资源列表
CRF++-0.50
- CRF++ 5.0的 source 应用在自然语言识别等领域的机器训练,对2G以上的语料不会出现内存溢出等问题
ictclas4j_0[1].9.1
- 基于java语言的分词系统,可以标注词性、词频等信息,可用于二次开发
InstGB5
- GB GIB5 互相轉換, 以及簡體 正體 互相轉換。
Robert
- 边缘检测
HowToDo
- 叫您如何实现部分字体的改变,部分字体格式改变,含代码奥!
libcharguess-src-1.0b.tar
- 判断一串字符是属于什么字符集的程序,如判断是否属于utf-8,gb2312
lunce-IKAnalyzer
- 中文分词工具,利用lucence的接口写的,进行最长匹配,正向和反向匹配后根据词数选择。别人写的,我用了,觉得不错,简单,上手快
fenci_ICTCLAS
- 基于中科院计算所的ICTCLAS系统开发的分词工具,只有一个类,上手最快,功能强大
MainFrm
- 中文信息处理的源程序代码。VC++实现,这是主程序,链接,.cpp文件
OnCorpusNew
- 中文信息处理的源程序,用于分词过程中的歧义鉴别与排除,vc++编写,.cpp文件
taggingPOS
- 中文信息处理的源程序,用于设置词汇在文本中的位置信息,vc++编程,.cpp文件
hanzibianma
- 介绍关于解决汉字问题的文章。 讲解了在编程过程中的汉字编码。