搜索资源列表
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
ICTCLASCaller
- ICTCLAS的JNI调用接口文件: Title:ICTCLAS Caller * <p>Descr iption:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it. * 请不要改变包名、类名以及native的方法名,否则调用将失效。 * 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,strin
getSpell
- 实用的简繁体中文转换成拼音全拼Java类,可以转换GBK字符集中的所有汉字,使用非常简单,只需按照main()函数中的测试例子调用即可。目前,对于多音字的处理还有待完善。-practical Jane English phonetic spelling converted into Java classes, GBK characters can be converted concentrate all the characters, using very simple, only in acc
gbcode
- 一个由cvcode.pas扩展的中文内码转换工具,内含有一个可供winword/excel的vba调用的DLL,全部含源代码。-an expansion by the Chinese cvcode.pas within yards conversion tools available to contain a Word / Excel VBA call the DLL, all containing the source code.
HLDLL
- C#调用天津海量分词进行分词,调用DLL进行实现-C# call Tianjin massive word for word, call the DLL to achieve the
ICTCLAS2012
- ICTCLAS的最新版本2012. 1.增加了CICTCLAS部分函数 2.修正了部分再UTF-8下计算位移偏移量的Bug. 3.ICTCLAS完全兼容开源搜索引擎Sphinx,具体可以访问Sphinx官网; 4.为保障用户使用的便利,从本版开始,调用的dll的名称一律为ICTCLAS2011.dll,不再变化,一般用户只需要变更dll及对应的.user授权文件,无需重新编译自己的程序,即可兼容新版本分词程序。 -ICTCLAS the latest version 2
Windows_32_C_Demo
- ICTCLAS 汉语分词系统 pku_test.txt 未经过分词的文档文件 调用ICTCLAS程序对其中的文档进行分词 -ICTCLAS Chinese word segmentation system pku_test.txt word document file without calling undue ICTCLAS program on which the document word