搜索资源列表
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
guide
- 中科院的分词程序说明,缺少此文档的可以看看看。-CAS-word descr iption of the processes, the lack of this document can watch to see.
ictclas-linux-1.0.tar
- 中科院ictclas分词系统的LINUX版本,非常不错的免费中文分词工具。-CAS ictclas Segmentation System LINUX version.
ws-uima2code
- 为了对数据进行处理,UIMA 应用程序将使用分析引擎,而后者包含实际进行分析的应用程序、Annotator 和 XML 描述符文件,其中,XML 描述符文件包含关于类以及其要接收和返回的信息等方面的内容。 还可以将简单的分析引擎组合为更为复杂的分析引擎。例如,定位本地事故报告和广播流量报告的分析引擎可能包含一个查找事故的分析引擎、一个查找位置的分析引擎,以及一个分析前两个引擎提供的注释的分析引擎。总体引擎描述符将确定如何在这些分析引擎间传递 CAS 对象。 事实上,描述符控制
initial
- 中科院分词系统,C++版,简单调用接口实现分词示例。(只需更改主函数中目标文件名即可)-CAS segmentation system, C++ version, simply call the interface segmentation examples. (Just change the primary function of the target file name)