搜索资源列表
Classifier4J-0.6-dist
- 可用于文本分类的贝叶斯分类器,java开源项目-can be used for text classification Bayesian classifier, java open source projects
download=tidy
- jobo, famous crawler open source which is implemented by java. used in many big websites. You will need a Java Runtime Environment 1.3 or later (on many System Java 1.2 is installed, it will NOT work !).
icu4c-4_4_1-src
- ICU是多国语言处理最权威的跨平台跨语言开发包,涉及多语种处理的方方面面。也是Unicode组织官方推荐的开发包。Java底层的多语言处理就是采用ICU4j。因为Java内核已经集成进去了,Java程序员可以在这方面少花许多脑筋。 一句话,如果用C++处理文本编码问题,ICU4c是不二之选。-ICU was originally developed by the Taligent company. The Taligent team later became the Unicode grou
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅
CRF-0.53
- crf++-0.53.zip CRF++ is a simple, customizable, and open source implementation of Conditional Random Fields (CRFs) for segmenting/labeling sequential data. CRF++ is designed for generic purpose and will be applied to a variety of NLP tasks, such as N