搜索资源列表
ChineseSegmenter
- 中文分词java版 基本词典,分次效果很不错的-Chinese word java version of the basic dictionary, graded very good results
paoding-analysis-2.0.4-alpha2
- 一款基于java的分词软件,用来把中文文章分成有意义的单词。
IKAnalyzer2.0.2
- Java lucene开源全文搜索,中文分词组件
lucene-1.4.3
- java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)
庖丁分词工具
- 一个流行的java分词程序。
fenci
- 一个简单的基于词典分词的程序,lucene的分词程序不少,但有时候并不需要复杂的功能,只是需要简单的根据指定的词典分词。代码简单,可以作为学习参考-A simple dictionary-based word process, lucene procedures for sub-word a lot, but sometimes does not require complex functions, but only require a simple dictionary word accord
HZ_Freq
- java中文分词系统,可供大家学习,祝成功路上越走越远!-Java wordseg program
SearchEngine
- Java实现的搜索引擎,有网页爬虫,查询服务,中文分词,索引建立等- realize search engine in Java
CutWords
- 实现搜索引擎中的中文分词技术,JAVA语言实现-Chinese word in the search engine technology
paoding-analysis-2.0.4
- Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高效率和用户良好体验。-Paoding Chinese word is a Java development can be combined with Lucene applications for the word componen
ansj
- ictclass的java版本开源实现,用于实现中文分词功能。-the java version that the open source implementation of ictclass
SearchEngine
- dySE 是个开源的 Java 小型搜索引擎。该搜索引擎分为三个模块:爬虫模块、预处理模块和搜索模块。其中详细阐述了: 多线程页面爬取、正文内容提取、文本提取、分词、索引建立、快照等功能的实现。-dySE is an open source Java small search engines. The search engine is divided into three modules: crawler module, pretreatment module and search module