搜索资源列表
mmseg-v0.3
- 基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
src_v1.3.01
- KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法 * 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 * 主要性能指标: * 分词准确度:90%以上(有待专家的权威评测) * 处理速度: 600KBytes/s
GoogleTools
- GOOGLE关键字批量抓取,需要先登录adWords账号 ,本软件为V1.0.0测试版,后期继续增加功能,现在只完成 输入关键字自动搜索所有该关键字的相关词组 后期增加下载功能及循环分词功能-GOOGLE keyword batch fetching, you must first login adWords account, the software V1.0.0 beta, continue to add features later, now just finished entering
Source_Code
- 中文分词系统分析库,可以对UTF8表述的中文文字进行分词操作, 支持外挂的词库和手动干预(回调方式)的加权处理。 可用于搜索引擎的基础分词开发-Chinese word segmentation system analysis libraries, can be expressed UTF8 Chinese text segmentation operation, support plug and manual intervention in the thesaurus (callback me
V1.4
- 由KaiToo搜索开发的一款基于字典的简单中英文分词算法-Search by KaiToo developed a simple dictionary based on English and Chinese word segmentation algorithm
fenci
- 中文分词 中文搜索引擎中的关键字识辨-Chinese word segmentation in Chinese search engine keywords that identify
wordsegment1
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!-It s an arithmetc of word segment,it has a very high efficiency!
ChineseTokenizer
- 中文分词演示程序,可以对字符串进行按照词义分词。在搜索技术中有广泛应用。-Chinese Segmentation demo program can be carried out in accordance with the meaning of the string segmentation. In the search technology has wide application.