搜索资源列表
多种分词方法
- 含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。-containing more than Segmentation. Graduation was the time of hope
MyHL
- 调用海量智能分词研究版的dll获取分词的结果(C#) -Call massive intelligence Segmentation Research version of the dll to obtain the results of sub-word (C#)
v1.4.02
- 一个开源的分词系统,可实现人名识别和词库管理。-Segmentation of an open source system, name recognition can be achieved and thesaurus management.
CutWordApp
- csharp实现的分词器,完整可以运行!结合正向逆向匹配法,效率较高-csharp device to achieve the sub-word, complete run! Forward Reverse with matching, more efficient
2
- c#中文分词源码,基于词频,词性等,可提取自定义数量的关键词-Chinese word c# source code, based on word frequency, part of speech, can customize the number of keywords extracted
SharpICTCLAS.net1.1
- 这是用C#编写的简单的中文分词程序,采用的是键树。-This is written in C# using simple Chinese word segmentation procedure is the key tree used.
p
- 分词组件 for .net 2.0,即将发布。 o-Word component for. Net 2.0, the upcoming release. o
NLuke0.12
- 这是一个基于网络的,扩展了lunce的一个搜索分词工具-This is a web-based, expanded lunce participle of a search tool
ChineseTokenizer
- 中文分词演示程序,可以对字符串进行按照词义分词。在搜索技术中有广泛应用。-Chinese Segmentation demo program can be carried out in accordance with the meaning of the string segmentation. In the search technology has wide application.
ParseWord
- 根据自然语言处理方法中的左端最大的方法对中文进行分词-Natural language processing methods in accordance with the methods of the extreme left of the largest Chinese word segmentation
KeyWordTree
- 一个c#编写的中文分词系统,有一个附带的baidu词库-fen ci c#
WordSegTest
- 该软件的主要功能是可以帮助我们进行中文的分词和对一些词性的分析。-this software is used for Chinese sorted.
WindowsApplication1
- 处理的对象是:完成分词和词性标注的语料,实现的结果是:统计出现词频完成降序排列。-Dealing with the object are: the completion of word segmentation and POS tagging of the corpus, the results achieved are: the completion of word frequency statistics appear in descending order.
HLDLL
- C#调用天津海量分词进行分词,调用DLL进行实现-C# call Tianjin massive word for word, call the DLL to achieve the
IKAnalyzer3.1.1StableAllInOne
- Lucene 中文分词,很好的 可以随便下压,加油-Lucene Java
33753115ktdictseg_v1.0.01
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数-It s an arithmetc of word segment,it has a very high efficiency!
SharpICTCLAS
- ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
lucene.net_search
- lucene.net 中文分词 分页高月显示
mySegment
- 类库程序,基于词典的简单分词,可分中英文混合的情况-Simple dictionary-based segmentation procedure