搜索资源列表
多种分词方法
- 含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。-containing more than Segmentation. Graduation was the time of hope
KNN(CSHARP)
- 基于不断学习的贝叶斯-KNN文本分类算法的设计与实现,给出原始几个类别的文本文件,通过机器学习,获取各个类别文本内容的主要特征,在这个基础上,给出待分类的文件库,系统通过自动分类,对文件库中的文本进行分类,把文件分配到最有可能的类别中。-based learning Bayesian-KNN text classification algorithm design and implementation given several types of the original text file,
huffman.rar
- 实现哈夫曼树算法,用VS2005开发,并附有详细的文本说明!,Huffman
k-meams(sourcecode)
- C#实现k均值文本聚类算法,文本聚类C#源程序,k-means聚类算法-C# to achieve k means clustering algorithm, document clustering C# source code, k-means clustering algorithm
RepeatedForms
- 根据相似度去重,把文本很相似的删除掉,基于VSM的算法的实现。-According to the similarity to heavy, very similar to the text removed, the algorithm based on VSM realize.
nerve
- 人工神经元分类模型,可以对短文本进行分类并且有比较高的准确率(训练文本正确时)-Artificial neural classification model can be classified on the short text and a relatively high accuracy rate (training text correctly)