搜索资源列表
ShootSearch_path_for_bate_1.0
- 一段关于中文信息分类的分词算法,他实现了信息过滤中的分词,为信息过滤的分类打下基础-section on the classification of information in Chinese word segmentation algorithm, he realized the information filtering the word, Information filtering to lay the foundation for the classification
ww
- 能快速对中文类别进行分类学习,学习结果好,识别率高
svm_multiClass
- svm(支持向量机)分类算法本质上是二类分类器,实现多类分类的方法一般是将多类分类看作是多个一对多的二类分类器。本程序就是基于svmlight的svm多类分类器实现。对分类感兴趣的用户请参照。配合中文分词(参见我上传的程序),可实现中文多类分本分类。
CRF1-2.tar
- CRF分类器,是一个很好的研究工具.用于中文信息处理的很好的工具
TK1.2-ARG0vsARG1.tar
- SVM分类器是一个很好的中文信息处理工具,不错的很好的东西
spamFiliter
- 中文邮件过滤。对训练邮件分词训练贝叶斯模型。然后对测试邮件分类
autosplit
- 中文自动分类分词程序,已经打包成dll,里面有说明
classify
- 中文分类的关键技术,包括中文分词,特征提取等信息
textcategoraization
- svm算法的中文文本分类 找的很辛苦啊
wordsegmentbasedonChinesetext
- 一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统
cutdic
- 用于中文分词的切分词典,还有词性标注,以这个词典数据库为基础建立文本分类,文本检索或文本过滤可以节省很多时间.很全,强烈推荐!-for the Chinese word segmentation Dictionary, and tagging to the dictionary database based text classification, text retrieval or text filtering can save a lot of time. All very strongly
R软件中文教程
- 本文档是对 R (“GNU S”)的入门介绍。R 是一种为统计计算和图形显示而设计的语言及环境,它和贝尔实验室(Bell Laboratories) John Chambers 等人开发的 S 系统相似。它提供了一系列统计和图形显示工具(线性和非线性模型,统计检验,时间序列分析,分类,聚类,……)。
svm.rar
- 中文文本分类,应用SVM对中文文本进行分类,具有高性能,Chinese text classification, applications to the Chinese version of SVM for classification, with high-performance
text_category
- 中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。-Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.
zuidashanruanjian
- 最大熵软件包用于中文信息处理可以用来分类-Maximum entropy package for Chinese information processing can be used to Categories
tztqjsydm
- 贝叶斯公式,文本分类,中文分词,VC++开发,方便实用和开发-beyes,text classify
WordTest
- 本文阐述了一个基于K-Nearest Neighbor(KNN)算法的中文网页自动分类系统的体系结构、具体设计和实现过程。系统分成三个模块:中文网页的下载与过滤(王勋完成);KNN算法的训练与分类(黄健完成);算法评估以及分词系统的整合(吴亮完成)。 本人主要是实现算法的评估以及分词系统的整合:分词系统的整合利用爱博汉语分词系统(服务器版本—共享版),将下载下来的中文网页过滤后所得到的txt文件内容进行分词,以便提供给KNN算法进行训练和分类;算法的评估是将KNN算法后所得到的结果进行分析,