文件名称:Chinese-text-categorization-Study
-
所属分类:
- 标签属性:
- 上传时间:2012-11-16
-
文件大小:432.02kb
-
已下载:1次
-
提 供 者:
-
相关连接:无下载说明:别用迅雷下载,失败请重下,重下不扣分!
介绍说明--下载内容来自于网络,使用问题请自行百度
本文通过对Bayes、KNN、SVM 应用于中文文本分类进行比较实验研究。
应用ICTCLAS 对中文文档进行分词,在大维数,多数据情况下应用TFIDF 进行
特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本
具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行
训练和分类。-Based on the Bayes, KNN, SVM applied to compare the Chinese text categorization Study. Application ICTCLAS word segmentation of Chinese document, in large dimension, multiple-data cases where application TFIDF feature selection, and also use it to realize the characteristics of weighted items, so that each text text library with a unified, capable of handling structural model. Three types of classification algorithm then weights the data for training and classification.
应用ICTCLAS 对中文文档进行分词,在大维数,多数据情况下应用TFIDF 进行
特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本
具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行
训练和分类。-Based on the Bayes, KNN, SVM applied to compare the Chinese text categorization Study. Application ICTCLAS word segmentation of Chinese document, in large dimension, multiple-data cases where application TFIDF feature selection, and also use it to realize the characteristics of weighted items, so that each text text library with a unified, capable of handling structural model. Three types of classification algorithm then weights the data for training and classification.
(系统自动生成,下载前可以参看下载内容)
下载文件列表
Chinese text categorization Study.pdf
本网站为编程资源及源代码搜集、介绍的搜索网站,版权归原作者所有! 粤ICP备11031372号
1999-2046 搜珍网 All Rights Reserved.