搜索资源列表
linear
- 线性判别中的感知算法对于文本的手写体数字从0到9,数字8的识别率很低。特征提取一般,不过还不错。
TextFilter
- 这是一个利用C#开发的文本过滤的算法, 主要包括特征提取,文本表示,和svm的过滤。算法中包括了简单的界面和使用说明。
TextMining
- 介绍自动文本分类的一个ppt,详细的介绍了自动文本分类的特征提取,分类算法以及评估。-Introduced an automatic text classification ppt, a detailed introduction of automatic text categorization of feature extraction, classification algorithms, as well as assessment.
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
TFIDFofTextfeature
- 介绍了TFIDF方法在文本特征提取中的应用,并阐述了其优缺点和改进方法-TFIDF method described in the text feature extraction application, and described its advantages and disadvantages and improvements
111
- 文本分类中特征提取方法的比较与研究,文本分类中特征提取方法的比较与研究-text classifyier
TZTQ
- 文本分类特征提取源码,使用CHI特征提取的方法。-Text classification feature extraction source, use CHI feature extraction method.
Bbeyessa
- 详细介绍了贝叶斯公式在自动文本分类领域的使用,并且提到了关于于互信息特征提取的方法。和其分类的例子。,已通过测试。 -Described in detail the use of the Bayesian formula in the field of automatic text classification, and mentioned on the mutual information feature extraction method. And the classification
Image-text-extraction
- 图形文字提取,根据特征把图片中的文字提取出来保存为文本。-Graphic text extraction, according to the characteristics of the text extracted the image to save as text.
windows_C_32bit
- 文本分词工具,在windows 64位系统下,导入到eclipse中,可对文本进行分词和特征提取- U6587 u653 u5B03 u5B3 u5B3 u5B3 u5BF U5206 u8BCD u548C u7279 u5F81 u63D0 u53D6
CEQA
- 功能:分词、特征词的提取、属性的提取、文本的分类等(Function: word segmentation, extraction of characteristic words, extraction of attributes, classification of text and so on)