搜索资源列表
ictclas4j_3
- 贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
SOApprocah方法的源程序下载
- SOApprocah方法的源程序下载 基于经典的PMI-IR方法,进行中文文本情感分类算法。,Download source SOApprocah methods based on the classic PMI-IR method for Chinese text classification algorithm emotion.
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
FinalProject
- 基于中文文本分类的毕业设计,有源码和开题报告及论文。-Chinese text classification based on the graduation design of the open-source and title reports and papers.
Chinese_web_page_categorization
- 本文在阐述自动文本分类的基础上,针对中文网页自身的一些特点,着重研究了中文网页自动分类方的关键技术。-In this paper,we briefly introduce automatic text categorization.On the basis of it,we mainly studied some key technologies of Chinese web page categorization.
1111
- 文本挖掘-中文分类器搜索,可以挖掘出文本主干,利用贝叶斯算法。-Text mining
TextMining
- 文本分类学习的好例子,用java调用weka进行中文文本本分类的源码-text classification code
HLSeg_JAVA_Example
- 中文分词 支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。 关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。 海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,
class
- 中文文本分类可以对已经分好词的文本进行分类,先自己导入数据,用libsvm中的svm进行分类和预测,特征用tfidf算法,还利用卡方检验进行了特征选择,可自行设定阈值-text mining
JAVAbayesClassification
- 中文的贝叶斯文本分类,包含训练数据代码和代码以及使用说明。可将篇章级文本分类为教育、IT等领域。-Chinese Bayesian text classification, training data containing the code and code and instructions for use. Chapter level text can be classified as education, IT and other fields.
clustertest
- 基于自定义中文词典的中文文本分类系统,自动生成影虎词典-Custom Chinese dictionary based Chinese Text Classification System
bayes
- java实现朴素贝叶斯中文文本分类器。自带分类语料和实验报告。功能完整。-java implement Naive Bayes Chinese text categorization. Own classification corpus and test reports. Full-featured.
Classification
- 多文本分类,有数据集,中文文本,支持向量机的-Text classification, data sets, the Chinese text, the support vector machine (SVM)