搜索资源列表
ictclas4j_3
- 贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
SOApprocah方法的源程序下载
- SOApprocah方法的源程序下载 基于经典的PMI-IR方法,进行中文文本情感分类算法。,Download source SOApprocah methods based on the classic PMI-IR method for Chinese text classification algorithm emotion.
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
news1.0
- JSP中文网新闻发布系统是由jsp中文网为了方便管理自己的相关技术文章而编写的b/s模式的集新闻发布、管理与一体的新闻发布系统。有许多其他新闻发布系统不存在的优点:例如,新闻可以发布多个图片的新闻,并且可以很好的排版页面显示的格式;每一篇新闻都可以有自己的关键字来描述,说明该新闻的主要内容,并且可以关联该新闻内容相似的新闻,新闻还可以无限分类。让您可以在一个新闻系统中管理你所有的新闻。-JSP Chinese system is a network of press releases from
FinalProject
- 基于中文文本分类的毕业设计,有源码和开题报告及论文。-Chinese text classification based on the graduation design of the open-source and title reports and papers.
zhengdike
- (个人原创)《中文网页自动分类》 牵扯的技术有:分词,统计词频,踢出网页中一些特殊字符(用正则表达式),还有需要提取培训集等等!! 此软件禁止商业活动,版权所属“qyTT论坛--www.qyclass.org/bbs” 本文来自: qyTT论坛 http://www.qyclass.org/bbs 我们的使命:让世界认识qyTT,让qyTT认识世界! 结果分析的思想:就是把得到的词频与建立的词库里每一类进行比较,如果存在一个最大匹配程度,就去这个类作为结果,如果存
1111
- 文本挖掘-中文分类器搜索,可以挖掘出文本主干,利用贝叶斯算法。-Text mining
BayesClassifier
- 基于java语言实现的贝叶斯分类器,可以用于中文或者英文进行分类-Bayesian classifier based on the java language, Chinese or English can be used to classify
TextMining
- 文本分类学习的好例子,用java调用weka进行中文文本本分类的源码-text classification code
HLSeg_JAVA_Example
- 中文分词 支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。 关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。 海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,
JavaBayes
- 用java编写的贝叶斯分类器,用于实现网页分类,中文网页分类-Using java prepared Bayesian classifier, used to implement web page classification, Chinese web page classification
class
- 中文文本分类可以对已经分好词的文本进行分类,先自己导入数据,用libsvm中的svm进行分类和预测,特征用tfidf算法,还利用卡方检验进行了特征选择,可自行设定阈值-text mining
JAVAbayesClassification
- 中文的贝叶斯文本分类,包含训练数据代码和代码以及使用说明。可将篇章级文本分类为教育、IT等领域。-Chinese Bayesian text classification, training data containing the code and code and instructions for use. Chapter level text can be classified as education, IT and other fields.
clustertest
- 基于自定义中文词典的中文文本分类系统,自动生成影虎词典-Custom Chinese dictionary based Chinese Text Classification System
bayes
- java实现朴素贝叶斯中文文本分类器。自带分类语料和实验报告。功能完整。-java implement Naive Bayes Chinese text categorization. Own classification corpus and test reports. Full-featured.
weka.pdf
- WEKA 中文API学习教程,详解 回归,分类,群集,最近邻算法-WEKA Chinese API tutorials, Detailed regression, classification, clustering, Nearest Neighbor algorithm
Classification
- 多文本分类,有数据集,中文文本,支持向量机的-Text classification, data sets, the Chinese text, the support vector machine (SVM)