搜索资源列表
基于朴素贝叶斯方法的文本分类
- 本程序实现了基于朴素贝叶斯方法的文本分类,附有源代码、实验报告、可执行程序以及语料库(包括训练集和测试集) -This procedure implements the text-based Naive Bayes classification method, with source code, test reports, executables and corpus (including the training set and test set)
jzym
- 垃圾邮件过滤器,你可以将快捷方式直接放到桌面上就可以用了,很方便哦! 打开后先训练, 然后选择你需要测试的txt文件 进行测试 , 其中, 自带的那个“邮件测试文件夹”是用来测试用这个邮件库过滤邮件正确率的,当然你也可以自己用自己准备好的邮件进行测试,不过“邮件测试文件夹”“合法邮件”“垃圾邮件”这3个文件夹名字不能改变. 你可以直接向Sample这个文件夹下的 “合法邮件”与“垃圾邮件”里直接增加自己的语料,当然你的语料库越大测试越准确了!-Spam filters, you ca
java-text-classter-tool
- Java 实现的文本分类工具,包含语料库和实例代码。-Java implementation of text classification tools, including the corpus and the example code.
geniuswiki
- 语料库管理系统功能齐全而强大,知识面广而且使用课程实际使用的毕业设计-Corpus management system has complete function and strong, broad knowledge and the use of the actual use of the graduate design course
TFIDF
- 语料库中计算tfidf的值。java开发完成。-Corpus tfidf calculated value. java development is completed.
dataset_602123
- 酒店情感分析语料库,包含neg和pos的分类-Hotels Corpus sentiment analysis, including classification neg and pos
TF
- TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级- TF-IDF is a statistical method to assess the importance of a word for a file set or a corpus of the importan