搜索资源列表
stop.rar
- 本代码用c语言编写,用于在文本分类预处理过程中停用词的去除。
Complete-Training-of-TC
- 用贝叶斯模型实现文本分类,;里面包含分词,词频统计,去除停用词等模块,目前完成的是分类的训练阶段。-realize text categorization by using the NaiveBayes Model
stopword-list
- 在文本进行分类聚类之前,必须对文本进行预处理。预处理的第一步是分词,这中间需要去除停用词。这个文件就是停用词列表-Must preprocess the text before the text classification clustering. The first step in preprocessing is the word, the middle need to remove the stop words. This file is the stop word list