搜索资源列表
a_framework_
- 数据挖掘和数据处理的注意点和方法,专业术语熵,聚类等的算法说明-Algorithm descr iption of the data mining and data processing attention points and methods, terminology, entropy, clustering, etc.
DataMining3rd
- 评测数据在去掉停用词的 分类过程开放测试中,引入Good-Turing算法的分类性能比Laplace原则提高了3·05 ,比Lidstone方法提高 1·00 .而在交叉熵选择特征词的算法中,增加Good-Turing的贝叶斯分类方法可比最大熵分类性能高95 .通过这种数据平滑的算法,有助于克服因数据稀疏而引发的特征词缺失问题 -Evaluation data in the open test of the classification process to remove stop