资源列表
py
- 显示汉字拼音的控件,可以获取汉字打头字母等信息,对多音字处理没有过多考虑!还有待提高!^_^!
stopwords
- 中英文中的常用的停用词,对文本分析有帮助的!
classify
- 文本分类程序,一个文本文件通常要根据某些关键词将文本内容分开来,可以输入多个关键词,文本中的任一行含有其中一个关键词就会被分离出来
MyProject
- 文本分类,使用贝叶斯分类系统,训练集和测试集
PHPWind_GBK_6.0
- PHP验证码,图片生成程序,请大家多指教
tt
- ADPCM的MATLAB的实现,有很好的音质恢复效果,程序简单易懂
m_seq
- 此函数用来生成最大长度线性移位寄存器序列(m序列)
DelFiles
- 主要是完成对某个文件目录下,其中包含的过小文件的删除功能。
copy
- 主要完成对文档的复制功能,复制一个文件的内容到另一个文档
PDFlib7UM
- PDFlib7中文用户手册,调用PDFlib库函数直接输出中文PDF文件
experimentoftextclassification
- 整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别, 教育类包括31篇文档, 商业与经济类有93篇文档, 计算机与因特网102篇文档, 娱乐与休闲166篇文档, 自然科学有208篇文档。 目录“DataSet”:RawText中的文本分词后保存在DataSet目录。 数据表“WordsTable”:保存DataSet中所有文本的倒排文档。 其中“目录
autosplit
- 中文自动分类分词程序,已经打包成dll,里面有说明