资源列表
Form2-26
- 从已标注的语料库中提取数据,转存在EXCEL中
clustBoost
- 聚类分析程序 k-means 编译环境 gcc/stl
MyProject
- 文本分类,使用贝叶斯分类系统,训练集和测试集
tt
- ADPCM的MATLAB的实现,有很好的音质恢复效果,程序简单易懂
PDFlib7UM
- PDFlib7中文用户手册,调用PDFlib库函数直接输出中文PDF文件
autosplit
- 中文自动分类分词程序,已经打包成dll,里面有说明
Dict
- 中文分词词典,可以用来进行中文分词。 一个比较全面的词库。
Read_rtfVB6
- 用VB6开发的读写rtf文档的源码,支持插入表格,图片及多字体样式
gb_big5_unicode
- GB到Big5到Unicode的转换码表-Big5 GB to the conversion to Unicode code table
GB18030GBKGB2312
- 详细介绍GB2312,GBK,GB18030结构,并给出求汉字偏移量的方法和函数。
FreeICTCLAS
- 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
Chinese
- 用VB6.0开发的中文词频统计软件,可在word文档中自动找出所有的词语,并从按照词频高低排序。附测试文档。