资源列表
hztjcx
- 简单的汉字频率统计程序 比如分析古文的时候可以看看哪些字出现次数高 C++/VC/MFC
pipe
- 这可是全球著名IT公司ILog的APS高级排产优化引擎,就连SAP、Oracle等ERP中的物料需求计划与生产计划算法都来源于ILog。我研究了好久,中间的性线求解算法可真谓难呀。
cidian
- 基于最大匹配算法的的中文分词组件,达到很好的分词准确率
zimujiaozheng
- 自己编写的字幕校正程序,主要针对电影字幕时间整体偏移的字幕。
ilue_SplitCNWord
- 简单的汉语分词算法,由于本人水平有限,因此功能不是很完全,但能实现一些简单分词,请高手继续补充。
py
- 显示汉字拼音的控件,可以获取汉字打头字母等信息,对多音字处理没有过多考虑!还有待提高!^_^!
classify
- 文本分类程序,一个文本文件通常要根据某些关键词将文本内容分开来,可以输入多个关键词,文本中的任一行含有其中一个关键词就会被分离出来
PHPWind_GBK_6.0
- PHP验证码,图片生成程序,请大家多指教
m_seq
- 此函数用来生成最大长度线性移位寄存器序列(m序列)
DelFiles
- 主要是完成对某个文件目录下,其中包含的过小文件的删除功能。
copy
- 主要完成对文档的复制功能,复制一个文件的内容到另一个文档
experimentoftextclassification
- 整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别, 教育类包括31篇文档, 商业与经济类有93篇文档, 计算机与因特网102篇文档, 娱乐与休闲166篇文档, 自然科学有208篇文档。 目录“DataSet”:RawText中的文本分词后保存在DataSet目录。 数据表“WordsTable”:保存DataSet中所有文本的倒排文档。 其中“目录