资源列表
CRFhelp
- crf(condintional random fields)简介 用音字转换实例来介绍crf模型
spamFiliter
- 中文邮件过滤。对训练邮件分词训练贝叶斯模型。然后对测试邮件分类
segment
- segment,一个简单的中文分词程序,命令行如下: java -jar segmenter.jar [-b|-g|-8|-s|-t] inputfile.txt -b Big5, -g GB2312, -8 UTF-8, -s simp. chars, -t trad. chars Segmented text will be saved to inputfile.txt.seg
hzpy
- powerbuilder生成汉字的拼音码
clustBoost
- 聚类分析程序 k-means 编译环境 gcc/stl
FIND_CH
- 汉字字符串提取程序,通过此程序可以提取汉字的字符串!!!!!!!
pinyingshurufa
- CCDC01采集器测试仪软件:拼音输入法模块,编译环境:Franklin 3.3.4
hztjcx
- 简单的汉字频率统计程序 比如分析古文的时候可以看看哪些字出现次数高 C++/VC/MFC
pipe
- 这可是全球著名IT公司ILog的APS高级排产优化引擎,就连SAP、Oracle等ERP中的物料需求计划与生产计划算法都来源于ILog。我研究了好久,中间的性线求解算法可真谓难呀。
cidian
- 基于最大匹配算法的的中文分词组件,达到很好的分词准确率
zimujiaozheng
- 自己编写的字幕校正程序,主要针对电影字幕时间整体偏移的字幕。
ilue_SplitCNWord
- 简单的汉语分词算法,由于本人水平有限,因此功能不是很完全,但能实现一些简单分词,请高手继续补充。