资源列表
word
- 实现中文分词,词汇表记录在WORD.TXT文件中。待分词文档为article.txt。
xqdj
- 人代会人员名单,使用EXCEL VBA编写,实现了自动按楼群等自定义方式分解、打印功能,效率很高。
BottomUpParser
- 中文信息处理方面的一个源码,此为自底向上的句法分析程序。功能比较完善,代码简洁易懂。
POSTagger
- 中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
ProbWordSeg
- 中文信息处理方面的一个源码。此为一个分词软件,这个分词的算法虽然简单,但是原理和其他相同,是最大概率法分次。功能强大,代码简洁易懂。
TestMDB
- 中文信息处理方面的一个源码。此为一个拼音分析和生成软件功能强大,代码简洁易懂。 1 可执行程序TestLexicon.exe必须与数据库文件在同一个目录下 2 数据库文件名为: lexicon.mdb,可以是access 97版格式的数据库, 也可以是access 2000版格式的数据库 3 双击TestLexicon.exe启动程序 4 选择“词典数据库”下“词库查询1”等进行查询,状态栏显示每个查询的 区别。程序反馈消息框响应用户的查询。
TestCorpus
- 一个检索单个汉字、多个汉字和词组,并且可以检索多种搭配的程序。使用起来非常方便。
TextPreProcessing
- 这个软件对文本文档进行预处理,比如去除多余的空格,加各种需要的标注符号等等,功能非常强大。
getunicode4
- 将汉字转为unicode码,转换的码具有十进制,十六进制和二进制
PreMS
- 处方跟踪系统的开发,希望大家多多支持
myzimo
- 中文字库文件应用,学习LCM液晶点阵汉字取模显示
bsvm-2.06
- svm的实现源码,java版,和libsvm是同一系列