资源列表
crc32src
- CRC计算 CRC计算 -CRC计算
HJ_SegWord_GBK
- 好不容易找到的一个php分词程序,很好的,里面包含了10万词条-Hard to find a php segmentation procedures, very good, which contains 100,000 entries
opnetcode
- 备,详细文档已经做好,在html目录下。 [DSPsoftwareDesignOfRegistrationNumberRecognition.r] - 介绍了车-备,详细文档已经做好,在html目录下。 [DSPsoftwareDesignOfRegistrationNumberRecognition.r]- 介绍了车
Segment
- 使用lucene组件的分词例子。同时利用JE-Analysis 1.5.1 组件分词。-Use Lucene component segmentation examples. At the same time, the use of JE-Analysis 1.5.1 Segmentation components.
text_category
- 中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。-Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.
Excel
- 该程序可以批量的将选中.txt文件中的数据添加到同名的Excel文件中,并依据Excel模板文件的设置绘出相关曲线。具体做法是将原.txt文件中的数据依次添加到templte.xls模版文件中,这样便在模版文件中绘出了相关曲线,然后再以原.txt文件另存为.xls文件-The program can batch will be selected. Txt file the data of the same name is added to the Excel document, and base
MAKEJP
- 中文编码转换,大5码转GBK码等 多音字字库组织和运用 组织海量名称数据,如何建立名称简拼索引-Chinese coding conversion, big 5 yards to GBK code word font, such as multi-tone organizations and mass organizations to use the name of the data, how to create the name of Microsoft Index
ParseWord
- 利用字典进行文章分词,正向最大匹配,你想最大匹配,并包含一个词汇表,vs 2005, c#-parse word, vs2005, c#
1111111111111
- 对于给定的一组未向信号,可以解析为可以接受、清晰的形式。-For a given one Group to the signal, can be resolved to an acceptable, clear form.
ImeSource
- 输入法源代码,使自己在开发过程中搜集的资料 和大家分享一下 希望对大家有所帮助 -Input source code, so that their development process to collect information and share with you hope to be helpful to everyone
wordsegment1
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!-It s an arithmetc of word segment,it has a very high efficiency!
segment
- 1 本程序说明了用概率法猜测“人名”的一般过程 2 用户可以修改config.ini文件中的值 3 用于测试的三个文件中: test1是小学语文课本语料 test2是按句分行的语料 test3是包含歧义串的语料-A descr iption of the procedures for using the probability method guess " names" the general course of 2 users can modify