搜索资源列表
IKAnalyzer3.2.8-source
- IKAnalyzer的源码包,实现中文分词功能,(1) 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/ 秒的高速处理能力。 (2) 采用了多子处理器分析模式,支持:英文字母( IP 地址、Email、URL )、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理 。 (3) 优化的词典存储,更小的内存占用。支持用户词典扩展定义 (4) 针对 Lucene 全文检索优化的查询分析器 IKQueryParser;采用歧义分析算法优化查询关键
lzw
- 实现lzw词典编码方法 Lzw编码算法的设计思路: 1.开始时的词典包含所有的根(先将所有单个字符编码),当前缀P时空的; 2.当前字符(C)=字符流中的下一个字符; 3.判断缀-符串P+C是否在词典中 A如果“是”:P=P+C//(用C扩展P) B.如果“否”: a 把代表当前前缀P的马子输出到码字流; b 把缀-符串P+C添加到词典; c 令P=C//(现在的P仅包含一个字符C); 4. 判断字符流中是否还有码字要译 (1)如果是,就返回到2;
sDict
- 词典文件,用于分词的词典,适用各种开发环境-Dictionary files for the sub-word dictionary, the application of a variety of development environment
计算器c
- 自己设计的基于51单片机的简易电子词典,方便阅读,便于修改-Of their own design based on 51 single-chip simple electronic dictionaries, user-friendly, easy to modify
libdict-0.4-beta.baif.tar
- libdict 是一个查词典的共享函数库。 -libdict is a dictionary of the shared libraries.
有声英语
- 1、有声词库,,可以从服务器下载各种不同的词典 2、分成浏览记忆、拼写记忆、复习单词 3、针对每个单词有丰富的语句例子以供学习 4、针对每个学习单子可以再拼写记忆和复习单词进行练习
mydict.tar
- 电子词典的源程序,可以帮你练习linux下的项目,了解电子词典的结构。-this is a code of dirary find.
VSM
- 向量空间模型算法,给定一个经过分词的文档集,可以输出向量空间模型、特征词典、倒排索引表等功能,很经典的VSM算法源代码-Vector space model algorithm, given a segmentation of the document set, you can output vector space model, the characteristics of dictionaries, inverted index table functions, it is the clas
workproject
- android电子词典源码 导入项目即可运行-Android electronic dictionary.
DiZiCiDian
- 一个关于android电子词典的java程序源代码-A java program source code on android electronic dictionary
svm-EM
- SVM(支持向量机)和EM(最大熵)文本分类算法,压缩包中包括了测试文本(环境类和计算机类),词典,停用词表等。-SVM (support vector machine) and EM (maximum entropy) text classification algorithm, compressed package includes test text (environmental and computer), dictionary, thesaurus, such as disabled.
index
- 用于数据结构的文件索引,关键字放在一个文件中 相当于一个词典-Data structure used to index the documents, keyword in a document equivalent to a dictionary
Vis_Dict
- 语音词典,语音开发的朋友也许能够用得着-Dictionary voice, voice of a friend may be able to develop useful
checkDictionary
- 完成“快速拼写检查程序”的分析、设计和实现过程。 快速拼写检查程序基本功能说明如下: 1.进行拼写检查的文件以文本文件形式存储于外存上; 2.只检查文件中英文单词的拼写错误; 3.单词是用字母(a…z或A…Z)定义,任一非字母字符作为分隔符; 4.判断单词拼写正误的依据是词典,词典以文本文件形式存放于外存上; 5.词典文件第1行为词典的名称,以后每一行存放一个单词; 6.输出结果以文本文件形式存储,其格式为: 第1行:被拼写检查的文件名 + 词典名 第2行后的每一行: 出错单词 位于第x行 7.
tuixianzi
- 大家玩过推箱子吗?这个游戏可是一个很不错的游戏哦,许多手机和电子词典上都有,现在你见到的这个可是用易语言写的还可以吧。 -Sokoban we played it? But this game a very good game, oh, many mobile phones and electronic dictionaries have, and now you see this but easy to use language can also write it.
dncd
- 电脑魔鬼词典-对计算机术语的另类解释,非常有趣,也非常值得深思的类比。-Devil Computer Dictionary- Computer Terms for an alternative explanation, very interesting and very worthwhile analogy.
charDict
- 是一个解密用的词典产生工具, 可以产生字符和数字的各种组合.-Is a decryption tool used to generate the dictionary, you can have characters and figures of various combinations.
dianzaicidian
- 子词典 可以进行 单词的查询 添加没有的单词 数据库是用的Acce-Sub-word dictionary can not add the word query the database is used acce
lookupword
- 读入英文词典,判断输入单词是否在词典中出现-Read the English dictionary, to determine whether or not the importation of words appearing in the dictionary
POSTagger_Src
- 包含了词条及其词性标记,频度信息的词典 练语料的格式要求: 每个词以 / 分隔, / 后是该词的词性标记。词性标记后至少要有一个空格。一个句子的所有词必须在同一行中。击“开始词性标注”选取文本文件(一次可以选择多个)进行标注处理-Includes a term and its part of speech marks, the frequency of information and training Corpus dictionary format requirements: Each w