搜索资源列表
souce_code.rar
- 轻轻松松背单词软件源码,delphi开发,收录了大量词库,很有价值,Easily back word software source code, delphi development, included a large number of thesaurus, great value
ictclas.rar
- Java中lucene分词需要的ICTCLAS.dll文件和data词库,Java Lucene participle in need ICTCLAS.dll documents and data thesaurus
v1.4.02
- 一个开源的分词系统,可实现人名识别和词库管理。-Segmentation of an open source system, name recognition can be achieved and thesaurus management.
JJCK_Tools
- 拼音加加词库处理工具 Ver1.02 作者:张文焕 本软件用以辅助制作拼音加加格式的词库。它共包括“整理”、“注音”、“排序”、“筛选”、“固顶”5个小程序,具体功能参阅各程序相关说明。另外,dfc、jjgx两个文件夹分别是“大分词”、“加加词库更新”工具,未予集成,请单独选用。-Phonetic processing tools Ver1.02 of Gaga Thesaurus: Zhang Wenhuan the software used to assist production
SW_I_WordSegment
- SW-I中文分词算法,MFC程序,在visual studio 2008中调试通过。默认词库为mdb,由于较大未包含在源文件中,请自行下载mdb格式的词典。-SW-I Chinese word segmentation algorithm, MFC procedures, visual studio 2008 in debug through. Default thesaurus for the mdb, as a result of the larger not included in the
IME
- 本软件采用VC++5.0编写而成,但VC++4.1以上的版本应该都行,如果不行,不妨把imm目录下的文件拷到VC相应的目录下。另外需要说明的是输入法程序实际上是一个动态连接库,即feepy.ime是一个动态连接库,所以你创建项目时,要用动态连接库格式,并把生成的库文件改成freepy.ime. 另外,本程序的词库是一个动态链表,是由内存映射文件实现动态内存共享的,对动态内存共享感兴趣的朋友可以参考。(注:此程序非本人亲手所写,只是珍藏好久,拿出来和大家分享)-This softwar
Source_Code
- 中文分词系统分析库,可以对UTF8表述的中文文字进行分词操作, 支持外挂的词库和手动干预(回调方式)的加权处理。 可用于搜索引擎的基础分词开发-Chinese word segmentation system analysis libraries, can be expressed UTF8 Chinese text segmentation operation, support plug and manual intervention in the thesaurus (callback me
svm-EM
- SVM(支持向量机)和EM(最大熵)文本分类算法,压缩包中包括了测试文本(环境类和计算机类),词典,停用词表等。-SVM (support vector machine) and EM (maximum entropy) text classification algorithm, compressed package includes test text (environmental and computer), dictionary, thesaurus, such as disabled.
text
- python写的gbk分词分句程序 可以使用sogou或者谷歌输入法的词库进行分词-python written procedures gbk participle clause can use Google sogou or input method for segmentation of the thesaurus
CMM_wordSeg
- 逆向最大匹配切词,很简单,仅供学习... 包含常用的9万的词库。-Reverse Maximum Matching segmentation, very simple, only to learn ... contains 90,000 commonly used in the thesaurus.
Hashset
- 一个拼写检查程序,用来检查你的输入的文件中的单词是否拼写错误,并给你给出可能的拼写建议。(用Hashset实现)(卡耐基梅隆大学ssd5数据结构Option Exercise4答案) 程序参数设置(第一个为要输入的词库文件,本例中是wordlist.txt, 第二个为要检查的文件,必须为txt格式,本例中用test.txt来检查)-A spelling checker to check your input file is misspelled words, and give you a p
SearchWord
- 词库检索系统,可以分析出任意文件夹下面的所有文件,以及查找某个特定的词语一否包含在某个文件里面-Thesaurus retrieval system, you can analyze any folder of all the documents below, as well as to find a specific word whether one is included in a file inside
Dictionary
- 基于离散子串匹配算法的电子辞典。对每个词条算出一个匹配度,查询时根据匹配度大小依次顺序列出词条;词库较大,因此采用了分类索引的算法,提高了查询速度。-Based on discrete substring matching algorithm of electronic dictionaries. Calculated for each term of a match, the query sequence according to the size of matching entries li
14160_1230085425thYk
- 搜狗词库备份_2008_09_28 -Sogou backup _2008_09_28 thesaurus
index
- 有一个内含有大约40万条常用词汇的词库。现给定一篇文章,使用这个词库分析出常用词汇的出现次数,并按出现次数由高到低排序这些词语。 -One contains about 400,000 common vocabulary thesaurus. Are given an article on the use of the thesaurus analysis of the emergence of a number of commonly used terms, and to sort hig
xx
- 从词库中随机抽取一个单词,显示一款可帮助学生背英文单词的小软件,在屏幕上时,该单词被随机隐藏了一个、或两个、或三个字母,用户正确填空后,可得分;当得分累积到某些分值时,系统给予鼓励-Randomly selected from the thesaurus in a word, showing a back to help students of English words of small software, on the screen, the words were randomly hide
hanzipingtai
- 这是差不多十年前的东西了, 差不多95年吧, 不过作者在这里面实现了在DOS的汉字显示及输入技术, 图形系统, mose支持而且还实现了几个输入法, 有全拼及五笔输入, 还支持词库及造词等功能. 我们都知道, 在WINDOWS下, 汉字输入其实也是很多朋友比较关心的一个技术, 在WINDOWS下写输入法, 要按照特定的接口来写, 但是对于DOS下的. 则自由多了, 朋友们可以看看这套汉字系统的作者是如何解决汉字输入的 -This is almost ten years ago things
PERL
- perl采用正向匹配算法,使用词库构建哈希结构,匹配分词-perl matching algorithm being used, use the thesaurus to build hash structure, matching word segmentation
Vocabulary_Classified.revised
- 分析词库 导出 可以很容易的做好准备日功做-Analysis of the thesaurus can be easily exported to prepare the day gong to do
ts1
- 这是用汇编语言开发的一种输入方法,简单灵活,词库多,已经在使用,但词库灵活程度还有待开发。-This is the development of assembly language with an input method, simple, flexible, thesaurus, and already in use, but also the flexibility of the thesaurus to be developed.