搜索资源列表
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
invert10_31
- 中文信息处理,建立文件的倒排表,形成词频链表-Chinese information processing, document the inverted table and form Frequency List
zidongfenci3.0
- 这个是我们的中文信息处理的作业,我是用mfc结合sqlserver写的,可以自己一步一步的进行分词,并且可以对文本进行分词,还可以自己的找到其中的歧义字段,并自动保存到文件
BottomUpParser
- 中文信息处理方面的一个源码,此为自底向上的句法分析程序。功能比较完善,代码简洁易懂。
POSTagger
- 中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
ProbWordSeg
- 中文信息处理方面的一个源码。此为一个分词软件,这个分词的算法虽然简单,但是原理和其他相同,是最大概率法分次。功能强大,代码简洁易懂。
TestMDB
- 中文信息处理方面的一个源码。此为一个拼音分析和生成软件功能强大,代码简洁易懂。 1 可执行程序TestLexicon.exe必须与数据库文件在同一个目录下 2 数据库文件名为: lexicon.mdb,可以是access 97版格式的数据库, 也可以是access 2000版格式的数据库 3 双击TestLexicon.exe启动程序 4 选择“词典数据库”下“词库查询1”等进行查询,状态栏显示每个查询的 区别。程序反馈消息框响应用户的查询。
dict
- 这是我的中文信息处理的小作业,是一个自动分词系统。- This is my Chinese information processing 灏忎綔 industry, is an automatic participle system.
MainFrm
- 中文信息处理的源程序代码。VC++实现,这是主程序,链接,.cpp文件
OnCorpusNew
- 中文信息处理的源程序,用于分词过程中的歧义鉴别与排除,vc++编写,.cpp文件
taggingPOS
- 中文信息处理的源程序,用于设置词汇在文本中的位置信息,vc++编程,.cpp文件
CRF1-2.tar
- CRF分类器,是一个很好的研究工具.用于中文信息处理的很好的工具
TK1.2-ARG0vsARG1.tar
- SVM分类器是一个很好的中文信息处理工具,不错的很好的东西
fenCi
- 实现中文信息处理中的汉语分词的功能,采用了正向最大和逆向最大的分词算法。
基本词典程序
- 这是一个能吧中文信息处理中的以二进制形式存储的词典,以文字形式转换过来,方便我们对词典的理解,非常有用哦-This is a Chinese information processing it in storage in a binary form in the dictionary, in textual format conversion up to us to the dictionary to understand, very useful oh
stopwords.rar
- 中文词的停用词表,可以作为中文信息处理中停用词删除的索引词典使用。,Chinese Vocabulary words out, Chinese information processing can be used as stop words in the dictionary using the index to delete.
PFR199801.rar
- PFR人民日报标注语料,它是中文信息处理的重要训练样本,PFR marked the People' s Daily corpus, which is an important Chinese information processing training samples
chinese
- 中文信息处理基础 第一讲VC环境编程简介 第二讲文件处理 第三讲字符编码 第四讲字频统计 第五讲文本断句 第六讲语料库-Basic information first deal with English-speaking environment for programming VC brief introduction stresses the second file handle character encoding the third stresses t
FileProgress1
- 文本结构化技术的初步实现及其中文信息处理的算法, 主要以论述为主!-text structure technology to achieve the initial and the Chinese information processing algorithm, based mainly discussed!
FileProgress2
- 文本结构化技术的初步实现及其中文信息处理的算法, 主要以论述为主!-text structure technology to achieve the initial and the Chinese information processing algorithm, based mainly discussed!