搜索资源列表
maxent-20041229[1].win32
- 文本分析中基于统计的方法中,最为常用的最大熵算法,该源码为Python版,广泛应用于词性标注,词义消岐等领域-text analysis based on statistical methods, the most commonly used of maximum entropy algorithm, the source code for Python version, widely used in tagging, Meaning Consumers divergent fields
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
wordpos
- 给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出-given with sub-term and part-of-speech tagging information corpus, it is concluded that the words and phrases, and in accordance with the order of the output frequency
postag_convert
- 一个集分词、词性标注和格式转换的强大的工具包-a word, part of speech tagging format conversion and a powerful tool kits
PcfgParser
- 1. 先打开规则库,读入规则集 (可比较两个规则文件rule1.txt 和 rule2.txt的差异) 2. 选择经过分词和词性标注的文件,进行句法分析 3. 分析结果文件与测试文件在同一个目录下,文件后缀名为 .pcfg 4. 分析结束后,同时产生一个新的规则文件,后缀名为.new, 可以观察规则概率值和期望次数的变化 5. 分析结果逐个以树形图方式显示,如果一个句子有多个结果,在显示框中同时显示。
POSTagger
- 中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
CRFTagger-1.0.tar
- 一个利用条件随机场(CRF)开发的词性标注工具包
07S051098
- 通过隐马尔可夫模型做词性标注,即给定一个句子,得到它的最优词性序列
word_pos
- 中文词性标注子程序第一步,将测试文本加入词性标记集、词语标记集、标记同现集,VFP源码
FreeICTCLAS
- 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
Codes and Application
- 这是一个中科院中文词法分析器,能对输入的文本进行分词,词性标注,未登陆词识别等功能,正确率相当高,很有用哦-This is an Academia Sinica Chinese morphology analyzer, can carry on the participle to the input text, the lexical category sign note, has not landed function and so on word recognition, correct r
自动分词与词性标注评测有助于学习NLP
- 自动分词与词性标注评测有助于学习NLP,并且理解其更深的含义,A good Instruction of PoS
windows_c_32.rar
- 中国科学院的最新版本的中文分析程序,可以进行分词、词性标注等,The latest version of the Chinese Academy of Sciences of the Chinese language analysis procedures, can be sub-word-of-speech tagging, etc.
Chinese-automatic-word-segmention
- 汉语自动分词和词性标注__源代码 这是原创,不带复制的 汉语自动分词和词性标注__源代码-Chinese automatic word segmentation and POS tagging __ source code This is the original, without copying Chinese automatic word segmentation and POS tagging __ source code
Unsupervise
- 利用隐马尔可夫模型实现词性标注。此为无监督模型。 内含语料库和测试集。方便大家学习。-The use of Hidden Markov Model to achieve part of speech tagging. This is no oversight model. Corpus and the test set contains. To facilitate them to learn.
POSTagger_Src
- 包含了词条及其词性标记,频度信息的词典 练语料的格式要求: 每个词以 / 分隔, / 后是该词的词性标记。词性标记后至少要有一个空格。一个句子的所有词必须在同一行中。击“开始词性标注”选取文本文件(一次可以选择多个)进行标注处理-Includes a term and its part of speech marks, the frequency of information and training Corpus dictionary format requirements: Each w
hmmfan
- 一个用于 词性标注的 HMM程序。 包含 训练和测试功能。-One for the HMM-speech tagging procedures. Includes training and testing.
KaiYuanIctclas
- ICTCLAC开源代码,可用在中文文本信息处理上,为信息抽取进行中文分词、词性标注处理,准确度达到85 以上,-failed to translate
POStag
- 词性标注。首先根据预料库训练模型,然后用得到的模型对未标记词性的语句进行词性标注。-Part of Speech Tagging. First, according to the training model is expected to libraries, and then get the model right part of speech of the statement is not marked for POS Tagging.
tool
- 中文语法词性标注工具,语义语法标注等开发环境Visio c-label tool