CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 词性标注语料

搜索资源列表

  1. v.206(预处理)

    0下载:
  2. lex语法分析,对BNC语料库进行文本标注前的预处理,将与SGML标注与文本词性标注无关的删除掉-this is lex syntax analyzing,annotate with BNC syntax LIB.
  3. 所属分类:编译器/词法分析

    • 发布日期:2008-10-13
    • 文件大小:233.93kb
    • 提供者:周果果
  1. POSTagger

    0下载:
  2. (1)从已经标注好词性的语料中统计得到词性标记的二元转移矩阵,以及每个词以确定的词性标记出现的次数等数据(训练阶段) (2)利用动态规划算法快速选取词性标记路径,得到词性标记结果 (3)可以选择不同的词性标记集 -(1) has been marked from the Corpus POS good statistical POS be labeled binary transfer matrix, and every word to determine the POS m
  3. 所属分类:其它

    • 发布日期:2008-10-13
    • 文件大小:94.17kb
    • 提供者:丁淑彬
  1. SogouW.20061127

    1下载:
  2. 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 ADV 副词 CLAS 量词 ECHO 拟声词
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:1.2mb
    • 提供者:17521
  1. POSTagger

    0下载:
  2. (1)从已经标注好词性的语料中统计得到词性标记的二元转移矩阵,以及每个词以确定的词性标记出现的次数等数据(训练阶段) (2)利用动态规划算法快速选取词性标记路径,得到词性标记结果 (3)可以选择不同的词性标记集 -(1) from the good part-of-speech tagging has been the Corpus statistics to be part of speech marking the transfer of binary matrix, a
  3. 所属分类:人工智能/神经网络/遗传算法

    • 发布日期:2008-10-13
    • 文件大小:754.82kb
    • 提供者:赵阳
  1. wordpos

    1下载:
  2. 给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出-given with sub-term and part-of-speech tagging information corpus, it is concluded that the words and phrases, and in accordance with the order of the output frequency
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:43.94kb
    • 提供者:gloria
  1. Part_Of_Speech_Label.rar

    1下载:
  2. JAVA实现的基于隐马尔科夫模型的词性标注。有指导的学习,附带语料,供参考,JAVA realization of hidden Markov model based on the part of speech tagging. Guided learning, incidental corpus, for reference
  3. 所属分类:Windows编程

    • 发布日期:2014-01-17
    • 文件大小:6.76mb
    • 提供者:yangwei
  1. PoS-Tagging-based-on-HMM

    2下载:
  2. 基于隐马尔科夫的中文词性标注系统的C++源代码,包括训练集和测试集语料库,单词量和词性数目都没有写死,可适应任意大的训练和测试数据集,程序已经过优化,一次标注只需要不到10秒的时间。-Based on Hidden Markov of the Chinese part of speech tagging system in C++ source code, including the training set and test set corpus, vocabulary and speech
  3. 所属分类:Windows Develop

    • 发布日期:
    • 文件大小:4.23mb
    • 提供者:蒋智威
  1. Unsupervise

    1下载:
  2. 利用隐马尔可夫模型实现词性标注。此为无监督模型。 内含语料库和测试集。方便大家学习。-The use of Hidden Markov Model to achieve part of speech tagging. This is no oversight model. Corpus and the test set contains. To facilitate them to learn.
  3. 所属分类:中文信息处理

    • 发布日期:2014-01-17
    • 文件大小:11.71mb
    • 提供者:lyn
  1. POSTagger_Src

    0下载:
  2. 包含了词条及其词性标记,频度信息的词典 练语料的格式要求: 每个词以 / 分隔, / 后是该词的词性标记。词性标记后至少要有一个空格。一个句子的所有词必须在同一行中。击“开始词性标注”选取文本文件(一次可以选择多个)进行标注处理-Includes a term and its part of speech marks, the frequency of information and training Corpus dictionary format requirements: Each w
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-27
    • 文件大小:170.47kb
    • 提供者:张耀
  1. WindowsApplication1

    0下载:
  2. 处理的对象是:完成分词和词性标注的语料,实现的结果是:统计出现词频完成降序排列。-Dealing with the object are: the completion of word segmentation and POS tagging of the corpus, the results achieved are: the completion of word frequency statistics appear in descending order.
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-29
    • 文件大小:35.86kb
    • 提供者:陈烨彬
  1. 1998renminribaodaiyoucixingbiaozhu

    0下载:
  2. 语音合成训练用语料,分词并带有词性标注。文档性质不是源码。-TTS language training materials, word and with part of speech tagging. The nature of the document is not a source.
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-05-10
    • 文件大小:2.12mb
    • 提供者:wulang
  1. MM2

    1下载:
  2. 利用隐马尔可夫模型实现词性标注。此为无监督模型。 内含语料库和测试集。方便大家学习。--Transition Matrix and Emission Matrix of Hidden Markov Model
  3. 所属分类:Windows编程

    • 发布日期:2014-01-17
    • 文件大小:9.08mb
    • 提供者:ken
  1. pfr199801

    0下载:
  2. PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,我们三方计划公开PFR语料库。作为公开的前期工作,从4月3日起,在我们三方的主页上免费公开PFR语料库1月份的语料,欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库,请注明来
  3. 所属分类:MultiLanguage

    • 发布日期:2017-11-05
    • 文件大小:2.11mb
    • 提供者:icypriest
  1. pos_tag

    1下载:
  2. 用viterbi方法进行词性标注 pos_tag.py 词性标注 evaluate.py 词性标注性能评估 PD_1998_01_POS.txt ”人民日报“语料库 标准词性标注结果.txt 语料库中后10 的数库(分词+词性标注)-Using the viterbi methods for part-of-speech tagging pos_tag.py part-of-speech tagging the evaluate.py speech tagging perform
  3. 所属分类:Other systems

    • 发布日期:2016-10-07
    • 文件大小:2.95mb
    • 提供者:高圆圆
  1. natural-language-processing

    0下载:
  2. 统计自然语言处理PPT-刘挺 中科院自动化研究所、模式识别国家重点实验室的 介绍的内容有统计机器翻译、词法分析与词性标注、语料库与词汇知识库-Statistical Natural Language Processing PPT-Ting Liu Institute of Automation, Chinese Academy of Sciences, State Key Laboratory of Pattern Recognition content presentation of
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-05-14
    • 文件大小:3.32mb
    • 提供者:吴鹏
  1. 199801

    0下载:
  2. 人民日报语料,分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)
  3. 所属分类:其他

    • 发布日期:2017-12-31
    • 文件大小:2.69mb
    • 提供者:elearner
  1. CorpusWordParser

    19下载:
  2. 语料分词和词性标注软件。 软件只支持打开文本格式(.txt)的文件,其他类型文件需先另存为文本文件格式后再处理。 软件可以自动识别、处理文本文件的不同字符编码(GB或Unicode等)。(Word segmentation and part of speech tagging software. Software only supports files that open text format (.Txt), and other types of files need to be sav
  3. 所属分类:其他

    • 发布日期:2018-04-29
    • 文件大小:1.39mb
    • 提供者:qibdg
  1. HMM-master

    1下载:
  2. python实验中文词性标注,包括预处理,实验数据为新闻语料。(Chinese word pos-of-speech with python)
  3. 所属分类:Windows编程

    • 发布日期:2019-05-06
    • 文件大小:7.93mb
    • 提供者:hebelu
搜珍网 www.dssz.com