搜索资源列表
yulao.SogouT.min
- soguo公司的语料,用于文本,网页分类,很好的语料库。
Collection-and-Analysis
- 本文首先在欧共体项目(LC-STAR)的资助下,开展了大规模汉语平衡语料的收集与分析工作,其主要目的是建立一个反映现代汉语语言特点的、适用于汉语语言分析、语音识别和语音合成的汉语标注语料库,并以此为基础建立相应的信息词典。-Our work supported by European Union’s project of LC-STAR, which includes collection and analysis of a large-scale balance-corpus, aims to
199801
- 人民日报1998年1月份的标注语料库,本人觉得很好所以共享一下~ 研究自然语言的朋友应该会用到~-People s Daily of January 1998 marked corpus of natural language should be used- friends
20news-bydate.tar
- 一个可用的英文语料库,包含20大分类,可用作文本分类语料库-One of the available English corpus, including 20 big classification, usable ZuoWenBen corpus
master_thesis
- 音乐领域中文实体关系抽取研究 实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义 好的语义关系。本文将实体关系抽取定义为一个分类问题,主要研究内容是 中文音乐领域的实体关系抽取。针对这一问题,本文首先构建了中文音乐实 体关系语料库,然后分别采用了基于序列模式挖掘的无指导的方法和基于特 征提取的有指导的方法来解决这一问题。 -Dissertation for the Master Degree in Engineering urgently needed to de
computer-voice-input
- 将语音录入问题分为三个模块进行研究:语音识别模块、 字转换模块和语料库建立模块。-Voice recording is divided into three modules for research: speech recognition module, word conversion module and corpus creation module.
616341
- 中文文本语料库 适合中文文本分类使用 朴素贝叶斯算法整合 -Chinese text categorization corpus
RDF3X-a-RISCstyle
- RDF是为了模式自由的信息提供的一种数据表达方式,在语义网语料库、生命科学、web2.0平台上发展迅速。-RDF is a data in order to model the freedom of expression of information provided by the rapid development of the Semantic Web corpora, life sciences, web2.0 platform.
jrxbck
- 用于数据分析的金融细胞词库,详细收集了金融行业的细胞词用户语料分析-For financial cell thesaurus data analysis, detailed analysis of cell collected corpus word user of the financial industry
hownet
- 知网完整版,附带相关的各种论文文档,中文语料库-see chinese descr iption
rt-polaritydata
- 该文档可在机器学习中用于文本分类的语料库,内涵一个正面语料文档和一个负面语料文档。(This document is a corpus for text categorization in machine learning, with a positive corpus document and a negative corpus document.)
文本处理高级语料库
- 自然语言处理语料库代码,能够提供大量方向基础入门信息。