搜索资源 - 测试集

搜索资源列表

PcfgParser

0下载：
1. 先打开规则库，读入规则集（可比较两个规则文件rule1.txt 和 rule2.txt的差异） 2. 选择经过分词和词性标注的文件，进行句法分析 3. 分析结果文件与测试文件在同一个目录下，文件后缀名为 .pcfg 4. 分析结束后，同时产生一个新的规则文件,后缀名为.new, 可以观察规则概率值和期望次数的变化 5. 分析结果逐个以树形图方式显示，如果一个句子有多个结果，在显示框中同时显示。
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：51.7kb
- 提供者：董广宇

experimentoftextclassification

0下载：
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档，数据集共分教育，商业与经济，计算机与因特网，娱乐与休闲，自然科学5个类别，教育类包括31篇文档，商业与经济类有93篇文档，计算机与因特网102篇文档，娱乐与休闲166篇文档，自然科学有208篇文档。目录“DataSet”：RawText中的文本分词后保存在DataSet目录。数据表“WordsTable”：保存DataSet中所有文本的倒排文档。其中“目录
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：2.73mb
- 提供者：同承

Unsupervise

1下载：
利用隐马尔可夫模型实现词性标注。此为无监督模型。内含语料库和测试集。方便大家学习。-The use of Hidden Markov Model to achieve part of speech tagging. This is no oversight model. Corpus and the test set contains. To facilitate them to learn.
所属分类：中文信息处理
- 发布日期：2014-01-17
- 文件大小：11.71mb
- 提供者：lyn