搜索资源列表
nsp-v0.71.tar
- N元组统计程序源代码,使用perl编写,作者是Ted Pedersen。-N group statistical source code, the use of perl preparation, the author is Ted Pedersen.
doc2mat.tar
- 用perl编写的文本转换为向量空间模型的程序,只能处理英文-using perl version prepared by the conversion of the vector space model procedures, can only handle English
TS300Src
- 从唐诗300首中统计作者和发表的诗篇,用perl语言实现-from the Tang Dynasty 300 Statistics published by the author and poetry, using perl language
Sohu.ZIP
- 统计http://www.sohu.cn/页面中有多少个静态的超链接,用perl语言实现-statistics http://www.sohu.cn/ pages static number of hyperlinks using perl language
idiomEx.ZIP
- 采用复杂数据结构完成成语接龙,用perl语言实现-use of complex data structure completed idiom Solitaire using perl language
Pos_py
- 采用复杂数据结构从文件中生成一个带有拼音和词性信息的词典,用perl语言实现-use of complex data structures generated from the paper with a phonetics and POS information in the dictionary. using perl language
IdionLink
- 一个成语接龙的PERL程序,由电脑自动出成语,然后用户根据成语的最后一个字进行接龙,如接不上,可选择由电脑给出-an idiom of PERL procedures out automatically by a computer idiom, Then users under the idiom of the final Solitaire for a word, such as whether or not, given the option of having a computer
segment
- 中文分词的perl代码。 可识别人名(包括外国人名)、数字等。
system
- 一个基于PERL的语言处理工具包. 其中包含文本处理,词汇过滤及一个英语词汇词法处理工具(STEMMER),适用于处理一些基本的.TXT文件.
文本拆分程序
- 这个perl程序可以很灵活地按照指定的行数把单个文本文件拆分成多个文本文件。
seg
- 一个应用perl编写的中文分词工具,里面有一个很好分词词库-perl fen ci
Goldcard_Perl_Generator
- All HTC GoldCard generator Perl scr ipt, FREE, STANDALONE and UNLIMITED
acopost_note
- acopost是Ingo Schroder于02年在德国汉堡大学完成的一个词性标注工具包。主要实现了基于实例、最大熵、2元隐马、基于转换规则等4种词性标注算法,以及评价和算法融合等。采用的语言是perl和c,代码比较短小,非常适于学习。-acopost Ingo Schroder is a speech in 2002 at the University of Hamburg, Germany marked the completion of the toolkit. The main achi