搜索资源列表
中文分词技术及最新发展
- 搜索引擎通常由信息收集和信息检索两部分组成。对于英文,由于英文中词 与词之间是用空格隔开,检索起来很方便,故计算机采用了词处理的方式,大大 减轻了用户与计算机的工作量:相对来讲,中文的情形就复杂得多。中文的词与 词之间是没有分隔符的,因此若想建立基于词的索引,就需要专门的技术,这种 技术被称之为“汉语词语切分技术”。根据是否采用词语切分技术,中文搜索引 擎又可分为基于字的搜索引擎和基于词的搜索引擎。由于中文信息处理的特殊 性,开发中文搜索引擎决不像西文软件的汉化那样简单。在实
基于哈希表的词频统计
- 基于哈希表的词频统计 -Hash table based on word frequency statistics
23
- 词频统计就是统计一个句子或一篇文章中各种词出现的频率,它是中文信息处理的一项基本技术,在很多领域中都有重要的应用。例如在中文搜索引擎(如Google、百度)中,除特别常用的词以外,一篇文章中出现频率较高的词通常能反映这篇文章的主题,因此可以使用词频来对中文文章进行归类。本案例实现按词表对文章中的词语进行分析,并按字典序给出词表中各词语在文章中出现的次数。-Frequency Statistics is a statistical one sentence or an article in the
word-statics
- 词频统计是一个重要的工具,你可以统计文章中词出现的频率来真正实现每个词的含义-word statics,you can use the soft ware to check the number of the article.such as a,b.c.d.
Word
- 使用的词频统计软件:用于英文单词词频统计,文件中给出主要的源代码-Frequency Statistics Software used: for the English word frequency statistics, the paper gives the main source code
wordCount
- 关于词的处理,词频统计,统计词频,非常实用。-word count
ICTCLAS2014
- 中文自然语言处理相关程序,包括中文词频统计、新词发现等功能,并含有示例文档。-Chinese Natural Language Processing related procedures, including Chinese word frequency statistics, new word detection and other functions, and contains a sample document.
xuqiufenxi
- 英文词频统计器的需求分析,描叙了工程的E-R图,各个子系统实现的功能。概要设计-English word frequency statistics the needs analysis, describes the use of ER diagram of the project, each subsystem functions implemented. Summary of design, etc.