搜索资源列表
TheGoogleFileSystem
- 一篇关于google搜索引擎的PC集群所采用的分布式文件系统的论文.对于想学习大规模数据处理的人应该很有用
TheGoogleFileSystem
- The Google File System 的总体设计方案描述,是一个十分经典的论文,学习搜索引擎方面的人必看文献。
23
- 词频统计就是统计一个句子或一篇文章中各种词出现的频率,它是中文信息处理的一项基本技术,在很多领域中都有重要的应用。例如在中文搜索引擎(如Google、百度)中,除特别常用的词以外,一篇文章中出现频率较高的词通常能反映这篇文章的主题,因此可以使用词频来对中文文章进行归类。本案例实现按词表对文章中的词语进行分析,并按字典序给出词表中各词语在文章中出现的次数。-Frequency Statistics is a statistical one sentence or an article in the
Google_PageRank
- google所用的网页排名算法。现在几乎被全球的搜索引擎学习者学习。-google page rank algorithm used. Now almost learners around the world search engine.
Large-scale-Incremental-Processing
- google的增量处理系统。下一代搜索引擎使用的爬虫和网页处理。-Large-scale Incremental Processing of google
GoogleDataCenter
- Google数据中心开发指南,讲述了Google在设计数据中心的关键技术,GOOGLE是全球一流的软件公司,搜索引擎很强大,你懂的-Google data center development guide, tells Google the key technology in the design of the data center, GOOGLE is the world s leading software companies, the search engine is very powe