资源列表
SearchEngine
- 北大天网项目负责人,国内信息搜索权威李晓明著,对搜索引擎原理进行了细致的讲述-North Skynet project manager, internal information search authority Li Xiaoming, and the principle of the search engine on a detailed
search-engine
- 搜索引擎-原理、技术与系统 Search Engine - principles, technologies and systems-Search Engine- principles, technologies and systems
968188_1229235444ZUjI
- 一个关于搜索引擎的原理、技术与系统的介绍与实现-A search engine about the principles, technology and systems with the introduction of the implementation
search
- 一个介绍搜索引擎原理的设计文档,是一个学习搜索引擎的好资料-Introduced the principle of a search engine design documents, is a good study and information search engine
search
- 详细的阐述了搜索引擎的原理,平且讲述了以后再web应用中的前景和价值!-Detailed descr iption of the principle of the search engine, flat and later described the prospect of web applications, and value!
Spider
- 由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。 -Designed to retrieve information as a " robot" program as a spider crawling across the network, and repeatedly, tirelessly. Therefore, the search engine " robot"
搜索引擎——原理技术与系统
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共 13 章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的 Web 信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。(This book introduces the work principle, the realizat
K---PageSearch-search-engine-system
- k- PageSearch搜索引擎系统的C#代码,实现搜索引擎的基本功能-k-PageSearch search engine for C# code to achieve the basic functions of search engines
CSharpSpider
- 用吃sharp语言编写的网络蜘蛛爬虫程序,代码完整,可直接运行。-Sharp language used to eat spiders web application, code integrity, can be directly run.
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
nut_source_1.0a6
- lucene + hadoop 分布式索引,希望对开发搜索引擎的同志有帮助-lucene+ hadoop distributed index, hope to develop a search engine to help comrades
wspider
- lucene 搜索功能的实现机制 主要用于站内搜索-lucene