资源列表
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
ExtractorDktj131_2012
- 基于复杂网络的新闻网页解析算法,实现复杂网络构建及分词功能-Built complex network based on complex network news page parsing algorithm, and the word function
clucene
- 搜索引擎底层用C写的,提供Dod.NET,PHPd,perl的例子-bottom search engine written in C, providing Dod.NET, PHPd, perl example
lucene-1.2
- 索引和检索接口,为搜索引擎的开发提供了核心组件为搜索引擎的开发提供了核心组件-indexing and retrieval interface, Search engine for the development of the core components of the search engine provided for the development of the core components
Web-Crawler
- program about web crawler
1.RAR
- 搜索引擎一词在国内外因特网领域被广泛使用,然而他的含义却不尽相同。在美国搜索引擎通常指的是基于因特网的搜索引擎,他们通过网络机器人程序收集上千万到几亿个网页,并且每一个词都被搜索引擎索引,也就是我们说的全文检索。著名的因特网搜索引擎包括First Search、Google、HotBot等-Internet search engine is used in the field is widely used abroad, but his meaning is different. Of the
Javasearchengine
- Java搜索引擎的代码,有兴趣走Java方向的同学必看-Java search engine code, interested students must see the direction to go Java
nutchbook
- Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。本电子数据里有详细的介绍-Nutch is an open-source, Java to achieve search engine. We run it offers its own search engine all the necessary tools.
Nutch
- 网上流行的Nutch爬行器代码,是Java语言编写的。功能很强大-Nutch web crawler popular code is the Java language. Very powerful
Nutch
- Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。本书是nutch的入门书籍-Nutch is a Java implementation, just the birth of open source (open-source) of the web search engine. This book is the introductory books nutch
Nutch-beginner
- 搜索引擎Nutch的入门级教程,供初学者使用,内容比较粗浅,但很准确。-The search engine the Nutch of entry-level tutorial for beginners to use, relatively shallow, but very accurate.
C++ 实现的网络爬虫
- 这个是一个C++实现的搜索引擎,功能齐全。是学习写搜索引擎很好的例子。