搜索资源列表
harvest-1.6.1.tar.gz
- 又一个建立索引的搜索引擎
htdig-3.2.0b2.tar.gz
- 公司级网络用的搜索引擎,包含建立索引
jugger_src-V1.0.0.tgz
- 包括建立索引功能的全文搜索程序
madengine.zip
- 根据特定URL地址读取所有页面自动建立索引文件的搜索程序
swish-efiles.1.3.2.tar.gz
- 用C语言写的搜索引擎,包含多种建立索引的方式
Spideroo
- C#写的一个搜索引擎,可以搜索、建立索引等。building a simple search engine that crawls the file system from a specified folder, and indexing all HTML (or other types) of documents. A basic design and object model was developed as well as a query/results page-C# to write
soo_search
- soo search是一个服务的接口,目标为简化搜索引擎的定制规则,加速全文索引的快速高效的开发。通过javaBean技术,把资源对象化,以建立方便的资源管理机制。soosoo search把资源的输入和输出通过一个值对象(bean)和用户进行交互,这样soosoo search可以快速的和现有的j2ee开源框架进行集成。soosoo search提供了两个接口,一个是索引器接口,一个是检索器接口。而这里两个接口的实现都是通过公共的数据模板进行资源的格式化。利用用户定制的javaBean对象,把
clucene-0.9.8
- clucene是lucene的C版本。这是一个建立索引、搜索的函数库。-clucene lucene is the C version. This is an established index, search the libraries.
lab2-indexing
- 实现了搜索引擎中的建立索引的部分,里面有详细的文档说明-realized the search engine of the establishment of the index, with a detailed document shows
IndexPerformanceTest
- 用Lucene实现的用于搜索引擎中的建立索引不过些索引结构不支持快速的信息更新。
swish++-6.0.4.tar
- gcc编的网络搜索引擎,包括建立索引和检索-gcc series of the Web search engines, including indexing and retrieval
incSpideraspnet
- 蜘蛛登陆追捕器 (网络版)0.12 版 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引擎收录的收录情况等等有相当重要的作用。
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
swish-efiles
- 详细说明: 用C语言写的搜索引擎,包含多种建立索引的方式 -C serach engine, contains many methods for index establishing
swish-efiles.1.3.2.tar
- 用C语言写的搜索引擎,包含多种建立索引的方式-C serach engine, contains many methods for index establishing
madengine
- 根据特定URL地址读取所有页面自动建立索引文件的搜索程序 -Serach app which can read all the special urls webpages and setup up index automatically
lucene2_source
- 应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。 -Applications to demonstrate use of Lucene indexing and search the index process.
tidy_for_interface_win
- 搜索引擎程序包括网络把从,网页净化,建立索引,排序等步骤。这是网页净化部分的代码。-tidy web page
Robot
- 网上机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获取在Internet上的信息。机器人利用主页中的超文本链接遍历Web,通过URL引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HTML文件的验证、URL链接验证、获取更新信息、站点镜象等。 -Internet Robot (Robot) also known as Spider, Worm, or Random, the core objective is t