资源列表
Czhizhu
- "蜘蛛"(Spider)是Internet上一种很有用的程序,搜索引擎利用蜘蛛程序将Web页面收集到数据库,企业利用蜘蛛程序监视竞争对手的网站并跟踪变动,个人用户用蜘蛛程序下载Web页面以便脱机使用,开发者利用蜘蛛程序扫描自己的Web检查无效的链接……对于不同的用户,蜘蛛程序有不同的用途。那么,蜘蛛程序到底是怎样工作的呢? - Spider (Spider) is the Internet on a very useful procedure, the search engine spider
risearch
- RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数据库来存储你网站所有页面的关键词以便快速搜索。Risearch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的关键词。 RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。
Google_Code
- Google Code Host的使用说明-Google Code Host of use
lucene2_source
- 应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。 -Applications to demonstrate use of Lucene indexing and search the index process.
NLuke0.12
- 这是一个基于网络的,扩展了lunce的一个搜索分词工具-This is a web-based, expanded lunce participle of a search tool
UseTheGoogle
- 在搜索越来越重要的今天。对所有人来说都是很有用的-More and more important in the search today. For all of us are very useful
spsearch
- java的搜索引擎,基于LUCENE算法。大家来观摩一下-java search engine, based on the Lucene algorithm. Everyone to watch what
WebSpider
- 網路蜘蛛(Web Spider)Copyright (c) 1998 by Sim Ayers. 一個網路蜘蛛程序的具體實現 使用Microsoft Visual C++ 6.0編譯-Spider Web (Web Spider) Copyright (c) 1998 by Sim Ayers. A Web spider concrete realization of the use of Microsoft Visual C++ 6.0 compiler
tse.081227-1441.Linux.tar
- 网络爬虫,网页搜集,网页PAGERANK计算。LINUX版本。-Network reptiles, page collection, page PAGERANK calculation. LINUX versions.
lucene-1.2-src.tar
- 学搜索引擎必须看的经典 入门的经典资料 代码特少-Science search engine must see classic classic data entry code small
TSE_tutorial
- 这个文件是和北大TSE搜索引擎配套的更详细的文档,希望对大家有所帮助!-This document is a search engine, and Beijing University TSE more detailed supporting documents, I hope all of you to help!