搜索资源列表
SearcherEngine
- Java做的搜索引擎,用bot和lucene搭建 非常不错的程序
bot
- java 网络爬虫,可用于网站采集,搜索,
bot-package-1.4
- 网络搜索引擎方面的源码,是个著名书籍上的例子,很有权威性-bot-pack
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开