资源列表
SearchCrawler
- 一个搜索引擎类,使用方法:在命令窗口输入: D:\\>java SearchCrawler http://www.sina.com 20 java-a search engine category, the use of methods : the command window : D : \\ gt; Java SearchCrawler http://www.sina.com 20 java
3
- 程序代码——可以对Heritrix进行索引和检索的Lucene程序-Code- can Heritrix Lucene indexing and retrieval procedures
search
- 搜索引擎的Cshap的代码实现从别的网站上转载的请大家阅读-Search engine
GetWeb
- 以下是一个Java爬虫程序,它能从指定主页开始,按照指定的深度抓取该站点域名下的网页并维护简单索引。-The following is a Java reptiles, it can start from the specified Home to crawl pages under the domain name of the site in accordance with the specified depth and maintain a simple index.
wlpc
- 一个网络爬虫程序,抓取网页上的内容 一个网络爬虫程序,抓取网页上的内容-A Web crawler program, crawl content on a web page web crawler program, crawl content on web pages
java
- 元搜索引擎,能够集合各家搜索引擎的优势,将最合理的搜索结果,呈现给用户-Meta search engine, to collect together all the advantages of search engines, search results will be the most reasonable, presented to the user
search_db[1]
- 利用本程序可以很方便地进行页面查找,应该属于搜索引擎吧。-use of the procedure can be very convenient for the search pages, search engines should belong to it.
multi-threaded
- 基于Java的多线程网络爬虫设计与实现,应用的是JAVA技术,制作网络爬虫-Java-based multi-threaded Web crawler design and implementation, the application is JAVA technology, production of web crawlers
spider
- 网络蜘蛛Spider,实现了从网络的自动获取Url并保存。
000
- 禁忌搜索程序 希望能给你的学习提供帮助 -Tabu search procedure can give you to learn to help
incSpideraspnet
- 蜘蛛登陆追捕器 (网络版)0.12 版 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引擎收录的收录情况等等有相当重要的作用。
53607929Webler
- 一个非常强悍的搜索引擎,包括网络蜘蛛,能实现网页排名-a very tough search engine, including Web spiders, able website rankings