搜索资源列表
non_zhineng-04-4-8
- 改进的机器人搜索引擎-improved search engine robot
SQLET_spider
- 网络机器人又称为Spider程序,是一种专业的Bot程序。用于查找大量的Web页面。它从一个简单的Web页面上开始执行,然后通过其超链接在访问其他页面,如此反复理论上可以扫描互联网上的所有页面。-network robot also known as Spider procedures, is a professional bot procedures. Looking for a large number of Web pages. From a simple Web pages to beg
sphider
- 搜索软件ROBOT 搜索引擎中最重要的一项 PHP编写的一个网络蜘蛛程序-search software search engine one of the most important preparation of a PHP Web Spider procedures
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
heritrix-1.6.0-src
- 非常优秀的搜索引擎 LInux下 java版本的 robot-excellent search engine LInux under java version of the robot
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
robot
- 用robots.txt文件设置使BBS只有首页被搜索引擎收录
Robot
- 信息采集Robot的实现及应用,详细讲述了ROBOT的开发和应用技术
wininet-spider
- 网络爬虫,完美演示了多线程和深度设置抓取网页数据。-crawl through internet to get web data. the win32 api supports applications that are pre-emptively multithreaded. this is a very useful and powerful feature of win32 in writing mfc internet spiders. the spider project is a
larbin_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system. www.av.com robot similar to the rapid indexing tool for Internet web pages cable guidelines generation
larbn_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 > 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 > 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system, similar to the robot www.av.com indexing tools
Search_Engine
- 描述了搜索引擎的系统结构,从网络机器人、索引引擎、Web服务器三个方面进行详细的说明,并通过实现一个新闻搜索引擎来进行例证。-Describes the search engine' s system structure, from the network robot, indexing engine, Web server three areas detailed explanation, and through the realization of a news search engi
ss
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-asp
robot.c.c
- 一个红外避障的六足爬虫机器人程序,网上查了很多,没有这样的源码程序-An infrared obstacle avoidance of the six-legged robot reptiles procedures, a lot of online search, there is no such source program
Robot
- 网上机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获取在Internet上的信息。机器人利用主页中的超文本链接遍历Web,通过URL引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HTML文件的验证、URL链接验证、获取更新信息、站点镜象等。 -Internet Robot (Robot) also known as Spider, Worm, or Random, the core objective is t
S130F-A
- example program SLIM for nachi ROBOT SA 130
1.RAR
- 搜索引擎一词在国内外因特网领域被广泛使用,然而他的含义却不尽相同。在美国搜索引擎通常指的是基于因特网的搜索引擎,他们通过网络机器人程序收集上千万到几亿个网页,并且每一个词都被搜索引擎索引,也就是我们说的全文检索。著名的因特网搜索引擎包括First Search、Google、HotBot等-Internet search engine is used in the field is widely used abroad, but his meaning is different. Of the
Spider
- 由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。 -Designed to retrieve information as a " robot" program as a spider crawling across the network, and repeatedly, tirelessly. Therefore, the search engine " robot"
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开