搜索资源列表
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
jocws500
- 可以帮助建立网站的搜索目录,能够高速建立目标URL数据库,提取超过70亿网页、目录及搜索引擎中的metadata(标题,关键字,描述)信息,并和用户的关键词作匹配 -can help establish a web site's search directory, a high-speed target URL database, Extraction of more than 7 billion web pages, directory and search engine
lz_spidetytryryr
- 这个系统是属于自动化的搜索引擎,它可以从一个网址列表开始,自动寻找这些网址的下一级网页。可以让中小网站也有有自己特色的搜索引擎。 适合与于对某一指定领域里的网站进行搜索,比如仅搜索医学网站。 使用sql server 2000做数据库。 网络蜘蛛根据用户设定的入口网址自动收集网页数据 强大完备的后台管理 充分挖掘.net性能,百万数据瞬间搜索 完美的前台web页cc面媲美专业搜索 中文分词接口-The system is an automated search
aidog-sousuo
- 爱搜狗集成搜索引擎,特点:无数据库版-集成搜索引擎, 搜索分类特别多包括视频、网页、BT、软件、图片、新闻、论坛等!-integrated search engine, features : no version of the database-integrated search engine, Search Categories particularly including video, web, BT, software, photos, news and forums!
miniSearch
- 搜索,2006年4月开发出来。开发之初,搜索就将自己的目标定位于打造专业化的搜索引擎。力争用“最”短的时间为广大搜索用户提供“最”有用的信息。 搜索目前主要提供“美容经验” “大杂烩” “旅行资讯”三个领域的网页信息。 注:我们提供各行业专业搜索引擎索引库定制服务,您只需提供需要索引的网址,我们便会为您提供强大的网页信息抓取服务,丰富您的搜索引擎数据库,抓取内容可嵌入本搜索系统中。我们按所提供的网址数量收费。欢迎广大公司、站长和个人联系!
v6499_zgurlsearch_1_12
- zgurl.com搜索是集国内多家搜索引擎于一体,收录了百度(baidu.com)、中搜、一搜、google、yahoo、*、阿土伯、慧聪等国内搜索引擎公司和专业数据库。 可搜索网址、网页、新闻、MP3、图片、Falsh、购物、黄页(公司库)等内容。 解决了百度不允许框架其网页(用一般的框架加入百度的页面,百度会自动刷新父框架为百度当前页面)。 演示地址:http://www.zgurl.com/search.asp zgurlsearch 1.12版 修正了1.0版阿土伯交易网企业库的链
incSpideraspnet
- 蜘蛛登陆追捕器 (网络版)0.12 版 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引擎收录的收录情况等等有相当重要的作用。
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
qddown_pb33674446
- 全文搜索引擎 在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 -Full-text search engine in the search engine classified part of our full-text se
Followtop
- Follow me超级搜索引擎V6.1(完美版) 主要功能: 1.本程序整合google、百度、搜狗、中搜、搜搜等等近百个搜索引擎为一体. 2.可以搜索网页、音乐、影视、软件、图片、小说、新闻、论坛、游戏、Flash、地图、购物、商业特色搜索等10多个搜索主题. 3.占用CPU资源少,支持流量大. 4.本程序版面绝对精美,所有资料来原于各大搜索引擎,完全不用维护,只要改一下网站资料和放些广告就可以了. 5.最新增加默认搜索功能,可以让用户选择百度或google或百度
follow
- Follow me超级搜索引擎V6.1(无数据库版) 主要功能: 1.本程序整合google、百度、搜狗、中搜、搜搜等等近百个搜索引擎为一体. 2.可以搜索网页、音乐、影视、软件、图片、小说、新闻、论坛、游戏、Flash、地图、购物、商业特色搜索等10多个搜索主题. 3.占用CPU资源少,支持流量大. 4.本程序版面绝对精美,所有资料来原于各大搜索引擎,完全不用维护,只要改一下网站资料和放些广告就可以了. 5.最新增加默认搜索功能,可以让用户选择百度或google或
ss
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-asp
zhizhu
- 网络爬虫,进行对网页中部分代码的获取,到数据库中-spider
larbin-2.6.3
- larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。 latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可以看到,一个简单的larbin的爬虫可以每天获取500万的网
spider_engine
- 分析网页代码,提取url进行散列处理,提交客户端程序进行排重处理,然后存入客户机数据库,随后根据数据库中的url列表遍历整个网络。-Analysis of web code, extract the hashed url, submit re-schedule the client program to deal with, and then stored in the client database, and then the url list in the database through
TheDefinitiveGuidetoMongoDB
- mongodb是一个高性能的非关系型数据库,其底层还实现了一个分布式文件系统,可用于各种云计算。基于mongodb做搜索引擎也是非常好的选择,用它给数以亿计的网页建立反向索引也是轻而易举的事情!!!本书由维护mongodb的核心人员所写,详细且清晰的介绍了mongodb。-mongodb is a high performance non-relational database, the bottom also implements a distributed file system, can
NetSpiderDemo
- 简单描述: 本程序是一个网络爬虫的演示程序。 程序主要涉及到:网页下载,URL解析,数据库读写。 网页下载使用Winhttp组件;数据库使用Sqlite。 使用方法: 1. 在“搜索网页”Tab页,输入关键字搜索,程序会把含关键字的网页信息,存入子目录下的Info.db。 2. 在“显示网页”Tab页,输入关键字显示,程序会把含关键字的网页信息,显示在界面上。 交流及指正,请联系QQ:270156812-This is a net
mapSearch
- 网页模板,地图搜索引擎,可以输入地名,搜索附近的东西(例如,麦当劳、超市,需要数据库支持)。-Web templates, map search engine, you can enter names, search for nearby things (for example, McDonald' s, supermarkets, require database support).