资源列表
Chap10
- 垂直搜索引擎,检索代码,创建索引文件,搜索关键字,并返回结果-Vertical search engine
Simple-collection-of-reptiles
- 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just made a collection of URL functi
crawler
- c++实现的一个网络爬虫,可以实现指定内容搜索的功能。-c++ implementation of a Web crawler, can specify the contents of the search function.
WebNewsCrawler-1.0
- 一个网络爬虫程序,用java实现的,并且可以实现新闻的抓取-A Web crawler program, with the java implementation, and news of the capture can be achieved
ComicSpider
- 本程序实现了对漫画的自动搜索与自动下载,通过使用httpclient及htmlparser爬取获得图像路径,并采取多线程方式进行下载,速度很快,可以二次开发。-This program implements an automatic search for comics and automatically download, using httpclient and htmlparser crawling get the image path, and take multiple threads
web1
- web本意是蜘蛛网和网的意思。现广泛译作网络、互联网等技术领域。表现为三种形式,即超文本-spider web and network intended meaning. Now widely translated network, the Internet and other technology fields. Manifested in three forms, namely, hypertext
JavaNetSpider
- Java网络爬虫(蜘蛛)源码 本程序利用java技术通过IP/TCP技术去捕捉网络数据。-Java web crawler (spiders) the source code The program use Java technology through the IP/TCP technology to capture network data.
SEO
- SEO搜索引擎优化高级教程,使你得心应手。给你带来客户-SEO search engine optimization advanced tutorial, make you with ease. Bring you the customer
search
- 禁忌搜索,在一定的约束条件下,搜索满足条件的最优解-tabu research
BuildHtmlDemo
- BuildHtml urlwrite 通过动态设置URL实现搜索引擎访问-BuildHtml urlwrite
yioop-v0.76
- Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps。 Yioop! Version 0.76 发布,该版本增加了获得Yioop! 之外的搜索结果的函数API,提高了RSS响应,允许包含图片。加强了在线文档,简化了arc_tool同步,修复了导致大型索引崩溃的目录输出缓冲的一个
SearchEngine
- 本文旨在运用元搜索技术,建立一个分类细致精确、数据全面深入、更新及时的面向主题的搜索引擎,成功地提高信息检索的效率。开放课程体系搜索引擎,是类似于麻省理工学院开放课程系统的课程教学资源搜索引擎。它有针对性的搜索网上课程教育相关信息,从而使学员高效检索所需的课程信息。-The purpose of this paper is to use the Meta search engine technique to create a educational subject-oriented search