资源列表
Python学习手册(第4版).pdf
- pyhton语言的爬虫应用,Mysql数据库应用(scrapy; database application development)
《Python3网络爬虫开发实战代码》
- 想学习Python爬虫吗,包含大量Python爬虫学习实例,资料丰富(Want to learn Python crawlers, including a lot of Python crawler learning examples, rich in information)
Google.Hacks.third-edition
- 讲述了google的一些使用技巧和google的一些实现原理,可以作为学习搜索引擎的参考书籍-About google and google some tips some of the implementation principle, can be used as a reference book to learn search engine
crawler
- 爬虫程序,对于一个网站,可以针对其子网站,进行爬虫,并且继续针对子网站后的子网站,一级一级的爬下去,可以将这些网站都保存到一个目录中去-Crawler, a web site, for its sub-sites to carry reptiles, and continue to subsites after subsites, shin level can these sites are saved to a directory
SPIDER
- 搜索引擎完整源码包括网络爬虫+数据库+界面源代码(The search engine includes a web crawler complete source code + database + interface source code)
lucene-4.0.0
- 这是一个搜索引擎的安装包,很简单,自己学吧哈-This is a search engine installation package is simple own now
mahout-0.3
- mahout是一个开源的软件包,对搜索引擎的聚类,分类算法以及推荐系统算法的代码实现-mahout is an open source software package, the search engine clustering, classification and recommendation system algorithm algorithms code
apache-nutch-1.2-src
- nutch-1.2用于开发自己的搜索引擎-apache nutch 1.2
google
- 在网站入侵中,Google是一个必须的,特殊的入侵工具。Google是一个用来在互联网上搜索信息的强大工具,在Google的数据库中存储着超过100亿个Web文件,而在这些信息中就隐藏着许多我们想要得到的信息,本次Google系列教程就教大家如何使用Google寻找我们所需要的信息,并加以利用。(Google hack, Search Engine)
nSearch0.7
- 中文搜索引擎,宁夏大学张冬的成果。功能还可以-Chinese search engine, the results of Zhang Ningxia University. Function can also be
SouYuan
- java开发的分布式搜索引擎,采用x-fire webservice的结构-java development distributed search engine, using x-fire webservice structure
Yahoo
- 雅虎搜索引擎的部分源代码,希望对大家有用!-Yahoo search engine part of the source code, useful for all of us hope!