搜索资源列表
Project_Search
- 采用GoogleAPI实现网络爬虫技术,可以运行,运行环境eclipse-Achieved by GoogleAPI crawler technology, you can run, run environmental eclipse
The-programming-collective-wisdom
- 《集体智慧编程》(programming collective intelligence building smart web 2.0 applications)以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数
spider_baike-master
- 一个简单的初级爬虫程序通用网络爬虫又称全网爬虫(Scalable Web Crawler),爬行对象从一些种子 URL 扩充到整个 Web,主要为门户站点搜索引擎和大型 Web 服务提供商采集数据。 由于商业原因,它们的技术细节很少公布出来。 这类网络爬虫的爬行范围和数量巨大,对于爬行速度和存储空间要求较高,对于爬行页面的顺序要求相对较低,同时由于待刷新的页面太多,通常采用并行工作方式,但需要较长时间才能刷新一次页面。 虽然存在一定缺陷,通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价
网络爬虫
- c#网络爬虫,抓取网页数据,爬虫技术抓数据(C# crawler technology)
50506-Python网络爬虫技术-源代码和实验数据
- Python网络爬虫技术-源代码和实验数据(Python web crawler technology)