搜索资源列表
CSharpspider
- visual C#编写的网络爬虫程序,与用VC写的相比简单了很多,对学习C#网络编程来说很重要!-written in visual C# Web crawler program written in VC compared with the simple use of a lot to learn C# network programming is very important!
SearchEngine1.0
- 实现搜索引擎最基本的下载网页、建立倒排索引、关键词查询功能。程序的实现借助了libcurl库。-Search engine to achieve the most basic functionality of downloading page, seting up inverted index, keyword querying. Program implementation with the libcurl library.
ESP
- 使用dotnet + 多线成的爬虫程序。 主要用于sina , 163 等大型论坛。 后台搭配数据库, 已经实现了 下载后的搜索, 图片已经实现下载在分类目录。 -Using dotnet+ Multi-line program into the reptiles. Mainly used sina, 163 and other large forums. Background with a database, has become a reality after downloa
j_13461_YH_Keywords_mining
- 欢迎使用渝海SEO关键词挖掘工具,本工具运行环境需求:PHP。 主要功能: 1、本工具适用于网站SEO时关键词深度挖掘,用一个关键词做相关热词挖掘,辅助筛选组合合适的关键词; 比如输入“电子商务”,工具会反馈百度、Google各自检索此关键词的收录量; 同时工具会提供相关热词索引,您可以继续点这些热词做分析。 周而复始的操作,就可以挖掘、组合出您想要的关键词。 2、DIV+CSS模板方便修改; 3、免费、开源程序。-Welcome to Yu Hai SEO K
GAMECAIDAN
- [原创]新版网吧游戏菜单 V2.0 超强版 由于朋友需要所以帮忙写了个游戏菜单,程序接近完美,所以请大家来PP 带有在线管理功能,可在线修改游戏设置。 带有本地歌曲点播功能,程序可播放本地或网络歌曲 带有百度音乐搜索功能,搜索出来的歌曲可在线播放,下载等-[Original] The new Internet version of the game menu V2.0 Superacid So as a result of the need to help a friend wr
WWW-Google-PageRank-0.12.tar
- Perl编写的PageRank算法,同大家分享。-PageRank algorithm based on Perl, share with all.
CSharpSpider
- "蜘蛛"(Spider)是Internet上一種很有用的程序,搜索引擎利用蜘蛛程序將Web頁面收集到數據庫,企業利用蜘蛛程序監視競爭對手的網站並跟蹤變動,個人用戶用蜘蛛程序下載Web頁面以便脫機使用,開發者利用蜘蛛程序掃瞄自己的Web檢查無效的鏈接……對於不同的用戶,蜘蛛程序有不同的用途。那麼,蜘蛛程序到底是怎樣工作的呢? 本文介紹如何用C#語言構造一個蜘蛛程序,它能夠把整個網站的內容下載到某個指定的目錄,程序的運行界面如圖一。你可以方便地利用本文提供的幾個核心類構造出自己的蜘蛛程序。 -
spider_engine
- 分析网页代码,提取url进行散列处理,提交客户端程序进行排重处理,然后存入客户机数据库,随后根据数据库中的url列表遍历整个网络。-Analysis of web code, extract the hashed url, submit re-schedule the client program to deal with, and then stored in the client database, and then the url list in the database through
Clucene-0[1].8.13-src
- C语言实现的搜索引擎,和大家分享下,很经典,很实用,适合初学者。-A search engine of c program,share it with you,thank you
tabu-search
- 禁忌搜索程序,此程序使用用实现禁忌搜索的基本能力,有良好的搜索能力-tabu search procedures, this program uses tabu search using to achieve the basic ability, with good search capabilities
WebNewsCrawler-1.0
- 一个网络爬虫程序,用java实现的,并且可以实现新闻的抓取-A Web crawler program, with the java implementation, and news of the capture can be achieved
Web-Crawlers
- 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。 -Web crawler (also known as web spider, robot, in the middle of the FOAF community, more often referred to as Web Chaser), is one kind of in acco
NwebCrawler
- NwebCrawler是用C#写的一款多线程网络爬虫程序,它的实现原理是先输入一个或多个种子URL到队列中,然后从队列中提取URL(先进先出原则),分析此网页寻找相应标签并获得其href属性值,爬取有用的链接网页并存入网页库中,其中用爬取历史来记录爬过的网页,这样避免了重复爬取。提取URL存入队列中,进行下一轮爬取。所以NwebCrawler的搜索策略为广度优先搜索。采用广度优先策略有利于多个线程并行爬取而且抓取的封闭性很强。-NwebCrawler is a multi-threaded w
WPCrawler
- 网络爬虫,也叫网络蜘蛛,有的项目也把它称作“walker”。维基百科所给的定义是“一种系统地扫描互联网,以获取索引为目的的网络程序”。网络上有很多关于网络爬虫的开源项目,其中比较有名的是Heritrix和Apache Nutch。 有时需要在网上搜集信息,如果需要搜集的是获取方法单一而人工搜集费时费力的信息,比如统计一个网站每个月发了多少篇文章、用了哪些标签,为自然语言处理项目搜集语料,或者为模式识别项目搜集图片等等,就需要爬虫程序来完成这样的任务。而且搜索引擎必不可少的组件之一也
用Python写网络爬虫
- 本书讲解了如何使用P川lOil来编写网络爬虫程序, 内容包括网络爬虫简 介, 从页面中抓取数据的三种方法, 提取缓存中的数据, 使用多个线程和进 程来进行并发抓取, 如何抓取动态页面中的内容, 与表单进行交互, 处理页 面中的验证码问题, 以及使用 Scarpy和Portia 来进行数据抓取, 并在最后使 用本书介绍的数据抓取技术对几个真实的网站进行了抓取, 旨在帮助读者活 学活用书中介绍的技术。 本书适合有一定Python 编程经验, 而且对爬虫技术感兴趣的读者阅读。(This book ex
聚合搜索
- 1:无需shell,无需蜘蛛池,无需租用二级目录,仅仅需要一个老域名 2:内置资源接口,提权,养站,排名 3:合理SEO优化构造,病毒式繁殖,组合,让蜘蛛畅快爬取收录 4:配合主动实时推送,每天可以推送400万个网页,加速收录 5:是目前最有效,最稳定,操作最简单,最省钱,排名的霸屏程序。 6:所需资源,一个老域名,你自己的关键词,一个服务器 7:本程序无需mysql,使用文件缓存,动静结合加载。 8:针对百度搜索引擎做了代码优化。 9:根目录可以直接用顶级域名养站。 10:自