搜索资源列表
PageParser
- 对网页进行解析的两个源码,结构代码比较清晰,容易上手.-pages of the two-source analysis, structural code clearer and easier to get started.
minispider
- 一个小的爬行器代码,如果大家有兴趣可以上传一个比较完整的爬行器
123
- 这段代码把搜索到的记录和第一个记录互换,如果同一个记录连续被访问,那么只用做一次比较,提高了性能。但如果两个记录交互被访问,如1 2 1 2 1 2……,那么性能就会下降了。我们来看一个模拟LRU的代码:
esou
- 整合了目前比较流行的各大搜索引擎的功能,按网页、音乐、视频、游戏、下载、商业、黄页、字典等功能进行分类。重要的是针对Google和百度、sogou等搜索联盟赚钱提供了软件端口。用户下载后只需将注册的代码输入系统即可开始赚钱。 新版本还将整合网址导航站等实用功能给大家。-Integration of the more popular features in major search engines, according to web pages, music, video, games, do
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
SearchandReplace
- 比较好且小的的本地代码搜索工具 个人感觉比eclipse自带的工具好用-small and exquisite search tools
lucene-core-2.4.1
- 是世界目前开源并且比较成熟的一个搜索引擎包,里面涉及一些全文检索、建立索引、分析等核心代码-World open source and relatively mature search engine package, which involves a number of full-text search, indexing, analysis and core code
cSharp-crawler-
- C# 编写的网络爬虫,比较基础 适合初学者入门学习,含代码,可运行-Web crawler written in C#, more suitable for beginner to learn basic, containing the code, run