资源列表
CsSpider
- C#编写的网络爬虫程序,对于编写网络爬虫程序有一定的帮助。-Web crawler written in C# program, procedures for the preparation of web crawler will help.
SearchTechnology
- 互联网搜索技术 检索与排序PPT 索引技术 排序 性能评测-Internet search technology, search and sort to sort PPT Indexing performance evaluation
larbin-2.6.3
- larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。 latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可以看到,一个简单的larbin的爬虫可以每天获取500万的网
fenci
- 一个简单的基于词典分词的程序,lucene的分词程序不少,但有时候并不需要复杂的功能,只是需要简单的根据指定的词典分词。代码简单,可以作为学习参考-A simple dictionary-based word process, lucene procedures for sub-word a lot, but sometimes does not require complex functions, but only require a simple dictionary word accord
crawl-0.4
- c语言实现的html爬虫,开发网页爬虫的参考资料-c language implementation of the html reptiles, developing web crawler reference! ! !
SEOSearch
- SEO搜索引擎,有不同版本的算法,内附文档-SEO search engine, there are different versions of the algorithm, enclosing a document
SphinxV0.9.8.1source
- SphinxV0.9.8.1source.zip VC++ 基于Lucene扩展的支持中文分词的开源搜索引擎 中文用户-Sphinx V0.9.8.1 source.zip VC++ extensions to support Lucene-based Chinese word segmentation in Chinese open source search engine users
lucene-3.0.0-src
- lucene-3.0.0-src.zip 纯java开源搜索引擎的源代码 初学者好好揣摩 apache家族的一个子项目 提供一个索引和搜索的框架,支持二次开发 Lucene的最新版本-lucene-3.0.0-src.zip pure java open source search engines try to figure out the source code for beginners a good family, an apache sub-project to provide a fr
SerachIP
- 一款简易的IP搜索工具,功能齐全哦-A simple IP search tool, a full-featured Oh! ! ! !
SearchEng
- Image Search Ingine, To search a image from database and process all operation like delete,update select etc
lyhmt
- 地方搜索站 这个很齐全,无错误,欢迎大家使用!-difang sousuo zhan zhge henbucuo huany dajia shiyong
MSNIMRobot
- MSN机器人IMRobot 很值得研究的