资源列表
hyperestraier-1.4.13
- 一个小型的分布式的搜索引擎,速度还快,并且内置了爬虫,能够处理CJK字符集(多字节字符),是个小型站内引擎的首选,能够运行在Unix/Linux平台
box-sky-sousuo
- *天空搜索引擎,研究常用搜索引擎的应用,实现简单网站搜索!-gray sky pigeons search engines, research common search engine applications, a simple search site!
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
tianqiyubao
- 网络爬虫,是一位资深搜索工程师给我参考学习的,这个的例子是抓取ip138里面的天气预报,现在用的话,可能URL有些失效了。大家在根据网页特点来改改就可以了-is good
pacar
- 利用python爬取汽车之家评论,涉及scarpy,bs4和正则表达式的使用(Climb the review of the car on the web)
luke-src-0.7
- Lucene is an Open Source, mature and high-performance Java search engine. It is highly flexible, and scalable from hundreds to millions of documents. Luke is a handy development and diagnostic tool, which accesses already existing Lucene indexes
Project
- 一个用c写的网络爬虫程序,内含源代码,功能还算比较强大。-Multifunctional spiders.
ShootSearch
- 基于dotlucene的c#开源搜索引擎 基于dotlucene的c#开源搜索引擎
btsearch
- 用c++开发的一个简单的蓝牙搜索程序,供初学者参考学习,会很有帮助的!-C++ development with a simple search of the Bluetooth procedure reference for beginners to learn, it would be helpful to the!
jspider-0.5.0-dev
- 一个由java实现的搜索引擎代码。实现对网页内容的分析和采集功能-a realization by the search engine code. Achieving the right Web content collection and analysis functions
deep-CBIRImageRetrieval
- 该课件主要陈述了基于内容的图象检索技术的由来,主要的处理技术和未来的发展方向。另外该课件为英文课件,有兴趣的可以下来看下!
zya0907_fuwengsearch
- 一个小的搜索引擎,仿google搜索引擎开发的小程序。仅供个人学习使用-a small search engine Google search engine imitation of small procedures. Only individual learning