资源列表
NetCrawler
- :把网络爬虫爬取的网页加以分析,去除网页中的控制命令和格式,只保留内容-: Reptile climb the network's website for analysis by removing the website of control commands and format, retaining only content
flooding
- 基于Gnutella协议的P2P网络路由搜索算法Light_Flooding的源代码-agreement based on the Gnutella P2P network routing algorithm Light_Floodi Vi source code
nutch-0.8
- nutch-0.8刚出来不久的一个很好用的搜索引擎工具 nutch-0.8刚出来不久的一个很好用的搜索引
KeyWordSCount
- 曾经有人问:在程序中输入关键字,能找出百度或谷歌中搜索的页面总数,并且统计该关键字社会关心程.这些VC源代码就实现了这些功能.代码注释详尽.
搜索引擎中主题爬虫的研究与实现
- 一个关于搜索引擎中主题爬虫的研究与实现的优秀论文
tnl______source
- tnl 非常牛的网络引擎 官方站点:http://www.opentnl.org/ 这是一个鲁棒性,安全的,易用的网络库,使用C++开发的用于仿真和游戏开发的网络库。这种网络架构对多人在线交互游戏有很好的支持。不管是做一个多人在线游戏,还是开发一个复杂的仿真系统,对网络应用程序来说都需要一个坚实的基础,TNL可以满足这一需求
search 用Lucene实现的用于搜索引擎
- 用Lucene实现的用于搜索引擎中的搜索的一般流程,可以在此基础上进一步实现更高效的搜索算法和对搜索结果的排序
Uindex.Src
- Uindex是一个开放源代码的搜索引擎,网页搜索量定位在千万量级,目前提供从蜘蛛程序、中文分词到建立全文索引的全部工具程序,FTP搜索提供基于文件名的检索,支持常见的FTP服务器。
VC搜索引擎
- 使用VC编写的简易搜索引擎-use VC summary prepared by the search engine
ANN
- ANN是一个加快搜索速度的源码程序;通过C++编写,支持在任意高维空间的近似或准确的最近邻搜索。
searchEngin
- 一个小的搜索引擎源代码,用java写的。现在很多研究搜索的都在用java写代码。
websearch
- jsp搜索引擎