资源列表
MSearch.Lib
- 我自己做的聚类搜索引擎,使用了K-mean和K-NN聚类算法
API_ImageSpider
- 从www.flickr.com上面下载图像的代码,可以根据输入的关键词进行检索
lucene+mysql+eclipe
- lucene+mysql+eclipe开发实例,实现了分页和中文分词。欢迎交流qq:276367673
JShuandeng
- JS实现的幻灯片,用于任何程序使用,方便搜索收录
spider
- 网络蜘蛛Spider,实现了从网络的自动获取Url并保存。
SearchEnginePrincipleTechnologyandSystems
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。
Arachnid_src0.40
- 利用JAVA实现的网络蜘蛛,具有从网络抓取网页的功能
cut
- 将一篇文章一句话一句话切开。便于lucene中将关键词定位到句子。
ACWPS_55824
- 中文分词系统,有兴趣的,可以下载,研究下,
sadfsadfsad
- IsBadReadPtr执行内存搜索的示例代码 NtDisplayStringr执行内存搜索的示例代码 SEH执行内存搜索的示例代码
fetchgals-5.6
- A multi-threaded web spider that finds free porn thumbnail galleries by visiting a list of known TGPs (Thumbnail Gallery Posts). It optionally downloads the located pictures and movies. TGP list is included. Public domain perl scr ipt running on Linu
lucene-2.3.0
- apache的开源搜索引擎框架,可以用其中的类包轻松建立文档索引程序