资源列表
ACWPS_55824
- 中文分词系统,有兴趣的,可以下载,研究下,
cut
- 将一篇文章一句话一句话切开。便于lucene中将关键词定位到句子。
Arachnid_src0.40
- 利用JAVA实现的网络蜘蛛,具有从网络抓取网页的功能
SearchEnginePrincipleTechnologyandSystems
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。
spider
- 网络蜘蛛Spider,实现了从网络的自动获取Url并保存。
JShuandeng
- JS实现的幻灯片,用于任何程序使用,方便搜索收录
lucene+mysql+eclipe
- lucene+mysql+eclipe开发实例,实现了分页和中文分词。欢迎交流qq:276367673
API_ImageSpider
- 从www.flickr.com上面下载图像的代码,可以根据输入的关键词进行检索
MSearch.Lib
- 我自己做的聚类搜索引擎,使用了K-mean和K-NN聚类算法
download
- 支持IIS6.0,能够在在线搜索你想要的下载的东西,功能还不少!
usebaidu
- 教你如何更好的用好百度,如何做好搜索引擎优化
3126
- PKU 3126 典型的广度优先搜索 用队列实现