资源列表
Lucene_in_Action_2nd_Edition
- lucene in action的第二版,比较新,是英文原版的,对学习lucene的初学者很有帮助。-lucene in action in the second edition, is relatively new, the English version, useful for beginners learning lucene.
1
- 基于Lucene和Heritnx构建搜索引擎的研究和示例实现
GB9706_1_2007
- 这是 GB 9706.1-2007 医用电气设备第1部分 安全通用要求(报批稿),能进行搜索查找的,非常方便-GB 9706.1
ModernInformationRetrieval
- Google写的,信息检索方面的文章非常好-verygood,perfect,and you love it
K-Means
- 一个很好的C均值聚类算法!通过运行此文件可以很好的进行数据的分类。-K-means
hibase-0.1.0.tar
- 一个使用的搜索引擎例子,可以在linux下运行-One example of the use of search engine, you can run linux
KARP_RAB
- karp rabbin searching algorithm
spider
- 网络爬虫,能实现基于关键词的抓取,是网络收索的好助手-spider
mifluz-0.24.0.tar
- mifluz 的目的是提供一个存储倒排索引c++库,允许存放关键词以便事后进行搜索。-The purpose of mifluz is to provide a C++ library to store a full text inverted index. To put it briefly, it allows storage of occurrences of words in such a way that they can later be searched. The basic id
interleaver
- interleaver research
Hadoop
- 基于Hadoop集群的分布式日志分析系统研究-Distributed Hadoop clusters based on log analysis system
Nutch
- 一种新型的基于Nutch的搜索引擎技术,时下热门研究方向-A new search engine based on Nutch technology research nowadays popular