资源列表
heritrixDktj131_2012
- 扩展Heritrix开发包开发的面向主题的网络爬虫-The extended the Heritrix development package developed theme-oriented web crawler
heritrix.rar
- heritrix网络爬虫开源项目带源码使用!,heritrix Web crawler to use open-source project with source code!
LuceneAndNuch_Ch1-10
- Lucene+Nuch搜索源代码_Ch1-10.rar-Lucene+ Nuch search source code _Ch1-10.rar
webcollector-2.71-bin
- 网络爬虫代码,关于凤凰网和河工大的网页爬取。(Web crawler code, page crawling on phoenix net and river industry.)
Search-Engine
- 实现了搜索引擎大部分功能,而且实现的相当不错-Most of the search engines to achieve a functional
verticalIndex
- 是用Lucence做的一个搜索引擎的demo-Lucence do is a search engine demo
GoogleHackingforPenetrationTesters
- google hacker:google搜索的高级技巧-google hacker
Manning.Lucene.in.Action
- Lucene是一个开源世界瑰宝- 高度可扩展的,快速的搜索引擎。它提供的性能,是disarmingly易于使用。在行动Lucene是Lucene的权威指南。它描述了如何索引你的类型,包括你一定要知道,如MS Word,PDF格式,HTML和XML数据。它向您介绍了搜索,排序,筛选,突出搜索结果。 -Lucene is a gem in the open-source world--a highly scalable, fast search engine. It delivers perfo
heritrix-1.14.4
- heritrix-1.14.4 纯JAVA开发的,开源的Web网络爬虫-heritrix-1.14.4 pure JAVA development, open source Web crawler
08214942iobg
- lucene+nutch搜索引擎(lucene开发资料文档,各种功能实例)-lucene development information, features instances
Search_Engine
- 课程作业 包含分词 前端 后台 爬虫等 网页数据直接用文本文件存储,倒叙表用二进制文件-Coursework includes reptiles and other sub-word front-back