搜索资源列表
RUSE2
- 一个用于搜索本地文件内容的小型搜索引擎,支持词根搜索,类似于"some thing"的搜索,甚至允许单词间隔搜索,比如"some thing"~2,表示some和thing之间可以有小于两个单词的间隔,可以使用关键字and,or,not,但需要说明的是,整个程序中Tester.java是一个Facade类,本程序并没有做应用,如果要基于本程序开发出一个用户界面,可以基于Facade类进行开发,直接调用其中的静态方法就可以了,详细的说明包括设计文档可以参考压缩包中的doc/spec/的文件。-A
javaseo
- Java毕业论文:搜索引擎系统附源代码.这是一套拿去就能用的Java毕业论文资料,内含JAVA技术实现搜索引擎的源代码、技术文档、编译JAR文件,如果你想偷懒的话,拿去就能用了。尤其是文档写的很详细,源代码也比较完整,不过环境配置比较麻烦。-Java Thesis: Search engine system attached to the source code. This is a set of Naqu be able to use the Java thesis information t
SearchEngine
- 基于java技术开发的一个搜索引擎。内有详细代码及技术文档。-A java-based search engine technology development. There are more code and technical documentation.
sousuoyinqing
- java技术实现的搜索引擎,里面包含了具体的技术文档-java technology search engine, which contains detailed technical documentation
javaseo
- Java毕业论文:搜索引擎系统附源代码215810757这是一套拿去就能用的Java毕业论文资料,内含JAVA技术实现搜索引擎的源代码、技术文档、编译JAR文件,如果你想偷懒的话,拿去就能用了。-no
DocumentExtractor
- 整合了网上开源项目的资源,实现了对office 文档,pdf文档以及html文件的文本抽取,为搜索引擎的实现提供了文本资源-Integration of online resources for open source projects, realized on office documents, pdf documents and html files of text extraction, as the search engine text resources provided for th
crawler
- Spider又叫WebCrawler或者Robot,是一个沿着链接漫游Web 文档集合的程序。它一般驻留在服务器上,通过给定的一些URL,利用HTTP等标准协议读取相应文档,然后以文档中包括的所有未访问过的URL作为新的起点,继续进行漫游,直到没有满足条件的新URL为止。WebCrawler的主要功能是自动从Internet上的各Web 站点抓取Web文档并从该Web文档中提取一些信息来描述该Web文档,为搜索引擎站点的数据库服务器追加和更新数据提供原始数据,这些数据包括标题、长度、文件建立时间
MyLucene-pre
- 基于Lucene的搜索引擎,带源码,带文档说明-Lucene-based search engine,With source code, with documentation
WebPageSearch
- JAVA读取txt文档中的内容,据此计算四种搜索引擎返回文档的准确率-JAVA read the the txt document content, calculate the accuracy of the four search engines return documents
sooba
- 此系统利用Lucene实现文档的全文搜索,功能强大,包括前台后台管理,是一个不错的搜索引擎-This system uses the Lucene document text search, powerful, including the management of the foreground to background