搜索资源列表
mse
- 使用java编写元搜索引擎,大家看看。肯能有所帮助
lucene
- lucene 是java 的版的搜索引擎公共模块, 本人使用此模块, 已经开发实现了网页的抓取。
search
- 搜索引擎的研究与实现(Java)(含源码),很好的
JSPxinwen
- 基于Java的新闻搜索引擎的设计与实现内容提要:作为除电视、报纸、广播之外的第四大媒体,互联网已经成为人们获取新闻信息的主要来源。快速的从众多新闻网站中找到所需新闻,是新闻搜索引擎的基本任务。有重大事件发生时,如何使客户及时得到最新消息,也是当今新闻服务所关心的问题。对于高速列车来说,开发数字高速铁路旅客信息系统,让旅客享受移动式的全新的数字化服务是改善服务软环境的措施之一。 本文结合搜索、数据库、网络等多种技术,实现了用于高速铁路旅客信息系统的新闻搜索引擎,该引擎为高速列车提供实时新闻。
bus.rar
- 关于长春市内公交车的搜索引擎 方便适用 java实现,Changchun city bus on the search engine to facilitate the achievement of the application of java
jeecms-1.1.0-beta-src
- JEECSM是JavaEE版网站管理系统(Java Enterprise Edition Content Manage System)的简称。 基于java技术开发,继承其强大、稳定、安全、高效、跨平台等多方面的优点 采用hibernate3+struts2+spring2+freemarker主流技术架构 懂html就能建站,提供最便利、合理的使用方式 强大、灵活的标签,用户自定义显示内容和显示方式 在设计上自身预先做了搜索引擎优化,增强对搜索引擎的友好性
jeecms-2.4.2-final-src
- JEECMS是国内Java版开源网站内容管理系统(java cms、jsp cms)的简称。 · 采用hibernate3+struts2+spring2+freemarker技术架构 · 基于java技术开发,继承其强大、稳定、安全、高效、跨平台等多方面的优点,支持mysql、oracle、sqlserver等数据库 · 懂html就能建站,提供最便利、合理的使用方式 · 强大、灵活的标签,用户自定义显示内容和显示方式 · 在设计上自身预先做了搜索引擎优化,增强对搜索引擎的
RUSE2
- 一个用于搜索本地文件内容的小型搜索引擎,支持词根搜索,类似于"some thing"的搜索,甚至允许单词间隔搜索,比如"some thing"~2,表示some和thing之间可以有小于两个单词的间隔,可以使用关键字and,or,not,但需要说明的是,整个程序中Tester.java是一个Facade类,本程序并没有做应用,如果要基于本程序开发出一个用户界面,可以基于Facade类进行开发,直接调用其中的静态方法就可以了,详细的说明包括设计文档可以参考压缩包中的doc/spec/的文件。-A
crawler
- Spider又叫WebCrawler或者Robot,是一个沿着链接漫游Web 文档集合的程序。它一般驻留在服务器上,通过给定的一些URL,利用HTTP等标准协议读取相应文档,然后以文档中包括的所有未访问过的URL作为新的起点,继续进行漫游,直到没有满足条件的新URL为止。WebCrawler的主要功能是自动从Internet上的各Web 站点抓取Web文档并从该Web文档中提取一些信息来描述该Web文档,为搜索引擎站点的数据库服务器追加和更新数据提供原始数据,这些数据包括标题、长度、文件建立时间
BaiDu
- java实现的ajax搜索引擎ja va实现的ajax搜索引擎-java projects
java
- 基于java的搜索引擎的设计与实现, “网络蜘蛛”或者说“网络爬虫”,是一种能访问网站并跟踪链接的程序,通过它,可快速地画出一个网站所包含的网页地图信息。本文主要讲述如何使用Java编程来构建一个“蜘蛛”-Design and implementation of java-based search engine, " spider" or " web crawler" , is able to visit the site and follow the
java-crawler
- java爬虫 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成-java crawler
carrot2-java-api-3.12.0-SNAPSHOT
- carrot2是一款开源的聚类可视化搜索引擎,并提供了java API以供开发使用。内部包含所有用于carrot2开发的jar包和实例。-You can use Carrot2 Java API to fetch documents various sources (public search engines, Lucene, Solr), perform clustering, serialize the results to JSON or XML and many more. Below
JavaSearchEngine-java
- 搜索引擎的研究与实现(Java) 很好 很好-JavaSearchEngine used for java
Arachnid_src0[1].40
- 网络爬虫为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫。 传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。通俗的讲,也就是通过源码解析来获得想要的内容。 聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时
BinarySearch
- 通过Java实现用二分法排序并附带algs4包,他是一个很有用的例子(Through the Java implementation with dichotomy and with algs4 package, he is a very useful example)
IKAnalyzer2012_u6
- java 搜索引擎中文分词包,拆分中文词组(Java search engine Chinese word segmentation package)
Lucene+nutch搜索引擎开发
- lucene search code develop search engine