搜索资源列表
weblucene
- Lucene Web interface, use XML as a lightweight protocol. developer can convert data source (text, DB, MS Word, PDF... etc) into xml format, indexing with lucene engine, and get full text search result via HTTP, with XML format output, user can easily
dduoftpspider--guiClient0.01
- 采用c#编写,asp.net搜索界面,管理界面计划也使用asp.net, 基于.net 2.0,使用vs2005开发, lucene作为索引数据库, 包括syn扫描模块/ftp数据采集模块/web搜索管理模块.-prepared using c #, Asp. Net search interface, the interface management plans to use Asp. Net. Based on. net 2.0, the use of vs2005 development,
lucene_book(1)
- Lucene+Heritrix搜索引擎的一个成功案例 市值30000万 只需下载,用Eclipse-import为web工程就可以了 需要安装mysql 5.5 同时由于此工程为web工程所以假如您的Eclipse没有安装tomcatPlugin的话,请也同时安装tomcatPlugin
luceneweb
- 本系统是一个基于lucene的web版文件检索系统。支持文件索引、查找。
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
UindexWeb_SVN189
- 开源的web搜索源码uindex最新版。采用lucene索引,前台使用.net开发。
lucene
- 站内搜索已是网站必不可以的功能模块之一,本源代码采用lucene开发的一个简单的站内搜索示例,共大家来一起分享相互学习。-Search is the Web site will not function modules, one of Lucene source code used to develop a simple Search example, a total of everyone to share and learn from each other.
Lucene
- 基于Lucene的Web站内信息搜索系统-Lucene-based Web site of the information search system
AnalyzerViewer_source
- Lucene.Net is a high performance Information Retrieval (IR) library, also known as a search engine library. Lucene.Net contains powerful APIs for creating full text indexes and implementing advanced and precise search technologies into your programs.
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
SearchEngine
- C#+Lucene.Net开发完成的一个自定义WEB搜索引擎,本项目实现了分词、模糊索引,加以Lucene.Net内部核心功能共同实现了搜索机制引擎-C#+ Lucene.Net developed a custom WEB search engine, the project achieved a sub-word, fuzzy indexing, Lucene.Net be the core function of the internal search mechanism to achie
Lucene.Net-2.0-002-27Nov06-src
- Lucene README file $Id: README.txt 164119 2005-04-21 20:47:18Z dnaber $ INTRODUCTION Lucene is a Java full-text search engine. Lucene is not a complete application, but rather a code library and API that can easily be used to add s
Xi.searcher
- jsp+tomcat+lucene编写,简易搜索引擎的实现,网页库可重新运行spider搜索-jsp+ tomcat+ lucene write, simple implementation of the search engine, Web database search can be re-run the spider
lucenePnutchPmapreducePsearch-engine
- 三篇关于开源搜索引擎的硕士论文 1、基于Lucene的Web搜索引擎实现 2、基于MapReduce的分布式智能搜索引擎框架研究 3、基于Nutch的垂直搜索引擎的分析与实现-Three open source search engine on the master' s thesis 1, the Web search engine based on Lucene implementation 2, based on the MapReduce framework
bbs
- Lucene+Heritrix搜索引擎的一个成功案例 市值30000万 只需下载,用Eclipse-import为web工程就可以了 需要安装mysql 5.5 同时由于此工程为web工程所以假如您的Eclipse没有安装tomcatPlugin的话,请也同时安装tomcatPlugin -Lucene+ Heritrix case of a successful search engine market capitalization of 300 million just to downl
Lucene
- 小型搜索引擎,实现网络爬虫,下载网页,建立网页索引,提供关键字搜索-Small search engine Web crawler, download page, create web pages index and keyword search
Lucene
- 用luncene实现对网页上文件的数据库的检索,达到保存,阅读等等使用的效果-Luncene retrieval database file on the web, to achieve the effect of a save, read, etc.
Csha-Lucene-Net
- C#版本网络爬虫,可以爬去web数据,web crawl desigend by csharp-web crawl desigend by csharp,web crawl desigend by csharp
apache-cxf-3.0.9
- 分词分析 软件复用是在软件开发中避免重复劳动的解决方案。Web服务实现了业务级别的软件复用,例如在B2B的集成中,各企业之间通过互相调用Web服务,实现了Web服务的共享,Web服务的使用企业不需要再重新开发其他企业中已经存在的服务。(Segmentation analysis)
WebSearch
- 包含爬虫部分、pagerank计算、Lucene构建索引三大部分。(Reptile PageRank and Lucene index construction)