搜索资源列表
webinfov1.0
- 基于Web的搜索引擎系统-Web-based search engine system
ltdemo
- 一个基于WEB搜索的客户端源API程序,请大家下载试用!-a Web-based search client API source procedures, please download trial!
基于Web链接挖掘和内容相关性分析的智能检索
- 一个基于Web 链接挖掘和内容相关性分析的智能信息检索系统-links to a Web-based mining and content analysis of the Intelligent Information Retrieval System
googlsearthdemo
- 使用Google Web APIs service 进行搜索的示例代码,数据交换基于SOAP与WSDL标准。-use Google Web APIs service for searching the sample code, data exchange, based on the SOAP and WSDL standards.
Deepthroat-php-2-3
- 深喉咙(Deepthroat) 可同时生成企业网站的前台和后台,并实现前后台同步管理。 基于PHP技术开发,系统构架安全合理,独特的缓存处理机制,使生成网站的浏览速度极快,结合Web设计简单理念,使生成的后台管理界面直观操作简单,支持插件模块、支持模版皮肤,使系统具有良好的扩充性,升级方便。 Deepthroat v2.2 (2006.10.13) 更新功能如下: · 增强SEO(搜索引擎优化) · 支持插件模块 · 支持模版皮肤 · 自定频
luceneweb
- 本系统是一个基于lucene的web版文件检索系统。支持文件索引、查找。
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
NLuke0.12
- 这是一个基于网络的,扩展了lunce的一个搜索分词工具-This is a web-based, expanded lunce participle of a search tool
Lucene
- 基于Lucene的Web站内信息搜索系统-Lucene-based Web site of the information search system
Design
- 软件名称:基于主题的Web爬行器 运行环境:Windows 2000/XP/2003 实现环境:Eclipse 编程语言:Java 功能:实现主题网页的抓取 -Software name: theme-based Web crawler operating environment: Windows 2000/XP/2003 achieve environmental: Eclipse programming language: Java features: realizati
lucenePnutchPmapreducePsearch-engine
- 三篇关于开源搜索引擎的硕士论文 1、基于Lucene的Web搜索引擎实现 2、基于MapReduce的分布式智能搜索引擎框架研究 3、基于Nutch的垂直搜索引擎的分析与实现-Three open source search engine on the master' s thesis 1, the Web search engine based on Lucene implementation 2, based on the MapReduce framework
multi-threaded
- 基于Java的多线程网络爬虫设计与实现,应用的是JAVA技术,制作网络爬虫-Java-based multi-threaded Web crawler design and implementation, the application is JAVA technology, production of web crawlers
01
- 本文在本课题 组开发基于内容图像搜索引擎系统V1.0研究基础上,引入多线程技术,提出多线程Web 图像搜索器的磁盘I/O缓冲方法。在深入分析和比较几种常见的搜索策略基础上,探索 出适合于多线程Web图像搜索器的新搜索策略。最后开发了多线程Web图像搜索器子 系统,完成与图像检索子系统的融合,构建出基于内容的图像搜索引擎系统V2.0。 -Using content-based image retrieval technology on internet for searchin
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
wtxx
- 一个课程设计,用于将下载的网页,去除无用信息,基于本地的lucene搜索引擎,可以输入关键字,然后查找那些文件包含这个keyword-A course design, used for download web pages, remove useless information, based on local lucene search engine, can enter keyword and then find those that file contains the keyword
ir
- 基于网页的倒排文件建立及查找 附源码及报告说明-Find attached source code and report illustrates web-based inverted file
spiderframework-19717
- 一个基于C#的爬虫框架,可以爬取任意网页内容,适合初学者。-a web spider based on C#
WebScarab
- 基于python的web爬虫框架,适合新手学习。Scrapy-a web spider framework
elasticsearch
- ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。-ElasticSearch is an open-source and distributed search engine which is very much scalab
RARBG_TORRENT
- 基于Python的Beautifulsoup4框架的爬虫,主要爬取出种子文件下载地址,由简单的GUI界面显示。(Based on Beautifulsoup4 frame in Python, the web crawler can grab RARBG torrent download address and displayed by simple GUI.)