搜索资源列表
theory_of_search_engine
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建 方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索 引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及 其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类 等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的 实验数据,具有学习和实用双重意义。
SearchEngineer
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。
SearchEnginePrincipleTechnologyandSystems
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。
1111
- 主题蜘蛛的设计与实现 摘要: 针对多媒体资源在网上的分布特点,采用链接类型过滤、网页内容过滤、链接内容过滤三层过滤和临时页面存储、目标页面存储、中间链接存储、更新存储四层存储机制,设计并实现了一个对包含多媒体资源(音频、视频和Flash 动画) 的网页进行搜集的主题蜘蛛. 实验结果显示,该主题蜘蛛能有效提高查准率.
IndexFiles
- 基于Lucene的网页生成工具,对于有网页爬行器从网络上下载下来的网页库,本软件可以对他们进行网页索引生成,生成网页索引是搜索引擎设计中核心的部分之一。也称网页预处理子系统。本程序用的是基于lucene而设计的。
COM2008-v50
- 一套现成的分类信息网站发布系统,拥有完善的数据分类和简洁的网页设计,适合于做城市门户网站、报社分类广告网站、行业分类信息网站;最新的5.0版本加入了社区化网站经营理念和成功的信息置顶赢利模式,更强的网站交互式功能、会员VIP功能、网站后台管理功能使COM2008分类信息系统实现质的飞跃;网站内容由信息发布者和网站浏览者共建、赢利点也由发布的信息产生,是一套带有成功赢利模式的优秀的Web2.0网站全站系统。 COM2008分类信息系统5.0商业版较上一个版本增加了以下功能:信息置顶功能、
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
03
- 本文首先介绍了图像搜索引擎系统的总体设计,分别介绍了数据下载模块、 预处理模块、图像分类模块、图像检索模块。在分析Spider系统的总体架构、运 行流程和重要组件的基础上,实现了普通爬虫和精确爬虫,分别针对不同的网页 进行数据下载。-This thesis describes the overall design of the image search engine firstly and describes the data download module、preprocess
LxmYhfWjm_v1.0
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web 信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和技术资
c20071217233337
- 优化大全seo资料,搜索引擎优化全书,非常棒的学习资料,对网页设计人员,网站推广人员非常有帮助-youhua seo
larbin-2.6.3
- larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。 latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可以看到,一个简单的larbin的爬虫可以每天获取500万的网
wtxx
- 一个课程设计,用于将下载的网页,去除无用信息,基于本地的lucene搜索引擎,可以输入关键字,然后查找那些文件包含这个keyword-A course design, used for download web pages, remove useless information, based on local lucene search engine, can enter keyword and then find those that file contains the keyword
sharhoo_php
- 此网页首页设计大气,并且搜索结果十分丰富精确 源码完整 完全开源 可以调节搜索结果 上传可用 无需任何改动 如果想把此源码的底部链接改动 也可以 共分两个版 asp版和php版 此版为PHP版 -Complete this page Home design atmosphere, and the search results are very rich and accurate source fully open source can be adjusted search results upl
Demo
- 如果我们想要设计一个网页,需要有按钮的功能,该程序提供按钮功能。希望采纳。-If we want to design a web page, you need to have a function button, the program provides button function. We hope to adopt.
搜索引擎——原理技术与系统
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共 13 章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的 Web 信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。(This book introduces the work principle, the realizat