搜索资源列表
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
BISMFTPSearchService
- BISM "菁搜"FTP搜索引擎服务程序源码(核心源码) 此为BISM软件开发小组发布的"菁搜"FTP搜索引擎的第一个版本.有很多功能还没有完成,请大家见谅!(此软件将作为开源项目) 开发平台: C++ Builder 2007 (开源信息和相关帮助信息)http://blog.csdn.net/BismSoftware 有相关问题可以联系我们: BISM软件工作组 E-MAIL:Bismsotware@163.com 余文锋
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
google-blog-CodePub.tar
- Google “解放数据”(Data Liberation)团队今天正式发布 Google Blog Converters 1.0,该开源工具可以让你在不同博客服务之间自由转移文章和评论数据。第一个版本提供了 Python 程序库及相关可执行脚本,用于相互转换 Blogger、LiveJournal、MovableType 和 WordPress 导出的各种数据文件格式。-Google " the liberation of Data" (Data Liberation) te
searchengine
- 本程序介绍了搜索引擎的基本原理和实现过程。尽管本程序离真正的搜索引擎功能还很原始,但这些技术可移植到其它软件中,为我们服务。-This procedure describes the basic principles of search engine and implementation process. Although the program functions from the real search engine is still original, but these technolo
video
- 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc