资源列表
1_071210093029
- 一个开源的搜索引擎程序,C#编写的。里面有详细的说明文档。
search_engine_csharp
- 一个开源的搜索引擎程序,C编写的
RMM
- 搜索引擎返回结果的自动文摘研究中分词源代码-Research on Automatic Abstraction Based on Search Engine Result
bkblog_develop
- 博客 博客 博客 博客 博客 博客 博客 博客 博客
FindFilesDlg
- 基于MFC对话框的网络编程,实现对文件名与视频名的模糊匹配与检索-MFC dialog-based network programming, video on the file name and the name of fuzzy matching and retrieval
metasearch
- 搜索引擎详细介绍,原理、技术和系统,适合新手。-meta search detail introduce
Search_engine
- 这本书介绍了搜索引擎的基本工作原理,并用实际的搜索引擎为例加以生动的说明,为学习搜索引擎原理提供了很大的便利-This book introduces the basic search engine working principle and the actual search engine used to be a vivid example of that principle for the learning search engine provides a great convenienc
LxmYhfWjm_v1.0
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后面向主题和个性化的Web 信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和技术资
wspider
- lucene 搜索功能的实现机制 主要用于站内搜索-lucene
nut_source_1.0a6
- lucene + hadoop 分布式索引,希望对开发搜索引擎的同志有帮助-lucene+ hadoop distributed index, hope to develop a search engine to help comrades
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开