资源列表
BuildHtmlDemo
- BuildHtml urlwrite 通过动态设置URL实现搜索引擎访问-BuildHtml urlwrite
yioop-v0.76
- Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps。 Yioop! Version 0.76 发布,该版本增加了获得Yioop! 之外的搜索结果的函数API,提高了RSS响应,允许包含图片。加强了在线文档,简化了arc_tool同步,修复了导致大型索引崩溃的目录输出缓冲的一个
SearchEngine
- 本文旨在运用元搜索技术,建立一个分类细致精确、数据全面深入、更新及时的面向主题的搜索引擎,成功地提高信息检索的效率。开放课程体系搜索引擎,是类似于麻省理工学院开放课程系统的课程教学资源搜索引擎。它有针对性的搜索网上课程教育相关信息,从而使学员高效检索所需的课程信息。-The purpose of this paper is to use the Meta search engine technique to create a educational subject-oriented search
9-01-2012-IR
- Search engine based on Information Extraction.
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
prologSearch
- Implementing Search in Prolog. How to represent the problem Uninformed Search depth first breadth first iterative deepening search Informed Search Hill climbing Graph Search
NetSpiderDemo
- 简单描述: 本程序是一个网络爬虫的演示程序。 程序主要涉及到:网页下载,URL解析,数据库读写。 网页下载使用Winhttp组件;数据库使用Sqlite。 使用方法: 1. 在“搜索网页”Tab页,输入关键字搜索,程序会把含关键字的网页信息,存入子目录下的Info.db。 2. 在“显示网页”Tab页,输入关键字显示,程序会把含关键字的网页信息,显示在界面上。 交流及指正,请联系QQ:270156812-This is a net
Speak
- It will help you to search different search engines at once.
SEO
- 多年搜索引擎营销的方法总结、实施细节和管理-For many years the search engine marketing methods
apache-nutch-1.4-src.tar
- 很好的一个开源搜索引擎,可以自己设计添加代码。-A good open source search engine can be designed to add your own source code
pachong2.0
- 一个网络爬虫源码Web crawlers source -Web crawlers source
how-to-use-C-toSpider
- 蜘蛛是一种半自动的程序,就象现实当中的蜘蛛在它的Web(蜘蛛网)上旅行一样,蜘蛛程序也按照类似的方式在Web链接织成的网上旅行。蜘蛛程序之所以是半自动的,是因为它总是需要一个初始链接(出发点),但此后的运行情况就要由它自己决定了,蜘蛛程序会扫描起始页面包含的链接,然后访问这些链接指向的页面,再分析和追踪那些页面包含的链接。从理论上看,最终蜘蛛程序会访问到Internet上的每一个页面,因为Internet上几乎每一个页面总是被其他或多或少的页面引用。-Spider is a semi-au