搜索资源列表
windows应用程序版的google搜索引擎源码
- 很多时候感觉用www.google.com搜索网站挺麻烦的,查阅MSDN的知识库后用C#写了这个windows应用程序版的google搜索引擎,主要调用了google开放出来的web service,不过搜索时速度还不是很快,但至少省去了右键[在新窗口中打开]的麻烦,以下是程序的源码. -often feel www.google.com search site with a very troublesome to access the knowledge base after MSDN
yider_0_5_3
- the Yider is an open source VBscr ipt spider that allows you to quickly add a search system to your site like the one at the top of this page. It stores data in a Microsoft Access or SQL 2000 database with full text searching. The Yider does not requ
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
sousuoyiqing
- 搜索引擎,用于网站内部的搜索,用于访问站内数据库。搞网站的朋友可以用到。-search engine for internal site search for database access stations. Engage site could be applied to a friend.
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
heritrix2.rar
- Heritrix是一个爬虫框架,可加如入一些可互换的组件。 它的执行是递归进行的,主要有以下几步: 1。在预定的URI中选择一个。 2。获取URI 3。分析,归档结果 4。选择已经发现的感兴趣的URI。加入预定队列。 5。标记已经处理过的URI ,Heritrix is a framework for reptiles, such as income may be a number of interchangeable components. It is a recursive implem
Robot
- 网上机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获取在Internet上的信息。机器人利用主页中的超文本链接遍历Web,通过URL引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HTML文件的验证、URL链接验证、获取更新信息、站点镜象等。 -Internet Robot (Robot) also known as Spider, Worm, or Random, the core objective is t
luceneDocument
- 这是学习Lucene的有力武器,刚刚接触搜索引擎的初学者可以参考此文档,内有示例和API文档说明-Lucene is a powerful weapon to learn, just access to search engines beginners can refer to this document, there are examples and API documentation shows
0a40a252b659
- 一款实现网络信息获取的爬虫代码,很实用,值得学习-A network of information access reptiles code, very useful
Hyperion
- 一款开源的桌面搜索引擎源代码,技术特色包括快速搜索文件(作者称经常会少于1秒),支持音乐/文档/图片筛选过滤,文件类型筛选过滤,文件访问和文件大小筛选等-An open source desktop search engine source code, technical features include a quick search for files (that are often less than one second), support the music/document/image
bolangjiaoyu
- 一款功能强大的教育门户网站源码,asp+access,很适合参考-A powerful educational portal source asp+access very suitable for reference
yuanma
- 一款功能强大的教育门户网站源码,asp+access,很适合参考-A powerful educational portal source asp+access very suitable for reference
RequestHTTP
- 一个轻量级的C++socket访问http的封装类,提供多种方便接口,页面请求,图片下载,均可方便KO-A lightweight C++socket access the http wrapper class, offers a variety of convenient interface, page requests, picture downloads, can be easily KO