搜索资源列表
Crawler
- 本人用c++开发的搜索引擎的网络爬虫 蜘蛛程序 欢迎参考。-I am using c++ developer' s Web crawler search engine spider welcome reference.
heritrix-1.14.4
- heritrix-1.14.4 纯JAVA开发的,开源的Web网络爬虫-heritrix-1.14.4 pure JAVA development, open source Web crawler
webcrawler
- 一个java 开发的网络爬虫,采集功能比较强大-Development of a java web crawler, collecting more powerful features
openwysiwyg_v1.4.7
- openWYSIWYG是一个跨浏览器,纯Javascr ipt开发,强大开源的WYSIWYG编辑器。支持多种Web编程语言:PHP,ASP,ASP.net,Perl,Java,Cold Fusion-openWYSIWYG is a cross-browser, pure Javascr ipt development, a powerful open-source WYSIWYG editor. Support a variety of Web programming languages: P
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
elasticsearch
- ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。-ElasticSearch is an open-source and distributed search engine which is very much scalab