资源列表
Lucene
- Lucene搜索引擎学习文档-Lucene search engine to learn the document
spider
- 简单的网络爬虫例子,详细描述如何从网上扒网址的方法!-A simple web crawler example, a detailed descr iption of the Grilled URL from the Internet!
WebNewsCrawler-1.0
- 一个网络爬虫程序,用java实现的,并且可以实现新闻的抓取-A Web crawler program, with the java implementation, and news of the capture can be achieved
dos
- DOS 全部常用命令集,可以搜索查看,用起来十分方便-DOS all the common command set, you can search view, is very convenient to use them
jspider-src-0.5.0-dev
- 一个JAVA的网络爬虫源码,可以爬取包括PDF,DOC,HTML等内容,相当不错!-A JAVA source network reptiles can climb check, including PDF, DOC, HTML and other content, very good!
webharvest1-project
- Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作
sousuo
- 一款搜索引擎的源代码 功能齐全,望大家下载-A search engine s source code a full-featured, hope you download
Wiley.SEO.Search.Engine.Optimization.Bible
- SEO(Search Engine Optimization),汉译为搜索引擎优化,为近年来较为流行的网络营销方式,主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会。分为站外SEO和站内SEO两种.SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。-One of the grievous mista
lucene-2.4.1-src
- lucence搜索技术的源文件。。可用于应用程序-lucence source document search technology. . Can be used in applications
庖丁分词工具
- 一个流行的java分词程序。
lucene-2.0.0-src.tar
- 这是一个Lucene的源码下载,很不错的,这是一个Lucene的源码下载,很不错的-Lucene This is a source of the download, very good. Lucene is a source of the download, very good