资源列表
Search_Engine--Principle_Technology_and_Systems.zi
- 书名:<<搜索引擎--原理、技术与系统>>
webharvest1-project
- Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作
ajaxluceneCDROM
- 征服AJAX.LUCENE构建搜索引擎随书光盘
apache-tika-0.1-incubating-src.tar
- apache基金项目tika,是一个可以对内容进行分析、提取的开发包,结合正则开发包,可以开发基于垂直搜索引擎,目前正处于孵化阶段,这里是目前的最新版本
luceneheritrixCDROM
- 开发自己的搜索引擎——Lucene 2.0+Heriterx随书光盘源码
seeknove103
- Seeknove 1.0.2是一个用PHP开发的开源搜索引擎整合系统,可根据关键字获取多个搜索引擎的搜索结果。Seeknove有两种搜索模式:分类模式、引擎模式。分类模式是按照功能分类索引的搜索模式,目前的分类有:网页、图片、新闻、音乐、视频、博客、论坛、地图、词典、资源。引擎模式是按照搜索引擎索引的搜索模式,整合的搜索引擎有:Google、百度、Yahoo、搜狗、有道、中搜、Live、搜搜、爱问、奇虎。
j_12026_els
- 可搜索在线电影,BT电影下载,BT软件下载搜索等
FileParse
- baidu硬盘搜索插件开发程序 百度硬盘搜索插件程序
data
- 在网上搜索的,可以做论文等设计的具体的数据。应该挺有用的
mov
- 1、改善网页界面,加速网页读取熟读 2、增加了几款模版样式。 3、增加了明星专辑搜索。 4、增加了电影页面评论功能。(评论系统请仔细看说明) 5、增加后台首页公告功能。 6、修改友情链接跟统计代码的生成方法,增加了图片友情链接功能 7、修正V2.X所有的错误。
fenci
- 海量分词结合lucene的分词部分源代码,不包含海量分词dll,请下载的朋友注意,希望能对大家有帮助。
Googl
- 一篇介绍google搜索引擎的文章.希望对大家有用