资源列表
lucence
- luncen制作搜索引擎学习光盘代码
802.16jModule
- Recently, IEEE 802.16j multi-hop relay network is proposed to increase data rate and coverage of the IEEE 802.16e networks. The Relay Station (RS) is introduced to relay the data from MR-BS to SS/MS or from SS/MS to MR-RS. We have studied the researc
a
- 关于网络爬虫的论文集,涉及到搜取网页和网页解析技术的一些重要课题。对算法和搜索引擎的理解有一定的帮助
Mysoov1
- jsp站内搜索引擎,可以实现在站内进行关键词的搜索功能。
sousuo_yinqin
- 搜索引擎 毕业论文:本文阐述了搜索引擎的基本原理,着重分析了中文分词的设计与实现
autodownloadLRC
- 自动搜索以及下载的源代码,(通过连接minilyrics.com歌词服务器查询) 用于搜索歌曲对应的歌词文件,并下载LRC歌词文件
heritrix-1.14.0-src
- 知名网络蜘蛛源码,可以下载整站内容,扩展性强,可以下载动态网页
SearchEngine
- 1.这是一个简单的采用了Lucene的搜索引擎,本例子采用lucene+struts+ibatis的框架进行开发,使用的数据库是Oracle,搜索源是jpetstore的product表,大家在使用的时候请根据实际情况修改database.properties文件的配置。 2.本例子支持中文搜索,相关的源码包在cnSolution目录。
ICTCLAS_aoyun_windows_c_32
- 中科院分词系统CTCLAS_aoyun_windows_c_32
网络爬虫
- 本人自己用VC++开发的网络爬虫程序,可以实现整个网站的抓取,网页中所有的URL重新生成.-I own VC++ development with the network of reptiles procedures, can crawl the entire site, the page URL to re-generate all.
java爬虫小程序
- 一个爬虫小程序
C++ 实现的网络爬虫
- 这个是一个C++实现的搜索引擎,功能齐全。是学习写搜索引擎很好的例子。