资源列表
jspider-0.5.0-dev
- 一个由java实现的搜索引擎代码。实现对网页内容的分析和采集功能-a realization by the search engine code. Achieving the right Web content collection and analysis functions
lucene-1.4.3-src
- 最流行的开源搜索引擎lucene源代码 是学习搜索引擎不错的参考项目-most popular open source Lucene search engine source code is learning good search engine information items
中文搜索引擎技术揭密:系统架构
- 中文搜索引擎技术揭密,简单介绍了搜索的相关知识和原理。-Chinese search engine technology to conduct a brief introduction to a search of relevant knowledge and principle.
jspcode(5files)
- 主要是JSP的代码 做网站时用得到 压缩包的内容:1.Jsp分页显示 2.jsp源码实例 搜索引擎 3.javajsp中 中文问题详解-开发技巧 4.JSP实现论坛树型结构的具体算法-开发实例 5.JSP调用JavaBean在网页上动态生成柱状图 共五个Java源码 txt格式 都有源代码和注释 无密码-JSP is mainly done for the code used to be compressed contents : 1.Jsp paging
WebSearch(.NET)
- 迅龙中文Web搜索引擎(.NET) 下载完整版 代码 http://gforge.osdn.net.cn/projects/xunlong/ LGPL协议发行 作者: 宁夏大学 张冬 zd4004@163.com 欢迎技术交流 http://blog.163.com/zd4004/ 2007.2.26-Long Xun Chinese Web search engine (.NET) code download a
lucene_book(1)
- Lucene+Heritrix搜索引擎的一个成功案例 市值30000万 只需下载,用Eclipse-import为web工程就可以了 需要安装mysql 5.5 同时由于此工程为web工程所以假如您的Eclipse没有安装tomcatPlugin的话,请也同时安装tomcatPlugin
neucsp
- 很好的分词工具,能对文本进行分词,标注词性,是进行文本聚类不可或缺的工具
luceneheritrixCDROM
- 开发自己的搜索引擎——Lucene 2.0+Heriterx随书光盘源码
WebCrawlers
- 搜索是网络技术的热门课题,网络爬虫是搜索技术的基础,用VC++编写的网络爬虫可以很好的学习这门课题,适合初学者
WebNewsCrawler-1.0
- 垂直搜索的网络爬虫,收集新闻信息的爬虫,采用java编写,附带源代码
网格搜索引擎技术研究
- 网格搜索引擎技术研究:一篇论文。网格搜索引擎对于当前热门的网格技术(grid)来说是一个空缺,值得研究。-grid search engine technology : a thesis. Grid search engine for the current hot Grid (grid) is a vacancy, it is worth studying.
EasyXSpider
- EasyXSpider不仅仅是一个简单的Linux下的爬虫程序。更包括了,索引制作,检索,分词(英文及中文二元法切词),以及Google PageRank算法和CGI查询界面的实现。可以看做是一个完整的小型搜索引擎。