搜索资源列表
lucene-1.3-final-src.zip
- 用java写的全文索引引擎
lucene.net-1.4.3.final-004-21Nov05.src
- Lucene是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能-Lucene is an open source search engine. it can be easy to join the Java software by the search function
lucene-1.4-final-src
- 搜索引擎的辕马 大家可以使用他 谢谢 欢迎大家的使用
freesearchbbs101
- 全文检索者站内搜索引擎论坛免费版1.0正式版for leadbbs314,dvbbs7 sp2 access数据库-were retrieved by the search engine stations Forum free version of the final version 1.0 for leadbbs314, dvbbs7 sp2 database access
Lucene+Nutch
- 该书首先描述了开发平台的配置, 接着详细介绍LUCENE和NUTCH开发。-The book first describes the development platform configuration, and then details the development of Lucene and NUTCH.
somao_v8.0
- PHPSou V3.0(20130322) 为UTF-8编码的测试版本,功能还不完善,不过在后台已经可以实现网址的抓取,目前后台已经抓取了超过80万的顶级网址,接近10万的网页可供搜索。 值得注意的是,本版本为整合sphinx版本,需要安装sphinx才能正常使用,需要研究本版本的网友可以登录官方论坛:http://www.phpsou.net 了解新版的安装方法。 PHPSou V3.0(20130322)为最终的PHPSou开发框架,后续版本将会在本版本的基础上进行升级,
用Python写网络爬虫
- 本书讲解了如何使用P川lOil来编写网络爬虫程序, 内容包括网络爬虫简 介, 从页面中抓取数据的三种方法, 提取缓存中的数据, 使用多个线程和进 程来进行并发抓取, 如何抓取动态页面中的内容, 与表单进行交互, 处理页 面中的验证码问题, 以及使用 Scarpy和Portia 来进行数据抓取, 并在最后使 用本书介绍的数据抓取技术对几个真实的网站进行了抓取, 旨在帮助读者活 学活用书中介绍的技术。 本书适合有一定Python 编程经验, 而且对爬虫技术感兴趣的读者阅读。(This book ex