资源列表
分词模块
- 一个非常有用的分词模块,对研究搜索引擎的人有参考价值-a very useful segmentation module, the study of search engines reference value
openwebspider-0.5
- 开源的Web蜘蛛程序,可以多线程现在Web页面-open-source Web spiders procedures can now multithreaded Web pages
LuceneInAction_SourceCode
- lucene是用在搜索引擎的开源工具,可以对所抓爬到的网页进行索引写入,对做好的索引可以进行快速的搜索。-Lucene is used in the open-source search engine tool, which can grasp onto to the website indexing write, the index can do rapid searches.
xapian-core-0.9.2.tar
- 开放源码的搜索引擎(Xapian open source search engine)-open source search engine (Xapian open source search engi ne)
lzsearch
- 用javascrip编写的分词系统 可以解决现在许多网站中文搜索支持不好的问题 无解压密码 -javascrip prepared with the sub-term system can solve many Web sites now support Chinese search the problems without extracting passwords
Nalanda-iVia-Crawler-1.0.1.tar
- 主题爬行源码.很经典的.对研究主题爬行的人很有帮助.-theme crawling source. Very classic. The themes were very helpful crawling.
百度分词词库
- 据说是百度以前用的中文分词词典,希望对大家有一点帮助哈,快下快下-allegedly Baidu before the Chinese word dictionaries, we hope to have a bit of help to Kazakhstan, where fast under fast!
google探索算法源码
- 据说是GOOGLE搜索引擎的排序算法,看了一下,不太懂,晕啊-allegedly Google search engine ranking algorithm, looked at them, not really understand, halo ah!
木棉搜索引擎
- 我正做搜索引擎方面的项目哈,在网上找到的一个比较完整的专业(主题)搜索引擎的设计与实现,值得一看-I was doing the search engine project Kazakhstan, on the Internet to find a more complete professional (theme) search engine design and implementation of an eye-catcher!
小叮咚分词模块
- 小叮呼的分词模块 小叮呼的分词模块-small bite called the Word module called the small bite-term m odule
lucene-1.4.3-src
- 最流行的开源搜索引擎lucene源代码 是学习搜索引擎不错的参考项目-most popular open source Lucene search engine source code is learning good search engine information items
soo_search
- soo search是一个服务的接口,目标为简化搜索引擎的定制规则,加速全文索引的快速高效的开发。通过javaBean技术,把资源对象化,以建立方便的资源管理机制。soosoo search把资源的输入和输出通过一个值对象(bean)和用户进行交互,这样soosoo search可以快速的和现有的j2ee开源框架进行集成。soosoo search提供了两个接口,一个是索引器接口,一个是检索器接口。而这里两个接口的实现都是通过公共的数据模板进行资源的格式化。利用用户定制的javaBean对象,把