资源列表
RRR
- 搜索引擎结构体系设计 4+1模型 开发视图,逻辑视图,部署视图,顺序视图-The search engine structure system to design 4+1 model development view, logical view, deployment view, the order of view
Synonym-retrieval
- 这是用c语言编写的,Lucene应用WordNet的同义词典实现同义词检索的功能。-C language of Lucene application WordNet thesaurus synonym search functionality.
paoding-analysis-2.0.4
- Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高效率和用户良好体验。-Paoding Chinese word is a Java development can be combined with Lucene applications for the word componen
red-piranha-4-alpha-snapshot-src
- Red-Piranha是一个开源搜索系统,它能够真正”学习”你所要查找的是什么。Red-Piranha可作为你桌面系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作为一个P2P搜索引擎,或与wiki结合作为一个知识/文档管理解决方案,或搜索你要的RSS聚合信息,或搜索你公司的系统(包括SAP,Oracle或其它任何Database/Data source),或用于管理PDF,Word和其它文档,或作为一个提供搜索信息的WebServic
prijauto
- 自动搜索框,完整的源码很值得一看哟~~!-Automatic search box, complete source code is worth a visit yo ~ ~!
Crawler
- 网络爬虫,能够从网页中搜索到各个链接并进行下一级的搜索,对于无用的Css,js等文件会自动筛选掉的,-Web crawler and search from a web page for each link and the next level search useless Css, js file will be automatically filtered out.
Blurum
- This is my program to increase points on the famous blurum.
Lucene.PaodingSrc.jar
- 最新的开源的中文分词paoding ,包含jar包和源码 可以给设计搜索的人一些帮助-The latest open-source Chinese the word paoding, contains the jar files and source code to the design search some help
Hyperion
- 一款开源的桌面搜索引擎源代码,技术特色包括快速搜索文件(作者称经常会少于1秒),支持音乐/文档/图片筛选过滤,文件类型筛选过滤,文件访问和文件大小筛选等-An open source desktop search engine source code, technical features include a quick search for files (that are often less than one second), support the music/document/image
apache-nutch-1.2-src
- nutch-1.2用于开发自己的搜索引擎-apache nutch 1.2
ICTCLAS50_Windows_32_C
- 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
ZhuaQu
- JAVA实现基本的页面抓取,运用多线程过滤和筛选,网络爬虫-JAVA Implementation of the basic page capture, filtering and screening of the use of multi-threaded Web crawler