资源列表
red-piranha-4-alpha-snapshot-src
- Red-Piranha是一个开源搜索系统,它能够真正”学习”你所要查找的是什么。Red-Piranha可作为你桌面系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作为一个P2P搜索引擎,或与wiki结合作为一个知识/文档管理解决方案,或搜索你要的RSS聚合信息,或搜索你公司的系统(包括SAP,Oracle或其它任何Database/Data source),或用于管理PDF,Word和其它文档,或作为一个提供搜索信息的WebServic
paoding-analysis-2.0.4
- Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高效率和用户良好体验。-Paoding Chinese word is a Java development can be combined with Lucene applications for the word componen
Synonym-retrieval
- 这是用c语言编写的,Lucene应用WordNet的同义词典实现同义词检索的功能。-C language of Lucene application WordNet thesaurus synonym search functionality.
RRR
- 搜索引擎结构体系设计 4+1模型 开发视图,逻辑视图,部署视图,顺序视图-The search engine structure system to design 4+1 model development view, logical view, deployment view, the order of view
file-hoster-urls
- Filters out file hosters from a list of URLs (then downloadable with JDownloader)-Filters out file hosters from a list of URLs (then downloadable with JDownloader)...
Search_1
- 全文检索的实现,用lucence开 IK 分词,实现全库 全文 搜索-The realization of the full-text search
video
- 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
Nutch-beginner
- 搜索引擎Nutch的入门级教程,供初学者使用,内容比较粗浅,但很准确。-The search engine the Nutch of entry-level tutorial for beginners to use, relatively shallow, but very accurate.
dataminingcode
- c++编写的经典数据挖掘算法的程序,全部经过调试通过。-classical data mining algorithms C++ to write the program.After debugging through
04799160weblogdig
- c++写的非常好的搜索引擎代码,值得学习借鉴-c++ to write a very good search engine code, it is worth to learn from
treegridview
- 强大地爬虫功能,可自动模拟百度等大型搜索网站-Powerful reptile function, automatic simulation Baidu and other major search sites
SearchEngineFinal
- 搜索引擎基本功能实现,包括网页爬取、内容组织、倒序排序、索引建立以及关键字查询模块。-Basic functions of search engines, including web crawling, content organization, reverse sorting, indexing and keyword search module.