搜索资源列表
lucene-1.4.3
- java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)
EasyXSpider
- EasyXSpider不仅仅是一个简单的Linux下的爬虫程序。更包括了,索引制作,检索,分词(英文及中文二元法切词),以及Google PageRank算法和CGI查询界面的实现。可以看做是一个完整的小型搜索引擎。
支持向量机java实现
- 文本自动分类的java实现
qishixunyou.rar
- 骑士巡游算法(可以向八个方向移动,搜索所有可行路径. 用二维链表存储结果),Cavalier Parade algorithm (moving to eight, search all possible paths. With two-dimensional chain store results)
mahout-0.3
- mahout是一个开源的软件包,对搜索引擎的聚类,分类算法以及推荐系统算法的代码实现-mahout is an open source software package, the search engine clustering, classification and recommendation system algorithm algorithms code
Auto_WordSeg
- 自动分词程序演示。包括最大、最小,正向、逆向等分词算法。-Automatic word segmentation procedure demonstrates. Including the largest, smallest, positive, reverse algorithm.
Page98PageRank
- google PageRank算法详解,Google两位创始人在美国申请了PageRank的专利,这是他们对PageRank算法所发表的论文-Google PageRank Algorithm,PageRank Pattern
cn2
- 关于数据挖掘中分类算法的顺序覆盖算法的经典论文-A good paper for sequential algorithm in classification of dataming
EasyXSpider
- 一个Linux下的爬虫,倒排序索引,多条件检索,二元切词以及Google PageRank算法的示例程序。包括CGI的查询界面。Cool!~-Linux under a reptile, invert index, multi-condition searches, Chinese binary segmentation, as well as an example of Google PageRank algorithm procedures. Including the CGI query
larbin_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system. www.av.com robot similar to the rapid indexing tool for Internet web pages cable guidelines generation
larbn_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 > 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 > 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system, similar to the robot www.av.com indexing tools
LuceneDesktop_1.0
- lucene的检索算法属于索引检索,即用空间来换取时间,对需要检索的文件、字符流进行全文索引,在检索的时候对索引进行快速的检索,得到检索位置,这个位置记录检索词出现的文件路径或者某个关键词。 -Lucene search algorithm belonging to Index Search, which uses space in exchange for time on the need to retrieve a document, character stream full-text
DetectingNear-DuplicatesforWebCrawling
- 介绍网页去重的算法。是一片经典的国外英文论文。-Introduced to re-page algorithm. Is a classic English papers abroad.
rb-tree
- 实现了rb-tree的演示和搜索,可以用于日常算法的学习之用-Rb-tree to achieve a demonstration and a search algorithm can be used for day-to-day learning
chinesechess
- 在网上发现的好东东。完全包,在vc6.0中直接编译通过。 采用了一下搜索算法 1.CEveluation类:估值类,对给定的棋盘进行估值. 2.CMoveGenerator类:走法产生器,对给定的棋盘局面搜索出所有可能的走法. 3.CSearchEngine类:搜索引擎基类. 4.CNegaMaxEngine类:负极大值法搜索引擎. 5.CAlphaBetaEngine类:采用了Alpha-Beta剪枝技术的搜索引擎. 6.CFAlphaBet
include
- 用VISUAL C++编写的中文分词系统中的INCULDE算法-Using VISUAL C++ Prepared Chinese word segmentation system INCULDE algorithm
utils
- 用VISUAL C++编写的中文分词系统 UTILS算法-Using VISUAL C++ Prepared Chinese word segmentation system Utils algorithm
risearch
- RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数据库来存储你网站所有页面的关键词以便快速搜索。Risearch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的关键词。 RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。
spsearch
- java的搜索引擎,基于LUCENE算法。大家来观摩一下-java search engine, based on the Lucene algorithm. Everyone to watch what
new_sqp
- 通过对经典的lemke互补转轴算法求解含有等式约束的凸二次规划问题的分析,发现所得到的线性互补问题(lcp)可能是退化的.由lemke算法求解(lcp)问题的迭代过程,通过六个命题说明了含有等式约束的凸二次规划问题对应的(lcp)问题退化的原因,并对经典的lemke算法的迭代过程进行修正,提出了一种改进的lemke算法,这种算法能有效地搜索到含等式约束凸二次规划问题的最优解.-Through the classic Lemke complementarity algorithm shaft co