搜索资源列表
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
PersonalSerachEngineer
- 就当前搜索引擎存在滞后性、缺乏个性化的问题给出了一种实时的、个性化的搜索引擎 的Personal IntelligentSearchEngine (PISE)爬虫算法。PISE可以实时地返回给用户查询结果,爬行虫根据用户输入的关键字直接到网上搜寻与之相关的信息,保证将最新结果返回给用户。爬虫算法通过一定的初始策略,运用使爬虫的搜索精益求精的思想,达到与用户的需求逐步接近的目的,从而实现搜索的智能化。实验证明PISE能够实现这一功能。
CsuSite
- 中国软件联盟全站的源程序代码,该网站用此代码两个月内PR值就达到了 4 。源代码中包含软件下载搜索引擎、行业软件搜索引擎、源代码搜索引擎、BT资源搜索引擎、编程资源搜索引擎、软件公司搜索引擎等。只要上载到你的空间马上就可以使用。演示地址: http://www.chinasoftwareunion.com-China Software Alliance, the station of the source code, the site using this code within two mon
ss
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-asp
example
- 回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择。这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称为“回溯点”。回溯算法是所有搜索算法中最为基本的一种算法,其采用了一种“走不通就掉头”思想作为其控制结构 -Backtracking is a search optimization method, based on forward selection search terms in order to ac
CutwordShort
- 用于搜索引擎上的切词程序,可以获得比较好的分词结果。运行速度可以达到约500k词/s(笔记本上)-For the search engine on the segmentation procedure can be the result of a better word. Running speed of about 800k words/s (notebook)
sphinx-0.9.8-rc2-chinese
- 搜索引擎,和MYSQL结和搜索网站的内容,速度极快,可以达到0.00XX秒.-Search engine, and MYSQL node and search site, extremely fast, can be achieved 0.00XX seconds.
Compass
- Compass 入门指南 Compass 通过OSEM(Object/Search Engine Mapping)允许把应用对象的领域模型映射到搜索引擎,最终通过访问common meta data来达到访问对象的目的-Compass Getting Started Guide
bamboo.v.1
- 该程序从网页的特征出发,利用简单的规则方法,却能够达到较好的效果。-The characteristics of the program starting from a web page, using simple rules of method, they can achieve better results.
WANNENGSOUSHOU
- 万能超级搜索引擎V8.0(赚钱版)绝对是目前全国功能最优秀的超级搜索引擎,可跟任何同类程序比较。 经数据统计,全国已超过20000个网站和超过3000家网吧正在使用本程序 而且有部分网站和网吧的站长已经达到日收入过千了 google已经成为全球最大的网站,百度已成为中国最大的网站,两者都是搜索引擎,已经证明搜索引擎已经成为每位网民日常必须的网站了,但因为百度和google已经垄断了全球大部分用户了,就算您有财力去做一个和百度一样的搜索引擎出来,也没有办法从百度手上抢到用户,要从百度手
doctrine-doctrine-website-sphinx
- doctrine与sphinx可以完美结合,达到重量级搜索效果。-doctrine and sphinx
RMM
- 这个是RMM算法,支持正向、逆向最大匹配,是自然语言处理的重要算法之一,只要替代程序中的词库即可。本词库取自1988年人民日报语料材料,算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th
findleft
- 这个是概率统计最大算法,此算法是分词算法的一种,是自然语言处理中最有效的分词算法之一,本算法精确度达到95 以上-This is the probability statistics algorithm, this algorithm is a sub-word segmentation algorithm is the most effective natural language processing word segmentation algorithm, the algorithm an
ulinks_2.20110305
- PHP自动链,通过读取http_referer变量获得你的网址,然后读取你的网页标题和其他信息,来达到友情连接交换的效果。搜索引擎会根据本站的链接加快收录或者更新您的网站。 PHP自动链 2.20110305 更新内容: 修正因目标站变化产生的查询错误 更新以下2个文件,覆盖既可。 /www/checkServer.php -php automatic chain v 2.20110305
elasticsearch
- ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。-ElasticSearch is an open-source and distributed search engine which is very much scalab