资源列表
sprit21121
- 原名《搜索引擎蜘蛛算法与蜘蛛程序构架》有关蜘蛛程序的设计
word(120000)
- 通用词库,含有12万条常用词汇。是开发搜索引擎,和相干开发的必备工作 。
C-arithmetic
- 常用的算法实现,可以再重温,加深一下,说明:从网上搜索得到
migong
- 迷宫求解,用栈来实现,深度搜索,自动生成迷宫。
google
- google引擎源码 网络上抓下来的 参考
google
- Google Search Api轻松打造自己的Search Engine,C语言XML解析器
BaiduMusicBox
- 本程序将完成搜索baidu,的结果进行处理,,来完成音乐的搜索与播放的功能
zhengquan
- 这个网站系统出了股票网址外包括一个生成静态的小型新闻系统 股票网址已经收录了国内大部分知名的财经证券类网站,非常齐全。 另外本人补充了纳斯达克,道琼斯指数在线查询页面 非常实用。 生成静态的小型新闻系统能够有效提高搜索引擎的抓取率。 另外有非常实用的广告管理功能 很不错。
HowtouseOpenLayers
- 介绍了如何使用OpenLayers的方法
search_engine
- 搜索引擎 控件内置多线程下载. 内置html完全解释.(解释了90%左右html脚本, 容错控制采用仿ie的技术) 内置javascrip有限解释.(解释了基本循环, 字符操作运算和整型运算) 内置正文分析的分解.(只仅中文简体) 后三项可以关掉, 采用第三方技术.
PersonalSerachEngineer
- 就当前搜索引擎存在滞后性、缺乏个性化的问题给出了一种实时的、个性化的搜索引擎 的Personal IntelligentSearchEngine (PISE)爬虫算法。PISE可以实时地返回给用户查询结果,爬行虫根据用户输入的关键字直接到网上搜寻与之相关的信息,保证将最新结果返回给用户。爬虫算法通过一定的初始策略,运用使爬虫的搜索精益求精的思想,达到与用户的需求逐步接近的目的,从而实现搜索的智能化。实验证明PISE能够实现这一功能。
heritrix-1.14.0-src
- 知名网络蜘蛛源码,可以下载整站内容,扩展性强,可以下载动态网页