搜索资源列表
no_xs04-4-22
- 搜索引擎。利用机器人编写的搜索引擎-search engine. Robots prepared by the search engine
non_zhineng-04-4-8
- 改进的机器人搜索引擎-improved search engine robot
lucene-1.4.3-src
- 最流行的开源搜索引擎lucene源代码 是学习搜索引擎不错的参考项目-most popular open source Lucene search engine source code is learning good search engine information items
点对点我的资源QQ
- 点对点文件上传下载软件,带ICQ功能,带搜索引擎功能。 成品简介:朋友就是你最丰富最忠实的资源,这套软件会帮你搜索他共享出来的资源。 功能包括:1、聊天室,透视网上邻居正在做什么;2、交朋友,跟你喜欢的网上邻居结盟做朋友;3、发送文字信息;4、查看他共享的资源:文件夹、收藏夹、朋友名单;5、互联浏览:和朋友连接浏览器,他看到的网站,你同时也看到;6、语音通话:和朋友用话筒及音箱来对话;7、网页量温:安排电脑跟踪你喜爱的网站的最新更新情况。系统优点:1、不用登录服务器和注注册;2、发
SkypeClient
- 1、支持无限级分类,无限添加网站; 2、动态生成HTML网页文件; 3、动态生成静态搜索目录,大大减轻了服务器负担; 4、对每一个登录网站进行审核管理; 5、搜索关键词具有空格分别功能,例如:“电脑 游戏”搜索引擎会找出 关于“电脑”和“游戏”的网站; 6、方便使用的网页模板,随时做出您的个性化网页; 7、动态设置网站在搜索结果、分类目录里的排名排序; 8、可以设置登录的网站出现在多个不同分类目录上,而不需要多次登录-a support unlimited c
PHPWindblog
- PHPWind大型多用户高速博客个人主页系统 PHPWind 推出大型多用户博客(BLOG), 该系统以众多个人日志(主页)为内容基础, 为网站内容管理与发布提供了更好的解决方案! (1) 以 .html 为链接模式架设整个网站, 让站点的内容大量出现在各大搜索引擎 (2) 全面支持 二级域名 比如 我的个人主页 http://yuling.phpwind.net (3) 做为一个可独立运行的系统, 同时可选择性的与论坛会员及文章数据进行完美整合! (4) 完全支持 RSS,
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
heritrix-1.14.4-src
- heritrix-1.14.4-src
heritrix-1.14.4
- heritrix-1.14.4 纯JAVA开发的,开源的Web网络爬虫-heritrix-1.14.4 pure JAVA development, open source Web crawler
linker2_0_4
- LINKER 2.0.4 多国语言版 一个免费分类搜索系统,有多国语言,多种界面,可以做的几乎和Altavista,Yahoo一模一样!-LINKER 2.0.4 multi-language version of a free classified search system, multi-language, multi-interface, can do almost Altavista, Yahoo the same!
lucene-2.4.0
- 最好的分析器代码,不过是class文件形式,可以反编译的,快快看看吧-The best parser code, but a form of class files, you can decompile and quickly take a look at it
lucene-2.4.1-src.tar
- Lucene是apache软件基金会[4] jakarta项目组的一个子项目,是一个开放源代码[5]的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 Lucene的原作者是Doug Cutting,他是一位资深全文索引/检索专家,曾经是
lucene-2.4.1-src
- lucence搜索技术的源文件。。可用于应用程序-lucence source document search technology. . Can be used in applications
crawl-0.4
- c语言实现的html爬虫,开发网页爬虫的参考资料-c language implementation of the html reptiles, developing web crawler reference! ! !
SharpICTCLAS
- ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
heritrix1.14.4
- heritrix1.14.4.zip版,欢迎下载-heritrix1.14.4.zip version, welcome to download
Solr-1.4-Enterprise-Search-Server
- 对于solr 搜索引擎, 现在为止最权威的著作.-This book is a comprehensive reference guide for nearly every feature Solr has to offer. It serves the reader right from initiation to development to deployment. It also comes with complete running examples to demonstrate its
lucidworks-solr-refguide-1.4
- solr1.4 开发指南。详细讲解使用solr进行搜索引擎开发的权威指导书。-solr reference guide
Simple-collection-of-reptiles
- 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just made a collection of URL functi
4
- FEEDER test 4 node ieee