搜索资源列表
weibo3.2
- WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。(WebCollector is a JAVA crawler framework (kernel) that does not need to be configured and easy to develop for two times. It prov
mywordcount
- 用于测试hadoop的mapreduce功能,功能与自带的wordcount程序大相径庭。(Use to test the mapreduce function of hadoop,this program was seem to the origin program.)
hadoopinternal
- hadoop大数据开发开源框架, 用来处理类似阿里,淘宝等日志信息的开源项目(hadoop is big database to alibaba google mayun)
绘图1
- 大数据架构图,hbase kafka solr hadoop hbase_indexer(big data hbase kafka solr hadoop hbase_indexer)
李昆
- java hadoop CarbonData,类似Parquet,是一种文件存储格式,但是数据结构更加丰富和复杂,支持列存,索引,向量化等(java hadoop CarbonData, like Parquet, is a file storage format, but the data structure is richer and more complex, supporting column storage, indexing, and quantification)
jieba-master
- 主要用于Hadoop下的大数据的开发,文本分词,聚类算法的分析(The development of big data under Hadoop, text participle, clustering algorithm analysis)
Hadoop
- Hadoop2.7.4+Spark2.1.0 完全分布式环境 搭建全过程(Hadoop2.7.4+Spark2.1.0 fully distributed environment to build the whole process)
大数据培训资料(3)(1)
- This documents will tell you how to build a Hadoop platform,The content is very detailed and the pro-test has been successful!
pivotal-hdb-220-docs.tar
- HDB是Pivotal公司出品,Greenplum on HDFS(In a class by itself, only Apache HAWQ (incubating) combines exceptional MPP-based analytics performance, robust ANSI SQL compliance, Hadoop ecosystem integration and manageability, and flexible data-store format sup
zookeeper-3.5.0-alpha.tar
- ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。 ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 ZooKeeper包含一个简单的原语集,提供Java和C的接口。 ZooKeeper代码版本中,提供了分布式独享锁、选举、队列的接
Linux下安装mysql步骤
- 详细介绍msql的环境搭建,测试等一些masql操作(Introduce the environment of Hadoop cluster in detail)
Gradient(坡度)
- 这是一个基于hadoop的坡度计算算法,效率高!(This id the algorithm of gradient on map reduce, it is fast.)
Hbase
- HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
InvertedIndex
- 基于MapReduce的InvertedIndex实现(InvertedIndex implementation based on MapReduce.)
hadoop_web
- 云存储管理系统,运用Struts2,hadoop2.6.5,redis,等开发,方便小型团队文件上传与共享。(Cloud storage management system)
wordcount
- 在hadoop平台进行大数据的wordcount.(Wordcount for big data at hadoop platform.)
zookeeper-3.4.10.tar
- 用于分布式框架 是开发的有利框架 欢迎使用(Distributed framework It's a good framework for development)
Chinese2SequenceFile
- 中文文档转成sequencefile文件格式,便于在hadoop下使用操作,java代码(Chinese doc to Sequence File)
hadoop3
- 一本很好的Hadoop教学参考书,适合初学者使用(A good Hadoop reference book for beginners)
shop
- 就会感觉很 热评话题 04_支付宝在线支付视频教程_数字签名_下载_Java知识分享网-免费Java资源下载 HTML5_Javascr ipt动画基础 PDF 下载_Java知识分享网-免费Java资源下载 深度剖析Hadoop HDFS PDF 下载_Java知识分享网-免费Java资源下载 深度探索区块链:Hyperledger技术与应用 PDF 下载_Java知识分享网-免费Java资源下载 区块链版权保护 PDF 下载_Java知识