搜索资源列表
Gradient(坡度)
- 这是一个基于hadoop的坡度计算算法,效率高!(This id the algorithm of gradient on map reduce, it is fast.)
CDH5.12.1搭建
- 针对大数据平台的搭建通过CDH5.12.1平台进行快速搭建(Building a large data platform for rapid construction through the CDH5.12.1 platform)
Hive
- bigdata hive use for hadoop
解决Spark数据倾斜的八种实用方法
- 什么是数据倾斜?对 Spark/Hadoop 这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。对于分布式系统而言,理想情况下,随着系统规模(节点数量)的增加,应用整
ambari安装
- ambari在开源 SQL 引擎之上进行了大量 SQL 功能 增强和性能优化,性能提升数倍甚至上百倍,并且集成多项管理工具,使其更适合在 Hadoop 上 进行大规模数据分析、检索、查询。