搜索资源列表
nest-master
- 基于hadoop的etl工具,实现比hive更通用的sql解析引擎(Hadoop based ETL tools to achieve a more common SQL parsing engine than hive)
1-cloudDay04
- 用zookeeper实现Hadoop平台中的多台服务器的可靠性保证(Using zookeeper to implement the reliability assurance of multiple servers in the Hadoop platform.)
CDH5.12.1搭建
- 针对大数据平台的搭建通过CDH5.12.1平台进行快速搭建(Building a large data platform for rapid construction through the CDH5.12.1 platform)
Linux
- 1.学习并理解如何使用 Hadoop,学会在 Hadoop 中运行简单的程序,了解其运 行过程。 2.通过学习生产者/消费者问题理解多线程同步问题。 1.在 Linux 环境下建立大数据处理框架 (1)学习 Hadoop 的相关知识。 (2)安装并配置 Hadoop 环境。 (3)在 Hadoop 上执行 WordCount 示例。 2. 实现生产者/消费者同步问题 (1)在 linux 系统中学习信号量的使用。 (2)执行生产者与消费者模型。(1. learn and und
Hive
- bigdata hive use for hadoop
wordcount
- 入门的简单MR小程序,可以简单理解MR程序的流程(A simple MR small program to get started)
Tiny-MD-HBase-master
- MD-Hbase的源代码, MD-Hbase为HBASE提供了多维index(The source code of MD-hbase)
sqljdbc_3.0.1301.101_chs.tar
- 这是一个针对hadoop的hdfs和sqlserver之间互传文件的工具(This is one for hadoop s hdfs and transfer files between sqlserver tools)
hdfs_video_jar
- 打开hdfs下MP4文件Hadoop平台的应用因为初次接触望点评改进(open in hdfs MP4 filesApplication based on hadoop platform because of the improvement of initial contact Review)
hadooponwindows-master
- hadooponwindows-master
极客内参-大数据开发实战-淘宝数据8
- 大数据环境搭建,主要是关于大数据分析的数据集。(Building big data environment)
解决Spark数据倾斜的八种实用方法
- 什么是数据倾斜?对 Spark/Hadoop 这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。对于分布式系统而言,理想情况下,随着系统规模(节点数量)的增加,应用整
针对银行数据的lightgbm源代码
- 在本地搭建的hadoop上可以使用,主要针对大数据,可以运行该算法的性能
用户画像源码
- 后端使用springboot、flink、kafaka、hbase、hadoop、flume等前端使用vue、node等
ambari安装
- ambari在开源 SQL 引擎之上进行了大量 SQL 功能 增强和性能优化,性能提升数倍甚至上百倍,并且集成多项管理工具,使其更适合在 Hadoop 上 进行大规模数据分析、检索、查询。