搜索资源列表
ARFFInputformat
- hadoop下自定义的读文件格式类,对于数据挖掘分类算法的训练测试文本的特殊格式有很大帮助.-hadoop read the file format class custom of great help for training in the special format of the test text data mining classification algorithms.
starfish-0.3.0
- Starfish 是一个用于大数据分析的自调优系统,这是一托管 Github 上的项目,但目前访问是 404,不清楚为何。Starfish 相当于是一个性能优化工具,可让 Hadoop 用户和应用达到最佳性能,包含三个组件: 1. Profiler 2. What-if Engine 3. Optimizer-Starfish is a self-tuning system for big data analysis, which is a project hosted on Git
JAVA-Hadoop-programming
- 程序源码,《Hadoop高级编程——构建与实现大数据解决方案》本书关注用于构建先进的、基于Hadoop的企业级应用的架构和方案,并为实现现实的解决方案提供深入的、代码级的讲解。本书还会带你领略数据设计以及数据设计如何影响实现。本书解释了MapReduce的工作原理,并展示了如何在MapReduce中重新定制特定的业务问题。在整本书中,你将会发现深入的Java代码示例,这些代码示例可以直接使用,它们均源自于已经成功地构建和部署的应用程序。-Source program the Hadoop pro
Hadoop
- windows 利用hadoop开源框架实现 每日产品的最高卖出量 实现大数据搜索-windows Using hadoop open source framework to achieve the daily product s highest selling quantity Big data search
hadoop-hive-code
- 此文件是大数据方面的两个小代码,一个是hadoop中wordcount的代码和说明,另外一个是hive的代码,希望可以帮到大家。-This file contains two small codes about the big data,one is the wordcount in hadoop,the other is hive. Hope this can help you!
9313_bigdata
- unsw大数据9313课程,lab包括Hadoop的mapreduce,hive,pig,scala语言-unsw Big Data 9313 courses, lab including Hadoop' s mapreduce, hive, pig, scala language
hadoop-lib
- 大数据资料,学习Hadoop的基础知识代码。-dig data hadoop
第九讲 分布式文件系统HDFS
- 分布式文件系统 HDFS 分布式文件系统的好处,缺点(Advantages and disadvantages of the distributed file system HDFS distributed file system)
Hadoop权威指南(第2版)修订升级版 高清中文PDF
- Hadoop权威指南(第2版)修订升级版 高清中文PDF.pdf(Hadoop authoritative guide (Second Edition) revised upgraded version of HD Chinese PDF.pdf)
Drill Across Dashboard
- hadoop学习资仪表盘学习案例加上源码大数据分析和hadoopjiagou(hnmixtures = defaultNMixtures2; backgroundRatio = defaultBackgroundRatio2; fVarInit = defaultVarInit2; fVarMax = defaultVarMax2; fVarMin = defaultVarMin2;)
wordcount
- 在hadoop平台进行大数据的wordcount.(Wordcount for big data at hadoop platform.)
FileHDFSTest
- 利用java api对hadoop的hdfs分布式文件系统进行操作(java operate hadoop HDFS FileSystem)