Spark 和 Hadoop开发人员培训(CCA)
Spark 和 Hadoop开发人员培训(CCA)
  • 观看数
    2765次
  • 课时
    0课时
  • 难度
    初级
Spark 和 Hadoop开发人员培训(CCA)
价格: 6500.00元
购买课程 咨询客服
讲师:康老师  | 开课时间:08月21日 17:00
课程评价: (0人)
收藏 扫一扫 扫码用手机学习
  • 第 1 章 : Hadoop和Hadoop生态系统的介绍
  • 第 1 节 : 传统大规模系统的问题
  • 第 2 节 : Hadoop
  • 第 3 节 : 数据存储和抽取
  • 第 4 节 : 数据处理
  • 第 5 节 : 数据分析和探索
  • 第 6 节 : 其他工具
  • 第 7 节 : 实验环境介绍
  • 第 2 章 : Hadoop架构和HDFS
  • 第 1 节 : 集群的分布式处理
  • 第 2 节 : 存储:HDFS体系结构
  • 第 3 节 : 存储:使用HDFS
  • 第 4 节 : 实验:使用命令行和Hue访问HDFS
  • 第 5 节 : 资源管理:YARN体系结构
  • 第 6 节 : 资源管理:使用YARN
  • 第 7 节 : 实验:运行一个YARN作业
  • 第 3 章 : 用Apache Sqoop导入关系数据
  • 第 1 节 : Sqoop概述
  • 第 2 节 : 基本的导入和导出
  • 第 3 节 : 限制结果
  • 第 4 节 : 改进Sqoop性能
  • 第 5 节 : Sqoop2
  • 第 6 节 : 实验:使用Sqoop从MySQL导入数据
  • 第 4 章 : 介绍Impala 和 Hive
  • 第 1 节 : 介绍Impala和Hive
  • 第 2 节 : 为什么使用Impala和Hive
  • 第 3 节 : 使用Impala和Hive查询数据
  • 第 4 节 : 比较Impala、Hive和传统数据库
  • 第 5 章 : 用Impala 和 Hive建模和管理数据
  • 第 1 节 : 数据存储概述
  • 第 2 节 : 创建数据库和表
  • 第 3 节 : 加载数据
  • 第 4 节 : HCatalog
  • 第 5 节 : Impala元数据缓存
  • 第 6 节 : 实验:在Impala或Hive里创建表并加载数据
  • 第 6 章 : 数据格式
  • 第 1 节 : 文件存储格式
  • 第 2 节 : Avro schemas
  • 第 3 节 : Avro Schema演进
  • 第 4 节 : Impala、Hive和Sqoop使用Avro
  • 第 5 节 : Impala、Hive和Sqoop使用Parquet
  • 第 6 节 : 压缩
  • 第 7 节 : 实验:为数据文件选择一种格式
  • 第 7 章 : 数据分区
  • 第 1 节 : 分区概述
  • 第 2 节 : 在Impala和Hive里进行分区
  • 第 3 节 : 实验:在Impala或Hive中分区数据
  • 第 4 节 : 什么是Apache Flume
  • 第 5 节 : 基本Flume体系结构
  • 第 6 节 : Flume Sources
  • 第 7 节 : Flume Sinks
  • 第 8 节 : Flume Channels
  • 第 9 节 : Flume配置
  • 第 10 节 : 实验:使用Flume收集Web服务日志
  • 第 8 章 : Spark 基础
  • 第 1 节 : 什么是Apache Spark
  • 第 2 节 : 使用Spark Shell
  • 第 3 节 :  RDDs(弹性分布式数据集)
  • 第 4 节 : Spark的函数式编程
  • 第 9 章 : Spark RDD 操作
  • 第 1 节 : 创建RDD
  • 第 2 节 : MapReduce
  • 第 3 节 : 其他通用的RDD操作
  • 第 4 节 : 实验:使用Spark处理数据文件
  • 第 10 章 : 编写和部署Spark应用
  • 第 1 节 : Spark应用 vs Spark Shell
  • 第 2 节 : 创建SparkContext
  • 第 3 节 : 构建Spark应用
  • 第 4 节 : 运行Spark应用
  • 第 5 节 : Spark Application Web UI
  • 第 6 节 : 实验:编写和运行Spark应用
  • 第 7 节 : 配置Spark属性
  • 第 8 节 : 记录日志
  • 第 9 节 : 实验:配置Spark应用
  • 第 11 章 : Spark 并行处理
  • 第 1 节 : 回顾:Spark集群
  • 第 2 节 : RDD分区
  • 第 3 节 :  基于文件的RDD分区
  • 第 4 节 : HDFS和数据本地化
  • 第 5 节 : 执行并行操作
  • 第 6 节 : Stages和Tasks
  • 第 7 节 : 总结
  • 第 8 节 : 实验:在Spark应用UI中查看Jobs和Stages
  • 第 12 章 : Spark RDD 持久性
  • 第 1 节 : RDD Lineage
  • 第 2 节 : RDD持久化概述
  • 第 3 节 : 分布式持久化
  • 第 4 节 : 实验:保存一个RDD
  • 第 13 章 : Spark数据处理的常用模式
  • 第 1 节 : 常见Spark使用案例
  • 第 2 节 : 迭代算法
  • 第 3 节 : 图处理和分析
  • 第 4 节 : 机器学习
  • 第 5 节 : 案例:K-means实现
  • 第 6 节 : 实验:使用Spark实现迭代算法
  • 第 14 章 : Spark SQL
  • 第 1 节 : Spark SQL和SQL Context
  • 第 2 节 : 创建DataFrames
  • 第 3 节 : 查询和转换DataFrames
  • 第 4 节 : 保存DataFrames
  • 第 5 节 : DataFrames和RDDs
  • 第 6 节 : 比较Spark SQL,Impala和Hive-on-Spark
  • 第 7 节 : 实验:使用Spark SQL处理ETL

最新学员

暂无学员

学员动态

admin 开始学习课时 Hadoop Architec...
admin 开始学习课时 Introduction to...
在线
咨询

服务时间: 8:00 - 22:00

客服热线: 40000-93353