


主办单位:碧茂科技
Spark及Hadoop开发员培训(10月上海+线上)宣传图
Spark及Hadoop开发员培训
课程描述:
学员将学习关键概念和掌握使用最新的Apache Spark 2技术和工具开发高性能并行应用:学习如何对结构化数据使用Spark SQL进行查询分析;如何对不同流式数据使用Spark Streaming进行实时处理;以及如何使用core Spark技术执行ETL处理和实现迭代式算法。本课程主要考察在Hadoop集群上,如何对大规模分布式数据使用Spark进行分布式处理。
通过本课程培训,参训人员将能应对不同行业、不同架构和不同应用问题场景的大数据问题挑战,创建应用或者进行交互式探索式分析以更快地获取最佳商业决策和解决方案。
课时安排:
4天/24课时。
可选择上海线下课程,也可选择线上课程。
认证编号:
CCA175。
培训内容:
本课程为每名学员准备了专属的、部署在云平台上的集群环境。每名学员使用该练习环境进行大量实操练习,学以致用。 通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
> 在Hadoop机群上进行分布式存储和处理数据。
> 在Hadoop机群上编写、配置和部署Apache Spark应用。
> 使用Spark shell进行交互式数据分析。
> 使用Spark SQL查询处理结构化数据。
> 使用Spark Streaming处理流式数据。
培训对象及学员基础:
本课程适合于具有编程经验的开发员及工程师。无需Apache Hadoop/Spark基础。
> 培训内容中对Apache Spark的介绍所涉及的代码及练习使用Scala和Python,因此需至少掌握这两个编程语言中的一种。
> 需熟练掌握Linux命令行。
> 对SQL有基本了解。
在参加完本培训后,我们建议学员参加此课程的一个后继课程:设计和创建大数据应用。
客户评价:
“通过Cloudera的培训,让我们在使用大数据核心平台Hadoop方面信心百倍地面对未来和赢得更多的挑战。”
—— Persado
1
文本已超出限制,最大输入200字
举报
其他