2.
EMR基础操作
1.
启动EMR集群
2.
SSH登录集群
3.
使用spark-submit执行任务
4.
监控任务执行状态
5.
使用Jupyter Notebook提交任务
6.
EMR Steps
3.
EMR Configuration
1.
Livy配置
2.
跨帐号查询Glue
3.
AWS
4.
4
5.
55
6.
AWS
7.
77
4.
Hive Workshop
1.
使用Hive CLI运行任务
2.
Hive - EMR Steps
3.
PIG - EMR STEPS
5.
EMR on EKS
1.
在EKS上创建EMR集群
2.
在EKS上向EMR提交作业
3.
AWS
4.
4
5.
55
6.
AWS
7.
77
6.
EMR Serverless - I
1.
控制台将Spark Job提交到 EMR Serverless
2.
从CLI提交 Spark Job
3.
使用 Custom Image
4.
提交 Hive Job
5.
Spark任务的监控
6.
CloudWatch Dashboard监控EMR Serverless Job
7.
Hive的监控
7.
EMR Serverless - II
1.
与Glue MetaStore集成
3.
Transaction型数据湖 - Hudi
4.
Transaction型数据湖 - Hudi II
8.
EMR的计算成本优化
1.
环境搭建
2.
EMR on EC2使用Spot
3.
通过EMR on EKS提交任务
4.
EKS上的spot中断
5.
使用KubeCost进行成本可视化
6.
通过EMR on EKS提交任务
7.
通过EMR on EKS提交任务
清除历史
© 2021 Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Introduction
> EMR基础操作