• 2. EMR基础操作
    • 1. 启动EMR集群
    • 2. SSH登录集群
    • 3. 使用spark-submit执行任务
    • 4. 监控任务执行状态
    • 5. 使用Jupyter Notebook提交任务
    • 6. EMR Steps
  • 3. EMR Configuration
    • 1. Livy配置
    • 2. 跨帐号查询Glue
    • 3. AWS
    • 4. 4
    • 5. 55
    • 6. AWS
    • 7. 77
  • 4. Hive Workshop
    • 1. 使用Hive CLI运行任务
    • 2. Hive - EMR Steps
    • 3. PIG - EMR STEPS
  • 5. EMR on EKS
    • 1. 在EKS上创建EMR集群
    • 2. 在EKS上向EMR提交作业
    • 3. AWS
    • 4. 4
    • 5. 55
    • 6. AWS
    • 7. 77
  • 6. EMR Serverless - I
    • 1. 控制台将Spark Job提交到 EMR Serverless
    • 2. 从CLI提交 Spark Job
    • 3. 使用 Custom Image
    • 4. 提交 Hive Job
    • 5. Spark任务的监控
    • 6. CloudWatch Dashboard监控EMR Serverless Job
    • 7. Hive的监控
  • 7. EMR Serverless - II
    • 1. 与Glue MetaStore集成
    • 3. Transaction型数据湖 - Hudi
    • 4. Transaction型数据湖 - Hudi II
  • 8. EMR的计算成本优化
    • 1. 环境搭建
    • 2. EMR on EC2使用Spot
    • 3. 通过EMR on EKS提交任务
    • 4. EKS上的spot中断
    • 5. 使用KubeCost进行成本可视化
    • 6. 通过EMR on EKS提交任务
    • 7. 通过EMR on EKS提交任务

  • 清除历史

© 2021 Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Introduction > EMR基础操作