Set up Workspace in EMR Studio


标题: “在 EMR Studio 中设置工作区” 权重: 24


步骤 1. 创建新的工作区

  1. 使用 AWS 控制台中的搜索栏进入 EMR 控制台

:image[studio]{src=”/static/emrstudio-1.png” width=500}

  1. 在左侧导航窗格中单击 Studios

:image[打开 EMR Studio]{src=”/static/emrstudio-2.png” width=500}

我们会注意到已经有一个名称在 AWS CloudFormation 中设置的 EMR Studio。
  1. 单击 Studio 访问 URL,然后单击 创建工作区

:image[创建 EMR Studio 工作区]{src=”/static/emrstudio-3.png” width=500}

  1. 为工作区输入一个 工作区名称(例如上图中的"demo”),然后单击 创建工作区
请注意,创建工作区需要几秒钟时间。
  1. 一旦工作区准备就绪,状态将变为 就绪 状态。然后通过单击 工作区名称 打开工作区。
此工作区将在新的浏览器选项卡中打开。如果工作区无法打开,可能是因为我们的浏览器正在阻止弹出窗口,请禁用对工作区的弹出窗口阻止。
工作区用户界面扩展了开源的 JupyterLab 界面,并添加了额外的工具,帮助我们创建和附加 EMR 集群、运行作业和链接 Git 存储库。工作区有以下面板来执行 EMR Studio 的不同操作:

- 文件浏览器
- 正在运行的内核和终端
- EMR 集群
- Git
- EMR Git 存储库
- 笔记本工具
- 打开的选项卡

![](https://static.us-east-1.prod.workshops.aws/public/3556f534-9037-4ad4-9890-7f9c20a5d551/static/emrstudio-4.png)

步骤 2. 将工作区附加到我们的 Amazon EMR 集群

  1. 从左侧导航窗格中单击 EMR 集群图标,并将 集群类型 设置为 EC2 上的 EMR 集群。不要指定运行时角色。

:image[2]{src=”/static/emrstudio-6.png” width=400}

  1. EC2 上的 EMR 集群 下拉列表中,选择由 CloudFormation 创建的现有集群,然后单击 附加 按钮。

:image[4]{src=”/static/emrstudio-7.png” width=400}

集群附加过程可能需要几分钟时间。在此过程中,我们将看到一条消息"正在将工作区附加到集群"。
我们的工作区现已附加到 CloudFormation 创建的 EMR 集群。 
通过单击本页底部的 **下一步** 继续进行第一个实验。