Amazon EMR提供了一个托管的Hadoop框架,可以轻松、快速且经济高效地使用Amazon EC2实例处理大量数据。
在EMR中可以运行其他流行的分布式框架,例如Apache Spark,HBase,Hive,Presto
和Flink
,并与其他AWS数据存储(例如Amazon S3和Amazon DynamoDB)中的数据进行交互。
基于流行的Jupyter Notebook,EMR Notebooks为临时查询和探索性分析提供了开发和协作环境。
EMR适用于多种大数据场景,包括日志分析、数据转换(ETL)、机器学习、财务分析等。