Amazon EMR

Apache Spark、Hive、Presto、その他のビッグデータワークロードを簡単に実行してスケール

EMR Serverless のご紹介

Amazon EMR Serverless は、データエンジニアやアナリストが、Apache Spark、Hive、Presto などのオープンソースのビッグデータフレームワークを使用して構築したアプリケーションを、調整、運用、最適化、セキュリティ確保、クラスター管理をすることなく、簡単かつコスト効率よく実行できる Amazon EMR の新オプションです。

利点

ビッグデータアプリケーションやペタバイトスケールのデータ分析を、オンプレミス型ソリューションの半分以下のコストで高速に実行できます。

カスタマイズされた Amazon EC2 クラスター、Amazon EKSAWS OutpostsAmazon EMR Serverless で実行するオプションを備えた、最新のオープンソースフレームワークを使用してアプリケーションを構築します。

パフォーマンスが最適化されたオープンソースの API 互換バージョンで Spark、Hive、および Presto を使用して、インサイトを導き出すまでかかる時間を最大 2 倍高速化します。

EMR Notebooks と EMR Studio の使い慣れたオープンソースツールを使用して、アプリケーションを簡単に開発、視覚化、およびデバッグします。

ユースケース

統計アルゴリズムと予測モデルを使用して大規模なデータ処理と what-if 分析を実行し、隠されたパターン、相関関係、市場動向、および顧客の好みを明確にします。
さまざまなソースからデータを抽出し、大規模に処理して、アプリケーションとユーザーが利用できるようにします。
ストリーミングデータソースされるイベントをリアルタイムで分析する、高い可用性、耐障害性を備えた長時間の実行に対応するストリーミングデータパイプラインを構築できます。
Apache Spark MLlib、TensorFlow、Apache MXNet などのオープンソースの機械学習フレームワークを使用してデータを分析します。Amazon SageMaker Studio に接続して、大規模なモデルトレーニング、分析、およびレポートを作成します。

AWS の詳細を見る