AWS Outposts 上的 Amazon EMR

為什麼選擇 Outposts 上的 EMR?

AWS Outposts 可將 AWS 服務、基礎設施和操作模型用於幾乎所有的資料中心、主機代管空間或內部部署設施。Amazon EMR 在 AWS Outposts 上提供,讓您可以在內部部署環境中設定、部署、管理和擴展 Apache Hadoop、Apache Hive、Apache Spark 和 Presto 叢集,如同在雲端中操作一樣。Amazon EMR 在 Outposts 中提供具成本效益的容量,同時將耗時的管理任務自動化,例如基礎架構佈建、叢集設定、組態或調整,讓您專注於您的應用程式。

您可以使用相同的 AWS 管理主控台、API 和適用於 EMR 的 CLI,快速輕鬆地在內部部署建立受管 EMR 叢集。與其他叢集一樣,在 Outpost 中啟動的 EMR 叢集將出現在 AWS 主控台中,但它將在 Outpost 中執行。

優勢

設定 Outpost 後,您可以在內部部署啟動新的 EMR 叢集,並在幾分鐘內連接到現有的 HDFS 儲存。這讓您可以在內部部署系統需要額外處理能力時快速做出回應。在內部部署 Hadoop 和 Spark 叢集中增加容量,有助於在高利用率期間滿足工作負載需求並維護 SLA。
Apache Hadoop、Apache Hive、Apache Spark 和 Presto 通常用於處理、轉換和分析作為較大資料架構一部分的資料。對於出於管控、合規或其他原因而需要保留在內部部署的資料,可以使用 EMR 在靠近資料的位置部署和執行內部部署的 Apache Hadoop 和 Apache Spark 之類的應用程式。這減少了將大量內部部署資料移至雲端的需求,從而減少了處理資料所需的總時間。
如果您正在將資料和 Apache Hadoop 工作負載移轉到雲端,並且想要在移轉完成之前開始使用 EMR,則可以使用 AWS Outposts 在連接到現有 HDFS 儲存的內部部署啟動 EMR 叢集。然後,您可以將資料逐漸移轉到 Amazon S3,作為向雲端架構發展的一部分。