Amazon EMR

輕鬆地執行和擴展 Apache Spark、Hive、Presto 和其他大數據工作負載

EMR Serverless 簡介

Amazon EMR Serverless 是 Amazon EMR 中的一個新選項,它讓資料工程師和分析師能夠以輕鬆且具成本效益的方式,在無須調整、操作、最佳化、保護或管理叢集的情況下,便能執行 Apache Spark、Hive 或 Presto 等使用開放原始碼大數據架構所建置的應用程式。

優勢

加速執行大數據應用程式及 PB 級資料分析,內部部署解決方案的成本則可減少一半以上。

使用最新的開放原始碼架構建置應用程式,並提供在自訂 Amazon EC2 叢集、Amazon EKSAWS OutpostsAmazon EMR Serverless 上執行的選項。

透過 Spark、Hive 和 Presto 的效能優化和開源 API 相容版本,獲得洞察的時間最多可縮短 2 倍。

使用 EMR Notebooks 和 EMR Studio 中熟悉的開放原始碼工具輕鬆開發、視覺化和偵錯您的應用程式。

使用案例

使用統計演算法和預測模型執行大規模資料處理和假設分析,以發現隱藏的模式、相關性、市場趨勢和客戶偏好。
從各種來源擷取資料、大規模處理,然後提供給應用程式和使用者兩者使用。
即時分析串流資料來源的事件,以建立長期執行、高可用性和容錯的串流 Data Pipeline。
使用開源機器學習 (ML) 架構,例如:Apache Spark MLlib、TensorFlow 與 Apache MXNet 來分析資料。連接到 Amazon SageMaker Studio 以進行大規模模型訓練、分析和報告。

探索更多 AWS 服務