Amazon EMR 上的 Presto
功能與優勢
客戶成功案例
Netflix 客戶成功案例
Netflix 選擇 Presto 做為大數據的互動式 ANSI-SQL 合規查詢引擎。Presto 不但有絕佳的可擴展性而且是開放原始碼,並與 Hive Metastore 和 Amazon S3 整合 – 這是 Netflix 大數據倉儲環境的骨幹。Netflix 在持久性 Amazon EMR 叢集執行 Presto,以快速且彈性的方式查詢高達 25 PB 的 Amazon S3 資料存放區。Netflix 是 Presto 的積極參與者,而且 Amazon EMR 為 Netflix 提供在 Amazon EMR 叢集上執行自有 Presto 組建的彈性。一般而言,Netflix 可在自己的 Presto 叢集上每天執行高達 3,500 個查詢。
Jammp 客戶成功案例
Jampp 是行動應用程式行銷平台,使用先進的廣告重新定位技術促使參與的使用者使用應用程式。Jampp 透過自己的轉換導向即時競價 (RTB) 引擎購買行動媒體庫存達成這個目標,該引擎可在 18 個 RTB 交易和超過 150 個行動廣告網路動態競標庫存。Jampp 將 Amazon EMR 上執行的 Presto 用於先進的臨機操作日誌分析,結合多個來源的資料以及複雜的重新定位客群計算。由於 Jampp 的使用者數量成長了 600%,因此複雜分析查詢的需求也隨著增加。Jampp 從在 MySQL 上執行複雜的多核心 Python 應用程式轉移到執行 Presto,效能因此提升了 12 倍。Jampp 目前使用 Amazon EMR 上的 Presto 每天處理 40 TB 的資料。
Cogo Labs 客戶成功案例
做為新創公司育成中心,Cogo Labs 操作其投資組合公司和內部團隊用來執行行銷分析和商業智慧的平台。為了支援高度創新的 OLAP 環境,他們在 SQL 上進行標準化以便與資料互動。Cogo Labs 選擇 Presto,因為它有絕佳的即時查詢效能、支援 ANSI-SQL,且可從 Amazon S3 直接處理資料。Amazon EMR 上執行的 Presto 可讓超過 100 名開發人員和分析師在存放超過 500 TB 資料的 Amazon S3 執行 SQL 查詢,以進行資料探索、臨機操作分析和報告。Cogo Labs 搭配使用短期和永久叢集,並依賴 Amazon EMR 與競價型執行個體的整合降低成本。
OpenSpan 客戶成功案例
OpenSpan 提供自動化和智慧解決方案協助連結人們、處理程序和技術,以獲得員工生產力的洞見、簡化交易,以及增進員工和客戶之間的互動。OpenSpan 使用 Amazon S3 中的資料從 HBase 遷移到 Amazon EMR 上的 Presto。OpenSpan 選擇 Presto 是因為其 SQL 界面和從 Amazon S3 直接即時查詢資料的能力,這可讓他們快速探索大量的資料,以及快速迭代即將推出的資料產品。OpenSpan 使用 parquet 檔案格式,同時使用 PrestogreSQL 連接 Presto。OpenSpan 選擇使用 Amazon EMR 和 Amazon S3,以經濟實惠的方式處理每天來自客戶的數 GB 資料。
Kanmu 客戶成功案例
Kanmu 是日本金融服務業的新創公司,根據客戶信用卡的使用方式提供卡聯服務。Kanmu 從使用 Hive 遷移到 Amazon EMR 上的 Presto,因為 Presto 能夠以互動速度執行探索和迭代分析、與 Amazon S3 搭配可獲得良好的效能,而且具備查詢大型資料集的可擴展性。Kanmu 使用 Fluentd-plugin-s3 將資料推送到 Amazon S3、使用優化資料列單欄式 (ORC) 格式存放資料,以及使用 node.js Web 用戶端 shib 執行 SQL 查詢。