Mengapa harus EMR?
Amazon EMR merupakan platform big data cloud terkemuka di industri untuk pemrosesan data, analisis interaktif, dan machine learning (ML) menggunakan kerangka kerja sumber terbuka seperti Apache Spark, Apache Hive, dan Presto. Harga Amazon EMR sederhana dan mudah diprediksi: Anda membayar tarif per detik untuk setiap detik penggunaan, dengan minimum pembayaran satu menit. Biaya klaster 10 simpul yang berjalan selama 10 jam sama dengan biaya klaster 100 simpul selama satu jam. Harga Amazon EMR bergantung pada cara Anda melakukan deployment aplikasi EMR Anda. Anda dapat menjalankannya pada klaster EMR dengan instans Amazon Elastic Cloud Compute (Amazon EC2), pada AWS Outposts, pada Amazon Elastic Kubernetes Service (Amazon EKS), atau dengan EMR Nirserver. Anda dapat menjalankan Amazon EKS di AWS menggunakan EC2 ataupun AWS Fargate.
Anda akan dikenakan biaya alamat IPv4 publik standar untuk alamat IPv4 yang digunakan dengan klaster Amazon EMR di EC2, klaster Amazon EMR di EKS, dan aplikasi Amazon EMR Nirserver Anda. Kunjungi bagian alamat IPv4 publik di halaman harga VPC untuk detail selengkapnya.
Kalkulator Harga AWS
Hitung biaya Amazon EMR dan arsitektur Anda dalam satu perkiraan.
Amazon EMR di Amazon EC2
Harga ini untuk aplikasi Amazon EMR yang berjalan di klaster Amazon EMR dengan instans Amazon EC2.
Harga Amazon EMR ditambahkan ke harga Amazon EC2 (harga untuk server yang menjadi dasarnya) dan harga Amazon Elastic Block Store (Amazon EBS) (jika melampirkan volume Amazon EBS). Ini juga ditagih per detik, dengan minimum satu menit. Terdapat berbagai opsi harga EC2 yang dapat Anda pilih, termasuk Sesuai Permintaan (ditunjukkan di bawah), Instans Cadangan satu tahun dan tiga tahun, Savings Plans Kapasitas, dan Instans Spot. Instans Spot adalah kapasitas EC2 cadangan yang tersedia dengan diskon hingga 90% dibandingkan dengan harga Sesuai Permintaan. Lihat penghematan harga Instans Spot vs Sesuai Permintaan dengan memfilter “Tipe instans yang didukung EMR” di halaman Penasihat Instans Spot.
Amazon EMR di Amazon EKS
Harga ini untuk Amazon EMR di klaster Amazon EKS.
Harga Amazon EMR ditambahkan ke harga Amazon EKS atau layanan lain yang digunakan dengan EKS. Anda dapat menjalankan EKS di AWS menggunakan EC2 atau AWS Fargate. Jika Anda menggunakan EC2 (termasuk grup simpul terkelola EKS), Anda membayar sumber daya AWS (misal., instans EC2 atau volume EBS) yang Anda buat untuk menjalankan simpul pekerja Kubernetes Anda. Lihat detail informasi harga pada halaman harga EC2. Jika Anda menggunakan AWS Fargate, harga dihitung berdasarkan sumber daya vCPU dan memori yang digunakan mulai saat Anda mengunduh citra kontainer hingga pod EKS berakhir, dibulatkan ke atas ke detik terdekat. Berlaku biaya minimum satu menit. Lihat detail informasi harga pada halaman harga AWS Fargate.
Harga Amazon EMR di Amazon EKS dihitung berdasarkan sumber daya vCPU dan memori yang digunakan mulai saat Anda mengunduh citra aplikasi EMR Anda hingga Pod EKS berakhir, dibulatkan ke atas ke detik terdekat. Harga didasarkan pada permintaan sumber daya vCPU dan memori untuk Tugas atau Pod.
Amazon EMR di AWS Outposts
Harga Amazon EMR di AWS Outposts sama dengan instans EMR berbasis cloud. Lihat halaman harga AWS Outposts untuk detail mengenai harga AWS Outposts.
Amazon EMR Serverless
Dengan Nirserver EMR, tidak ada biaya di muka dan Anda hanya membayar untuk sumber daya yang Anda gunakan. Anda membayar jumlah sumber daya vCPU, memori, dan penyimpanan yang digunakan oleh aplikasi Anda.
Dengan Nirserver EMR, Anda dapat membuat aplikasi menggunakan versi kerangka kerja sumber terbuka, dan mengirimkan tugas ke aplikasi tersebut. Sebagai bagian dari spesifikasi tugas, Anda dapat memberikan jumlah minimum dan maksimum pekerja yang bekerja bersamaan, serta vCPU, memori, dan penyimpanan untuk masing-masing pekerja. EMR secara otomatis menambahkan dan menghapus pekerja berdasarkan apa yang diperlukan oleh tugas tersebut dalam batas yang Anda tentukan. Tiga dimensi yang terdiri dari komputasi, memori, dan penyimpanan untuk pekerja dapat dikonfigurasi secara independen. Anda dapat memilih mulai dari 1 vCPU, 2 vCPU, 4 vCPU, 8 vCPU, hingga 16 vCPU per pekerja, memori mulai dari 2 GB hingga 120 GB per pekerja dengan peningkatan 1 GB hingga 8 GB. Untuk opsi penyimpanan, Anda dapat memilih penyimpanan standar mulai dari 20 GB hingga 200 GB per pekerja, atau memilih penyimpanan yang dioptimalkan secara acak mulai dari 20 GB hingga 2 TB per pekerja.
Anda dikenai biaya atas sumber daya vCPU, memori, dan penyimpanan agregat yang digunakan sejak pekerja siap menjalankan hingga menghentikan beban kerja, yang dibulatkan ke detik terdekat dengan minimum 1 menit. Jika Anda menyiapkan aplikasi untuk pekerja yang memulai saat aplikasi dimulai, pekerja yang diminta akan memulai saat Anda memulai aplikasi, dan berhenti saat Anda menghentikan aplikasi, atau saat aplikasi tetap diam.
Catatan: Saat menggunakan gambar kustom, Anda dikenai biaya untuk sumber daya vCPU, memori, dan penyimpanan agregat yang digunakan sejak EMR Nirserver mulai mengunduh gambar sampai pekerja berhenti, dibulatkan ke detik terdekat dengan waktu minimum 1 menit.
Detail harga (komputasi dan memori)
Harga didasarkan pada sumber daya vCPU, memori, dan penyimpanan yang digunakan oleh pekerja, agregat dari semua pekerja.
-
Linux/x86
-
Linux/ARM
-
Linux/x86
-
-
Linux/ARM
-
Detail harga (penyimpanan sementara)
Penyimpanan standar: 20 GB pertama dari penyimpanan sementara tersedia untuk semua pekerja secara default, dan Anda hanya perlu membayar penyimpanan tambahan yang dikonfigurasi per pekerja.
Penyimpanan yang Dioptimalkan secara Acak: Anda membayar seluruh penyimpanan yang dikonfigurasi per pekerja, termasuk 20 GB pertama.
Konfigurasi pekerja yang didukung
CPU | Nilai Memori | Penyimpanan Sementara |
1 vCPU | Min. 2 GB dan Maks. 8 GB, dengan peningkatan 1 GB | 20 GB - 200 GB |
2 vCPU | Min. 4 GB dan Maks. 16 GB, dengan peningkatan 1 GB | 20 GB - 200 GB |
4 vCPU | Min. 8 GB dan Maks. 30 GB, dengan peningkatan 1 GB | 20 GB - 200 GB |
8 vCPU | Min. 16 GB dan Maks. 60 GB, dengan peningkatan 4 GB | 20 GB - 200 GB |
16 vCPU | Min. 32 GB dan Maks. 120 GB, dengan peningkatan 8 GB | 20 GB - 200 GB |
Durasi
Durasi dihitung dari saat pekerja siap menjalankan beban kerja hingga saat beban kerja dihentikan, dibulatkan ke detik terdekat dengan minimum 1 menit.
Biaya tambahan
Anda mungkin dikenai biaya tambahan jika aplikasi Anda menggunakan layanan AWS lain. Misalnya, jika aplikasi Anda menggunakan Amazon Simple Storage Service (S3) untuk menyimpan dan memproses data maka Anda akan dikenai biaya Amazon S3 standar. Jika Anda menggunakan data dari sumber data seperti Amazon S3, Amazon Relational Database Service (RDS), atau Amazon Redshift, Anda akan dikenai biaya dengan tarif permintaan dan transfer data standar. Jika Anda menggunakan Amazon CloudWatch, Anda dikenai tarif standar untuk log CloudWatch dan peristiwa CloudWatch.
WAL Amazon EMR
Harga ini untuk Amazon EMR pada klaster EC2 dengan aplikasi Apache HBase menggunakan WAL Amazon EMR. Write Ahead Log Apache HBase memungkinkan pencatatan semua perubahan data ke penyimpanan berbasis file. Dengan Amazon EMR di EC2, Anda dapat menulis write-ahead log Apache HBase ke WAL Amazon EMR, lapisan penyimpanan terkelola tahan lama yang bertahan lebih lama dari klaster Anda. Jika klaster Anda, atau dalam kasus yang jarang terjadi, Zona Ketersediaan menjadi tidak sehat atau tidak tersedia, Anda dapat membuat klaster baru, mengarahkannya ke direktori root Amazon S3 yang sama dan workspace WAL Amazon EMR, serta memulihkan data di WAL secara otomatis dalam beberapa menit. Untuk informasi selengkapnya, lihat Dokumentasi WAL Amazon EMR.
Anda akan membayar atas apa yang digunakan untuk WAL EMR. Jika Anda memiliki klaster aktif yang dikonfigurasi untuk menggunakan WAL, Anda akan dikenai biaya atas penyimpanan WAL EMR berdasarkan penggunaan yang ditagih sebagai EMR-WAL-WALHours, penulisan sebagai WriteRequestGiB, dan pembacaan sebagai ReadRequestGiB.
EMR-WAL-WALHours: WAL EMR akan membuat satu WAL per Wilayah Apache HBase. Setelah klaster Anda diakhiri, jika masih ada data di WAL EMR yang tidak di-flush ke Amazon S3, Anda dapat memulihkan data dengan meluncurkan klaster pemulihan, atau memilih untuk membersihkan WAL dengan membuat klaster sementara dan menggunakan CLI WAL EMR untuk menghapus sumber daya WAL EMR. Jika Anda tidak menghapus data WAL EMR secara eksplisit, WAL EMR akan mempertahankan data dan menagih Anda untuk data yang tidak di-flush selama 30 hari. Anda dapat melihat contoh di bawah ini.
ReadRequestGiB dan WriteRequestGiB: Kedua dimensi ini adalah untuk permintaan baca dan tulis. Panggilan API Apache HBase untuk menulis data ke tabel Anda pada klaster dengan WAL EMR ditagih sebagai WriteRequestGiB. Penulisan WAL EMR akan terjadi untuk semua penulisan Apache HBase seperti operasi `Put`. Panggilan API Apache HBase untuk membaca data dari WAL EMR Anda selama operasi pemulihan Apache HBase ditagih sebagai ReadRequestGiB. Pembacaan dan Penulisan dikenai biaya berdasarkan ukuran item dan tagihan EMR minimal 1 Bita.
Contoh Harga
Contoh 1: EMR di EC2
Penetapan harga berdasarkan harga AS-Timur-1.
Misalkan Anda menjalankan aplikasi Amazon EMR yang di-deploy di Amazon EC2, dan Anda menggunakan satu instans EC2 c4.2xlarge sebagai simpul utama dan dua instans EC2 c4.2xlarge sebagai simpul inti. Anda akan dikenakan biaya untuk EMR dan untuk simpul EC2. Jika Anda menjalankan selama satu bulan, dengan penggunaan 100% selama bulan itu, dan menggunakan harga sesuai permintaan untuk EC2, biaya Anda akan menjadi:
Simpul utama:
Biaya EMR = 1 instans x 0,105 USD per jam x (100/100 digunakan/bulan) x 730 jam dalam sebulan = 76,65 USD (biaya node utama EMR) Biaya EC2 = 1 instans x 0,398 USD per jam x 730 jam dalam sebulan = 290,54 USD (biaya node utama EC2)
Simpul inti:
Biaya EMR = 2 instans x 0,105 USD per jam x (100/100 digunakan/bulan) x 730 jam dalam sebulan = 153,30 USD (biaya simpul inti EMR)
Biaya EC2 = 2 instans x 0,398 USD per jam x 730 jam dalam sebulan = 581,08 USD (biaya simpul inti EC2)
Total biaya = 76,65 USD + 290,54 USD + 153,30 USD + 581,08 USD = 1101,57 USD
Contoh 2: EMR di EKS
Penetapan harga berdasarkan harga AS-Timur-1.
Misalkan Anda menjalankan aplikasi Amazon EMR-Spark yang di-deploy di Amazon EKS. Dalam hal ini, EKS mendapatkan kapasitas komputasinya menggunakan instans EC2 r5.2xlarge (8 vCPU, 64 GB RAM). Anggaplah bahwa klaster EKS memiliki 100 simpul, dengan total 800 vCPU, dan 6400 GB total memori. Anggaplah bahwa aplikasi tersebut menggunakan 100 vCPU dan 300 GB memori selama 30 menit.
Total biaya peningkatan Amazon EMR untuk tugas tersebut:
Total Peningkatan pada vCPU = (100 * 0,01012 USD * 0,5) = (jumlah vCPU * tarif per jam vCPU * waktu aktif tugas dalam jam) = 0,506 USD
Total Peningkatan pada memori = (300 * 0,00111125 USD * 0,5) = (jumlah memori yang digunakan * tarif per GB-jam * waktu aktif tugas dalam jam) = 0,1667 USD
Total Peningkatan EMR untuk tugas EMR = 0,6727 USD
Biaya Tambahan
Anda membayar 0,10 USD per jam untuk setiap klaster Amazon EKS yang Anda buat. Anda dapat menggunakan satu klaster Amazon EKS untuk menjalankan beberapa aplikasi dengan memanfaatkan ruangnama Kubernetes dan kebijakan keamanan IAM. Anda dapat menjalankan EKS di AWS menggunakan Amazon EC2 atau AWS Fargate.
Jika Anda menggunakan Amazon EC2 (termasuk dengan grup simpul terkelola Amazon EKS), Anda membayar sumber daya AWS (misalnya instans EC2 atau volume Amazon EBS) yang Anda buat untuk menjalankan simpul pekerja Kubernetes Anda. Anda hanya membayar atas apa yang Anda gunakan, saat Anda menggunakannya. Tidak ada biaya minimum dan tidak ada komitmen di muka. Lihat detail informasi harga pada halaman harga EC2.
Jika Anda menggunakan AWS Fargate, harga dihitung berdasarkan sumber daya vCPU dan memori yang digunakan mulai saat Anda mengunduh citra kontainer hingga pod Amazon EKS berakhir, dibulatkan ke atas ke detik terdekat. Berlaku biaya minimum satu menit. Lihat detail informasi harga pada halaman harga AWS Fargate.
Contoh 3: EMR Serverless
Misalkan Anda mengirimkan tugas Spark ke EMR Serverless Mari kita asumsikan bahwa tugas dikonfigurasi untuk menggunakan minimum 25 pekerja dan maksimum 75 pekerja, yang masing-masing pekerja dikonfigurasi dengan 4 VCPU dan memori 30 GB. Anggap bahwa tidak ada penyimpanan sementara tambahan yang dikonfigurasi. Jika pekerjaan Anda berjalan selama 30 menit menggunakan 25 pekerja (atau 100 vCPU) dan secara otomatis diskalakan untuk menambahkan 50 pekerja lagi (200 vCPU lagi) selama 15 menit:
Total biaya jam-vCPU = (100 * 0,052624 USD * 0,5) + (200 * 0,052624 USD * 0,25) = (jumlah vCPU * tarif per jam-vCPU * waktu aktif tugas dalam jam) = 5,2624 USD
Total jam-GB = (750 * 0,0057785 USD * 0,5) + (1500 * 0,0057785 USD * 0,25) = (Total GB memori yang dikonfigurasi * tarif per jam-GB * waktu aktif tugas dalam jam) = 4,333875 USD
Total Biaya EMR Serverless = 9,596275 USD
Biaya Tambahan: Jika aplikasi Anda menggunakan layanan AWS lain seperti Amazon S3, Anda akan dikenai tarif S3 standar.
Contoh 4: WAL EMR
Misalkan Anda membuat klaster Amazon EMR baru dengan Apache HBase dan memilih untuk sepenuhnya membuat cadangan klaster Anda di Wilayah AS Timur (Virginia Utara). Karena ini untuk aplikasi baru, Anda tidak tahu akan seperti apa pola lalu lintas Anda. Untuk lebih mudahnya, asumsikan bahwa pengguna Anda membuat 10 tabel HBase termasuk tabel sistem, 2 Wilayah HBase per tabel, dan bahwa setiap kali pengguna berinteraksi dengan aplikasi Anda, mereka menulis 1 KiB data.
Untuk jangka waktu 10 hari, Anda menerima sedikit lalu lintas ke aplikasi Anda, menghasilkan 10.000 penulisan setiap hari. Namun, pada hari ke-11, lalu lintas aplikasi Anda melonjak menjadi 2.500.000 penulisan. Anda juga memutuskan untuk memperbarui kode kustom secara bersamaan di klaster Anda dan mengambil waktu henti malam yang dijadwalkan untuk pengguna akhir Anda pada Hari ke-11. Mari kita asumsikan, ini menghasilkan 1.000.000 pembacaan dari WAL EMR untuk operasi pemulihan HBase. Aplikasi Anda melakukan penskalaan untuk memberikan pengalaman yang mulus bagi pengguna Anda. Kemudian, secara perlahan, aplikasi Anda memiliki pola lalu lintas yang lebih teratur yaitu 50.000 tulis setiap hari hingga akhir bulan.
Tabel berikut ini merangkum total penggunaan Anda untuk bulan tersebut.
Jangka waktu (Hari dalam Bulan) | Total Tulis | Total Baca | Penggunaan EMR WAL |
1 - 10 | 100.000 tulis (10.000 tulis x 10 hari) | ||
11 | 2.500.000 tulis | 1.000.000 baca | |
12 - 30 | 950.000 tulis (50.000 tulis x 19 hari) | ||
Total Bulanan | 3.550.000 tulis | 1.000.000 baca | |
Tagihan bulanan | 0,30 USD (0,0883 USD per GiB Permintaan Tulis WAL EMR x 3,55 juta KiB tulis/1048576 KiB/GiB) | 0,08 USD (0,0883 USD per GiB Permintaan Baca WAL EMR x 1 juta KiB baca/1048576 KiB/GiB) | 25,92 USD (0,0018 USD per WAL per Jam Penggunaan WAL EMR X penggunaan 10 Tabel HBase X 2 wilayah HBase per Tabel HBase X 1 WAL per wilayah HBase X 30 hari X 24 jam atau penggunaan 14.400 EMR-WAL-WALHours) |
Untuk bulan tersebut, tagihan Anda akan menjadi 26,52 USD, total yang mencakup 0,38 USD untuk ReadRequestGiB dan WriteRequestGiB, dan 25,92 USD untuk EMR-WAL-WALHours.
Sumber daya harga tambahan
Hitung biaya bulanan Anda dengan mudah dengan AWS
Hubungi spesialis AWS untuk mendapatkan penawaran yang dipersonalisasi