Amazon EMR Nirserver

Jalankan aplikasi big data menggunakan kerangka kerja sumber terbuka tanpa perlu mengelola klaster dan server

Mengapa harus EMR Nirserver?

Amazon EMR Nirserver adalah opsi nirserver di Amazon EMR yang memudahkan analis dan rekayasawan data untuk menjalankan kerangka kerja analitik big data sumber terbuka tanpa perlu mengonfigurasi, mengelola, dan menskalakan klaster atau server. Anda mendapatkan semua fitur dan keuntungan Amazon EMR tanpa perlu memiliki seorang ahli untuk merencanakan dan mengelola klaster.

Manfaat

Pilih kerangka kerja sumber terbuka yang ingin Anda jalankan untuk aplikasi, seperti Apache Spark serta Apache Hive, dan EMR Nirserver akan secara otomatis menyediakan serta mengelola sumber daya komputasi dan memori dasarnya.
Jalankan beban kerja analitik pada skala apa pun dengan penskalaan sesuai permintaan otomatis yang mengubah ukuran sumber daya dalam hitungan detik untuk memenuhi volume data dan kebutuhan pemrosesan yang terus berubah.
EMR Nirserver secara otomatis menaikkan dan menurunkan skala sumber daya untuk menyediakan jumlah kapasitas yang tepat untuk aplikasi Anda. Anda hanya perlu membayar sebesar penggunaan, dan Anda tidak perlu terlalu khawatir dengan penyediaan yang berlebih atau kurang.

Cara kerjanya

1

Buat aplikasi Anda

Pilih kerangka kerja sumber terbuka dan versi yang ingin Anda gunakan.

2

Kirim pekerjaan

Kirimkan pekerjaan ke aplikasi Anda melalui API atau EMR Studio. Anda juga dapat mengirimkan pekerjaan menggunakan layanan orkestrasi alur kerja seperti Apache Airflow atau Amazon Managed Workflows for Apache Airflow.

3

Pekerjaan debug

Gunakan alat sumber terbuka yang biasa Anda digunakan seperti Spark UI dan Tez UI untuk melakukan pemantauan dan debug pekerjaan.

Kasus Penggunaan

Seiring dengan perubahan tuntutan beban kerja, skalakan sumber daya aplikasi dengan lancar, tanpa harus mengonfigurasi terlebih dahulu berapa banyak daya komputasi dan memori yang Anda butuhkan.
Pilih opsi untuk melakukan inisialisasi awal sumber daya aplikasi dan mengaktifkan waktu respons dalam hitungan detik untuk pipeline data yang diatur oleh SLA.
Jalankan lingkungan pengembangan dan pengujian dengan cepat dan mudah, skalakan secara otomatis dengan penggunaan yang tidak terduga, dan masukkan produk ke pasar dengan lebih cepat.