Mengapa harus AWS Glue?
Mempersiapkan data Anda untuk mendapatkan hasil yang berkualitas merupakan langkah pertama dalam proyek analitik atau ML. AWS Glue adalah layanan integrasi data nirserver yang membuat persiapan data menjadi lebih sederhana, lebih cepat, dan lebih murah. Anda dapat menemukan dan terhubung ke lebih dari 100 sumber data yang berbeda, mengelola data dalam katalog data terpusat, dan membuat, menjalankan, serta memantau pipeline ETL secara visual untuk memuat data ke danau data. Dengan kemampuan AI generatif bawaan, Anda dapat memodernisasi tugas Spark dan berkembang lebih cepat dengan asisten cerdas untuk pembuatan ETL dan pemecahan masalah Spark.
Pengantar AWS Glue (01:54)

Keuntungan AWS Glue

Dukungan fleksibel untuk ETL, ELT, batch, streaming, dan lainnya, tanpa penguncian
Skala petabita, tagihan yang berbasis bayar sesuai penggunaan, beragam ukuran data
Mendukung semua pengguna data, mulai dari developer hingga pengguna bisnis
Dapatkan bantuan yang ditenagai AI sepanjang perjalanan integrasi data Anda—mulai dari membuat kode ETL secara otomatis hingga memodernisasi tugas Spark Anda. AWS Glue menyediakan pembuatan kode cerdas, peningkatan Spark dengan bantuan AI (pratinjau), dan pemecahan masalah Spark bawaan (pratinjau).
Kemampuan integrasi data lengkap dalam satu layanan nirserver

Cara kerja

AWS Glue adalah layanan integrasi data nirserver yang memudahkan untuk menemukan, menyiapkan, memindahkan, dan mengintegrasikan data dari berbagai sumber untuk analitik, machine learning (ML), dan pengembangan aplikasi.

  • Opsi mesin integrasi data
  • Pilih mesin integrasi data yang Anda inginkan di AWS Glue untuk mendukung pengguna dan beban kerja Anda.

    Diagram menunjukkan beberapa opsi mesin pemrosesan data untuk AWS Glue.
  • ETL yang didorong peristiwa
  • AWS Glue dapat menjalankan tugas extract, transform, and load (ETL) Anda saat data baru tiba. Misalnya, Anda dapat mengonfigurasi AWS Glue untuk memulai tugas ETL agar berjalan segera setelah data baru tersedia di Amazon Simple Storage Service (S3).

    Diagram yang menunjukkan bagaimana AWS Glue dapat menjalankan tugas ETL Anda saat data baru tiba.
  • Katalog Data AWS Glue
  • Anda dapat menggunakan Katalog Data untuk menemukan dan mencari beberapa set data AWS dengan cepat tanpa memindahkan data. Setelah data dimasukkan dalam katalog, data langsung tersedia untuk pencarian dan kueri menggunakan Amazon Athena, Amazon EMR, dan Amazon Redshift Spectrum.

    Diagram yang menunjukkan Katalog Data menemukan dan mencari set data tanpa memindahkan data.
  • Tugas ETL tanpa kode
  • AWS Glue Studio memudahkan untuk membuat, menjalankan, dan memantau tugas ETL AWS Glue secara visual. Anda dapat membangun tugas ETL yang memindahkan dan mentransformasi data menggunakan editor seret dan letakkan, dan AWS Glue secara otomatis menghasilkan kode.

    Diagram yang menunjukkan bagaimana pengguna dapat menyusun tugas ETL yang memindahkan dan mentransformasi data menggunakan editor seret-dan-letakkan.
  • Kelola dan pantau kualitas data
  • AWS Glue Data Quality mengotomatisasi pembuatan aturan, manajemen, dan pemantauan kualitas data untuk memastikan data berkualitas tinggi di semua danau data dan pipeline Anda.

    Diagram menunjukkan bagaimana AWS Glue Data Quality secara otomatis mengukur, memantau, dan mengelola kualitas data yang ada di danau data dan pipeline data.
  • Persiapan data
  • Dengan AWS Glue DataBrew, Anda dapat menjelajahi dan bereksperimen dengan data secara langsung dari danau data, gudang data, dan basis data, termasuk Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora, dan Amazon Relational Database Service (RDS). Anda dapat memilih lebih dari 250 transformasi yang dibuat sebelumnya di DataBrew untuk mengotomatiskan tugas persiapan data seperti memfilter anomali, menstandardisasi format, dan mengoreksi nilai yang tidak valid.

    Selain itu, AWS Glue Studio menawarkan alat persiapan data yang memungkinkan Anda menyiapkan data dengan antarmuka visual interaktif tunjuk-dan-klik tanpa menulis kode.

    Diagram yang menunjukkan cara DataBrew mengotomatiskan tugas persiapan data untuk pengguna.

Kasus Penggunaan

Sederhanakan manajemen pipeline ETL

Hapus manajemen infrastruktur dengan penyediaan otomatis dan manajemen pekerja, serta gabungkan semua kebutuhan integrasi data Anda ke dalam satu layanan.

Mendukung berbagai kerangka kerja dan beban kerja pemrosesan

Lebih mudah mendukung berbagai kerangka kerja pemrosesan data, seperti ETL dan ELT, serta beragam beban kerja, termasuk batch, mikro batch, dan streaming.

Jelajahi, lakukan eksperimen, dan proses data secara interaktif

Dengan menggunakan sesi interaktif AWS Glue, teknisi data dapat secara interaktif menjelajahi dan mempersiapkan data menggunakan lingkungan pengembangan terintegrasi (IDE) atau notebook pilihan mereka.

Temukan data secara efisien

Identifikasi data di AWS, on-premise, dan cloud lainnya dengan cepat, lalu sediakan data tersebut secara instan untuk pembuatan kueri serta transformasi.

Yang baru

  • Tanggal (Terbaru hingga Terlama)
Hasil tidak ditemukan
1

Jelajahi selengkapnya tentang AWS