Harga Amazon Bedrock

Ikhtisar harga

Amazon Bedrock adalah layanan terkelola penuh yang menawarkan pilihan model fondasi (FM) dengan performa tinggi melalui satu API, bersama dengan serangkaian kemampuan luas yang Anda butuhkan untuk membangun aplikasi AI generatif dengan keamanan, privasi, dan AI yang bertanggung jawab.

Dengan Amazon Bedrock, Anda akan dikenai biaya untuk inferensi dan kustomisasi model. Anda memiliki pilihan dua paket harga untuk inferensi: 1. Sesuai Permintaan dan Batch: Mode ini memungkinkan Anda menggunakan FM berdasarkan bayar sesuai pemakaian tanpa harus membuat komitmen jangka waktu berbasis waktu. 2. Throughput yang Disediakan: Mode ini memungkinkan Anda menyediakan throughput yang cukup untuk memenuhi persyaratan performa aplikasi Anda sebagai ganti komitmen jangka waktu berbasis waktu.

Model Harga

Dengan mode On-Demand, Anda hanya membayar untuk apa yang Anda gunakan, tanpa komitmen periode berbasis waktu. Untuk model pembuatan teks, Anda dikenai biaya untuk setiap token input yang diproses dan setiap token output yang dihasilkan. Untuk model penyematan, Anda dikenai biaya untuk setiap token input yang diproses. Token terdiri dari beberapa karakter dan mengacu pada unit dasar teks yang dipelajari model untuk memahami input dan perintah pengguna. Untuk model pembuatan gambar, Anda dikenai biaya untuk setiap gambar yang dihasilkan.

Inferensi lintas wilayah: Mode Sesuai Permintaan juga mendukung inferensi lintas wilayah untuk beberapa model. Hal ini memungkinkan developer mengelola semburan lalu lintas tanpa kendala dengan memanfaatkan komputasi di berbagai AWS Region dan mendapatkan batas throughput yang lebih tinggi serta ketahanan yang ditingkatkan. Tidak ada biaya tambahan untuk menggunakan inferensi lintas wilayah dan harga dihitung berdasarkan wilayah tempat Anda membuat permintaan (wilayah sumber).

Dengan mode Batch, Anda dapat memberikan satu set perintah sebagai file input tunggal dan menerima tanggapan sebagai file output tunggal sehingga memungkinkan Anda mendapatkan prediksi skala besar secara simultan. Tanggapan diproses dan disimpan di bucket Amazon S3 sehingga Anda dapat mengaksesnya pada lain waktu. Amazon Bedrock menawarkan model fondasi (FM) terpilih dari penyedia AI terkemuka seperti Anthropic, Meta, Mistral AI, dan Amazon untuk inferensi batch dengan harga 50% lebih rendah dibandingkan dengan harga inferensi sesuai permintaan. Lihat daftar model di sini.

Inferensi latensi yang dioptimalkan untuk model fondasi di Amazon Bedrock memberikan waktu respons lebih cepat untuk model dan membantu meningkatkan keresponsifan untuk aplikasi AI generatif Anda. Anda dapat menggunakan inferensi latensi yang dioptimalkan untuk model Claude 3.5 Haiku Anthropic, dan model Llama 3.1 405B dan 70B Meta. Seperti yang diverifikasi oleh Anthropic, dengan inferensi latensi yang dioptimalkan di Amazon Bedrock, Claude 3.5 Haiku berjalan lebih cepat di AWS dibandingkan di tempat lain. Selain itu, dengan inferensi latensi yang dioptimalkan di Bedrock, Llama 3.1 405B dan 70B berjalan lebih cepat di AWS dibandingkan penyedia cloud besar lainnya. Pelajari selengkapnya di sini.

Dengan mode Provisioned Throughput, Anda dapat membeli unit model untuk model dasar atau khusus tertentu. Mode Provisioned Throughput terutama dirancang untuk beban kerja inferensi konsisten besar yang membutuhkan throughput yang terjamin. Model khusus hanya dapat diakses menggunakan Provisioned Throughput. Unit model menyediakan throughput tertentu, yang diukur dengan jumlah maksimum token input atau output yang diproses setiap menitnya. Dengan harga Provisioned Throughput, Anda dikenai biaya per jam, dan memiliki fleksibilitas untuk memilih antara periode komitmen 1 bulan atau 6 bulan.

Impor Model Kustom memungkinkan Anda untuk memanfaatkan investasi yang telah Anda lakukan untuk kustomisasi model sebelumnya di Amazon Bedrock dan menggunakannya dengan cara yang sepenuhnya dikelola seperti model fondasi yang di-hosting Bedrock yang sudah ada. Anda dapat mengimpor bobot khusus untuk arsitektur model yang didukung dan menyajikan model kustom menggunakan mode Sesuai Permintaan. Tidak ada biaya untuk mengimpor model kustom ke Bedrock. Setelah mengimpor model, Anda akan dapat mengaksesnya sesuai permintaan tanpa perlu melakukan tindakan bidang kontrol apa pun. Anda hanya dikenai biaya untuk inferensi model, berdasarkan jumlah salinan model kustom yang diperlukan untuk melayani volume inferensi Anda dan durasi setiap salinan model aktif, ditagih dalam periode 5 menit. Salinan model adalah instans tunggal dari model yang diimpor yang siap melayani permintaan inferensi. Harga per salinan model per menit tergantung pada faktor-faktor, seperti arsitektur, panjang konteks, AWS Region, versi unit komputasi (pembuatan perangkat keras), dan berjenjang berdasarkan ukuran salinan model.

Amazon Bedrock Marketplace memungkinkan Anda untuk menemukan, menguji, dan menggunakan lebih dari 100 model fondasi yang populer, baru, dan khusus di Bedrock. Model Amazon Bedrock Marketplace di-deploy ke titik akhir tempat Anda dapat memilih jumlah instans dan tipe instans yang diinginkan serta mengonfigurasi kebijakan penskalaan otomatis untuk memenuhi tuntutan beban kerja Anda. Untuk model eksklusif, Anda akan dikenai harga perangkat lunak yang ditetapkan oleh penyedia model (per jam, dapat ditagih dengan kenaikan per detik, atau per permintaan) dan harga infrastruktur berdasarkan instans yang Anda pilih. Anda dapat melihat harga ini sebelum berlangganan model penyedia dan juga dari daftar model di AWS Marketplace. Untuk model yang tersedia untuk umum, Anda hanya dikenai biaya infrastruktur berdasarkan instans yang Anda pilih. Pelajari selengkapnya di sini.

Kustomisasi dan Optimasi

Dengan Amazon Bedrock, Anda dapat menyesuaikan FM dengan data Anda untuk memberikan respons yang disesuaikan untuk tugas tertentu dan konteks bisnis Anda. Anda dapat menyempurnakan model dengan data berlabel atau menggunakan prapelatihan lanjutan dengan data tanpa label. Untuk penyesuaian model pembuatan teks, Anda dikenai biaya untuk pelatihan model berdasarkan jumlah total token yang diproses oleh model (jumlah token dalam korpus data pelatihan x jumlah epoch), dan untuk penyimpanan model yang dikenai biaya per bulan per model. Epoch mengacu pada satu pass penuh melalui set data pelatihan Anda selama penyempurnaan atau prapelatihan lanjutan. Inferensi menggunakan model khusus dikenai biaya berdasarkan paket Provisioned Throughput, dan mengharuskan Anda membeli Provisioned Throughput. Satu unit model tersedia tanpa periode komitmen untuk inferensi pada model yang disesuaikan. Anda akan dikenai biaya untuk jumlah jam unit model pertama yang Anda gunakan untuk inferensi model khusus. Jika Anda ingin meningkatkan throughput melebihi satu unit model, Anda harus membeli periode komitmen 1 bulan atau 6 bulan.

Dengan Distilasi Model Amazon Bedrock, Anda hanya perlu membayar apa yang Anda gunakan. Pembuatan data sintetis dikenai harga sesuai permintaan untuk model guru yang dipilih. Penyempurnaan model siswa dikenai biaya pada tingkat kostumisasi model. Karena model distilasi adalah model kustom, inferensi yang menggunakan model kustom dikenai biaya berdasarkan paket Throughput yang Disediakan dan mengharuskan pelanggan untuk membeli Throughput yang Disediakan.

Dengan caching prompt di Amazon Bedrock, Anda dapat meng-cache konteks berulang di seluruh panggilan API untuk mengurangi biaya dan latensi respons Anda. Prompt sering kali berisi konteks atau awalan umum seperti percakapan panjang dengan banyak giliran, contoh dengan banyak bidikan, serta instruksi terperinci yang menyempurnakan perilaku model. Dengan menggunakan API Amazon Bedrock yang ada, Anda dapat menentukan awalan prompt yang akan Anda cache selama lima menit dalam cache untuk akun AWS tertentu. Selama waktu tersebut, setiap permintaan dengan awalan yang cocok menerima diskon hingga 90% untuk token yang disimpan dan peningkatan latensi hingga 85%. Harga dan peningkatan performa bervariasi menurut model dan panjang prompt, tetapi cache selalu diisolasi ke akun AWS Anda.

Alat

Pagar Pembatas Amazon Bedrock membantu Anda menerapkan perlindungan khusus dan kebijakan AI yang bertanggung jawab untuk aplikasi AI generatif Anda. Pagar Pembatas ini memberikan perlindungan keamanan tambahan yang dapat disesuaikan di atas perlindungan native yang ditawarkan oleh FM. Pagar Pembatas ini adalah satu-satunya kemampuan AI yang bertanggung jawab yang ditawarkan oleh penyedia cloud utama dan memungkinkan pelanggan untuk membangun serta menyesuaikan perlindungan keamanan, privasi, dan kebenaran untuk aplikasi AI generatif mereka dalam satu solusi, dan berfungsi dengan semua FM di Amazon Bedrock, serta model yang disempurnakan. Pagar Pembatas Bedrock juga dapat diintegrasikan dengan Agen Amazon Bedrock dan Basis Pengetahuan Amazon Bedrock untuk membangun aplikasi AI generatif yang selaras dengan kebijakan AI yang bertanggung jawab milik Anda. Selain itu, Pagar Pembatas Amazon Bedrock menawarkan API ApplyGuardrail untuk membantu evaluasi input pengguna dan respons model yang dihasilkan oleh FM kustom atau pihak ketiga di luar Bedrock.

Basis Pengetahuan Amazon Bedrock adalah alur kerja Retrieval-Augmented Generation (RAG) terkelola penuh yang memungkinkan pelanggan untuk membuat aplikasi AI generatif yang sangat akurat, berlatensi rendah, aman, dan kustom dengan memasukkan informasi kontekstual dari sumber data mereka sendiri. Basis Pengetahuan ini mendukung berbagai sumber data, termasuk S3, Confluence, Salesforce, dan SharePoint, dalam pratinjau. Basis Pengetahuan ini juga menawarkan penyerapan dokumen untuk streaming data. Basis Pengetahuan Bedrock mengonversi data tidak terstruktur menjadi sematan, menyimpannya dalam basis data vektor, dan memungkinkan pengambilan dari beragam penyimpanan data. Basis Pengetahuan ini juga terintegrasi dengan Kendra untuk pengambilan terkelola dan mendukung pengambilan data terstruktur dengan menggunakan bahasa alami ke SQL.

Otomatisasi Data Amazon Bedrock mentransformasi konten multimodal yang tidak terstruktur menjadi format data terstruktur untuk kasus penggunaan seperti pemrosesan dokumen cerdas, analisis video, dan RAG. Otomatisasi Data Bedrock dapat menghasilkan konten Output Standar dengan menggunakan default yang telah ditentukan yang spesifik untuk modalitas tertentu, seperti deskripsi video adegan demi adegan, transkrip audio, atau analisis dokumen otomatis. Pelanggan juga dapat membuat Output Kustom dengan menentukan persyaratan output mereka di Cetak biru berdasarkan skema data mereka sendiri yang kemudian dapat dengan mudah dimuat ke basis data atau gudang data yang ada. Melalui integrasi dengan Basis Pengetahuan, Otomatisasi Data Bedrock juga dapat digunakan untuk menguraikan konten untuk aplikasi RAG, meningkatkan akurasi dan relevansi hasil dengan memasukkan informasi yang disematkan baik dalam gambar maupun teks.

Agen Amazon Bedrock menawarkan kemampuan untuk membangun dan mengonfigurasi agen otonom dalam aplikasi Anda. Agen ini terhubung ke sumber data perusahaan Anda dengan aman dan menambah permintaan pengguna dengan informasi yang tepat untuk menghasilkan respons yang akurat. Anda dapat membuat aplikasi satu agen atau multiagen di Amazon Bedrock hanya dengan beberapa langkah cepat, sehingga mempercepat waktu yang diperlukan untuk membangun aplikasi AI generatif. Agen ini mendukung interpretasi kode untuk menghasilkan dan mengeksekusi kode serta pengembalian kontrol secara dinamis, yang memungkinkan Anda untuk menentukan skema tindakan dan mendapatkan kontrol kembali setiap kali agen menginvokasi tindakan. Selain itu, Agen Amazon Bedrock dapat mempertahankan memori di seluruh interaksi, dengan menawarkan pengalaman pengguna yang lebih personal dan lancar.

Alur Amazon Bedrock adalah fitur penulisan dan eksekusi alur kerja Bedrock untuk aplikasi AI generatif. Alur Amazon Bedrock mempercepat pembuatan, pengujian, dan deployment alur kerja AI generatif yang ditentukan pengguna melalui builder visual yang intuitif dan serangkaian API. Alur Amazon Bedrock memungkinkan Anda menghubungkan model fondasi terbaru, Prompt, Agen, Basis Pengetahuan, Pagar Pembatas, dan layanan AWS (seperti Amazon Lex, AWS Lambda, Amazon S3) beserta logika bisnis dengan lancar untuk membangun alur kerja AI generatif. Anda dapat dengan mudah menguji dan membuat versi alur kerja Anda, dan menjalankannya di lingkungan nirserver yang aman melalui antarmuka visual atau API tanpa harus membangun infrastruktur Anda sendiri.

Model Evaluasi: Dengan evaluasi model Amazon Bedrock, Anda membayar untuk apa yang Anda gunakan, tanpa komitmen volume minimum pada jumlah prompt atau respons. Untuk evaluasi otomatis (terprogram), Anda hanya membayar inferensi dari model pilihan Anda dalam evaluasi. Skor algoritmik yang dihasilkan secara otomatis disediakan tanpa biaya tambahan. Selama Pratinjau Publik untuk evaluasi otomatis (Model/LLM-as-a-Judge), Anda hanya membayar inferensi dari model generator dan model evaluator pilihan Anda. Dalam tugas evaluasi model LLM-as-a-judge, metrik bawaan menggunakan templat prompt penilaian sistem yang unik untuk setiap metrik dan model penilaian yang tersedia yang akan dibebankan sebagai bagian dari penggunaan token Anda, dan prompt penilaian tersedia di dokumentasi AWS publik sebagai bentuk transparansi. Untuk evaluasi berbasis manusia di mana Anda membawa tim kerja Anda sendiri, Anda dikenakan biaya untuk inferensi model dalam evaluasi, dan biaya 0,21 USD per tugas manusia yang diselesaikan. Tugas manusia didefinisikan sebagai instans ketika pekerja manusia mengirimkan evaluasi atas satu perintah dan respons inferensi terkait di antarmuka pengguna evaluasi manusia. Harganya sama baik Anda memiliki satu maupun dua model dalam pekerjaan evaluasi Anda dan juga sama terlepas dari berapa banyak metrik evaluasi dan metode penilaian yang Anda sertakan. Biaya untuk tugas manusia akan muncul di bagian Amazon SageMaker di tagihan AWS Anda dan sama untuk semua Wilayah AWS. Tidak ada biaya terpisah untuk tenaga kerja, karena tenaga kerja tersebut disediakan oleh Anda. Untuk evaluasi yang dikelola AWS, harga disesuaikan dengan kebutuhan evaluasi Anda dalam keterlibatan pribadi saat bekerja dengan tim evaluasi ahli AWS.

Evaluasi Basis Pengetahuan Amazon Bedrock (evaluasi RAG): Dengan Evaluasi Basis Pengetahuan Amazon Bedrock (evaluasi RAG), Anda membayar untuk apa yang Anda gunakan, tanpa komitmen volume minimum pada jumlah prompt atau respons. Selama Pratinjau Publik, Anda hanya membayar inferensi dari model generator dan model evaluator pilihan Anda (tugas evaluasi menggunakan LLM-as-a-Judge), serta setiap biaya yang timbul atas penggunaan Basis Pengetahuan dalam tugas evaluasi sesuai dengan harga Basis Pengetahuan Amazon Bedrock. Dalam tugas Evaluasi Basis Pengetahuan (Evaluasi RAG), metrik bawaan menggunakan templat prompt penilaian sistem yang unik untuk setiap metrik dan model penilaian yang tersedia yang akan dibebankan sebagai bagian dari penggunaan token Anda, dan prompt penilaian tersedia di dokumentasi AWS publik sebagai bentuk transparansi. Beberapa metrik melakukan penilaian terhadap inferensi model pada konteks yang diambil dari Basis Pengetahuan Anda atau jawaban ground truth Anda di samping prompt input, yang memengaruhi biaya yang terkait dengan setiap metrik - informasi selengkapnya mengenai setiap metrik dapat ditemukan di dokumentasi AWS publik untuk evaluasi.

Detail harga

Harga tergantung pada modalitas, penyedia, dan model. Pilih penyedia model untuk melihat harga terperinci.

Amazon Bedrock menawarkan model fondasi (FM) terpilih dari penyedia AI terkemuka, seperti Anthropic, Meta, Mistral AI, dan Amazon untuk inferensi batch dengan harga 50% lebih rendah dibandingkan dengan harga inferensi sesuai permintaan. Lihat daftar model di sini.

  • AI21 Labs
  • AI21 Labs

    Harga Sesuai Permintaan

    Model AI21 Labs Harga per 1.000 token input Harga per 1.000 token output
    Jamba 1.5 Large 0,002 USD 0,008 USD
    Jamba 1.5 Mini 0,0002 USD 0,0004 USD
    Jurassic-2 Mid 0,0125 USD 0,0125 USD
    Jurassic-2 Ultra 0,0188 USD 0,0188 USD
    Jamba-Instruct 0,0005 USD 0,0007 USD
  • Amazon
    • Amazon Nova
    • Amazon Nova

      Harga untuk Model Pemahaman

      Harga untuk model Pembuatan Konten Kreatif

    • Amazon Titan
    • Amazon Titan

    • Amazon Lainnya
  • Anthropic
  • Anthropic

    Harga Sesuai Permintaan dan Batch

    Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Harga per 1.000 token input (penulisan cache) Harga per 1.000 token input (pembacaan cache)

    Claude 3.5 Sonnet**
     

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    0,00375 USD

    0,0003 USD

    Claude 3.5 Haiku
     

    0,0008 USD

    0,004 USD

    0,0005 USD

    0,0025 USD

    0,001 USD

    0,00008 USD

    Claude 3 Opus*
     

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

    NA

    NA

    Claude 3 Haiku
     

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    NA

    NA

    Claude 3 Sonnet
     

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    NA

    NA

    Claude 2.1
     

    0,008 USD

    0,024 USD

    NA

    NA

    NA

    NA

    Claude 2.0
     

    0,008 USD

    0,024 USD

    NA

    NA

    NA

    NA

    Claude Instant
     

    0,0008 USD

    0,0024 USD

    NA

    NA

    NA

    NA
    *Claude 3 Opus saat ini tersedia di Wilayah AS Barat (Oregon)
    **Harga untuk Claude 3.5 Sonnet berlaku untuk setiap versi Claude 3.5 Sonnet (v1 dan v2) - Claude 3.5 Sonnet v2 saat ini tersedia di Wilayah AS Barat (Oregon)
    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch) Harga per 1.000 token input (penulisan cache) Harga per 1.000 token input (pembacaan cache)

    Claude 3.5 Sonnet**

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    0,00375 USD 0,0003 USD

    Claude 3.5 Haiku

    0,001 USD

    0,005 USD

    0,0005 USD

    0,0025 USD

    0,001 USD 0,00008 USD

    Claude 3 Opus*

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

       

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

       

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

       

    Claude 2.1

    0,008 USD

    0,024 USD

    N/A

    N/A

       

    Claude 2.0

    0,008 USD

    0,024 USD

    N/A

    N/A

       

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/A

    N/A

       
    *Claude 3 Opus saat ini tersedia di Wilayah AS Barat (Oregon)    
    **Harga untuk Claude 3.5 Sonnet berlaku untuk setiap versi Claude 3.5 Sonnet (v1 dan v2) - Claude 3.5 Sonnet v2 saat ini tersedia di Wilayah AS Barat (Oregon)    

    Wilayah: Eropa (London)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD 0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Wilayah: Eropa (Zürich)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Wilayah: Amerika Selatan (Sao Paulo)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Wilayah: Kanada (Pusat)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Wilayah: Asia Pasifik (Mumbai)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Wilayah: Asia Pasifik (Sydney)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Wilayah: Asia Pasifik (Tokyo)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/A

     

    N/A

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/A

    N/A

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Wilayah: Asia Pasifik (Singapura)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude Instant

    0,0008 USD

    0,0024 USD

    0,0004 USD

     

    0,0012 USD

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    0,004 USD

     

    0,012 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/A

    N/A

    Wilayah: Eropa (Paris)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Wilayah: Eropa (Frankfurt)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude Instant

    0,0008 USD

    0,0024 USD

    N/A

    N/A

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    N/A

    N/A

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Wilayah: Asia Pasifik (Seoul)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/A

     

    N/A

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/A

     

    N/A

    Wilayah: AS Timur (Ohio)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output Harga per 1,000 token input (batch) Harga per 1.000 token output (batch)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    N/A

     

    N/A

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    N/A

     

    N/A

    Wilayah: AWS GovCloud (AS-Barat) & AWS GovCloud (AS-Timur)

    Model Anthropic Harga per 1.000 token input Harga per 1.000 token output

    Claude 3.5 Sonnet

    0,0036 USD

    0,018 USD

    Claude 3 Haiku

    0,0003 USD

    0,0015 USD

    Inferensi yang Dioptimalkan Latensi

    Wilayah: AS Timur (Ohio)

      Harga per 1.000 token input Harga per 1.000 token output
    Claude 3.5 Haiku 0,001 USD 0,005 USD

    Harga Throughput yang Disediakan

    Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

    Model Anthropic Harga per jam per model dengan
    tidak ada komitmen
    Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Model Anthropic Harga per jam per model dengan
    tidak ada komitmen
    Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Wilayah: Asia Pasifik (Tokyo)

    Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

    Claude Instant

    53,00 USD

    29,00 USD

    Claude 2.0/2.1

    86,00 USD

    48,00 USD

    Wilayah: Eropa (Frankfurt)

    Model Anthropic Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

    Claude Instant

    49,00 USD

    27,00 USD

    Claude 2.0/2.1

    79,00 USD

    44,00 USD

    Silakan hubungi tim akun AWS Anda untuk detail selengkapnya tentang unit model. 

     

  • Cohere
  • Cohere

    Harga Sesuai Permintaan

    Model Cohere Harga per 1.000 token input Harga per 1.000 token output
    Command 0,0015 USD 0,0020 USD
    Command-Light 0,0003 USD 0,0006 USD
    Command R+ 0,0030 USD 0,0150 USD
    Command R 0,0005 USD 0,0015 USD
    Sematkan - Bahasa Inggris 0,0001 USD N/A
    Embed - Multilingual 0,0001 USD N/A
    Model Cohere Harga per 1.000 kueri**
    Rerank 3.5 2,00 USD
    **Anda dikenakan biaya untuk jumlah kueri di mana kueri dapat berisi hingga 100 potongan dokumen. Jika kueri berisi lebih dari 100 potongan dokumen, itu dihitung sebagai beberapa kueri. Misalnya, jika permintaan berisi 350 dokumen, itu akan diperlakukan sebagai 4 kueri. Perhatikan bahwa setiap dokumen hanya dapat berisi hingga 500 token (termasuk kueri dan token total dokumen), dan jika panjang token lebih tinggi dari 512 token, itu dipecah menjadi beberapa dokumen.

    Harga untuk kustomisasi (penyempurnaan)

    Model Cohere Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus per bulan Harga untuk inferensi model khusus per unit model per jam (dengan harga Provisioned Throughput tanpa komitmen)

    Cohere Command

    0,004 USD

    1,95 USD

    49,50 USD

    Cohere Command-Light 0,001 USD

    1,95 USD

    8,56 USD

    *Total token yang dilatih = jumlah token dalam korpus data pelatihan x jumlah epoch

    Harga Provisioned Throughput

    Model Cohere Harga per jam per model 
    tanpa komitmen
    Harga per jam per unit model untuk komitmen 1 bulan

    Harga per jam per unit model untuk komitmen 6 bulan

    Cohere Command

    49,50 USD

    39,60 USD

    23,77 USD

    Cohere Command - Light 8,56 USD

    6,85 USD

    4,11 USD
    Sematkan - Bahasa Inggris 7,12 USD

    6,76 USD

    6,41 USD
    Embed - Multibahasa 7,12 USD

    6,76 USD

    6,41 USD

    Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model. 

  • Meta Llama
  • Meta Llama

    Llama 3.3

    Harga Sesuai Permintaan dan Batch

    Llama 3.2

    Harga Sesuai Permintaan dan Batch

    Llama 3.1

    Harga Sesuai Permintaan dan Batch

    Harga untuk kustomisasi model (penyempurnaan)

    Harga Throughput yang Disediakan

    Llama 3

    Harga Sesuai Permintaan 

    Llama 2

    Harga Sesuai Permintaan 

    Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

    Model Meta Harga per 1.000 token input Harga per 1.000 token output

    Llama 2 Chat (13B)

    0,00075 USD

    0,001 USD

    Llama 2 Chat (70B)

    0.00195 USD

    0,00256 USD

    Harga untuk kustomisasi model (penyempurnaan)

    Model Meta Harga untuk melatih 1.000 token Harga untuk menyimpan setiap model khusus* per bulan Harga untuk inferensi model khusus untuk 1 unit model per jam (dengan harga Provisioned Throughput tanpa komitmen)

    Llama 2 Pretrained (13B)

    0,00149 USD

    1,95 USD

    23,50 USD

    Llama 2 Pretrained (70B)

    0,00799 USD

    1,95 USD 23,50 USD

    *Penyimpanan model khusus = 1,95 USD

    Harga Provisioned Throughput

    Model Meta Harga per jam per unit model untuk komitmen 1 bulan Harga per jam per unit model untuk komitmen 6 bulan

    Llama 2 Pretrained and Chat (13B)

    21,18 USD

    13,08 USD

    Llama 2 Pretrained (70B)

    21,18 USD

    13,08 USD

    *Model Llama 2 Pre-trained hanya tersedia dalam provisioned throughput setelah penyesuaian.

    Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    Harga Sesuai Permintaan

    Model Stabilty AI Harga per gambar yang dihasilkan
    Stable Diffusion 3.5 Large 0,08 USD
    Stable Image Core 0,04 USD
    Stable Diffusion 3 Large 0,08 USD
    Stable Image Ultra 0,14 USD

    Generasi sebelumnya dari model gambar yang ditawarkan oleh Stability AI dihargai per gambar, tergantung pada jumlah langkah dan resolusi gambar.

    Model Stabilty AI Resolusi gambar Harga per gambar yang dihasilkan untuk kualitas standar (<=50 langkah) Harga per gambar yang dihasilkan untuk kualitas premium (>50 langkah)
    SDXL 1.0 Hingga 1024 x 1024 0,04 USD 0,08 USD

    Harga Provisioned Throughput

    Model Stabilty AI Harga per jam per unit model untuk komitmen 1 bulan* Harga per jam per unit model untuk komitmen 6 bulan*

    SDXL 1.0

    49,86 USD

    46,18 USD

    *Termasuk inferensi untuk model dasar dan khusus

    Hubungi tim akun atau penjualan AWS Anda untuk detail selengkapnya tentang unit model.

    Saat ini, kustomisasi model (penyempurnaan) tidak didukung untuk model Stability AI di Amazon Bedrock.

  • Impor Model Kustom
  • Impor Model Kustom

    • Llama
    • Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

      Versi Unit Model Kustom v1.0
      Harga per Unit Model Kustom per menit* 0,0785 USD
      Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD
       
      Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Sebagai referensi, model Llama 3.1 8B 128K membutuhkan 2 Unit Model Kustom, model Llama 3.1 70B 128k membutuhkan 8 Unit Model Kustom.
      *Ditagih dalam periode 5 menit
    • Llama Multimodal
    • Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

      Versi Unit Model Kustom v1.0
      Harga per Unit Model Kustom per menit* 0,0785 USD
      Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD
       
      Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Llama 3.2 11B 128K membutuhkan 4 Unit Model Kustom.
      *Ditagih dalam periode 5 menit
    • Mistral
    • Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

      Versi Unit Model Kustom v1.0
      Harga per Unit Model Kustom per menit* 0,0785 USD
      Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD
       
      Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Mistral 7B 32K membutuhkan 1 Unit Model Kustom.
      *Ditagih dalam periode 5 menit
    • Mixtral
    • Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

      Versi Unit Model Kustom v1.0
      Harga per Unit Model Kustom per menit* 0,0785 USD
      Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD
       
      Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Mixtral 8x7B 32K membutuhkan 4 Unit Model Kustom.
      *Ditagih dalam periode 5 menit
    • Flan
    • Wilayah: AS Timur (Virginia Utara) dan AS Barat (Oregon)

      Versi Unit Model Kustom v1.0
      Harga per Unit Model Kustom per menit* 0,0785 USD
      Biaya penyimpanan bulanan per Unit Model Kustom 1,95 USD
       
      Unit Model Kustom yang diperlukan untuk melakukan host model bergantung pada berbagai faktor - terutama arsitektur model, jumlah parameter model, dan panjang konteks. Jumlah pasti Unit Model Kustom yang dibutuhkan akan ditentukan saat melakukan impor. Untuk referensi, model Flan-T5 XL 512 membutuhkan 1 Unit Model Kustom. 
      *Ditagih dalam periode 5 menit

    Harga Inferensi Sesuai Permintaan:
    Anda ditagih dalam periode 5 menit selama salinan model Anda aktif, dimulai dari invokasi pertama yang berhasil. Batas throughput dan konkurensi maksimum per salinan model bergantung pada faktor-faktor seperti, campuran token input/output, tipe perangkat keras, ukuran model, arsitektur, optimisasi inferensi, dan ditentukan selama alur kerja impor model.

    Bedrock menskalakan jumlah salinan model secara otomatis tergantung pada pola penggunaan Anda. Jika tidak ada invokasi selama periode 5 menit, Bedrock akan menurunkan skala menjadi nol dan menaikkan kembali skala saat Anda menginvokasi model. Saat menaikkan kembali skala, Anda mungkin mengalami durasi pemulaian dingin (dalam puluhan detik) tergantung pada ukuran model. Bedrock juga menaikkan skala jumlah salinan model jika volume inferensi Anda secara konsisten melebihi batas konkurensi dari satu salinan model. Catatan: Jumlah maksimum default adalah 3 salinan model per akun per model yang diimpor, yang dapat ditingkatkan melalui Service Quotas.

Alat penetapan harga (detail)

  • Flows
  • Amazon Bedrock Flows

    Anda akan dikenakan biaya berdasarkan jumlah transisi simpul yang diperlukan untuk menjalankan aplikasi Anda. Bedrock Flows menghitung transisi simpul setiap kali simpul dalam alur kerja Anda dijalankan. Anda dikenai biaya untuk jumlah total transisi simpul di seluruh alur Anda.

    Semua biaya diukur setiap hari dan ditagih setiap bulan mulai tanggal 1 Februari 2025.

    Harga per 1.000 transisi simpul
    0,035 USD

    Biaya Tambahan

    Anda dapat dikenai biaya tambahan jika eksekusi alur kerja aplikasi Anda memanfaatkan layanan AWS atau transfer data lain. Misalnya, jika alur kerja Anda menginvokasi kebijakan Pagar Pembatas Amazon Bedrock, Anda akan ditagih untuk jumlah unit teks yang diproses oleh kebijakan tersebut. 

  • Basis Pengetahuan
  • Structured Data Retrieval (Pembuatan SQL)

    Structured Data Retrieval dikenakan biaya untuk setiap permintaan untuk menghasilkan kueri SQL. Kueri SQL yang dihasilkan digunakan untuk mengambil data dari penyimpanan data terstruktur.

    Model Rerank

    Model Rerank dirancang untuk meningkatkan relevansi dan akurasi respons dalam aplikasi Retrieval Augmented Generation (RAG). Mereka dikenakan biaya per kueri.

    **Anda dikenakan biaya untuk jumlah kueri di mana kueri dapat berisi hingga 100 potongan dokumen. Jika kueri berisi lebih dari 100 potongan dokumen, itu dihitung sebagai beberapa kueri. Misalnya, jika permintaan berisi 350 dokumen, itu akan diperlakukan sebagai 4 kueri. Perhatikan bahwa setiap dokumen hanya dapat berisi hingga 512 token (termasuk kueri dan token total dokumen), dan jika panjang token lebih tinggi dari 512 token, itu dipecah menjadi beberapa dokumen. Sebuah kueri setara dengan unit pencarian.

  • Pagar Pembatas
  • Pagar Pembatas Amazon Bedrock

    Kebijakan pagar pembatas*

    Harga per 1.000 unit teks**

    Filter konten (konten teks)****

    0,15 USD

    Topik yang ditolak

    0,15 USD

    Pemeriksaan landasan kontekstual***

    0,1 USD

    Filter informasi sensitif (PII)

    0,1 USD

    Filter informasi sensitif (ekspresi reguler) 

    Gratis

    Filter kata

    Gratis

    Harga Sesuai Permintaan

    * Setiap kebijakan pagar pembatas bersifat opsional dan dapat diaktifkan berdasarkan persyaratan aplikasi Anda. Biaya akan dikenakan berdasarkan jenis polis yang digunakan dalam pagar pembatas. Misalnya, jika pagar pembatas dikonfigurasi dengan filter konten dan topik yang ditolak, biaya akan dikenakan untuk kedua kebijakan ini, sementara tidak akan ada biaya yang terkait dengan filter informasi sensitif.

    **Unit teks dapat berisi hingga 1000 karakter. Jika input teks lebih dari 1000 karakter, itu diproses sebagai beberapa unit teks, masing-masing berisi 1000 karakter atau kurang. Misalnya, jika input teks berisi 5600 karakter, itu akan dikenakan biaya untuk 6 unit teks.

    ***Pemeriksaan landasan kontekstual menggunakan sumber referensi dan kueri untuk menentukan apakah respons model didasarkan pada sumber dan relevan dengan kueri. Jumlah total unit teks yang dikenai biaya dihitung dengan menggabungkan semua karakter dalam sumber, kueri, dan respons model.

    **** Harga untuk filter konten untuk mendeteksi dan memfilter konten gambar berbahaya akan diumumkan ketika fitur tersebut tersedia secara umum.

  • Evaluasi Model
  • Evaluasi Model

    Evaluasi model dikenai biaya untuk inferensi dari model pilihan Anda. Skor algoritmik yang dihasilkan secara otomatis disediakan tanpa biaya tambahan. Untuk evaluasi berbasis manusia, saat membawa tim kerja Anda sendiri, Anda dikenai biaya untuk inferensi model dalam evaluasi, dan biaya sebesar 0,21 USD per tugas manusia yang diselesaikan.

    Model

    Harga per 1.000 token input

    Harga per 1.000 token output

    Harga per tugas manusia

     

    Model yang dipilih untuk evaluasi

    Berdasarkan model yang dipilih

    Berdasarkan model yang dipilih

     

    0,21 USD

     
  • Otomatisasi Data
  • Otomatisasi Data

    • Basis Pengetahuan Amazon Bedrock menawarkan integrasi Otomatisasi Data Bedrock untuk memberikan respons yang lebih relevan dan akurat untuk data multimodal. Saat menyiapkan Basis Pengetahuan, Anda dapat memilih Otomatisasi Data Bedrock sebagai metode penguraian Anda untuk menganalisis dan mengekstrak wawasan yang berarti dari gambar atau dokumen, yang dapat mencakup gambar, bagan, dan diagram. Selama pemrosesan, Otomatisasi Data Bedrock mengekstrak informasi yang berarti dari dokumen dan gambar yang dicerna, yang kemudian digunakan dalam langkah-langkah Basis Pengetahuan berikutnya untuk pemotongan, penyematan, dan penyimpanan. Ketika terintegrasi dengan Basis Pengetahuan, Otomatisasi Data Bedrock memberikan dan mengenakan biaya untuk output terstandar.

Contoh harga

  • Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Jurassic-2 Mid AI21 untuk meringkas input sebesar 10 ribu token teks input menjadi output sebesar 2 ribu token.

    Total biaya yang dikeluarkan = 10 ribu token/1000 * 0,0125 USD + 2 ribu token/1000 * 0,0125 USD = 0,15 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock setiap jam: Permintaan ke model Amazon Titan Text – Lite untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.

    Total biaya per jam yang dikeluarkan adalah = 2 ribu token/1.000 * 0,0003 USD + 1 ribu token/1.000 * 0,0004 USD = 0,001 USD.

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model dasar Amazon Titan Image Generator untuk menghasilkan 1000 gambar berukuran 1024 x 1024 dengan kualitas standar.

    Total biaya yang dikeluarkan = 1.000 gambar * 0,01 USD per gambar = 10 USD

    Harga kustomisasi (penyempurnaan dan prapelatihan lanjutan)

    Developer aplikasi menyesuaikan model Amazon Titan Image Generator menggunakan 1000 pasangan gambar-teks. Setelah pelatihan, developer menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (masa komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.

    Biaya bulanan yang dikeluarkan untuk Penyempurnaan adalah: Pelatihan penyempurnaan (0,005 USD * 500 * 64). Pada kalkulasi tersebut, 0,005 USD adalah harga per gambar yang dilihat, 500 adalah jumlah langkah, dan 64 adalah ukuran batch + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli dua unit model Amazon Titan Text Express dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.

    Total biaya bulanan yang dikeluarkan = 2 unit model * 18,40 USD/jam * 24 jam * 31 hari = 27.379,20 USD

    Developer aplikasi membeli satu unit model dari model dasar Amazon Titan Image Generator dengan komitmen 1 bulan.

    Total biaya yang dikeluarkan = 1 unit model * 16,20 USD * 24 jam * 31 hari = 12.052,80 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock di Wilayah AS Barat (Oregon): Permintaan ke model Claude Anthropic untuk meringkas input sebesar 11 ribu token teks input menjadi output sebesar 4 ribu token.

    Total biaya yang dikeluarkan = 11 ribu token/1000 * 0,008 USD + 4 ribu token/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model Anthropic Claude Instant di Wilayah AS Barat (Oregon):

    Total biaya bulanan yang dikeluarkan adalah 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model Command Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.

    Total biaya yang dikeluarkan = 6 ribu token/1.000 * 0,0015 USD + 2 ribu token/1.000 * 0,0020 USD = 0,013 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Command-Light Cohere untuk meringkas input sebesar 6 ribu token teks input menjadi output sebesar 2 ribu token.

    Total biaya yang dikeluarkan = 6 ribu token/1000 * 0,0003 USD + 2 ribu token/1000 * 0,0006 USD = 0,003 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model Embed English atau Embed Multilingual Cohere untuk menghasilkan penyematan untuk 10 ribu token input.

    Total biaya yang dikeluarkan = 10 ribu token/1000 * 0,0001 USD = 0,001 USD

    Harga kustomisasi (penyempurnaan)

    Developer aplikasi menyesuaikan model Cohere Command menggunakan 1.000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.

    Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,004 USD * 1000) + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (49,50 USD) = 55,45 USD

    Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 39,60 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model Cohere Command dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.

    Total biaya bulanan yang dikeluarkan adalah 1 unit model * 39,60 USD * 24 jam * 31 hari = 29.462,40 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model Llama 2 Chat (13B) Meta untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 500 token.

    Total biaya yang dikeluarkan = 2 ribu token/1000 * 0,00075 USD + 500 token/1000 * 0,001 USD = 0,002 USD

    Harga kustomisasi (penyempurnaan)

    Developer aplikasi menyesuaikan model Llama 2 Pretrained (70B) menggunakan 1000 token data. Setelah pelatihan, menggunakan provisioned throughput model khusus selama 1 jam untuk mengevaluasi performa model. Model yang disempurnakan disimpan selama 1 bulan. Setelah evaluasi, developer menggunakan provisioned throughput (komitmen 1 bulan) untuk meng-hosting model yang disesuaikan.

    Biaya bulanan yang dikeluarkan untuk penyempurnaan adalah: Pelatihan penyempurnaan (0,00799 USD * 1000) + penyimpanan model khusus per bulan (1,95 USD) + 1 jam inferensi model khusus (23,50 USD) = 33,44 USD

    Biaya bulanan yang dikeluarkan untuk provisioned throughput (komitmen 1 bulan) dari model khusus = 21,18 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model Meta Llama 2 dengan komitmen 1 bulan untuk kasus penggunaan peringkasan teks mereka.

    Total biaya bulanan yang dikeluarkan adalah 1 unit model * 21,18 USD * 24 jam * 31 hari = 15.757,92 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: Permintaan ke model Mistral 7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.

    Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,00015 USD + 1 ribu token/1000 * 0,0002 USD = 0,0005 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: permintaan ke model Mixtral 8x7B untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token.

    Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,00045 USD + seribu token/1000 * 0,0007 USD = 0,0016 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock pada setiap jam: permintaan ke model Mistral Large untuk meringkas input sebesar 2 ribu token teks input menjadi output sebesar 1 ribu token. 

    Total biaya per jam yang dikeluarkan = 2 ribu token/1000 * 0,008 USD + seribu token/1000 * 0,024 USD = 0,04 USD

  • Harga On-Demand

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: permintaan ke model SDXL untuk menghasilkan gambar 512 x 512 dengan ukuran langkah sebesar 70 (kualitas premium).

    Total biaya yang dikeluarkan = 1 gambar * 0,036 USD per gambar = 0,036 USD

    Developer aplikasi melakukan panggilan API berikut ke Amazon Bedrock: Permintaan ke model SDXL 1.0 untuk menghasilkan gambar berukuran 1024 x 1024 dengan ukuran langkah sebesar 70 (kualitas premium).

    Total biaya yang dikeluarkan = 1 gambar * 0,08 USD per gambar = 0,08 USD

    Harga Provisioned Throughput

    Developer aplikasi membeli satu unit model SDXL1.0 dengan komitmen 1 bulan.

    Total biaya yang dikeluarkan = 1 * 49,86 USD * 24 jam * 31 hari = 37.095,84 USD

  • Contoh evaluasi model 1:

    Harga on-demand
    Developer aplikasi mengirimkan set data untuk evaluasi model berbasis manusia menggunakan Anthropic Claude 2.1 dan Anthropic Claude Instant di Wilayah AWS AS Timur (Virginia Utara).

    Set data berisi 50 perintah, dan developer memerlukan satu pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam pembuatan tugas evaluasi sebagai parameter “pekerja per perintah”).

    Akan ada 50 tugas dalam pekerjaan evaluasi ini (satu tugas untuk setiap set respons cepat per setiap pekerja). Sebanyak 50 perintah digabungkan menjadi 5000 token input, dan respons terkait digabungkan menjadi 15,000 token untuk Anthropic Claude Instant dan 20,000 token untuk Anthropic Claude 2.1.

    Biaya berikut dikeluarkan untuk tugas evaluasi model ini:

    Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total
    Claude Instant Inference 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Tugas Manusia             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Contoh evaluasi model 2:

    Harga on-demand
    Developer aplikasi mengirimkan set data untuk evaluasi model berbasis manusia menggunakan Anthropic Claude 2.1 dan Anthropic Claude Instant di Wilayah AWS AS Timur (Virginia Utara).

    Set data berisi 50 perintah, dan developer memerlukan dua pekerja untuk menilai setiap rangkaian respons perintah (dapat dikonfigurasi dalam pembuatan tugas evaluasi sebagai parameter “pekerja per perintah”). Akan ada 100 tugas dalam tugas evaluasi ini (1 tugas untuk setiap set respons-perintah per setiap pekerja: 2 pekerja x 50 rangkaian respons-perintah = 100 tugas manusia).

    Sebanyak 50 perintah digabungkan menjadi 5.000 token input, dan respons terkait digabungkan menjadi 15.000 token untuk Anthropic Claude Instant dan 20.000 token untuk Anthropic Claude 2.1.

    Biaya berikut dikeluarkan untuk tugas evaluasi model ini:

    Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total
    Claude Instant Inference 5.000 0,0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5.000 0,008 USD 0,0400 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Tugas Manusia             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Contoh 1: Chatbot dukungan pelanggan
    Pengembang aplikasi membuat chatbot dukungan pelanggan dan menggunakan filter konten untuk memblokir konten berbahaya dan topik yang ditolak untuk menyaring pertanyaan dan tanggapan yang tidak diinginkan.

    Chatbot melayani 1000 permintaan pengguna per jam. Setiap permintaan pengguna memiliki panjang input rata-rata 200 karakter dan menerima respons FM 1500 karakter.

    Setiap permintaan pengguna 200 karakter sesuai dengan 1 unit teks.

    Setiap respons FM 1.500 karakter sesuai dengan 2 unit teks.

    Unit teks diproses setiap jam = (1 + 2) * 1000 kueri = 3000 unit teks

    Total biaya yang dikeluarkan per jam untuk filter konten dan topik yang ditolak = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

     

    Contoh 2: Ringkasan transkrip pusat panggilan
    Pengembang aplikasi membuat aplikasi untuk meringkas transkrip obrolan antara pengguna dan agen dukungan. Ini menggunakan filter informasi sensitif untuk menyunting informasi pengenal pribadi (PII) dalam ringkasan yang dihasilkan untuk 10.000 percakapan.

    Setiap ringkasan yang dihasilkan memiliki rata-rata 3.500 karakter yang sesuai dengan 4 unit teks.

    Total biaya yang dikeluarkan untuk meringkas 10.000 percakapan = 10000 * 4 * (0,1 USD/1000) = 4 USD

    Item Jumlah token input Harga per 1.000 token input Biaya input Jumlah token output Harga per 1.000 token output Biaya output Jumlah tugas manusia Biaya per tugas manusia Biaya tugas manusia Total
    Claude Instant Inference 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Tugas Manusia             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Contoh Harga: Developer aplikasi mengimpor model tipe Llama 3.1 yang disesuaikan dengan ukuran parameter 8B dengan panjang urutan 128K di wilayah us-east-1 dan menghapus model setelah 1 bulan. Hal ini membutuhkan 2 Unit Model Kustom. Jadi, harga per menit akan menjadi 0,1570 USD karena diperlukan 2 Unit Model Kustom. Biaya penyimpanan model untuk 2 Unit Model Kustom adalah 3,90 USD untuk bulan tersebut.

    Tidak ada biaya untuk mengimpor model. Invokasi pertama yang berhasil adalah pukul 8.03, saat pengukuran dimulai. Periode pengukuran 5 menit dimulai pukul 8.03 – 8.07; 8.07 –8.11, dan seterusnya. Jika ada setidaknya satu invokasi selama periode 5 menit, periode tersebut akan dianggap aktif untuk penagihan. Jika tidak ada invokasi dari pukul 8.07 – 8.11, pengukuran akan berhenti pada pukul 8.11. Dalam hal ini, tagihan akan dihitung sebagai berikut: 0,1570 USD * 5 menit * 3 periode lima menit = 2,355 USD.

  • Contoh Harga 1 (Peringkat ulang menggunakan model Amazon Rerank 1.0)

    Pada bulan tertentu, Anda membuat 2 juta permintaan ke API Rerank menggunakan model Amazon Rerank 1.0 – 1 juta permintaan berisi kurang dari 100 dokumen masing-masing dan karena itu akan dikenakan biaya untuk masing-masing satu permintaan. 1 juta permintaan sisanya berisi 120-150 dokumen, dan karena itu setiap permintaan akan dikenakan biaya untuk 2 permintaan.

    Harga untuk satu permintaan = 0,001 USD
    Total biaya = 1.000.000 * 0,001 USD + 1.000.000 * 2 * 0,001 USD = 3000 USD 

    Contoh Harga 2: (Pengambilan data terstruktur)

    Developer aplikasi membuat chatbot dukungan yang melakukan kueri data terstruktur yang disimpan di Amazon Redshift. Developer membuat Basis Pengetahuan Bedrock dan terhubung ke Amazon Redshift. Chatbot melayani 10000 kueri pengguna per jam. Setiap kueri pengguna akan dikenakan biaya 0,002 USD per API GenerateQuery untuk menghasilkan SQL dari kueri pengguna.

    Total biaya yang dikeluarkan untuk menghasilkan SQL per jam = 0,002 USD * 10000 = 20 USD.
    Total biaya yang dikeluarkan dalam sebulan = 20 USD * 24 * 30 = 1440 USD

  • Contoh: Ringkasan berita
    Developer aplikasi membuat alur untuk mengotomatiskan ringkasan berita untuk pedagang saham. Alur tersebut mencakup simpul Input yang mengambil lokasi S3, dan simpul pengambilan S3 yang mengambil 10 file yang menyertakan artikel dari 10 kantor berita utama di S3 (2 transisi simpul). Alur tersebut kemudian menggunakan pengulang simpul untuk menginvokasi model dengan simpul prompt untuk meringkas setiap file (+ 10 file x 2 transisi simpul). Alur tersebut kemudian mengumpulkan semua hasil menggunakan simpul kolektor, menulis hasilnya ke S3 menggunakan simpul penyimpanan S3, dan menyelesaikan dalam simpul Output (+ 3 transisi simpul). Mereka menjalankan alur ini setiap setengah jam setiap hari kerja.

    Jumlah transisi simpul per eksekusi alur adalah: 2 + 1 + 10 * 2 + 3 = 25 transisi simpul/eksekusi aliran

    Jumlah eksekusi aliran per bulan adalah: 24 jam * 2 * 5 hari * 4 minggu = 960 eksekusi alur/bulan.

    Total tagihan per bulan adalah: 25 * 960 * 0,035 USD/1000 = 0,84 USD

    Biaya tambahan
    Tagihan tersebut juga akan mencakup biaya tambahan untuk layanan AWS yang digunakan dalam eksekusi alur kerja, termasuk penggunaan Amazon S3 dalam simpul pengambilan dan penyimpanan, dan penggunaan model fondasi Amazon Bedrock di simpul prompt.

  • Contoh harga 1:
    Katakanlah Anda memproses dokumen 1.000 halaman menggunakan BDA Custom Output. Semua 1.000 halaman diproses menggunakan cetak biru 1 yang memiliki 15 bidang. Harga per halaman untuk cetak biru dengan 30 bidang atau kurang adalah 0,040 USD. Total biayanya adalah 40 USD.

    Total halaman yang diproses = 1.000
    Harga per halaman untuk cetak biru dengan kurang dari 30 bidang = 0,040 USD
    Total biaya = 1.000 * 0,040 USD = 40 USD

     

    Contoh harga 2:
    Katakanlah Anda memproses 2 dokumen menggunakan BDA Custom Output. Dokumen 1 memiliki 40 halaman dan diproses menggunakan cetak biru 1 yang memiliki 20 bidang. Dokumen 2 memiliki 10 halaman dan diproses menggunakan cetak biru 2, yang memiliki 40 bidang. Harga per halaman untuk cetak biru 1 adalah 0,040 USD karena cetak biru tersebut memiliki 30 bidang atau kurang. Harga per halaman cetak biru 2 adalah 0,045 USD. Biaya pemrosesan untuk Dokumen 1 menggunakan cetak biru 1 adalah 1,60 USD. Biaya pemrosesan untuk Dokumen 2 menggunakan cetak biru 2 adalah 0,45 USD. Total biaya pemrosesan kedua dokumen adalah 2,05 USD.

    Total halaman yang diproses = 50
    Harga per halaman untuk Cetak biru 1 dengan kurang dari 30 bidang = 0,040 USD
    Harga per halaman untuk Cetak biru 2 dengan 40 bidang = 0,040 USD + (# bidang tambahan di atas 30*0,0005 USD per bidang)
    Jumlah bidang tambahan di atas 30 = 40 - 30 = 10
    Harga per halaman untuk Cetak biru 2 dengan 40 bidang = 0,040 USD + (10 * 0,0005 USD per bidang) = 0,045 USD
    Biaya untuk Dokumen 1 menggunakan Cetak biru 1 = 40 halaman x 0,040 USD per halaman = 1,6 USD
    Biaya untuk Dokumen 2 menggunakan Cetak biru 2 = 10 halaman x 0,045 USD per halaman = 0,45 USD
    Total biaya = Biaya untuk Dokumen 1 + Biaya untuk Dokumen 2 = 1,6 USD + 0,45 USD = 2,05 USD

     

    Contoh harga 3:
    Katakanlah Anda memproses video 60 menit menggunakan Output Standar BDA. Harga per menit untuk output standar video adalah 0,050 USD. Total biayanya adalah 3,00 USD.

    Total menit diproses = 60
    Harga per menit untuk output standar video = 0,050 USD
    Total biaya = 60 * 0,050 = 3,00 USD

     

    Contoh harga 4:
    Katakanlah Anda memproses 2.000 gambar menggunakan Output Kustom BDA. 1.000 gambar pertama diproses menggunakan cetak biru 1, yang memiliki 10 bidang. 1.000 halaman terakhir diproses menggunakan cetak biru 2, yang memiliki 40 bidang. Harga per gambar untuk cetak biru 1 adalah 0,005 USD, karena berisi 30 bidang atau kurang. Harga per gambar cetak biru 2 adalah 0,01 USD. Biaya pemrosesan untuk 1.000 gambar pertama menggunakan cetak biru 1 adalah 5,00 USD. Biaya pemrosesan untuk 1.000 gambar kedua menggunakan cetak biru 2 adalah 10,00 USD. Total biaya pemrosesan 2.000 gambar keseluruhan akan menjadi 15,00 USD

    Biaya untuk 1000 gambar pertama = 1.000 gambar * 0,005 USD per gambar = 5,00 USD
    Biaya untuk 1.000 gambar kedua = 1.000 gambar * (0,005 USD + (# bidang tambahan di atas 30 * 0,0005 USD per bidang))
    = 1.000 * (0,005 USD + ((40-30) * 0,0005 USD))
    = 1.000 * (0,005 USD + (10 * 0,0005 USD)) = 10,00 USD
    Total biaya = 5,00 USD + 10.00 USD = 15,00 USD

     

    Contoh harga 5:
    Mari kita asumsikan bahwa Anda ingin menggunakan Output Standar Otomatisasi Data Bedrock untuk memproses 15.000 menit rekaman audio rapat di organisasi Anda. Total biaya pemrosesan keseluruhan 15.000 menit audio akan menjadi 90 USD.

    Total menit yang diproses = 15.000 menit
    Total biaya = 15.000 menit × 0,006 USD = 90 USD


    Contoh Harga 6:
    Katakanlah Anda mengatur Basis Pengetahuan Bedrock untuk menggunakan Otomatisasi Data Bedrock sebagai pengurai dan kemudian menyerap dokumen 1000 halaman. Perhatikan bahwa integrasi Basis Pengetahuan Bedrock dan Otomatisasi Data Bedrock menggunakan output standar. Harga per halaman untuk output standar adalah 0,010 USD. Total biayanya adalah 10 USD.

    Total halaman yang diproses = 1.000
    Harga per halaman untuk output standar = 0,010 USD
    Total biaya = 1.000 * 0,010 USD = 10 USD