Mengapa memilih Trainium?
Chip AWS Trainium adalah keluarga chip AI yang dibuat khusus oleh AWS untuk pelatihan dan inferensi AI agar dapat menghadirkan performa tinggi sekaligus mengurangi biaya.
Chip AWS Trainium generasi pertama mendukung instans Trn1 Amazon Elastic Compute Cloud (Amazon EC2), yang memiliki biaya pelatihan hingga 50% lebih rendah daripada instans Amazon EC2 yang sebanding. Banyak pelanggan, termasuk Databricks, Ricoh, NinjaTech AI, dan Arcee AI, mengakui manfaat performa dan biaya instans Trn1.
Chip AWS Trainium2 menghadirkan performa hingga empat kali lipat dari Trainium generasi pertama. Instans Trn2 Amazon EC2 berbasis Trainium2 dibuat khusus untuk AI generatif dan merupakan instans EC2 yang paling kuat untuk melatih dan men-deploy model dengan lebih dari ratusan miliar hingga triliun parameter. Instans Trn2 menawarkan performa sesuai harga 30% hingga 40% lebih baik daripada instans P5e dan P5en EC2 berbasis GPU generasi saat ini. Instans Trn2 dilengkapi dengan 16 chip Trainium2 yang saling terhubung dengan NeuronLink, interkoneksi chip-ke-chip milik kami. Anda dapat menggunakan instans Trn2 untuk melatih dan men-deploy model yang paling berat, termasuk model bahasa besar (LLM), model multimodal, dan transformator difusi, untuk membangun set aplikasi AI generatif generasi berikutnya yang luas. UltraServers Trn2, penawaran EC2 yang benar-benar baru (tersedia dalam pratinjau), cocok untuk model terbesar yang membutuhkan lebih banyak memori dan bandwidth memori daripada yang dapat disediakan oleh instans EC2 mandiri. Desain UltraServer menggunakan NeuronLink untuk menghubungkan 64 chip Trainium2 di empat instans Trn2 menjadi satu simpul, yang membuka kemampuan baru. Kesimpulannya, UltraServers membantu memberikan waktu respons terdepan di industri untuk menciptakan pengalaman waktu nyata terbaik. Untuk pelatihan, UltraServers meningkatkan kecepatan dan efisiensi pelatihan model dengan komunikasi kolektif yang lebih cepat untuk paralelisme model dibandingkan dengan instans mandiri.
Anda dapat memulai pelatihan dan deployment model pada instans Trn2 dan Trn1 dengan dukungan native untuk kerangka kerja machine learning (ML) populer. seperti PyTorch dan JAX.