Trainium을 선택해야 하는 이유
AWS Trainium 칩은 비용을 절감하면서도 고성능을 제공하기 위해 AWS가 AI 훈련 및 추론용으로 특별히 구축한 AI 칩 제품군입니다.
1세대 AWS Trainium 칩은 동급 Amazon EC2 인스턴스보다 훈련 비용이 최대 50% 저렴한 Amazon Elastic Compute Cloud(Amazon EC2) Trn1 인스턴스를 구동합니다. Databricks, Ricoh, NinjaTech AI, Arcee AI를 비롯한 많은 고객이 Trn1 인스턴스의 성능 및 비용 이점을 실현하고 있습니다.
AWS Trainium2 칩은 1세대 Trainium보다 최대 4배 높은 성능을 제공합니다. Trainium2 기반 Amazon EC2 Trn2 인스턴스는 생성형 AI용으로 특별히 구축되었으며, 수천억에서 조 단위 이상의 파라미터로 모델을 훈련하고 배포하는 데 가장 강력한 EC2 인스턴스입니다. Trn2 인스턴스는 현재 세대의 GPU 기반 EC2 P5e 및 P5en 인스턴스보다 30%~40% 우수한 가격 대비 성능을 제공합니다. Trn2 인스턴스는 AWS의 독자적인 칩 간 상호 연결인 NeuronLink로 상호 연결된 16개의 Trainium2 칩을 탑재합니다. Trn2 인스턴스를 사용하여 대규모 언어 모델(LLM), 멀티모달 모델, 확산 트랜스포머 등 가장 까다로운 모델을 훈련 및 배포하여 광범위한 차세대 생성형 AI 애플리케이션을 구축할 수 있습니다. Trn2 UltraServer는 완전히 새로운 EC2 제품(평가판으로 제공)으로, 독립 실행형 EC2 인스턴스보다 많은 메모리 및 메모리 대역폭이 필요한 최대 규모의 모델에 적합합니다. UltraServer 설계는 NeuronLink를 사용하여 4개의 Trn2 인스턴스에 걸쳐 64개의 Trainium2 칩을 단일 노드에 연결하여 새로운 처리 능력을 제공합니다. 추론의 경우, UltraServer는 업계 최고의 응답 시간을 제공하여 최상의 실시간 경험을 제공합니다. 훈련의 경우, UltraServer는 모델 병렬 처리를 위한 더 빠른 집단 통신을 통해 독립 실행형 인스턴스와 비교해 모델 훈련 속도와 효율성을 향상시킵니다.
PyTorch, JAX와 같은 인기 있는 기계 학습(ML) 프레임워크에 대한 기본 지원을 제공하여 Trn2 및 Trn1 인스턴스에서 모델 훈련 및 배포를 시작할 수 있습니다.