O que é o SageMaker HyperPod?
O Amazon SageMaker HyperPod remove o trabalho pesado indiferenciado envolvido na criação de modelos de IA generativa. Ele ajuda a escalar rapidamente as tarefas de desenvolvimento de modelos, como treinamento, ajuste fino ou inferência, em um cluster de centenas ou milhares de aceleradores de IA. O SageMaker HyperPod permite a governança centralizada em todas as suas tarefas de desenvolvimento de modelos, oferecendo total visibilidade e controle sobre como as diferentes tarefas são priorizadas e como os recursos computacionais são alocados para cada tarefa, ajudando você a maximizar a utilização do cluster pela GPU e pelo AWS Trainium e acelerar a inovação.
Com o SageMaker HyperPod, você pode distribuir e paralelizar com eficiência seu workload de treinamento em todos os aceleradores. O SageMaker HyperPod aplica automaticamente as melhores configurações de treinamento para modelos populares disponíveis publicamente, para ajudar você a alcançar rapidamente o desempenho ideal. Ele também monitora continuamente seu cluster em busca de falhas de infraestrutura, repara automaticamente o problema e recupera seus workloads sem intervenção humana — tudo isso ajuda a economizar até 40% do tempo de treinamento.
Benefícios do SageMaker HyperPod
Apresentando a governança de tarefas no SageMaker HyperPod
Maximize a utilização e obtenha visibilidade total dos recursos de computação, ao mesmo tempo em que reduz os custos.