Preços do Amazon Bedrock
Visão geral da definição de preço
O Amazon Bedrock é um serviço totalmente gerenciado que oferece uma variedade de modelos de base (FMs) de alta performance por meio de uma única API, juntamente com um amplo conjunto de recursos necessários para criar aplicações de IA generativa com segurança, privacidade e IA responsável.
Com o Amazon Bedrock, a cobrança é feita com base na inferência e na personalização de modelos. Você pode escolher entre dois planos de preços para inferência: 1. Sob demanda e em lote: esse modo permite que você use FMs com base no pagamento conforme o uso, sem precisar assumir nenhum compromisso de prazo com base no tempo. 2. Throughput provisionada: esse modo permite provisionar uma throughput suficiente para atender aos requisitos de performance da sua aplicação em troca de um compromisso de prazo baseado em tempo.
Modelos de preços
Ferramentas avançadas
Detalhes do preço
O preço depende da modalidade, do fornecedor e do modelo. Selecione o fornecedor do modelo para ver os preços detalhados.
O Amazon Bedrock oferece modelos de base (FMs) selecionados dos principais fornecedores de IA, como Anthropic, Meta, Mistral AI e Amazon, para inferência em lote a um preço 50% menor em comparação com os preços de inferência sob demanda. Consulte a lista de modelos aqui.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Custom Model Import
-
AI21 Labs
-
AI21 Labs
Preços sob demanda
Modelos do AI21 Labs Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Jamba 1.5 Large USD 0,002 USD 0,008 Jamba 1.5 Mini USD 0,0002 USD 0,0004 Jurassic-2 Mid USD 0,0125 USD 0,0125 Jurassic-2 Ultra USD 0,0188 USD 0,0188 Jamba-Instruct USD 0,0005 USD 0,0007 -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
Preços sob demanda e em lote
Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3.5 Sonnet**
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3.5 Haiku
0,001 USD
USD 0,005
USD 0,0005
USD 0,0025
Claude 3 Opus*
USD 0,015
USD 0,075
USD 0,0075
USD 0,0375
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 2.1
USD 0,008
USD 0,024
N/D
N/D
Claude 2.0
USD 0,008
USD 0,024
N/D
N/D
Claude Instant
USD 0,0008
USD 0,0024
N/D
N/D
*No momento, o Claude 3 Opus está disponível na região Oeste dos EUA (Oregon) **O preço do Claude 3.5 Sonnet é aplicável a cada versão do Claude 3.5 Sonnet (v1 e v2). O Claude 3.5 Sonnet v2 está atualmente disponível na região Oeste dos EUA (Oregon) Região: Europa (Londres)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015 USD 0,0075 Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125 USD 0,000625
Região: Europa (Zurique)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3.5 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Região: América do Sul (São Paulo)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Região: Canadá (Central)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Região: Ásia-Pacífico (Mumbai)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Região: Ásia-Pacífico (Sydney)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Região: Ásia-Pacífico (Tóquio)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude Instant
USD 0,0008
USD 0,0024
N/D
N/D
Claude 2.0/2.1
USD 0,008
USD 0,024
N/D
N/D
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Claude 3.5 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Região: Ásia-Pacífico (Singapura)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude Instant
USD 0,0008
USD 0,0024
USD 0,0004
USD 0,0012
Claude 2.0/2.1
USD 0,008
USD 0,024
USD 0,004
USD 0,012
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Claude 3.5 Sonnet
USD 0,003
USD 0,015
N/D
N/D
Região: Europa (Paris)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Região: Europa (Frankfurt)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude Instant
USD 0,0008
USD 0,0024
N/D
N/D
Claude 2.0/2.1
USD 0,008
USD 0,024
N/D
N/D
Claude 3 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3.5 Sonnet
USD 0,003
USD 0,015
USD 0,0015
USD 0,0075
Claude 3 Haiku
USD 0,00025
USD 0,00125
USD 0,000125
USD 0,000625
Região: Ásia-Pacífico (Seul)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3.5 Sonnet
USD 0,003
USD 0,015
N/D
N/D
Claude 3 Haiku
USD 0,00025
USD 0,00125
N/D
N/D
Região: Leste dos EUA (Ohio)
Modelos da Anthropic Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Preço por 1.000 tokens de entrada (em lote) Preço por 1.000 tokens de saída (em lote) Claude 3.5 Sonnet
USD 0,003
USD 0,015
N/D
N/D
Claude 3 Haiku
USD 0,00025
USD 0,00125
N/D
N/D
Preços para throughput provisionado
Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Modelos da Anthropic Preço por hora por modelo
sem compromissoPreço por hora por unidade de modelo para compromisso de 1 mês Preço por hora por unidade modelo para compromisso de 6 meses Claude Instant
USD 44,00 USD 39,60
USD 22,00
Claude 2.0/2.1
USD 70,00 USD 63,00
USD 35,00
Modelos da Anthropic Preço por hora por modelo
sem compromissoPreço por hora por unidade de modelo para compromisso de 1 mês Preço por hora por unidade modelo para compromisso de 6 meses Claude Instant
USD 44,00 USD 39,60
USD 22,00
Claude 2.0/2.1
USD 70,00 USD 63,00
USD 35,00
Região: Ásia-Pacífico (Tóquio)
Modelos da Anthropic Preço por hora por unidade de modelo para compromisso de 1 mês Preço por hora por unidade modelo para compromisso de 6 meses Claude Instant
USD 53,00
USD 29,00
Claude 2.0/2.1
USD 86,00
USD 48,00
Região: Europa (Frankfurt)
Modelos da Anthropic Preço por hora por unidade de modelo para compromisso de 1 mês Preço por hora por unidade modelo para compromisso de 6 meses Claude Instant
USD 49,00
USD 27,00
Claude 2.0/2.1
USD 79,00
USD 44,00
Entre em contato com sua equipe de contas da AWS para obter mais detalhes sobre unidades de modelo.
-
Cohere
-
Cohere
Preços sob demanda
Modelos do Cohere Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Command USD 0,0015 USD 0.0020 Command-Light USD 0,0003 USD 0,0006 Command R+ USD 0,0030 USD 0,0150 Command R USD 0,0005 USD 0,0015 Embed – Inglês USD 0,0001 N/A Embed – Multilíngue USD 0,0001 N/A Preços para personalização (ajuste fino)
Modelos do Cohere Preço para treinar 1.000 tokens Preço para armazenar cada modelo personalizado por mês Preço a ser inferido de um modelo personalizado por unidade de modelo por hora (com preços de throughput provisionado sem compromisso) Cohere Command
USD 0,004
USD 1,95
USD 49,50
Cohere Command-Light USD 0,001 USD 1,95
USD 8,56 *Total de tokens treinados = número de tokens no corpus de dados de treinamento x número de epochs
Preços para throughput provisionado
Modelos do Cohere Preço por hora por modelo
sem compromissoPreço por hora por unidade de modelo para compromisso de 1 mês Preço por hora por unidade modelo para compromisso de 6 meses
Cohere Command
USD 49,50 USD 39,60
USD 23,77
Cohere Command - Light USD 8,56 USD 6,85
USD 4,11 Embed – Inglês USD 7,12 USD 6,76
USD 6,41 Embed – Multilíngue USD 7,12 USD 6,76
USD 6,41 Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.
-
Meta Llama
-
Meta Llama
Llama 3.2
Preços sob demanda e em lote
Llama 3.1
Preços sob demanda e em lote
Preços para personalização de modelos (ajuste fino)
Preços para throughput provisionado
Llama 3
Preço sob demanda
Llama 2
Preço sob demanda
Região: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Modelos do Meta Preço por 1.000 tokens de entrada Preço por 1.000 tokens de saída Llama 2 Chat (13B)
USD 0,00075
USD 0,001
Llama 2 Chat (70B) USD 0,00195
USD 0,00256 Preços para personalização de modelos (ajuste fino)
Modelos do Meta Preço para treinar 1.000 tokens Preço para armazenar cada modelo personalizado* por mês Preço a ser inferido de um modelo personalizado para 1 unidade de modelo por hora (com preços de throughput provisionado sem compromisso) Llama 2 pré-treinado (13B)
USD 0,00149
USD 1,95
USD 23,50
Llama 2 pré-treinado (70B) USD 0,00799
USD 1,95 USD 23,50 *Armazenamento de modelo personalizado = USD 1,95
Preços para throughput provisionado
Modelos do Meta Preço por hora por unidade de modelo para compromisso de 1 mês Preço por hora por unidade modelo para compromisso de 6 meses Llama 2 pré-treinado e Chat (13B)
USD 21,18
USD 13,08
Llama 2 pré-treinado (70B) USD 21,18
USD 13,08 *Os modelos pré-treinados do Llama 2 estão disponíveis somente em throughput provisionado após a personalização.
Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
Preços sob demanda
Modelo do Stability AI Preço por imagem gerada Stable Image Core USD 0,04 SD3 Large USD 0,08 Stable Image Ultra USD 0,14 Os modelos de imagem da geração anterior oferecidos pela Stability AI têm o preço por imagem, dependendo da contagem de etapas e da resolução da imagem.
Modelo do Stability AI Resolução da imagem Preço por imagem gerada com qualidade padrão (<=50 etapas) Preço por imagem gerada com qualidade premium (>50 etapas) SDXL 1.0 Até 1024 x 1024 USD 0,04 USD 0,08 Preços para throughput provisionado
Modelo do Stability AI Preço por hora por unidade de modelo para compromisso de 1 mês* Preço por hora por unidade modelo para compromisso de 6 meses* SDXL 1.0
USD 49,86
USD 46,18
*Inclui inferência para modelos de base e personalizados
Entre em contato com sua equipe de contas ou vendas da AWS para obter mais detalhes sobre unidades de modelo.
No momento, a personalização de modelos (ajuste fino) não é compatível com os modelos do Stability AI no Amazon Bedrock.
-
Custom Model Import
-
Custom Model Import
-
Llama
-
Llama multimodal
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Regiões: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Versão de unidade de modelo personalizada v1.0 Preço por unidade de modelo personalizado por min* USD 0,0785 Custo mensal de armazenamento por unidade de modelo personalizado USD 1,95 As unidades de modelo personalizadas necessárias para hospedar um modelo dependem de vários fatores, principalmente a arquitetura do modelo, a contagem de parâmetros do modelo e o comprimento do contexto. O número exato de unidades de modelo personalizado necessárias será determinado no momento da importação. Para referência, o modelo Llama 3.1 8B 128K requer duas unidades de modelo personalizadas, um modelo Llama 3.1 70B 128k requer oito unidades de modelo personalizadas. *Faturado em janelas de 5 minutos -
Llama multimodal
-
Regiões: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Versão de unidade de modelo personalizada v1.0 Preço por unidade de modelo personalizado por min* USD 0,0785 Custo mensal de armazenamento por unidade de modelo personalizado USD 1,95 As unidades de modelo personalizadas necessárias para hospedar um modelo dependem de vários fatores, principalmente a arquitetura do modelo, a contagem de parâmetros do modelo e o comprimento do contexto. O número exato de unidades de modelo personalizado necessárias será determinado no momento da importação. Para referência, o modelo Llama 3.2 11B 128K requer quatro unidades de modelo personalizadas. *Faturado em janelas de 5 minutos -
Mistral
-
Regiões: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Versão de unidade de modelo personalizada v1.0 Preço por unidade de modelo personalizado por min* USD 0,0785 Custo mensal de armazenamento por unidade de modelo personalizado USD 1,95 As unidades de modelo personalizadas necessárias para hospedar um modelo dependem de vários fatores, principalmente a arquitetura do modelo, a contagem de parâmetros do modelo e o comprimento do contexto. O número exato de unidades de modelo personalizado necessárias será determinado no momento da importação. Para referência, o modelo Mistral 7B 32K requer uma unidade de modelo personalizada. *Faturado em janelas de 5 minutos -
Mixtral
-
Regiões: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Versão de unidade de modelo personalizada v1.0 Preço por unidade de modelo personalizado por min* USD 0,0785 Custo mensal de armazenamento por unidade de modelo personalizado USD 1,95 As unidades de modelo personalizadas necessárias para hospedar um modelo dependem de vários fatores, principalmente a arquitetura do modelo, a contagem de parâmetros do modelo e o comprimento do contexto. O número exato de unidades de modelo personalizado necessárias será determinado no momento da importação. Para referência, o modelo Mixtral 8x7B 32K requer quatro unidades de modelo personalizadas. *Faturado em janelas de 5 minutos -
Flan
-
Regiões: Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon)
Versão de unidade de modelo personalizada v1.0 Preço por unidade de modelo personalizado por min* USD 0,0785 Custo mensal de armazenamento por unidade de modelo personalizado USD 1,95 As unidades de modelo personalizadas necessárias para hospedar um modelo dependem de vários fatores, principalmente a arquitetura do modelo, a contagem de parâmetros do modelo e o comprimento do contexto. O número exato de unidades de modelo personalizado necessárias será determinado no momento da importação. Para referência, o modelo Flan-T5 XL 512 requer uma unidade de modelo personalizada. *Faturado em janelas de 5 minutos
Preços de inferência sob demanda:
Você receberá cobranças em janelas de 5 minutos pelo período em que sua cópia de modelo estiver ativa, a partir da primeira invocação bem-sucedida. O limite máximo de throughput e simultaneidade por cópia de modelo depende de fatores como combinação de tokens de entrada/saída, tipo de hardware, tamanho do modelo, arquitetura, otimizações de inferência e é determinado durante o fluxo de trabalho de importação do modelo.O Bedrock dimensiona automaticamente o número de cópias do modelo de acordo com seus padrões de uso. Se não houver invocações por um período de 5 minutos, o Bedrock diminuirá para zero e aumentará novamente quando você invocar seu modelo. Ao aumentar a escala, você pode experimentar uma duração de inicialização a frio (em dezenas de segundos), dependendo do tamanho do modelo. O Bedrock também aumenta o número de cópias do modelo se o volume de inferência exceder consistentemente os limites de simultaneidade de uma única cópia do modelo. Nota: há um máximo padrão de 3 cópias de modelo por conta e por modelo importado que podem ser aumentadas por meio do Service Quotas.
-
Ferramentas avançadas de preços (detalhes)
-
Barreiras de proteção do Amazon Bedrock
-
Avaliação de modelo
-
Barreiras de proteção do Amazon Bedrock
-
Barreiras de proteção do Amazon Bedrock
Política de barreira de proteção*
Preço por 1.000 unidades de texto**
Filtros de conteúdo
USD 0,75
Tópicos negados
USD 1
Verificação de fundamentação contextual***
USD 0,1
Filtro de informações confidenciais (PII)
USD 0,1
Filtro de informações confidenciais (padrão de expressão regular)
Grátis
Filtros de palavras
Grátis
Preços sob demanda
* Cada política de barreira de proteção é opcional e pode ser habilitada com base nos requisitos da aplicação. As cobranças serão feitas com base no tipo de política usado na barreira de proteção. Por exemplo, se uma barreira de proteção estiver configurada com filtros de conteúdo e tópicos negados, haverá cobranças por essas duas políticas, mas não haverá cobranças associadas aos filtros de informações confidenciais.
**Uma unidade de texto pode conter até 1000 caracteres. Se uma entrada de texto tiver mais de 1000 caracteres, ela será processada como várias unidades de texto, cada uma contendo 1000 caracteres ou menos. Por exemplo, se um texto tiver 5.600 caracteres, serão contabilizadas seis unidades de texto para fins de cobrança.*** A verificação de fundamentação contextual utiliza uma fonte de referência e uma consulta para determinar se a resposta do modelo está fundamentada com base na fonte e se é relevante para a consulta. O número total de unidades de texto cobradas é calculado com base na soma de todos os caracteres presentes na fonte, na consulta e na resposta do modelo.
Não há suporte a barreiras de proteção para imagens e incorporações.
-
Avaliação de modelo
-
Avaliação de modelo
A avaliação de modelo é cobrada pela inferência de sua escolha de modelo. As pontuações algorítmicas geradas automaticamente são fornecidas sem custo adicional. Na avaliação baseada em humanos, na qual você traz seu próprio fluxo de trabalho, você é cobrado pela inferência do modelo na avaliação e uma taxa de USD 0,21 por tarefa humana concluída.
Modelo
Preço por 1.000 tokens de entrada
Preço por 1.000 tokens de saída
Preço por tarefa humana
Modelo selecionado para avaliação
Com base no modelo selecionado
Com base no modelo selecionado
USD 0,21
Exemplos de preço
-
AI21 Labs
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Jurrasic-2 Mid da AI21 para resumir uma entrada de 10.000 tokens de texto em uma saída de 2.000 tokens.
Custo total acumulado = 10.000 tokens/1000 * USD 0,0125 + 2.000 tokens/1000 * USD 0,0125 = USD 0,15
-
Amazon
Preços sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Amazon Titan Text Lite para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.
Custo total acumulado por hora = 2.000 tokens/1.000 * USD 0,0003 + 1.000 tokens/1.000 * USD 0,0004 = USD 0,001.
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo de base do Gerador de imagens do Amazon Titan para gerar 1000 imagens de 1024 x 1024 em tamanho de qualidade padrão.
Custo total acumulado = 1000 imagens * USD 0,01 por imagem = USD 10
Preços para personalização (ajuste fino e pré-treinamento contínuo)
Um desenvolvedor de aplicações personaliza um modelo Gerador de imagens do Amazon Titan usando 1.000 pares de imagem e texto. Após o treinamento, o desenvolvedor usa o throughput provisionado do modelo personalizado por 1 hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por 1 mês. Após a avaliação, o desenvolvedor usa o throughput provisionado (compromisso de 1 mês) para hospedar o modelo personalizado.
Custo mensal do ajuste fino = treinamento de ajuste fino (USD 0,005 * 500 * 64), em que USD 0,005 é o preço por imagem vista, 500 é o número de etapas e 64 é o tamanho do lote + armazenamento de modelo personalizado por mês (USD 1,95) + 1 hora de inferência de modelo personalizado (USD 21) = USD 160 + USD 1,95 + USD 21 = USD 182,95
Preços para throughput provisionado
Um desenvolvedor de aplicações compra duas unidades de modelo do Amazon Titan Text Express com um compromisso de 1 mês para seu caso de uso de resumo de texto.
Custo mensal total acumulado = 2 unidades do modelo * USD 18,40/hora * 24 horas * 31 dias = USD 27.379,20
Um desenvolvedor de aplicações compra uma unidade de modelo do modelo de base do Gerador de imagens do Amazon Titan com compromisso de 1 mês.
Custo total incorrido = 1 unidade do modelo * USD 16,20 * 24 horas* 31 dias = USD 12.052,80
-
Anthropic
Preços sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock na região Oeste dos EUA (Oregon): uma solicitação ao modelo Claude da Anthropic para resumir uma entrada de 11.000 tokens de texto em uma saída de 4.000 tokens.
O custo total acumulado é de 11.000 tokens/1000 * USD 0,008 + 4.000 tokens/1000 * USD 0,024 = USD 0,088 + USD 0,096 = USD 0,184
Preços para throughput provisionado
Um desenvolvedor de aplicações compra uma unidade de modelo do Claude Instant da Anthropic na região Oeste dos EUA (Oregon):
O custo mensal total acumulado é de 1 unidade de modelo * USD 39,60 * 24 horas * 31 dias = USD 29.462,40
-
Cohere
Preços sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Command da Cohere para resumir uma entrada de 6.000 tokens de texto em uma saída de 2.000 tokens.
O custo total incorrido é = 6.000 tokens/1.000 * USD 0,0015 + 2.000 tokens/1.000 * USD 0,0020 = USD 0,013
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Command-Light da Cohere para resumir uma entrada de 6.000 tokens de texto de entrada em uma saída de 2.000 tokens.
Custo total acumulado = 6.000 tokens/1000 * USD 0,0003 + 2.000 tokens/1000 * USD 0,0006 = USD 0,003
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: um solicitação ao modelo Embed em inglês ou Embed multilíngue da Cohere para gerar incorporações para 10.000 tokens de entrada.
Custo total acumulado = 10.000 tokens/1000 * USD 0,0001 = USD 0,001
Preços para personalização (ajuste fino)
Um desenvolvedor de aplicações personaliza um modelo Command da Cohere usando 1000 tokens de dados. Após o treinamento, ele usa o throughput provisionado do modelo personalizado por 1 hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por 1 mês. Após a avaliação, o desenvolvedor usa o throughput provisionado (compromisso de 1 mês) para hospedar o modelo personalizado.
O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,004 * 1000) + armazenamento de modelos personalizados por mês (USD 1,95) + 1 hora de inferência de modelo personalizado (USD 49,50) = USD 55,45
Custo mensal acumulado para throughput provisionado (compromisso de 1 mês) do modelo personalizado = USD 39,60
Preços para throughput provisionado
Um desenvolvedor de aplicações compra uma unidade de modelo do Command da Cohere com um compromisso de 1 mês para seu caso de uso de resumo de texto.
O custo mensal total acumulado é de 1 unidade de modelo * USD 39,60 * 24 horas * 31 dias = USD 29.462,40
-
Meta Llama
Preços sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo Llama 2 Chat (13B) da Meta para resumir uma entrada de 2.000 tokens de texto de entrada em uma saída de 500 tokens.
Custo total acumulado = 2.000 tokens/1000 * USD 0,00075 + 500 tokens/1000 * USD 0,001 = USD 0,002
Preços para personalização (ajuste fino)
Um desenvolvedor de aplicações personaliza o modelo pré-treinado do Llama 2 (70B) usando 1000 tokens de dados. Após o treinamento, ele usa o throughput provisionado do modelo personalizado por 1 hora para avaliar a performance desse modelo. O modelo ajustado é armazenado por 1 mês. Após a avaliação, o desenvolvedor usa o throughput provisionado (compromisso de 1 mês) para hospedar o modelo personalizado.
O custo mensal do ajuste fino é: treinamento de ajuste fino (USD 0,00799 * 1000) + armazenamento de modelo personalizado por mês (USD 1,95) + 1 hora de inferência de modelo personalizado (USD 23,50) = USD 33,44
Custo mensal acumulado para throughput provisionado (compromisso de 1 mês) do modelo personalizado = USD 21,18
Preços para throughput provisionado
Um desenvolvedor de aplicações compra uma unidade de modelo do Meta Llama 2 com um compromisso de 1 mês para seu caso de uso de resumo de texto.
O custo mensal total acumulado é de 1 unidade de modelo * USD 21,18 * 24 horas * 31 dias = USD 15.757,92
-
Mistral AI
Preços sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral 7B para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.
Custo total acumulado por hora = 2.000 tokens/1000 * USD 0,00015 + 1000 tokens/1.000 * USD 0,0002 = USD 0,0005
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral 8x7B para resumir uma entrada de 2.000 tokens de texto em uma saída de 1.000 tokens.
Custo total acumulado por hora = 2.000 tokens/1000 * USD 0,00045 + 1000 tokens/1.000 * USD 0,0007 = USD 0,0016
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock de hora em hora: uma solicitação ao modelo Mistral Large para resumir uma entrada de 2.000 tokens de texto de entrada em uma saída de 1.000 tokens.
O custo total por hora incorrido é = 2.000 tokens/1000 * USD 0,008 + 1.000 tokens/1000 * USD 0,024 = USD 0,04
-
Stability AI
Preços sob demanda
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo SDXL para gerar uma imagem de 512 x 512 em gradações de 70 (qualidade premium).
Custo total acumulado = 1 imagem * USD 0,036 por imagem = USD 0,036
Um desenvolvedor de aplicações faz as seguintes chamadas de API para o Amazon Bedrock: uma solicitação ao modelo SDXL 1.0 para gerar uma imagem de 1024 X 1024 em gradações de 70 (qualidade premium).
Custo total acumulado = 1 imagem * USD 0,08 por imagem = USD 0,08
Preços para throughput provisionado
Um desenvolvedor de aplicações compra uma unidade de modelo do SDXL 1.0 com compromisso de 1 mês.
Custo total acumulado = 1 * USD 49,86 * 24 horas * 31 dias = USD 37.095,84
-
Avaliação do modelo
Exemplo de avaliação de modelo 1:
Preços sob demanda
Um desenvolvedor de aplicações envia um conjunto de dados para avaliação de modelos baseada em humanos usando o Anthropic Claude 2.1 e o Anthropic Claude Instant na região da AWS Leste dos EUA (Norte da Virgínia).O conjunto de dados contém 50 solicitações e o desenvolvedor exige que 1 pessoa avalie cada conjunto de prompts de resposta (configurável na criação do trabalho de avaliação como parâmetro “pessoas por prompt”).
Haverá 50 tarefas neste trabalho de avaliação (uma tarefa para cada conjunto de prompt-resposta por cada trabalhador). As 50 solicitações combinam até 5.000 tokens de entrada, e as respostas associadas combinam 15.000 tokens para o Anthropic Claude Instant e 20.000 tokens para o Anthropic Claude 2.1.
As seguintes cobranças são cobradas por esse trabalho de avaliação de modelo:Item Número de tokens de entrada Preço por 1.000 tokens de entrada Custo da entrada Número de tokens de saída Preço por 1.000 tokens de saída Custo de produção Número de tarefas humanas Preço por tarefa humana Custo das tarefas humanas Total Inferência instantânea de Claude 5.000 USD 0,0008 USD 0,004 15.000 USD 0,0024 USD 0,036 USD 0,04 Inferência do Claude 2.1 5.000 USD 0,008 USD 0,04 20.000 USD 0,024 USD 0,48 USD 0,52 Tarefas humanas 50 USD 0,21 USD 10,50 USD 10,50 Total USD 11,06 Exemplo de avaliação de modelo 2:
Preços sob demanda
Um desenvolvedor de aplicações envia um conjunto de dados para avaliação de modelos baseada em humanos usando o Anthropic Claude 2.1 e o Anthropic Claude Instant na região da AWS Leste dos EUA (Norte da Virgínia).
O conjunto de dados contém 50 solicitações e o desenvolvedor exige que dois trabalhadores avaliem cada conjunto de prompts de resposta (configurável na criação do trabalho de avaliação como parâmetro “trabalhadores por prompt”). Haverá 100 tarefas neste trabalho de avaliação (1 tarefa para cada conjunto de resposta de prompt por cada trabalhador: 2 trabalhadores x 50 conjuntos de respostas de prompt = 100 tarefas humanas).
As 50 solicitações combinam até 5.000 tokens de entrada, e as respostas associadas combinam 15.000 tokens para o Anthropic Claude Instant e 20.000 tokens para o Anthropic Claude 2.1.
As seguintes cobranças são cobradas por esse trabalho de avaliação de modelo:
Item Número de tokens de entrada Preço por 1.000 tokens de entrada Custo da entrada Número de tokens de saída Preço por 1.000 tokens de saída Custo de produção Número de tarefas humanas Preço por tarefa humana Custo das tarefas humanas Total Inferência instantânea de Claude 5.000 0,0008 USD USD 0,0040 15.000 USD 0,0024 USD 0,036 USD 0,04 Inferência do Claude 2.1 5.000 USD 0,008 USD 0,0400 20.000 USD 0,024 USD 0,48 USD 0,52 Tarefas humanas 100 USD 0,21 USD 21,00 USD 21,00 Total USD 21,56 -
Barreiras de proteção do Amazon Bedrock
Exemplo 1: chatbot de suporte ao cliente
Um desenvolvedor de aplicações cria um chatbot de suporte ao cliente e usa filtros de conteúdo para bloquear conteúdo nocivo e tópicos negados para filtrar consultas e respostas indesejáveis.
O chatbot atende a 1.000 consultas de usuários por hora. Cada consulta do usuário tem um tamanho médio de entrada de 200 caracteres e recebe uma resposta FM com 1.500 caracteres.
Cada consulta do usuário de 200 caracteres corresponde a 1 unidade de texto.
Cada resposta FM de 1.500 caracteres corresponde a 2 unidades de texto.
Unidades de texto processadas a cada hora = (1 + 2) * 1.000 consultas = 3.000 unidades de texto
Custo total incorrido por hora com filtros de conteúdo e tópico negado = 3.000 * (USD 0,75 + USD 1,00)/1.000 = USD 5,25Exemplo 2: resumo de transcrição do call center
Um desenvolvedor de aplicações cria uma aplicação para resumir as transcrições de chat entre usuários e atendentes de suporte. Ele usa filtro de informações confidenciais para omitir informações de identificação pessoal (PII) nos resumos gerados para 10.000 conversas.
Cada resumo gerado tem uma média de 3.500 caracteres que correspondem a 4 unidades de texto.
Custo total incorrido para resumir 10.000 conversas = 10.000 * 4 * (0,1/1000) = USD 4Item Número de tokens de entrada Preço por 1.000 tokens de entrada Custo da entrada Número de tokens de saída Preço por 1.000 tokens de saída Custo de produção Número de tarefas humanas Preço por tarefa humana Custo das tarefas humanas Total Inferência instantânea de Claude 5.000 USD 0,0008 USD 0,004 15.000 USD 0,0024 USD 0,036 USD 0,04 Inferência do Claude 2.1 5.000 USD 0,008 USD 0,04 20.000 USD 0,024 USD 0,48 USD 0,52 Tarefas humanas 100 USD 0,21 USD 21,00 USD 21,00 Total USD 21,56 -
Custom Model Import
Exemplo de preço: um desenvolvedor de aplicações importa um modelo personalizado do tipo Llama 3.1 com um tamanho de parâmetro de 8B com um comprimento de sequência de 128 mil na região us-east-1. Isso requer duas unidades de modelo personalizadas. Portanto, o preço por minuto será de USD 0,1570 porque são necessárias duas unidades de modelo personalizadas. Os custos de armazenamento do modelo para duas unidades de modelo personalizadas seriam de USD 3,90 por mês.
Não há cobrança para importar o modelo. A primeira invocação bem-sucedida é feita às 8h03, quando a medição começa. As janelas de medição de 5 minutos são feitas das 8h03 às 8h07; das 8h07 às 8h11 e assim por diante. Se houver pelo menos uma invocação durante qualquer período de 5 minutos, a janela será considerada ativa para cobrança. Se não houver invocação das 8h07 às 8h11, a medição será interrompida às 8h11. Nesse caso, a fatura seria calculada da seguinte forma: USD 0,1570 * 5 minutos* 3 janelas de cinco minutos = USD 2,355.