Tarifs d'Amazon Bedrock
Vue d'ensemble des tarifs
Amazon Bedrock est un service entièrement géré qui propose un choix de modèles de fondation (FM) performants via une API unique, ainsi qu’un large éventail de capacités permettant de créer des applications d’IA génératives alliant sécurité, confidentialité et IA responsable.
Avec Amazon Bedrock, l’inférence et la personnalisation des modèles vous sont facturées. Vous avez le choix entre deux plans tarifaires pour l’inférence : 1. À la demande et par lots : ce plan vous permet d’utiliser les FM sur la base du paiement à l’utilisation sans avoir à prendre d’engagements temporels. 2. Débit alloué : ce plan vous permet d’allouer un débit suffisant pour répondre aux exigences de performances de votre application en échange d’un engagement à durée déterminée.
Modèles de tarification
Outils avancés
Informations de tarification
La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.
Amazon Bedrock propose certains modèles de fondation (FM) provenant des principaux fournisseurs d’IA tels qu’Anthropic, Meta, Mistral AI et Amazon pour l’inférence par lots à un prix 50 % inférieur à celui de la tarification d’inférence à la demande. Consultez la liste des modèles ici.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Importation de modèles personnalisés
-
AI21 Labs
-
AI21 Labs
Tarification à la demande
Modèles AI21 Labs Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Jamba 1.5 Large 0,002 USD 0,008 USD Jamba 1.5 Mini 0,0002 USD 0,0004 USD Jurassic-2 Mid 0,0125 USD 0,0125 USD Jurassic 2 Ultra 0,0188 USD 0,0188 USD Jamba-Instruct 0,0005 USD 0,0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
Tarification à la demande et par lots
Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Haiku
0,001 USD
0,005 USD
0,0005 USD
0,0025 USD
Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 2.1
0,008 USD
0,024 USD
N/A
N/A
Claude 2.0
0,008 USD
0,024 USD
N/A
N/A
Claude Instant
0,0008 USD
0,0024 USD
N/A
N/A
*Claude 3 Opus est actuellement disponible dans la région USA Ouest (Oregon) **La tarification de Claude 3.5 Sonnet est applicable à chaque version de Claude 3.5 Sonnet (v1 et v2). Claude 3.5 Sonnet v2 est actuellement disponible dans la région de l'Ouest des États-Unis (Oregon) Région : Europe (Londres)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD 0,0075 USD Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD 0,000625 USD
Région AWS : Europe (Zurich)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Région AWS : Amérique du Sud (Sao Paulo)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Région AWS : Canada (Centre)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Région : Asie-Pacifique (Mumbai)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Région : Asie-Pacifique (Sydney)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Région : Asie-Pacifique (Tokyo)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude Instant
0,0008 USD
0,0024 USD
N/A
N/A
Claude 2.0/2.1
0,008 USD
0,024 USD
N/A
N/A
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Région : Asie-Pacifique (Singapour)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude Instant
0,0008 USD
0,0024 USD
0,0004 USD
0,0012 USD
Claude 2.0/2.1
0,008 USD
0,024 USD
0,004 USD
0,012 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/A
N/A
Région : Europe (Paris)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Région : Europe (Francfort)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude Instant
0,0008 USD
0,0024 USD
N/A
N/A
Claude 2.0/2.1
0,008 USD
0,024 USD
N/A
N/A
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haïku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Région : Asie-Pacifique (Séoul)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/A
N/A
Claude 3 Haïku
0,00025 USD
0,00125 USD
N/A
N/A
Région : USA Est (Ohio)
Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Prix pour 1 000 jetons d'entrée (lot) Prix pour 1 000 jetons de sortie (lot) Claude 3.5 Sonnet
0,003 USD
0,015 USD
N/A
N/A
Claude 3 Haïku
0,00025 USD
0,00125 USD
N/A
N/A
Tarification du débit alloué
Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Anthropic Prix par heure par modèle avec
aucun engagementTarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois Claude Instant
44,00 USD 39,60 USD
22 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Modèles Anthropic Prix par heure par modèle avec
aucun engagementTarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois Claude Instant
44,00 USD 39,60 USD
22 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Région : Asie-Pacifique (Tokyo)
Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois Claude Instant
53 USD
29 USD
Claude 2.0/2.1
86 USD
48 USD
Région : Europe (Francfort)
Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois Claude Instant
49 USD
27 USD
Claude 2.0/2.1
79 USD
44 USD
Contactez l’équipe responsable de votre compte AWS pour plus de détails sur les unités modèles.
-
Cohere
-
Cohere
Tarification à la demande
Modèles Cohere Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Command 0,0015 USD 0,002 USD Command-Light 0,0003 USD 0,0006 USD Command R+ 0,0030 USD 0,0150 USD Command R 0,0005 USD 0,0015 USD Embed – anglais 0,0001 USD N/A Embed – multilingue 0,0001 USD N/A Tarification pour la personnalisation (ajustement)
Modèles Cohere Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé par mois Prix à déduire d’un modèle personnalisé par unité de modèle par heure (avec une tarification de débit provisionné sans engagement) Command de Cohere
0,004 USD
1,95 USD
49,5 USD
Command-Light de Cohere 0,001 USD 1,95 USD
8,56 USD *Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement multipliés par le nombre d’époques
Tarification du débit provisionné
Modèles Cohere Prix par heure et par modèle
sans engagementTarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois
Command de Cohere
49,5 USD 39,60 USD
23,77 USD
Cohere Command - Light 8,56 USD 6,85 USD
4,11 USD Embed – anglais 7,12 USD 6,76 USD
6,41 USD Embed – multilingue 7,12 USD 6,76 USD
6,41 USD Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.
-
Meta Llama
-
Meta Llama
Llama 3.2
Tarification à la demande et par lots
Llama 3.1
Tarification à la demande et par lots
Tarification pour la personnalisation de modèle (ajustement)
Tarification du débit provisionné
Llama 3
Tarification à la demande
Llama 2
Tarification à la demande
Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Meta Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie Lama 2 Chat (13B)
0,00075 USD
0,001 USD
Llama 2 Chat (70B) 0,00195 USD
0,00256 USD Tarification pour la personnalisation de modèle (ajustement)
Modèles Meta Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé* par mois Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement) Llama 2 Pretrained (13B)
0,00149 USD
1,95 USD
23,50 USD
Llama 2 Pretrained (70B) 0,00799 USD
1,95 USD 23,50 USD *Stockage de modèles personnalisés = 1,95 USD
Tarification du débit provisionné
Modèles Meta Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité de modèle pour un engagement de six mois Llama 2 Pretrained et Chat (13B)
21,18 USD
13,08 USD
Llama 2 Pretrained (70B) 21,18 USD
13,08 USD *Les modèles préentraînés de Llama 2 ne sont disponibles qu’en débit provisionné après personnalisation.
Pour plus de détails sur les unités de modèle, veuillez contacter l’équipe responsable de votre compte AWS ou l’équipe des ventes.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
Tarification à la demande
Modèle Stability AI Prix par image générée Stable Image Core 0,04 USD SD3 Large 0,08 USD Stable Image Ultra 0,14 USD Les modèles d’images de la génération précédente proposés par Stability AI sont facturés par image, en fonction du nombre d’étapes et de la résolution de l’image.
Modèle Stability AI Résolution de l’image Prix par image générée pour la qualité standard (<=50 étapes) Prix par image générée pour la qualité supérieure (>50 étapes) SDXL 1.0 Jusqu’à 1024 × 1024 0,04 USD 0,08 USD Tarification du débit provisionné
Modèle Stability AI Tarif horaire par unité modèle pour un engagement d’un mois* Tarif horaire par unité modèle pour un engagement de six mois* SDXL 1.0
49,86 USD
46,18 USD
**Comprend l’inférence pour les modèles de base et les modèles personnalisés
Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.
Actuellement, la personnalisation des modèles (ajustement) n’est pas prise en charge pour les modèles Stability AI sur Amazon Bedrock.
-
Importation de modèles personnalisés
-
Importation de modèles personnalisés
-
Llama
-
Lama multimodal
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisée par min* 0,0785 USD Coût de stockage mensuel par unité modèle personnalisée 1,95 USD Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées. *Facturé par créneaux de 5 minutes -
Lama multimodal
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisée par min* 0,0785 USD Coût de stockage mensuel par unité modèle personnalisée 1,95 USD Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.2 11B 128K nécessite 4 unités de modèle personnalisées. *Facturé par créneaux de 5 minutes -
Mistral
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisée par min* 0,0785 USD Coût de stockage mensuel par unité modèle personnalisée 1,95 USD Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Mistral 7B 32K nécessite 1 unité de modèle personnalisée. *Facturé par créneaux de 5 minutes -
Mixtral
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisée par min* 0,0785 USD Coût de stockage mensuel par unité modèle personnalisée 1,95 USD Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Mixtral 8x7B 32K nécessite 4 unités de modèle personnalisées. *Facturé par créneaux de 5 minutes -
Flan
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisée par min* 0,0785 USD Coût de stockage mensuel par unité modèle personnalisée 1,95 USD Les unités de modèle personnalisées nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisées nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Flan-T5 XL 512 nécessite 1 unité de modèle personnalisée. *Facturé par créneaux de 5 minutes
Tarification par inférence à la demande :
Vous êtes facturé dans des fenêtres de 5 minutes pour la durée pendant laquelle votre copie de modèle est active à compter de la première invocation réussie. La limite maximale de débit et de simultanéité par copie de modèle dépend de facteurs tels que la combinaison de jetons d’entrée/sortie, le type de matériel, la taille du modèle, l’architecture, les optimisations d’inférence et est déterminée lors du flux de travail d’importation du modèle.Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : Il existe un maximum par défaut de 3 copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.
-
Outils avancés de tarification (détails)
-
Garde-fous Amazon Bedrock
-
Évaluation du modèle
-
Garde-fous Amazon Bedrock
-
Garde-fous Amazon Bedrock
Politique en matière de barrières de protections *
Prix pour 1 000 unités de texte**
Filtres de contenu
0,75 USD
Sujets refusés
1 USD
Contrôle de l’ancrage contextuel***
0,1 USD
Filtre d’informations sensibles (PII)
0,1 USD
Filtre d’informations sensibles (expression régulière)
Gratuit
Filtres de mots
Gratuit
Tarification à la demande
* Chaque politique de barrière de protections est facultative et peut être activée en fonction des exigences de votre application. Des frais seront facturés en fonction du type de police utilisé pour la barrière de protections. Par exemple, si une barrière de protections est configurée avec des filtres de contenu et des sujets refusés, des frais seront facturés pour ces deux politiques, alors qu'aucun frais ne sera associé aux filtres d'informations sensibles.
**Une unité de texte peut contenir jusqu'à 1 000 caractères. Si une saisie de texte comporte plus de 1 000 caractères, elle est traitée comme plusieurs unités de texte, chacune contenant 1 000 caractères ou moins. Par exemple, si une saisie de texte contient 5 600 caractères, elle sera facturée pour 6 unités de texte.*** Le contrôle de l’ancrage contextuel utilise une source de référence et une requête pour déterminer si la réponse du modèle est fondée sur la source et pertinente pour la requête. Le nombre total d’unités de texte facturées est calculé en combinant tous les caractères de la source, de la requête et de la réponse du modèle.
Les barrières de protections ne sont pas prises en charge pour les images et les vectorisations.
-
Évaluation du modèle
-
Évaluation du modèle
L'évaluation du modèle est facturée pour l'inférence à partir du modèle que vous avez choisi. Les scores algorithmiques générés automatiquement sont fournis sans frais supplémentaires. Pour l'évaluation basée sur l'humain dans laquelle vous apportez votre propre flux de travail, l'inférence du modèle dans l'évaluation vous est facturée et des frais de 0,21 USD par tâche humaine effectuée vous sont facturés.
Modèle
Prix pour 1 000 jetons d’entrée
Prix pour 1 000 jetons de sortie
Prix par tâche humaine
Modèle sélectionné pour l'évaluation
Sur la base du modèle sélectionné
Sur la base du modèle sélectionné
0,21 USD
Exemples de tarification
-
AI21 labs
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD
-
Amazon
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Amazon Titan Text Lite pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base Amazon Titan Image Generator pour générer 1 000 images de taille 1 024 × 1 024 au format de qualité standard.
Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD
Tarification de la personnalisation (ajustement et pré-entraînement continu)
Un développeur d’applications personnalise un modèle Amazon Titan Image Generator à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer la performance du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.
Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot, + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 USD = 182,95 USD
Tarification du débit provisionné
Un développeur d’applications achète deux unités de modèles Amazon Titan Text Express avec un engagement d'un mois pour son cas d'utilisation de résumé de texte.
Coût mensuel total encouru = 2 unités de modèles x 18,40 USD/heure x 24 heures x 31 jours = 27 379,20 USD
Un développeur d’applications achète une unité de modèle du modèle de base Amazon Titan Image Generator avec un engagement d’un mois.
Coût total engagé = 1 unité modèle x 16,20 USD x 24 heures x 31 jours = 12 052,80 USD
-
Anthropic
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Anthropic Claude pour résumer une entrée de 11 000 jetons de texte d’entrée en une sortie de 4 000 jetons.
Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle Anthropic Claude Instant dans la région USA Ouest (Oregon) :
Coût mensuel total encouru = 1 unité de modèle x 39,60 USD x 24 heures x 31 jours = 29 462,40 USD
-
Cohere
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,0020 USD = 0,013 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command - Light pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Embed anglais ou multilingue pour générer des intégrations pour 10 000 jetons d’entrée.
Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD
Tarification de la personnalisation (ajustement)
Un développeur d’applications personnalise un modèle Cohere Command à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.
Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,50 USD) = 55,45 USD
Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 39,60 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle de Cohere Command avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 1 unité de modèle x 39,60 USD x 24 heures x 31 jours = 29 462,40 USD
-
Meta Llama
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Meta Llama 2 Chat (13B) pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.
Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD
Tarification de la personnalisation (ajustement)
Un développeur d’applications personnalise le modèle Llama 2 Pretrained (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.
Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,50 USD) = 33,44 USD
Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 21,18 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 1 unité de modèle x 21,18 USD x 24 heures x 31 jours = 15 757,92 USD
-
Mistral AI
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD
Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,008 USD + 1 000 jetons/1 000 x 0,024 USD = 0,04 USD
-
Stability AI
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille d’étape de 70 (qualité supérieure).
Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.0 pour générer une image de 1 024 x 1 024 avec une taille d’étape de 70 (qualité supérieure).
Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle de SDXL 1.0 avec un engagement d’un mois.
Coût total = 1 x 49,86 USD x 24 heures x 31 jours = 37 095,84 USD
-
Évaluation du modèle
Exemple d'évaluation du modèle 1 :
Tarification à la demande
Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).Le jeu de données contient 50 invites, et le développeur a besoin d’un travailleur pour évaluer chaque ensemble invite-réponse (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »).
Cette tâche d'évaluation comportera 50 tâches (1 tâche pour chaque paire d’invite-réponse par travailleur). Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.
Les frais suivants sont encourus pour ce travail d'évaluation de modèles :Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tâches humaines 50 0,21 USD 10,50 USD 10,50 USD Total 11,06 USD Exemple d'évaluation du modèle 2 :
Tarification à la demande
Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).
Le jeu de données contient 50 invites, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble invites-réponses (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »). Ce travail d'évaluation comportera 100 tâches (1 tâche pour chaque ensemble invites-réponses par travailleur : 2 travailleurs x 50 ensembles invites-réponses = 100 tâches humaines).
Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.
Les frais suivants sont encourus pour ce travail d'évaluation de modèles :
Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total Inférence instantanée Claude 5 000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tâches humaines 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Garde-fous Amazon Bedrock
Exemple 1 : chatbot d'assistance à la clientèle
Un développeur d'applications crée un chatbot d'assistance à la clientèle et utilise des filtres de contenu pour bloquer le contenu préjudiciable et les sujets refusés pour filtrer les requêtes et les réponses indésirables.
Le chatbot répond à 1 000 requêtes d'utilisateurs par heure. Chaque requête utilisateur a une longueur d'entrée moyenne de 200 caractères et reçoit une réponse FM de 1 500 caractères.
Chaque requête utilisateur de 200 caractères correspond à une unité de texte.
Chaque réponse FM de 1 500 caractères correspond à 2 unités de texte.
Unités de texte traitées chaque heure = (1 + 2) x 1 000 requêtes = 3 000 unités de texte
Coût total par heure pour les filtres de contenu et les sujets refusés = 3 000 x (0,75 USD + 1,00 USD) / 1 000 = 5,25 USDExemple 2 : résumé des transcriptions d’un centre d'appels
Un développeur d'applications crée une application pour résumer les transcriptions des discussions entre les utilisateurs et les agents d’assistance. Il utilise un filtre d'informations sensibles pour supprimer les données d’identification personnelles (PII) dans les résumés générés pour 10 000 conversations.
Chaque résumé généré comporte en moyenne 3 500 caractères, ce qui correspond à 4 unités de texte.
Coût total engagé pour résumer 10 000 conversations = 10 000 x 4 x (0,1 / 1 000 USD) = 4 USDÉlément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tâches humaines 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Importation de modèles personnalisés
Exemple de tarification : un développeur d'applications importe un modèle de type Llama 3.1 personnalisé d'une taille de paramètre 8B avec une longueur de séquence de 128 Ko dans la région us-est-1 et supprime le modèle au bout d'un mois. Cela nécessite 2 unités de modèle personnalisées. Ainsi, le prix par minute sera de 0,1570 USD car 2 unités de modèle personnalisées sont requises. Les coûts de stockage des modèles pour 2 unités modèles personnalisées seraient de 3,90 USD par mois.
L’importation du modèle est gratuite. La première invocation réussie a lieu à 8 h 03, heure à laquelle le comptage commence. Les fenêtres de comptage de 5 minutes vont de 8 h 03 à 8 h 07 ; de 8 h 07 à 8 h 11, etc. S’il y a au moins une invocation pendant une période de 5 minutes, la fenêtre sera considérée comme active pour la facturation. S'il n’y a pas d’invocation entre 8 h 07 et 8 h 11, le compteur s’arrêtera à 8 h 11. Dans ce cas, la facture serait calculée comme suit : 0,1570 USD * 5 minutes * 3 fenêtres de cinq minutes = 2,355 USD.