Amazon Bedrock 定价
定价概述
Amazon Bedrock 是一项完全托管的服务,可通过单个 API 提供多种高性能基础模型(FM),同时还提供一系列您所需的广泛功能,用于构建支持安全性、隐私性和负责任人工智能原则的生成式人工智能应用。
使用 Amazon Bedrock,您需要为模型的推理和自定义支付费用。有两种推理定价方案供您选择: 1.按需和批量:此模式允许您按照即用即付的原则使用基础模型,无需承诺使用期限。2.预配置吞吐量:此模式允许您预先配置足够的吞吐量,以满足应用程序的性能要求,作为交换,您需要承诺使用期限。
定价模式
高级工具
定价详细信息
定价取决于模式、提供商和模型。请选择模型提供商以查看详细定价。
Amazon Bedrock 提供来自领先 AI 提供商 [如 Anthropic、Meta、Mistral AI 和 Amazon)] 的精选基础模型(FM),用于批量推理,价格比按需推理定价低 50%。请参阅此处的模型列表。
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
自定义模型导入
-
AI21 Labs
-
AI21 Labs
按需定价
AI21 Labs 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 Jamba 1.5 Large 0.002 USD 0.008 USD Jamba 1.5 Mini 0.0002 USD 0.0004 USD Jurassic-2 Mid 0.0125 美元 0.0125 美元 Jurassic-2 Ultra 0.0188 美元 0.0188 USD Jamba-Instruct 0.0005 USD 0.0007 USD -
Amazon
-
Amazon
-
Anthropic
-
Anthropic
按需和批量定价
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3.5 Sonnet**
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3.5 Haiku
0.001 USD
0.005 USD
0.0005 USD
0.0025 USD
Claude 3 Opus*
0.015 USD
0.075 USD
0.0075 USD
0.0375 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 2.1
0.008 USD
0.024 USD
不适用
不适用
Claude 2.0
0.008 USD
0.024 USD
不适用
不适用
Claude Instant
0.0008 USD
0.0024 USD
不适用
不适用
*Claude 3 Opus 目前在美国西部(俄勒冈州)区域提供 **Claude 3.5 Sonnet 的定价适用于每个版本的 Claude 3.5 Sonnet(v1 和 v2)— Claude 3.5 Sonnet v2 目前在美国西部(俄勒冈州)区域可用 区域:欧洲地区(伦敦)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD 0.0075 USD Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD 0.000625 USD
区域:欧洲(苏黎世)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3.5 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
区域:南美洲(圣保罗)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
区域:加拿大(中部)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
区域:亚太地区(孟买)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
区域:亚太地区(悉尼)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
区域:亚太地区(东京)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude Instant
0.0008 USD
0.0024 USD
不适用
不适用
Claude 2.0/2.1
0.008 USD
0.024 USD
不适用
不适用
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3.5 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
区域:亚太地区(新加坡)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude Instant
0.0008 USD
0.0024 USD
0.0004 USD
0.0012 USD
Claude 2.0/2.1
0.008 USD
0.024 USD
0.004 USD
0.012 美元
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3.5 Sonnet
0.003 USD
0.015 USD
不适用
不适用
区域:欧洲地区(巴黎)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
区域:欧洲地区(法兰克福)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude Instant
0.0008 USD
0.0024 USD
不适用
不适用
Claude 2.0/2.1
0.008 USD
0.024 USD
不适用
不适用
Claude 3 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3.5 Sonnet
0.003 USD
0.015 USD
0.0015 USD
0.0075 USD
Claude 3 Haiku
0.00025 USD
0.00125 USD
0.000125 USD
0.000625 USD
区域:亚太地区(首尔)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3.5 Sonnet
0.003 USD
0.015 USD
不适用
不适用
Claude 3 Haiku
0.00025 USD
0.00125 USD
不适用
不适用
区域:美国东部(俄亥俄州)
Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) Claude 3.5 Sonnet
0.003 USD
0.015 USD
不适用
不适用
Claude 3 Haiku
0.00025 USD
0.00125 USD
不适用
不适用
预配置吞吐量定价
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
Anthropic 模型 每个模型的每小时价格
无承诺期1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格 Claude Instant
44.00 USD 39.60 USD
22.00 美元
Claude 2.0/2.1
70.00 USD 63.00 USD
35.00 USD
Anthropic 模型 每个模型的每小时价格
无承诺期1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格 Claude Instant
44.00 USD 39.60 USD
22.00 美元
Claude 2.0/2.1
70.00 USD 63.00 USD
35.00 美元
区域:亚太地区(东京)
Anthropic 模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格 Claude Instant
53.00 美元
29.00 美元
Claude 2.0/2.1
86.00 美元
48.00 美元
区域:欧洲地区(法兰克福)
Anthropic 模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格 Claude Instant
49.00 美元
27.00 美元
Claude 2.0/2.1
79.00 美元
44.00 美元
请联系您的 AWS 账户团队,了解有关模型单元的更多详细信息。
-
Cohere
-
Cohere
按需定价
Cohere 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 命令 0.0015 美元 0.0020 美元 Command-Light 0.0003 美元 0.0006 USD Command R+ 0.0030 USD 0.0150 USD Command R 0.0005 USD 0.0015 USD Embed — 英语 0.0001 USD 不适用 Embed — 多语言 0.0001 USD 不适用 定制(微调)的定价:
Cohere 模型 训练 1000 个令牌的价格 每个自定义模型每月的存储价格 自定义模型每个模型单元每小时推理的价格(无承诺预配置吞吐量定价) Cohere Command
0.004 美元
1.95 美元
49.50 美元
Cohere Command-Light 0.001 美元 1.95 美元
8.56 美元 *训练的总令牌数 = 训练数据语料库中的令牌数量 x 训练周期数
预配置吞吐量定价
Cohere 模型 每个模型的每小时价格
无承诺期1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格
Cohere Command
49.50 USD 39.60 USD
23.77 USD
Cohere Command - Light 8.56 USD 6.85 USD
4.11 USD Embed — 英语 7.12 USD 6.76 USD
6.41 USD Embed — 多语言 7.12 USD 6.76 USD
6.41 USD 请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。
-
Meta Llama
-
Meta Llama
Llama 3.2
按需和批量定价
Llama 3.1
按需和批量定价
模型定制(微调)的定价
预配置吞吐量定价
Llama 3
按需定价
Llama 2
按需定价
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
元模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 Llama 2 Chat (13B)
0.00075 USD
0.001 USD
Llama 2 Chat (70B) 0.00195 美元
0.00256 USD 模型定制(微调)的定价:
元模型 训练 1000 个令牌的价格 每个自定义模型*每月的存储价格 自定义模型使用 1 个模型单元进行推理的每小时价格(无承诺期的预配置吞吐量定价) Llama 2 预训练(13B)
0.00149 USD
1.95 美元
23.50 USD
Llama 2 预训练(70B) 0.00799 美元
1.95 美元 23.50 美元 *自定义模型存储空间 = 1.95 美元
预配置吞吐量定价
元模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格 Llama 2 预训练和聊天(13B)
21.18 USD
13.08 USD
Llama 2 预训练(70B) 21.18 USD
13.08 美元 *Llama 2 预训练模型仅在定制后的预配置吞吐量中可用。
请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
按需定价
Stability AI 模型 生成每张图像的价格 Stable Image Core 0.04 USD SD3 Large 0.08 USD Stable Image Ultra 0.14 USD Stability AI 提供的上一代图像模型按图像定价,具体取决于步数和图像分辨率。
Stability AI 模型 图像分辨率 生成每张高质量图像的价格(<=50 步) 生成每张高质量图像的价格(>50 步) SDXL 1.0 最多 1024 x 1024 0.04 美元 0.08 USD 预配置吞吐量定价
Stability AI 模型 1 个月承诺期内,每个模型单元的每小时价格* 6 个月承诺期内,每个模型单元的每小时价格* SDXL 1.0
49.86 美元
46.18 USD
*包含基础模型和自定义模型的推理
请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。
目前,Amazon Bedrock 上的 Stability AI 模型不支持模型自定义(微调)。
-
自定义模型导入
-
自定义模型导入
-
Llama
-
Multimodal Llama
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
自定义模型单元版本 v1.0 每个自定义模型单元的每分钟价格* 0.0785 USD 每个自定义模型单元的每月存储成本 1.95 美元 托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Llama 3.1 8B 128K 模型需要 2 个自定义模型单元,Llama 3.1 70B 128k 模型需要 8 个自定义模型单元。 *按 5 分钟计费 -
Multimodal Llama
-
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
自定义模型单元版本 v1.0 每个自定义模型单元的每分钟价格* 0.0785 USD 每个自定义模型单元的每月存储成本 1.95 美元 托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Llama 3.2 11B 128K 模型需要 4 个自定义模型单元。 *按 5 分钟计费 -
Mistral
-
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
自定义模型单元版本 v1.0 每个自定义模型单元的每分钟价格* 0.0785 USD 每个自定义模型单元的每月存储成本 1.95 美元 托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Mistral 7B 32K 模型需要 1 个自定义模型单元。 *按 5 分钟计费 -
Mixtral
-
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
自定义模型单元版本 v1.0 每个自定义模型单元的每分钟价格* 0.0785 USD 每个自定义模型单元的每月存储成本 1.95 美元 托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Mixtral 8x7B 32K 模型需要 4 个自定义模型单元。 *按 5 分钟计费 -
Flan
-
区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)
自定义模型单元版本 v1.0 每个自定义模型单元的每分钟价格* 0.0785 USD 每个自定义模型单元的每月存储成本 1.95 美元 托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Flan-T5 XL 512 模型需要 1 个自定义模型单元。 *按 5 分钟计费
按需推理定价:
从第一次成功调用开始,在模型副本处于活动状态期间,将按 5 分钟的时间窗口向您收费。每个模型副本的最大吞吐量和并发限制取决于输入/输出令牌组合、硬件类型、模型大小、架构、推理优化等因素,并在模型导入工作流程中确定。Bedrock 会根据您的使用模式自动扩展模型副本的数量。如果 5 分钟内没有调用,Bedrock 将缩减到零,并在您调用模型时向上扩展。在向上扩展时,可能会出现一段冷启动持续时间(以十秒为单位),具体取决于模型大小。如果您的推理量持续超过单个模型副本的并发限制,Bedrock 还会增加模型副本的数量。注意:每个帐户每个导入模型的默认最大模型副本数为 3 个,可以通过服务配额增加。
-
定价高级工具(详情)
-
Amazon Bedrock 护栏
-
模型评测
-
Amazon Bedrock 护栏
-
Amazon Bedrock 护栏
护栏策略*
每 1000 个文本单元的价格**
内容过滤器
0.75 USD
被拒绝的话题
1 USD
上下文基础检查***
0.1 USD
敏感信息过滤器(PII)
0.1 USD
敏感信息过滤器(正则表达式)
免费
文字过滤器
免费
按需定价
* 每项护栏策略都是可选的,可以根据您的应用程序要求启用。费用将根据防护机制中使用的策略类型而定。例如,如果在防护机制上配置了内容过滤器和被拒绝的话题,则会产生与这两项策略相关的费用,而不会产生与敏感信息过滤器相关的费用。
**文本单元最多可包含 1000 个字符。如果文本输入超过 1000 个字符,则将其作为多个文本单元进行处理,每个文本单元包含不超过 1000 个字符。例如,如果文本输入包含 5600 个字符,则将按照 6 个文本单元收费。*** 上下文基础检查使用参考源和查询来确定模型响应是否基于源并与查询相关。收费文本单元总数是通过合并源、查询和模型响应中的所有字符来计算的。
图像和嵌入不支持护栏。
-
模型评测
-
模型评测
模型评测根据通过所选模型进行的推断收费。自动生成的算法分数不收取额外费用。对于自带工作流团队的人工评估,您需要为评估中的模型推理付费,并且每完成一个人工任务需支付 0.21 美元的费用。
型号
每 1000 个输入令牌的价格
每 1000 个输出令牌的价格
每项人工任务的价格
选定进行评测的模型
基于所选模型
基于所选模型
0.21 USD
定价示例
-
AI21 labs
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 AI21 的 Jurasic-2 Mid 模型将 1 万个令牌的输入文本总结成 2000 个令牌的输出。
产生的总成本 = 1 万个令牌/1000 * 0.0125 美元 + 2000 个令牌/1000 * 0.0125 美元 = 0.15 美元
-
Amazon
按需定价
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Amazon Titan Text Lite 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。
每小时产生的总成本为 = 2000 个令牌/1000 * 0.0003 美元 + 1000 个令牌/1000 * 0.0004 美元 = 0.001 美元。
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Amazon Titan 图像生成器基础模型生成 1000 张大小为 1024 x 1024 的标准质量图像。
产生的总成本 = 1000 张图像 * 每张图像 0.01 美元 = 10 美元
定制(微调和持续预训练)定价
应用程序开发人员使用 1000 个图像文本对自定义 Amazon Titan 图像生成器模型。训练结束后,开发人员使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。
微调产生的每月成本为:微调训练(0.005 美元 * 500 * 64),其中 0.005 美元是每张图像的价格,500 是步骤数,64 是批量大小 + 每月自定义模型存储(1.95 美元)+ 一小时的自定义模型推理(21 美元)= 160 美元 + 1.95 美元 + 21 = 182.95 美元
预配置吞吐量定价
应用程序开发人员购买了两个 Amazon Titan Text Express 模型单元,用于处理文本摘要,承诺期为 1 个月。
每月产生的总成本 = 2 个模型单元 * 18.40 美元/小时 * 24 小时 * 31 天 = 27379.20 美元
应用程序开发人员购买了一个基本 Amazon Titan 图像生成器模型的模型单元,承诺期为 1 个月。
产生的总成本 = 1 个模型单元 * 16.20 美元 * 24 小时 * 31 天 = 12052.80 美元
-
Anthropic
按需定价
应用程序开发人员在美国西部(俄勒冈州)对 Amazon Bedrock 执行了以下 API 调用:请求 Anthropic 的 Claude 模型将 1.1 万个令牌的输入文本总结成 4000 个令牌的输出。
产生的总成本 = 1.1 万个令牌/1000 * 0.008 美元 + 4000 个令牌/1000 * 0.024 美元 = 0.088 美元 + 0.096 美元 = 0.184 美元
预配置吞吐量定价
一位应用程序开发人员在美国西部(俄勒冈州)区域购买了 Anthropic Claude Instant 的一个模型单元:
每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元
-
Cohere
按需定价
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command 模型将 6000 个令牌的输入文本总结成 2000 个令牌的输出。
产生的总成本 = 6000 个令牌/1000 * 0.0015 美元 + 2000 个令牌/1000 * 0.0020 美元 = 0.013 美元
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command-Light 模型将 6000 个令牌的输入文本总结成 2000 个令牌的输出。
产生的总成本 = 6000 个令牌/1000 * 0.0003 美元 + 2000 个令牌/1000 * 0.0006 美元 = 0.003 美元
应用程序开发人员对 Amazon Bedrock 进行了以下 API 调用:请求 Cohere 的 Embed 英语或 Embed 多语言模型为 1 万个输入令牌生成嵌入。
产生的总成本为 = 1 万个令牌/1000 * 0.0001 美元 = 0.001 美元
自定义(微调)定价
应用程序开发人员使用 1000 个数据令牌自定义 Cohere 命令模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。
微调产生的每月成本 = 微调训练(0.004 美元 * 1000 美元)+ 每月自定义模型存储(1.95 美元)+ 1 小时自定义模型推理(49.50 美元)= 55.45 美元
自定义模型的预置吞吐量(1 个月承诺期)产生的每月成本 = 39.60 美元
预配置吞吐量定价
应用程序开发人员购买了一个 Cohere Command 模型单元,用于处理文本摘要,承诺期为 1 个月。
每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元
-
Meta Llama
按需定价
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Meta 的 Llama 2 Chat(13B)模型将 2000 个令牌的输入文本总结成 500 个令牌的输出。
产生的总成本为 = 2000 个令牌/1000 * 0.00075 美元 + 500 个令牌/1000 * 0.001 美元 = 0.002 美元
自定义(微调)定价
应用程序开发人员使用 1000 个数据令牌自定义 Llama 2 预训练(70B)模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。
每月微调产生的费用为:微调训练(0.00799 美元 x 1000)+ 每月自定义模型存储空间(1.95 美元)+ 一小时的自定义模型推理(23.50 美元)= 33.44 美元
自定义模型的预配置吞吐量(1 个月承诺期)产生的每月成本 = 21.18 美元
预配置吞吐量定价
应用程序开发人员购买了一个 Meta Llama 2 模型单元,用于处理文本摘要,承诺期为 1 个月。
每月产生的总成本 = 1 个模型单元 * 21.18 美元 * 24 小时 * 31 天 = 15757.92 美元
-
Mistral AI
按需定价
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral 7B 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。
每小时产生的总成本为 = 2000 个令牌/1000 * 0.00015 美元 + 1000 个令牌/1000 * 0.0002 美元 = 0.0005 美元
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mixtral 8x7B 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。
每小时产生的总成本为 = 2000 个令牌/1000 * 0.00045 美元 + 1000 个令牌/1000 * 0.0007 美元 = 0.0016 美元
应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral Large 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。
每小时产生的总成本为 = 2000 个令牌/1000 * 0.008 美元 + 1000 个令牌/1000 * 0.024 美元 = 0.04 美元
-
Stability AI
按需定价
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL 模型生成尺寸为 512 x 512、步长为 70(高质量)的图像。
产生的总成本 = 1 张图像 * 每张图像 0.036 美元 = 0.036 美元
应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL 1.0 模型生成尺寸为 1024 x 1024、步长为 70(高质量)的图像。
产生的总成本 = 1 张图像 * 每张图像 0.08 美元 = 0.08 美元
预配置吞吐量定价
应用程序开发人员购买了一个 SDXL 1.0 模型单元,承诺期为 1 个月。
产生的总成本 = 1 * 49.86 美元 * 24 小时 * 31 天 = 37,095.84 美元
-
模型评估
模型评估示例 1:
按需定价
一位应用程序开发人员在美国东部(弗吉尼亚州北部)AWS 区域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant 提交了一个数据集,用于基于人体的模型评估。该数据集包含 50 个提示,开发人员需要 1 个工作人员对每个提示响应集进行评分(可在评估作业创建中配置为“每个提示的工作人员”参数)。
此评估作业中将有 50 个任务(每个工作人员的每组提示响应有 1 个任务)。50 个提示总计 5000 个输入令牌,相关响应总计为 1.5 万个 Anthropic Claude Instant 令牌和 2 万个 Anthropic Claude 2.1 令牌。
此模型评估作业会产生以下费用:项目 输入令牌的数量 每 1000 个输入令牌的价格 输入成本 输出令牌的数量 每 1000 个输出令牌的价格 输出成本 人工任务数量 每项人工任务的价格 人工任务的成本 合计 Claude Instant Inference 5000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD 0.04 USD Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20000 0.024 USD 0.48 USD 0.52 USD 人工任务 50 0.21 USD 10.50 USD 10.50 USD 合计 11.06 美元 模型评估示例 2:
按需定价
一位应用程序开发人员在美国东部(弗吉尼亚州北部)AWS 区域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant 提交了一个数据集,用于基于人体的模型评估。
该数据集包含 50 个提示,开发人员需要 2 个工作人员对每个提示响应集进行评分(可在评估作业创建中配置为“每个提示的工作人员”参数)。此评估作业中将有 100 个任务(每个工作人员的每组提示响应有 1 个任务:2 个工作人员 x 50 个提示响应集 = 100 个人工任务)。
50 个提示总计 5000 个输入令牌,相关响应总计为 1.5 万个 Anthropic Claude Instant 令牌和 2 万个 Anthropic Claude 2.1 令牌。
此模型评估作业会产生以下费用:
项目 输入令牌的数量 每 1000 个输入令牌的价格 输入成本 输出令牌的数量 每 1000 个输出令牌的价格 输出成本 人工任务数量 每项人工任务的价格 人工任务的成本 合计 Claude Instant Inference 5000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD 0.04 USD Claude 2.1 Inference 5000 0.008 USD 0.0400 USD 20000 0.024 USD 0.48 USD 0.52 USD 人工任务 100 0.21 USD 21.00 USD 21.00 USD 合计 21.56 美元 -
Amazon Bedrock 护栏
示例 1:客户支持聊天机器人
应用程序开发人员创建客户支持聊天机器人,使用内容过滤器屏蔽有害内容,使用被拒绝的话题来过滤不必要的查询和响应。
聊天机器人每小时处理 1000 个用户查询。每个用户查询的平均输入长度为 200 个字符,收到 1500 个字符的 FM 响应。
每个 200 个字符的用户查询对应 1 个文本单元。
每个 1500 个字符的 FM 响应对应 2 个文本单元。
每小时处理的文本单位 = (1 + 2) * 1000 个查询 = 3000 个文本单元
内容过滤器和被拒绝的主题每小时产生的总费用 = 3000 *(0.75 美元 + 1.00 美元)/1000 = 5.25 美元示例 2:呼叫中心听录文本摘要
应用程序开发人员创建了一个应用程序来总结用户和支持座席之间的聊天记录。它使用敏感信息过滤器来编辑 10000 个对话生成的摘要中的个人身份信息(PII)。
生成的每个摘要平均包含 3500 个字符,对应 4 个文本单元。
总结 10000 个对话所产生的总成本 = 10000 * 4 * (0.1/1000 美元) = 4 美元项目 输入令牌的数量 每 1000 个输入令牌的价格 输入成本 输出令牌的数量 每 1000 个输出令牌的价格 输出成本 人工任务数量 每项人工任务的价格 人工任务的成本 合计 Claude Instant Inference 5000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD 0.04 USD Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20000 0.024 USD 0.48 USD 0.52 USD 人工任务 100 0.21 USD 21.00 USD 21.00 USD 合计 21.56 USD -
自定义模型导入
定价示例:应用开发人员在 us-east-1 区域导入了一个自定义的 Llama 3.1 类型模型,该模型大小为 8B 参数,序列长度为 128K,并在 1 个月后删除了该模型。这需要 2 个自定义模型单元。因此,每分钟的价格将为 0.1570 USD,因为需要 2 个自定义模型单元。当月 2 个自定义模型单元的模型存储成本为 3.90 USD。
导入模型不收取任何费用。第一次成功调用是在上午 8:03,此时开始计量。5 分钟的计量窗口为上午 8:03 至上午 8:07;上午 8:07 至上午 8:11,依此类推。如果在任何 5 分钟时间段内有至少一次调用,则该窗口将被视为活跃的计费窗口。如果从上午 8:07 到上午 8:11 没有调用,则计量将在上午 8:11 停止。在这种情况下,账单的计算方式如下:0.1570 USD * 5 分钟 * 3 个五分钟窗口 = 2.355 USD。