新榜讯 8月26日消息,阿里云大模型服务平台百炼发布部分模型上下文缓存降价通告。此次调价后,在请求部分模型且命中缓存的情况下,命中的输入Token将按照cached_token进行计费,其单价从调价前input_token单价的40%降至input_token单价的20%;而未被命中的输入Token则按标准input_token计费。
扫描二维码
手机浏览
阿里云百炼宣布部分模型上下文缓存降价
分享文章链接
相似推荐

DeepSeek线上模型版本升级至V3.1
新榜讯 《DeepSeek线上模型版本升级至V3.1,上下文长度拓展至128k》 日前,DeepSeek线上模型版本完成重要升级,已正式更新至V3.1,其上下文长度也随之拓展至128k。

OpenAI发布GPT-4.1:百万token上下文、编程能力提升
新榜讯 OpenAI 重磅推出三款 GPT-4.1 系列模型,分别为 GPT-4.1、GPT-4.1 mini 以及 GPT-4.1 nano,此系列模型仅能通过 API 加以使用。

阿里云:大模型服务平台百炼部分历史模型将于7月2日下线
新榜讯 4 月 3 日消息,据阿里云官网通知,其大模型服务平台百炼的部分历史模型将于 2025 年 7 月 2 日下线。