国内主流厂商
DeepSeek
- 最新模型:DeepSeek-V3、DeepSeek-R1
- 定价特点:
- 输入/输出分开计费:输入token价格通常低于输出
- 批量优惠:用量越大单价越低
- 免费额度:新用户通常有试用额度
- 参考价格(以32K上下文为例):
- 输入:约 ¥0.2-0.5 / 1K tokens
- 输出:约 ¥0.8-2.0 / 1K tokens
- 适用场景:通用对话、代码生成、逻辑推理
百度文心一言(ERNIE)
- 模型:ERNIE 4.0、ERNIE 3.5等
- 计费方式:
- 按调用次数或tokens计费
- 有套餐包和按量付费两种模式
- 参考价格:
- 标准版:约 ¥0.004-0.008元/千tokens
- 高级版:约 ¥0.012-0.02元/千tokens
阿里通义千问
- 模型:Qwen-Max、Qwen-Plus等
- 定价特点:
- 分模型等级定价
- 预付费套餐包有折扣
- 参考价格:
- Qwen-Plus:约 ¥0.02元/千tokens
- Qwen-Max:约 ¥0.12元/千tokens
腾讯混元
- 定价模式:
- 按调用量阶梯计价
- 有企业定制方案
- 参考价格:约 ¥0.01-0.05元/千tokens
国外主流厂商
OpenAI
- 模型:GPT-4o、GPT-4 Turbo、GPT-3.5 Turbo
- 定价(美元计费):
- GPT-4o:
- 输入:$2.50 / 1M tokens
- 输出:$10.00 / 1M tokens
- GPT-4 Turbo:
- 输入:$10.00 / 1M tokens
- 输出:$30.00 / 1M tokens
- GPT-3.5 Turbo:
- 输入:$0.50 / 1M tokens
- 输出:$1.50 / 1M tokens
- GPT-4o:
Anthropic Claude
- 模型:Claude 3 Opus/Sonnet/Haiku
- 定价:
- Claude 3 Opus:$15 / 1M tokens输入,$75 / 1M tokens输出
- Claude 3 Sonnet:$3 / 1M tokens输入,$15 / 1M tokens输出
- Claude 3 Haiku:$0.25 / 1M tokens输入,$1.25 / 1M tokens输出
Google Gemini
- 模型:Gemini 1.5 Pro/Flash
- 定价:
- Gemini 1.5 Pro:
- 输入:$3.50 / 1M tokens
- 输出:$10.50 / 1M tokens
- Gemini 1.5 Flash:
- 输入:$0.075 / 1M tokens
- 输出:$0.30 / 1M tokens
- Gemini 1.5 Pro:
定价影响因素
计费维度
- Tokens数量:最主流的计费方式,1个token≈0.75个英文单词或1个中文字符
- API调用次数:部分服务商按请求次数收费
- 上下文长度:长上下文窗口通常单价更高
- 推理时间:复杂任务可能额外收费
影响价格的关键因素
- 模型能力:越强大的模型越贵
- 使用场景:商业用途可能比研究用途价格高
- 承诺用量:年度承诺或大额预付费有折扣
- 区域差异:不同地区定价可能不同
成本优化建议
- 选择合适模型:根据任务复杂度选择性价比最高的模型
- 优化提示词:减少不必要的tokens使用
- 使用缓存:对重复性内容进行缓存
- 监控用量:设置用量警报,避免意外费用
- 考虑混合使用:简单任务用便宜模型,复杂任务用强模型
注意事项
- 价格变动:大模型API价格经常调整,以官网最新信息为准
- 隐藏成本:注意网络流量、存储等附加费用
- 合规要求:国内企业需注意数据出境合规问题
- 服务稳定性:选择有SLA保障的服务商
免费替代方案
- 学术用途:部分厂商提供学术免费额度
- 开源模型:可自行部署Llama、Qwen等开源模型
- 社区版API:部分服务商有限制的免费版本
建议根据具体需求(如语言支持、响应速度、准确性要求等)选择合适的服务商,并在使用前详细阅读定价文档,最好进行小规模测试再扩大使用。

版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。