主要观点:生成式 AI 相对便宜,人们常认为大型语言模型运行成本高但实际并非如此,以网络搜索为例进行对比,说明 LLM 价格低廉且成本在下降,虽有反对意见但通过多方面分析可反驳,这对理解 AI 财务状况等有重要意义,同时指出真正成本问题在 AI 所需的后端服务。
关键信息:
- 公共 API 定价:Gemini API 接地搜索为$35/1k 查询,Bing Search API 最便宜层为$15/1k 查询,Brave 最便宜层为$5/1k 搜索。
- LLM 测试示例及价格:如 Gemini 2.5 Flash 不同查询的 token 数及价格,不同模型的价格差异。
- 反对意见及反驳:如典型 LLM 响应更长、API 价格被补贴、搜索 API 价格包含更多成本等,通过多方面分析进行反驳。
- 敏感性分析工具:Open in new tab。
- 重要意义:影响对 AI 公司财务状况的看法,后端服务可能成为真正成本问题,AI 与后端服务的关系及可能的发展等。
重要细节: - 推理成本比模型进步更快,常见定价模型难可视化。
- 许多模型有更灵活调度的低价选项,未在表中体现。
- OpenAI 报告亏损但实际成本不高,主要是未对免费用户 monetize。
- 有关于 LLM 成本结构等的多篇研究论文作为参考。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。