Claude Code /cost 详解:你的 AI 编程到底花了多少钱
为什么需要 /cost
用 Claude Code 开发,你最关心什么?
除了代码质量和效率,恐怕就是钱了。
如果你是 API Key 用户,每次对话都在产生费用。一个复杂的 debug 会话、一次大规模重构,到底花了多少钱?不看不知道,看了可能吓一跳。
如果你是 Max/Pro 订阅用户,虽然不按次收费,但你肯定想知道自己的额度用了多少,是不是快超了。
/cost 就是让你随时掌握花费的命令。
/cost 是什么
/cost 是 Claude Code 的会话成本查看命令。它显示当前会话中累计的 API 调用费用、时间消耗和代码变更统计。
在交互模式下输入:
/cost
你会看到类似这样的输出:
Total cost: $0.4832
Total duration (API): 3 mins 12 secs
Total duration (wall): 8 mins 45 secs
Total code changes: 156 lines added, 43 lines removed
Usage by model:
claude-opus-4-6: 12,450 input, 3,280 output, 45,600 cache read, 8,200 cache write ($0.42)
claude-sonnet-4-6: 2,100 input, 890 output ($0.02)
一目了然。
谁能看到 /cost
这里有个重要的区分:
API Key 用户
如果你使用 API Key 访问 Claude Code,/cost 会显示完整的费用明细。每一笔调用都在计费,你需要知道花了多少。
Max/Pro 订阅用户
如果你是 Claude.ai 的订阅用户,/cost 命令默认是隐藏的。因为你用的是订阅制,不按调用收费。
输入 /cost 后,你会看到:
You are currently using your subscription to power your Claude Code usage
或者如果你的订阅额度用完了,正在使用超额部分:
You are currently using your overages to power your Claude Code usage.
We will automatically switch you back to your subscription rate limits when they reset
想看详细费用? 可以通过环境变量强制显示:设置 DISABLE_COST_WARNINGS=false 不会改变这个行为,因为订阅用户的成本显示逻辑是独立的。这个功能主要面向 API Key 用户。
费用怎么算的
这部分是硬核干货。Claude Code 内置了完整的模型定价表,基于 API 官方价格实时计算费用。
模型定价(每百万 Token)
| 模型 | 输入 | 输出 | 缓存读取 | 缓存写入 |
|---|---|---|---|---|
| Haiku 3.5 | $0.80 | $4 | $0.08 | $1.00 |
| Haiku 4.5 | $1 | $5 | $0.10 | $1.25 |
| Sonnet 4.x | $3 | $15 | $0.30 | $3.75 |
| Opus 4 / 4.1 | $15 | $75 | $1.50 | $18.75 |
| Opus 4.5 | $5 | $25 | $0.50 | $6.25 |
| Opus 4.6 | $5 | $25 | $0.50 | $6.25 |
| Opus 4.6 (fast) | $30 | $150 | $3.00 | $37.50 |
注意两个关键点:
-
Opus 4.6 的 fast 模式贵 6 倍。这就是
/fast的代价——同样的模型,更快的输出,但每个 Token 的价格翻了 6 倍。所以/fast适合短任务,不适合长篇大论。 -
缓存读取只有输入价格的 10%。Claude Code 大量使用 Prompt Cache(系统提示、CLAUDE.md 等),这意味着重复上下文的成本非常低。
计算公式
费用 = 输入 Token × 输入单价
+ 输出 Token × 输出单价
+ 缓存读取 Token × 缓存读取单价
+ 缓存写入 Token × 缓存写入单价
+ 网络搜索次数 × $0.01
每次 API 调用完成后,Claude Code 从响应头中提取实际 Token 用量,乘以对应模型的单价,累加到会话总费用中。
/cost 显示哪些信息
/cost 的输出包含五个维度:
1. 总费用(Total cost)
当前会话累计的 API 调用费用,单位美元,精确到小数点后四位。
如果会话中使用了不在定价表中的模型(比如某个内测模型),会显示警告:费用可能不准确。
2. API 时间(Total duration - API)
所有 API 调用的纯耗时之和。不包括你思考的时间、工具执行的时间,只算 Claude 在”想”的时间。
3. 总时间(Total duration - wall)
从会话开始到现在的实际挂钟时间。API 时间 vs 总时间的差距,就是你”等待之外”的时间。
4. 代码变更(Total code changes)
当前会话中新增和删除的代码行数。让你直观地感受到”这次对话的产出”。
5. 模型明细(Usage by model)
按模型分别列出 Token 用量:输入、输出、缓存读取、缓存写入,以及每个模型的费用小计。
如果你在会话中切换了模型(比如先用 Opus 做分析,再切 Sonnet 做简单修改),这里会分别列出。
费用持久化
Claude Code 会把费用数据保存到项目配置中,包括:
- 总费用金额
- API 调用总时长
- 各模型 Token 用量明细
- 会话 ID(用于判断是否是同一个会话)
这意味着如果你用 /resume 恢复了之前的会话,费用数据也会一起恢复,保持连续性。
但要注意:这个持久化是按会话的。新会话的费用从零开始。
实际使用建议
定期检查
养成习惯,在长会话中定期输入 /cost 看看花了多少。特别是在做以下事情时:
- 大规模重构(大量代码上下文 = 大量 Token)
- 反复调试(多轮对话 = 累积费用)
- 使用 max effort(更长的思考链 = 更多输出 Token)
关注缓存比例
如果你发现缓存读取 Token 远大于输入 Token,说明 Prompt Cache 在发挥作用,你的成本得到了优化。
反之,如果缓存读取很少,可能是你的 CLAUDE.md 或系统提示太短,没有充分利用缓存。
fast 模式的费用感知
/fast 模式下 Opus 4.6 的价格是普通模式的 6 倍。如果你只是做个简单修改就开了 fast,可能得不偿失。建议:
- 短任务 + fast:快速完成,总费用可控
- 长任务 + 普通模式:慢一点,但省得多
/cost vs /usage vs /stats
这三个命令容易混淆,区别是:
| 命令 | 面向用户 | 显示内容 |
|---|---|---|
/cost | API Key 用户 | 实际美元花费 |
/usage | 订阅用户 | 订阅额度和速率限制 |
/stats | 所有用户 | 会话统计和活动指标 |
简单记:花钱看 /cost,额度看 /usage,数据看 /stats。
省钱技巧
既然知道了费用怎么算,分享几个省钱的实用技巧:
- 善用
/compact:上下文太长时压缩一下,减少后续每次调用的输入 Token - 善用
/effort:简单任务用 low 或 medium,别让 Claude 过度思考 - 善用缓存:写好 CLAUDE.md,让常用上下文走缓存读取(只要输入价的 10%)
- 慎用
/fast:除非时间真的很紧,否则普通模式性价比更高 !前缀:对不需要 AI 介入的命令用感叹号前缀,完全不产生 API 调用
写在最后
/cost 的核心价值是透明。
AI 编程助手不是免费午餐。每一次对话、每一个 Token 都有成本。/cost 让你看到这些成本,从而做出更明智的决策——什么时候该全力以赴,什么时候该节省开支。
知道花了多少,才能花得值得。
更多同类文章
- AI-first 创业公司,为什么只需要一种编程语言?
- cc-ping:一行命令 Ping 所有 Claude Code 配置
- 震惊!程序员用这个工具,4分钟干完95分钟的活!效率暴涨24倍
- CCBot - 研发提效 24 倍
- Claude Code /add-dir:被低估的 Monorepo 神器
- Claude Code 省 Token 小技巧:感叹号的妙用
- 我做了个机器人,让团队在飞书里用 Claude Code
- Claude Code /btw 命令详解:不打扰主线的快问快答
- Claude Code /compact:释放上下文,不丢进度
- Claude Code /config:一文搞懂所有可调设置
- Claude Code /context:你的上下文都被什么吃了?
- Claude Code /diff:这次对话改了什么,一目了然
- Claude Code /fast:同样的 Opus,两倍速——值不值?
- Claude Code 引用外部知识的最佳实践:GitHub MCP + Context7
- Claude Code /hooks:让 AI 按你的规矩办事
- Claude Code /init:10 秒自动生成 CLAUDE.md
- Claude Code MCP:让 AI 连接 GitHub、数据库等一切工具
- Claude Code /memory 详解:让 AI 真正记住你的项目
- Claude Code /model:Opus、Sonnet、Haiku 怎么选?
- Claude Code /permissions:谁能干什么,你说了算
- Claude Code /plan 详解:先想清楚再动手
- Claude Code + Playwright MCP:AI 终于能"看见"页面了
- Claude Code /resume 命令详解:别让对话白聊
- Claude Code /review:让 AI 帮你做 Code Review
- Claude Code Skills 详解:打造你的专属命令库
- Claude Code /stats:看看 AI 到底帮你写了多少代码
- Claude Code /status 命令详解:一眼看清会话全貌
- Claude Code /tasks 命令详解:后台任务尽在掌控
- Claude Code /usage 命令详解:你的额度还剩多少
- Claude Code /vim:在 AI 编程助手里用 Vim 键位
- Claude Code 使用指南:从安装到实战,一篇就够(2026)
- Claude 全家桶:从聊天到写代码到自动办公,一文讲清楚
- Claude Code /agents 详解:自定义 AI 子代理,各司其职
- Claude Code /doctor 详解:一键诊断你的开发环境
- Claude Code /effort 详解:控制 AI 思考的深度
- Claude Code /export 详解:把 AI 对话带走
- Claude Code /rewind 详解:AI 改错了?一键回退
- Claude Code /plugin 详解:给你的 AI 编程助手装插件
- Claude Code /theme 详解:给你的终端换个好看的皮肤
- Claude Code /insights 详解:用 AI 分析你自己用 AI 的方式
- Claude Code /rename 详解:给你的会话取个有意义的名字
- Claude Code settings.json 详解(一):配置文件在哪里、谁说了算
- Claude Code settings.json 详解(二):permissions 权限系统全解析
- Claude Code settings.json 详解(三):hooks 钩子全解析
- Claude Code settings.json 详解(四):env、模型、认证与其他实用字段