Logo Vincent
返回文章列表

Claude Code /cost 详解:你的 AI 编程到底花了多少钱

Claude
Claude Code /cost 详解:你的 AI 编程到底花了多少钱

为什么需要 /cost

用 Claude Code 开发,你最关心什么?

除了代码质量和效率,恐怕就是了。

如果你是 API Key 用户,每次对话都在产生费用。一个复杂的 debug 会话、一次大规模重构,到底花了多少钱?不看不知道,看了可能吓一跳。

如果你是 Max/Pro 订阅用户,虽然不按次收费,但你肯定想知道自己的额度用了多少,是不是快超了。

/cost 就是让你随时掌握花费的命令。

/cost 是什么

/cost 是 Claude Code 的会话成本查看命令。它显示当前会话中累计的 API 调用费用、时间消耗和代码变更统计。

在交互模式下输入:

/cost

你会看到类似这样的输出:

Total cost:            $0.4832
Total duration (API):  3 mins 12 secs
Total duration (wall): 8 mins 45 secs
Total code changes:    156 lines added, 43 lines removed
Usage by model:
  claude-opus-4-6:    12,450 input, 3,280 output, 45,600 cache read, 8,200 cache write ($0.42)
  claude-sonnet-4-6:  2,100 input, 890 output ($0.02)

一目了然。

谁能看到 /cost

这里有个重要的区分:

API Key 用户

如果你使用 API Key 访问 Claude Code,/cost 会显示完整的费用明细。每一笔调用都在计费,你需要知道花了多少。

Max/Pro 订阅用户

如果你是 Claude.ai 的订阅用户,/cost 命令默认是隐藏的。因为你用的是订阅制,不按调用收费。

输入 /cost 后,你会看到:

You are currently using your subscription to power your Claude Code usage

或者如果你的订阅额度用完了,正在使用超额部分:

You are currently using your overages to power your Claude Code usage.
We will automatically switch you back to your subscription rate limits when they reset

想看详细费用? 可以通过环境变量强制显示:设置 DISABLE_COST_WARNINGS=false 不会改变这个行为,因为订阅用户的成本显示逻辑是独立的。这个功能主要面向 API Key 用户。

费用怎么算的

这部分是硬核干货。Claude Code 内置了完整的模型定价表,基于 API 官方价格实时计算费用。

模型定价(每百万 Token)

模型输入输出缓存读取缓存写入
Haiku 3.5$0.80$4$0.08$1.00
Haiku 4.5$1$5$0.10$1.25
Sonnet 4.x$3$15$0.30$3.75
Opus 4 / 4.1$15$75$1.50$18.75
Opus 4.5$5$25$0.50$6.25
Opus 4.6$5$25$0.50$6.25
Opus 4.6 (fast)$30$150$3.00$37.50

注意两个关键点:

  1. Opus 4.6 的 fast 模式贵 6 倍。这就是 /fast 的代价——同样的模型,更快的输出,但每个 Token 的价格翻了 6 倍。所以 /fast 适合短任务,不适合长篇大论。

  2. 缓存读取只有输入价格的 10%。Claude Code 大量使用 Prompt Cache(系统提示、CLAUDE.md 等),这意味着重复上下文的成本非常低。

计算公式

费用 = 输入 Token × 输入单价
     + 输出 Token × 输出单价
     + 缓存读取 Token × 缓存读取单价
     + 缓存写入 Token × 缓存写入单价
     + 网络搜索次数 × $0.01

每次 API 调用完成后,Claude Code 从响应头中提取实际 Token 用量,乘以对应模型的单价,累加到会话总费用中。

/cost 显示哪些信息

/cost 的输出包含五个维度:

1. 总费用(Total cost)

当前会话累计的 API 调用费用,单位美元,精确到小数点后四位。

如果会话中使用了不在定价表中的模型(比如某个内测模型),会显示警告:费用可能不准确。

2. API 时间(Total duration - API)

所有 API 调用的纯耗时之和。不包括你思考的时间、工具执行的时间,只算 Claude 在”想”的时间。

3. 总时间(Total duration - wall)

从会话开始到现在的实际挂钟时间。API 时间 vs 总时间的差距,就是你”等待之外”的时间。

4. 代码变更(Total code changes)

当前会话中新增和删除的代码行数。让你直观地感受到”这次对话的产出”。

5. 模型明细(Usage by model)

按模型分别列出 Token 用量:输入、输出、缓存读取、缓存写入,以及每个模型的费用小计。

如果你在会话中切换了模型(比如先用 Opus 做分析,再切 Sonnet 做简单修改),这里会分别列出。

费用持久化

Claude Code 会把费用数据保存到项目配置中,包括:

  • 总费用金额
  • API 调用总时长
  • 各模型 Token 用量明细
  • 会话 ID(用于判断是否是同一个会话)

这意味着如果你用 /resume 恢复了之前的会话,费用数据也会一起恢复,保持连续性。

但要注意:这个持久化是按会话的。新会话的费用从零开始。

实际使用建议

定期检查

养成习惯,在长会话中定期输入 /cost 看看花了多少。特别是在做以下事情时:

  • 大规模重构(大量代码上下文 = 大量 Token)
  • 反复调试(多轮对话 = 累积费用)
  • 使用 max effort(更长的思考链 = 更多输出 Token)

关注缓存比例

如果你发现缓存读取 Token 远大于输入 Token,说明 Prompt Cache 在发挥作用,你的成本得到了优化。

反之,如果缓存读取很少,可能是你的 CLAUDE.md 或系统提示太短,没有充分利用缓存。

fast 模式的费用感知

/fast 模式下 Opus 4.6 的价格是普通模式的 6 倍。如果你只是做个简单修改就开了 fast,可能得不偿失。建议:

  • 短任务 + fast:快速完成,总费用可控
  • 长任务 + 普通模式:慢一点,但省得多

/cost vs /usage vs /stats

这三个命令容易混淆,区别是:

命令面向用户显示内容
/costAPI Key 用户实际美元花费
/usage订阅用户订阅额度和速率限制
/stats所有用户会话统计和活动指标

简单记:花钱看 /cost,额度看 /usage,数据看 /stats

省钱技巧

既然知道了费用怎么算,分享几个省钱的实用技巧:

  1. 善用 /compact:上下文太长时压缩一下,减少后续每次调用的输入 Token
  2. 善用 /effort:简单任务用 low 或 medium,别让 Claude 过度思考
  3. 善用缓存:写好 CLAUDE.md,让常用上下文走缓存读取(只要输入价的 10%)
  4. 慎用 /fast:除非时间真的很紧,否则普通模式性价比更高
  5. ! 前缀:对不需要 AI 介入的命令用感叹号前缀,完全不产生 API 调用

写在最后

/cost 的核心价值是透明

AI 编程助手不是免费午餐。每一次对话、每一个 Token 都有成本。/cost 让你看到这些成本,从而做出更明智的决策——什么时候该全力以赴,什么时候该节省开支。

知道花了多少,才能花得值得。

更多同类文章

© 2026 vincentqiao.com . 保留所有权利。