Claude Code /cost 详解：你的 AI 编程到底花了多少钱

为什么需要 /cost

用 Claude Code 开发，你最关心什么？

除了代码质量和效率，恐怕就是钱了。

如果你是 API Key 用户，每次对话都在产生费用。一个复杂的 debug 会话、一次大规模重构，到底花了多少钱？不看不知道，看了可能吓一跳。

如果你是 Max/Pro 订阅用户，虽然不按次收费，但你肯定想知道自己的额度用了多少，是不是快超了。

/cost 就是让你随时掌握花费的命令。

/cost 是什么

/cost 是 Claude Code 的会话成本查看命令。它显示当前会话中累计的 API 调用费用、时间消耗和代码变更统计。

在交互模式下输入：

/cost

你会看到类似这样的输出：

Total cost:            $0.4832
Total duration (API):  3 mins 12 secs
Total duration (wall): 8 mins 45 secs
Total code changes:    156 lines added, 43 lines removed
Usage by model:
  claude-opus-4-6:    12,450 input, 3,280 output, 45,600 cache read, 8,200 cache write ($0.42)
  claude-sonnet-4-6:  2,100 input, 890 output ($0.02)

一目了然。

谁能看到 /cost

这里有个重要的区分：

API Key 用户

如果你使用 API Key 访问 Claude Code，/cost 会显示完整的费用明细。每一笔调用都在计费，你需要知道花了多少。

Max/Pro 订阅用户

如果你是 Claude.ai 的订阅用户，/cost 命令默认是隐藏的。因为你用的是订阅制，不按调用收费。

输入 /cost 后，你会看到：

You are currently using your subscription to power your Claude Code usage

或者如果你的订阅额度用完了，正在使用超额部分：

You are currently using your overages to power your Claude Code usage.
We will automatically switch you back to your subscription rate limits when they reset

想看详细费用？ 可以通过环境变量强制显示：设置 DISABLE_COST_WARNINGS=false 不会改变这个行为，因为订阅用户的成本显示逻辑是独立的。这个功能主要面向 API Key 用户。

费用怎么算的

这部分是硬核干货。Claude Code 内置了完整的模型定价表，基于 API 官方价格实时计算费用。

模型定价（每百万 Token）

模型	输入	输出	缓存读取	缓存写入
Haiku 3.5	$0.80	$4	$0.08	$1.00
Haiku 4.5	$1	$5	$0.10	$1.25
Sonnet 4.x	$3	$15	$0.30	$3.75
Opus 4 / 4.1	$15	$75	$1.50	$18.75
Opus 4.5	$5	$25	$0.50	$6.25
Opus 4.6	$5	$25	$0.50	$6.25
Opus 4.6 (fast)	$30	$150	$3.00	$37.50

注意两个关键点：

Opus 4.6 的 fast 模式贵 6 倍。这就是 /fast 的代价——同样的模型，更快的输出，但每个 Token 的价格翻了 6 倍。所以 /fast 适合短任务，不适合长篇大论。
缓存读取只有输入价格的 10%。Claude Code 大量使用 Prompt Cache（系统提示、CLAUDE.md 等），这意味着重复上下文的成本非常低。

计算公式

费用 = 输入 Token × 输入单价
     + 输出 Token × 输出单价
     + 缓存读取 Token × 缓存读取单价
     + 缓存写入 Token × 缓存写入单价
     + 网络搜索次数 × $0.01

每次 API 调用完成后，Claude Code 从响应头中提取实际 Token 用量，乘以对应模型的单价，累加到会话总费用中。

/cost 显示哪些信息

/cost 的输出包含五个维度：

1. 总费用（Total cost）

当前会话累计的 API 调用费用，单位美元，精确到小数点后四位。

如果会话中使用了不在定价表中的模型（比如某个内测模型），会显示警告：费用可能不准确。

2. API 时间（Total duration - API）

所有 API 调用的纯耗时之和。不包括你思考的时间、工具执行的时间，只算 Claude 在”想”的时间。

3. 总时间（Total duration - wall）

从会话开始到现在的实际挂钟时间。API 时间 vs 总时间的差距，就是你”等待之外”的时间。

4. 代码变更（Total code changes）

当前会话中新增和删除的代码行数。让你直观地感受到”这次对话的产出”。

5. 模型明细（Usage by model）

按模型分别列出 Token 用量：输入、输出、缓存读取、缓存写入，以及每个模型的费用小计。

如果你在会话中切换了模型（比如先用 Opus 做分析，再切 Sonnet 做简单修改），这里会分别列出。

费用持久化

Claude Code 会把费用数据保存到项目配置中，包括：

总费用金额
API 调用总时长
各模型 Token 用量明细
会话 ID（用于判断是否是同一个会话）

这意味着如果你用 /resume 恢复了之前的会话，费用数据也会一起恢复，保持连续性。

但要注意：这个持久化是按会话的。新会话的费用从零开始。

实际使用建议

定期检查

养成习惯，在长会话中定期输入 /cost 看看花了多少。特别是在做以下事情时：

大规模重构（大量代码上下文 = 大量 Token）
反复调试（多轮对话 = 累积费用）
使用 max effort（更长的思考链 = 更多输出 Token）

关注缓存比例

如果你发现缓存读取 Token 远大于输入 Token，说明 Prompt Cache 在发挥作用，你的成本得到了优化。

反之，如果缓存读取很少，可能是你的 CLAUDE.md 或系统提示太短，没有充分利用缓存。

fast 模式的费用感知

/fast 模式下 Opus 4.6 的价格是普通模式的 6 倍。如果你只是做个简单修改就开了 fast，可能得不偿失。建议：

短任务 + fast：快速完成，总费用可控
长任务 + 普通模式：慢一点，但省得多

/cost vs /usage vs /stats

这三个命令容易混淆，区别是：

命令	面向用户	显示内容
`/cost`	API Key 用户	实际美元花费
`/usage`	订阅用户	订阅额度和速率限制
`/stats`	所有用户	会话统计和活动指标

简单记：花钱看 /cost，额度看 /usage，数据看 /stats。

省钱技巧

既然知道了费用怎么算，分享几个省钱的实用技巧：

善用 /compact：上下文太长时压缩一下，减少后续每次调用的输入 Token
善用 /effort：简单任务用 low 或 medium，别让 Claude 过度思考
善用缓存：写好 CLAUDE.md，让常用上下文走缓存读取（只要输入价的 10%）
慎用 /fast：除非时间真的很紧，否则普通模式性价比更高
! 前缀：对不需要 AI 介入的命令用感叹号前缀，完全不产生 API 调用

写在最后

/cost 的核心价值是透明。

AI 编程助手不是免费午餐。每一次对话、每一个 Token 都有成本。/cost 让你看到这些成本，从而做出更明智的决策——什么时候该全力以赴，什么时候该节省开支。

知道花了多少，才能花得值得。