Claude Code 实战 400 万 Tokens:接入 DeepSeek V4,从$26降到$2

发布时间:2026/6/29 22:40:09
Claude Code 实战 400 万 Tokens:接入 DeepSeek V4,从$26降到$2 DeepSeek V4 到底是什么规格先把背景说清楚后面算费用才有意义。DeepSeek V4 分两个版本V4-Flash和V4-Pro。V4-Pro 是这次的主角。1.6T 参数但采用 MoEMixture of Experts架构每次推理只激活 49B 参数。这个设计直接决定了它的成本优势——计算量只有 Dense 同参数模型的一小部分但性能却能打到接近顶级。DeepSeek 官方的说法是V4-Pro 在主流 benchmark 上比 Claude Sonnet 4.5 高与 GPT-5.4 差距约 3-6 个月。不是碾压是非常够用。V4-Flash 是轻量版本284B 总参数、13B 激活。速度更快成本更低适合那些不需要深度推理的任务比如文件读写、代码格式化、简单问答。两个版本都支持 1M token 上下文MIT 协议开源。这两点对用 Claude Code 做长上下文任务的工程师来说不算小事。75% 降价意味着什么算一遍直接上数字。原价正式定价模型输入每百万 tokens输出每百万 tokensDeepSeek V4-Flash$0.14$0.28DeepSeek V4-Pro$1.74$3.48Claude Sonnet 4.6$3.00$15.00Claude Opus 4.7$5.00$25.00GPT-5.4$2.50$15.00V4-Pro 75% 折扣后截至 2026-05-05 15:59 UTC模型输入折后输出折后DeepSeek V4-Pro折扣期$0.435$0.870缓存命中更夸张折扣期间 V4-Pro 的 cache hit 输入价格是 $0.003625/百万V4-Flash 是 $0.0028/百万。Claude Code 里重复上下文很多如果触发缓存实际费用还能再砍一刀。现在算 400 万 tokens 的账单假设输入/输出比例 7:3编码场景典型比例指令和代码上下文多生成内容相对少280 万输入 120 万输出后端输入费用输出费用合计Claude Sonnet 4.6$8.40$18.00$26.40Claude Opus 4.7$14.00$30.00$44.00DeepSeek V4-Pro折扣$1.22$1.04$2.26DeepSeek V4-Flash$0.39$0.34$0.73结论很直接折扣期的 V4-Pro同样的 400 万 tokens比 Claude Sonnet 便宜11.6 倍比 Opus 便宜19 倍。就算折扣结束回到原价V4-Pro 依然是 Sonnet 的 1/4 不到。怎么接入 Claude Code15 分钟搞定这是整篇文章最值钱的部分因为大多数人不知道 DeepSeek 原生支持 Anthropic API 格式。不需要任何 proxy不需要中间件直接配置两个环境变量就行。前置条件Claude Code 已安装npm install -g anthropic-ai/claude-code或官网下载注册 DeepSeek 账号并生成 API Keyplatform.deepseek.com给账户充一点余额10 元人民币够跑很久第一步配置环境变量打开你的 shell 配置文件~/.zshrc或~/.bashrc添加# Claude Code 使用 DeepSeek 作为后端 export ANTHROPIC_BASE_URLhttps://api.deepseek.com/anthropic export ANTHROPIC_API_KEYsk-xxxxxxxxxxxxxxxxxxxxxxxx # 换成你的 DeepSeek API Key关键点ANTHROPIC_BASE_URL末尾不要加/v1否则请求会 404。保存后执行source ~/.zshrc第二步指定模型Claude Code 默认会尝试调用claude-sonnet-4-6这个模型名但 DeepSeek 不认这个名字。需要在 Claude Code 的配置中指定 DeepSeek 的模型名。创建或编辑~/.claude/settings.json如果不存在就新建{ model: deepseek-v4-pro, fallbackModel: deepseek-v4-flash }或者按任务类型做分级路由——重度任务走 V4-Pro轻量任务走 V4-Flash{ model: deepseek-v4-pro, smallModel: deepseek-v4-flash, apiTimeout: 600000 }apiTimeout设成 60000010 分钟是因为 V4-Pro 在长推理任务上响应有时会超过默认超时时间。不设这个复杂任务跑一半会断掉。第三步验证配置claude 你在用什么模型如果回复里提到 DeepSeek 或者响应格式正常说明配置成功。顺便去 DeepSeek 控制台看一下 Usage有请求进来就稳了。真实使用400 万 Tokens 跑下来的感受用了大概三天主要场景是重构一个 Spring Boot 服务、写若干个单元测试、调 API 接口文档、做代码 review。感受好的地方代码补全和逻辑推理的质量跟 Claude Sonnet 4.6 差距不大多数时候感觉不到切换。特别是理解长文件、跟踪变量依赖这类需要上下文的任务1M 的上下文窗口没给我制造麻烦。响应速度比预期快。V4-Flash 处理简单问答基本是秒级V4-Pro 的复杂推理大概 5-15 秒在可接受范围内。感受不好的地方有一次我往对话里粘贴了一张架构截图让它帮我分析服务依赖关系。结果 Claude Code 收到的是占位文本什么也看不出来。排查了半天才想起来DeepSeek V4-Pro 目前不支持图片输入。这是最大的坑。如果你的工作流里经常需要上传截图、UI 设计稿、日志截图DeepSeek V4 目前是做不了的。这一块还得走官方 Claude。另外偶尔会出现比 Claude 官方更字面化的回复——你让它重构它可能严格按照字面意思动而不是主动发现周边的问题。不算大问题适应一下提示词的写法就好。踩坑记录整理一下我遇到的问题大多数都能绕过去坑1模型名字写错导致 400 错误ANTHROPIC_BASE_URL配了 DeepSeek 的地址但settings.json里还写着claude-sonnet-4-6。DeepSeek 不识别这个名字会自动 fallback 到deepseek-v4-flash悄悄切换你不一定察觉。记得明确指定模型名。坑2base URL 带了 /v1标准 OpenAI 格式的 base URL 通常是https://api.example.com/v1但 DeepSeek 的 Anthropic 兼容端点是https://api.deepseek.com/anthropic。多加/v1会 404。坑3超时设置不够默认超时 120 秒V4-Pro 处理涉及大量上下文的复杂任务有时会超。apiTimeout: 600000基本够用。坑4图片内容被静默丢弃没有报错只是图片内容被替换成占位符你可能根本不知道模型没看到图。有上传图片需求时先用纯文字描述替代或者这部分任务切回官方 Claude。坑5折扣有截止时间75% 折扣到2026-05-05 15:59 UTC为止之后回到原价V4-Pro $1.74 输入 / $3.48 输出。原价依然比 Claude Sonnet 便宜但优势没现在这么大。回原价后轻量任务建议全面切 V4-Flash$0.14/$0.28把 V4-Pro 留给真正需要的场景。我的判断DeepSeek V4 Claude Code 这个组合折扣期内毫无疑问值得试。$26 → $2.3不是玄学是实实在在的账单差距。折扣结束后还值不值得看你的场景。如果工作流里有大量截图、视觉内容或者对最新模型能力有依赖继续付 Claude 官方的价格是合理的。如果主要是文字代码、长上下文推理、批量任务DeepSeek V4-Flash 回到原价后依然是全市场最便宜的选项之一。MoE 架构的效率优势是结构性的不是一次性的价格战。DeepSeek 自己说了等华为昇腾 950 量产之后还会继续降价。这条路长期看是走得通的。当然如果你完全不在乎钱Claude Sonnet 4.6 的综合体验还是更顺滑一点——特别是多模态、工具调用的稳定性。二者不是替换关系是互补。下一篇打算把 Claude Code 的 settings.json 里那些不起眼的配置项拆解一遍有几个隐藏选项对省钱和提速都有帮助感兴趣的话关注一下。如果你身边有人用 Claude Code 但一直嫌贵这篇可以直接甩给他省得他再踩一遍那几个坑。常见问题Q: DeepSeek V4 接入 Claude Code 后代码质量真的不差吗A: 多数日常编码任务感受不到明显差距——重构、补全、单测这类有规律可循的工作表现稳定。差距主要出现在需要深度理解业务背景做权衡决策的场景Claude Sonnet 4.6 在这里会更主动地给出有见解的建议V4-Pro 有时更执行型。如果你对结果有要求任何模型都需要给足上下文和约束这一点用哪家都一样。Q: 折扣结束后还有必要用 DeepSeek V4 吗A: 有。V4-Flash 原价 $0.14/$0.28 是全市场最低区间Claude Code 里大量的轻量操作读文件、简单问答、格式化用 Flash 完全够把成本压到原来的 1/10。V4-Pro 回到原价后在 Claude Sonnet 的 1/4 左右计算密集型任务还是有竞争力。Q: 会不会有数据隐私问题A: DeepSeek 的服务器在中国大陆。如果你的代码涉及公司敏感信息或有合规要求这是需要认真评估的问题不是买便宜就完事的。纯个人项目、学习用途的话问题不大商业项目请先确认合规策略。Q: 有没有办法在 V4-Pro 和官方 Claude 之间自动切换A: 有。claude-code-router这个开源工具可以根据任务类型把请求路由到不同后端——有图片的走官方 Claude纯文字代码走 DeepSeek V4。GitHub 搜musistudio/claude-code-router有现成配置这个方案灵活性更高后续我可能单独写一篇。Q: 每次 Claude Code 更新后需要重新配置吗A: 不需要。ANTHROPIC_BASE_URL和ANTHROPIC_API_KEY在系统环境变量里settings.json在~/.claude/目录Claude Code 升级不会动这两个地方。