如何修复Claude Code给第三方大模型用户挖的坑
用第三方API转发Claude Code的朋友, 如果最近发现token消耗暴涨、推理变慢, 大概率是被这个东西坑了.@张司机在路上:
Claude Code从2.1.36开始, 在每个API请求里塞了一行`x-anthropic-billing-header`, 是当成system prompt的第一块发过去的. 里面有个叫`cch`的5位hex字段, 每次请求都不一样. 我实测同一个session里连续三轮, cch依次是`97bd6 → 24c2d → ead88`, 前一轮辛苦建好的缓存, 下一轮直接对不上前缀hash.
Anthropic自己的服务端知道怎么处理. 但所有第三方Anthropic兼容代理、Bedrock、本地vLLM都不知道. 它们老老实实把这段当成system prompt的一部分算缓存key. 前缀每次都变, 命中率直接归零.
我从Claude Code二进制里扒出了源代码, 看到了拼这个header的函数, 也找到了关掉它的环境变量`CLAUDE_CODE_ATTRIBUTION_HEADER=0`. 加到`~/.claude/settings.json`的env段, 重启就生效.
视频里完整拆解了cch怎么生成、Zig native层怎么覆盖占位符、Anthropic为什么要这么干、以及第三方API为什么会被坑.
发布视频
播放量:4.97万 弹幕:36 评论:292
点赞:1617 投币:547 收藏:2883 转发:846
发布日期:2026-05-16 10:26:23