如何修复Claude Code给第三方大模型用户挖的坑用第三方API转发Claude Code的朋友, 如果最近发现token消耗暴涨、推理变慢, 大概率是被这个东西坑了.Claude Code从2.1.36开始, 在每个API请求里塞了一行`x-anthropic-billing-header`, 是当成system prompt的第一块发过去的. 里面有个叫`cch`的5位hex字段, 每次请求都不一样. 我实测同一个session里连续三轮, cch依次是`97bd6 → 24c2d → ead88`, 前一轮辛苦建好的缓存, 下一轮直接对不上前缀hash.Anthropic自己的服务端知道怎么处理. 但所有第三方Anthropic兼容代理、Bedrock、本地vLLM都不知道. 它们老老实实把这段当成system prompt的一部分算缓存key. 前缀每次都变, 命中率直接归零.我从Claude Code二进制里扒出了源代码, 看到了拼这个header的函数, 也找到了关掉它的环境变量`CLAUDE_CODE_ATTRIBUTION_HEADER=0`. 加到`~/.claude/settings.json`的env段, 重启就生效.视频里完整拆解了cch怎么生成、Zig native层怎么覆盖占位符、Anthropic为什么要这么干、以及第三方API为什么会被坑.@张司机在路上:发布视频播放量:4.97万弹幕:36 评论:292点赞:1617 投币:547 收藏:2883 转发:846发布日期:2026-05-16 10:26:23 | Steven’s Diary

如何修复Claude Code给第三方大模型用户挖的坑

用第三方API转发Claude Code的朋友, 如果最近发现token消耗暴涨、推理变慢, 大概率是被这个东西坑了.

Claude Code从2.1.36开始, 在每个API请求里塞了一行`x-anthropic-billing-header`, 是当成system prompt的第一块发过去的. 里面有个叫`cch`的5位hex字段, 每次请求都不一样. 我实测同一个session里连续三轮, cch依次是`97bd6 → 24c2d → ead88`, 前一轮辛苦建好的缓存, 下一轮直接对不上前缀hash.

Anthropic自己的服务端知道怎么处理. 但所有第三方Anthropic兼容代理、Bedrock、本地vLLM都不知道. 它们老老实实把这段当成system prompt的一部分算缓存key. 前缀每次都变, 命中率直接归零.

我从Claude Code二进制里扒出了源代码, 看到了拼这个header的函数, 也找到了关掉它的环境变量`CLAUDE_CODE_ATTRIBUTION_HEADER=0`. 加到`~/.claude/settings.json`的env段, 重启就生效.

视频里完整拆解了cch怎么生成、Zig native层怎么覆盖占位符、Anthropic为什么要这么干、以及第三方API为什么会被坑.

@张司机在路上:

发布视频
播放量:4.97万弹幕:36 评论:292
点赞:1617 投币:547 收藏:2883 转发:846
发布日期:2026-05-16 10:26:23

7:23

Media is too big

VIEW IN TELEGRAM