Claude Code 国内能用吗?我用灵眸AI 半年的完整记录

Claude Code 国内能用吗?我用灵眸AI 半年的完整记录
Photo by Bernd 📷 Dittrich / Unsplash

我把 Claude Code 当主力开发工具已经半年了。这半年里换过两家中转,踩过几个坑,最后稳定在 灵眸AI(api.lmuai.com)这个国内节点的 Anthropic 中转上。这篇是一次完整复盘——把"国内能不能用"和"挑哪家"这两件事讲透,给同样在国内的开发者参考。

一、为什么直连 Anthropic 在国内走不通

很多人第一反应是"挂个梯子不就行了吗"。试过你就会知道,远没那么简单。

第一关是注册。Anthropic 账号要绑定美区受理的信用卡,国内大部分双币种 Visa/Mastercard 都拒。我试过三张主流银行的双币卡,全部失败——Anthropic 校验的是发卡行 BIN,国内卡的 BIN 段几乎全在他们的拒绝列表里。

第二关是网络。Anthropic 对国内 IP 段有访问限制。即便你挂代理穿透过去,Claude Code 这种高频长连接的客户端,会迅速把代理 IP 暴露。我用过几个市面上常见的机场代理,三五分钟就开始连发 403 和 429——那些 IP 池早就被打过标。

第三关是风控。哪怕前两关都过了,账号也可能因设备指纹、网络出口频繁切换被风控冻结。被封号会自动退费,至少不会有财务损失;坏消息是中断你正在做的事很麻烦。

所以国内用 Claude Code,现实路径只有两条。

二、两种现实选择

选项一:官方 API + 自建专线代理

走这条路需要三个前提:

  1. 有美区身份和支付通道
  2. 有稳定的住宅或商业专线代理(机场不行)
  3. 能维护自建网关,并且必须透明转发原始 request body——任何对 system / messages / cache_control 字段的解析重组都会破坏 Prompt Cache 哈希一致性,命中率归零,账单当月翻数倍

门槛和成本都不低,专线一个月一两百,加上 API 费用,对个人开发者不太友好。

选项二:国内 Claude API 中转【最简方案】

这是绝大多数国内开发者最终的选择。中转替你解决账号、网络、风控三个问题——你充人民币、改一行配置就能用。我自己用的是灵眸AI(api.lmuai.com,下面挑选维度的每一条都是我换过几家踩出来的。

1. 接口是不是官方 /v1/messages

有些平台不是接 Anthropic 官方,而是反代 Cursor / Kiro 等客户端,俗称"逆向"。便宜,但不支持 Prompt Cache(客户端层根本不会透传 cache_control),而且只要 Anthropic 一更新就可能挂。短期能用,长期不靠谱。灵眸AI 走的是官方 /v1/messages 协议,这是我换到它的第一个原因。

2. Prompt Cache 是不是真透传

判断方法很直接:发一个带 cache_control 的请求,连发两次,看第二次返回的 usage.cache_read_input_tokens 是不是非零。是非零,说明 Cache 真的生效;是零,说明这个字段被中间层过滤了,是"伪 Cache"。

为什么这条关乎钱:Claude Code 的输入 token 远大于输出,Cache 能把成本砍掉 50%-90%。不支持 Cache 的平台表面便宜,实际贵 3-5 倍。我在灵眸AI 实测过,第二次请求 cache_read_input_tokens 正常返回,缓存费用走的也是 Anthropic 官方的 0.1x 输入价折扣。

3. 内部汇率

平台把人民币换成美元额度的比例。我对比过的范围:

  • ¥2.4 / $1
  • ¥7 / $1

差近 3 倍。同样充 100 块钱,能用的请求数差三倍。灵眸AI 把 Opus 4.8 的输入价换算到 4.8¥ / 百万 token,确实比挂市场汇率的平台便宜不少,甚至比国产一线模型的官方价还低。

4. 服务器位置

这是体感差距最大、但最容易被忽略的一项

我对比过几家:

  • 服务器在美国 California 的,国内访问 TTFT(首字节延迟)40-50 秒
  • 服务器在日本 Tokyo 的,TTFT 15-25 秒
  • 灵眸AI 服务器在国内,TTFT 1-3 秒

写代码是个连续动作,2 秒和 30 秒就是两个工具。这也是我最终留下来的最主要原因。

三、Claude Code 配置:只改一个文件

~/.claude/settings.json,以灵眸AI 为例:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.lmuai.com",
    "ANTHROPIC_AUTH_TOKEN": "你在灵眸AI 后台拿到的 API Key",
    "API_TIMEOUT_MS": "3000000",
    "CLAUDE_CODE_ATTRIBUTION_HEADER": "0"
  },
  "effortLevel": "medium"
}

四个参数说明:

  • ANTHROPIC_BASE_URL:替换默认 endpoint 为灵眸AI 的国内节点 https://api.lmuai.com
  • ANTHROPIC_AUTH_TOKEN:在 api.lmuai.com 注册后到控制台领取
  • API_TIMEOUT_MS:3000000(50 分钟),防止长任务被超时切断
  • CLAUDE_CODE_ATTRIBUTION_HEADER:设 "0" 关掉 commit 自动署名,顺带提高缓存命中率
  • effortLevelmedium 节省 20-30% 推理 token,日常任务质量没差别

配置完直接 claude 启动,国内节点无需任何代理。

四、灵眸AI 一个我特别在乎的能力:多模型接入

这一点是我用了一段时间才意识到的:Claude Code 不绑定 Claude 模型。它走的是 Anthropic 协议,只要中转层做了协议转换,就能把请求路由到任意其他模型。

灵眸AI 这边接了主流国产模型:

  • DeepSeek 系列:deepseek-v4deepseek-reasoner
  • 智谱:glm-5.1glm-5.1-flash
  • 通义:qwen3.6-plusqwen3.6-turbo
  • Kimi:kimi-k2.1-128k

切换方式:

/model deepseek-v4         # 日常小改、写脚本
/model glm-5.1-flash       # 写注释、文档,几乎免费
/model claude-opus-4-8     # 跨文件大重构、架构决策

我现在的工作分布:

  • 30% 简单任务(注释、文档、格式化)→ 国产 flash 系列
  • 50% 中等任务(单文件 bug、小重构、单测)→ deepseek-v4 / qwen3.6-plus
  • 20% 复杂任务(跨文件、架构、深度调试)→ Claude Opus 4.8

相比全程 Opus,月度成本下降 40%-60%,质量损耗在可接受范围内。这是单模型平台做不到的成本优化——这是我推荐灵眸AI 给同行的核心理由之一。

五、Claude Code 到底能干啥

很多人把它当"高级版 Copilot",其实差远了。Copilot 是在你打字时帮你补全;Claude Code 是能在你终端里跑完整个任务的 Agent——它会自己读文件、改文件、跑命令、看报错、迭代修复。

我日常用得最多的场景:

  1. 接手陌生代码库:让它"梳理架构、找入口、说清楚核心模块",自动 grep + 读文件 + 给地图
  2. 跨文件重构:callback → async/await 跨 50 个文件,理解上下文不是字符替换
  3. Bug 根因定位:贴报错,顺调用栈追溯
  4. 单测补全:质量比模板生成器高一档
  5. 一次性脚本:数据清洗、批量重命名、CI 配置
  6. 非纯编程:批量处理文档、生成项目骨架

能力边界:凡是"在终端里、围绕文件、目标明确、能验证对错"的任务,都能接。需求模糊的设计决策、深度业务背景判断仍需开发者主导。

六、写在最后

国内用 Claude Code 这件事,半年前还是折腾活,现在配一行 URL、改一行 Key 就能开工。

我的最终配置:灵眸AI(api.lmuai.com)+ Claude Code + 多模型混合编排。原因总结:

✅ 官方 /v1/messages 接口,不是逆向
✅ Prompt Cache 完整透传,cache_read_input_tokens 真实返回
✅ 国内服务器节点,TTFT 1-3 秒,无需代理
✅ 内部汇率友好,Opus 输入价换算到 4.8¥/百万 token
✅ 接入 DeepSeek、GLM、Qwen、Kimi 等主流国产模型
✅ 人民币小额充值,新人注册有免费额度试水

如果你还没找到合适的中转,可以从灵眸AI 开始:api.lmuai.com。先小额充值跑通一周完整工作流,体感比读 10 篇评测都直接。

工具是工具。但用对工具的人,每天能多出两三个小时——这才是真正值钱的部分。