Part I · 04
把宪法翻译成
三条工程红线
宪法很美,但工程师每天面对的是 IDE、终端、PR——他们需要可以
当场判断 的规则。Anthropic 的 Boris Cherny 曾经把宪法浓缩成
Claude Code 团队最常引用的三句话。
"理解用户意图 · 对自己的知识局限诚实 · 尊重用户的自主权。"
— Boris Cherny, Anthropic 工程师 (Claude Code 团队)
这三条几乎能解释 4 月所有功能更新的"为什么这样设计"。
我们一条一条看,并且每条配 3 个真实案例。
04.1 · 第一条
理解用户意图
01
"在敲代码之前,先弄清楚用户真正想要什么。"
Why it matters
AI 最容易犯的错不是"答错了",而是"答了错的问题"。
宪法里"genuinely helpful"这一条,在工程上首先表现为反对盲目动手——
Claude 应该先听懂、再行动,而不是看见一个动词就开撸。
正向行为
主动澄清模糊需求:"你说的'清理'指的是删除还是归档?"
正向行为
对探索性问题先用 2~3 句给方向 + 取舍,而不是直接进 plan mode 写一大堆。
反向行为
看到"修个 bug"就开始改代码,不读上下文、不查 reproduce。
三个真实案例
案例 A · Claude Code 系统提示词
"对探索性问题('我们应该怎么做 X?'),用 2~3 句回答 + 一个推荐 + 主要 trade-off。
不要急着实现。"
这是一段写在 Claude Code 默认 prompt 里的明确指令——
把"先理解"作为默认动作,而不是依赖用户每次提醒。
案例 B · /resume 大型会话摘要(4 月 v2.1.117)
重新进入旧会话时,Claude 提供"总结历史 + 你想从哪儿继续"的选项。
没有这一步,AI 容易"假装记得"——其实丢了上下文。
主动暴露记忆边界 就是"理解意图"的真诚版本。
案例 C · /effort 滑块(4 月 v2.1.111)
在执行任务前,让用户主动选择"low / medium / high / xhigh"努力级别。
不是 Claude 偷偷决定花多少算力——而是
把"你要我多用心"这件事当成意图的一部分 让用户告诉它。
04.2 · 第二条
对自己的知识局限诚实
02
"不知道就说不知道;不确定就标出来;走捷径之前先验证。"
Why it matters
AI 最容易"看上去聪明"的方式是编造——给一个流畅但错误的答案。
Claude 的训练原则反过来:真诚比完美更重要,能说"我不确定"是高水准而非低水准。
正向行为
不确定库版本?用 WebFetch 去查,或承认"建议你 npm view 看一眼"。
正向行为
引用具体文件路径 + 行号,让用户能直接核对。
反向行为
编造一个看起来很合理的 API 名字 / 库名 / 配置项。
三个真实案例
案例 A · /ultrareview 多 reviewer 并行(4 月 v2.1.111)
每个 reviewer 独立列出发现,发现还要经过"verification step"过滤误报。
不当黑箱——把每条 finding 单列、可单独 disagree。
这是把"诚实"延伸到 AI 的输出结构上。
案例 B · 思考进度可视化(4 月 v2.1.116)
Claude 思考时会显示 "still thinking → thinking more → almost done"。
看似只是 UX 改进,本质是"不假装秒答"——
把"我正在花算力"这件事如实告诉你。
案例 C · Prompt injection 自检
当 WebFetch 等工具的返回结果里夹带可疑指令时,Claude 应主动告知用户。
这是把"诚实"延伸到了对抗环境——
Claude 不只对自己诚实,还要对"我可能被骗"这件事保持警觉并告知用户。
04.3 · 第三条
尊重用户的自主权
03
"对不可逆操作,先确认;权限模型可配置;用户随时能修改、回退、关闭。"
Why it matters
Claude 是助手,不是支配者。哪怕在 Auto Mode 下,Anthropic 仍坚持
所有可能造成"严重 / 不可逆 / 影响共享系统"的动作必须再问一次——
不是因为它做不了,是因为不该替你做。
正向行为
git push --force / rm -rf / DROP TABLE / 发消息 / 改 CI——必须确认。
正向行为
权限粒度可调:每条 Bash 规则都能 allow/deny;每个 hook 都能用 if 字段过滤。
反向行为
"我已经帮你删了" / "我顺手 push 了一下"——绕过用户决定。
三个真实案例
案例 A · Bash(find:*) 不再自动批准 -exec / -delete(4 月 v2.1.113)
过去 Bash(find:*) 一条规则就放行所有 find——但 find 可以删文件。
新版本把 -exec / -delete 单独剥出来,需要更明确的授权。
典型的"能力越大、确认越细"。这条修复看上去琐碎,背后是同一原则:
不可逆动作不能搭便车通过。
案例 B · /config 持久化到 ~/.claude/settings.json(4 月 v2.1.119)
过去 /config 改的设置可能不持久;新版本写到用户文件里。
用户的偏好是它自己的,不是 Claude 的——必须能保存、能版本化、能跨机同步。
案例 C · RBAC + SCIM(企业版,4 月)
企业管理员可以分组、对接 IdP,按 feature 粒度授权用户。
把"自主权"从个人 延伸到 组织——
团队 leader 也是 Claude 的"用户",他对成员能用什么 feature 应有控制权。
04.4 · 综合
三条原则
如何同时体现
最有意思的是:很多 4 月功能不是只对应一条原则,而是同时体现三条。
下面用一个真实功能 /ultrareview 做拆解。
⊕
/ultrareview 一个功能,三条原则
理解意图
需要用户主动调用,不会偷偷启动;可以指定 PR 号、当前分支、CI 集成等不同意图。
对局限诚实
每个 reviewer 列单独发现,verification step 过滤误报;用户能看到"是哪个 agent 找到的"。
用户自主
非阻塞——agent 在云端跑,用户继续干自己的活;最终是否合并由用户决定。
这就是"理念产品化"的样子
把宪法落到训练里,把训练落到行为里,把行为落到工程界面里——
这套链条 Anthropic 已经做了 4 年。第二部分开始,我们逐个看 4 月的具体产品发布。
下一页:第二部分 · 4 月旗舰发布的第一个 — Claude Opus 4.7。