Anthropic 创始人手册：AI 原生创业四阶段拆解

5 月 14 日 Anthropic 放出 36 页册子《The Founder’s Playbook: Building an AI-Native Startup》。核心动作是把传统的”验证 → 融资 → 招人 → 构建 → 再融资 → 增长 → 再招人”重映射成四阶段：Idea、MVP、Launch、Scale。每阶段都标注了目标、退出条件、典型失败模式和具体的 Claude 用法。

册子收尾一句把整本论点浓缩到极致：

瓶颈不再是你能造什么，而是你选择造什么。

创始人角色被压缩成”指挥智能体的人”#

册子把传统岗位被三类 AI 能力压缩的逻辑拆得很清楚：

AI 能力	替代了谁	一句话定位
对话式研究	”我得找个懂的人问问”的场景	全领域随叫随到的专家
智能体编程	技术联合创始人、外包、早期工程团队	永远在线、不会卡住的工程师
工作流自动化	早期运营岗	按需自动化的运营团队

创始人从执行者变成智能体指挥官，注意力从执行层往判断层挪。

真正被解锁的群体是非技术领域专家。会写代码这件事第一次从开公司的门槛上彻底拿掉，有真实领域经验的人可以直接把产品推出去。

Idea 阶段：构建变快放大了验证的难度#

册子引用过一个数据点：42% 的创业公司死于”做了没人要的东西”。智能体编程时代这个比例只会更高。

逻辑很直接。以前做一个原型要花几个月，原型存在这件事本身就是一种信号；现在一个下午就能做出原型，原型的存在不再携带任何信号。原文里这一段写得很精确：

一个能跑的原型容易被当成”问题真实存在”的硬证据。它的真正作用是跟潜在用户对话时的压力测试道具，对话本身才是证据。

这一阶段的三大典型陷阱：

把构建误当成验证：把”我能交付”误读成”问题真实存在”
过早扩张：还没验证就开始堆代码、堆产品面
失去客观性：让 AI 验证想法它就给你找证据，让 AI 估市场它就给你算出能拿融资的 TAM

册子原文：

确认偏误现在自带研究引擎。

退出条件是三个肯定回答：

能精确说出”谁有这个问题、多频繁、多严重、当前怎么处理”
你的解决方案对的是验证过程中真正浮现的问题，不是最初假设的那个
信号足够支撑投入 MVP——这一阶段不会有 100% 确定性，等本身就是一种失败模式

整本册子贯穿一条建议：把 Claude 当结构化反方辩手用。具体演练有三个：

假设锐化。把”合同审查太慢”重写成”中端市场公司的内部法务团队平均花 3 天以上审一份合同，因为修订意见散在邮件线程里、没有单一版本管理”
反向研究。让 Claude 主动找反向证据，AI 默认会顺着方向走，所以要主动让它指向反面
结构化竞争分析。按”直接对手 / 间接对手 / 潜在收购方 / 邻近玩家”四层分类，每层都要论证”为什么它能赢、你输”

MVP 阶段：架构先于代码，CLAUDE.md 是第一个产物#

MVP 阶段有两个并行目标：把验证过的问题做成一个聚焦的小产品；以及在构建过程中不要累积技术债。

这个阶段值得抄写的金句是智能体时代技术债的定义：

AI 时代的技术债是复利累积的。没有写下来、能让 AI 读到的规格和架构约束，每个会话都会从头推导基础决策，决策本身会漂移。

人话翻译：你今天和 Claude 讨论好用 Postgres，明天另起会话它可能又劝你用 MongoDB。架构假设在会话之间漂移，是这一代技术债的根本形态。

册子给出的标准流程：

写代码之前，先用 Claude 把架构、依赖、取舍全部讨论一遍
把讨论结果保存为 CLAUDE.md，这是项目”第一个产物”
Claude Code 每次自动读这个文件，会话间的架构假设才能持久化
每次会话结束都更新一次，把新做的决定记下来

CLAUDE.md 是 Claude Code 的项目级指令文件，运行在目录里时 Agent SDK 会自动读。作用上等于项目的持久记忆。

这一阶段还有四个失败模式值得记：

失败模式	是什么
智能体技术债	架构约束没沉淀，会话之间决策漂移
假性产品-市场契合	早期上升曲线来自创始人朋友、投资人 portfolio、HN 头条，都不是真 PMF
零阻力的范围蔓延	每个功能看着都正当，但加起来产品就失焦
经验不足导致的不安全	AI 写出来的代码”能跑”但不一定”安全”，安全漏洞要被攻击才会暴露

判断 PMF 的两个试金石：

Sean Ellis 测试：问活跃用户”如果不能再用这个产品你会怎么想”，超过 40% 回答”非常失望”才算 PMF 信号
力度测试：PMF 之前留存靠创始人推（个人跟进、激励、外联）；PMF 之后产品自己拉用户。“从推到拉”的力度变化是最干净的信号

如果三轮迭代后还到不了 PMF，册子给的三问诊断框架：

数据里有没有某个用户群和其他人响应方式不一样？
设计价值和体验价值的鸿沟，是定位问题还是产品问题？
当前产品要找到真 PMF，需要哪些前提为真，这些前提现实吗？

Launch 阶段：创始人从资产变成瓶颈#

退出条件三件套：

条件	标准
增长可复制、有渠道	CAC / LTV / 回本周期能讲清楚
产品能扛生产负载	基础设施加固完成，安全合规到位
运营不依赖创始人	创始人不再亲手做客服、分诊、迭代规划、汇报

整章里这一句压得最重：

MVP 阶段创始人事事在场是资产；到了 Launch 阶段，同样的直觉变成约束。

征兆很具体：本该一小时拍板的决定要拖一周；只有你能回答的支持请求开始堆积；只有你记得做的运营任务，没人提醒就不会发生。

解药也朴素。把你正在亲手做的每件事列出来，按三类分：

可以全自动化的
需要人但不必是你的
真的必须创始人判断的

前两类全部交给智能体工作流。

Launch 阶段三件套要叠加使用，册子第一次明确给出协作分工：

Claude Code 造产品，Claude Cowork 造产品周围的公司，Claude 把产品和组织知识运营化。三件套合力之下，小团队可以跑出 n 倍规模公司的体感。

安全和合规的态度也要在这一阶段切换：

MVP 时只有少量内测用户、生产环境没敏感数据，安全漏洞是理论风险；产品进入生产、用户依赖之后，理论风险就变成真实暴露面。

AI 扫描只是辅助，替代不了合格的合规审查——册子明确写了这一条。

Scale 阶段：护城河的三层叠加#

这一章对独立开发者价值最高。结论很硬：护城河是沉淀，模型可以被换、行业边角场景不能被换。

护城河有三层叠加。

把领域知识沉淀进 AI 上下文是第一层：

把领域知识外化到 Claude 里，价值在于把行业边角场景编码进产品。通用 AI 医疗账单工具在 340B 药品计划上会崩，你的产品有专门逻辑。

具体路径：通过长对话、项目、记忆功能把行业黑话、监管陷阱、边角场景沉淀成 Skills（可复用例程）。这是一份花钱买不到的资产。

用户行为数据飞轮是第二层：

这种数据是时间锁定的、依赖具体上下文，山寨者重建不了。你买不到几千个用户在你产品里不断打磨工作流之后留下的行为指纹。

册子建议每个产品都写一份护城河叙事：你的数据飞轮怎么工作的、转了多久、为什么资金雄厚的对手从零开始两年内追不上。

工作流锁定是第三层，也是最深的一层：

切换从产品决策变成全面运营项目。

打法是用 Claude Code 多搭原生集成（项目管理、通信、数据源），以及对外开放 API、webhook、SDK——让用户能在你的产品之上二次开发。

这一章里最值得抄进自己工作流的练习：

找出垂直领域里通用竞品一定会做错的边角场景，用 Claude Code 基于真实见过的场景写一条专属测试（不是单元测试那种）。每次再发现类似边角场景就追加进去。测试套件本身就是护城河地图。

把测试套件当护城河地图来管，这个思路适用于任何垂直 AI 产品的内部文档。

Scale 阶段的退出条件不再是单一里程碑，而是一个阈值事件——公司在创始人不直接管日常运营的情况下仍稳定运行。会落到三种形式之一：可持续盈利、可 IPO、被收购。

三件套的产品矩阵#

册子里反复出现的那张表：

任务类型	用哪个	为什么
一个问题、一次重写、快速头脑风暴	Claude Chat	对话式、零配置
调研、分析、多文件多系统整合出文档	Claude Cowork	文件夹访问、连接器、Skills、定时运行
写代码、测试、发布软件	Claude Code	代码库访问、diff、git、开发环境

册子里有一句定调：

底下都是同一个 Claude，不同的只是周围的工作空间。

册子也给了一个 Cowork 的起源故事：Anthropic 内部观察到非工程团队（营销、数据）绕开 Chat 直接用 Code 跑多步任务之后才推出 Cowork。本质上 Cowork 是 Code 的”非工程友好版”。

创始人案例#

册子最后一章列了一长串案例，按行业和打法整理：

公司	一句话	核心打法
HumanLayer（YC F24）	Slack 里的 SQL 智能体，做基础清理（如删掉 90 天没查过的表）	上下文工程比模型工程更重要
Ambral（YC W25）	把客户经理的 1/50 注意力变回 100%	产品本身就是多智能体，基于 Claude Agent SDK
Vulcan Technologies（YC S25）	YC 案例三件套之一	—
GC AI	公司内部法务团队平台	把公司专属手册、跨职能干系人、风险阈值编进产品
Carta Healthcare	处理 22000 例外科手术 / 年临床数据	数据抽取时间砍 66%，把垂直深度翻译成具体数字
Anything	帮 150 万用户把想法变软件，无需写代码	一个非技术创始人靠它做并卖了完整招聘平台
Cogent	企业安全智能体	Claude 当推理层，自动化漏洞处置全流程
Airtree	Claude Cowork 当运营中心	一人搭工作流，全公司用
Duvo	跨 ERP / 供应商门户 / 邮件 / 电话的采购供应链智能体	完全建在 Claude + Agent SDK 上
Zingage	家庭护理 24/7 自动化平台	结构化工具调用 + 上下文推理
Kindora	非营利匹配捐助者的 AI 平台	创始人是非营利组织高管，非工程师
Wordsmith	律师转 CTO 的公司内部法务 AI	Claude 当推理引擎，开发用 Claude Code

12 个案例放在一起的隐含信号：YC 最近几批投的 AI 公司，核心壁垒是把模型套到具体行业工作流里的工程化能力——更明确地说，是创始人本身的领域经验在 AI 上的”转录”。

几条可以挪进自己工作流的具体动作#

可以直接抄走的几条：

写代码之前先填四格”谁有这个问题、多频繁、多严重、当前怎么处理”。每个空格都是没做完的客户调研。Claude 用作反方辩手，专门让它驳倒你
每个 AI 协作项目维护一份 CLAUDE.md：技术栈、依赖、取舍、刻意不做的事。这是和 AI 协作时唯一持久的共同记忆
把”通用 AI 会做错”的场景写成测试集，每次再发现就追加。这个测试集就是你的护城河地图
每次 Claude Code 会话留 5 分钟写架构日志。便宜的保险，防会话间架构漂移
三件套分工固定下来：碎片问答给 Chat，多源知识工作和定时任务给 Cowork，写代码发布软件给 Code

册子的真正贡献是把”AI 让构建变快”翻译成”验证、范围、架构、安全四个纪律必须前置”。构建零成本之后，剩下唯一值钱的还是判断本身——能力放大器同时放大错误，所以前置纪律的价值被乘以 n 倍。

Anthropic 创始人手册：AI 原生创业的四阶段拆解