Stanford CS 153

YC 人工智能原生公司方法论

Garry Tan(YC CEO)+ Diana Hu(YC GP)| 2026
英文原音视频 → 字幕提取 → 精华整理
"We're at the first pitch of the first inning on the revolution
and you guys are the shock troops."

📊 关键数据

10x
AI coding agent 工程师 vs 传统工程师
3个月
YC 2026 batch 平均 3x revenue
$1-2M
AI 原生公司单员工 revenue

💡 核心洞察

1. AI 改变了生产的单位经济

"2010 年:创建 Posterous 用了 10人 + $4M。今天 6人团队可以做到 $10M ARR。"
一个人 + AI coding agent = 以前一个团队

2. 软件工厂的核心问题不是生成代码,而是质量控制

"Demo code 很容易。问题是 80-90% 测试覆盖率才能不产出垃圾。"
plan-eng-review = Garry 每天用 20 次的核心技能 评测 > 通用 benchmark hallucinations 用 test coverage 控制

3. 不可自动化的:Taste

"Shipping code 的成本趋近于零。但判断什么是好的 taste 永远不会趋近于零。"

🔧 Primitive: Skillify(技能化)

将一个成功的 agent 行为转化为可测试、可复用的 skill。每天用 20 次。

Skillify 完整 11 步流程
1
Write the skill(LLM 写 SKILL.md)
2
Write the code
3
Write unit tests for the code
4
Write LLM evals for the skill file
5
Write an integration test
6
Ensure resolver trigger in agents.md
7
Test the trigger
8
LLM-as-judge eval → trigger is broad enough
9
Check resolvable(DRY,无重叠 skills)
10
End-to-end smoke test
11
Define schema(存在 memory 哪个位置)
Human Org 对应
Human: 10-20% 人做 compliance Agentic system: 同上,compliance 工作不可省略

🏗️ Primitive: Resolver(解析器)= 组织架构

Human OrgAgentic System
Employee capabilitySkill
Org chartResolver
Internal wiki / process docsMemory
Audit & complianceCheck resolvable
Performance reviewTrigger eval

🔄 闭环系统 vs 开环系统

❌ 传统公司(开环)

  • 信息存在人脑子里
  • Slack/DM 边栏对话
  • 会议笔记不写
  • 纯直觉(vibes)驱动
  • error accumulates → 脱轨

✅ AI 原生公司(闭环)

  • Agent 嵌入所有决策点
  • 所有 artifact 的 read access
  • 自动追踪 traces
  • 自动触发改进
  • YC 工程团队:sprint -50%,产出 +10x
闭环三步
1. Capture
记录所有交互 traces
2. Detect → Eval
失败 case 转化为 evals
3. Replay
持续回放 → self-heal

🧠 Gbrain:三层记忆系统

L1
Knowledge wiki(文本 grep)
L2
Vector search + RAG fusion + 反向链接 + 知识图谱
L3
认识论系统(追踪信念来源:直觉 / 某人观点 / 世界知识)

👥 AI 原生公司三大角色

角色职责
IC(Individual Contributor)每个人都是 builder,包括非技术人员。销售也能构建自己的 pipeline automation。
DRI(Direct Responsible Individual)每个结果追溯到具体负责人。Orchestrate IC 完成任务(通常是 founder)。
AI Founder(新角色)Living at the edge of the future,持续尝试所有新工具。

🏢 YC 公司案例

公司领域成果
Salient银行贷款 voice agent签约美国 top banks
Happy Robot货运 forwarder agent1年内 10x revenue,Series B
Reduct文档处理快速增长

反直觉观点

Boil the ocean 是对的

以前"不要煮沸海洋"是保守建议,现在 Garry 的回应是"actually let's boil the ocean"——AI coding agents 让大范围工作成为可能。

中层管理会消失

Middle management 原来做的是 lossy information routing,AI 让这变得不必要。

非技术人员也能 build

销售可以用 AI 构建自己的 call pipeline 和 meeting automation。

评测才是护城河

Generic benchmark(MMLU)不能告诉你产品是否 work。产品评测必须自己建,因领域而异。