视频Lecture · 最佳拍档 · Enactive Cognition vs 表征主义
这些运行在全球各地服务器里的AI,它们真的理解这个世界吗?它们展现出来的那些令人惊叹的所谓智能,和人类几十亿年进化出来的认知能力,在本质上是同一种东西吗? — 大飞(最佳拍档)
这个问题直接关系到AI未来的发展方向。如果现在的AI已经有真正的理解能力,只需继续扩大模型规模,AGI自然到来。但如果它们只是在模仿行为、统计模式,无论模型做多大,都永远不可能达到真正的通用智能。
你识别出这是"椅子",因为脑子里有"椅子"的内部表征,你把眼前的物体和这个表征进行了匹配。
被动 符号匹配你知道这是椅子,因为你知道可以坐在上面、可以搬动它、可以把它当桌子用。这些"能做什么"的知识,就是你对椅子的理解。
主动 行动创造意义Agent与环境持续互动,不是静态数据集。"世界本身就是它最好的模型"——罗德尼·布鲁克斯
没有行动就没有感知,感知本身就是一种行动。掌握行动如何改变感官输入的规律 = 感知世界。
认知离不开身体。你的身体能做什么、不能做什么,决定了你能有什么样的经验。
Agent主动定义自己的目标和意义,从欲望出发投射到世界生成目标——"意向弧"。
数据不再是一种静态的资源,而是Agentic能力的产物。只有通过Agent自己的经验,才能实现真正的持续进步。 — 萨顿 & 西尔弗,《欢迎来到经验时代》(2025)
一个大模型即使看过了所有关于"杯子"的文本和图片,它也不可能真正理解"杯子"是什么,因为 它从来没有拿过一个杯子,从来没有用杯子喝过水,从来没有打碎过一个杯子。 — 大飞
主流AI路线 · 1950年代认知革命 · 来源:古希腊柏拉图
新方向 · 具身智能 · 来源:现象学+生态心理学
表征主义流程:
生成认知流程:
理念论:现实世界是理念世界的影子,知识是对理念的回忆
认知科学诞生:认知 = 计算 + 表征,成为AI基础范式
符号AI:规则匹配 + 逻辑推理,完全缺乏身体经验
数据驱动表征学习,但仍是被动学习人类留下的痕迹
萨顿 & 拉菲系统性批判表征主义,提出生成认知路线
萨顿和拉菲从丰富的哲学和科学思想中,提炼出四个对AI最关键的核心概念
Agent与环境持续互动、相互影响。不是过去经历的数据集,而是实时生成的互动过程。
感知和行动是相互建构、不可分割的整体。没有行动就没有感知,感知本身就是一种行动。
认知离不开身体。你的身体能做什么、不能做什么,决定了你能有什么样的经验。
Agent不是被动接收信息,而是主动定义自己的目标和意义。
| 机器学习的"经验" | 生成认知的"经验" | |
|---|---|---|
| 本质 | 人类预先收集的静态数据集 | Agent与环境实时生成的互动过程 |
| 来源 | 人类经验留下的痕迹 | Agent自己的行动和反馈 |
| 持续性 | 一次性的,训练完就固定 | 持续不断,没有终点 |
| 游泳比喻 | 看了一万本游泳书和视频 | 真正下水,体验浮力、呛水、保持平衡 |
吉布森提出:环境提供给智能体的行动可能性,不是物体固有属性,而是物体与智能体身体能力之间的关系。
休伯特·德雷福斯批判专家系统缺乏人类基于身体经验的常识
瓦雷拉、汤普森、罗施——正式提出生成主义框架
奥雷根 & 诺埃——传感器运动偶联理论
萨顿 & 拉菲——对主流AI范式的系统性批判和反思
萨顿 & 西尔弗——数据是Agentic能力的产物,只有通过Agent自己的经验才能持续进步
| AI类型 | 问题 | 诊断 |
|---|---|---|
| 🟡 专家系统 | 完全缺乏经验,只有规则匹配 | 零经验 |
| 🔴 监督学习 | 数据只是人类经验痕迹,不是AI自己的经验 | 二手经验 |
| 🔴 大语言模型 | 看过所有"杯子"文本图片,仍不理解"杯子" | 无具身 |
| 🟡 强化学习 | 最接近经验观,但仍不完整 | 部分经验 |
| 🟢 具身AI/机器人 | 有身体,持续学习,有希望 | 接近目标 |
生成认知 — 认知不是在头脑中构建世界的模型,而是在具身主体与环境的互动中被"生成"的。意义是Agent在行动中创造的。
表征主义 — 主流AI依赖的认知观。认为认知是信息处理过程:外部信息→内部表征→推理决策→行动输出。感知是被动的。
环境提供给智能体的行动可能性。不是物体固有属性,而是物体与智能体身体能力之间的关系。如:地面→行走,杯子→抓握。
认知离不开身体。你的身体能做什么、不能做什么,决定了你能有什么样的经验。(梅洛-庞蒂)
行动系统性地改变感官输入,掌握这些规律就是感知世界。如:眼球转动→视野物体反向移动→据此感知深度和空间。(奥雷根 & 诺埃)
世界比任何Agent都大得多、复杂得多。它永远不可能见过所有情况,必须持续学习和适应。(萨顿)
从欲望/需要出发,投射到世界生成目标。Agent不是被动接收信息,而是主动定义自己的意义和方向。
表征主义的核心假设:感知是对预先存在的世界的被动复制,先看见再识别再行动。
生成认知的经验 ≠ 机器学习的数据集。是Agent与环境之间持续不断、相互影响的实时互动过程,有技能性、规范性、具身性三个特点。
神经网络学习新任务时完全忘记旧任务的现象。持续学习(终身学习)研究的核心问题。
能够主动行动、设定目标、持续学习的AI系统。萨顿:"数据不再是静态资源,而是Agentic能力的产物。"