导论:机器人、智能控制与具身智能
对应 PPT:第一讲《绪论》 这一篇是全课的「地图」,先建立概念框架,后面每一篇都是在往这张地图上填内容。读完你应该能回答:什么是智能控制?它和传统控制差在哪?这门课要讲哪几条技术路线?
1. 从一个直觉开始:智能机器人「智能」在哪
现在的机器人已经不是「按固定程序动作的执行机器」,而是能感知环境、理解指令、自主决策的具身智能体。把「智能机器人」拆开,有四个基本要素,正好对应一个经典闭环 —— OODA 循环:
| 要素 | OODA 阶段 | 典型硬件 / 能力 |
|---|---|---|
| 感知 Observation | 观察 | 摄像头、激光雷达 |
| 认知 Orientation | 判断 | 环境解析、情景判断 |
| 决策 Decision | 决策 | 路径规划、任务分配 |
| 执行 Action | 行动 | 协同控制、运动控制 |
记住这个闭环:感知 → 认知 → 决策 → 执行 →(反馈回感知)。后面所有方法,本质上都是在强化这个闭环里的某一环或整体。
2. 机器人的定义与分类
「机器人」没有全球统一定义,但各家定义能看出侧重:
- 美国机器人协会 RIA:可编程、多功能的机械手(manipulator),用于搬运材料 / 零件 / 工具。
- 日本 JIRA:带记忆装置和末端执行器(end effector)、能自动移动代替人力的通用机器。
- 美国国家标准局 NBS:能编程、在自动控制下执行操作与移动作业的机械装置。
- 我国定义:自动化机器 + 类人 / 仿生的智能能力(感知、规划、执行、协同),强调高度灵活性。
归纳:国外定义强调「按程序执行任务」的能力;我国定义额外强调「智能属性」(仿生智能)。这其实预示了从「自动化」到「智能化」的演进。
机器人的三种分类依据:① 按应用环境(工业 / 服务);② 按自主性(遥控 / 自主);③ 按功能(家用、医疗、农业、军事、空中等)。
3. 具身智能:智能由「身体 × 环境交互」塑造
具身智能(Embodied Intelligence) 的概念最早可追溯到图灵(1950)。核心主张是——智能不是只待在「算法 / 推理模块」里,而是由智能体的物理身体、传感-运动回路、与环境的持续交互共同塑造出来的。
两个关键词:
- 具身性:认知与行为能力受身体结构、材料属性、驱动方式、传感配置的约束与塑形。
- 耦合:智能体与环境通过力学交互 + 信息反馈形成动态闭环;智能表现为「闭环系统的稳定」。
机器人是具身智能的载体,具备四性:载体性(提供身体形态与执行器)、闭环性(传感器 → 状态估计 → 策略 / 控制 → 执行器 → 环境反馈)、约束性(真实世界的时延、饱和、摩擦、能量预算)、系统性(落地靠「算法 + 传感 + 执行 + 能源 + 管理」协同)。
一个贯穿全课的视角:从系统论看,具身智能就是一个广义控制问题——在复杂不确定环境中做「信息-能量耦合调控」:
- 控制对象 = 具身系统;
- 控制目标 = 任务性能最优 + 约束满足;
- 控制手段 = 模型 + 反馈 + 优化 + 学习 的统一。
这句话很关键:它把「AI 的具身智能」和「控制论」直接焊在了一起,也是这门课为什么叫「智能控制与机器人」。记住它,第 6 篇我们会让这个闭环合上。
4. 为什么需要智能控制:传统控制的局限
传统控制 = 经典控制(PID、根轨迹、频域)+ 现代控制(状态空间、最优控制)。它们的共同前提是:有被控对象的精确数学模型。这在实际中常常做不到:
- 实际系统有复杂性、非线性、时变性、不确定性,拿不到精确数学模型;
- 某些含不确定性的过程根本无法用传统数学模型描述;
- 传统方法常需要苛刻的线性化假设,与实际系统不符;
- 面对智能机器人、社会经济系统等复杂任务,传统控制无能为力。
智能控制的研究对象因此有三个特点:不确定性模型、高度非线性、复杂任务要求(自规划、自决策、避障、故障诊断等)。
5. 智能控制的定义(一段简史)
智能控制是「控制理论发展的高级阶段」,本质是一门交叉学科:
- 1966 年,J. M. Mendel 提出把人工智能技术用于飞船控制系统设计;
- 1971 年,美籍华人傅京逊教授首次提出「智能控制」概念,定义为人工智能与自动控制的交叉;
- 1977 年,G. N. Saridis 引入运筹学,提出著名的三元交集结构:
其中 = 智能控制, = 自动控制, = 人工智能, = 运筹学。
- :模拟人思维的知识处理系统(记忆、学习、推理);
- :描述系统动力学特性,本质是动态反馈;
- :定量优化方法(线性规划、调度、多目标优化)。
引入 的意义:在「智能 + 控制」之外,强调更高层次的调度、规划、管理,为递阶智能控制提供理论依据。
智能控制的定义:设计一个控制器,使其具备学习、抽象、推理、决策功能,能根据环境信息变化做出适应性反应,完成原本需要人来完成的任务。它有三种类型:① 人作为控制器;② 人-机结合作为控制器;③ 无人参与的自主控制系统(如自主机器人)。
学科形成标志:1985 年 IEEE 成立智能控制专委会;1987 年第一次国际智能控制大会。
6. 控制理论现状:四个反直觉的观点
课件引用 Annual Reviews in Control(2020)的产业调研,给了四个重要判断,提醒我们别把「智能控制」浪漫化:
- 控制理论在没落吗?没有。 1960–2020 IFAC 论文数、专利数都在稳步上升。
- 学术界和工业界有分离吗?有。 工业界人士在 IEEE 控制系统学会担任 leader 的比例在下降。
- 最有影响力的控制方法是什么?PID 仍稳居王座。 其次是系统辨识;先进控制里最被看好的是 MPC(模型预测控制)。
- 理论界和工业界看重的指标不同。 理论界追求响应快、鲁棒性好;工业界几乎压倒性地最看重降本(cost reduction)。
这组观点的价值:工业落地里 PID 依然是主力,智能方法要解决的是 PID 们搞不定的那部分,且最终要算经济账。
7. 智能控制的五大分支(本课主线)
这正是后面各篇的主角:
- 模糊控制:精确量 → 模糊化 → 模糊规则推理 → 解模糊 → 控制对象。(第 2 篇)
- 神经网络控制:用神经网络的强非线性逼近与学习能力,在线调权值使误差趋零。(第 3 篇)
- 智能搜索算法:遗传算法、粒子群等,模拟自然过程求解优化问题。
- 迭代学习控制:利用先前经验和输出误差,每次迭代调整控制输入,适合重复性任务。(第 4 篇)
- 强化学习控制:智能体与环境交互,依据奖赏以「试错」方式调整策略。(第 4 篇)
加上第 6 篇的 VLA(视觉-语言-动作)模型:把视觉感知、语言理解、动作生成统一进一个神经网络,实现「看 + 听 → 行动」的端到端学习。
8. 本篇小结
智能机器人 = 感知-认知-决策-执行 闭环(OODA)
│
├── 具身智能:智能由「身体 × 环境交互」塑造,是广义控制问题
│
传统控制(需精确模型)──力不从心──> 智能控制(IC = AC ∩ AI ∩ OR)
│
└── 五大分支:模糊 / 神经网络 / 智能搜索 / 迭代学习 / 强化学习(+ VLA)
(符号·模糊·连接·行为 四条线)
└──> 在「具身智能 / VLA」中合流
下一篇:进入符号主义的代表——专家系统与专家控制,看最早一代「会讲道理」的智能控制是怎么用规则把专家经验装进机器的。