导论：机器人、智能控制与具身智能

对应 PPT：第一讲《绪论》这一篇是全课的「地图」，先建立概念框架，后面每一篇都是在往这张地图上填内容。读完你应该能回答：什么是智能控制？它和传统控制差在哪？这门课要讲哪几条技术路线？

1. 从一个直觉开始：智能机器人「智能」在哪

现在的机器人已经不是「按固定程序动作的执行机器」，而是能感知环境、理解指令、自主决策的具身智能体。把「智能机器人」拆开，有四个基本要素，正好对应一个经典闭环 —— OODA 循环：

要素	OODA 阶段	典型硬件 / 能力
感知 Observation	观察	摄像头、激光雷达
认知 Orientation	判断	环境解析、情景判断
决策 Decision	决策	路径规划、任务分配
执行 Action	行动	协同控制、运动控制

记住这个闭环：感知 → 认知 → 决策 → 执行 →（反馈回感知）。后面所有方法，本质上都是在强化这个闭环里的某一环或整体。

2. 机器人的定义与分类

「机器人」没有全球统一定义，但各家定义能看出侧重：

美国机器人协会 RIA：可编程、多功能的机械手（manipulator），用于搬运材料 / 零件 / 工具。
日本 JIRA：带记忆装置和末端执行器（end effector）、能自动移动代替人力的通用机器。
美国国家标准局 NBS：能编程、在自动控制下执行操作与移动作业的机械装置。
我国定义：自动化机器 + 类人 / 仿生的智能能力（感知、规划、执行、协同），强调高度灵活性。

归纳：国外定义强调「按程序执行任务」的能力；我国定义额外强调「智能属性」（仿生智能）。这其实预示了从「自动化」到「智能化」的演进。

机器人的三种分类依据：① 按应用环境（工业 / 服务）；② 按自主性（遥控 / 自主）；③ 按功能（家用、医疗、农业、军事、空中等）。

3. 具身智能：智能由「身体 × 环境交互」塑造

具身智能（Embodied Intelligence） 的概念最早可追溯到图灵（1950）。核心主张是——智能不是只待在「算法 / 推理模块」里，而是由智能体的物理身体、传感-运动回路、与环境的持续交互共同塑造出来的。

两个关键词：

具身性：认知与行为能力受身体结构、材料属性、驱动方式、传感配置的约束与塑形。
耦合：智能体与环境通过力学交互 + 信息反馈形成动态闭环；智能表现为「闭环系统的稳定」。

机器人是具身智能的载体，具备四性：载体性（提供身体形态与执行器）、闭环性（传感器 → 状态估计 → 策略 / 控制 → 执行器 → 环境反馈）、约束性（真实世界的时延、饱和、摩擦、能量预算）、系统性（落地靠「算法 + 传感 + 执行 + 能源 + 管理」协同）。

一个贯穿全课的视角：从系统论看，具身智能就是一个广义控制问题——在复杂不确定环境中做「信息-能量耦合调控」：

控制对象 = 具身系统；
控制目标 = 任务性能最优 + 约束满足；
控制手段 = 模型 + 反馈 + 优化 + 学习的统一。

这句话很关键：它把「AI 的具身智能」和「控制论」直接焊在了一起，也是这门课为什么叫「智能控制与机器人」。记住它，第 6 篇我们会让这个闭环合上。

4. 为什么需要智能控制：传统控制的局限

传统控制 = 经典控制（PID、根轨迹、频域）+ 现代控制（状态空间、最优控制）。它们的共同前提是：有被控对象的精确数学模型。这在实际中常常做不到：

实际系统有复杂性、非线性、时变性、不确定性，拿不到精确数学模型；
某些含不确定性的过程根本无法用传统数学模型描述；
传统方法常需要苛刻的线性化假设，与实际系统不符；
面对智能机器人、社会经济系统等复杂任务，传统控制无能为力。

智能控制的研究对象因此有三个特点：不确定性模型、高度非线性、复杂任务要求（自规划、自决策、避障、故障诊断等）。

5. 智能控制的定义（一段简史）

智能控制是「控制理论发展的高级阶段」，本质是一门交叉学科：

1966 年，J. M. Mendel 提出把人工智能技术用于飞船控制系统设计；
1971 年，美籍华人傅京逊教授首次提出「智能控制」概念，定义为人工智能与自动控制的交叉；
1977 年，G. N. Saridis 引入运筹学，提出著名的三元交集结构：

$IC = AC \cap AI \cap OR$

其中 $IC$ = 智能控制， $AC$ = 自动控制， $AI$ = 人工智能， $OR$ = 运筹学。

$AI$ ：模拟人思维的知识处理系统（记忆、学习、推理）；
$AC$ ：描述系统动力学特性，本质是动态反馈；
$OR$ ：定量优化方法（线性规划、调度、多目标优化）。

引入 $OR$ 的意义：在「智能 + 控制」之外，强调更高层次的调度、规划、管理，为递阶智能控制提供理论依据。

智能控制的定义：设计一个控制器，使其具备学习、抽象、推理、决策功能，能根据环境信息变化做出适应性反应，完成原本需要人来完成的任务。它有三种类型：① 人作为控制器；② 人-机结合作为控制器；③ 无人参与的自主控制系统（如自主机器人）。

学科形成标志：1985 年 IEEE 成立智能控制专委会；1987 年第一次国际智能控制大会。

6. 控制理论现状：四个反直觉的观点

课件引用 Annual Reviews in Control（2020）的产业调研，给了四个重要判断，提醒我们别把「智能控制」浪漫化：

控制理论在没落吗？没有。 1960–2020 IFAC 论文数、专利数都在稳步上升。
学术界和工业界有分离吗？有。 工业界人士在 IEEE 控制系统学会担任 leader 的比例在下降。
最有影响力的控制方法是什么？PID 仍稳居王座。 其次是系统辨识；先进控制里最被看好的是 MPC（模型预测控制）。
理论界和工业界看重的指标不同。 理论界追求响应快、鲁棒性好；工业界几乎压倒性地最看重降本（cost reduction）。

这组观点的价值：工业落地里 PID 依然是主力，智能方法要解决的是 PID 们搞不定的那部分，且最终要算经济账。

7. 智能控制的五大分支（本课主线）

这正是后面各篇的主角：

模糊控制：精确量 → 模糊化 → 模糊规则推理 → 解模糊 → 控制对象。（第 2 篇）
神经网络控制：用神经网络的强非线性逼近与学习能力，在线调权值使误差趋零。（第 3 篇）
智能搜索算法：遗传算法、粒子群等，模拟自然过程求解优化问题。
迭代学习控制：利用先前经验和输出误差，每次迭代调整控制输入，适合重复性任务。（第 4 篇）
强化学习控制：智能体与环境交互，依据奖赏以「试错」方式调整策略。（第 4 篇）

加上第 6 篇的 VLA（视觉-语言-动作）模型：把视觉感知、语言理解、动作生成统一进一个神经网络，实现「看 + 听 → 行动」的端到端学习。

8. 本篇小结

智能机器人 = 感知-认知-决策-执行 闭环（OODA）
        │
        ├── 具身智能：智能由「身体 × 环境交互」塑造，是广义控制问题
        │
传统控制（需精确模型）──力不从心──> 智能控制（IC = AC ∩ AI ∩ OR）
        │
        └── 五大分支：模糊 / 神经网络 / 智能搜索 / 迭代学习 / 强化学习（+ VLA）
                  （符号·模糊·连接·行为 四条线）
                  └──> 在「具身智能 / VLA」中合流

下一篇：进入符号主义的代表——专家系统与专家控制，看最早一代「会讲道理」的智能控制是怎么用规则把专家经验装进机器的。