智能控制与机器人 | L.D.J 的私家工坊

这是一份《智能控制与机器人》的系统学习笔记——目标是让一个没上过这门课、但有基本理工科基础（高数、线代、一点点 Python）的读者，跟着它从零把整门课学明白，并且覆盖课程的全部知识点。

它不照搬课件顺序，而是按一条**「智能控制方法演进」的主线重新组织：传统控制（PID）依赖被控对象的精确数学模型，遇到非线性、强不确定、难建模的复杂系统就力不从心；智能控制的思路是把人类专家的经验、学习与推理能力「装进」控制器。这门课就是带你认识「给控制器装智能」的几条主要技术路线，最后汇聚到当下最热的具身智能 / VLA（视觉-语言-动作）模型**。

组织主线是人工智能的三大主义，外加感知、集成与安全：

篇	模块	核心方法	一句话灵魂
第 0 篇	导论	$IC = AC \cap AI \cap OR$ 、OODA、具身智能	给控制器装智能的全局地图
第 1 篇	符号主义	专家系统、专家 PID	把专家经验写成 IF-THEN 规则
第 2 篇	模糊逻辑	模糊控制、TSK 模糊系统	把「有点高」量化成隶属度
第 3 篇	连接主义	神经网络 / RNN / LSTM / Transformer	不写规则，让数据自己学映射
第 4 篇	行为主义	迭代学习控制、强化学习	没有标准答案，靠试错 + 反馈学
第 5 篇	感知	光流	给机器人装「看运动」的眼睛
第 6 篇	集大成	具身智能 / POMDP / VLA / NaVILA	看 + 听懂 → 行动的端到端智能体
第 7 篇	安全	冰山模型 / 对抗样本 / 电车难题	给强大的智能体套上缰绳

这个顺序的逻辑是难度与依赖递进：先讲清「什么是智能控制」（第 0 篇），再从最像人类直觉的规则系统（符号、模糊）讲起，过渡到需要数据的学习方法（神经网络），再到需要交互的试错方法（强化学习），最后这些能力在具身智能 / VLA 里合流，并补上感知（光流）与安全两块拼图。

每一篇都尽量做到有直觉、有例子、有完整推导，公式用 KaTeX 书写。下面按篇阅读即可。

📁 智能控制与机器人

导论：机器人、智能控制与具身智能

符号主义：专家系统与专家控制

模糊逻辑：模糊控制与 TSK 模糊系统

连接主义：神经网络控制

行为主义：迭代学习控制与强化学习

感知基础：光流

集大成：具身智能与 VLA 模型

安全与伦理：给智能体套上缰绳

评论