导论:机器人、智能控制与具身智能
全课地图:从 OODA 闭环看智能机器人、傅京逊与 Saridis 的智能控制定义 IC=AC∩AI∩OR、为什么传统控制力不从心、五大智能控制分支,以及具身智能为何是一个广义控制问题
积极乐观、活力无穷、永远攀登。
Math · Code · Design · Philosophy
7 folders, 0 postsAbout self-discipline and teamwork
Money money and more money
BUAA 你把我害惨了
2 folders, 0 postsLife is love, inspiration, freedom, experiment
0 folders, 0 postsGoals in mind, Step on feet.
0 folders, 0 postsExplore the world inside.
0 folders, 0 posts全课地图:从 OODA 闭环看智能机器人、傅京逊与 Saridis 的智能控制定义 IC=AC∩AI∩OR、为什么传统控制力不从心、五大智能控制分支,以及具身智能为何是一个广义控制问题
给控制器装智能的第一条路线:把专家经验写成 IF-THEN 规则。知识库+推理机、正反向推理、CF 确定性因子、专家系统 vs 专家控制、专家 PID(增量式 PID 完整推导 + 5 种情况),以及 XCON/MYCIN/PROSPECTOR 与专家系统的衰落
把不精确的自然语言经验定量化:隶属度与模糊集合、交并补与 max-min 合成、模糊推理、模糊控制器三件套与 7 步设计、解模糊三法、模糊自适应 PID,以及 TSK 模糊系统、TSK≈RBF 网络、ANFIS 与 Mamba/SSM 回到状态空间法
不写规则,让数据自己学映射。机器学习三要素、神经元与激活函数(梯度消失→ReLU)、通用近似定理、反向传播、六种神经网络控制结构、RBF 网络控制、TSK≈RBF 的逐行证明,以及 RNN/LSTM/Transformer 处理序列
没有标准答案,靠试错+反馈学习。迭代学习控制的二维时间视角、D/P/PD/PID 型学习律与收敛性 |I-PΓ|<1 推导;强化学习的 MDP、贝尔曼方程、Q-Learning 走房间、DQN、Actor-Critic 与 PPO/SAC/TD-MPC 算法谱系
给机器人装上「看运动」的眼睛。光流的定义与稀疏/稠密之分、两条基本假设与核心约束方程推导、孔径问题,以及三代算法:Lucas-Kanade(最小二乘+角点)、Farneback(二次多项式拟合)、FlowNet(深度学习)