模糊逻辑:模糊控制与 TSK 模糊系统

Views: --

对应 PPT:第三讲《模糊控制》+ 模糊系统优化专题 专家系统的规则是「非黑即白」的硬逻辑,但人脑经验常是「温度有点高就把阀门关小一点」这种模糊话。模糊控制就是把这种不精确的自然语言经验量化成机器能算的控制律。


1. 为什么需要模糊控制

几点睡算「熬夜」?23:00 几乎不算,00:00 有点熬,01:30 非常熬。但你定不出精确界线——难道 23:59 不算、00:01 就算?「熬夜」本身是个模糊概念:中间过渡时界限不明显、「亦此亦彼」。「老师 / 学生」是精确概念;「高个子 / 热天气 / 年轻人」是模糊概念。

三条痛点逼出模糊控制:传统控制依赖精确模型;专家系统 IF-THEN 非黑即白;而人类经验是定性的(「温度有点高就关小一点」)。核心思想:用模糊数学,把人「不精确的自然语言经验」定量化。五个特点:① 无模型控制;② 贴近人类认知;③ 易理解;④ 工程实现简单;⑤ 鲁棒性与适应性强。

2. 隶属度:从「非 0 即 1」到 [0,1] 连续

模糊数学由美国加州大学 Zadeh(扎德)教授提出,核心是用数学工具描述模糊现象,在经典集合论基础上引入隶属函数

  • 经典集合:元素与集合的关系只有「属于(1)」或「不属于(0)」,分界线明确。
  • 模糊集合:用 隶属度(Degree of membership) μA(x)[0,1]\mu_A(x) \in [0,1] 描述从属程度,是连续变化的值。

为什么需要它?定义「舒适 = 15~25℃」。按经典集合,14.99℃ 属于「冷」、15.01℃ 属于「舒适」——差 0.02 度天壤之别?这跟人的真实感觉不符。模糊集合允许 15℃ 附近「既有点冷又有点舒适」。

经典案例(Zadeh 的「年轻」模糊集):0x250 \le x \le 25μ=1\mu = 125<x10025 < x \le 100

μ年轻(x)=[1+(x255)2]1\mu_{\text{年轻}}(x)=\left[\,1+\left(\frac{x-25}{5}\right)^{2}\,\right]^{-1}

代入 x=30x=30μ(30)=11+1=0.5\mu(30)=\frac{1}{1+1}=0.5,即「30 岁属于年轻人的程度是 0.5」——模糊集合给出了「半个年轻人」这种符合直觉的描述。

三种表示法(以 5 人对「高个子」隶属度为例):① Zadeh 法 A=μ(xi)/xiA=\sum \mu(x_i)/x_i(「+」「/」只是分隔符,不是加和除);② 序偶法 A={(xi,μ(xi))}A=\{(x_i,\mu(x_i))\};③ 隶属函数描述法(连续论域用,如上面「年轻」的分段函数)。

3. 模糊集合的交并补运算

A,BA,B 在同一论域,把「非此即彼」换成隶属度的逐点运算:

  • ABA\cap B:逐点取小 min\min,记 \wedge
  • ABA\cup B:逐点取大 max\max,记 \vee
  • Aˉ\bar AμAˉ(x)=1μA(x)\mu_{\bar A}(x)=1-\mu_A(x)

例:A=(0.5,0.3,0.4,0.2,0.1)A=(0.5,0.3,0.4,0.2,0.1)B=(0.2,0.8,0.1,0.7,0.4)B=(0.2,0.8,0.1,0.7,0.4)AB=(0.2,0.3,0.1,0.2,0.1)A\cap B=(0.2,0.3,0.1,0.2,0.1)AB=(0.5,0.8,0.4,0.7,0.4)A\cup B=(0.5,0.8,0.4,0.7,0.4)Aˉ=(0.5,0.7,0.6,0.8,0.9)\bar A=(0.5,0.7,0.6,0.8,0.9)

直觉:模糊逻辑里 「且」= 取小(一串条件里最弱一环决定整体,木桶效应)、「或」= 取大「非」= 1 减。这三个算子是后面所有模糊推理的基础。

4. 模糊关系与合成

模糊关系描述两个论域元素「多大程度相关」,用矩阵表示 rij=μR(xi,yj)[0,1]r_{ij}=\mu_R(x_i,y_j)\in[0,1]。例:子女与父母相貌相似度

0.80.3
0.50.9

max-min 合成:算法像矩阵乘法,但**「乘」改取小 \wedge、「加」改取大 \vee**。某格例:(0.30.1)(0.70.8)(0.20.0)=0.10.70.0=0.7(0.3\wedge0.1)\vee(0.7\wedge0.8)\vee(0.2\wedge0.0)=0.1\vee0.7\vee0.0=0.7。直觉:每条「通路」取最弱一环,多条通路取最强那条。

5. 模糊推理:让「IF A THEN B」能算

一条规则「IF x is A THEN y is B」分两步:① 把规则编码成模糊关系 R=A×BR=A\times BμR(x,y)=μA(x)μB(y)\mu_R(x,y)=\mu_A(x)\wedge\mu_B(y),逐对取小);② 用实际输入做合成 B=ARB'=A'\circ R(max-min 合成)。

例(IF 温度低 THEN 开大阀门):温度低 A=(1.0,0.6,0.1)A=(1.0,0.6,0.1),阀门开大 B=(0.1,0.7,1.0)B=(0.1,0.7,1.0)。先求 R=A×BR=A\times B

b1b2b3
a10.10.71.0
a20.10.60.6
a30.10.10.1

输入实际温度 A=(0.8,0.5,0.2)A'=(0.8,0.5,0.2),则 B=AR=(0.1,0.7,0.8)B'=A'\circ R=(0.1,0.7,0.8)模糊关系就是模糊推理的桥梁。

6. 模糊控制器:三件套 + 工作流程

精确量 →①模糊化→ 模糊量 →②知识库+推理→ 模糊控制量 →③解模糊→ 精确控制量

① 模糊化接口:精确量 → 模糊量。常用单点模糊集。典型语言变量(描述误差,三角隶属函数,论域 [6,6][-6,6]):NB 负大 / NM 负中 / NS 负小 / ZO 零 / PS 正小 / PM 正中 / PB 正大

② 知识库 = 数据库(存隶属函数)+ 规则库(存 IF-THEN 模糊规则)

③ 推理与解模糊接口:推理求出模糊控制量,解模糊把它变回精确量。

6.1 二维模糊控制器的 7 步设计

工程最常用单变量二维模糊控制器:输入误差 EE 和误差变化 ECEC,输出控制量 uu(本质是「模糊版 PD 控制」)。7 步:① 定义控制器(选二维结构);② 定义模糊集与论域(都取 7 档 {NB,...,PB}\{NB,...,PB\});③ 定义隶属函数(常用三角形);④ 建立模糊规则;⑤ 建立模糊控制表(二维共 7×7=497\times7=49 条);⑥ 模糊推理;⑦ 反模糊化。

二维模糊控制表(行 EE、列 ECEC、格内 uu):

E\ECNBNMNSZOPSPMPB
NBNBNBNMNMNSNSZO
NMNBNMNMNSNSZOPS
NSNMNMNSNSZOPSPS
ZONMNSNSZOPSPSPM
PSNSNSZOPSPSPMPM
PMNSZOPSPSPMPMPB
PBZOPSPSPMPMPBPB

规律:对角对称,误差与误差变化越往一个方向偏,控制量越往对应方向给。

工程关键技巧——查询表(Look-up Table):把 49 条规则离线全部推理 + 解模糊,算成一张「E×ECuE\times EC\to u 的数值表」;在线时直接查表,不实时推理,又快又稳。这是模糊控制能塞进单片机的原因。

7. 解模糊的三种方法

  • 最大隶属度法:取隶属度最大的输出,并列取平均。简单但丢分布信息、易跳变。
  • 重心法(最常用):取隶属度曲线与横轴围成面积的质心。离散式:

v0=kvkμ(vk)kμ(vk)v_0=\frac{\sum_{k} v_k\,\mu(v_k)}{\sum_{k}\mu(v_k)}

输出平滑,输入微变输出也平滑变。

  • 加权平均法v0=ikiviikiv_0=\frac{\sum_i k_i v_i}{\sum_i k_i},工业常用;权 kik_iμ(vi)\mu(v_i) 时退化为重心法。

8. 模糊自适应整定 PID

思想:把「什么误差状况下 PID 三参数该怎么调」的经验写成模糊规则;运行时实时检测 e,ece,ec,用模糊推理在线整定 kp,ki,kdk_p,k_i,k_d

kp=kp0+Δkp,ki=ki0+Δki,kd=kd0+Δkdk_p=k_{p0}+\Delta k_p,\quad k_i=k_{i0}+\Delta k_i,\quad k_d=k_{d0}+\Delta k_d

三参数作用分析(重点,常考)

参数作用过大过小
kpk_p 比例加快响应、提高精度超调、易不稳定响应慢、精度低
kik_i 积分消除稳态误差积分饱和、超调大静差难消除
kdk_d 微分改善动态、提前预报偏差提前制动、抗干扰差动态改善不足

对比专家 PID(都不要精确模型):专家 PID 用规则切换控制策略(5 种情况);模糊 PID 用模糊推理在线调 PID 三个参数旋钮。前者调「怎么打」,后者调「力度」。

模糊控制的发展转折点值得记一个:1992 年 L.X.Wang 证明模糊系统是万能逼近器(能逼近任意连续函数,和神经网络一样)。这个「模糊万能逼近 + 神经模糊」正是「模糊」与「神经网络」深层相通的信号——这是下面 TSK 的主题,也是通往第 3 篇连接主义的桥。


9. TSK 模糊系统:把规则后件从「模糊集」换成「函数」

对应:模糊系统优化专题。前面讲的 Mamdani 型模糊控制,规则后件还是个模糊集(「THEN u is PB」)。TSK 模糊系统把后件换成一个普通函数,于是模糊系统一下子和一大堆机器学习模型「等价」了,也能用神经网络那套梯度下降来训练。这是「模糊」与「连接主义」真正握手的地方。

TSK = Takagi–Sugeno–Kang。它和 Mamdani 型的唯一区别在后件。一条二输入 TSK 规则:

IF x1 is F1 and x2 is F2, THEN y=a1x1+a2x2+c\text{IF } x_1 \text{ is } F_1 \text{ and } x_2 \text{ is } F_2,\ \text{THEN } y = a_1 x_1 + a_2 x_2 + c

  • 前件:和模糊控制一样,用隶属函数判断输入「有多符合这条规则」。
  • 后件:不再是模糊标签,而是一个关于输入的函数a1=a2=0a_1=a_2=0 时退化成常数(零阶 TSK)。

直觉:Mamdani 是「每条规则投一个模糊标签,最后解模糊」;TSK 是「每条规则给一个小公式算出一个数,最后按隶属度加权平均」。后者天然可微、省掉解模糊、更好训练。

设计 TSK 的三大挑战:① 优化(进化算法 / 梯度下降);② 维数灾难(规则数随输入维度指数爆炸);③ 泛化(靠正则化)。

9.1 训练 TSK:MBGD 套路

既然要梯度下降,就有「每步用多少样本」的选择,这就是 MBGD(Mini-Batch Gradient Descent,小批量梯度下降)

方式每步样本特点
批量 GD全部 NN方向最准,但百万样本太慢
随机 GD1 个快,但方向抖、噪声大
小批量 GD(MBGD)一小撮(32/64)又快又稳,今天训练神经网络的标准做法

更新式:θk=θk1αLθk1\theta_k=\theta_{k-1}-\alpha\,\frac{\partial L}{\partial\theta}\big|_{k-1}。训练 TSK 三步走:定义目标函数(带 L2 正则)→ 半随机初始化规则 → 微调规则(大数据用 MBGD、加速用 Adam/AdaBound、提泛化用 DropRule / 归一化)。代表作 MBGD-RDA(Wu et al. 2019)。

9.2 TSK ≈ RBF 网络(核心等价)

这一节的完整理解需要先看第 3 篇的 RBF 网络。这里先给结论,第 3 篇会逐行推导证明。

一个 TSK 模糊系统,在适当条件下,和五种主流机器学习模型功能等价:RBF 神经网络、MLP/ANFIS、混合专家 MoE、分类回归树 CART、堆叠集成 Stacking。其中最直接的是 TSK ≈ RBF 网络——当把模糊集的隶属函数选成高斯,TSK 的「规则点火强度」就逐字变成 RBF 的「钟形片区探测器」:规则数 = 神经元数、规则中心 = 高斯中心、加权平均 = 加权求和。

意义:① 「模糊系统是万能逼近器」和「神经网络是万能逼近器」本质是同一件事;② 神经模糊(Neuro-Fuzzy)/ ANFIS 由此而来——既可当模糊系统看(每个高斯是一条可读的 IF-THEN 规则,白盒),又可当神经网络训练(梯度下降自动学中心 / 权重)。这一举解决了第 1 篇的「知识获取困境」:规则不用人写,让数据训出来,还能翻译回人能读的规则。

ANFIS(自适应网络模糊推理系统,Jang 1993) 把一次模糊推理拆成五层前馈网络,于是能用反向传播训练:① 算隶属度 → ② 算规则激活强度 → ③ 归一化 → ④ 激活强度 × 后件 → ⑤ 求和。

9.3 Mamba / SSM:序列建模又回到控制的状态空间法

专题最后抛出一个呼应全课主题的彩蛋:当下挑战 Transformer 的 Mamba,其内核 SSM(状态空间模型) 正是《自动控制原理》里的状态空间法

Transformer 自注意力对序列长度 NNO(N2)O(N^2) 复杂度、超长序列吃不消。Mamba(Gu & Dao, 2023)不靠 attention,由 S4 / S6 模块堆叠:训练时像 CNN(可并行)、推理时像 RNN(状态递推),吞吐量是 Transformer 的 5 倍。机器学习的 SSM 写成连续状态方程 + 输出方程:

h˙(t)=Ah(t)+Bu(t)\dot h(t)=A\,h(t)+B\,u(t)

y(t)=Ch(t)+Du(t)y(t)=C\,h(t)+D\,u(t)

这和自动控制原理的状态空间法 x˙=Ax+Bu, y=Cx+Du\dot x = A x + B u,\ y = C x + D u 一模一样。也就是说,深度学习兜了一大圈,又回到了控制论 60 年前的语言——这是这门课「智能 × 控制」深层统一的最好注脚,也再次照应导论「具身智能是广义控制问题」。

10. 本篇小结

模糊逻辑 → 用隶属度处理「亦此亦彼」
  模糊集合(隶属度/交并补/关系合成/推理)
  模糊控制器 = 模糊化 + 知识库推理 + 解模糊(7步设计 + 查询表)
  模糊 PID:在线调三参数旋钮
      │(1992 模糊万能逼近器)

  TSK:后件换成函数 → 可微可训练
      ≈ RBF/MLP/MoE/CART/Stacking(神经模糊 ANFIS)
      Mamba/SSM = 控制论的状态空间法

下一篇:连接主义——不写规则、不写隶属函数,给机器一堆「输入→输出」的例子,让它自己从数据里把规律学出来。

评论