KGE 与推理 2(关系特性建模)
Views: --
对应 PPT:第11讲 第 10 讲的深化——专门讲”如何建模不同的关系特性”(1-N/N-N/对称/逆反/组合/层次)。重点:TransE 家族完整对比、张量分解改进、特定空间模型。
1. 关系特性分类(必背)
1.1 复杂映射特性(4 类)
| 类型 | 含义 | 例子 |
|---|---|---|
| 1-1 | 一对一 | (北京, 首都, 中国) |
| 1-N | 一对多 | (中国, 有城市, 北京/上海/广州) |
| N-1 | 多对一 | (小明/小强, 出生于, 北京) |
| N-N | 多对多 | (本泽马/贝克汉姆/C罗, 效力于, 皇家马德里) |
“1”位置是唯一性实体,“N”位置是非唯一性实体。
1.2 多种关系模式(4 类)
| 模式 | 含义 | 例子 |
|---|---|---|
| 对称关系 | 夫妻、朋友 | |
| 反对称关系 | 老师 | |
| 逆反关系 | 球员 ↔ 效力于 | |
| 组合关系 | (小明, 出生于, 北京) + (北京, 首都, 中国) → (小明, 国籍, 中国) |
1.3 实体间层次关系
- 中国 > 广西省 > 桂林市(自顶向下的层次)
- 双曲空间 / 极坐标可建模这种树状结构
2. 基础模型的局限
| 模型 | 局限 |
|---|---|
| TransE | 不能建模 1-N(强制 t 相等);对称关系 → ;无法建模层次 |
| RESCAL | 矩阵乘法满足交换律 → 不能建模反对称;难以建模组合 |
3. 基于关系感知映射的模型(5 个变种)
3.1 总览表(必背)
| 模型 | 表示空间 | 打分函数 | 特点 |
|---|---|---|---|
| TransH | 实数 | 关系超平面投影 | |
| TransR | 实数 | 关系空间投影 | |
| STransE | 实数 | 头尾实体不同投影 | |
| TransD | 实数 | 自适应稀疏投影 | |
| TransF | 实数 | 放松约束 | |
| TransA | 实数 | 马氏距离 |
3.2 TransH
- 每个关系 r 对应超平面法向量
- 实体投影到超平面再平移
- 投影公式:
- 缺点:同一关系的所有实体都投影到同一个超平面,无法精细区分
3.3 TransR / STransE / TransD
| 模型 | 关键创新 | 优缺点 |
|---|---|---|
| TransR | 每个关系一个投影矩阵 | 实体/关系空间分离;参数多 |
| STransE | 头/尾实体分别投影 | 更灵活;参数更多 |
| TransD | 自适应稀疏投影矩阵 | 减少参数 |
TransD 公式(重点记忆):
- 头尾实体分别投影 → 自适应
3.4 TransF
- 放松 TransE 的硬约束:头实体+关系 ≠ 必须等于尾实体,只需保持相同方向
3.5 TransA / TransM
- TransA:欧氏距离 → 加权马氏距离(对不同分量加权)
- TransM:降低 1-N 关系权重
4. 基于特定表示空间的模型
4.1 4 个模型
| 模型 | 表示空间 | 思想 |
|---|---|---|
| KG2E | 多维高斯空间 | 实体/关系表示为高斯分布,含不确定性 |
| ManifoldE | 流形空间 | 实体在球体内(不强制相等) |
| TorusE | 紧李群环 | TransE 的李群环版本 |
| HAKE | 极坐标系 | 模长+相角分别建模层次和语义 |
4.2 KG2E(不确定性建模)
- 实体/关系嵌入多维高斯分布
- = 中心位置, = 不确定度
- 打分函数(KL 散度 / 期望似然):
关键优势:能直接建模复杂映射特性 + 不确定性。
4.3 ManifoldE(流形)
- 打破”点 = 点”的硬约束
- 头实体和关系为球心,尾实体在球内:
- 巧妙解决 1-N 问题:1-N 的多个 t 只要都在球内即可
4.4 TorusE(紧李群环)
- 把 TransE 搬到李群环上
- 同一头实体不同尾实体的差值可以相同 → 建模 1-N
- 打分函数:
4.5 HAKE(极坐标建模)
- 实体/关系表示为极坐标
- 模长 建模层次(同一层 → 相同模长)
- 相角 建模语义(同一类 → 相近相角)
- 数学:
$\mathbf{h} \circ \mathbf{r}$在极坐标下 = 模长相乘 + 相角相加
5. 建模多种关系模式的 3 类方法
5.1 总览
| 类型 | 代表模型 | 关键思想 |
|---|---|---|
| 改进张量分解 | ComplEx / HolE / SimplE | 打破交换律 |
| 改进关系感知映射 | PairRE / TripleRE / TranS | 增加映射+平移 |
| 旋转操作 | RotatE / QuatE / DualE | 复数/四元数旋转 |
5.2 改进张量分解
ComplEx(第一个打破交换律):
- 实体/关系嵌入复数空间
- 头实体、关系、尾实体复数表示间的哈密顿乘法
- 打分函数:
- = 尾实体的共轭
- 同时建模对称 + 反对称
HolE:
- 循环相关运算
- 头尾实体间的循环相关 → 同时建模对称/反对称
- 但不能建模组合关系
SimplE:
- 为每个实体学 2 个嵌入(作为头 + 作为尾)
- 为每个关系构造对应的逆关系
- 打分函数:
5.3 改进关系感知映射
PairRE(最优雅的方案):
- 关系用成对向量 分别处理头/尾
- 打分函数:
- 满足约束:
| 关系模式 | PairRE 约束 |
|---|---|
| 对称 | |
| 反对称 | |
| 逆反 | |
| 组合 |
TripleRE:
- 关系表示为3 部分(头映射 + 平移 + 尾映射):
TranS:
- TripleRE 的扩展,2 次映射 + 3 次平移:
5.4 旋转操作(最现代)
RotatE(复数旋转):
- 是模长 1 的复数(纯旋转)
- 4 种关系模式都能建模
- 缺点:复数空间一个平面上的旋转,可能导致奇异性
QuatE(四元数旋转):
- 实体/关系嵌入四元数空间
- 通过哈密顿乘法实现在两个平面上的旋转(更稳定)
- 打分函数:
DualE(对偶四元数 = 旋转 + 平移):
- 实体/关系嵌入对偶四元数空间
- 对偶四元数同时表示旋转和平移
- 打分函数:
6. 建模层次关系
6.1 2 类方法
| 方法 | 代表模型 | 核心思想 |
|---|---|---|
| 双曲空间 | Poincaré | 双曲空间 = 连续树形空间 |
| 极坐标系 | HAKE | 模长建模层次,相角建模语义 |
6.2 Poincaré 模型
- 庞加莱球(特殊的几何空间)
- 距球心近 = 高层抽象概念,距球心远 = 低层具体实体
- 打分函数:
- 只关注”上位”层次关系(如 WordNet)
6.3 HAKE 极坐标
- 二维极坐标 表示一个点
- 模长 → 层次关系(同一层 = 相同模长)
- 相角 → 语义(同一类 = 相近相角)
7. TransE 家族终极对比表(期末必背)
| 模型 | 空间 | 打分函数核心 | 主要建模 |
|---|---|---|---|
| TransE | 实数 | 1-1、反对称、组合 | |
| TransH | 实数 | 投影到关系超平面 | 1-N |
| TransR | 实数 | 投影到关系空间 | 复杂映射 |
| STransE | 实数 | 头尾分别投影 | 复杂映射 |
| TransD | 实数 | 自适应稀疏投影 | 复杂映射 |
| TransF | 实数 | 放松方向约束 | 简单关系 |
| TransA | 实数 | 加权马氏距离 | 复杂映射 |
| KG2E | 高斯 | 不确定性相似度 | 不确定性 |
| ManifoldE | 流形 | 球体内距离 | 1-N |
| TorusE | 李群环 | 李群平移 | 1-N |
| ComplEx | 复数 | 哈密顿乘法 | 对称+反对称 |
| HolE | 实数 | 循环相关 | 对称+反对称 |
| SimplE | 实数 | 双嵌入+逆关系 | 对称+反对称 |
| PairRE | 实数 | 成对关系向量 | 4 种模式 + 复杂映射 |
| TripleRE | 实数 | 头映射+平移+尾映射 | 4 种模式 |
| TranS | 实数 | 2 次映射+3 次平移 | 4 种模式 |
| RotatE | 复数 | 4 种模式 | |
| QuatE | 四元数 | 哈密顿乘法(两平面) | 4 种模式 + 更稳定 |
| DualE | 对偶四元数 | 旋转+平移 | 4 种模式 |
| HAKE | 极坐标 | 模长+相角 | 层次关系 |
| Poincaré | 双曲 | 庞加莱距离 | 层次关系 |
8. 本章脑图
KGE 与推理 2
├── 关系特性分类
│ ├── 复杂映射(1-1/1-N/N-1/N-N)
│ ├── 多种模式(对称/反对称/逆反/组合)
│ └── 层次关系
│
├── 基于关系感知映射(5 个变种)
│ ├── TransH(超平面投影)
│ ├── TransR(关系空间投影)
│ ├── STransE(头尾分别投影)
│ ├── TransD(自适应稀疏投影)
│ └── TransF/A/M(放松/加权)
│
├── 基于特定表示空间
│ ├── KG2E(高斯分布+不确定性)
│ ├── ManifoldE(流形)
│ ├── TorusE(李群环)
│ └── HAKE(极坐标=层次+语义)
│
├── 建模多种关系模式(3 类)
│ ├── 改进张量分解:ComplEx/HolE/SimplE
│ ├── 改进关系感知映射:PairRE/TripleRE/TranS
│ └── 旋转操作:RotatE/QuatE/DualE
│
└── 建模层次关系
├── 双曲空间(Poincaré)
└── 极坐标(HAKE)