📁 知识图谱
BUAA《知识图谱》课程复习 · 13 讲串讲,覆盖知识表示、知识抽取、知识融合、知识存储、知识推理与期末考点
《知识图谱》课程的复习笔记,面向考试。课件共 13 讲,路线是「为什么 → 是什么 → 怎么造 → 怎么用 → 怎么考」:
- 是什么 / 为什么(第 1 讲):知识图谱的定位、概念、发展史、典型项目;
- 怎么表示(第 2 讲):RDF / 属性图 / OWL / 表示学习四类表示;
- 怎么造(第 3–7 讲):知识抽取从结构化 → 半结构化 → 非结构化 → NER 前沿 → 知识融合;
- 怎么用(第 8 讲):知识存储(图数据库 vs 三元组库)与检索;
- 怎么推(第 9–11 讲):符号推理 + 表示学习推理(KGE / Trans 系列 / GNN);
- 落地 + 串讲(第 12–13 讲):典型应用 + 期末考点。
这里的内容贴着课件脉络和考点组织,保留「考点清单」「易错点」这类应试视角;如果想看脱离课程、按知识体系沉淀的版本,去 Tech Stack 的对应主题。
下面是按讲次整理的复习笔记。
知识图谱概述
开篇定位章:为什么需要 KG、KG 是什么、怎么造、怎么用——信号/数据/信息/知识四层概念与典型 KG 全景
知识表示
KG 的骨架:RDF / 属性图 / OWL 三类符号化表示,以及用表示学习把符号变向量的路线
知识抽取总论
三类数据源(结构化/半结构化/非结构化)的抽取全景:实体、关系、事件,方法演进谱
半结构化知识抽取
从 Web / 百科 / 表格里挖实体:包装器、百科 infobox 抽取与 D2R 工具链
非结构化知识抽取
从纯文本里挖实体与关系:特征模板 → 核函数 → 神经网络 → 远程监督 → 联合抽取
NER 前沿与 LLM 抽取
实体识别前沿:MRC 式 NER、字典增强、LLM 抽取与 KG 构建中的范式转变
知识图谱融合
多源 KG 怎么合并:本体融合、实体对齐、实体消歧、共指消解
知识存储与检索
三元组库 vs 图数据库、Neo4j 等代表系统、语义检索与 SPARQL / Cypher 查询
知识推理 1(逻辑 / 图 / 统计)
符号化推理三路:本体推理、图结构推理、概率/统计推理
KGE 与推理 1(基础 + TransE)
表示学习基础:TransE 思想、损失函数、负采样,以及 TransH / TransR / TransD 的动机
KGE 与推理 2(关系特性建模)
复杂关系建模:Trans 系列扩展、双线性(DistMult/ComplEx)、图神经网络(R-GCN/CompGCN)
知识图谱应用
KG 落地场景:语义搜索、智能问答、推荐系统、金融风控、医疗决策、辅助大模型
期末串讲与考点
期末考点串讲与复习要点:高频简答、计算题套路、易错点速查