人工智能
第二章 知识表示与知识图谱
课程导入
同学们,当我们提到 “智能” 二字,你会想到什么?是让机器听懂我们说话,看懂图片内容,还是像专家一样给出精准判断?其实,无论哪种人工智能,都离不开一个最基础、最核心的问题
——如何让计算机理解、存储并运用人类的知识。
知识,是我们对世界的认知与经验,它藏在事实里、规则中、经验间。但对计算机而言,这些零散、模糊、结构化程度不一的信息,无法直接被识别和推理。我们怎样才能把 “鸟会飞”“发烧可能是感冒”“小明的父亲是张三” 这类知识,转化成机器能读懂、能计算、能推理的形式?又该如何描述事物的属性、关系和层次结构?

从严谨的一阶谓词逻辑,到贴近人类思维的产生式规则,再到擅长结构化描述的框架表示法,直到如今广泛应用的知识图谱,一代代研究者不断探索,就是为了找到更合适的知识表示方式。
今天这门课,我们就一起走进知识表示与知识图谱的世界,学习几种经典的知识表示方法,理解它们的原理、特点与应用,揭开机器 “拥有知识、运用知识” 的神秘面纱,为后续学习人工智能打下坚实基础。
内容如下:👇
- 知识与知识表示的概念
- 一阶谓词逻辑表示法
- 产生式表示法
- 框架表示法
- 知识图谱
一、知识与知识表示的概念
前言
1.1 知识的基本概念
知识是在长期实践和科学研究中积累的对客观世界的认识与经验,是智能活动的基础。
知识本质上是信息通过特定关联形成的信息结构 。
知识的典型表现形式:
- 事实型知识:"雪是白色的"
- 规则型知识:"如果头痛且流涕,则有可能患了感冒"
1.2 知识的特性
1.2.1 相对正确性
知识在特定条件和环境下才成立,如:
- 十进制中:1+1=2 ✅
- 二进制中:1+1=10 ✅
- 文学语境中:王安石诗句"西风昨夜过园林,吹落黄花满地金"的描写
1.2.2 不确定性
知识的不确定性主要来源于四个方面:
① 随机性引起的不确定性
案例:“如果头痛且流涕,则有可能患了感冒”
案例:《三国演义》中曹操判断"隆冬之际只有西风北风",但周瑜利用东风实施火攻,体现了随机因素导致的知识不确定性。
② 模糊性引起的不确定性

③ 经验性引起的不确定性
基于经验的知识可能不完全可靠,如"老马识途"的典故:
- 齐桓公依靠老马找到出路
- 但现代导航中需结合GPS等多源信息
④ 不完全性引起的不确定性
受认知局限影响,如对火星是否存在水的认知随时间不断更新。
1.2.3 可表示性与可利用性
- 知识可用语言、文字、图形、神经网络等多种形式表示.
- 例子:“鸟会飞”可以用文字、图形、神经网络等形式表示
- 知识可被实际应用解决问题
- 例子:“鸟会飞”的知识可被用于飞行器设计、鸟类保护等实际应用

1.3 知识表示的基本原则
知识表示(knowledge representation):将人类知识形式化或者模型化。
- 知识表示是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。
选择知识表示方法需考虑以下原则:
- 充分性:能完整表示领域知识
- 可利用性:便于知识推理和应用
- 可维护性:易于组织和管理
- 可实现性:便于计算机理解和实现
二、一阶谓词逻辑表示法
前言
2.0 引入
在人工智能中,要让计算机像人一样思考推理,首先必须把知识变成机器能理解的语言。自然语言模糊、有歧义,无法直接用于逻辑判断 。而一阶谓词逻辑,正是人工智能里最基础、最严谨的知识表示工具 ,它用统一、规范的形式描述事实与关系,为机器推理提供了坚实基础。
2.1 基本概念
2.1.1 命题与谓词
- 命题(P):非真即假的陈述句,若命题意义为真,如"3<5",则记为T; 若命题意义为假,如"太阳从西边升起",则记为F。
一个命题在不同的解释下,其真假值可能不同,如“今天天气晴朗”在“今天”解释下为真,在“明天”解释下为假。
- 命题逻辑:研究命题及命题之间关系的符号逻辑系统。如:P:北京是中华人民共和国的首都
- 命题逻辑表示法:无法把它所描述的事物的结构及逻辑特征反映出来,也不能把不同事物间的共同特征表述出来。
P:老李是小李的父亲
P:李白是诗人 Q:杜甫也是诗人
- 谓词的一般形式:刻画个体性质或关系的表达式,形式为P(x₁, x₂, ..., xₙ)
- 个体 x1, x2,…, xn :某个独立存在的事物或者某个抽象的概念;如:“老张”、“教师”、“李父”等。
- 个体是变元,没有指定一个或者一组个体,如“x<5” :Less(x, 5)
- 个体是函数:一个个体到另一个个体的映射,如 “小李的父亲是教师”:Teacher (father (Li) )
- 个体是谓词:“Smith作为一个工程师为IBM工作”:二阶谓词 Works (engineer (Smith), IBM)
- 谓词名 P:刻画个体的性质、状态或个体间的关系。如:“是”、“在”、“喜欢”等。
- 个体 x1, x2,…, xn :某个独立存在的事物或者某个抽象的概念;如:“老张”、“教师”、“李父”等。
谓词类型举例:
- 一元谓词:
Teacher(Zhang) - "老张是教师" ,Teacher (father (Li)) - "李父是教师" - 二元谓词:
Greater(5,3) - "5>3" - 三元谓词:
Works(Smith, IBM, engineer) - "Smith在IBM做工程师"
2.1.2 谓词公式构成
谓词公式就是按照严格的递归规则,由原子谓词、逻辑连接词和量词 构造出来的、能够表达确定意义的符号表达式。👇
定义谓词 :Father(x, y) —— 表示 “x 是 y 的父亲”
谓词公式 :Father(张三, 小明)
解释:Father是二元谓词(描述两个实体的关系),第一个参数张三是 “父亲” 主体,第二个参数小明是 “子女”,公式精准表达 “张三是小明的父亲”,无歧义、可被机器识别。
连接词:
否定(¬)、析取(∨)、合取(∧)、蕴含(→)、等价(↔)
- 案例:
- “机器人不在2号房间”:﹁ Inroom (robot, r2)
- “李明打篮球或踢足球”:Plays (Liming, basketball) ∨ Plays (Liming, football)
- “我喜欢音乐和绘画”:Like (I, music) ∧ Like (I, painting)
- “如果刘华跑得最快,那么他取得冠军。” :RUNS (Liuhua,faster)→WINS (Liuhua ,champion)
- P ↔ Q: “P当且仅当Q”。
- 案例:

连接词的优先级别从高到低排列:
- 优先级:
¬ > ∧ > ∨ > → > ↔
量词:
- 全称量词(∀x):对所有个体x
----->“所有的机器人都是灰色的”: (∀x)[ROBOT (x) → COLOR (x,GRAY)] - 存在量词(∃x):存在个体x
----->“1号房间有个物体”:(∃x)INROOM(x,r1) - 全称量词和存在量词出现的次序将影响命题的意思 ,如:
- (∀x)(∃y)(Employee(x) → Manager(y, x)):“每个员工都有一个经理”
- (∃y)(∀x)(Employee(x) → Manager(y, x)):“存在一个员工,他是所有其他员工的经理”
2.2 谓词公式的性质与应用
2.2.1 基本性质
- 永真性:所有解释下均为真.
- 举例:P(x)∨¬P(x) 解释:无论 P(x) 代表 “x 是学生” 还是 “x 是苹果”,x 无论是谁。 结果:“x 是学生 或者 x 不是学生”,永远为真。
- 可满足性:至少存在一个解释使其为真
- 举例: F(x,y):x>y 公式:(∃x)(∃y)F(x,y)为真的情况:取 x=5,y=3。“存在 5 大于 3”,真。结论:因为能找到真的情况,所以它是可满足的
- 不可满足性:所有解释下均为假
- 举例:P(x)∧¬P(x) 解释:x 既是学生,又不是学生。 结果:逻辑矛盾,永远不可能发生。
- 等价性:P ⇔ Q 表示逻辑等价
- 举例:量词等价:¬(∀x)P(x)⟺(∃x)¬P(x) 左边:不是所有 x 都是学生 右边:存在 x 不是学生----> d意思一模一样
- 永真蕴含:P ⇒ Q 表示逻辑结论关系
- 具体规则:
- 假言推理:P, P→Q ⇒ Q
- 例子:如果考试及格,那么能拿学分。
- 现在已知:考试及格了。
- 所以推出:能拿学分。
- 拒取式推理:¬Q, P→Q ⇒ ¬P
- 如果考试及格,那么能拿学分。
- 现在已知:没拿到学分。
- 所以推出:考试没及格。
- 假言三段论:P→Q, Q→R ⇒ P→R
- 如果努力学习,那么考试及格。
- 如果考试及格,那么能拿学分。
- 所以推出:如果努力学习,那么能拿学分
- 假言推理:P, P→Q ⇒ Q
- 具体规则:
2.3 一阶谓词逻辑知识表示方法
谓词公式表示知识的步骤:
(1)定义谓词及个体。
(2)变元赋值。
(3)用连接词连接各个谓词,形成谓词公式。
案例:表示关系数据库信息

- Occupant(Zhang, 201) // 张住在201房
- Telephone(491, 201) // 201房电话是491
- Occupant(Li,201)
- Occupant(Wang, 202)
- Occupant(Zhao, 203)
- Telephone(492,201)
- Telephone(451,202)
- Telephone(451,203)
2.4 优缺点
优点:严密性、自然性、易于实现
缺点:无法表示不确定知识、推理效率较低
三、产生式表示法
前言
3.0 知识引入
现实世界里的知识,真的全都那么精确、绝对、非真即假吗?
比如:
- 如果发烧,可能是感冒
- 如果头痛,多半要休息
- 如果皮肤红痒,大概率是过敏
这些都是人类专家最常用的经验知识,不确定、不绝对、带可能性。而一阶谓词逻辑最大的特点就是:只能表示精确知识,不能表示不确定知识 。一旦遇到模糊的、经验性的、带概率的规则,它就不好用了。
这时候,我们就需要一种更贴近人类思维、更灵活、更容易写规则的知识表示方法。
3.1 产生式基本结构
产生式由美国数学家波斯特Post于1943年提出,后由1972年纽厄尔和西蒙发展完善。产生式通常用于表示事实、规则以及它们的不确定性度量,适合于表示事实性知识和规则性知识。
产生式类型:
- 确定性规则:
IF P THEN Q-->IF 动物会飞 AND 会下蛋 THEN 该动物是鸟 - 不确定性规则:
IF P THEN Q(置信度)-->IF 发烧 THEN 感冒 (0.6) - 确定性事实性知识的产生式:(对象,属性,值)或(关系,对象1,对象2)-->
老李年龄是40岁:(Li,age,40) 老李和老王是朋友:(friend,Li,Wang) - 不确定性事实性知识的产生式:
(对象,属性,值,置信度)-->老李年龄很可能是40岁:(Li,age,40,0.9)-->老李和老王不大可能是朋友:(friend,Li,Wang,0.1)
注意: 产生式与谓词逻辑中的蕴含式的区别 👇
- 蕴含式 :只能表示 100% 正确的逻辑。
- 产生式 :可以表示经验、规则、可能、不确定知识。
产生式的形式描述及语义——巴科斯范式BNF:
<产生式>::=<前提> <结论>
<前 提>::=<简单条件>|<复合条件>
<结 论>::=<事实>|<操作>
<复合条件>::=<简单条件>AND<简单条件>[AND<简单条件>…
|<简单条件>OR<简单条件>[OR<简单条件>…
<操 作>::=<操作名>[(<变元>,…)]
说明:
符号“::=”表示“定义为”;符号“|”表示“或者是”;符号“[ ]”表示“可缺省”。3.2 产生式系统组成
我们已经知道,产生式可以很自然地表示 “如果… 那么…” 形式的知识。但只有一条条孤立的规则,还不能形成智能 。
怎样把这些规则组织起来,让计算机像专家一样,根据已知事实自动推理、得出结论?
这就需要一个完整、可运行的系统来管理规则、存储事实、执行推理。👈
系统三大组件: 👇
- 规则库:产生式规则集合
- 综合数据库:存放当前事实和状态
- 控制系统:实现推理过程

3.3 典型应用:动物识别系统

3.3.1 规则库示例
r1: IF 该动物有毛发 THEN 该动物是哺乳动物
r2: IF 该动物有奶 THEN 该动物是哺乳动物
r3: IF 该动物有羽毛 THEN 该动物是鸟
r4: IF 该动物会飞 AND 会下蛋 THEN 该动物是鸟
r5: IF 该动物吃肉 THEN 该动物是食肉动物
r6: IF 该动物有犬齿 AND 有爪 AND 眼盯前方
THEN 该动物是食肉动物
r7: IF 该动物是哺乳动物 AND 有蹄
THEN 该动物是有蹄类动物
r8: IF 该动物是哺乳动物 AND 是反刍动物
THEN 该动物是有蹄类动物
r9: IF 该动物是哺乳动物 AND 是食肉动物 AND 是黄褐色
AND 身上有暗斑点 THEN 该动物是金钱豹
r10:IF 该动物是哺乳动物 AND 是食肉动物 AND 是黄褐色
AND 身上有黑色条纹 THEN 该动物是虎
r11: IF 该动物是有蹄类动物 AND 有长脖子 AND 有长腿
AND 身上有暗斑点 THEN 该动物是长颈鹿
r12:IF 该动物有蹄类动物 AND 身上有黑色条纹
THEN 该动物是斑马
r13:IF 该动物是鸟 AND 有长脖子 AND 有长腿 AND 不会飞
AND 有黑白二色 THEN 该动物是鸵鸟
r14: IF 该动物是鸟 AND 会游泳 AND 不会飞
AND 有黑白二色 THEN 该动物是企鹅
r15: IF 该动物是鸟 AND 善飞 THEN 该动物是信天翁3.3.2 推理过程实例
设已知初始事实存放在综合数据库中:
已知事实:暗斑点、长脖子、长腿、奶、蹄
推理链:
- 匹配r₂ → 推出"哺乳动物"
- 匹配r₇ → 推出"有蹄类动物"
- 匹配r₁₁ → 推出"长颈鹿"

3.4 产生式表示法评价
- 优点:自然性好、模块化、清晰易懂
- 缺点:效率不高、难以表示结构性知识
- 适用场景:经验性、不确定性知识,规则相对独立的问题领域
- 专家经验、启发式知识
- 如医生诊断、故障判断、专家建议。
- 条件–结论型规则
- 用 IF…THEN… 就能描述的知识。
- 不确定性知识
- 可以带可信度、概率,不要求绝对正确。
- 推理、决策、分类、识别系统
- 如动物识别、分类系统、故障诊断、智能决策、问答系统。
- 规则需要经常增删改的系统
- 规则相互独立,便于维护和扩展。
- 专家经验、启发式知识
四、框架表示法
前言
4.0 框架表示法——课程引入
我们刚刚学习了产生式表示法,它用IF…THEN… 的形式,很好地表达了经验、规则和推理过程,简单又直观。
但大家思考一下:现实世界中的事物,往往不是一条条孤立的规则,而是有属性、有关系、有层次的整体。比如一个“学生”,有姓名、年龄、专业、成绩等一系列信息;一种“动物”,有羽毛、翅膀、叫声、习性等一整套特征。
产生式虽然擅长推理,却很难把这些结构化、成块、有层次的知识完整地组织起来。
为了让计算机能像人一样,用整体模板去理解和描述事物,我们就需要一种新的知识表示方法——框架表示法。 👇 👇
4.1 框架理论基础

1975年,美国明斯基提出了框架理论:人们对现实世界中各种事物的认识都是以一种类似于框架的结构存储在记忆中的。
框架表示法:一种结构化的知识表示方法,已在多种系统中得到应用。
4.2 框架结构
框架由槽(slot)和侧面(faced)组成:
<框架名>
槽名₁: 侧面名₁₁ → 侧面值₁₁₁, ...
槽名₂: 侧面名₁₂ → 侧面值₁₂₁, ...
槽名n: ...
约束: 约束条件1
约束条件2
...
约束条件n4.2.1 框架结构示例
例1 教师框架
框架名:〈教师〉
姓名:单位(姓、名)
年龄:单位(岁)
性别:范围(男、女)
缺省:男
职称:范围(教授,副教授,讲师,助教)
缺省:讲师
部门:单位(系,教研室)
住址:〈住址框架〉
工资:〈工资框架〉
开始工作时间:单位(年、月)
截止时间:单位(年、月)
缺省:现在例2 教师框架
当把具体的信息填入槽或侧面后,就得到了相应框架的一个事例框架
框架名:〈教师-1〉
姓名:夏冰
年龄:36
性别:女
职称:副教授
部门:计算机系软件教研室
住址:〈adr-1〉
工资:〈sal-1〉
开始工作时间:1988,9
截止时间:1996,7例3 将下列一则地震消息用框架表示:“某年某月某日,某地发生6.0级地震,若以膨胀注水孕震模式为标准,则三项地震前兆中的波速比为0.45,水氡含量为0.43,地形改变为0.60。”
解:地震消息用框架如下图所示。
框架名:〈地震〉
地 点:某地
日 期:某年某月某日
震 级:6.0
波 速 比:0.45
水氡含量:0.43
地形改变:0.604.3 框架网络与继承
框架可通过"Is-a "关系形成层次结构,下层框架继承上层槽值:

4.4 框架表示法特点
- 结构性:便于表达结构性知识,能够将知识的内部结构关系及知识间的联系表示出来
- 继承性:框架网络中,下层框架可以继承上层框架的槽值,也可以进行补充和修改
- 自然性:框架表示法与人在观察事物时的思维活动是一致的,符合人类认知习惯
五、知识图谱
前言
5.1 知识图谱概述
我们前面学习了一阶谓词逻辑、产生式、框架表示法,它们各有所长,能表示精确知识、规则经验和结构化信息。
但在如今大数据、互联网、人工智能高速发展的时代,知识的规模越来越大、关联越来越复杂,我们不仅要表示单个事物、单条规则,更需要把海量的知识串联起来、形成网络、直观展示。
传统的知识表示方法在处理大规模、高关联、跨领域的知识时,显得不够灵活、不够高效。
为了让机器真正像人脑一样关联知识、理解语义、智能检索,今天我们就来学习目前人工智能领域最热门、应用最广泛的知识表示方式 ——知识图谱。
谷歌于2012年5月16日首先发布了知识图谱(Knowledge Graph)。目的是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。Google、百度和搜狗等搜索引擎公司构建的知识图谱,分别称为知识图谱、知心和知立方。

定义:知识图谱是用图形化技术描述知识资源及其关联关系的知识表示方法。
5.2 知识表示形式
基本单位:三元组
- (实体1-关系-实体2):中国-首都-北京
- (实体-属性-属性值):北京-人口-2069万
知识图谱也可被看作是一张图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。

5.3 知识图谱架构
5.3.1 逻辑结构
- 数据层:主要是由一系列的事实组成,而知识以事实为单位进行存储。
- 模式层:构建在数据层之上,是知识图谱的核心
5.3.2 体系架构

获取知识的资源对象大体可分为:
- 结构化数据 是指知识定义和表示都比较完备的数据。
- 半结构化数据 是指部分数据是结构化的,但存在大量结构化程度较低的数据。
- 非结构化数据 是指没有定义和规范约束的“自由”数据。
5.4 知识图谱构建方法
- 自顶向下:先定义本体模式,再填充实体
- 自底向上:从数据提取实体,再构建顶层本体
5.5 典型知识图谱系统
- 维基百科:多语言知识库
- DBpedia:从维基百科提取结构化知识
- YAGO:多语言语义知识库
- XLORE:中英文平衡的大规模知识图谱
相关信息
| 表示方法 | 适用场景 | 优点 | 局限性 |
|---|---|---|---|
| 一阶谓词逻辑 | 精确知识推理 | 严密性好 | 不能处理不确定性 |
| 产生式表示 | 专家系统、规则推理 | 自然性强 | 效率较低 |
| 框架表示 | 结构化知识 | 继承性好 | 构建复杂 |
| 知识图谱 | 互联网知识组织 | 关联性强 | 数据质量要求高 |
