核心定义
知识表示 包含两个层面的含义:

- 表示什么(What):选择哪些人类知识需要进行形式化,这涉及到对知识本身的理解和建模。
- 如何表示(How):用什么样的数据结构、符号系统或形式语言来描述这些知识,这决定了计算机如何处理这些知识。
知识表示就是 知识在计算机中的“存在形式”或“载体”。
为什么需要知识表示?
计算机本身并不“理解”世界,为了让计算机能像人类一样进行推理、解决问题、决策和对话,必须将人类的知识“教”给它,知识表示就是实现这一目标的桥梁,其主要目的包括:
- 使知识可计算:将非结构化的、隐含的知识转化为结构化的、显式的符号,供算法处理。
- 实现推理:为基于知识的系统(如专家系统)提供推理的基础,从已知事实推出新结论。
- 促进知识共享与重用:通过标准化表示(如本体),不同的人、不同的系统可以共享和理解同一套知识。
- 辅助人类理解:清晰的结构化表示(如语义网络、框架)有助于人类自身理解和梳理复杂领域的知识体系。
主要的知识表示方法
知识表示方法主要分为两大类:符号表示法 和 非符号(连接主义)表示法。
(一)符号表示法
用明确定义的符号和结构来表达知识。
-
逻辑表示法
- 核心思想:使用形式逻辑(如一阶谓词逻辑)来描述事实、规则和约束。
- 特点:严谨、精确,具有坚实的数学基础,便于进行自动推理(如归结原理)。
- 示例:
∀x (人(x) ∧ 有工作(x) → 纳税(x))(所有人如果有工作,就需要纳税)。
-
产生式规则
- 核心思想:采用
IF (条件) THEN (动作)的形式表示知识,这是专家系统最常用的表示法。 - 特点:直观、模块化,易于添加和修改规则,推理过程(如正向/反向链)清晰。
- 示例:
IF 发烧 AND 咳嗽 THEN 疑似感冒(置信度0.8)
- 核心思想:采用
-
语义网络
- 核心思想:用节点表示概念/对象,用有向边表示概念间的关系,构成一个有向图。
- 特点:形象直观,便于表达概念间的分类、属性、部分等关系,支持继承推理。
- 示例:
鸟 -> (是一种) -> 动物;麻雀 -> (是一种) -> 鸟;鸟 -> (有) -> 翅膀。
-
框架
- 核心思想:用类似于“记录”或“对象”的数据结构来描述一类事物,一个框架包含多个“槽”,每个槽有名称和值(可以是默认值、过程或指向其他框架的指针)。
- 特点:适合表达具有固定结构、包含丰富属性的实体,能很好地模拟人类对原型的认知。
- 示例:“房屋”框架的槽包括:
[所有者]、[面积]、[地址]、[房间列表]等。
-
本体
- 核心思想:对领域内共享概念体系的明确、形式化规范说明,它定义概念、概念的属性、概念之间的关系以及约束。
- 特点:语义丰富,旨在实现机器间的无歧义理解和互操作,是语义网(Web 3.0)和现代知识图谱的核心。
- 示例:在医药本体中,明确定义“疾病”、“症状”、“药品”、“治疗”等概念,以及“疾病具有症状”、“药品治疗疾病”等关系。
(二)非符号表示法(连接主义方法)
这类方法不依赖于显式的符号逻辑。
-
神经网络表示
- 核心思想:知识不是以规则或符号形式存储,而是分布式地编码在大量神经元的连接权重中。
- 特点:擅长处理感知、模式识别等任务,能从数据中自动学习特征表示,但可解释性差,是“黑箱”模型。
- 示例:深度学习模型识别猫的图片,其“知识”存在于网络各层的权重矩阵中。
-
向量/嵌入表示
- 核心思想:将离散的符号(如词、实体)映射到连续、高维的向量空间中,语义相似的符号在向量空间中也距离相近。
- 特点:是实现符号表示与非符号表示结合的关键(如知识图谱嵌入),便于进行数值计算和相似度比较。
- 示例:Word2Vec, TransE 等模型生成的词向量或实体向量。
一个好的知识表示应具备的特性
- 充分表达性:能够充分、准确地表达领域所需的知识。
- 可理解性:对人类而言清晰易懂,便于知识工程师构建和维护。
- 高效推理性:能够支持高效、可靠的推理机制,从已有知识中推导出新知识。
- 可维护性:易于添加、修改和删除知识,保持知识库的一致性和完整性。
- 与推理机制的分离性:表示方法与具体的推理算法相对独立,便于系统的模块化设计和优化。
总结与发展趋势
- 核心挑战:如何在表达能力强(能表示复杂知识)、推理效率高(计算可行)和易于获取(能从数据或专家那里学到)之间取得平衡。
- 现代趋势:
- 符号与非符号的结合:这是当前研究热点。知识图谱(符号) 与 深度学习(非符号) 的结合(即“神经符号AI”),既利用了知识的精确性和可解释性,又发挥了神经网络强大的感知和学习能力。
- 大规模与开放域:从封闭的专家系统转向构建像维基数据、谷歌知识图谱这样的大规模、开放域知识库。
- 自动化构建:利用自然语言处理、信息抽取等技术,从非结构化文本中自动化或半自动化地构建知识表示。
知识表示是AI系统的“知识底座”,其选择和设计直接决定了系统的智能水平和能力范围,随着技术的发展,它正向着更融合、更动态、更自动化的方向演进。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。