首先,问一个问题:什么是人工智能(AI)?不幸的是,它没有一个真正好的、吸引人的定义。与我们从 Starship Enterprise 构建数据(所谓的强人工智能)相反,弱人工智能是使用人工智能方法来改善客户的流程。我总是用下面这句话来解释弱人工智能:人工智能模仿人类的行为,为此他们需要智能。人工智能的一个核心概念是包含这种“智能”的模型。这些模型可以通过机器学习创建,也可以由人类明确地制定(或建模)。规则用于制定此类模型的某些部分。
并非所有规则都是相同的
规则到底是什么? “规则”一词有多种不同的使用方式。除了规则的一般语言概念之外,还有用于在技术环境中分析文本的规则——例如Ruta规则、产生式规则和不同类型的基于逻辑的规则。我将在我的文章中更详细地讨论后者。
当我们谈论 IT 中的规则时,大多数情况下我们指的是业务规则系统中 比利时消费者电子邮件列表 使用的生产规则。这些来自 20 世纪 70 年代的专家系统,因此是一种人工智能方法。然而,如今有许多供应商销售这种类型的控制系统。这些规则的初衷是由专家来制定。然而,焦点已经改变,这些类型的规则现在被视为一种 IT 工具。
在这个小小的题外话之后,让我们回到基于逻辑的规则。谓词逻辑是一门定义非常明确的数学学科。这里对谓词逻辑的不同子集(例如命题逻辑、号角逻辑、描述逻辑或数据记录)进行了区分,它们具有不同的表达能力。对于所有这些子集,其含义都有明确且正式的定义。
最具表现力的规则是号角逻辑规则。虽然 Datalog 只能对有限模型进行陈述,但 Horn 逻辑规则可以表达计算机上可解释的任何内容(图灵完整性)。命题逻辑规则的表达性最弱。这些都可以与SQL的表达能力相媲美。
霍恩逻辑规则及其可操作性在人工智能中发挥着重要作用。作为当时开始的人工智能研究的一部分,Herb Simon、JC Shaw 和 Allen Newell 于 1959 年开发了通用问题求解器 (GPS)。这是用于实现基于谓词逻辑的通用问题解决方法的软件。假设每个问题都可以描述为一组谓词逻辑公式,然后可以由通用问题求解器来解决。这也适用于更简单的问题,例如数学难题和耐心游戏“河内塔”。然而,当涉及到更复杂的问题时,普惠制很快就会达到极限,因为它们的解决方案往往会很快出现组合爆炸。
然而,在 1976 年,四色问题被随后的基于一般谓词逻辑公式的定理证明器证明了。这个数学定理以前从未被任何人证明过,它指出四种颜色总是足以为任何地图着色,因此没有两个相邻国家具有相同的颜色。顺便说一句:定理证明器是基于使用计算机程序生成和验证逻辑定理的数学证明的机器辅助证明。
今天看起来怎么样?
如今的系统侧重于喇叭逻辑或较弱的数据记录。此类系统是专门在语义网领域开发的,与业务规则系统相比,被认为是现代规则系统。他们能够处理大量数据。业务规则系统就像计算机程序一样。简单来说:指定一定量的输入事实,然后控制程序运行并输出一定量的输出事实。相反,数据记录规则用于演绎数据库。与数据库类似,可以在这里进行查询,然后根据存储的数据和规则来回答查询。重要的是,此类系统中的规则不应被视为 IT 工具。相反,主题专家应该能够制定此类规则。
出于这个原因,在 20 世纪 90 年代,人们对此类规则的可理解语法进行了大量工作 - 这包括 F-logic 语法等。在此背景下,本体和规则的开发系统应运而生——例如OntoEdit或OntoStudio。顺便说一下,规则也是可以学习的。为了使这种“学习”成为可能,开发了诸如 FOIL 之类的程序。