廖备水:关于规范、价值和偏好的实践推理论文

摘要：在设计人工智能主体的社会时，可以通过定义社会价值和规范来约束主体的行为。当不同规范之间发生冲突时，主体依据他／她对价值的排序做出决定，选择违反一些规范，遵守更重要的规范。关于规范的推理具有可废止性和非单调性。为研究非单调推理，20世纪80年代以来，出现了缺省逻辑、自认识逻辑、限定推理等形式系统。这些系统在实际应用中存在不少问题，比如，计算复杂性高、缺乏动态处理机制等。针对这些问题，本文引入基于价值排序的一种抽象规范系统，给出一种基于可废止逻辑的偏好规范推理模型和一种基于论辩逻辑的偏好规范推理模型，并比较了这两种模型的优缺点。前者适合于持谨慎态度的主体的认知推理，但在实践推理中可能导致某些规范系统的外延为空。后者不仅支持怀疑性推理，也支持轻信推理，在实践推理中具有优势。此外，基于论辩逻辑的偏好规范推理模型还能够发挥其抽象框架的优势，对不同论证之间的动态关系进行推理和研究。

关键词：实践推理；社会规范；社会价值；可废止逻辑；形式论辩；社交网络

一、引言

随着人工智能的飞速发展，自动驾驶汽车、医疗机器人、家庭服务机器人等设施不断增加，由此引发人工智能的伦理问题。① Virginia Dignum，Ethics in Artificial Intelligence:Introduction to the Special Issue，Ethics and Information Technology，vol．20，2002，pp．1-3．为了使得人工智能主体的行为符合人类社会的预期，需要建立有效途径来约束主体的行为。现有的主要手段可以粗略地划分为硬性约束和柔性约束两类。前者给机器指定硬性的条件，当这些条件不满足时，主体不能实施特定行为；后者通过定义（社会）价值和规范，当不同规范发生冲突时，主体可以依据它对价值的排序，选择违反某些规范，遵守较为重要的规范。考虑下面的伊索寓言故事——蚂蚁和蚱蜢。②伊索:《蚂蚁和蚱蜢》，米歇尔·沃克改编，吴永生译，北京:清华大学出版社，2004年，第1—30页。

重大突破出现了：他的团队在一个极小的模糊热团块中探测到了热斑（或者说“耀斑”）存在的证据，这直接标明了那个疑似黑洞天体的位置。一个重达400万个太阳质量的黑洞应该有一张“嘴”（或者说“视界”），其直径大约是1 600万英里 ——实在是太小了，小到地球上的“引力”干涉仪都无法将其分辨出来。

为了储备冬天的食物，蚂蚁在炎热的夏天里辛勤工作，而蚱蜢却坐在树枝上弹着吉他，嘲笑蚂蚁。冬天如期而至，蚂蚁躲进屋子里过冬，有暖暖的窝，充裕丰富的粮食，过得很安稳，而贪玩的蚱蜢却既没有粮食也没有房屋，寒冷和饥饿侵蚀着他。饥寒交迫的蚱蜢向蚂蚁要食物。为了公平，蚂蚁本来不想给蚱蜢食物，但又觉得蚱蜢很可怜。于是她走到厨房里帮他拿了一些面包。

可是当她回来时，蚱蜢和他的吉他已经结冻成冰了。

1.2 分组 ①观察组中，男58例，女42例;平均年龄76.5岁;Braden量表评分13分者68例，14分者32例。②对照组1中，男46例，女54例;平均年龄74.1岁;Braden量表评分13分者55例，14分者45例。③对照组2中，男52例，女48例;平均年龄73.5岁;Braden量表评分13分者51例，14分者49例。3组患者一般资料比较差异无统计学意义。

这则寓言蕴含着几个十分重要的价值理念，如生存、快乐、公平、怜悯等。蚂蚁和蚱蜢对这些理念的重要性有着不同的排序，从而决定了不同的行为选择。

最后，由于价值的多样性、主体行为的不确定性、规范的可废止性等现实情况，难以把价值和规范建模为硬性的约束条件，强加给主体。在现有文献中，提出了各种主体模型以实现主体的自主决策。其中，BDI（信念—期望—意图）模型用信念、愿望和意图这三种态度来刻画主体的结构，通过规划库来研究该模型的抽象性质和推理过程；④ Nicolás D．Rotstein，Alejandro J．García and Guillermo R．Simari，Defeasible Argumentation Support for an Extended BDI Architecture，in I．Rahwan，S．Parsons and C．Reed eds．，Lecture Notes in Artificial Intelligence，Berlin，Heidelberg:Springer Berlin Heidelberg，Vol．4946，2008，pp．145-163．BOID是一种基于义务的模型，用于刻画规范对主体行为的约束；⑤ Jan Broersen，Mehdi Dastani，Joris Hulstijn and Leon van der Torre，Goal Generation in the BOID Architecture，Cognitive Science Quarterly，Vol．2，No．3-4，2002，pp．428-447．AATS，称作“基于动作的交替转移系统”，用于建模多主体的联合行动及系统状态转移。⑥ Michael Wooldridge and Wiebe van der Hoek，On Obligations and Normative Ability:Towards a Logical Analysis of the Social Contract，Journal of Applied Logic，Vol．3，Iss．3-4，2005，pp．396-420．为了反映主体的价值排序对规范及主体行动的影响，阿特金森（Atkinson）等人将价值引入了AATS。⑦Katie Atkinson and Trevor Bench-Capon，States，Goals and Values:Revisiting Practical Reasoning，Argument＆Computation，Vol．7，No．2-3，2016，pp．135-154．这三类模型都涉及认知推理和实践推理，对主体的行为决策进行探讨。

N2：为了生存，夏天应该劳动。

N3：出于公平，应该不要把食物送给不劳动者。

N4：出于怜悯，应该把食物送给不劳动者。

所以，卡内基的捐赠活动，一方面直接支持了我国图书馆事业的发展，为我国培养了图书馆学专业人才，卡内基基金会捐给中国的书刊都非常具有研究价值和收藏价值，成为我国近代图书馆藏书的重要组成部分。另一方面，极大地推动了我国社会力量积极参与图书馆建设，激发了社会各界对于图书馆事业的捐赠热情，为当时社会力量参与图书馆建设的方式提供了借鉴。当然，由于当时中国缺少产生卡内基式大实业家的社会和时代环境，不会出现卡内基那种大规模、持续的图书馆捐赠活动，当时社会各界对图书馆事业的捐助仅局限于对一、两个馆的经费支持或图书捐赠，而且这种捐赠多是一次性的。

首先，在一个由多主体组成的社会网络（social network）中，不同的主体对价值的优先性的排序不同，导致他们具有不同的偏好、做出不同的决策。关于优先性与偏好关系的逻辑理论，可参考刘奋荣的《关于偏好动态性的推理》一书。①Fenrong Liu，Reasoning about Preference Dynamics，Dordrecht:Springer Netherlands，2011．

其次，在多主体的情境下，一个主体的价值排序不仅决定他／她自己的行为，而且影响到其他主体的行为。在上述例子中，对于蚱蜢来说，如果他相信蚂蚁会出于怜悯给他食物，那么，他就会选择夏天不劳动，以实现自己“快乐”的价值，同时也不会牺牲“生存”的价值。为了刻画主体之间的信念、价值排序和决策的相互影响，需要在社会层面上开展研究。譬如，建立主体之间的信息互动和博弈的模型。刘奋荣和谢立民提出了一种刻画主体选择的认知模型，并利用该模型对主体未来的行为和状态进行推理与预测；②参见刘奋荣、谢立民:《关于社交网络中主体行为的推理与预测》，《暨南学报》2018年第12期。范本特姆（van Benthem）和刘奋荣则通过图博弈来表示主体间互动的场景，从而可以使用模态逻辑及其扩展来研究图博弈的各种性质。③参见约翰·范本特姆、刘奋荣:《图博弈的设计与模态逻辑的发展》，《清华大学学报》2019年第2期。

N1：为了快乐，夏天应该不劳动。

根据以上课程，哲学要讲授心理学、道义学(伦理学)、论理学、纯正哲学，不包含“印度及中国哲学”(东洋哲学)。由后续情况看，哲学科因1881(明治14)年的改正而独立后，开始讲授新设科目“印度及中国哲学”(东洋哲学)。

在炎热的夏天，对蚂蚁而言，长远的生存考量优先于短暂的快乐，N2优先于N1；对于蚱蜢来说，即时的快乐优先于长远的生存考量，N1优先于N2。在寒冷的冬天，对于拥有食物的蚂蚁来说，当她认为公平优先于怜悯时，N3优先于N4；反之，N4优先于N3。这个例子尽管简单，但可以折射出一系列的理论问题。

本文不深入研究优先性与偏好的关系、不同主体之间的相互影响和互动的推理。相反，本文着重研究在给定规范和价值排序的前提下，如何建模实践推理。这里涉及两个问题:价值的优先排序如何与规范推理相结合？如何处理规范推理的可废止性和非单调性问题？对于第一个问题，范本特姆等人把关于优先性排序的双层结构模型应用在道义逻辑中，实现了优先关系图（priority graphs）与道义世界之间不同排序（betterness ordering）的结合。① Johan van Benthem，Davide Grossi and Fenrong Liu，Priority Structures in Deontic Logic，Theoria，Vol．80，Iss．2，2014，pp．116-152．就第二个问题而言，规范推理的非单调性与其可废止性有着密切的关系:在多主体社会中，不同的规范之间常常存在潜在的冲突，如上述例子中N1和N2，以及N3和N4。由此带来的问题是，使用此类规范进行的推理具有动态性和可废止性。换句话说，一条涉及某个行动的规范是否可接受，取决于与之冲突的其他规范的状态以及这些规范之间的优先级。在上述例子中，假定初始系统中只有一条规范N1，那么可以推出“夏天应该不劳动”；若新的规范N2加入，并且N2优先于N1，则可以推出“夏天应该劳动”。这样，之前“夏天应该不劳动”的结论就需要被撤回。

为了建模推理的可废止性问题，20世纪80年代以来，出现了一系列非单调推理系统，如缺省逻辑、②Raymond Reiter，A Logic for Default Rasoning，Artificial Intelligence，Vol．13，Iss．1-2，1980，pp．81-132．自认识逻辑、③ Robert C．Moore，Semantical Considerations on Nonmonotonic Logic，Artificial Intelligence，Vol．25，Iss．1，1985，pp．75-94．限定推理、④ John McCarthy，Circumscription——A Form of Non-monotonic Reasoning，Artificial Intelligence，Vol．13，Iss．1-2，1980，pp．27-39．可废止逻辑、⑤ Donald Nute，Defeasible Logic，in Bartenstein O．，Geske U．，Hannebauer M．and Yoshie O．eds．，Web Knowledge Management and Decision Support，Berlin，Heidelberg:Springer Berlin Heidelberg，2001，pp．151-169．回答集编程、⑥ Vladimir Lifschitz，Action Languages，Answer Sets，and Planning，in Apt K．R．，Marek V．W．，Truszczynski M．and Warren D．S．eds．，The Logic Programming Paradigm，Artificial Intelligence Series，Berlin，Heidelberg:Springer Berlin Heidelberg，1999，pp．357-373．形式论辩⑦ Phan Minh Dung，On the Acceptability of Arguments and Its Fundamental Role in Nonmonotonic Reasoning，Logic Programming and N-Person Games，Artifical Intelligence，Vol．77，Iss．2，1995，pp．321-357．等。这些非单调推理系统在实际应用中存在不少问题，比如，计算复杂性高、缺乏动态处理机制、难以建模多主体交互中的推理等。鉴于此，本文采用范本特姆和刘奋荣等人提出的优先性排序与偏好的关系理论，同时选取可废止逻辑和形式论辩（也称为“论辩逻辑”⑧廖备水，黄华新:《不一致问题与论辩逻辑》，《学术月刊》2013年第6期，第64—69页。）作为理论基础，建立关于价值、规范和偏好的实践推理模型，并利用新模型进一步研究实际的问题。

本文的结构如下:第二部分介绍基于价值的抽象规范系统，用于表示价值、规范以及偏好关系；第三部分给出基于可废止逻辑的偏好规范推理；第四部分讨论基于论辩逻辑的偏好规范推理；第五部分介绍相关研究；第六部分是结论与未来工作。

二、基于价值的抽象规范系统

给定一个HANS H＝＜L，N，C，r＞，H上的一个从a1到an的路径是一个规范序列［（a1，a2），（a2，a3），…，（an-1，an）］，使得｛（a1，a2），（a2，a3），…，（an-1，an）｝⊆N，n≥2，且序列中的所有规范都不相同。路径［（a1，a2），（a2，a3），…，（an-1，an）］是一致的，当且仅当｛a1，a2，…，an｝是一致的，即在该集合中不存在ai和aj使得ai＝～aj，其中1≤i≤n，1≤j≤n。为简便起见，把路径［（a1，a2），（a2，a3），…，（an-1，an）］记作［a1，a2，a3，…，an］。给定一个HANS H＝＜L，N，C，r＞，我们把H上的一个从a1∈C到某个an∈L的一致的路径［a1，a2，a3，…，an］称为论证，记作α。把Concl（α）＝an称为α的结论。给定一个论证α，把［a1，…，ai］（1≤i≤n）称作α的子论证。把由H构造而来的所有论证集合记作arg（H）。

● L＝E∪｛¬e|e∈E｝∪｛丅｝是全体元素集合；E是原子元素集合；

（2）C2耐纹波无机酸化成箔：高压水煮后皮膜耐压上升、皮膜抗水合性好、漏电流小。一般化成箔在经过水煮试验后其皮膜耐压会下降，但这种化成箔水煮试验后耐压上升（这是此类化成箔最显著的特点）。该化成箔对电解液的适应性强，适用各型耐纹波铝电解，皮膜损耗低，而且它在频繁充、放电铝电解中表现更好：发热量小、寿命长。缺点：化成耗电量高，容量转化率低。

● N⊆L×L是有穷的规范集合；

● C⊆L称为情境，使得丅∈C且对所有的e∈E，｛e，¬e｝⊈C；

● r:N→IN是一个从规范到自然数的函数。

对于所有a∈L，如果a∈E，用～a表示¬a；如果a＝¬e，用～a表示e。对于规范（a，c），本文把r（（a，c））简写作r（a，c）。考虑如下HANS的一个实例。

本检测方法的定量限为0.02 mg／kg，检测方法的添加回收率在73%～79%，相对标准偏差在4%～6%，满足NY／T 788《农作物中农药残留试验准则》的要求；标准曲线覆盖了2个数量级以上。该方法能满足残留量检测的要求，可用于检测丝瓜样品中咪鲜胺及其代谢物残留量。

设L1＝｛s，w，¬w，g，¬g，丅｝，C1＝｛s，丅｝，N1＝｛（s，w），（s，¬w），（¬w，g），（¬w，¬g）｝，r（s，w）＝1，r（s，¬w）＝2，r（¬w，g）＝1，r（¬w，¬g）＝2。其中，s，w，¬w，g，¬g分别表示“夏天”“应该劳动”“应该不劳动”“应该给食物”和“应该不给食物”。由此得到的一个HANS，记作H1，表示为图1。

图1 一个HANS的例子：H1

在HANS中，函数r对规范的排序是固定的，且未指明排序的缘由。在基于价值和规范的实际推理中，规范的排序取决于与之关联的价值排序。不同的主体有不同的价值排序，从而对规范有不同的排序。基于优先性与偏好的关系理论，②参见Fengrong Liu，Reasoning About Preference Dynamics，Dordrecht:Springer Netherlands，pp．115-120．本文把HANS扩展成一种基于价值的理论，简称VHANS。

一个VHANS是一个六元组HV＝＜L，N，C，V，Ag，ρ＞，其中V是一组价值集合，ρ:N→V×Ag×IN把每条规范映射到一个由价值、主体和自然数组成的三元组。

每个VHANS代表一个可能的决策情境:每条规范对应于一个价值；同时，实施该规范的某个主体给这个价值指派一个优先级。为简单起见，在每个决策情境中，对于每条规范，仅考虑一个行为实施者。对于规范（a，c），本文把ρ（（a，c））简写作ρ（a，c）。

下面结合图1的例子进一步说明VHANS的概念。设V＝｛H，L，F，P｝，其中H、L、F和P分别表示价值“快乐”“生存”“公平”和“怜悯”；Ag＝｛ant，grs｝。设ρ（s，w）＝（L，grs，1），ρ（s，¬w）＝（H，grs，2），ρ（¬w，g）＝（P，ant，1），ρ（¬w，¬g）＝（F，ant，2）。由此得到的一个VHANS，记作H1V，如图2所示。

图2 一个VHANS的例子：H1V

图2表示的是与“蚂蚁与蚱蜢”的故事相对应的情节发展:夏天里，在“应该劳动”和“应该不劳动”的两条互相冲突的规范之间，蚱蜢对快乐价值和生存价值给出了一种排序；此后在冬天，在“应该给食物”和“应该不给食物”两条互相冲突的规范之间，蚂蚁对公平价值和怜悯价值给出了一种排序。这样，对于特定的规范系统，在不同的主体对各条规范进行价值排序后，形成了一个决策情境。显然，每当主体改变对价值的排序，就会得到一个新的决策情境。可以看出，给定一个VHANS，当不关注排序的缘由时，可将它规约为一个HANS。

三、基于可废止逻辑的偏好规范推理

在一个HANS中，由于规范之间可能存在冲突，因此关于规范的推理是非单调的或可废止的。使用非单调逻辑的术语，本文把一个HANS称为一个可废止理论。在一个可废止理论中，如果可废止规则（规范）的优先性排序不是全序的，那么，它可能存在多个外延。对于一个HANS H＝＜L，N，C，r＞，如果一个文字①本文把literal翻译为“文字”。它是离散数学中的一个术语，指的是一个原子命题或者原子命题的否定。a∈L在所有的外延中，我们说它被怀疑地（skeptically）推出；否则，它被轻信地（credulously）推出。这里的推出关系的定义取决于不同的逻辑系统。本文将介绍两种不同类型的偏好规范推理系统。

第一种方法基于可废止逻辑。该逻辑于1987年由纽特（Nute）首先提出。② Donald Nute，Defeasible Reasoning，Proceedingsof the20th Hawaii International Conferenceon System Scienc，University of Hawaii，New York:IEEE Press，1987，pp．470-477．一个可废止理论由五种不同的知识组成:事实、硬性规则、可废止规则、废止者和规则上的偏好关系。事实是不可辩驳的陈述，例如“蚂蚁是动物”。规则由前提、箭头符（“→”，“⇒”和“”分别表示硬性规则、可废止规则和废止者）和结论组成，其中前提是一组文字的集合，结论是一个文字。由于在HANS中所有规范都可以理解为可废止规则，我们只需要箭头符“⇒”。

作为一种非单调的方法，可废止逻辑采用怀疑论的观点来构造结论。我们把H＝＜L，N，C，r＞的结论定义为一个带标签的文字，并有如下两种形式:

+∂q:指q∈L在H中是以可废止的方式可证的；

-∂q:指我们已经证明q∈L在H中是以可废止的方式不可证的。

在这里，一个证明是H中的一个推导，它是由规范构造的带标签文字的有限序列，表示为P＝（P（1），…P（n））。对应于上述两种结论，当采用模糊阻止型（ambiguity blocking）③Guido Governatori，Micheal J．Maher，Grigoris Antoniou and David Billington，Argumentation Semantics for Defeasible Logic，Journal of Logic and Computation，Vol．14，Iss．5，2004，pp．675-702．可废止逻辑时，有如下两种推理规则分别说明推导是如何展开的。其中，N［q］表示N中结论为q的规范集合；P（1．．i）表示序列P的长度为i的初始部分。

+∂:可以添加P（i+1）＝+∂q，如果

（1）∃u∈N［q］∀a∈A（u）:a∈C或者+∂a∈P（1．．i）；并且

一个行之有效的方法是“时间比较”。比较过去的我和现在的我，比较另一半曾经的不足和现在的完善。每一次比较，都应该让我们更清晰双方做过的努力，以及弥补过的缺憾。

（2）∀v∈N［～q］，

（2．1）∀a∈A（v）:a∈C或者+∂a∈P（1．．i）并且

（2．2）∃w∈N［q］使得∀a∈A（w）:a∈C或者+∂a∈P（1．．i），并且r（w）＞r（v）．

-∂:可以添加P（i+1）＝-∂q，如果

在理解词汇虚实的基础上，才有可能对写法上的虚实进行深层次的探究。“诗有纯用虚写，而精湛卓立，由其义深而词达，故力透纸背也。”虚写手法在古诗文中的运用是非常广泛的，但要充分领略这种留白和虚处的美丽，最终还是要由词出发，词达才能义深。

（1）∀u∈N［q］∃a∈A（u）:-∂a∈P（1．．i）或者

（2）∃v∈N［～q］使得

此诗描写景物境界开阔，意境浑圆。诗歌的首联语言豪放而直白，有直指人心的力量。“眼界无穷世界宽”既是写山顶远望的景色，也是指豁达的心境和佛家所指的彼岸世界。颈联写山中近景，悬崖上的瀑布和苍翠的树荫，带给人清凉，也带给人澄澈的心境。颔联写来路的曲折，显出诗人心境与世俗世界的距离。尾联以飘渺的梦境结束，使诗作中的山水更显得飘渺空灵。在现实世界种种无奈面前，方干只能通过佛道麻痹自身，将情怀抒发并消解在诗歌之中。

（2．1）∃a∈A（v）:-∂a∈P（1．．i），或者

（2．2）∀w∈N［q］，∃a∈A（w）:-∂a∈P（1．．i）或者r（w）≤r（v）．在上述推导中，为了说明q是以可废止的方式可证明的，不仅需要有一个可以应用的结论为q的规范（1），而且还要考虑可能的“攻击”，即支持～q的推理链。具体来说，为了可废止地证明q，必须说明:对于那些结论为～q的所有规范，它们或者前提不可证（2．1），或者被优先级更高的规范所反驳（2．2）。用于-∂的推理规则是用于+∂的推理规则的结构上的补，具体解释略。

依据比林顿（Billington）等人的工作，对于一个可废止理论，一个文字是否可证明是唯一确定的。①David Billington，Grigoris Antoniou，Guido Governatori and Michael Maher，An Inclusion Theorem for Defeasible Logics，ACM Transaction on Computational Logic，Vol．12，Iss．1，2010，pp．1-25．严格地讲，有如下性质:

对于一个HANS H＝＜L，N，C，r＞，对于任意的q∈L，要么+∂q成立，要么-∂q成立，但不可能+∂q和-∂q同时成立。

由于+∂q成立与否是唯一确定的，每个H有唯一的外延，即有唯一的一组以可废止的方式可证的文字集合。因此，对于每个+∂q，可以说q被怀疑地推出。

本文进一步讨论图1的例子。依据H1，可以构造如下推理序列:P（1）＝+∂¬w，P（2）＝-∂w，P（3）＝+∂¬g，P（4）＝-∂g。因此，¬w和¬g可以被怀疑地推出。另外，若把r（s，¬w）＝2修改为r（s，¬w）＝1，可以得到另一个HANS，记作H1′，如图3所示。依据H1′，可以构造如下推理序列:P（1）＝-∂¬w，P（2）＝-∂w，P（3）＝-∂¬g，P（4）＝-∂g。这时，所有4个文字（w，¬w，g和¬g）既不能被怀疑地推出，也不能被可废止地推出。从这个例子可以看出，如果一个主体对两条互相冲突的规范在优先性的排序上是相等的，那么，他无法做出决策。回到蚂蚁和蚱蜢的故事中，如果蚱蜢对夏天“应该劳动”和“应该不劳动”两条规范的排序相等，那么，在两种行为选择之间他会左右为难。

图3 另一个HANS的例子：H1′

依据这个例子，可以直接得到如下性质。

旅游班小袁同学，一个有强烈自尊心的诚实男孩，自小有听力缺陷，有自卑感，平时学习很努力，大部分功课还可以，但英语基础很薄弱，英语成绩一直在低水平上徘徊。分析原因，主要是学不得法，但小袁同学不以为是。一次英语考试后，依然很差的成绩让他终于爆发了，哭的稀里哗啦，认为自己不幸、不行……。我找他谈心，重点分析存在的问题，要求他选择适合的学习方法并加强引导。经过近两个月的辅导，他的成绩有了很大起色，听、说、读、写能力也有了很大改观，最终以优异的成绩考上了二本院校。

存在某些HANS H＝＜L，N，C，r＞，对于所有的q∈L/C，+∂q不成立，即-∂q成立。

依据这个性质，在可废止逻辑系统中，某些HANS的外延为空集。该特性适合于持谨慎态度的主体的认知推理。不过，对于必须对可能的行动做出选择的实践推理，外延为空集往往不能满足现实要求。在上述例子中，当某个主体对规范（s，w）和（s，¬w）有相同的偏好时，仍然需要做出选择。

四、基于论辩逻辑的偏好规范推理

与可废止逻辑通过构造推理链的证明过程不同，论辩逻辑则通过构造论证、比较论证和评估论证来实现推理。

首先，论证的定义和构造有不同的方法，如ASPIC+、②Sanjay Modgil and Henry Prakken，The ASPIC+framework for Structured Argumentation:A Tutorial，Argument＆Computation，Vol．5，No．1，2014，pp．31-62．ABA、③Francesca Toni，A Tutorial on Assumption-based Argumentation，Argument＆Computation，Vol．5，No．1，2014，pp．89-117．DeLP④Alejandro J．García and Guillermo R．Simari，Defeasible Logic Programming:An Argumentative Approach，Theory and Practice of Logic Programming，Vol．4，Iss．2，2004，pp．95-137．等不同的形式论辩理论。在本文讨论的HANS中，一个论证可以被看作是一个一致的路径，具体定义如下:

关于规范的推理与道义逻辑密切相关，是逻辑学领域的一个重要研究方向。由于本文主要关注主体如何根据价值排序处理规范推理中的可废止性问题，我们采用输入／输出逻辑的抽象规范系统（简称为HANS）。⑨Beishui Liao，Nir Oren，Leendert van der Torre and Serena Villata，Prioritized Norms in Formal Argumentation，Journal of Logic and Computation，https:／／doi．org／10．1093／logcom／exy009，2018．在这个系统中，规范被表示为一个有序对（a，c）。其中，a表示情况或条件，代表规范的输入；c是在a情况下根据规范主体有义务做的事情，代表规范的输出。我们把a和c分别称为规范（a，c）的前提和结论。对于u＝（a，c），我们用A（u）表示前提a，用C（u）表示结论c。给定一组规范集合S，C（S）＝｛C（u）｜u∈S｝表示S的所有结论的集合。依据最新文献，① 参见Silvano Colombo Tosatto，Guido Boella，Leendert van der Torre and Serena Villata，Abstract Normative Systems:Semantics and Proof Theory，Principles of Knowledge Representation and Reasoning:Proceedings of the Thirteenth International Conference（KR 2012），California:AAAI Press，2012，pp．358-368．HANS被定义为一个四元组H＝＜L，N，C，r＞，其中:

第二，论证的比较涉及两个方面:论证之间的攻击关系和击败关系的识别。论证之间的攻击关系定义:给定一组论证集合arg（H），对于α，β∈arg（H），α攻击β，当且仅当存在β的子论证β’，使得Conl（α）＝～Conl（β’）。我们把arg（H）中论证之间的所有攻击关系集合记作att（H）。

不同的论证经常有不同的强度（通常称为优先关系）。论证的优先关系取决于用于构造论证的各个元素的优先关系。在本文中，由于每个论证均包含一组非空的规范集合，为了获得两个论证的优先关系，需要比较两个由规范组成的集合之间的关系。这就涉及如何从论证元素之间的优先关系提升到论证之间的优先关系，存在不同的选择。一方面，可以考虑如何选择用于比较的元素，有最弱链（weakest link）原则和最后链（last link）原则；另一方面，要比较集合之间的优先关系，有民主（democratic）方法和精英（elite）方法。① Sanjay Modgil and Henry Prakken，A General Account of Argumentation with Preferences，Artificial Intelligence，Vol．195，2013，pp．361-397．这与把集合元素之间的偏好关系提升到集合之间的二元关系，在技术上有类似之处，可参考刘奋荣的工作。②Fenrong Liu，Von Wright’s“The Logic of Preference”revisited，Synthese，Vol．175，Iss．1，2010，pp．69-88．这里采用如下定义:

设α＝［a1，…，an］和β＝［b1，…，bm］是arg（H）中的两个论证。令Φ1＝｛a1，…，an｝，Φ2＝｛b1，…，bm｝。根据最弱链原则，α优先于β，记作αwβ，当且仅当存在b∈Φ2＼Φ1，使得对于所有a∈Φ1＼Φ2，r（b）≤r（a）。根据最后链原则，α优先于β，记作αlβ，当且仅当an≥bm。当忽略下标时，αβ意指αwβ或αlβ。③Beishui Liao，Nir Oren，Leendert van der Torre and Serena Villata，Prioritized Norms in Formal Argumentation，Journal of Logic and Computation，https:／／doi．org／10．1093／logcom／exy009，2018．

现代学徒制是一种将传统学徒制模式和现代职业教育相融合的人才培养理念，培养模式具有双重性(学校和企业双主体、高素质和高技能双目标、教室和培训中心双场所、学生和学徒双身份、教师和师傅双师资)，以培养学生完成岗位任务的行动能力为导向，关注学生社会生活需要的素质教育和持续发展的方法教育。

基于论证之间攻击关系和优先关系的定义，击败关系可以被定义为:

对于两个相互攻击的论证α和β，对于某种排序原则w或l，如果α优先于β，那么，α击败β。本文把arg（H）中论证之间的所有击败关系集合记作defeatw（H）或defeatl（H）。当不含下标w或l时，defeat（H）指其中任何一种。给定一个HANS H＝＜L，N，C，r＞，本文把FH＝（arg（H），defeat（H））称作由H构造而来的抽象论辩框架，简称AAF。

图1中的H1可以构造如下论证集合:x1＝［s，¬w］，x2＝［s，w］，x3＝［s，¬w，g］，x4＝［s，¬w，¬g］；论证之间的攻击关系集合:att（H1）＝｛（x1，x2），（x2，x1），（x2，x3），（x2，x4），（x3，x4），（x4，x3）｝；论证之间的优先关系集合:x1x2，x4x3。因此，defeat（H1）＝｛（x1，x2），（x4，x3）｝。令F1＝（arg（H1），att（H1）），F2＝（arg（H1），defeat（H1））。图4为论辩框架F1和F2。

图4 抽象论辩框架F1（左）和F2（左）

● E是一个完全外延，当且仅当E是可相容的，且A中所有可以被E防御的论证都在E中；

● E是无冲突的，当且仅当不存在α，β∈E，使得（α，β）∈R；

学校改变了传统的单一德育说教模式，实行德育活动载体艺术化，学校的各类教育活动无不渗入了艺术元素，以艺术特有的感染力强化德育效果，让学生在活动中学习，在活动中体验，在活动中提升。

● 一个论证α∈A可被E防御，当且仅当对于所有β∈A，如果（β，α）∈R，那么，存在γ∈E使得（γ，β）∈R；

● E是可相容的，当且仅当E是无冲突的，且E中的所有论证都可被E防御。

第三，论证的状态评估在AAF中进行。给定一个AAF，依据特定的评价标准，把一组集体可接受的论证集合称为一个外延。① Phan Minh Dung，On the Acceptability of Arguments and Its Fundamental Role in Nonmonotonic Reasoning，Logic Programming and n-Person Games，Artificial Intelligence，Vol．77，1995，pp．321-357．通常，我们把依据特定评价标准，从一个AAF到一组外延集合的映射关系称为论辩语义。令F＝（A，R）是一个AAF，E⊆A是一组论证的集合。下面列举论辩语义中的一些重要概念:

● E是一个优先外延，当且仅当E是集合包含意义上极大的完全外延；

● E是一个基外延，当且仅当E是集合包含意义上最小的完全外延；

● E是一个稳定外延，当且仅当E是无冲突的，且对于所有α∈A＼E，存在β∈E使得（β，α）∈R。对于每个外延E，我们用Concl（E）＝｛Concl（α）|α∈E｝表示E的结论集合。

出口去向方面,中国甘薯出口目标市场集中度非常高．ITC官方网站公布的数据显示,2017年我国甘薯出口的主要市场包括中国香港,占中国甘薯出口额总量的85%以上，如表3所示．

依据上述概念，在完全语义下，F1的外延为:E1＝｛｝，E2＝｛x1｝，E3＝｛x1，x3｝，E4＝｛x1，x4｝，E5＝｛x2｝。其中，E3、E4和E5既是优先外延，也是稳定外延；E1是唯一的基外延。对于F2，它只有一个唯一的优先外延E4＝｛x1，x4｝。同时，E4也是唯一的稳定外延和基外延。

对于E4＝｛x1，x4｝，有Concl（E4）＝｛¬w，¬g｝。因此，在基语义下，¬w和¬g可以被怀疑地推出。这个例子表明，在基语义下，基于论辩逻辑的方法与基于模糊阻止型可废止逻辑的方法有相同的外延。值得注意的是，这种对应关系并非总是成立。下面就是一个反例。②Guido Governatori，Micheal J．Maher，Grigoris Antoniou and David Billington，Argumentation Semantics for Defeasible Logic，Journal of Logic and Computation，Vol．14，Iss．5，2014，pp．675-702．

设H2＝＜L2，N2，C2，r＞，其中L2＝｛a，¬a，b，¬b，丅｝，C2＝｛丅｝，N2＝｛（丅，a），（丅，¬a），（丅，b），（a，¬b）｝，r（丅，a）＝r（丅，¬a）＝r（丅，¬b）＝r（a，b）＝1。依据阻止型可废止逻辑，有-∂a，-∂¬a，+∂b和-∂¬b。因此b可被怀疑地推出。另一方面，由H2可以构造如下论证:y1＝［丅，a］，y2＝［丅，¬a］，y3＝［丅，b］，y4＝［丅，a，¬b］。相应的论辩框架，记作F3，如图5所示。由于在基语义下，F3的外延为空集，a、¬a、b和¬b均不可被怀疑地推出。

图5 抽象论辩框架F3

上述讨论表明，对于相同的可废止理论，不同的非单调推理系统可能输出不同的结果。除此之外，与基于可废止逻辑的方法相比，基于论辩逻辑的方法还具有一些优点:它不仅支持怀疑性的推理，而且支持轻信的推理；它更便于处理系统的动态性。具体来说，

第一，在论辩逻辑中，通常有多种论辩语义可供选择。对于图5中的F3，有三个外延:｛y1，y3｝、｛y1，y4｝和｛y2，y3｝。因此，a、¬a、b和¬b均可以被轻信地推出。

第二，在可废止逻辑中，为了证明一个命题成立，必须构造一个推理链。当系统中发生知识变更时，需要重新构造所有的推理链，效率低。在论辩逻辑中，由于论证之间的冲突处理在抽象的论辩框架进行，可以利用论证之间的可达关系来区分受影响和不受影响的论证，为处理系统动态性提供了便捷途径。①Beishui Liao，Li Jin and Robert C．Koons，Dynamics of Argumentation Systems:A Division-Based Method，Artificial Intelligence，Vol．175，Iss．11，2011，pp．1790-1814．

五、相关研究

与本文工作相关的研究包括基于优先级的非单调逻辑、基于优先级的论辩系统、基于价值的论辩理论等方面。在基于优先级的非单调逻辑方面，布鲁卡（Brewka）等人提出了一个为扩展逻辑编程附加优先性的方法。②Gerhard Brewka and Thomas Eiter，Preferred Answer Sets for Extended Logic Programs，Artificial Intelligence，Vol．109，Iss．1-2，1999，pp．297-356．他们考虑了提供优先性信息的程序——来自对规则的严格偏序补充。这些附加信息用于解决潜在的冲突。他们认为，结论应该是那些包含在至少一个回答集中的文字。他们给出使用规则上的偏好来选择回答集的子集的方法，称之为首选回答集。根据这一方法，除非一个规则的假设被更优先级的规则击败，否则该规则就可应用。在基于优先级的论辩系统方面，杨（Young）等人运用结构化论辩框架（ASPIC+）来刻画布鲁卡的基于优先级的缺省逻辑（PDL），③ Anthony P．Young，Sanjay Modgil and Odinaldo Rodrigues，Prioritised Default Logic as Rational Argumentation，in Proceedings of the 15th International Conference on Autonomous Agents＆Multiagent Systems（AAMAS 2016），Singapore:ACM 2016，2016，pp．626-634．把缺省规则上的优先排序提升到论证层面上。这种优先排序方法可以刻画可废止规则在论证建构过程中的可应用性。他们证明了PDL中的推理结论和ASPIC+的实例化在稳定语义下的论证结论之间总是存在对应关系。在我们的前期工作中，结合HANS和形式论辩，构建了一种基于论辩的优先性抽象规范系统。④Beishui Liao，Nir Oren，Leendert van der Torre and Serena Villata，Prioritized Norms in Formal Argumentation，Journal of Logic and Computation，https:／／doi．org／10．1093／logcom／exy009，2018．该工作主要关注规范推理的三种典型分离方法:贪心方法、规约方法和最优解方法。本文证明了在全序条件下:1．根据最弱链原则提升的论证优先性在稳定语义下等价于贪心方法；2．根据最后链原则提升的论证优先性在稳定语义下等价于规约方法；3．使用最弱链原则和稳定语义，并在引入一些刻画论证之间的隐含攻击关系的击败关系后，最优解方法也可以用论辩系统来表达。在HANS中，对规范分离的定义和布鲁卡等人的初始形式体系不同。HANS不使用缺省否定来表示例外——即规则的可废止性；相反，使用可废止规则和规则的可应用性概念。此外，莫吉尔（Modgil）等人基于ASPIC+框架，构建一个带偏好的通用论辩框架。⑤Sanjay Modgil and Henry Prakken，A General Account of Argumentation with Preferences，Artificial Intelligence，Vol．195，2013，pp．361-397．他们用基于偏好扩展的塔尔斯基逻辑实例化ASPIC+，并证明了这一实例化结果满足论辩系统的理性假设。他们还强调对偏好的合理运用需要考虑论证的结构。

六、结论和未来工作

本文以构建一个能够反映社会价值，并可以根据优先级处理规范冲突的实践推理系统为目标，先介绍了一种基于价值的抽象规范系统，并将其分别与可废止逻辑和形式论辩两种非单调推理相结合，提出了两种不同的实践推理模型。

基于可废止推理的模型可以构建一个可废止理论，并且根据可废止规则的优先性排序，得出某个命题或行为以可废止的方式可证或不可证。

基于形式论辩的模型将抽象规范系统HANS中从一个元素到另一元素的非环路径可以看作是一个论证。根据规范的优先级，采用最弱链原则或最后链原则，提升论证之间的优先关系，从而可以比较论证并确定论证之间的击败关系，得到抽象论辩框架图；然后根据论辩语义得出可接受的论证外延，继而得到结论外延。基于形式论辩的模型的优点是可以发挥论辩方法能使推理过程更直观、易于为推理过程提供自然的解释，帮助用户理解应该遵守哪条规范。此外，论辩方法对动态性的处理比较灵活，在一些情况下，相比其他非单调推理手段计算复杂性较低。

比较两种方法，可以发现，如果在基于形式论辩的方法中采用的优先关系提升方式是最弱链原则，那么论辩系统的结果与基于可废止逻辑的方法具有对应关系:当规则之间的优先级关系是全序时等价。

由于实践推理要求根据不同的偏好得到不同的结论，而可废止逻辑只能得到一个可能为空的外延，不太适合于实践推理；基于论辩逻辑的方法则不仅支持怀疑性的推理，也支持轻信推理。此外，论辩逻辑可以通过局部评估论证状态，更简单地处理系统动态性问题。

抽象规范系统的推导形式有多种选择，除可废止逻辑和形式论辩两种方法外，还有其他非单调推理方法，如缺省逻辑、回答集编程等，在具体情境下使用何种逻辑应当考虑系统对动态性的处理能力、冲突关系的处理方式、计算复杂性、推理过程刻画的自然性与推理结果的合理性等多种因素。

现有工作还处于初步阶段，许多开放性问题尚待解决。对于偏好规范系统中规范的排序问题，现有的逻辑系统仅研究全序条件下的逻辑关系。在偏序条件下，可进一步研究基于形式论辩的推理系统的构成及其性质。①Beishui Liao，Nir Oren，Leendert van der Torre and Serena Villata，Prioritized Norms in Formal Argumentation，Journal of Logic and Computation，https:／／doi．org／10．1093／logcom／exy009，2018．关于规范、价值和偏好的推理，本文仅关注特定情境下的推理问题。对于不同情境的形成和演化，则涉及多主体的联合决策和联合行动的问题。

基金项目：国家社会科学基金重大项目“基于社交网络的信息流逻辑研究”（17ZDA026）；国家社会科学基金重大项目“汉语隐喻的逻辑表征与认知计算”（18ZDA290）；欧盟科研创新框架计划（Horizon 2020）项目“MIREL-MIning and REasoning with Legal texts”（690974）

作者简介：廖备水，浙江大学语言与认知研究中心（杭州 310028）；余喆，浙江大学语言与认知研究中心；莱恩·范德托（Leon van der Torre），卢森堡大学计算机科学与通信实验室（Esch-sur-Alzette，4364）

（责任编辑：王丰年）

标签：逻辑论文; 主体论文; 外延论文; 价值论文; 关系论文; 哲学论文; 宗教论文; 逻辑学(论理学)论文; 形式逻辑(名学论文; 辩学)论文; 《清华大学学报(哲学社会科学版)》2019年第2期论文; 国家社会科学基金重大项目“基于社交网络的信息流逻辑研究”(17ZDA026) 国家社会科学基金重大项目“汉语隐喻的逻辑表征与认知计算”(18ZDA290) 欧盟科研创新框架计划(Horizon 2020)项目“MIREL-MIning and REasoning with Legal texts”(690974)论文; 浙江大学语言与认知研究中心论文; 卢森堡大学计算机科学与通信实验室论文;