什么是真正的宽容?


Owl of Minerva,Hic Rhodus, hic salta

我尝试从效益主义(Utilitarianism, 又译 功利主义)的和最大似然估计(Maximum likelihood)的角度回答这个问题,并证明“宽容”是基于先验概率的最优理性选择

1. 定义问题:

效益主义最初由边沁(Jeremy Bentham)提出。在谈效益主义前,先定义效益:

所谓效益,意指一种外物给当事者求福避祸的那种特性,由于这种特性,该外物就趋于产生福泽、利益、快乐、善或幸福(所有这些,在目前情况下,都是一回事),或者防止对利益攸关之当事者的祸害:痛苦、恶或不幸(这些也都是一回事)

边沁认为,人类的一切行为动机以及合理性依据都根源于快乐和痛苦。它们是人类行为的根本原因。人是一种追求快乐与避免痛苦的动物,趋乐避苦是人的本性 。简单来说,在效益主义概念下,人们该如何选择决策,取决于事件相关方的最大化效益,或者说追究快乐的最大化

比如说,一个是是否选择杀人,取决于这件事情会给他和想要杀害对象的的预期快乐净值。在一般状态下,杀一个人会给被杀对象造成极大的痛苦,对行使杀人者来说,会带来律法的追究,这也是痛苦,因此该行为的预期是非常痛苦的,所以不应当杀人。但是在一些特殊情况下,比如正当防卫,如果不杀对方,则可能造成对很多人的生命威胁,此时按照效益主义,则应当选择杀之。

然后考虑最大似然的定义:

假设 X 为离散随机变量,f 为模型,θ为模型参数。{x_1, x_2, …, x_n}为独立同分布的采样。参数为θ的模型 f 在 n 次采样下产生{x_1, x_2, …, x_n}的分布,表示为

定义似然函数为

两边取对数,为对数似然:

同时可以定义平均似然:

举个例子以便理解:

抛硬币 40 次,正面记作 H,反面记作 T,得到采样{x_1, x_2, …, x_40}。其中得到 H 的次数为 23,T 的次数为 17。假设这枚硬币是某个暗箱中取出的,暗箱中有两枚硬币。这两枚硬币抛出正面的概率分别为 1/2 和 2/3,那么用作采样的硬币跟可能是哪一个呢。这时候我们可以考虑似然概率:

可见,这枚硬币是抛出正面概率为 1/2 的那枚的可能性更大。根据这个例子,我们可以直观的理解,最大似然概率是一种根据已知采样求未知决策的方法。

将最大似然应用于效益主义模型:

考虑一件事情,我们做它可能让我们高兴,也可能让我们不高兴,在以往的 n 次做这件事情后,我们都记录下结果,得到 n 次采样 M. 让我们高兴记作 1,让我们不高兴时记作 0,即

M={y_1,y_2,…,y_n}. 这 n 次采样让我们高兴的总值为

假设做这件事情让我们高兴的概率为 p,符合伯努利分布,则 n 次做这件事情让我们高兴的期望为

现在我们反过来看,假设我们已经知道做这件事情让我们高兴的概率为 p,那么我们可以推导,在我们采样的 n 次试验中,得到 r 次高兴的结果的概率。

对于伯努利分布

可以定义熵 H:

有最大熵分布

其中

由于

所以

从而最大熵分布函数为

现在,我们可以把上面投硬币的例子换一种说法:

有做某事的经验 40 次,结果让人高兴记作 H,不高兴记作 T,得到采样{x_1, x_2, …, x_40}。其中得到 H 的次数为 23,T 的次数为 17。我们另外定义该做的事情和不该做的事情,该做的事情让我们高兴的概率分别为 2/3,不该做的事情让我们高兴的概率为 1/3,那么下次我们应该是选择做还是不做,或者说这件事是该做的还是不该做的呢。

所以,如果理性的选择,这件事是应该做的。这种选择对应的熵函数值更大。

2. 宽容与熵函数

在 1 部分的简化模型下,我们可以暂时定义宽容为效益主义概念下,基于有限经验(有限已知采样)的最优理性选择(熵函数值更大)

对于生活很多事件,我们无法得知它确切的让我们高兴的概率,但是我们自己有很多次以往的经验,再加上前人告诉我们的生活经历,于是我们自己对这件事有有限采样,基于这个采样可以作出决策。但是相比于别人的经验,我们更相信我们自己的经历。因此采样受到个人经历的影响更大,别人的经验往往会踢出样本,不予采信

在我们生活的初始阶段,比如儿童时期,虽然书本教育我们不要嘲笑他人的缺陷,但是我们往往会反其道行之,因为嘲笑一个人会让我们有优越感,还会带动其他人一起嘲笑,让我们有归宿感,这种快乐给我们的感觉被过分强化了,我们甚少体验到被嘲笑的痛苦和长期的恶果,因而对被嘲笑对象的感受不予考虑而做出了这样的决策。事件相关方的概念在我们心中也是模糊的,因而我们不会得到合理的熵函数。直到我们长大,有过足够的经历(采样),我们更多的认同别人的经验,同时有了足够的自己的经验,这时才会做出更为理性的选择:宽容别人的缺陷

历史上由于传教和信仰的关系,发生过多次冲突:十字军东征,宗教改革与新教 – 天主教冲突,英国的清教徒受到排挤而被迫移民北美,印巴冲突……不一而足。宗教冲突同时对人的生命、财产还有社会文化都会造成极大的损失。于是当人类社会有了足够的经验之后,逐渐认识到宗教宽容才是最优的理性的选择:宽容别人的信仰

由于遗忘,我们一般相信最近的经验胜于以往的经验,这也会让熵函数不合理,因为最近的采样得到了不该有的加权。比如最近几十年的恐怖袭击,很多与伊斯兰教有关。穆斯林在众人心目中几乎成为愚昧和血腥的同义词,穆斯林在街上也会受到更多的注意,特别是最近爆发的恐怖事件,使得仇恨伊斯兰教的人越来越多,人们关于宗教宽容的经验受到了挑战。

对于不了解的事物,我们由于缺少采样,不能构造合理的熵函数。如果我们根据以往的经验贸然加以揣测,难免会闹笑话。对于别人面临的问题,由于我们并未实际的经历他们的苦难,没有面对他们的困境,经常的,我们很难给出合理的决策建议。把我们的意见强加于人,因而是粗鲁的,不合适的,我们显摆智慧和经验的尝试通常会受到了他人内心的鄙视,结局也容易让自己尴尬。因此我们要宽容不了解的事物

但我们面对伤害时,我们容易怒火焚身,不合适的加权自己的痛苦,因而急于报仇雪恨。复仇对于复仇对象,自然完全没有什么效益可言了。复仇的急切心情,使我们忘记了复仇者只在复仇施行的时刻会带来快乐。在这前后会导致到更大的负面影响,思前想后,难以忘记整个事件。这会让自己 Keeping Wounds Green,受到第二次伤害。理性的选择应该是,淡忘仇恨,宽容你的敌人

关于 1 部分的模型,自然是有很多问题,包括但不限于:

  • 无法量化快乐和痛苦的程度,很多时候并不能等价于 1 或 0 来考虑
  • 事件相关方的范围,以及对相关个人的感受的加权不好定义
  • 事件每次出现,自有他们各自的情况,并不会每次都相同,因而使用过往的采样并不是一定合适的
  • 事件的结果并不一定是纯粹的快乐或者痛苦,而是可能两种都有,而且持续的时间不一样,怎么对这两种结果加权不好定义
  • ……

实际的情况可能非常复杂,因而构造的函数往往也会过于复杂而无法计算。但是宽容是基于人们多年的经验的,虽然宽容往往会违背你的直觉,他你是基于先验概率的最优理性选择。

为了做到宽容,需要:

  1. 审慎面对事情,保持冷静,不应情绪而做决定(不给最近的采样以不适当的加权)
  2. 多多学习和接触,了解到自己认识的局限,同时敬畏未知(认识到熵函数适用的界限)
  3. 汲取前人的经验和旁人的经验(积累采用,采用越多构造的熵函数越合理)
  4. ……

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s