“实锤”就代表正义吗:信息纷繁的时代,我们还能相信什么?

阿姆斯特朗是否真的登上过月球?热搜上的明星八卦是确有其事还是在转移视线?晚上一杯牛奶真的有助于睡眠?我相信有关这些疑问,每个人心中都有几乎确定无疑的答案。在短视频流行、自媒体发达、信息过载而非缺乏的今天,尤为如此。我们只需要点开手机上的软件,动动手指,就可以看到各式各样的新闻、意见、观点和故事。如果我们不辞辛劳地点赞、收藏和转发,大数据就会通过我们“一键三连”的习惯筛选和推送我们最喜欢看到、最愿意听到和最希望相信的内容。但不乏反讽的是,或许我们也丧失了一些纯粹和率真:在这个众多消息漫天纷飞的时代,我们还可以相信什么?还有真相存在吗?
当代著名法学家弗雷德里克·肖尔(Fred rick Schaue r,1946- 2024)在其生前最后一部著作《实锤:证据在司法、政治及日常生活中的使用与误用》中告诉我们,如果愿意且有勇气面对真相,我们还是可以找寻到虽不完美但足够的事实。事实或真相之所以不完美,是因为它们并不会自然而然地浮现在我们眼前。我们需要解读它们留下的踪迹并结合自己的判断来指认和确定真相究竟在何处。于是,证据就成为我们相信某件事为真或为假的理由与凭据。肖尔指出,面对证据我们需要明确它只能够告诉我们“是什么构成了一个事实,以及什么构成一个真的陈述或假的陈述”。言下之意,证据及其所确定的事实是一种经验现象,与我们的偏好期望有所不同,也与我们愿意相信的事实彼此有别,更与我们对于事实本身的好坏判断和应对策略关系不大:事实就是事实,无论你是否愿意接受。这就如一句名言所说,“人们有权拥有自己的观点,但无权拥有自己的事实!”


《实锤》,作者:弗雷德里克·肖尔,译者:高虹远,版本:理想国|云南人民出版社,2025年1月。

面对证据,我们都需要思考两个问题:证据试图证明什么,以及证据本身是否真实。在这个意义上,证据自身并不具有价值,它是我们确定自己所关心的事实的一种手段。在分析证据时,我们往往会运用归纳推理。比如,肝炎病人大多数都会出现黄疸症状,如果有患者皮肤发黄,医生可能会首先怀疑这是不是肝炎导致的。但正如我们尚未遗忘的数学知识所表明的那样,归纳推理并没有100%的确定性。当我们一次性吃掉过量的橘子时,大量胡萝卜素进入血液暂时无法代谢,皮肤也会呈现出黄色。当然,这种可能性虽然存在,在现实生活中人们因此而皮肤发黄的概率却不高。肖尔风趣地提到,面对证据时,我们需要采纳概率较大的解读,因为“如果你听到马蹄声,你应该猜是马,而不是斑马”。
这就凸显出概率之于证据的重要性。有关这一点,证据领域中一直存在着两个可能彼此对立的观点。一种是贝叶斯推断。这种方法主张我们在评估证据时,会对其概率具有既定的某种看法。这便是先验概率。在此基础上,当有新的证据出现时,我们就会对原有证据的概率加以调整。这就是后验概率。贝叶斯推断在各个领域有非常广泛的运用。比如,民间一直流传着有关光绪皇帝死因的故事。清史专家依据正史和时人笔记得出了一定结论,而后在2008年专家们通过检验光绪皇帝的头发而发现其中砷含量非常高。这个证据的出现,自然就会改变专家对于先前判定光绪皇帝死因的证据的评估。简言之,贝叶斯方法注重将证明特定事实的证据逐一单个加以评价。与此相反的则是最佳解释推理。这种方法强调我们并不是逐个评估支持或反对某个结论的证据,而是将它们视为一个整体来评价,进而找出哪种解释是我们迄今为止获得的所有证据中最佳的解释。最佳解释推理往往被视为贝叶斯推断的对立面,它向后者提出的有力挑战是:一个所谓的证据总是通过成为一系列证据中的一员而成为相关证据。我们不应当割裂证据之间的关联。
电影《毒舌律师》(2023)剧照。
肖尔教授有关这两种方法的评述非常具有“现实主义”的色彩。他认为,或许它们并没有表面上看起来那样截然不同。在现实生活中,当我们需要解答某个问题或检验某个假定时,我们就会去寻找对于解答问题或检验假定有用的事实。这种对于事实有用性的判断,似乎更适宜运用贝叶斯推断。比如,我们都知晓某个品牌的手机质量不错,如果我们发现朋友手里拿着的就是这个品牌的手机,我们可能会不假思索地认为朋友的手机质量也很好。反之,如果我们想要知道某品牌的手机质量如何,然后看到朋友手里恰好有这个品牌的手机,朋友对此手机的评价就会影响我们对于这个品牌的整体看法。但是,如果我们已经掌握了所有证据,再逐个评估这些证据就显得没有必要了:此时,我们综合所有证据,将之视为一个整体加以分析,可能会得到更有说服力的结论。
既然证据总与概率相关,就意味着事实的认定总不会泾渭分明、非黑即白。更准确地说,通过证据认定事实都会具有不确定性。这就需要我们通过制度设计来管控这种不确定性。在法律中,这种制度就是举证责任标准问题。在刑事领域,英美法中常见的做法是要求定罪时必须“排除合理怀疑”,这通常意味着嫌疑人有90%以上的概率确实犯有被指控的罪行。但在民事领域,举证责任标准则是“优势证据”,也即法官通过权衡认为一方证据所表明的事实的概率大于其他可能性的出现即可。在肖尔看来,这两种不同举证责任标准其实体现着人们对于不同实质价值的权衡。他引述英国法学家威廉·布莱克斯通(William Blackstone)的名言“宁可错放十个,不可冤枉一人”指出,任何决策程序都会出错,我们需要在避免冤枉无辜与避免错放罪犯之间有所取舍调和。从制度设计角度来说,我们自然不愿意惩罚无辜的人。但这个价值并不绝对,否则我们就需要通过取消一切惩罚来保护它。同时,我们也不愿意错放罪犯。但这个价值同样并不绝对,否则我们就需要严刑峻法并大幅降低举证责任标准。现实中的制度设计虽然可能偏向于布莱克斯通的立场,但却总是这两种价值的折中:我们必须接受一些冤枉无辜的行为,而这是为了能够惩罚很多确实犯了罪的人所付出的代价。
依据肖尔的分析,这种代价很难通过更细致入微的制度设计或小心谨慎的价值权衡加以消除,甚至就连降低也很难。这是因为如果我们接受事实的认定取决于证据,而分析证据是和概率相关的统计学问题,就会看到实际情形远比我们想象的复杂。首先,统计学总是关注总体情形,而在具体案件中我们所讨论的是总体情形中的某一个体。比如,假设在一个雨夜,一辆私家车被一辆公交车逼下了公路,受伤车主只是模糊地看到这辆公交车是蓝色的。依据统计,该市有80%的蓝色公交车属于大都会运输公司所有,而剩下的20%的蓝色公交车归公共服务公司所有。那么私家车主是否可以向大都会运输公司索赔,毕竟它造成事故的概率更大?无需法律专业知识,仅凭生活常识和正义感我们都会认为法官不应当支持这一诉求,因为统计数据是一回事,而在该案件中肇事的车辆则是另一回事,我们无法从整体情况推导出个体情形。
其次,统计学的精确性也未必一定有助于惩罚罪犯。肖尔举出了一个非常有意思的例子:假设一位男子被四名女性指控性侵犯,这些指控发生在不同的时间和地点,而且没有理由相信这些指控者彼此认识或知道其他人的指控。简言之,这些指控是彼此独立的。在每一个案件中,该男子都极力否认对他的指控。假设案件进入刑事诉讼(适用“排除合理怀疑”标准),检方只能证明该男子有80%的可能犯有被指控的罪行,如果这些诉讼彼此单独审理,该男子显然应当被无罪释放。但如果我们不从法律角度思考这个问题,而是讨论该男子是否至少实施过一次性侵犯时,结论可能就完全不一样了:如果四个指控中每个指控成立的概率都是0.8,那么该男子至少实施过一次性侵犯的概率就是0.9984(1减去0.2的四次方)。如果是这样,法律还能主张自己能够发现真相,能够严惩罪犯吗?或者说,我们究竟该如何理解法律中的统计学数据,以及应当如何改进相关算法呢?

所信者听也,
而听犹不可信
在不同的证据中,言辞证据或证词是最有争议且最值得关注的一种。我们总会认为自己知道许多事情,并且认为自己是通过亲身经历获得了有关这些事情的知识。但是肖尔指出,如果稍加反思,我们就会发现我们所知道的东西很少是基于自己感知的。比如,我们有关这个世界的知识大部分来自书本、新闻以及老师的讲授。我们有关自我的知识,特别是自己的出生日期,其实源自母亲或父亲的告知。这就引发了一个问题:在何种程度上我们可以认为一个人所说的话就是其所断言的事实的证据?
从法律角度来看,一般规则认定书面证据优于口头证据,而且口头证据必须“可信”。这指的是证词若能成为证据,其前提是证人本身是可信的。这种“可信度”源自何处?如肖尔所说,我们会发现这种信任本身也基于证据:也许我们对证词真实性和证人可信度的判断都来自证人以前说过的话,也许证人的身份、地位和专业知识让我们赋予其信任。但无论怎样,这里似乎存在着逻辑上的循环:我们基于信任将言辞视为证据,可信任本身建立在特定证据之上。正因如此,当证人在法庭上引述别人的话,也即提出“传闻”证据时,法庭一般不将之视为有效证据。但肖尔指出,美国法律在反对传闻证据的规则上附加了许多例外,这些例外几乎已经将这个规则“掏空”。他对此现象的解释是,我们很难想象一个没有传闻的世界,或者不通过传闻来传播的知识——我们所阅读的报刊、书籍和新闻,几乎都是有关别人说了什么的内容,在某种意义上都属于“传闻”。
法庭在证人作证时,会要求证人说真话且说全部的真话。在英美法律传统中,法官还会要求证人宣誓。当然,这种具有浓厚宗教色彩的仪式在今天已经不再具有实质效力,证人大概率不会因为已经宣誓就改变自己的证词。相较而言,法庭上的论辩技术,特别是交叉询问艺术或许是探知真相、查验证词真伪的更有效方法。这种场景一再出现于各类影视作品之中。比如,以现实案例为原型的港剧《溏心风暴》大结局中,钟嘉欣饰演的律师敏锐地发现了证人证词中的漏洞,进而成功一举击败关菊英饰演的王秀琴对遗产的觊觎。但在现实中,交叉询问是否能够有效发现证人撒谎或搞错状况,是值得怀疑的。因为在此时证人往往很固执,而且律师的陈述和证人的证词彼此混杂,可律师的陈述常常是证词的形式。在这个意义上,肖尔认为法庭中的这些程序其实难以实现其最初设计的目的。
电视剧《溏心风暴》剧照。
不过,在法庭和现实生活中,人们还有其他的方式来判定证词的可信度。一个常见的情形就是我们会根据自己内心的感受对证词加以校准。比如,我大概知道自己的弹簧秤可能有些失准,或许误差在一公斤左右,于是每次测量后我都会将减去相应重量的数字作为自己的真实体重。又比如,我们经常会在某影音平台上查看新上映的影片或新出版的图书的评分与短评。如果我们对该平台足够熟悉,就会发现新上映的影片总会受到粉丝或水军的影响,评分可能会略高或略低;而新出版的图书由于作者或译者本人就是该平台的“关键意见领袖”(KOL),其评分往往会偏高,一段时间后才会回到相对合理的区间。我们会根据自己的判断来校准图书与影片的分数。这种情况同样适用于我们在挑选酒店、饭店时浏览“大众点评”抑或“小红书”时的内心的权衡判断。
在面对证词时,还需要考虑的一个问题是,证人可能会说谎。说谎是证词失真的常见情形,但并非全部。法庭发现,证人在受到情绪的推动而产生“激情表述”,抑或由于各种原因而导致记忆和描述不准确时,证词都可能不再可靠。但是这都属于证人的无心之失。谎言与此不同,它主要适用于那些明显是故意而非仅仅是疏忽的假话。同时,谎言也不等同于自欺,无论这种自欺的后果多么严重。日常生活中人们对于谎言的警惕,使得谎言这个词的范围有不断扩大的趋势。肖尔指出,人们似乎倾向于将一切虚假的陈述都视为谎言,这使得这个概念存在着一些边缘地带。比如,当一个人所说的话明显是虚假的,而且这种虚假是众所周知的,那么即使他主观上没有欺骗的意图,他的行为似乎也可以算作说谎;同时,如果一个人没有明确说假话,但是他的言行却给别人造成误解,这种行为也算说谎。
人们对于说谎的担忧,使得“测谎技术”在20世纪20年代以来一直兴盛不衰。比如,龙勃罗梭和麦肯齐是通过血压来识别谎言,之后的专家们则是通过呼吸频率、眼周热成像、电脑扫描等。他们共同的预设是,说谎会给人带来压力,这就必然会导致生命体征的改变。从我们的生活常识来说,这种观点不乏合理之处。但是正如肖尔所说,我们的关注点其实不应该是这种技术是否完美,而应该是这种技术和什么加以对比。如果同民间智慧、都市传说和想当然的业余心理学来比较,这些技术或许不够完善,但可能的确有效。只是从证据责任标准来说,这项技术所提供的结论还不达标。肖尔由此认为,证据是否足够好,可能取决于证据充分(或不充分)的后果是什么。比如,不足以限制个人自由的证据,但足以给政府发布警告提供合理性,而不足以禁售原本合法的产品的证据,可能足以让某些消费者拒绝购买该产品。在这个意义上说,任何证据都不完美,但不完美的证据并非没有价值。不同的使用目的,决定了我们对于证据评价,而这构成了我们依据证据决策的基础。


在全书结尾,肖尔讨论了两个有趣的问题。第一个问题是他发现在日常生活和法律体系对于一个人的性格,也即其过往的言行与当下行为之间的关联,有着不同的判断标准。在日常生活中,我们倾向于从一个人的性格来判断这个人当前的言语是否可靠、行为是否得当。比如,同样一句话,从我们信任的朋友口中说出,与一个陌生人口中说出,可能就有完全不同的效果。但是在法律体系中,情况似乎完全相反:一个人过往的行为并不构成它以后行为的证据。比如,美国的《联邦证据法》第四百零四条(b)款规定,“犯罪、过失或其他行为的证据不得被用于证明某人的品格,进而表明此人在特定场合的行为与其他行为相一致”。这似乎有违我们的常识。毕竟,当我们知道一个人有过偷盗的历史后,我们就很难再雇佣他或她做保安或保姆。但法律并没有采纳这个常识。肖尔给出了两种解释。一个解释是,如果法律考虑一个人过去的犯罪和其他已经被惩罚过的错误,就是将这个人过往的经历视为判定其当前罪行的证据。这其实等同于让人们因过去的罪行再次受罚。另一个解释是,法律当然也认为一个人先前的行为与之后的行为相关,但在现实世界中一个人之前犯过罪,并不等同于他之后一定会犯罪。为了避免法官和陪审团冤枉无辜,法律制度就不采纳这些过去的行为作为证据。对于过去行为的证明力,“宁可让法官和陪审团信其无,不可使他们信其有”。
第二个问题则涉及我们关心事实并探究证据究竟有何价值。肖尔指出,理想状态下我们都希望自己有关事实的认定不受个人偏好的影响。但实际情况却是,我们有关现实世界的感知往往符合我们的偏好。在观看体育赛事时,我们更愿意相信自己偏爱的运动员受到了场内或场外的某种不公正的对待,他或她的每一次获胜都是“偏偏你最争气”,而每一次失利都是有人在排兵布阵般的“下大棋”。在观看影视剧时的情况也很类似,我们更愿意认为一部剧的“大爆”,是自己偏爱的演员或偶像提升了平台的用户数量、剧集的质感以及其他演员的“咖位”,而非多种因素共同作用促成了这部剧的成功。
这些事实表明,我们面对证据时可能存在着两种彼此不同的动机。肖尔指出,一种动机是我们看到支持和反驳某个事实性命题的证据同时存在时,会进行“动机性推理”;另一种动机是我们看到所有或绝大部分证据指向一个方向时,可能会进行“动机性拒绝”。前者意味着我们会以相对开放的态度评估指向不同事实的证据,进而得出自己的结论。此时,我们的偏好所发挥的作用比较“软”,也即当正反双方证据势均力敌时,除非我们所反对的结论具有强有力的证据,不然我们还是倾向于相信自己偏好的证据。后者则指的是我们在面对种种自己不喜欢的结论的证据时,偏好会以比较“硬”的方式运作,推动我们认为这些不利的证据都是假象,抑或完全否定它们的存在。由此可见,我们在面对证据时并不是完全遵循理性原则的,动机的介入使得我们无法严格执行“事实为依据”这个准则。但遗憾的是,动机介入我们有关证据的判断,却是人类行为的一种常态。在这个意义上,肖尔坦率地认为,证据与事实只是对某些人来说、对某些问题而言很重要;“对于认为证据和事实不重要的人来说,再多的证据、再多的证据分析,也无济于事”。
电视剧《白色巨塔》剧照。
这个令人沮丧但无疑属实的观点,自然体现出肖尔作为一名法律现实主义者的冷静与坦诚。在各种各样的教科书中,法律现实主义往往被刻画为法治信念、法律教义和法学方法的解构,法律现实主义者往往被理解为冷酷无情、罔顾道德、蔑视个人权利的一群肆无忌惮的反叛者。但无论从历史还是现实来看,这种刻画和理解都是一种扭曲和误会。作为历史现象的(美国)法律现实主义兴盛于20世纪30年代;作为一种理论立场的法律现实主义无论在此之前还是自此之后,都在世界各地法律传统中绵延不断。贯穿这一历史现象和各种理论立场的,是法律现实主义者们对于法律实际运作与法官实际行为的关注。不错,卢埃林在《荆棘丛》(The Bramble Bush, 1951)开篇即指出,法律就是对于法官所作所为的一种预测。但正如他在这本风靡一时的小册子的前言所说,这并不是有关法律的定义,而是提醒读者,有关法律规则的了解只有在补充了人们实际上如何运用这些规则时才算完整。正因如此,我们可以看到一代又一代的法律现实主义者,一方面是著书立说阐述法律理论的研究者,另一方面则大多是浸淫法律教义且熟稔法律方法的律师、法官或某个领域的专家。
肖尔教授可以说是法律现实主义者这一形象在当代的典型代表。他毕业于达特茅斯学院,依靠有关美国宪法《第一修正案》方面的研究成为哈佛法学院教授。在此之后,他的研究兴趣转向法哲学与法律理论,陆续写作并出版了有关法律规则、法学方法、先例制度和法律强制力的一系列著作,并整理出版了法律现实主义重要代表人物卡尔·卢埃林有关规则的手稿。可以说,他的研究不仅完整传承了美国法律现实主义的传统议题,还在此基础上有所延伸和拓展。本书有关证据问题的讨论,就在很大程度上体现了这一点。肖尔指出,自己的分析并非诉讼专业有关“证据法”的评注,而是综合法学、认识论、认知科学、社会科学等议题围绕证据与事实关系展开的讨论。这不仅呼应了发轫于美国法学家约翰·威格摩尔(John Wigmore)的司法证明理论,还开拓并普及了威廉·特文宁、尼尔·麦考密克等人有关证据和概率的分析。此外,本书简练且风趣的文字,让我总是想起2017年合作导师新书研讨会上肖尔演讲时会场爆发的阵阵笑声。可以说,这在相当程度上实现了卢埃林希望却未能达到的目标:法律理论不是面向少数专家,而是面向千百万人。
本文为独家原创内容。撰文:赵英男;编辑:李永博;校对:薛京宁 杨利。未经新京报书面授权不得转载。欢迎转发至朋友圈。
2024书评周刊合订本上市!
点击书封可即刻下单

发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。