查找:                      转第 显示法宝之窗 隐藏相关资料 下载下载 收藏收藏 打印打印 转发转发 小字 小字 大字 大字
【期刊名称】 《经贸法律评论》
预测编码在司法中的应用简介
【英文标题】 An Introduction to the Judicial Application of Predictive Coding
【作者】 於兴中
【作者单位】 美国康奈尔大学法学院{王氏中国法讲席教授},杭州师范大学、西北政法大学{特聘教授}
【分类】 人工智能【中文关键词】 预测编码;电子证据开示;人工智能
【英文关键词】 Predictive Coding; E-Evidence Discovery; Artificial Intelligence
【文章编码】 2096-6180(2018)01-0097-7【文献标识码】 A
【期刊年份】 2018年【期号】 1
【页码】 97
【摘要】

预测编码是一种利用计算机技术审查、分析和处理大量文档的技术。预测编码在特定算法支持下进行“文本分类”,并基于律师及案情专家对测试文件审阅,通过软件程序对与特定案件或争论点相关或者可响应的文件进行识别。由于预测编码可以通过协助律师进行文件的搜索、挑选和分类,减少需要手动审查的不相关和无响应文档的数量从而大幅降低电子披露流程的成本,被认为是电子证据开示领域最重要的发展之一。自2012年以来,在英美法系中已有若干在司法审判中使用预测编码的案例。但由于预测编码技术仍处于发展之中,其仍然具有局限性。预测编码技术尚难以准确无误地捕捉到案件文本的关键点,在算法决策透明度、训练模型的设计上也仍不成熟。由于预测编码技术自身的专业性,使得法律文件审查工作将日益专业化和精英化。人类语言的复杂性使得预测编码尚难以准确理解不同场景中不同词语的内涵,因而在审查的准确性上仍存在风险。

【英文摘要】

Predictive coding is the use of keyword search, filtering and sampling to automate portions of an e-discovery document review. It is enable to realize “text categorization” under the application of specific algorithms and identify critical issues by softwares. It has been regarded as one of the most important developments in electronic evidence discovery area. Since 2012, there exist several judicial cases that applying predictive coding in common law countries. Nevertheless, there are several shortcomings in predictive coding. It is still hard to accurately predict key points of case documents. There exist weaknesses in the transparency of algorithms decision-making process and its model design. It is also difficult to accurately understand complicated human language under different scenarios.

【全文】法宝引证码CLI.A.1252208    
引言
  预测编码(predictive coding)这项被萨斯金教授誉为“颠覆性的法律技术”正在引起法学界和法律实务界的高度关注。[1]对于想要了解不断变化的法律服务市场的人来说,了解预测编码是一个非常好的切入点。因为它有可能改变律师业务的范围和程度。律师的一项重要工作是要花大量的时间审查文件,尤其是大型律师事务所的诉讼助理。在数字化时代,一个案件往往涉及大量的电子文件,而电子文件的审查使律师的任务更为繁重。虽然这项工作可以全部或部分地外包给国内或国际的电子证据开示供应商,以降低费用,但文件审查仍然是诉讼中最昂贵的部分。
  近年来,由于网络世界的兴起和人工智能的发展,一些律师事务所使用预测编码软件,用计算机软件取代律师在文件审查过程中的某些作用。使用预测编码进行文件审查不但节省了成本,而且预测编码似乎比人力审查更准确。[2]
  预测编码通常用于文档密集型案例。为了剔除不相关的文档,并对相关文档进行排序,律师会将一组样本文件提供给计算机软件,以便训练其识别哪些文档与案件相关,哪些无关。这种训练会反复开展,直到计算机成功分拣相关与不相关的文件为止。一些预测编码软件将文档分为响应和无响应两类,有些软件可为文档提供相关性分析。律师可以审查相关的批量文件,然后再将其转交给诉讼双方。预测编码目前最常用于民事诉讼中的电子证据开示过程,但它还有许多其他潜在的应用,尽管各种各样的法律问题尚未确定。
  更为重要的是,尽管大部分法院还是持谨慎态度,但已经有一些法院对使用预测编码采取了支持的态度。在实行先例制度的国家,一旦有法院作出先例判决,其他法院虽然没有义务照搬,但遇到同类案件时,也很可能会参考。自2012年春美国联邦地区法院纽约南区法院裁判法官安德鲁·佩克(Andrew J. Peck)首次批准在Monique da Silva Moore等人诉Publicis Groupe SA & MSL Group公关公司案中使用预测编码以来,从业者一直密切关注每一个提及预测编码的新决定。[3]由于尚未出现在电子证据开示中使用预测编码的通用技术或法律标准,每个请求使用预测编码的新案件都提供了如何对其进行辩护以及法院和当事方如何对其作出反应的见解。虽然此类案件的总数仍然很少,但每年的数量仍在增加。据Gibson Dunn律师事务所发表的“2014年末电子证据开示发展状况”中的统计数字,2012年此类决策共有6项,2013年有9项,而2014年则增至17项。[4]
  预测编码在司法中的应用到底前景如何?是否会影响到司法公正,甚至改变司法程序?如果采用预测编码,该如何设定法律上的管理或限制?这些问题都值得仔细考虑。学界对此问题的研究也刚刚开始,还没有足够的文献来证成某种可信的理论。故此,本文能做的也只能是一些初步的介绍。本文以关于预测编码的简要介绍开始,继而讨论最近英美司法案例中的一些问题,以供从事此方面研究的人士参考。
  一、什么是预测编码?
  通常所说的预测编码又称为计算机辅助文档编码,是一种利用计算机技术审查、分析和处理大量文档的技术。根据2012年全美律师协会诉讼法年会提交的报告,预测编码涉及制定基于训练集的决策标准,然后应用于更大的数据体系以进行预测。预测编码的核心在于“监督学习”,即从人类决策中学习,然后能够将这些决策应用于新数据的算法。都拉黑名单了,还接个P
  引而伸之,预测编码是一种算法支持下的文本分类(text categorization),指的是基于律师及案情专家对测试文件(或一组种子文件、正确性检测文件(validation sets)或训练文件)的审阅,通过软件程序对与特定案件或争论点相关或者可响应(responsive)的文件进行识别。这种由计算机辅助的方法涉及机器学习,以及不同算法工具的组合使用。这种协助律师进行文件的搜索、挑选和分类的方法被认为是电子证据开示领域最重要的发展之一。实际上,它的重要性甚至使得一些业内人士相信,这项技术将最终代替律师审阅文件的作用。
  使用预测编码的软件能够从错误中吸取教训,首先审查由法律团队手动标记和分类的文档样本。然后给预测编码程序提供一组新的文件,要求识别哪些文件是相关的并且应该由人进行审查。接下来,法律团队审查软件的决策,以确定是否已达到可接受的置信水平。如果软件的标记和分类未能证明可接受的置信水平,则重复培训过程,直到软件了解所需内容。预测编码的支持者认为其节省了时间和金钱,因为该技术只需要人力审查小量的电子文件和记录,而大量的数据则交由计算机软件处理。虽然软件加快了审查过程,但并未完全取代人工输入,预测编码故此也可称为技术辅助审查。
  具体而言,预测编码是使用关键字搜索,过滤和采样来自动执行电子开示文档审阅的部分内容。预测编码的目标是减少需要手动审查的不相关和无响应文档的数量。预测编码软件使用数学模型和人工智能编程来扫描电子文档并定位与法律案例相关的数据。就其性质而言,预测编码实际上是数据压缩理论的一个重要分支。根据离散信号之间存在一定相关性特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预值的差(预测误差)进行编码。如果预测比较准确,那么误差信号就会很小,就可以用较少的码位进行编码,以达到数据压缩的目的。
  二、预测编码在证据开示中的应用
  (一)电子证据开示
  预测编码在法律中的应用集中在电子证据开示领域。自2012年以来,在英美法系中已有若干判例。起源于英国的证据开示制度在美国及英联邦国家和地区得到了继承和发扬,成为证据制度中不可或缺的重要组成部分。这一制度要求案件在正式庭审之前,检控方应当适时将指控证据向辩护方进行公开,使辩护方能够在庭审中提出有准备、富于针对性的辩护意见;辩护方也有义务将特定种类的证据向检控方展示,为准确的指控提供帮助。证据开示制度对于充分保障被告人的辩护权、预防控辩双方恶意证据突袭、有效发现案件真实和提高诉讼效率具有特别重要的意义。证据开示制度在平衡控辩双方力量、提髙诉讼效率和发现案件真实等方面具有十分重要的作用。其在英美法系国家较为完善,在大陆法系国家则通过阅卷权实现,而日本和意大利也在诉讼制度改革中有意设立了相关制度。[5]在中国,类似制度也被法律所认可。[6]
  电子证据开示是指在审前的证据展示中,诉讼各方在法院的主持下,将本方所掌握的电子证据告知对方,并出示、交接的一种审前程序。电子证据开示是识别可能与法律行为相关信息的过程。以电子存储信息为中心,它包括文档、记录、电子邮件、即时消息聊天、会计数据库、图像文件等。电子证据开示通常始于对所识别的与手头案件相关的信息进行合法的“保留”。这里的目标是确保在程序期间信息仍然可用和可访问,并将与证据开示相关的原标记添加到文

  ······

法宝用户,请登录后查看全部内容。
还不是用户?点击单篇购买;单位用户可在线填写“申请试用表”申请试用或直接致电400-810-8266成为法宝付费用户。
【注释】                                                                                                     
©北大法宝:(www.pkulaw.cn北大法宝,版权所有)专业提供法律信息、法学知识和法律软件领域各类解决方案。北大法宝为您提供丰富的参考资料,正式引用法规条文时请与标准文本核对
欢迎查看所有产品和服务。法宝快讯:如何快速找到您需要的检索结果?    法宝V5有何新特色?
扫码阅读
本篇【法宝引证码CLI.A.1252208      关注法宝动态:  

法宝联想
【相似文献】
【作者其他文献】

热门视频更多