深度换脸技术 AI造假可以打破吗?

无论是使用数字合成技术(CGI)从零开始合成具有真实感的图像(这一过程极具挑战性且花费巨大),还是借助修图神器 Photoshop 的帮助,伪造虚假图像和视频都曾是一件需要花费大量时间和精力的事情。

而现在,人工智能生成图像的出现使得任何人都可以更容易地对图像或视频做出调整,使其产生令人混淆的真实效果。今年早些时候,《麻省理工科技评论》杂志人工智能方面的资深编辑威尔·奈特(Will Knight)就曾使用成品软件,自己伪造了一则美国参议员特德·克鲁兹(Ted Cruz)的虚假视频。这则视频会有一点失真的情况,但这一情况并不会持续很长的时间。

相同的技术正在被用于创造越来越多的视频和图片,人们称之为“深度换脸技术(deepfakes)”。比起常见的以文本形式出现的虚假新闻,这些“深度换脸技术”更有可能破坏真相、误导观看者并在更大范围内制造是非分歧。

这些可能性深深困扰着美国达特茅斯学院计算机科学教授哈尼·法里德(Hany Farid),20 年来,法里德一直致力于揭穿虚假图像的工作。他提醒道:“我认为我们并没有做好准备”。但他希望,随着越来越多的人意识到这一问题以及最新科技的发展,人们能够做好充分的准备,在真实图像和通过技术操作所产生的创造品之间做出分辨。

图丨拍摄于牛津大学布雷齐诺斯学院( Brasenose College)的一张原图

图丨使用修图手段,将原图中屋顶上代表非异性恋者(LGBTQ)的彩虹旗擦除的示例图

法里德解释说,目前人们主要使用两种途径来应对识别图像过程中的挑战。第一种方法是在图像中寻找修改的痕迹。图像取证专家们使用计算技术来判断,是否任何像素或元数据有修改过的痕迹。比如说,他们能找出不符合物理学定律的阴影或反射影像,或者通过查看一个图像文件被压缩的次数,来判断这个文件是否已被多次编辑和保存。

第二种方法是鉴别图像是否与刚被拍摄出来的那一刻一样完整,这也是一种相对较新的方法。鉴别过程中需要进行数十次的核查,来确保摄像师没有试图伪造设备的位置数据和时间标识。核查的内容还包括,相机的坐标、时区、海拔高度和附近的无线网络信息是否能彼此印证?作为一个三维场景,图像中光线的折射是否正常?还是说,这是有人用另外一张二维图像拍摄的照片?

法里德认为,这第二种方法是一种非常理想的方式。因为每天有 20 亿张图片被上传到网络之中,法里德认为第二种方式将有助于大规模鉴别图像的实现。

两家初创公司正在致力于将这一想法商业化,它们分别是来自美国的 Truepic(法里德为其提供顾问支持)和来自英国的 Serelay。他们已经采取了一些相似的举措:两家公司都拥有能免费支持苹果系统(iOS)和安卓系统(Android)的相机应用程序,这些程序将使用专有算法,在拍照时自动鉴别图像。当一张图像获得如同病毒一样的广泛传播时,人们可以将其与原图相比较,来查看这张图像是否保留着与原图一致的完整性。

Truepic 公司将用户拍摄的图像上传并储存在服务器端,而 Serelay 公司储存的是各式各样的数字指纹,这些数字指纹是通过在每张图像中对大约 100 个数学值进行计算而获得的(该公司声称,哪怕是对单一像素所进行的编辑,用这些数学值也足以检测出来,它们还能大致判断出图像中的哪一部分发生了改变)。

Truepic 公司说,他们选择储存完整图片,是为了以防用户出于安全原因而删除某些敏感图片(例如,某些在交战地带等高危情境下工作的 Truepic 用户,可能需要在对现场进行记录之后,立刻将应用程序卸载)。与之相反,Serelay 公司认为,不储存用户图像能为用户提供更大的隐私空间。

为了更大程度获得用户的信任并提供安全保障,Truepic 公司还使用了区块链技术来存储所有的图片和元数据——区块链是比特币背后的一项底层技术,它将加密技术和分布式网络结合起来,从而为信息的存储和追踪提供保障。

法里德承认“这第二种方式并不是绝对安全的”,他也表示说,这种方式仍有一些缺点。比如,用户们必须在手机中使用此类能够提供鉴别技术的软件,而不是单纯的相机应用程序。他也指出,相比于安全性,试图将这种方法商业化的公司可能更看重货币化的实现。“而我们对开发这些应用程序的公司是寄予了一定信任的”,他说。

但目前也有一些策略能够缓解这些缺点。Truepic 和 Serelay 两家公司都提供了软件开发工具包,让第三方平台能够接触到他们的技术。他们这样做是希望,未来,他们的鉴别技术能成为数字相机的行业标准,这里的数字相机包括脸书(Facebook)、色拉布(Snapchat)、甚至苹果(Apple)公司开发的本地相机应用程序。到那时,在社交媒体上发布的未经修改的图像都将自动获得核查标记,就像推特(Twitter)目前使用的认证徽章标志一样,有核查标记意味着这张图像能够与数据库中的图像相匹配——Serelay 公司希望这种标志能建立图像的可信度。

“我们在网络上看到的绝大多数内容都是通过移动设备捕捉的”,法里德说,“而基本上只有少数相机程序能在系统中加入这项鉴别技术,因此我认为这将是一个很好的解决方案”。

目前,这两家初创公司都在与社交媒体公司谈判,探索合作的可能性。同时,Serelay 公司也参与了脸书公司一个名为 LDN_LAB 的新加速器项目。

虽然这项技术还没有普及,但法里德鼓励人们将其作为一种默认程序,在记录高危情境时使用,这些情境可能是记录政治竞选演说、人权冲突、或是记录犯罪现场的证据片段。目前,已经有民众使用 Truepic 公司的应用程序来记录叙利亚危机。阿拉伯半岛电视台(Al Jazeera)也在报道叙利亚危机时,使用鉴别功能制作了一些视频。除此之外,两家公司也都在保险行业推广了这项技术,以此作为记录损毁情况的一种可信方式。

“我,和许多像我一样的无辜孩子,都将被残忍杀害。”# 叙利亚伊德利卜(Idlib)的孩子们想对美国总统特朗普说的话 @realDonaldTrump. pic.twitter.com/owd7DvZWlB————阿拉伯半岛电视台英语频道 @AJEnglish 2018 年 9 月 9 日报道

法里德表示,对于致力于这方面的公司来说,保持其产品的透明度并选择可信的合作伙伴是非常重要的。前者有助于维持用户的信任,后者有助于防范有不良居心的人。

法里德说,要做好应对深度换脸技术扩散的准备,我们的路还很长。但他对此信心十足。“Truepic 和 Serelay 各自类型的技术都发展得很好”,他说,“在我看来,我们已经快要到达终点了”。

-End-