如何识别假数字图像

作者: 哈尼·法里德(Hany Farid) 2008-07-02 16:04:03 来源:南方周末

如何识别假照片

相关新闻

图片

  • 26如何识别假数字图像3相机指纹 数字润饰极少留下明显痕迹。由于润饰手法多种多样,作者希望开发一种全能算法,应对所有照片修改方法。我们提出的方法利用了数码相机的一个共性。相机的数字传感器具有矩形的像素网格,由于数字传感器网格上方装有色彩滤波阵列,因此每个像素只能探测某种颜色附近一定波长范围内的光强度。使用最广的色彩滤波阵列是拜尔阵列,它具有红、绿和蓝光滤光镜。因此,在形成标准数字照片的一个像素所需要的三种颜色通道中,原始数据的每个像素只能选择其中一个。缺失的数据根据邻近像素进行内插运算填充,这就是所谓的“去马赛克”过程。不管使用哪种去马赛克算法,最终得到的数字图片中的像素均与其邻近的像素相关。如果一张照片据称是用某部相机拍摄,但却缺乏此相机应该具有的像素相关性,那么就可以判定它被修改过了。

标签

借助新的软件技术,照片作假比任何时候都更容易,更逼真。不过软件技术同样为我们提供了揪出伪造图片的新武器


镜面高光

眼睛里有一个白色的小光斑,称为“镜面高光”,是眼睛反射环境光线时产生的。我们可以根据镜面高光的形状、颜色和位置,获知大量有关光线的信息。这张照片的“镜面高光”,无论是位置还是形状,彼此间都完全对不上号,因此单凭肉眼便可断定它被修改过。然而在许多情况下,需要采用数学分析才能识别真伪。为了准确判定光的位置,需要考虑眼睛的形状以及眼睛、相机和光线之间的相对方向。


相机指纹

数字润饰极少留下明显痕迹。由于润饰手法多种多样,作者希望开发一种全能算法,应对所有照片修改方法。我们提出的方法利用了数码相机的一个共性。相机的数字传感器具有矩形的像素网格,由于数字传感器网格上方装有色彩滤波阵列,因此每个像素只能探测某种颜色附近一定波长范围内的光强度。使用最广的色彩滤波阵列是拜尔阵列,它具有红、绿和蓝光滤光镜。因此,在形成标准数字照片的一个像素所需要的三种颜色通道中,原始数据的每个像素只能选择其中一个。缺失的数据根据邻近像素进行内插运算填充,这就是所谓的“去马赛克”过程。不管使用哪种去马赛克算法,最终得到的数字图片中的像素均与其邻近的像素相关。如果一张照片据称是用某部相机拍摄,但却缺乏此相机应该具有的像素相关性,那么就可以判定它被修改过了。


明暗问题

从不同的照片上截取所需图像,合成一张新照片时,由于拍摄时光线条件不同,不同照片上的人或物会存在细微差别。这一方法基于一个简单的事实:照射到某个表面上的光线多少,取决于该表面与光源的相对方向。例如,一个球体面向光源的一侧被照得最亮,而背向光源一侧则最暗;整个球面上的光照随着球面与光线方向之间夹角的变化由明到暗逐渐过渡。

在上面这张照片中,照射到警察的光源方向与照射鸭子的光源方向不符。但我们还需要分析其他一些东西,才能确定鸭子是被添加到这张照片上去的。



眼见不为实

历史上对照片大做手脚的事例不可胜数。有人修改照片是为了让自己的形象更有魅力,有人则是为了从照片上抹去自己不喜欢的人或物。以前,伪造的照片需要在暗室里经过好几个钟头的繁琐操作才能出炉;现今,任何人只要有一台电脑,便可不费吹灰之力地伪造照片,而且伪造得非常高明,别人极难察觉出来。

在许多情况下,单凭肉眼很难发现作弊的蛛丝马迹,因此我们需要基于计算机的更加专业的方法——数字图像鉴定术。

常有新闻媒体、执法部门、法院及公民个人委托我鉴别图片的真伪。每张待鉴定的照片都向我提出了新的、不同以往的挑战,需要采用不同的办法来解决。我曾通过检测光线来寻找破绽,最终发现一张两人合影是由他们各自的照片拼合而成;拿到一张别人上传到网上参加钓鱼竞赛的照片,我就会查找照片是否存在因缩放操作而产生的像素伪迹;对于一幅在软件所有权争议中作为证据的屏幕截图,由于发现JPEG压缩(一种标准的数据格式)存在不一致的漏洞,我断定有人在其中做了手脚。

上述例子表明,图片种类繁多,弄虚作假的伎俩也五花八门,因此图像鉴定需要用到多种多样的工具。过去5年中,我、我的同事、学生和一群目前人数尚少却在不断增加的研究人员,已经研究出多种方法来揭露数字图片中的造假行径。在开发每一种工具时,我们的第一步,便是弄清一幅图片有哪些统计特性或几何特性会受到某种具体作弊手法的干扰及破坏;第二步则是编制一套数学算法来找出这些破绽。

照片真实与否,可以决定一个人会不会遭受牢狱之灾,或者鉴定出最新宣布的科学发现究竟是革命性进展,还是一场让整个领域蒙羞的骗局。伪造的照片还可以左右选举结果:在1950年美国大选期间,一张米勒德·E·泰 丁 斯 (Millard E.Tydings)参议员与美国共产党领导人厄尔·白劳德(Earl Browder)交谈的照片被曝光,泰丁斯因此在竞选中落败,后来人们怀疑这张照片是被修改过的。近几年的政治宣传广告中,作伪照片的案例更是层出不穷。2004年初,有人在互联网上发布了一幅伪造的剪报,刻意显示民主党总统候选人约翰·克里(John Kerry)在20世纪70年代一次反越战活动中同美国著名女星简·方达(Jane Fonda)站在同一台上。因此,现在我们比以往更加有必要知道,什么时候才能够“眼见为实”。

随处可见的造假门

伪造的照片随处可见。黎巴嫩自由记者阿德南·哈吉(Adnan Hajj)曾在中东历次冲突现场为路透社拍摄过不少生动的照片,但2006年8月,路透社发布的一幅他拍摄的照片却有明显的修改痕迹。这张照片反映的是黎巴嫩首都贝鲁特遭以色列轰炸后的情景,照片上一些大团的浓烟一眼就可看出是复制添加的。

2003年,布里安·沃尔斯基(Brian Walski)被洛杉矶时报社解雇,起因是他从伊拉克发回的一张登载于该报头版的照片露出了马脚:为了使照片更加生动,沃尔斯基将来自两张不同照片的元素拼合起来。其他报社的一位员工仔细查找照片上是否有他住在伊拉克的朋友时,敏锐地发现同一个人出现在了照片中的不同位置。

1994年,《时代》杂志曾用一幅经过修改的美国著名球星杰西卡·辛普森 (O.J.Simpson)的面部照片作封面,《新闻周刊》则在2005年某期封面上把美国家政女王玛莎·斯图尔特(Martha Stewart)的头部嫁接在另一位女模特苗条的身躯上,这些行为都饱受争议与谴责。

伪造图片的丑闻也曾令科学界大为震惊。2004年,韩国首尔国立大学的黄禹锡(Woo Suk Hwang)及其同事在《科学》杂志上发表论文,称该团队已经克隆出11个干细胞。但调查发现,11个克隆干细胞中只有2个是真的,其他9个均系伪造,这最终令黄禹锡身败名裂。《细胞生物学杂志》总编迈克·罗斯纳(Mike Rossner)估计,该杂志采用的来稿中,多达五分之一的稿件都有处理不当的插图,必须重新制作。

图片的真伪还在很大程度上决定着官司的输赢,包括那些所谓的儿童色情作品案。2002年,美国最高法院规定,由电脑生成的虚拟未成年人图片受宪法保护,从而推翻了1996年出台的一项法律的部分内容(原法律规定的儿童色情案范围更广,由电脑生成的虚拟儿童图像也包括在内)。在2006年俄亥俄州沃帕科内塔进行的一次庭审中,被告方宣称电脑中的照片不是真实的,如果俄亥俄州当局无法证明图片的真实性,被告就有权拥有这些图片。在这桩官司中我受检方委托出庭作证,向陪审员讲述了现代图像处理技术的功能和局限性,并检验了这些图片是否由电脑生成。被告方声称照片不真实的说法最终被法庭驳回。

然而,在美国,已经有若干项联邦一级和州一级上的决议认定,由于电脑生成的图像过于复杂,因此不应要求陪审团来鉴定图片的真实性。至少有一位联邦法官认为,即使是专家,也有可能做出错误的鉴定。既然如此,当数字摄影作为证据引入法庭时,我们还能信任它吗?

激烈的较量

本文插图中介绍的各种识别伪造图片的方法也许能多多少少挽回人们对照片的信任。但造假者也绝不会束手就擒——在我们努力研发能够揭穿照片骗局的软件时,造假者也会拼命寻找能够瞒过各种算法的伎俩,并且把本来是为合法用途开发的各种越来越高级的图像处理软件搬过来为己所用。想骗过某些取证鉴定工具也许并非难事,例如,我们很容易就能编写出程序来恢复原始图像所应有的像素相关性,然而要想骗过更高级的鉴定方法,难度就会大得多,远远超过普通电脑用户的水平。本文框图中介绍的方法,利用了图像形成过程中复杂而微妙的光线明暗分布特性和几何特性,要利用标准图像编辑软件来校正这些特性将会非常棘手。

有关垃圾邮件以及病毒的博弈不会终止,更不必说那些普通的犯罪活动了;同样,造假者与真伪鉴别者之间的角力也无法避免。然而,鉴于图片取证分析领域的进展,制假工作的难度越来越大,耗费的时间也将越来越多,但要完全杜绝造假则是不可能的。

虽然数字图像取证分析仍是一个相对较新的领域,但科技出版行业、新闻媒体以及司法部门已经开始使用各种取证分析技术来鉴定数字媒体的真伪了。随着这一领域在今后5到10年中的不断进展,图像取证分析技术将会普及,就像现在的实物取证分析技术一样。我希望,这项新兴技术能在合理的相关政策及法规配合下,让我们在这个引人入胜但有时又让人迷茫的数字时代,从容应对各种挑战。

(《Scientific American》中文版《环球科学》授权发表,有删节,郭凯声译)

上一页1下一页
1

我要打分:

0/5 (共0票)

责任编辑: 朱力远 网络编辑: 莫希

评论(已有0条)

十大热门

订阅更多...

订阅中心


2008年5月29日

南方周末


浏览最新电子报