阿尔伯特・爱因斯坦 or 玛丽莲・梦露

    在下面这一排图片中,你看到的是爱因斯坦的头像,还是梦露的头像?如果你和我一样,坐在大约13寸的显示器跟前,眼睛离屏幕大约50cm左右的话,我想你在最左边的图应该能看到爱因斯坦,而在最右边的最小的那个图片里,应该能看到梦露。
    当然,正如你所预料的,从左到有所有的图片内容是一样的,我只是在photoshop里把它们的大小按比例更改了一下。

    这种图片叫做hybrid image (混合图像, Hybrid Images @ MIT )。这幅图是由爱因斯坦和梦露两个人的头像混合而成的。下面我要解释一下它的原理。首先,我需要先说明一下一个叫做spatial infrequency (空间频率)的概念。

    视觉上的空间频率,简单的说,就是在单位长度上出现的某种几何结构的数量。一般这个长度使用视角做单位,就是某个长度两个端点到你眼睛连线的夹角。同样的图像,如果距离变近,视角就会增大,从而空间频率降低。下面这张图,左边就是空间频率比较低的图像,右边是空间平频率比较高的图像。我们平常看到的图像里,比较细致、明暗变化剧烈的部分,例如轮廓,空间频率就比较高;而明暗变化比较缓慢的,例如大片的原野,空间频率就比较低。
    像在photoshop里面加工图片,“锐化”就是保留高空间频率的成分,过滤掉一部分低频成分。这样由于去掉了明暗变化缓慢的成分,图片看上去就会更鲜明,从而显得“锐”。而“模糊”就是反而为之。

    第一副图片,就是把爱因斯坦的头像的高频信息(类似于锐化以后的图片),和梦露头像的低频信息(类似于模糊化以后的图片)叠加在一起。
    人的视觉有个特点,距离比较近的时候,对高频成分很敏感,对低频成分很不敏感。而如果离得比较远,也就是图像变小的话,就对低频成分敏感,而分辨不清楚高频成分。
    通俗的说,就是离得近,细致的东西就看得清楚,而模糊的东西就反而看不清。如果离得远了,细致的东西就分辨不清,以前模糊的东西反而觉得清晰起来。
    这就是混合图像的原理。大图相当于离得近的时候,这时候你只能看清高频成分,也就是爱因斯坦的脸。当你往后退,离得远了(图片就变小了),就只能看清低频成分,也就是梦露的脸。

    人的视觉有一个特点,在某一个固定的明暗对比度之下,只对一定的空间频率比较敏感,超出这个范围就分辨不清楚。例如下图,从左到右,空间频率逐渐升高。由下至上,明暗对比度逐渐减小。如果你在这幅图上半部分比划一条水平的直线,在这条直线上,明暗对比度是固定的,这时候只有比较靠图片中央的明暗变化看得比较清楚,靠左边和靠右边看上去则像一大片灰色,看不出有明暗的规律性变化(不要贴得太近哦)。在这幅图里,如果固定明暗对比度,空间频率过高、或者过低,都超出了人的视觉敏感范围。

    在文章一开始的图片中,如果你的头离图片比较近,爱因斯坦的高频信息正好落入感度比较高的空间频率范围内,而梦露的低频信息则恰好处于不敏感范围,所以只能看到爱因斯坦。当你渐渐后退,或者图片缩小的时候,原本低频的信息就变成了高频,进入视觉敏感的频率范围,而原本高频的信息就变得太高频了,超出了视觉敏感范围。这时候,梦露变得明显,而爱因斯坦就变得不明显了。这就是混合图像的原理。

    这个视觉现象的原理,大家都明白了吗?以上是这学期ゼミ的作业,要求把混合图像的原理,用大学3年级学生也可以完全理解的语言来解释。如果有看不明白的地方,请一定要反馈给我,让我修改一下。