我们之前都喜欢说,一张照片抵过千言万语,但是世界上总不乏反其道而行之的牛人,这款出自技术爱好者马特·理查森(Matt Richardson)之手的奇特相机,设计初衷就是,如何让20个字来描述一张照片。这款相机目前被称为“白描相机(Descriptive Camera)”,使用一张文字描述的打印字条来取代实际拍摄的图像。
看到这里,你的脑海中蹦出了怎样的技术手段,实现场景到文字描述的转换技术呢?人工智能?机器学习?
其实都不是,这个描述的过程是完全人工实现的。用户手中的这款相机,目前的模型是配备有网络摄像头的,拍摄的过程与普通相机无异,手指轻触拍摄键,也会得到一副“看不到的图像”,被直接上传到亚马逊网站提供的“人工外包服务站”——土耳其机器人(Mechanical Turk),只要有人针对照片写下描述性的语言并且提交回送到相机客户端,相机就能够用自带的热敏打印机将其打印出来,如图所示的输出结果。
为了确保结果的有效性,返回相机之前增设了人工筛选过程,最佳描述者会获得金钱上的支付,而最吻合真实场景的描述才会返回到相机用户端。据统计,整个过程中,结果均会在6分钟内返回,多数情况下可以达到3分钟的反馈速度。
我们来看看相机拍摄的结果,上图中,相机捕捉到窗外强烈日光下一幢高楼的照片,输出结果为:“这是一幢陈旧老楼的照片,它看起来像是风烛残年摇摇欲坠,急需尽快修葺。(This is a faded picture of a dilapidated building. It seems to be run down and in need of repairs.)”
如上图,那些黑色方格的不明物体很难辨别,有人提供描述结果为:“这像是一排又老又丑的橱柜,其上还贴着各种老旧商标,残破不堪。橱柜前方有一个台灯与其相连(Looks like a cupboard which is ugly and old having name plates on it with a study lamp attached to it.”
在这两张照片中,画面主体都比较突出,描述起来误差不大。如何处理这样的照片,得到用户满意的结果,或许是该款相机面临的挑战。
设计者理查森介绍说:“这款相机的实现其实是抛砖引玉的一个探索,在图像的搜索技术迫在眉睫的时候,我想知道如果一款相机能够及时提供‘可供搜索’的描述性语言,会得到怎样的成效。”
这款相机目前还没有明确标价,理查森称,相机的硬件成本约为200美元,但是为其编写代码也花费了很多的时间。同时,在土耳其机器人服务中,每条有效信息为1.25美元。由此估算出来,最终每张照片的成像价格大概与宝丽来相片不相上下。
同时,理查森于今年春季在纽约大学开设了一门叫做“计算型相机(computational cameras)”的课程,他带着这台相机走上课堂,希望能够教学相长,为下一步的设计提供更多想法。
该相机将于5月14日-15日两天在纽约的ITP春季展中展出。(文/果壳网)