迷人的金发女郎面对镜头,正准备拉下男人的裤子,她微微上扬的嘴角迷离的眼神已经足以点燃烈火……不到一秒钟内,任何一位职业素质过硬的人类鉴黄师,都会将其当作一张色情图片删除。
但在AI鉴黄师眼中,这只是一副20多岁的女性肖像。她头部倾斜,坐在堆满衣服和绘画的室内。
是的,背景中的确有一幅画
人工智能鉴黄师的错误不止于此,在Facebook和Tumblr全面抵制色情图片的时候,来自科技的纰漏层出不穷。被当成生殖器官的考古图片和岩洞风景照,引发了大量用户的怨声载道。
“恕我无能,我完全意识不到这张图片有什么色情倾向?”
“这只是大自然中正常的繁衍行为,仅仅因为它们长得像一些不可描述的部位就剥夺它们的肖像权?这样是不公平的。”
“对手工织物的封禁是我最后的极限,请告诉我为什么要扼杀这只可爱的蜡烛?!”
对于用户们濒临崩溃的指责,2Beats首席执行官Samim Winiger终于解释了AI鉴黄师粗野任性的原因。
“让公众拥有知情权是非常重要的,因为人工智能的发展就像你拥有了一个黑色的魔法盒子。在中世纪时,只有少数人识字。一些东西只会控制在他们手里。”他说,“如果只有精英们拥有知识并获得控制机器学习的技能,那就是灾难的开始。”
他的目标是向公众展示AI视觉如何区分图片,希望让人们更好地了解人工智能是如何工作的
近年来,神经网络帮助AI研究人员在视觉、翻译和语音识别方面做出了巨大改进。你的远程按摩棒和智能音箱已经可以开始监听你的对话,但是,对于神经网络已经实现的所有进步,我们仍然不清楚它们依靠什么标准进行图像分类。
“首先,我们收集了超过100000张的色情图片,并将它们输入学习图像分类的神经网络。低层会将这些物体拆分成形状,最终导出为可以被AI检测的对象。通过这样的学习,AI会逐渐建立对物体外观的理解。”
Porn hub贡献了最大的样本数据库
“神经网络的工作原理有点像每一层都会拍摄一张照片的相机,从最底层开始扫描,到最高层时,图像中的内容就变得越来越清晰。”
多色行是最低层,拥有可识别的边缘。向下的图像对应更高的层次
第二行图像是将这些边缘分成形状和对象部分的图层
在拆分完所有这一切后,它们被“缝合”成为一个完整的物体
你可以看到胸部、臀部以及各种其他不同的身体部位
这就是AI神经网络通过对图片中不同层次的抽样来检测色情内容的方式
“接下来的两行对应尝试对色情图片进行分类或标记的算法。”Winiger说。
它们是如何“可视化”图像的关键
肉眼很难辨别这些看起来像什么,其实AI也一样。
神经网络一生中没有见过真正的色情片,它基本上是一个处子。它只根据被设定的要求拆分与归类图片,这种粗暴的方式意味着它会在很长一段时间内沉浸于难以割裂的局限性。
现在,科学家们开始开发了更多的工具,以便更全面地突出这些可以被破译的图像。这些工具可以向我们展示AI在每层“看到”的内容,人们可以通过机器的眼睛“查看”图像,更好地了解人工智能鉴黄师失败的原因。
谷歌的神经网络始终认为哑铃是人类的一部分,大量的哑铃图片被标记为违禁内容。在AI眼里,这些由一根横杠穿起来的东西看起来应该被归入非礼勿视的文件夹。
有些人把这些失误称为空间性视错觉的AI版本,你的大脑会欺骗你去看那些并非完全存在的东西,比如在玉米饼中看到耶稣的脸
研究人员仍在研究这个问题,了解机器如何看待沙漠和哑铃只是第一步。想让它们辨别色情内容,首先要让他们理解色情。
但理解之后呢?一个成熟的的机器人可能会自制出两个虚拟人类主演的色情电影,它们有可能看起来像是某位名人或者你隔壁的邻居?或者更糟糕的儿童色情?这一切又由谁来负责?
“这些神经网络可以学习新的行为或新的思维方式,它们可能会学到系统设计师无法预测的东西。” 康奈尔大学人工智能专家Bart Selman说。“我们是否在训练我们可能并不理解的机器?”
“你为某个目标训练它,但系统可能通过做你不希望它做的事来实现这个目标。这是一个哲学问题,比技术更艰难百倍。”