人工智能的“创造力”正在改变我们对真实事物的理解



伯克利的一组研究人员今年发布了两个视频。 其中一匹马在篱笆后面奔跑。 在第二个,她突然得到黑白斑马图案。 结果并不完美,但是这些条带非常清楚地适合马匹,就好像这些动物的家谱陷入了混乱之中。 类似的技巧表明了机器学习算法改变现实的能力的发展。



其他一些研究人员使用神经网络将黑熊的照片变成了大熊猫的可信图像,从苹果变成了橘子,将猫变成了狗。 一个Reddit用户使用另一种机器学习算法来编辑色情影片,并在其中插入名人面孔 。 初创公司Lyrebird根据一分钟的语音记录, 合成了令人信服的语音。 Adobe工程师正在开发Sensei人工智能平台,正在将机器学习引入用于视频,照片和音频编辑的创新工具中。 这些项目的起源和目标有很大的不同,但是它们有一个共同点:它们合成图片和声音,结果与真实的惊人地相似。 与以前的实验不同,这些AI创作看起来和听起来都是逼真的。

这些变化背后的技术将很快将我们推向新的创作领域,从而提高当代艺术家的能力并培养普通的业余爱好者。 我们将寻找创造力概念的新定义,这将扩大其视野,并包括机器的创造。 但是,这种繁荣将带来不利影响。 人工智能创造的部分内容将被用来欺骗,从而使人们对假新闻无休止地涌现出来。 关于图片是否已更改的旧争论将由新的争论取代,即有关所有类型内容(包括文本)的来源的争论。 您将开始怀疑:人们(如果有)在创建此专辑/系列/文章时扮演什么角色?

以前,有两种创建类似于真实音频或视频的方法。 首先是使用摄像头和麦克风来记录生产现场。 第二个是最大限度地利用人才(通常要花很多钱)来创建精确的副本。 现在,机器学习算法提供了第三种选择,允许任何技术知识最少的人修改现有内容以创建新材料。


金星的诞生-深梦的版本

起初,神经网络生成的内容并不面向现实主义。 Google的Deep Dreams于2015年发布,是使用深度学习在迷幻景观和多眼怪异艺术品上盖章的早期例子。 2016年的热门应用程序Prisma使用深度学习来增强照片滤镜,例如使用蒙德里安或蒙克绘画对图片进行样式设置。 此技术称为样式转换:采用一幅图像的样式(例如“尖叫”)并将其应用于第二帧。

现在,样式转移算法正在不断改进。 以康奈尔大学Kavita Bala实验室的工作为例。 它显示了深度学习如何将一张照片(闪烁的夜空)的风格转换为一张阴郁的大都市的图片,并欺骗认为该地方真实的评论者。 受人工智能识别美学特性的潜力启发,Bala教授与他人共同创立了GrokStyle 。 想象一下,您喜欢朋友沙发上的装饰性枕头或杂志上的毯子。 向该图像显示GrokStyle算法,它将找到相同样式的事物图像。

Bala教授说:“我喜欢这些技术是它们如何使设计和风格民主化。 我是一名技术人员:我欣赏美丽和时尚,但我什至无法将它们创造得紧密。 这项工作使我可以使用这些东西。 也很高兴能够将其提供给其他人。 我们在这个领域没有天赋的事实并不意味着我们必须生活在一个无聊的环境中。”

在Adobe,十多年来,机器学习一直是创造创意产品的一部分,但该公司最近迈出了一大步。 十月份,致力于Sensei的工程师展示了一种很有前途的视频编辑工具Adobe Cloak。 它使用户可以轻松地从视频剪辑中删除路灯柱,即使对于有经验的编辑人员来说,这也是一件非常痛苦的任务。 另一个名为Project Puppetron的项目将特定的艺术风格应用于实时视频。 它允许您以动画青铜雕像或绘制的卡通人物的形式显示人物。 “您可以在镜头前做点什么,然后将其转换为实时动画,” Adob​​e研究部高级科学家兼主管John Brandt说。



机器学习使这些项目成为可能,因为与以前的计算机视觉方法相比,机器学习可以区分面部的各个部分,并能更好地看到前后背景之间的差异。 Sensei工具允许艺术家不使用材料,而是使用概念。 布兰特解释说:“ Photoshop在像素管理方面做得很出色,但实际上人们正在尝试操纵这些像素显示的内容。”

这是新闻的重要部分。 当艺术家不再需要花费时间在屏幕上绘制单个点时,他们的工作效率就会提高。 据勃兰特说,他对新艺术形式出现的可能性感到非常高兴,并正在等待新形式的出现。


Adobe披风演示

但是,不难想象这种创造性的爆炸如何导致非常糟糕的后果。 芝加哥大学的毕业生Yanshun Yao观看了AI制作的假视频,并决定启动一个项目,探讨机器学习的危害。 在他看到的视频中,新生的巴拉克·奥巴马发表了讲话。 姚明想检查一下是否有可能用文字材料制作类似的东西?

文本的结构几乎应该是完美无瑕的,以便使大多数读者相信其“人类起源”。 姚开始的任务相对简单-为Yelp和亚马逊生成假评论。 这样的文本只能包含几个句子,读者不会期望其具有较高的语言水平。 他和他的同事创建了一个神经网络,以5个句子的Yelp长度为主题创建文本 。 收到的评论包括诸如“现在这是我们最喜欢的地方!”之类的声明。 和“和我的兄弟一起去那里,点了素食面食-非常好吃。” 进一步,姚明问人们这些文字是真实的还是假的-当然,人们经常会误认为。

撰写此类评论的费用从10美元到50美元不等,Yao声称,有人试图通过降低价格和向网站充斥虚假评论来实现流程自动化,只是时间问题。 他还探索了神经网络保护Yelp免受伪造内容的功能-并取得了一些成功。 他的下一个目标是生成可信的新闻文章。

对于视频内容,进度可以更快。 哈尼·法里德(Hani Farid)是检测伪造照片和视频的专家,也是达特茅斯学院的教授,他对病毒内容的传播速度以及识别其真实性的过程如何落后感到担忧。 他承认,在不久的将来,将会有一段令人难以置信的录像带,唐纳德·特朗普(Donald Trump)下令对朝鲜进行核攻击。 它会变得病毒式传播,并引发恐慌-就像它曾经在“世界大战”中引起广播节目一样。 他说:“我不想做出歇斯底里的假设,但我也不认为这种担心是没有根据的。”

但是,特朗普产生的出场已经在网上走走了。 它们是语音合成器初创公司Lyrebird的产品。 该公司的联合创始人兼首席执行官Jose Sotelo坚信这种技术的存在是不可避免的,因此他和他的同事将继续开发该技术-当然不要忘记道德规范。 他确信当今最好的防御方法是提高人们对机器学习可能性的认识。 Sotelo指出:“如果您在月球上看到我的照片,几乎可以肯定地决定它们是用图形编辑器制作的。 但是,如果您听到录音时最好的朋友在谈论您的讨厌的话,您很可能会担心。 这确实是一项新技术,它给人类带来了新的挑战。”



不太可能能够阻止产生的AI内容的浪潮。 欺诈者和不诚实的政客可能会使用技术来创建误导性信息的情况。

积极的一面是,生成的AI内容还可以为社会提供巨大的服务。 Lyrebird的Sotelo梦想着他的技术将能够恢复与由于肌萎缩性侧索硬化症或癌症而失去声音的人说话的能力。 开头提到的带马和斑马的视频是改善无人驾驶车辆视野的工作的副产品。 首先在虚拟环境中训练用于此类机器的软件。 但是,像侠盗猎车手这样的世界与现实非常遥远。 Zebrification算法的创建是为了缩小虚拟环境与现实世界之间的距离,并最终使无人驾驶汽车更安全。

Source: https://habr.com/ru/post/zh-CN409153/


All Articles