用于图像处理的神经网络。 Skylum Software的Alexander Savsunenko说

亚历山大·萨维森科(Alexander Savsunenko)创建智能系统已有六年之久,其中两个是纽约州立大学石溪分校的高级研究人员。 他开发了用于DNA分析,成像和营销的智能系统。

现在,亚历山大领导Skylum Software的AI实验室,在那里他从事基于神经网络的图形编辑器。 我们问他为哪个创建的服务感到特别骄傲,以及为什么在A / B测试中使用神经网络。


亚历山大,告诉我们您在纽约大学石溪分校的研究工作。 您在那里有哪些项目,它们与人工智能或机器学习有关?

不,它们与AI和机器学习没有直接关系。 我正在研究基于石墨烯的新材料。 我们开发了用于导电的3D打印新材料。 然后,使用带有两个喷嘴的打印机,可以同时打印外壳和电路板的电子线路。 我们最终创建了材料,现在可以出售。

在机器学习领域中完成了一个有趣的项目之后-Let's Enhance,这是一项提高照片质量的服务。 告诉我们您如何教机器如何恢复压缩图像。

我们以高质量拍摄图像,从图像中压缩并产生噪点,然后训练神经网络,以便它可以学习如何以高质量恢复图像。 在对这样的对进行训练之后,神经网络能够独立地提高图像质量:消除像素化,压缩伪像和其他缺陷。


照片来源

这个项目中最困难的是什么?

我想在生产中支持该系统。 当有关Mashable的文章出现在TechCrunch,Mashable中时,大量的流量流向我们,一天之内,我们处理了大约20万张图像。 我必须努力确保我们的服务器能够经受住所有这一切。

去年,发布了Let's Enhance 2.0。 里面有什么新东西?

我们改变了训练方法,损失功能,网络架构。 如果您想提高产品质量,可以不断改变这些方面。

今天的服务对象是什么? 您设法通过它获利了吗?

大约一年前,我离开了Let's Enhance.io。 之后,在2018年7月,这家初创公司进入了Techstars London计划并获得了加速器的投资。 该项目几乎立即获利并获利。

您参与了哪些AI开发? 其中哪一个特别引以为傲?

我和我的同事们有一个Titanovo营养遗传学项目,可以分析DNA。 通过机器学习,我们学会了基于全基因组分析和芯片基因分型来预测生理标记和易感性。 他们从科学文章,统计数据,形成的数据集,教学模型中收集数据,并根据这些数据为人们制定建议并预测他们的未来健康-所有这些都建立在模糊逻辑,不同分类器上。 现在有许多在营养遗传学,运动遗传学上使用AI和ML的项目。 但是我们是第一个。 这些进展的材料可以在我在Medium上的博客中找到。

我对营销团队的着陆页进行了动态优化实验,将多臂匪的理论转向了神经网络。 他制作了机器学习脚本来优化流量购买。 我现在正在做的影像工作也与人工智能有关。 我也为她感到骄傲。

您当前正在使用图像编辑服务。 这里的神经网络有什么功能?

首先,模式识别。 AI在Skylum Software的Photolemur程序中扮演着最大的角色:由于机器视觉,该程序可以一键增强照片质量。

怎么样了

我们上传了一张照片,该服务会自动对其进行改进-您只需要保存即可。 没有弹出式窗口,滑块或模式。

为此,程序首先需要识别图像的类型:肖像,风景,城市景观。 还有照片中的人物,建筑物和其他物体,一天中的时间,一年中的时间(如果照片是在大街上拍摄的)。 然后,您需要分割图像,选择相应的区域。 例如,在肖像中,面部的某些部分突出:眼睛,耳朵,鼻孔等。

然后,所有这些都需要改进,在这里不再使用人工智能。 遵循摄影师处理此类图像的方式,通过有线算法改进了图像。 例如,使皮肤光滑,增加上the的对比度,使眼睛的白色变浅。 但这都是次要的。 首先,您需要分割图像。



哪些数据库和算法用于训练系统?

说到开发神经网络的框架,我更喜欢MXNet,它是当今相当陌生的选择,但逐渐流行。 主要优点是计算速度快以及在编程神经网络的命令式和符号模式之间切换的混合模式,这很方便。 但是,我无法告诉您数据集和算法的名称,这是该项目的商业秘密。

创建智能图形编辑器时遇到什么困难?

该技术尚未成熟,神经网络经常会犯错误:在模式识别中,尤其是在涉及复杂图像时的分割中。 因此,我不得不分析结果并使用传统方法和标准算法进行编辑。 尚不可能建立一个从头到尾完全依靠神经网络来完成所有工作的系统。 好吧,当然,在使用用户终端设备时,您需要考虑网络的复杂性-CPU计算速度很慢,并非每个人都具有支持CUDA的GPU,并且OpenCL的支持也不佳。

哪种图像是最佳选择?

我们的质量保证团队致力于这一工作,并特别注意图像的最终质量。 由于我们的照片编辑器和相机都在不断变化,因此无法修复某些理想的选择,因为它在不断变化。

这些产品的受众是什么? 您是否可以“吸引” Adob​​e用户?

我们的旗舰Luminar产品是Adobe Lightroom的新替代产品。 由于团队规模较小且关系紧密,因此可以更快地将新技术引入产品并不断吸引新用户。 Luminar非常适合初学者和专业摄影师,因为它结合了一键式编辑工具和全套功能,可以对照片进行更详细的处理。


发光接口 本文比较了Luminar和Photoshop中的工作

但是Photolemur是一种独特且相当年轻的产品,它已经使用了一年多。 他的目标受众是不想了解Photoshop的所有滑块和按钮,而只是希望他们的度假照片能够快速变得美丽的人们。 我们设法找到我们的受众:销售不断,产品得到积极使用。

您还参与开发神经网络以优化目标网页的项目。 告诉我们更多有关这项工作的信息。

当您需要对目标页面进行A / B测试时,这是一项经典任务。 如果为所有可能的基本选项生成单独的页面,则它们可以生成数百万个版本。 为了使用经典方法获得具有统计意义的结果,您需要对所有这些选项进行成对的A / B测试。 这需要大量的流量。 如此大规模的测试只能为拥有大量资源的公司提供服务,例如亚马逊。

而且,如果一家小型公司想要测试许多选项,那么您可以使用与强化训练一起工作的神经网络进行A / B测试。 然后,实际上,将用元素填充页面交给神经网络,并将其分配为增加页面转换的任务。 在此版本的工作中,神经网络在服务器上旋转,并与流量如何并行学习。 最后,它更快地找到了最佳的着陆选择。

如果稍微复杂一点,那么AI将学习显示针对特定用户的个性化目标网页的版本。 因为我们还提供其他信息:浏览器,一天中的时间,操作系统。 因此,用户看到了神经网络正在向他显示的页面,并且使用这种方法的流量需要大大减少。 当然,不能保证完美的匹配,但是该页面将更快地给出良好的结果。

亚历山大将于11月14日在基辅AI大会上讨论使用神经网络进行视觉内容和登陆页面优化。 其他发言人名单和活动日程在官方网站上

Source: https://habr.com/ru/post/zh-CN426559/


All Articles