眼对眼视频通讯:试图解决眼神交流不足的问题


我们的计算机,智能手机和平板电脑内置了针对用户的便携式摄像机。 视频聊天和视频会议(一对一,多对多,多对多)已经在企业和普通人中变得司空见惯,而且我认为我们大多数人都同意,这种联系比仅使用声音的普通对话要好得多。 观察他人的面孔可以丰富对话并增加对话的满意度。 但是,我对与当前视频连接相关的一项功能感到恼火:对话参与者无法看到对方的眼睛。 《星际迷航》中没有这样的问题,这个宇宙当然是我所有技术期望的来源。

边说边看着我


如果您使用视频聊天,您可能理解我的意思。 面对您的相机位于屏幕上方(有时位于屏幕下方或侧面)。 这意味着您在屏幕上看到的角度与摄像头(和对话者)看到您的角度不同-这种效果称为视差[或不是; 视差的定义是物体相对于远处背景的视在位置的变化,视观察者的位置而定。 翻译]。 对话者的印象是,只有当您看着镜头时,您才能看到他的眼睛。 因此,当您在屏幕上看到朋友的图像时,在他看来他在向下看(或朝着不同的方向,但没有看着您),并且您在朋友的屏幕上看起来完全一样。 当然,您可以将摄像头直接放在屏幕的前面,但是摄像头会关闭对话者的图像。

进行眼神交流对于进行有意义的对话非常重要,最后,使用视频而不是音频的全部目的是看待与您交谈的人。 但是,如果您看不到别人的眼睛,则可以消除视频通话比常规通话带来的大部分好处。 有效的业务沟通指示通常说,您应该在交谈时看着摄像机,以便另一端的人给您留下直接与他们交谈的印象。 但这是不自然的,它不允许您看到他们对您的讲话的反应。 实际上,我们确实需要在联合会的宇宙飞船上发生什么事情:视频屏幕与摄像头同时工作,以便当您观看屏幕时,从另一侧看您的眼睛将是相同的。 自然,工程师已经在多个方向上努力达到这种效果。

全部关于镜子


在视频通话期间保持眼神交流的一种相当简单的方法是使用从电视行业借来的技术: 提词提示器 。 如果您在电视上观看新闻,您会发现播音员正在直接注视摄像机。 播音员不学习他们的故​​事; 他们从特殊的视频屏幕中读取它们,该屏幕似乎出现在相机的正前方。 实际上,屏幕(普通的平板)从下方朝上位于摄像头的正面,并且其文字以镜像显示。 在此屏幕上方,与摄像头正成45°角的是部分镀银(或双面)镜。 播音员看到他在下面的文字的倒影,而相机仅看到播音员。



提词提示器-简单,久经考验的技术; 他们已经存在了60多年。 当此类设备用于视频通信时,有时也称为视频隧道。 但是它们有某些问题。 一个问题是尺寸:设备本质上是相当笨重的,因为它需要在相机前面安装一个倾斜的镜子,以及特殊的防止眩光的镜头。 提词提示器通常也很笨重,脆弱且昂贵-所有这些因素使它们对普通消费者没有吸引力。

我有一个ProPrompter Desktop设备,其价格仅为“ 500美元”,可以在计算机(台式机或笔记本电脑)或平板电脑上佩戴。 实际上,这是一个微型提词机,并且视频的排列方式可以使对话者的图像(而不是要阅读的文本)直接位于相机的前面。 它很麻烦,但是可以工作,当我在大型团体面前进行远程视频演示或以脚本录制视频时,它很有用。

无论您是否使用提词提示器-如果有两个以上的人参加视频对话,都会出现另一个问题。 如果我直接看摄像机,那么对于所有在屏幕上看到我的人来说,即使他们分散在不同的地方,我似乎也在与他们进行目光接触。 这样,当我将注意力从一个人转移到另一个人时,参与者将不会有我的眼睛在动的印象-而且我无法说出屏幕上是谁在看着我(或看着我的图像)。 位于安大略省金斯顿女王大学的GAZE-2系统正在尝试通过在视频隧道中使用多个摄像头以及一个针对计算机认为用户的视线指向的附加摄像头来解决此问题; 该软件将切换到最靠近用户凝视的相机,并在另一端旋转图像以匹配发生的情况。

存在的影响


MAJIC系统是1996年东京庆应义University大学开发的另一种解决确定注视方向问题的方法。 她用大而薄的穿孔材料制成的弧形屏幕代替了提词提示器的双面镜,该屏幕在一侧提供了反射表面,而在另一侧则提供了大部分透明的表面。 屏幕后面的摄像机将谈话的参与者记录在一个地方,普通的视频投影仪在屏幕上显示其他参与者(位于一个或多个地方)的图像。 MAJIC的一个独特功能是,在屏幕上每个人的图像后面,每个人都有一个较小的摄像头,可以与那个人在那个地方的虚拟眼睛一起工作(并与扬声器一起播放声音)。 最后,似乎每个人都总是看着他当前转过的对话中的那个参与者,甚至有可能看到对话中的一个参与者何时看着另一个参与者。 另一个优点是:与实物大小一样的投影让人感觉实际上坐在彼此相对的桌子上。 不幸的是,据我所知,该系统从未售出,鉴于其体积庞大和设备成本不足为奇。

十年后,出现了该系统的更为紧凑的版本。 2006年1月,苹果公司获得了一项对眼视频系统的专利,该系统在显示器中内置了许多微型(实际上是不可见的)照相机以及显示元件。 然后该软件将所有成千上万的图像合并为一个。 这将产生类似于MAJIC建议的效果。 时间会告诉消费者何时或以何种形式提供类似技术。

惠普, 微软和AT&T等大型公司的研究人员正在研究另一种可能更有前途的方法,即凝视校正 。 这一切都始于在常规显示器旁边安装一两个普通摄像机。 特殊的视频处理器可以实时数字化地改变每个人的脸部图像,即使他的眼睛没有直视,他的眼睛也似乎直接注视着相机。 在早期的演示中,这些系统看起来或多或少令人信服-尽管有些令人恐惧-但它们尚未准备好用于商业用途。 而且,它们还不能适应与许多参与者集中在一处的令人满意的工作,或与几个远程参与者之一进行选择性眼神交流。


进步不会一直停下来,这是很好的,但是鉴于当今计算设备的强大计算能力,令我感到惊讶和失望的是,到目前为止,还没有任何软件工具可用于纠正所有人的目光。 令人讨厌的是,以前已经存在过这样的工具-一个名为CatchEye的Windows应用程序,可与Skype,Google Hangouts,Facebook Messenger和其他产品一起使用。 但是,他于2017年被逐出市场,没有任何解释。 我想发生这种情况是因为开发人员被苹果或微软等大型公司收购,并且正在努力将这一机会提供给大众,但我可能太乐观了。 如果我能直视技术巨头...

Source: https://habr.com/ru/post/zh-CN459022/


All Articles