麻省理工学院开发了一种新型的界面,可让您将“思想”转化为声音


新型接口的开发者之一Arnav Kapoor演示了该设备的操作

麻省理工学院的工程师创建了一个系统 ,可以将自说出的单词和句子转录为文本。 为了使系统成功运行,其载体需要自己清楚地发音单词和短语。 在这种情况下,负责说话的脸部,喉咙和舌头的肌肉开始起作用。 它们不能全力工作,而只能激活,这足以使新系统“读取”。

从外部看起来像这样-一个人只是保持沉默,系统“说话”,或者说是打印。 该开发包括两个部分:必须戴在脸上的小工具和经过专门“训练”的神经网络,该网络分析接收到的信息并将其与字母和单词相关联。 此外,该界面还允许您控制小工具-在电视上切换频道,跟踪费用并保持正常活动。

要戴在耳朵上的小工具包括“骨头耳机”,即将声音沿骨头传导到内耳的耳机。 外部通道保持打开状态,一个人听到周围发生的一切。

这样的系统是非常便携式的,并且适合在街道上和在家中佩戴。 一些使用它的方法是不寻常的。 例如,您可以下棋,与自己聊天,了解敌人的动作并从计算机获得帮助。

您不仅可以将开发内容用于有身体问题的人,还可以用于各种情况下的普通用户。 开发人员的任务是创建一个可以提高一个人的能力,补充他的才智和某种意义上的感官的系统。

项目参与者之一佩蒂·梅斯(Petty Maes)说:“没有智能手机和其他数字设备,我们将无法生存。” “但是使用这些小工具会阻止我们,因此必须中断才能与它们一起使用。 例如,进行对话,突然之间需要使用电话。 您需要找到它,拿起它,输入密码并打开应用程序。 因此,我和我的学生很长时间都在尝试新型系统及其外形,这使人们能够充分利用现代技术和服务而不会被小工具分散注意力。”

结果在计算机协会ACM智能用户界面会议上进行了报告。

从原则上讲,科学家提出的想法并不是什么新鲜事。 它出现在19世纪的某个地方,随着新技术的出现,他们开始认真致力于其实施。 在60年代,开始阅读时对自己说出的短语和单词被认为是阻碍阅读速度的外部因素(实际上是)。 但是说有它的优点,它可以用于计算机接口的开发。 上面给出了一个例子。


在创建系统的过程中,科学家首先需要了解人脸上的哪些肌肉最活跃地参与了说话过程。 之后,开始了用于将“思想转换为文本”的原型设备的开发。 该系统的主要信号感应元件是16个电极。

他们作证,核对了那个男人对自己说的话。 然后,基于接收到的数据数组,开发人员开始训练神经网络。 顺便说一下,最初该设备覆盖了脸部的两侧。 但是后来发现,即使电极仅在脸部的一侧,神经网络也可以将信号转换为文本而不会出现问题。 因此,为了减小系统的大小,它被减半了。

神经网络训练开始时很小,只有20个字。 随着时间的流逝,字典增加了,神经网络变得更加“智能”。 据科学家称,它可以对任何人进行个性化设置,从而提高了对“思想”的识别准确性。 您接受的培训越多,系统将越有效。

开发人员没有计划使其完美,这只是概念验证。 该技术可用于许多领域,包括制造。 您可以想象一个工业企业,其噪声水平会干扰员工在工作问题上的正常沟通。 在这种情况下,您可以使用这样的系统。 消防员或潜水员也有类似情况。 他们无需讲话,系统会发出“想法”。

到目前为止,我们还没有在谈论技术的商业化,但是也不排除这种发展。


Source: https://habr.com/ru/post/zh-CN411651/


All Articles