具有硬件加速功能的语音识别。 专用ASIC的功耗低于8 mW


语音识别ASIC的技术规范

语音命令是控制电子设备最自然,最方便的界面。 可以想象,将来,几乎所有的电子设备都可以理解房主的命令:从公寓的灯泡到冰箱,微波炉和厨房的水壶。 连接到物联网的通用网络,这些设备不仅可以了解所有者,而且可以相互协调其行为。

近年来,语音识别技术已经达到了很高的水平,并且已经在各种商业应用中得到了成熟:汽车计算机控制,医疗保健(用于医生语音识别的数字文档)和军事用途。 例如,在意大利训练飞机M-346和美国战机F-35中,语音识别系统的准确性达到98% 。 但是,为了在家用电器和可穿戴电子设备上执行语音识别,您需要大幅度降低此接口的功耗。

麻省理工学院(MIT)信息和人工智能实验室(CSAIL)的工程师已经开始为这张未来派的图片做准备,因为周围的所有电子设备都开始理解人类的声音。 作为与Quanta Computer合作的Qmulus合作项目的一部分,麻省理工学院的研究人员开发了用于语音识别的专用微芯片(ASIC)的原型。 该芯片的独特之处在于其超低功耗:从0.2 mW到10 mW,这取决于需要识别的单词数量。 这样就可以在几乎任何设备中使用此类电子设备,甚至可以由人体供电。

成年男性体内的正常新陈代谢会产生约80瓦的热量,而训练有素的骑自行车的人会产生高达400瓦的机械能。 当然,这种功率不能用于为电子设备提供完全的动力,但是并不需要很多。 在被动模式下,很容易从人体上去除几瓦特。 例如,由于人体温度(约37°C)和周围空气(20°C)之间的差异,腕上10厘米长的小手镯连续产生约40 mW功率



如果您不戴手镯,而是穿上整个保暖外套或宽50-100厘米的壁炉,那么它将为您带来约2瓦的电力。 但是您仍然可以转换运动的动能并分解血液中的糖。 这足以为车身电子设备,衣服和最简单的配件供电。

除人体之外,低功率电子设备还可以产生能量,例如,由背景无线电波(微波,无线电,WiFi等),窗户和地板的振动等产生能量。

普通的普通智能手机不太可能使用从人体或以太收集的能量。 根据开发人员的说法,在常规移动硬件上的智能手机上的语音识别程序将拉大约1W。 好多 在实际条件下使用专用的MIT芯片和Quanta Computer意味着节能90-99%。 最重要的是,这种低功耗设备极大地扩展了语音识别的范围。 现在,它不仅可以在智能手机或昂贵的电子设备中实现,而且可以在最常见的周围物体中实现,甚至在浴室镜子中也可以实现。

如果您从环境中收集能量,则此类设备将根本不需要更换电池。 如果仍为电池供电以确保可靠性,则一次充电足以维持数月或数年。

麻省理工学院和Quanta Computer的联合项目Qmulus始于2005年,当时被称为T-Party。 开发人员建议,随着物联网的普及,计算机芯片将被嵌入到各种物体中,甚至包括在宠物和牛中,以应对牲畜并监视其状况。 Microchip不断收集信息并将其实时发送到中央服务器。

也许语音识别芯片可以内置在宠物项圈中-例如,语音命令可以向项圈发送微弱的电脉冲,刺激宠物执行一个或另一个动作。 但是,没有芯片的宠物非常了解主人的声音命令,因此这种发明在其他领域更有用。

麻省理工学院电气工程学教授Anantha Chandrakasan 说: “语音命令将成为可穿戴和智能设备的自然界面。” -此类设备的小型化将需要键盘以外的其他接口。 与在云中执行此操作相比,在本地集成语音识别功能,降低系统功耗至关重要。”

设计的ASIC的识别精度与具有14.5万个单词的字典的商业Kaldi软件大致相同,并且在80 MHz的时钟频率下,微电路的性能(在词汇晶格中搜索单词的速度)大约与具有Xeon处理器且时钟频率为3的计算机的性能相对应, 7 GHz。



下表显示了连续语音识别质量(WER)和ASIC功耗。
挑战赛词汇量频次内存交换er耗电量
人物113兆赫0.11 MB /秒1.65%172兆瓦
天气2k23兆赫10.1 MB /秒4.38%4.70毫瓦
食物日记7k46兆赫9.02 MB /秒8.57%4.67兆瓦
新闻(1)5千15兆赫4.84 MB /秒3.12%1.78兆瓦
新闻(2)14.5万40兆赫15.0 MB /秒8.78%7.78兆瓦
上周在国际固态电路会议 上, 发表了科学文章“具有深层神经网络声学模型和语音激活功率门控功能的可扩展语音识别器”,并对该芯片进行了描述。

Source: https://habr.com/ru/post/zh-CN401503/


All Articles