Office 365和其他MS产品将为阅读困难添加语音I / O



昨天, Microsoft教育团队博客上发布了一个广泛的条目,其中提供了Office 365产品套件的语音助手以及许多其他产品更新。 首先,我们正在谈论将Dictation for Office 365桌面应用程序功能添加到面向学生的Office 365产品的网络版本中,以及在Android上发布Office Lens,以前仅对iOS用户可用。 这不是Microsoft提供的所有“好东西”的完整列表。 所有这些活动都是与阅读障碍症Made Dyslexia)共同进行的,该技术巨头计划在其中为患有阅读障碍症的学生和学生制作教材和手册。

MS Education Team出版物的重要性还在于,它清楚地表明了该公司活动的优先重点之一,也是最重要的潜在竞争领域-语音输入系统的开发和所有现有生态系统在用户设备上的文本识别,更多是在猫下。 在这里,我们将简短地讨论没有市场热情的Microsoft新产品,并讨论正在发生的事情以及为什么一旦“主要邪恶的公司”突然在培养年轻一代的领域中走到了最前沿。

根据Microsoft员工引用的统计数据 ,几乎五分之一的学生(根据其他来源-高达15%)患有某种形式的阅读障碍 -在不损害学习能力的情况下选择性损害识别部分文字或独立书写的能力。 阅读障碍经常伴有ADHD(您可以在Habr的第一手资料中阅读)。 实际上,患有阅读障碍的人具有正常的智力,他们可以而且经常想学习,但是由于自己大脑的特征,他们无法做到这一点。 阅读障碍不是我们通常的脑疾病,因此无法得到治疗。 也就是说,现代社会的阅读障碍是一种残疾。 对于遭受这种疾病折磨的人们,他们制定了特殊的培训计划,尽管如此,在某种程度上,它们限制了他们使用信息的可能性。 这类用户被称为公司新产品的主要目标受众。

如上文所述,Microsoft将其Office 365的听写功能从应用程序迁移到Word Online和OneNote Online的Web附件,它们可以在任何现代浏览器下运行(是的,与Edge固定功能的预期捕获并未发生,但更多稍后)。



上市的第二个重要产品是沉浸式阅读器。 此开发组织了使用数学公式逐行阅读文本的方式,以促进对此类混合文本的理解:



所有这一切将与公司的另一种培训产品Math Pane结合使用。 沉浸式阅读器将在最近收购的 Microsoft教育平台Flipgrid上提供,该公司已于今年7月购买并转为免费基础。 Microsoft产品的这种发展方向旨在对抗特定类型的阅读障碍-dyscalculia ,在这种情况下,有困难的人可以从视觉上感知数学表达式和公式。 该疾病源于大脑无法一目了然地估算对象的数量,即无需重新计算。 像诵读困难一样,诵读困难不会影响智力的一般水平,但会限制人的发展方向和日常工作。

此外,这次Immersive Reader将与Office Lens一起迁移到Andoid,后者可捕获和数字化打印的文本。 以前,该产品仅适用于iOS。



上面描述的所有“阅读器”都不仅限于英语,并且有广泛的受支持语言列表,包括俄语( 请参见此处 )。 Edge也没有绕过创新。 Microsoft在其浏览器中嵌入了ePub和PDF文件的字典,以及新的逐行文本查看模式。

这是怎么回事?


如果您不关注Microsoft的活动或仅在查看E3上的xBox演示的一部分时才与公司的新闻联系,那么很自然地您的反应可能是这样的:



显而易见,微软打算偿还前几年的业力债务(至少对IE6的编码员应有之多),并正在积极扩大其在教育和开源领域的影响力。

除了Linux Foundation的白金会员资格外 ,该公司还积极为各级教育机构开发集成解决方案。 而且,如果10到15年前这个过程开始于销售计算机课程的许可证包,那么现在Microsoft为学校和高等教育机构提供基于Windows 10和Office 365的集成软件和硬件解决方案。客观上,这个市场的规模和资源可比微软没有竞争对手。 潜在地,只有亚马逊和苹果可以与巨人竞争,但是两家公司都专注于其他市场领域,对像微软这样的教育领域不感兴趣。

在上一个演示文稿中,重要的一点是,微软提供的新产品的很大一部分将在10月底免费提供。 尽管该项目最初是商业性质的,但Microsoft还是购买了相同的Flipgrid,并将其转移到免费的基础上。 此外,沉浸式阅读功能至少在Word Online(“查看”选项卡)中成功存在,并且在俄语中阅读效果很好。

不要忘记,如果正确实施,作为Microsoft教育计划的一部分提供的产品和功能将拥有美好的未来。 迄今为止,市场上还没有实现一种任意的体面而又简单的解决方案,用于将口述文本翻译成书面形式。 唯一需要注意的是,口头语言通常比书面文本简单得多。 现在,微软正在朝相反的方向努力,特别是针对阅读障碍,他们正在开发算法,将复杂的书面文本简化到一个更简单的级别,以促进他们的听力理解。 如果该公司将来能够将这些工作扩展到180度,并教语音输入系统将口头语音“提高”到书面语音可以接受的水平,那么这绝对是一个突破。

该系统的另一个应用领域是将语音消息转换为文本,作为即时通讯工具中通信的一部分。 该系统的雏形是几年前在Skype(同声翻译系统)框架中进行测试的,但是由于其复杂性,它的分布不正确。 另一方面,语音消息现在在社交网络或电报中极为普遍,但是出于某些原因,部分观众只是拒绝使用它们。 例如,因为仅对于参加方“发送”语音消息很方便,但是“接收”音频记录却花费了大量时间来收听。 很难说,但是语音转文字功能甚至可以使Skype痛苦不已(当然,经过认真处理和减轻该产品的负担)。

Source: https://habr.com/ru/post/zh-CN426609/


All Articles