
Ontem, foi
publicada uma postagem extensa no blog da
Equipe de Educação da
Microsoft que apresenta o assistente de voz para o conjunto de produtos do Office 365, além de várias outras atualizações de produtos. Antes de tudo, estamos falando de adicionar os recursos Dictation for Office 365 Desktop Apps à versão web dos produtos Office 365 para estudantes, bem como o lançamento do Office Lens no Android, que anteriormente estava disponível apenas para usuários do iOS. E esta não é uma lista completa de todos os "presentes" da Microsoft. Todas essas atividades são realizadas em conjunto com a
Dislexia Made , na qual a gigante da tecnologia planeja criar materiais e manuais de ensino para alunos e alunos que sofrem de dislexia.
A importância da publicação da Equipe de Educação da MS também reside no fato de que ela mostra claramente uma das áreas prioritárias e mais importantes potencialmente competitivas da atividade da empresa - o desenvolvimento de sistemas de entrada de voz e reconhecimento de texto em dispositivos do usuário para todos os ecossistemas existentes, mais sobre o que é sob o gato. Lá, falaremos brevemente sobre novos produtos da Microsoft sem entusiasmo de marketing e discutiremos o que está acontecendo e por que uma vez a “principal corporação do mal” de repente se viu na vanguarda no campo de treinamento da geração mais jovem.
De acordo com as
estatísticas citadas pelos funcionários da Microsoft, quase um em cada cinco alunos (segundo outras fontes - até 15%) sofre de alguma forma de
dislexia - comprometimento seletivo da capacidade de reconhecer partes de um texto escrito ou escrever de forma independente, sem prejudicar a capacidade de aprendizado. Muitas vezes, a dislexia é acompanhada de TDAH (sobre o qual você pode
ler aqui em primeira mão). De fato, as pessoas com dislexia têm um intelecto normal, podem e muitas vezes querem aprender, mas não conseguem fazer isso por causa das características de seu próprio cérebro. A dislexia não é uma doença cerebral em nossa forma usual e, portanto, não é tratada. Ou seja, a dislexia na sociedade moderna é uma forma de incapacidade. Para as pessoas que sofrem com isso, são elaborados programas especiais de treinamento que, em um grau ou outro, no entanto, os limitam às possibilidades de consumo de informações. Essa categoria de usuários é chamada de público-alvo principal de novos produtos da empresa.
Como dissemos acima, a Microsoft leva seu Ditado para o Office 365 do aplicativo para o complemento da Web para o Word Online e o OneNote Online, que funcionará em qualquer navegador moderno (sim, a captura esperada com a funcionalidade de unha do Edge não aconteceu, mas mais sobre isso depois).

O segundo produto importante que se torna público é o Immersive Reader. Esse desenvolvimento organiza a leitura linha a linha do texto com fórmulas matemáticas para facilitar a percepção desse texto misto:

Tudo isso funcionará em conjunto com o
Math Pane , outro produto de treinamento da empresa. O Immersive Reader estará disponível na plataforma educacional Microsoft
recém-adquirida Flipgrid, que a empresa comprou em julho deste ano e transferiu para uma base gratuita. Esse vetor de desenvolvimento de produtos da Microsoft visa combater um tipo específico de dislexia -
discalculia , na presença de uma pessoa com dificuldade percebida visualmente expressões e fórmulas matemáticas. Essa doença decorre da incapacidade do cérebro de estimar rapidamente o número de objetos, ou seja, sem recontar. Como no caso da dislexia, a discalculia não afeta o nível geral de inteligência, mas limita a pessoa nas direções do desenvolvimento e nos aspectos cotidianos.
Além disso, o Immersive Reader migrará para o Andoid, desta vez em conjunto com o Office Lens - que fornece captura e digitalização de texto impresso. Anteriormente, o produto estava disponível apenas para iOS.

Todos os "leitores" descritos acima não se limitam ao inglês e possuem uma extensa lista de idiomas suportados, incluindo russo (
veja aqui ). O Edge também não ignorou a inovação. A Microsoft incorpora um dicionário para arquivos ePub e PDF em seu navegador, bem como um novo modo de exibição de texto linha por linha.
Que diabos está acontecendo?
Se você não seguir as atividades da Microsoft ou entrar em contato com as notícias da empresa apenas como parte da exibição da apresentação do xBox no E3, é bastante natural que sua reação seja algo como isto:

Há um sentimento claro de que a Microsoft pretende pagar suas dívidas cármicas pelos anos anteriores de trabalho (e pelo menos eles deviam muito aos codificadores do IE6) e está expandindo ativamente sua presença nas esferas educacional e de código aberto.
Além da
associação de platina à Linux Foundation , a corporação está desenvolvendo ativamente soluções integradas para instituições de ensino em todos os níveis de ensino. Além disso, se há 10 a 15 anos, esse processo começou com a venda de pacotes de licenças para aulas de informática, agora a Microsoft oferece às escolas e instituições de ensino superior soluções integradas de software e hardware baseadas no Windows 10 e Office 365. Objetivamente, esse mercado é comparável em tamanho e recursos. A Microsoft não tem concorrente. Potencialmente, apenas Amazon e Apple podem competir com o gigante, mas ambas as empresas estão se concentrando em outros segmentos de mercado e não estão interessadas no segmento educacional, como a Microsoft.
Na última apresentação, é importante que uma parte significativa dos novos produtos apresentados pela Microsoft esteja disponível até o final de outubro e de graça. O mesmo Flipgrid foi comprado pela Microsoft e transferido para uma base gratuita, embora inicialmente o projeto tenha natureza comercial. Além disso, a função de leitura imersiva existe com êxito pelo menos no Word Online (a guia "Visualizar") e lê bem em russo.
Não esqueça que os produtos e funções apresentados como parte dos programas educacionais da Microsoft, se implementados corretamente, têm um grande futuro. Até agora, uma solução arbitrariamente decente e simples para traduzir o texto ditado em uma forma escrita não foi implementada no mercado. O único idioma falado por ressalvas é geralmente muito mais simples que o texto escrito. Agora, a Microsoft está trabalhando na direção oposta e, especialmente para os disléxicos, eles estão desenvolvendo algoritmos que simplificariam textos escritos complexos para um nível mais simples, a fim de facilitar a compreensão auditiva. Se a empresa conseguir expandir esses trabalhos 180 graus no futuro e ensinar os sistemas de entrada de voz a "enobrecer" a fala oral a um nível aceitável para a escrita, isso será definitivamente um avanço.
Outra área de aplicação do sistema é a conversão de mensagens de voz em texto como parte da comunicação em mensagens instantâneas. O embrião desse sistema foi testado há vários anos no âmbito do Skype (sistema de tradução simultânea), mas devido à sua complexidade, ele não foi distribuído adequadamente. Por outro lado, as mensagens de voz agora são extremamente comuns nas redes sociais ou no Telegram, mas parte da platéia simplesmente se recusa a usá-las por vários motivos. Por exemplo, porque é conveniente apenas para a parte que "envia" uma mensagem de voz, mas a gravação de áudio "que recebe" gasta um tempo considerável ouvindo. É assustador dizer, mas a função Voice-to-Text poderia até dar uma nova vida ao agonizante Skype (após um sério processamento e iluminação deste produto, é claro).