
Ayer se
publicó una extensa publicación en el blog del
Equipo de Educación de Microsoft que presenta el asistente de voz para el conjunto de productos de Office 365, así como una serie de otras actualizaciones de productos. En primer lugar, estamos hablando de agregar las funciones de Dictado para aplicaciones de escritorio de Office 365 a la versión web de los productos de Office 365 para estudiantes, así como el lanzamiento de Office Lens en Android, que anteriormente solo estaba disponible para usuarios de iOS. Y esta no es una lista completa de todos los "productos" de Microsoft. Todas estas actividades se llevan a cabo conjuntamente con
Made Dyslexia , en la que el gigante de la tecnología planea crear materiales didácticos y manuales para alumnos y estudiantes que sufren de dislexia.
La importancia de la publicación del equipo de educación de MS también radica en el hecho de que muestra claramente una de las áreas prioritarias y, lo que es más importante, potencialmente competitivas de la actividad de la empresa: el desarrollo de sistemas de entrada de voz y reconocimiento de texto en los dispositivos de los usuarios para todos los ecosistemas existentes, más sobre lo que está bajo el corte. Allí hablaremos brevemente sobre los nuevos productos de Microsoft sin entusiasmo por el marketing y discutiremos lo que está sucediendo y por qué una vez que la "corporación malvada principal" de repente se encontró a la vanguardia en el campo de la capacitación de la generación más joven.
Según las
estadísticas citadas por los empleados de Microsoft, casi uno de cada cinco estudiantes (según otras fuentes, hasta un 15%) padece alguna forma de
dislexia , un deterioro selectivo de la capacidad de reconocer partes de un texto escrito o escribir de forma independiente, sin afectar la capacidad de aprendizaje. A menudo, la dislexia está acompañada de TDAH (que puede
leer aquí de primera mano de Habr). De hecho, las personas con dislexia tienen un intelecto normal, pueden y a menudo quieren aprender, pero no pueden hacerlo debido a las características de su propio cerebro. La dislexia no es una enfermedad cerebral en nuestra forma habitual y, por lo tanto, no se trata. Es decir, la dislexia en la sociedad moderna es una forma de discapacidad. Para las personas que lo padecen, se elaboran programas de capacitación especiales que, en un grado u otro, los limitan a las posibilidades de consumir información. Esta categoría de usuarios se llama el público objetivo principal de los nuevos productos de la empresa.
Como dijimos anteriormente, Microsoft mueve su Dictado para Office 365 de la aplicación al complemento web para Word Online y OneNote Online, que funcionará en cualquier navegador moderno (sí, la captura esperada con la funcionalidad clavada a Edge no sucedió, pero más sobre eso luego)

El segundo producto importante que se hace público es Immersive Reader. Este desarrollo organiza la lectura de texto línea por línea con fórmulas matemáticas para facilitar la percepción de dicho texto mixto:

Todo esto funcionará en conjunto con
Math Pane , otro producto de capacitación de la compañía. Immersive Reader estará disponible en la
recientemente adquirida plataforma educativa de Microsoft Flipgrid, que la compañía compró en julio de este año y la transfirió a una base gratuita. Este vector de desarrollo de productos de Microsoft está dirigido a combatir un tipo específico de dislexia: la
discalculia , en presencia de la cual una persona con dificultad percibe visualmente expresiones y fórmulas matemáticas. Esta enfermedad proviene de la incapacidad del cerebro para estimar el número de objetos de un vistazo, es decir, sin contarlos. Como en el caso de la dislexia, la discalculia no afecta el nivel general de inteligencia, pero limita a una persona en las direcciones del desarrollo y los aspectos cotidianos.
Además, Immersive Reader migrará a Andoid, esta vez junto con Office Lens, que proporciona captura y digitalización de texto impreso. Anteriormente, el producto solo estaba disponible para iOS.

Todos los "lectores" descritos anteriormente no se limitan al inglés y tienen una extensa lista de idiomas admitidos, incluido el ruso (
ver aquí ). Edge tampoco pasó por alto la innovación. Microsoft incorpora un diccionario para archivos ePub y PDF en su navegador, así como un nuevo modo de visualización de texto línea por línea.
Que diablos esta pasando
Si no sigue las actividades de Microsoft o está en contacto con las noticias de la compañía solo como parte de la presentación de xBox en E3, entonces es bastante natural que su reacción sea algo como esto:

Existe la clara sensación de que Microsoft tiene la intención de pagar sus deudas kármicas por los años anteriores de trabajo (y al menos le debían mucho a los codificadores por IE6), y está expandiendo activamente su presencia en las esferas educativas y de código abierto.
Además de
la membresía platino en la Fundación Linux , la corporación está desarrollando activamente soluciones integradas para instituciones educativas en todos los niveles de la educación. Además, si hace 10-15 años este proceso comenzó con la venta de paquetes de licencias para clases de computación, ahora Microsoft ofrece a las escuelas e instituciones de educación superior soluciones integradas de software y hardware basadas en Windows 10 y Office 365. Objetivamente, este mercado es comparable en tamaño y recursos Microsoft no tiene competidor. Potencialmente, solo Amazon y Apple pueden competir con el gigante, pero ambas compañías se están concentrando en otros segmentos del mercado y no están interesadas en el segmento educativo como Microsoft.
En la última presentación, es importante que una parte importante de los nuevos productos presentados por Microsoft esté disponible a fines de octubre y de forma gratuita. Microsoft compró el mismo Flipgrid y lo transfirió a una base gratuita, aunque inicialmente el proyecto era de naturaleza comercial. Además, la función de lectura inmersiva existe con éxito al menos en Word Online (la pestaña "Ver") y se lee bien en ruso.
No olvide que los productos y funciones presentados como parte de los programas educativos de Microsoft, si se implementan correctamente, tienen un gran futuro. Hasta ahora, no se ha implementado en el mercado una solución arbitrariamente decente y simple para traducir el texto dictado a una forma escrita. La única advertencia: el lenguaje hablado es a menudo mucho más simple que el texto escrito. Ahora Microsoft está trabajando en la dirección opuesta, y especialmente para los disléxicos, están desarrollando algoritmos que simplificarían los textos escritos complejos a un nivel más simple para facilitar su comprensión auditiva. Si la corporación podrá expandir estos trabajos 180 grados en el futuro y enseñar sistemas de entrada de voz para "ennoblecer" el habla oral a un nivel aceptable para el habla escrita, esto definitivamente será un gran avance.
Otra área de aplicación del sistema es la conversión de mensajes de voz en texto como parte de la comunicación en mensajería instantánea. El embrión de este sistema se probó hace varios años en el marco de Skype (sistema de traducción simultánea), pero debido a su complejidad no se distribuyó correctamente. Por otro lado, los mensajes de voz ahora son extremadamente comunes en las redes sociales o Telegram, pero parte de la audiencia simplemente se niega a usarlos por varias razones. Por ejemplo, porque es conveniente solo para la parte que "envía" un mensaje de voz, pero la grabación de audio "que recibe" pasa mucho tiempo escuchando. Es aterrador decirlo, pero la función de voz a texto podría incluso dar nueva vida a la agonía de Skype (después de un procesamiento serio y un alivio de este producto, por supuesto).