Le MIT a développé un nouveau type d'interface qui vous permet de transformer des «pensées» en voix


Arnav Kapoor, l'un des développeurs d'un nouveau type d'interface, démontre le fonctionnement de l'appareil

Les ingénieurs du MIT ont créé un système qui transcrit les mots et les phrases auto-prononcés en texte. Pour que le système fonctionne correctement, son transporteur doit se prononcer clairement les mots et les phrases. Dans ce cas, les muscles du visage, de la gorge et de la langue qui sont responsables de la parole commencent à fonctionner. Ils ne fonctionnent pas à pleine puissance, mais seulement s'activent, ce qui est assez suffisant pour que le nouveau système "lise".

De l'extérieur, cela ressemble à ceci - une personne est simplement silencieuse, et le système «parle», ou plutôt imprime. Le développement se compose de deux parties: un gadget à porter sur le visage et un réseau neuronal spécialement «formé», qui analyse les informations reçues et les associe à des lettres et des mots. De plus, l'interface vous permet de contrôler les gadgets - de changer de chaîne sur le téléviseur, de suivre les coûts et de maintenir une activité tout à fait normale.

Le gadget à porter sur l'oreille comprend un «écouteur en os», c'est-à-dire un écouteur qui conduit le son le long de l'os jusqu'à l'oreille interne. Le canal externe reste ouvert et une personne entend tout ce qui se passe autour.

Un tel système est très portable et adapté pour être porté à la fois dans la rue et à la maison. Certaines façons de l'utiliser sont inhabituelles. Par exemple, vous pouvez jouer aux échecs, vous parler des mouvements de l'ennemi et obtenir de l'aide de l'ordinateur.

Vous pouvez utiliser le développement non seulement pour les personnes ayant des problèmes physiques, mais aussi pour les utilisateurs ordinaires dans diverses situations. La tâche des développeurs était de créer un système capable d'améliorer les capacités d'une personne, de compléter son intellect et, d'une certaine manière, ses sens.

«Nous ne pouvons plus vivre sans smartphones et autres appareils numériques», explique Petty Maes, l'une des participantes au projet. «Mais l'utilisation de ces gadgets nous empêche, il faut les interrompre pour travailler avec eux. Par exemple, il y a une conversation et soudain, il est nécessaire d'utiliser le téléphone. Vous devez le trouver, le récupérer, saisir le mot de passe et ouvrir l'application. Par conséquent, mes étudiants et moi avons expérimenté de nouveaux types de systèmes et leurs facteurs de forme pendant longtemps, ce qui permet aux gens de profiter des technologies et des services modernes sans se laisser distraire par les gadgets, en fait. »

Les résultats ont été rapportés lors de la conférence ACM Intelligent User Interface de l'Association for Computing Machinery.

En principe, l'idée proposée par les scientifiques n'est pas nouvelle. Il est apparu quelque part au 19ème siècle et avec l'avènement des nouvelles technologies, ils ont commencé à travailler sérieusement à sa mise en œuvre. Dans les années 60, parler les phrases et les mots à soi-même pendant la lecture a commencé à être considéré comme un facteur externe qui entrave la vitesse de lecture (en fait, c'est le cas). Mais parler a ses avantages, il peut être utilisé dans le développement d'interfaces informatiques. Un exemple a été donné ci-dessus.


Dans le processus de création du système, les scientifiques devaient d'abord comprendre quels muscles du visage de la personne sont les plus activement impliqués dans le processus de parole. Après cela, le développement d'un prototype de dispositif pour convertir les «pensées en texte» a commencé. Le principal élément de détection de signal du système était 16 électrodes.

Ils ont recueilli des témoignages et vérifié ce que l'homme s'était dit. Ensuite, sur la base du tableau de données reçu, les développeurs ont commencé à former le réseau neuronal. Soit dit en passant, au départ, l'appareil couvrait les deux côtés du visage. Mais ensuite, il s'est avéré que le réseau neuronal convertit les signaux en texte sans problème même si les électrodes ne sont que d'un côté du visage. Par conséquent, pour réduire la taille du système, il a été divisé par deux.

La formation au réseau neuronal a commencé petit - avec seulement 20 mots. Au fil du temps, le dictionnaire s'est agrandi et le réseau de neurones est devenu plus «intelligent». Selon les scientifiques, il peut être personnalisé pour toute personne, augmentant ainsi la précision de reconnaissance des "pensées". Plus vous avez de formation, mieux le système fonctionnera.

Les développeurs n'avaient pas l'intention de le perfectionner, ce n'est qu'une preuve de concept. La technologie peut être utilisée dans de nombreux domaines, y compris la fabrication. Vous pouvez imaginer une entreprise industrielle dont le niveau de bruit interfère avec la communication normale des employés sur les problèmes de travail. Dans ce cas, vous pouvez utiliser un tel système. Une situation similaire est avec les pompiers ou les plongeurs. Ils n'auront pas besoin de parler, le système émettra des «pensées».

Jusqu'à présent, nous ne parlons pas de la commercialisation de la technologie, mais un tel développement n'est pas non plus exclu.


Source: https://habr.com/ru/post/fr411651/


All Articles