Arnav Kapoor, uno de los desarrolladores de un nuevo tipo de interfaz, demuestra el funcionamiento del dispositivo.Los ingenieros del MIT
han creado un sistema que transcribe las palabras y oraciones auto-habladas en texto. Para que el sistema funcione con éxito, su operador debe pronunciar claramente palabras y frases para sí mismo. En este caso, los músculos de la cara, la garganta y la lengua responsables del habla comienzan a funcionar. No funcionan con toda su fuerza, sino que solo se activan, lo cual es suficiente para que el nuevo sistema "lea".
Desde el exterior, se ve así: una persona simplemente está en silencio, y el sistema "habla", o más bien imprime. El desarrollo consta de dos partes: un dispositivo que debe usarse en la cara y una red neuronal especialmente "entrenada", que analiza la información recibida y la asocia con letras y palabras. Además, la interfaz le permite controlar dispositivos: cambiar canales en la televisión, realizar un seguimiento de los costos y mantener una actividad bastante normal.
El dispositivo que se debe usar en el oído incluye un "auricular de hueso", es decir, un auricular que conduce el sonido a lo largo del hueso hacia el oído interno. El canal externo permanece abierto y una persona escucha todo lo que sucede a su alrededor.
Tal sistema es muy portátil y adecuado para usar tanto en la calle como en el hogar. Algunas formas de usarlo son inusuales. Por ejemplo, puedes jugar ajedrez, hablar contigo mismo sobre los movimientos del enemigo y obtener ayuda de la computadora.
Puede utilizar el desarrollo no solo para personas con problemas físicos, sino también para usuarios comunes en una variedad de situaciones. La tarea de los desarrolladores era crear un sistema que pudiera mejorar las habilidades de una persona, complementar su intelecto y, de alguna manera, sus sentidos.
"Ya no podemos vivir sin teléfonos inteligentes y otros dispositivos digitales", dice Petty Maes, una de las participantes del proyecto. “Pero el uso de estos gadgets nos impide, es necesario interrumpir para poder trabajar con ellos. Por ejemplo, hay una conversación y, de repente, es necesario usar el teléfono. Necesita encontrarlo, recogerlo, ingresar la contraseña y abrir la aplicación. Por lo tanto, mis alumnos y yo experimentamos con nuevos tipos de sistemas y sus factores de forma durante mucho tiempo, lo que permite a las personas aprovechar las tecnologías y servicios modernos sin ser distraídos por los dispositivos, de hecho ”.
Los resultados se informaron en la conferencia de la Interfaz de usuario inteligente ACM de la Association for Computing Machinery.
En principio, la idea propuesta por los científicos no es nueva. Apareció en algún lugar del siglo XIX, y con el advenimiento de las nuevas tecnologías, comenzaron a trabajar seriamente en su implementación. En los años 60, hablar las frases y palabras para uno mismo mientras leía comenzó a considerarse un factor externo que dificulta la velocidad de lectura (de hecho, lo es). Pero hablar tiene sus ventajas, se puede utilizar en el desarrollo de interfaces informáticas. Un ejemplo fue dado anteriormente.
En el proceso de creación del sistema, los científicos primero necesitaban comprender qué músculos de la cara de la persona participan más activamente en el proceso de hablar. Después de eso, comenzó el desarrollo de un dispositivo prototipo para convertir "pensamientos en texto". El principal elemento sensor del sistema era 16 electrodos.
Tomaron testimonios y verificaron lo que el hombre se dijo a sí mismo. Luego, según la matriz de datos recibida, los desarrolladores comenzaron a entrenar la red neuronal. Por cierto, inicialmente el dispositivo cubría ambos lados de la cara. Pero luego resultó que la red neuronal convierte las señales en texto sin problemas, incluso si los electrodos están solo en un lado de la cara. Por lo tanto, para reducir el tamaño del sistema, se redujo a la mitad.
El entrenamiento de la red neuronal comenzó en pequeño, con solo 20 palabras. Con el tiempo, el diccionario se incrementó y la red neuronal se volvió más "inteligente". Según los científicos, se puede personalizar para cualquier persona, lo que aumenta la precisión del reconocimiento de los "pensamientos". Cuanta más capacitación tenga, mejor funcionará el sistema.
Los desarrolladores no tenían planes de llevarlo a la perfección, esto es solo una prueba de concepto. La tecnología se puede utilizar en muchos campos, incluida la fabricación. Puede imaginar una empresa industrial, el nivel de ruido en el que interfiere con la comunicación normal de los empleados sobre cuestiones laborales. En este caso, puede usar dicho sistema. Una situación similar es con bomberos o buzos. No necesitarán hablar, el sistema expresará "pensamientos".
Hasta ahora, no estamos hablando de la comercialización de tecnología, pero ese desarrollo tampoco está excluido.

