A los científicos les encanta buscar la primera mención de su ciencia. Por ejemplo, vi un artículo en el que se decía seriamente que los primeros experimentos sobre estimulación eléctrica del cerebro se llevaron a cabo en la antigua Roma, cuando alguien se sorprendió por una anguila eléctrica. De una forma u otra, generalmente, la historia de la electrofisiología se calcula generalmente a partir de los experimentos de Luigi Galvani (siglo XVIII). En esta serie de artículos trataremos de contar una pequeña parte de lo que la ciencia ha aprendido en los últimos 300 años sobre la actividad eléctrica del cerebro humano, sobre qué beneficios se pueden extraer de todo esto.

¿De dónde viene la actividad eléctrica del cerebro?
El cerebro está formado por neuronas y glía. Las neuronas exhiben actividad eléctrica, la glía también puede hacer esto, pero de una manera diferente [ 1 ], [ 2 ], y hoy no le prestaremos atención.
La actividad eléctrica de las neuronas consiste en bombear iones de sodio, potasio y cloro entre la célula y el medio ambiente. Entre las neuronas, las señales se transmiten mediante mediadores químicos. Cuando un mediador secretado por una neurona entra en un receptor adecuado de otra neurona, puede abrir canales iónicos activados químicamente y dejar que una pequeña cantidad de iones ingrese a la célula. Como resultado, la célula cambia un poco su carga. Si han ingresado suficientes iones en la celda (por ejemplo, una señal ha llegado a varias sinapsis al mismo tiempo), otros canales iónicos que dependen del voltaje (hay más) se abren, y la celda se activa en cuestión de milisegundos sobre la base de un principio de "todo o nada", y luego vuelve a Condición previa. Este proceso se llama potencial de acción.

¿Cómo puedo registrarlo?
La mejor manera de registrar la actividad de las células individuales es pegar un electrodo en la corteza. Puede ser un cable , puede ser una matriz con varias decenas de canales , puede ser un pin con varios cientos , o puede ser una placa flexible con varios miles (como esta para usted, máscara de máscara ).
En animales, esto se ha hecho durante mucho tiempo. A veces, por razones de salud (epilepsia, enfermedad de Parkinson, parálisis completa), se realizan en una persona. Los pacientes con implantes pueden imprimir texto con el poder del pensamiento, controlar los exoesqueletos e incluso controlar todos los grados de libertad del manipulador industrial.
Parece impresionante, pero en el futuro cercano, tales métodos no llegarán a todas las clínicas del distrito y, especialmente, a las personas sanas. En primer lugar, es muy costoso: el costo del procedimiento para cada paciente se mide en cientos de miles de dólares. En segundo lugar, la implantación de electrodos en la corteza sigue siendo una operación neuroquirúrgica grave con todas las posibles complicaciones y daños en el tejido nervioso alrededor del implante. En tercer lugar, la tecnología en sí misma es imperfecta: no está claro qué hacer con la compatibilidad tisular de los implantes y cómo evitar su ensuciamiento con glía, como resultado de lo cual la señal deseada deja de registrarse con el tiempo. Además, enseñar a cada paciente cómo usar un implante puede llevar más de un año de entrenamiento diario.
No puede pegar los cables profundamente en la corteza, pero suavemente colóquelo sobre él, se obtiene un electrocorticograma. Aquí ya no se puede registrar la señal de las neuronas individuales, pero se puede ver la actividad de áreas muy pequeñas (la regla general es que, cuanto más lejos de las neuronas, peor es la resolución espacial del método). El nivel de invasividad es más bajo, pero aún necesita abrir el cráneo, por lo que este método se usa principalmente para el monitoreo durante las operaciones.
Puede colocar cables ni siquiera en la corteza, sino en la duramadre (el cráneo delgado que se encuentra entre el cerebro y el cráneo real). Aquí el nivel de invasividad y posibles complicaciones es aún más bajo, pero la señal sigue siendo de bastante alta calidad. Resultará EEG epidural. El método es bueno para todos, sin embargo, todavía se necesita una operación aquí.
Finalmente, un método mínimamente invasivo para estudiar la actividad eléctrica del cerebro es un electroencefalograma, es decir, grabar usando electrodos que se encuentran en la superficie de la cabeza. El método es el más extendido, relativamente barato (los dispositivos de gama alta no cuestan más de varias decenas de miles de dólares, y la mayoría son varias veces más baratos, los consumibles son casi gratuitos), y tiene la mayor resolución de tiempo de los métodos no invasivos: puede estudiar los procesos de percepción, que toman unos pocos milisegundos. Desventajas: baja resolución espacial y señal ruidosa, que, sin embargo, contiene información suficiente para algunos fines médicos y de interfaz neurológica.
En la imagen con el potencial de acción, se puede ver que la curva tiene dos partes principales: de hecho, el potencial de acción (pico grande) y el potencial sináptico (cambio pequeño de amplitud antes del pico grande). Sería lógico suponer que lo que registramos en la superficie de la cabeza es la suma de los potenciales de acción de las neuronas individuales. Sin embargo, en realidad, todo funciona al revés: el potencial de acción tarda aproximadamente 1 milisegundo y, a pesar de su gran amplitud, no pasa a través del cráneo y los tejidos blandos, pero los potenciales sinápticos debido a su mayor duración están bien resumidos y registrados en la superficie del cráneo. Esto se ha demostrado mediante el registro simultáneo por métodos invasivos y no invasivos. También es importante que la actividad de no todas las neuronas se pueda registrar con EEG (más detalles aquí ).
Es importante que haya alrededor de 86 mil millones de células nerviosas en el cerebro (cómo se puede calcular con tanta precisión, lea aquí ), y la actividad de una neurona en ese ruido es imposible de contar. Sin embargo, aún se puede extraer alguna información. Imagina que estás parado en el centro de un estadio de fútbol. Mientras los fanáticos solo están haciendo ruido y hablando entre ellos, escuchas un zumbido constante, pero tan pronto como una pequeña parte de los presentes comienza a cantar un canto, ya se puede escuchar con bastante claridad. De la misma manera con las neuronas: en la superficie del cráneo puede ver una señal significativa solo si de inmediato una gran cantidad de neuronas muestran actividad sincrónica. Para el EEG no invasivo, esto es aproximadamente 50 mil neuronas que trabajan sincrónicamente.
Por primera vez, la idea de medir la tensión en la cabeza de una persona se hizo realidad en 1924 por una persona bastante interesante . El primer registro de EEG se veía así:

Es difícil entender lo que significa esta señal, pero está claro de inmediato que no parece ruido blanco: en ella se notan husos de oscilaciones de alta amplitud y diferentes frecuencias. Este ritmo alfa es el ritmo cerebral más notable que se puede ver a simple vista.
Ahora, por supuesto, los ritmos de EEG no se analizan a simple vista, sino por métodos matemáticos, los más simples de los cuales son espectrales.

Espectro de Fourier rayado del electroencefalograma ( fuente )
En total, hay varias bandas en las que generalmente se analiza la actividad rítmica del EEG, estas son las más populares:
8-14 Hz - Ritmo alfa. Presentado principalmente en las áreas occipitales. Aumenta mucho al cerrar los ojos, también se suprime con el estrés mental y aumenta con la relajación. Este ritmo se produce cuando la excitación circula entre la corteza y el tálamo. El tálamo es un tipo de enrutador que decide cómo redirigir la información entrante a la corteza. Cuando una persona cierra los ojos, no tiene nada que hacer, comienza a generar actividad de fondo, lo que provoca un ritmo alfa en la corteza. Además, la red en modo predeterminado juega un papel importante: una red de estructuras que están activas durante la vigilia silenciosa, pero este es un tema para un artículo separado.

Un tipo de ritmo alfa con el que es fácil confundir es el ritmo mu. Tiene características similares, pero se registra en las áreas centrales de la cabeza, donde se encuentra la corteza motora. Una característica importante es que su poder disminuye cuando una persona mueve sus extremidades, o incluso piensa en cómo hacerlo.
14-30 Hz - Ritmo beta. Más pronunciado en los lóbulos frontales del cerebro. Aumenta con el estrés mental.
30+ Hz - Ritmo gamma. Puede estar en algún lugar dentro del cerebro, pero la mayor parte de lo que se puede registrar desde la superficie proviene de los músculos. Descubrimos lo siguiente :
Es necesario eliminar de alguna manera la actividad muscular de la cabeza para registrar el EEG con y sin músculos. Desafortunadamente, no hay una manera fácil de desactivar los músculos de la cabeza sin desconectarlos de todo el cuerpo. Tomamos un científico (nadie más estaría de acuerdo con tal cosa), lo bombeamos con un relajante muscular, como resultado de lo cual todos los músculos están desconectados. El problema es que si apaga todos los músculos, incluidos el diafragma y el intercostal, no podrá respirar. Solución: colóquelo en un ventilador. El problema es que ni siquiera puede hablar sin músculos. Solución: colocamos un torniquete en su brazo para que el relajante muscular no caiga allí y luego pueda dar señales con este brazo. El problema es que si aprietas el experimento, la mano se caerá. Solución: detenemos el experimento cuando el científico deja de sentir su mano y esperamos que todo termine bien. El resultado: una participación en el espectro de frecuencia de EEG de más de 20 Hz en el contexto del relajante muscular se vuelve 10-200 veces menor, cuanto mayor es la frecuencia, mayor es la caída.
1-4 Hz - ritmo Delta. Expresado durante la fase, de repente, el sueño delta (el sueño más profundo), también aumenta con el estrés.
Además de la actividad rítmica, también hay una evocada en EEG. Si sabemos con certeza en qué momento le mostramos a una persona un incentivo (puede ser una imagen, un sonido, una sensación táctil o incluso un olor ), podemos ver qué reacción tuvo este estímulo en particular. La relación señal / ruido de dicha respuesta con respecto al EEG de fondo es bastante baja, pero si mostramos el estímulo, por ejemplo, 10 veces, reducimos el EEG en relación con el momento de presentación y el promedio, podemos obtener curvas bastante detalladas, que se denominan potenciales evocados (que no deben confundirse con los potenciales acciones).

Este es el potencial evocado para el sonido. Dejaremos los detalles a los psicofisiólogos; aquí es suficiente para que comprendamos que cada extremo significa algo. Con un promedio suficiente, las respuestas de las estructuras serán visibles, comenzando desde el nervio auditivo (I) y terminando con la corteza asociativa (P2).
¿Qué se puede hacer con ella?
Puedes hacer muchas cosas, pero hoy nos concentraremos en las interfaces de neurocomputadoras. Estos son sistemas de análisis EEG en tiempo real que permiten enviar comandos a una computadora o robot sin la ayuda de los músculos, lo más cercano a la telequinesis que la ciencia moderna puede proporcionar.
Lo más obvio que viene a la mente es hacer una interfaz sobre la actividad rítmica. ¿Recordamos que el ritmo alfa es pequeño cuando una persona está tensa y mucho cuando está relajado? Así que relájate. Escribimos el EEG, hacemos la transformación de Fourier, cuando el poder en la ventana de alrededor de 10 hertzios ha superado un cierto umbral, enciende la bombilla: este es el control de la computadora por el poder del pensamiento. El mismo principio puede permitirle controlar otros ritmos. Debido a la simplicidad y la poca exigencia del equipo, han aparecido muchos juguetes que funcionan según este principio: Neurosky , Emotiv , miles de ellos. En principio, si te esfuerzas, una persona puede aprender a llegar al estado correcto, que se clasificará correctamente. El problema con los dispositivos de consumo es que a menudo no escriben una señal de muy alta calidad, y no son capaces de restar artefactos de los movimientos oculares y faciales. Como resultado, existe una oportunidad real de aprender a controlar los músculos y los ojos, y no el cerebro (y la mente subconsciente trabaja de modo que cuanto más intente no hacerlo, peor resultará). Además, la relación señal / ruido en los ritmos es bastante baja, y la interfaz es lenta e inexacta (si puede adivinar correctamente el estado con una precisión de más del 70%, esto ya es un logro). Sí, y la base científica del estado, excepto la relajación y la concentración, por decirlo suavemente, es inestable. Sin embargo, con una implementación adecuada, el método puede tener su aplicación.
Un subconjunto importante de interfaces sobre ritmos es la representación de movimientos. Aquí se invita a la persona a no imaginar algo abstracto relajante, sino a representar el movimiento de, digamos, la mano derecha. Si lo hace bien (y aprender la presentación correcta es difícil), puede detectar una disminución en el ritmo mu en el hemisferio izquierdo. La precisión de tales interfaces también gira en torno al 70%, pero se utilizan en simuladores para la recuperación de accidentes cerebrovasculares y lesiones , incluido el uso de varios exoesqueletos, por lo que todavía son necesarios.
Otra clase de neurointerfaces EEG se basa en el uso de todo tipo de actividad evocada. Estas interfaces son muy confiables, con una combinación exitosa de circunstancias que se aproxima al 100%.
La forma más popular de interfaces neuronales incluye el potencial del P300. Surge cuando una persona intenta seleccionar un estímulo que necesita entre muchos innecesarios.


Por ejemplo, si aquí tratamos de calcular cuántas veces se enciende la letra "A" y, al mismo tiempo, no prestamos atención a todos los demás, entonces, en respuesta a este estímulo, al promediar, veremos una línea roja y, al promediar a todos los demás, una línea azul. La diferencia entre ellos es notable a simple vista, y entrenar al clasificador que los distinguirá no es difícil.
Dichas interfaces generalmente no son muy hermosas y no son muy rápidas (imprimir una sola carta tomará aproximadamente 10 segundos), pero pueden ser útiles para pacientes completamente paralizados.
Además, hay un componente cognitivo en IMC-P300: solo mirar una carta no es suficiente, debe prestarle atención activamente. Esto permite, bajo ciertas condiciones, hacer juegos bastante interesantes sobre esta tecnología (pero este es un tema para otro artículo).
Debido al hecho de que P300 es un potencial cognitivo, no es muy importante para él lo que, de hecho, se le muestra a una persona, lo principal es que puede reaccionar ante él. Como resultado, la interfaz funcionará incluso si las letras se reemplazan entre sí en un punto, esto es útil para pacientes que no pueden mover los ojos.

Hay otros potenciales evocados interesantes, en particular SSVEP (ZVPUS) - potenciales de un estado estable. Si busca analogías en el campo de la comunicación, entonces el P300 funciona como un walkie-talkie: las señales de diferentes estímulos están separadas por el tiempo, y SSVEP es un FDMA clásico: separación por frecuencia portadora, como en la comunicación GSM.
luces de emergencia cuidadosamente epilépticas Es necesario mostrarle a una persona varios estímulos que destellan a diferentes frecuencias. Al elegir un estímulo, es suficiente mirarlo cuidadosamente, y después de unos segundos su frecuencia aparecerá mágicamente en la corteza visual, desde donde puede extraerse mediante métodos de correlación o espectrales. Esto es más rápido y más fácil que leer las letras del P300, pero es difícil ver un parpadeo durante mucho tiempo.
Donde hay FDMA, ahí está el lugar de CDMA:
con cuidado, incluso más luces de emergencia epilépticas 
El gris es la secuencia binaria, el color es la actividad causada por él en todos los canales, el mapa es la distribución del potencial en el EEG. Se ve que el máximo en la parte posterior de la cabeza está en las áreas visuales
Es posible modular el parpadeo de los estímulos no por frecuencias y fases, sino por secuencias binarias ortogonales , que también terminan en la corteza visual y se clasifican mediante análisis de correlación. Esto puede ayudar a optimizar un poco el entrenamiento del clasificador y acelerar la interfaz: una letra puede tomar menos de 2 segundos. Debido a la exitosa selección de colores, puede hacer que la interfaz sea un poco menos vyrviglaznym, aunque elimine completamente el parpadeo. Desafortunadamente, el componente cognitivo aquí no es tan pronunciado: el seguimiento de los movimientos oculares proporciona resultados comparables, pero técnicamente más simples, más baratos y más convenientes.
Cuando hablo sobre qué tan bien pueden funcionar estos u otros tipos de interfaces, tengo que operar constantemente con una relación señal / ruido. De hecho, los potenciales evocados tienen una amplitud baja de aproximadamente 5 microvoltios, a pesar de que el ritmo alfa de fondo puede tener fácilmente una amplitud de 20. Una señal tan débil parece bastante difícil de clasificar, pero de hecho es bastante simple si el experimento se lleva a cabo correctamente y bueno para grabar el EEG. Ahora, la mayor parte de la investigación académica se concentra en el campo de la invención de nuevos clasificadores, incluido el uso de redes neuronales, pero ya se puede lograr un nivel bastante bueno con los clasificadores lineales más simples de scikit-learn. Por ejemplo, un buen conjunto de datos con P300 y código está aquí .
Interfaces de neurocomputadora: una tecnología en evolución, parece mágica, especialmente para una persona no preparada. Sin embargo, en realidad este es un método en el que hay muchas dificultades obvias. El secreto aquí, como con cualquier tecnología, es tener en cuenta todas las limitaciones y encontrar áreas de su aplicación en las que estas restricciones no interfieran con el trabajo.