Os cientistas adoram procurar a primeira menção de sua ciência. Por exemplo, vi um artigo em que se afirmava seriamente que os primeiros experimentos de estimulação elétrica do cérebro foram realizados na Roma Antiga, quando alguém ficou chocado com a enguia elétrica. De uma maneira ou de outra, geralmente, a história da eletrofisiologia é geralmente calculada a partir dos experimentos de Luigi Galvani (século XVIII). Nesta série de artigos, tentaremos contar uma pequena parte do que a ciência aprendeu nos últimos 300 anos sobre a atividade elétrica do cérebro humano, sobre quais lucros podem ser extraídos disso tudo.

De onde vem a atividade elétrica do cérebro?
O cérebro é composto de neurônios e glia. Os neurônios exibem atividade elétrica, a glia também pode fazer isso, mas de uma maneira diferente [ 1 ], [ 2 ], e hoje não prestaremos atenção nela.
A atividade elétrica dos neurônios consiste no bombeamento de íons sódio, potássio e cloro entre a célula e o meio ambiente. Entre os neurônios, os sinais são transmitidos usando mediadores químicos. Quando um mediador secretado por um neurônio entra em um receptor adequado de outro neurônio, ele pode abrir canais de íons ativados quimicamente e deixar uma pequena quantidade de íons na célula. Como resultado, a célula muda um pouco sua carga. Se íons suficientes entraram na célula (por exemplo, um sinal chegou a várias sinapses ao mesmo tempo), outros canais de íons, dependendo da tensão (há mais) abertos, e a célula é ativada em questão de milissegundos com base no princípio de "tudo ou nada" e, em seguida, retorna para condição anterior. Esse processo é chamado de potencial de ação.

Como posso registrá-lo
A melhor maneira de registrar a atividade de células individuais é colocar um eletrodo no córtex. Pode ser um fio , pode ser uma matriz com várias dezenas de canais , pode ser um pino com várias centenas , ou pode ser uma placa flexível com vários milhares (dessa forma, máscara de máscara ).
Em animais, isso é feito há muito tempo. Às vezes, por razões de saúde (epilepsia, doença de Parkinson, paralisia completa), elas são feitas em uma pessoa. Pacientes com implantes podem imprimir texto com o poder do pensamento, controlar exoesqueletos e até controlar todos os graus de liberdade do manipulador industrial.
Parece impressionante, mas no futuro próximo, esses métodos não chegarão a todas as clínicas distritais e, principalmente, a pessoas saudáveis. Em primeiro lugar, é muito caro - o custo do procedimento para cada paciente é medido em centenas de milhares de dólares. Em segundo lugar, a implantação de eletrodos no córtex ainda é uma operação neurocirúrgica séria, com todas as complicações possíveis e danos ao tecido nervoso ao redor do implante. Em terceiro lugar, a própria tecnologia é imperfeita - não está claro o que fazer com a compatibilidade de tecidos com os implantes e como evitar a contaminação com a glia, como resultado do qual o sinal desejado deixa de ser gravado ao longo do tempo. Além disso, ensinar a cada paciente como usar um implante pode levar mais de um ano de treinamento diário.
Você não pode prender os fios profundamente na casca, mas gentilmente colocá-la - você recebe um eletrocorticograma. Aqui, o sinal de neurônios individuais não pode mais ser registrado, mas você pode ver a atividade de áreas muito pequenas (a regra geral é que, quanto mais distante dos neurônios, pior a resolução espacial do método). O nível de invasividade é mais baixo, mas você ainda precisa abrir o crânio, portanto esse método é usado principalmente para monitoramento durante as operações.
Você pode colocar fios nem no córtex, mas na dura-máter (o crânio fino que fica entre o cérebro e o crânio real). Aqui o nível de invasão e possíveis complicações é ainda mais baixo, mas o sinal ainda é de alta qualidade. Ele resultará em EEG peridural. O método é bom para todos, no entanto, uma operação ainda é necessária aqui.
Finalmente, um método minimamente invasivo para estudar a atividade elétrica do cérebro é um eletroencefalograma, ou seja, gravar usando eletrodos que estão na superfície da cabeça. O método é o mais difundido e relativamente barato (os dispositivos de ponta custam não mais do que várias dezenas de milhares de dólares e a maioria é várias vezes mais barato, os consumíveis são praticamente gratuitos) e tem a maior resolução temporal de métodos não invasivos - você pode estudar os processos de percepção que levam alguns milissegundos. Desvantagens - baixa resolução espacial e sinal de ruído, que, no entanto, contêm informações suficientes para alguns propósitos médicos e de interface neuro.
Na figura com o potencial de ação, pode-se observar que a curva possui duas partes principais - de fato, o potencial de ação (pico grande) e o potencial sináptico (pequena alteração na amplitude antes do pico grande). Seria lógico supor que o que registramos na superfície da cabeça é a soma dos potenciais de ação dos neurônios individuais. No entanto, na realidade, tudo funciona ao contrário - o potencial de ação leva cerca de 1 milissegundo e, apesar de sua alta amplitude, não passa pelo crânio e tecidos moles, mas os potenciais sinápticos, devido à sua maior duração, são bem resumidos e registrados na superfície do crânio. Isso foi comprovado pela gravação simultânea por métodos invasivos e não invasivos. Também é importante que a atividade de nem todos os neurônios possa ser gravada usando o EEG (mais detalhes aqui ).
É importante que haja cerca de 86 bilhões de células nervosas no cérebro (como isso pode ser calculado com tanta precisão, leia aqui ), e é impossível contar a atividade de um neurônio com tanto barulho. No entanto, algumas informações ainda podem ser extraídas. Imagine que você está parado no centro de um estádio de futebol. Enquanto os fãs estão apenas fazendo barulho e conversando entre si, você ouve um zumbido constante, mas assim que apenas uma pequena parte dos presentes começa a cantar um canto, você já pode ouvi-lo claramente. Da mesma forma que os neurônios - na superfície do crânio, você pode ver um sinal significativo apenas se imediatamente um grande número de neurônios mostrar atividade síncrona. Para EEG não invasivo, são aproximadamente 50 mil neurônios trabalhando de forma síncrona.
Pela primeira vez, a ideia de medir a tensão na cabeça de uma pessoa foi realizada em 1924 por uma pessoa bastante interessante . O primeiro registro EEG ficou assim:

É difícil entender o que esse sinal significa, mas é imediatamente claro que ele não se parece com ruído branco - são notados fusos de oscilações de alta amplitude e frequências diferentes. Este ritmo alfa é o ritmo cerebral mais perceptível que pode ser visto a olho nu.
Agora, é claro, os ritmos do EEG não são analisados pelo olho, mas por métodos matemáticos, dos quais os mais simples são espectrais.

Espectro de Fourier listrado do eletroencefalograma ( fonte )
No total, existem várias bandas nas quais a atividade rítmica do EEG é geralmente analisada, e aqui estão as mais populares:
8-14 Hz - ritmo alfa. Apresentado principalmente nas áreas occipitais. Aumenta bastante ao fechar os olhos, também é suprimido pelo estresse mental e aumenta com o relaxamento. Esse ritmo é produzido quando a excitação circula entre o córtex e o tálamo. O tálamo é um tipo de roteador que decide como redirecionar as informações recebidas para o córtex. Quando uma pessoa fecha os olhos, ela não tem nada para fazer, ela começa a gerar atividade em segundo plano, o que causa um ritmo alfa no córtex. Além disso, a rede no modo padrão desempenha um papel importante - uma rede de estruturas ativas durante a vigília silenciosa, mas esse é um tópico para um artigo separado.

Um tipo de ritmo alfa com o qual é fácil confundir é o ritmo. Tem características semelhantes, mas é registrada nas áreas centrais da cabeça, onde o córtex motor está localizado. Uma característica importante é que seu poder diminui quando uma pessoa move seus membros, ou até pensa em como fazê-lo.
14-30 Hz - ritmo beta. Mais pronunciado nos lobos frontais do cérebro. Aumenta com o estresse mental.
30+ Hz - Ritmo gama. Pode estar em algum lugar dentro do cérebro, mas a maior parte do que pode ser gravado da superfície vem dos músculos. Descobrimos o seguinte :
É necessário, de alguma forma, remover a atividade muscular da cabeça para registrar o EEG com e sem músculos. Infelizmente, não há uma maneira fácil de desativar os músculos da cabeça sem desconectá-los por todo o corpo. Pegamos um cientista (ninguém mais concordaria com isso), bombeamos com um relaxante muscular, como resultado do qual todos os músculos estão desconectados. O problema é que, se você desligar todos os músculos, incluindo o diafragma e o intercostal, ele não conseguirá respirar. Solução - coloque em um ventilador. O problema é que ele nem consegue falar sem músculos. Solução - colocamos um torniquete em seu braço para que o relaxante muscular não caia lá, então ele pode emitir sinais com esse braço. O problema é que se você apertar o experimento, a mão cairá. Solução - paramos o experimento quando o cientista para de sentir sua mão e esperamos que tudo termine bem. O resultado - uma participação no espectro de frequências EEG de mais de 20 Hz no contexto do relaxante muscular se torna 10 a 200 vezes menor, quanto maior a frequência, maior a queda.
1-4 Hz - ritmo Delta. Expressado durante a fase, de repente, o sono delta (o sono mais profundo) também aumenta com o estresse.
Além da atividade rítmica, há também uma evocada no EEG. Se soubermos exatamente em que momento mostramos um incentivo a uma pessoa (pode ser uma imagem, som, sensação tátil ou até cheiro ), podemos ver qual foi a reação a esse estímulo específico. A relação sinal / ruído de uma resposta em relação ao EEG de fundo é bastante baixa, mas se mostrarmos o estímulo, por exemplo, 10 vezes, reduzir o EEG em relação ao momento da apresentação e à média, podemos obter curvas bastante detalhadas, chamadas de potenciais evocados (não confundir com potenciais) ações).

Este é o potencial evocado para o som. Vamos deixar os detalhes para os psicofisiologistas - aqui é o suficiente para entendermos que cada extremo significa alguma coisa. Com média suficiente, as respostas das estruturas serão visíveis, começando pelo nervo auditivo (I) e terminando no córtex associativo (P2).
O que pode ser feito com ela
Você pode fazer muitas coisas, mas hoje vamos nos concentrar nas interfaces dos neurocomputadores. Estes são sistemas de análise de EEG em tempo real que permitem que comandos sejam enviados a um computador ou robô sem a ajuda dos músculos - o mais próximo da telecinesia que a ciência moderna pode fornecer.
A coisa mais óbvia que vem à mente é fazer uma interface sobre a atividade rítmica. Lembramos que o ritmo alfa é pequeno quando uma pessoa está tensa e muito quando está relaxado? Então relaxe. Escrevemos o EEG, fazemos a transformação de Fourier, quando a potência na janela em torno de 10 hertz ultrapassa um certo limite, acende a lâmpada - esse é o controle do computador pela força do pensamento. O mesmo princípio pode permitir que você controle outros ritmos. Devido à simplicidade e pouca exigência do equipamento, surgiram muitos brinquedos que funcionam com esse princípio - Neurosky , Emotiv , milhares deles. Em princípio, se você se esforçar, uma pessoa pode aprender a chegar ao estado certo, que será classificado corretamente. O problema dos dispositivos de consumo é que eles geralmente não escrevem um sinal de qualidade muito alta e não conseguem subtrair artefatos dos movimentos dos olhos e dos músculos faciais. Como resultado, há uma oportunidade real de aprender a controlar músculos e olhos, e não o cérebro (e a mente subconsciente funciona para que, quanto mais você tentar não fazer isso, pior será). Além disso, a relação sinal / ruído nos ritmos é bastante baixa e a interface é lenta e imprecisa (se você puder adivinhar corretamente o estado com uma precisão de mais de 70% - isso já é uma conquista). Sim, e a base científica do estado, exceto relaxamento e concentração, para dizer o mínimo, é instável. No entanto, com a implementação adequada, o método pode ter sua aplicação.
Um subconjunto importante de interfaces sobre ritmos é a representação de movimentos. Aqui a pessoa é convidada a não imaginar algo abstratamente relaxante, mas a representar o movimento, digamos, da mão direita. Se você fizer certo (e aprender a apresentação correta é difícil), poderá detectar uma diminuição no ritmo cardíaco no hemisfério esquerdo. A precisão dessas interfaces também gira em torno de 70%, mas elas são usadas em simuladores para recuperação de acidentes vasculares cerebrais e lesões , incluindo o uso de vários exoesqueletos, por isso ainda são necessárias.
Outra classe de neurointerfaces de EEG é baseada no uso de atividade evocada de todos os tipos. Essas interfaces são muito confiáveis, com uma combinação bem-sucedida de circunstâncias que se aproxima de 100%.
A forma mais popular de interfaces neurais inclui o potencial do P300. Surge quando uma pessoa tenta destacar um estímulo de que precisa entre muitos desnecessários.


Por exemplo, se aqui tentarmos calcular quantas vezes a letra "A" acende e, ao mesmo tempo, não prestar atenção a todas as outras, em resposta a esse estímulo, ao calcular a média, veremos uma linha vermelha e, ao calcular a média de todas as outras, uma linha azul. A diferença entre eles é perceptível a olho nu, e não é difícil treinar o classificador que os distinguirá.
Tais interfaces geralmente não são muito bonitas e não são muito rápidas (imprimir uma única carta leva cerca de 10 segundos), mas podem ser úteis para pacientes completamente paralisados.
Além disso, há um componente cognitivo no IMC-P300 - apenas olhar para uma carta não é suficiente, é preciso prestar atenção a ela. Isso permite, sob certas condições, criar jogos bastante interessantes sobre essa tecnologia (mas esse é um tópico para outro artigo).
Devido ao fato de o P300 ser um potencial cognitivo, não é muito importante para ele o que, de fato, é mostrado a uma pessoa, o principal é que ele pode reagir a ela. Como resultado, a interface funcionará mesmo que as letras se substituam em um ponto - isso é útil para pacientes que não conseguem mover os olhos.

Existem outros potenciais evocados interessantes, em particular SSVEP (ZVPUS) - potenciais de um estado estável. Se você procurar analogias no campo das comunicações, o P300 funciona como um walkie-talkie - os sinais de diferentes estímulos são separados pelo tempo, e o SSVEP é um FDMA clássico - separação por frequência da operadora, como na comunicação GSM.
luzes de emergência cuidadosamente epilépticas É necessário mostrar a uma pessoa vários estímulos que piscam em diferentes frequências. Ao escolher um estímulo, basta examiná-lo com cuidado e, após alguns segundos, sua frequência aparecerá magicamente no córtex visual, de onde pode ser extraído por métodos espectrais ou de correlação. Isso é mais rápido e fácil do que ler as letras do P300, mas é difícil ver esse piscar por um longo tempo.
Onde há FDMA, existe o próprio lugar do CDMA:
com cuidado, luzes de emergência ainda mais epilépticas 
Cinza é a sequência binária, cor é a atividade causada por ela em todos os canais, o mapa é a distribuição do potencial no EEG. Vê-se que o máximo na parte de trás da cabeça está nas áreas visuais
É possível modular o piscar de estímulos não por frequências e fases, mas por seqüências binárias ortogonais , que também terminam no córtex visual e são classificadas por análise de correlação. Isso pode ajudar a otimizar um pouco o treinamento do classificador e acelerar a interface - uma letra pode levar menos de 2 segundos. Devido à seleção bem sucedida de cores, você pode tornar a interface um pouco menos vyrviglaznym, embora se livrar completamente de piscar. Infelizmente, o componente cognitivo aqui não é tão pronunciado - o rastreamento dos movimentos oculares fornece resultados comparáveis, mas tecnicamente mais simples, mais barato e mais conveniente.
Quando falo sobre como esses ou outros tipos de interfaces podem funcionar, tenho que operar constantemente com uma relação sinal / ruído. De fato, os potenciais evocados têm uma baixa amplitude de cerca de 5 microvolts, apesar do ritmo alfa de fundo facilmente ter uma amplitude de 20. Esse sinal fraco parece bastante difícil de classificar, mas, na verdade, é bastante simples se o experimento for realizado corretamente e bom gravar o EEG. Agora, a maioria das pesquisas acadêmicas está concentrada no campo da invenção de novos classificadores, incluindo o uso de redes neurais, mas um nível bastante bom já pode ser alcançado com os classificadores lineares mais simples do scikit-learn. Por exemplo, um bom conjunto de dados com P300 e código está aqui .
Interfaces para neurocomputadores - uma tecnologia em evolução, parece mágica, especialmente para pessoas despreparadas. No entanto, na realidade, este é um método no qual existem muitas dificuldades não óbvias. O segredo aqui, como em qualquer tecnologia, é levar em conta todas as limitações e encontrar áreas de sua aplicação nas quais essas restrições não interferem no trabalho.