Neste livro, nos concentramos nos principais detalhes do dispositivo de rede neural: como eles funcionam, como podem ser usados em problemas de reconhecimento de sequência. Este material pode ser aplicado diretamente na prática. Mas, é claro, uma das razões do interesse em NS é a esperança de que algum dia eles possam ir além dos limites do simples reconhecimento de sequência. Talvez eles, ou algumas outras abordagens baseadas em computadores digitais, possam finalmente ser usados para criar máquinas pensantes que podem competir ou superar a inteligência humana? Essa idéia vai muito além do material discutido no livro - ou do conhecimento de qualquer pessoa no planeta. Mas especular sobre esse assunto é sempre interessante.
Tem havido muito debate sobre se os computadores podem, em princípio, atingir o nível de inteligência humana. Não vou considerar esse problema. Apesar do debate, acredito que não há dúvida séria sobre a possibilidade de criar um computador inteligente - embora essa tarefa possa ser extremamente difícil e talvez vá muito além das tecnologias existentes - e os críticos atuais um dia se encontrarão na posição de
vitalistas do passado.
Em vez disso, quero estudar outra questão: existe um conjunto simples de princípios que podem ser usados para explicar um fenômeno como a inteligência? Em particular, mais especificamente, existe um algoritmo simples para criar inteligência?
A ideia de um algoritmo verdadeiramente simples para criar inteligência é bastante ousada. Ela provavelmente parece otimista demais para ser verdade. Muitas pessoas têm um sentimento persistente e intuitivo de que o intelecto tem uma complexidade significativa que não pode ser simplificada. Eles estão tão impressionados com a incrível diversidade e flexibilidade do pensamento humano que concluem que é impossível um algoritmo simples criar inteligência. Mas, apesar dessa intuição, não acho que valha a pena tirar conclusões precipitadas sobre esse assunto. A história da ciência está repleta de exemplos de como um fenômeno que inicialmente parecia extremamente complexo foi posteriormente explicado por um conjunto de idéias simples, mas poderoso.
Considere, por exemplo, os primeiros dias da astronomia. Desde os tempos antigos, sabia-se que havia uma grande variedade de objetos diferentes no céu: o sol, a lua, os planetas, os cometas, as estrelas. Esses objetos se comportam de maneiras completamente diferentes: as estrelas, por exemplo, movem-se majestosa e regularmente pelo céu, mas os cometas parecem aparecer do nada, voam pelo céu e desaparecem. No século XVI, apenas um otimista ingênuo poderia imaginar que todos os movimentos desses objetos pudessem ser explicados por um simples conjunto de princípios. Porém, no século XVII, Newton formulou a teoria da gravitação universal, que explicava não apenas todo esse movimento, mas também fenômenos terrestres, como marés e o comportamento das conchas associadas à Terra. Em retrospecto, o ingênuo otimista do século XVI parece um pessimista pedindo muito pouco.
Certamente, na ciência há muito mais exemplos desse tipo. Considere a miríade de produtos químicos que compõem nosso mundo, tão belamente explicada pela tabela periódica, que por sua vez é construída de acordo com várias regras simples que podem ser obtidas da mecânica quântica. Ou o mistério da complexidade e diversidade do mundo biológico, cujas fontes, ao que parece, residem no princípio da evolução através da seleção natural. Esses e muitos outros exemplos dizem que não seria sensato descartar uma explicação simples de como o intelecto funciona com base no que nosso cérebro está fazendo - e no que é o melhor exemplo de inteligência atualmente - parece muito complicado.
Nesse prefácio, presumo que um computador possa ser considerado razoável se suas capacidades coincidirem ou excederem as do pensamento humano. Ou seja, a questão da existência de um algoritmo de inteligência é uma questão da existência de um algoritmo que possa pensar da mesma maneira que uma pessoa. Vale a pena notar que, em princípio, pode haver formas da mente que não incluem pensamentos como os humanos e, ao mesmo tempo, de algum modo interessante, excedem as mentes das pessoas.
Por outro lado, apesar de todos esses exemplos otimistas, logicamente falando, é possível que a inteligência possa ser explicada apenas através do trabalho de um grande número de mecanismos fundamentalmente diferentes. No caso do nosso cérebro, esses mecanismos podem surgir como uma reação a muitos pedidos diferentes da seleção natural durante a evolução. Se esse ponto de vista estiver correto, a inteligência envolverá complexidade irreparável, e é impossível criar um algoritmo simples de inteligência.
Qual destes dois pontos de vista é verdadeiro?
Para aprofundar essa questão, vamos fazer uma que esteja intimamente relacionada a ela, mas a outra - existe uma explicação simples de como o cérebro humano funciona? Em particular, estudaremos maneiras de quantificar a complexidade do cérebro. A primeira abordagem é o estudo do cérebro do ponto de vista da
conexão . Estamos falando diretamente sobre as conexões: quantos neurônios no cérebro, quantos neuroglia, quantas conexões entre os neurônios. Você provavelmente já encontrou esses números antes: no cérebro existem cerca de 100 bilhões de neurônios, 100 bilhões de neuroglia e 100 trilhões de conexões entre os neurônios. Esses números são surpreendentes. E eles são assustadores. Se você precisa entender os detalhes de todas essas conexões (para não mencionar neurônios e neuroglia) para entender como o cérebro funciona, então definitivamente não obteremos um algoritmo simples para a inteligência.
Há um segundo ponto de vista mais otimista no cérebro - do ponto de vista da biologia molecular. A idéia é perguntar quanta informação genética é necessária para descrever a arquitetura do cérebro. Para entender isso, vamos começar observando as diferenças genéticas entre humanos e chimpanzés. Você provavelmente se deparou com a afirmação comum de que "os humanos são 98% chimpanzés". Às vezes, os números variam de 95% a 99%. Essas variações ocorrem porque, inicialmente, os números foram comparados comparando amostras parciais do genoma do chimpanzé humano, em vez de todo o genoma. No entanto, em 2007, o genoma do chimpanzé foi completamente
sequenciado e agora sabemos que o DNA humano e do chimpanzé diferem em cerca de 125 milhões de bases de DNA emparelhadas. Isso é de 3 bilhões de bases emparelhadas em cada genoma. Portanto, você não pode dizer que uma pessoa é 98% chimpanzé - seria mais correto falar de 96%.
Quanta informação está contida em 125 milhões de bases emparelhadas? Cada base emparelhada pode ser rotulada com uma das quatro possibilidades - as “letras” do código genético, as bases adenina, timina, guanina e citosina. Portanto, cada par pode ser descrito com dois bits de informação - apenas para identificar um dos quatro rótulos. Portanto, 125 milhões de bases emparelhadas são equivalentes a 250 milhões de bits de informação. Esta é a diferença genética entre humanos e chimpanzés!
Certamente, esses 250 milhões de bits são responsáveis por toda a diferença genética entre humanos e chimpanzés. Mas estamos interessados apenas na diferença associada ao cérebro. Infelizmente, ninguém sabe quanta diferença genética pode descrever a diferença no cérebro. Mas suponha, apenas por uma questão de clareza, que aproximadamente metade dos 250 milhões de bits seja responsável por essa diferença. Acontece 125 milhões de bits.
125 milhões de bits é um número impressionantemente grande. Vamos ver o quanto isso é traduzido em termos mais compreensíveis. Em particular, qual seria o tamanho de um texto equivalente em inglês? Acontece que o conteúdo informativo do idioma inglês corresponde a cerca de um bit por letra. Parece uma classificação bastante baixa - afinal, o alfabeto tem 26 letras - no entanto, o texto em inglês contém uma enorme quantidade de redundância. Obviamente, pode-se argumentar que há redundância no genoma e que dois bits em uma base emparelhada é uma enumeração. Mas vamos ignorá-lo, porque, na pior das hipóteses, significa que vamos superestimar a complexidade genética do cérebro. Assumindo tudo isso, veremos que a diferença genética entre nosso cérebro e o cérebro do chimpanzé é equivalente a 125 milhões de letras, ou 25 milhões de palavras em inglês. Isso é cerca de 30 vezes mais do que a
Bíblia King James contém.
Uma grande quantidade de informações. Mas não incompreensivelmente grande. Ele cai na escala da mente humana. Talvez nem uma única pessoa possa entender tudo o que está escrito neste código, mas um grupo de pessoas poderá compreendê-lo coletivamente, usando a especialização apropriada. E, embora essa seja uma grande quantidade de informações, ela é pequena se comparada às informações necessárias para descrever 100 bilhões de neurônios, 100 bilhões de neuroglia e 100 trilhões de conexões existentes no cérebro. Mesmo se usássemos uma descrição simples e simples - digamos, 10 números de ponto flutuante para descrever cada conexão - isso exigiria 70 quadrilhões de bits. Isso significa que a descrição genética é meio bilhão de vezes menos complexa do que a descrição do conectoma completo do cérebro humano.
A partir disso, fica claro que o genoma não pode conter uma descrição detalhada de todas as nossas conexões neurais. Ele tem que descrever apenas a arquitetura geral e os princípios básicos subjacentes ao cérebro. Mas essa arquitetura e esses princípios são suficientes para garantir que as pessoas, quando crescerem, se tornem racionais. Obviamente, isso não é sem truques - as crianças em crescimento precisam de um ambiente saudável e estimulante e de boa nutrição para alcançar o potencial intelectual. No entanto, se crescermos em um ambiente razoável, uma pessoa saudável terá um intelecto incrível. Em certo sentido, a informação em nossos genes contém a essência de como pensamos. Além disso, os princípios contidos nesta informação genética provavelmente serão entendidos por nós.
Os números apresentados são estimativas muito aproximadas. É possível que 125 milhões de bits se tornem um exagero e que exista um conjunto muito mais compacto de princípios fundamentais subjacentes ao pensamento humano. Talvez a maioria desses 125 milhões de bits seja apenas um ajuste fino em relação a pequenos detalhes. E talvez sejamos muito conservadores no cálculo desses números. Seria ótimo se fosse esse o caso! Para nossos objetivos atuais, o ponto principal será o seguinte: a arquitetura do cérebro é complexa, mas não tanto quanto você imagina ao avaliar o número de conexões no cérebro. Uma análise do cérebro do ponto de vista da biologia molecular sugere que as pessoas um dia serão capazes de entender os princípios básicos subjacentes à arquitetura do cérebro.
Nos últimos parágrafos, ignorei o fato de que 125 milhões de bits descrevem apenas a diferença genética entre o cérebro humano e o cérebro do chimpanzé. Nem todas as habilidades do nosso cérebro existem devido a esses 125 milhões de bits. Os próprios chimpanzés são bons em pensar. Talvez a chave da inteligência esteja principalmente nas habilidades mentais (e nas informações genéticas) que os chimpanzés e os seres humanos possuem. Nesse caso, o cérebro humano pode ser apenas uma pequena atualização do cérebro do chimpanzé, pelo menos em termos da complexidade dos princípios básicos. Apesar do chauvinismo humano geralmente aceito em relação às nossas capacidades únicas, isso não é tão incrível: as linhas genéticas do desenvolvimento de humanos e chimpanzés divergiram apenas 5 milhões de anos atrás, um momento em uma escala evolutiva. No entanto, na ausência de argumentos mais convincentes, permaneço do lado do chauvinismo humano geralmente aceito: acho que os princípios mais interessantes subjacentes aos pensamentos humanos estão contidos nesses 125 milhões de bits, e não na parte do genoma que temos em comum com os chimpanzés.
A adoção do ponto de vista sobre o cérebro inerente à biologia molecular nos dá uma redução na complexidade de nossa descrição em cerca de nove ordens de magnitude. Isso é inspirador, mas não nos diz se é possível criar um algoritmo verdadeiramente simples para a inteligência. Podemos reduzir ainda mais a complexidade? E, mais importante, podemos resolver a questão da possibilidade de criar um algoritmo simples para a inteligência?
Infelizmente, ainda não há evidências convincentes suficientes para resolver esse problema. Deixe-me descrever algumas das evidências disponíveis com o truque de que esta revisão será curta e incompleta, e visa apenas dar uma idéia de alguns trabalhos científicos recentes, e não descrever completamente tudo o que é conhecido no momento.
Entre as evidências que sugerem a possibilidade de um algoritmo simples para inteligência está o experimento, publicado na revista Nature em abril de 2000. Uma equipe de cientistas liderada por Mriganka Sur "reflash" o cérebro dos furões recém-nascidos. Normalmente, os sinais dos olhos de um furão são transmitidos para uma parte do cérebro conhecida como córtex visual. Porém, nesses furões, os cientistas redirecionaram o sinal para que ele penetrasse no córtex auditivo, ou seja, na parte do cérebro que geralmente é usada para a audição.
Para entender o que aconteceu depois disso, você precisa entender um pouco do córtex visual. O córtex visual contém muitas colunas de orientação. Estas são pequenas placas de neurônios, cada uma das quais reage à estimulação visual de uma certa direção. Eles podem ser representados na forma de pequenos sensores de direção: quando alguém lança luz brilhante de uma determinada direção, a coluna de orientação correspondente é ativada. Se a luz se mover, uma coluna de orientação diferente será ativada. Uma das estruturas de alto nível mais importantes do córtex visual é o mapa de orientação, no qual as colunas de orientação estão marcadas.
Os cientistas descobriram que, se o sinal visual dos olhos do furão é redirecionado para o córtex auditivo, o córtex auditivo muda. Colunas orientais e um mapa de orientação começam a aparecer no córtex auditivo. Ele é menos ordenado que o mapa de orientação no córtex visual, mas é claro que é isso. Além disso, os cientistas realizaram os testes mais simples das reações dos furões aos estímulos visuais, treinando-os para responder de maneira diferente quando a luz vinha de diferentes direções. A julgar pelos testes, os furões ainda podiam "ver", pelo menos de forma rudimentar, usando o córtex auditivo.
Este é um resultado incrível. Ele diz que como diferentes partes do cérebro aprendem a responder aos dados sensoriais são baseadas em princípios gerais. Essa comunidade fornece argumentos a favor da idéia da existência de um conjunto de princípios simples no coração da mente. No entanto, não se engane, acreditando que a visão dos furões nessas experiências foi muito boa. Os testes comportamentais testaram apenas aspectos grosseiros da visão. Obviamente, não podemos perguntar aos furões "eles aprenderam a ver". Portanto, experimentos não provaram que o córtex auditivo reformado proporcionava aos furões uma visão de alta qualidade. Portanto, esses experimentos fornecem um apoio muito limitado à idéia de que princípios semelhantes estão no cerne da aprendizagem de diferentes partes do cérebro.
Que evidência existe para refutar a existência de um algoritmo simples para inteligência? Alguns deles vêm dos campos da psicologia evolutiva e da neuroanatomia. Desde a década de 1960, os psicólogos evolucionistas descobriram uma ampla gama de universais humanos, padrões de comportamento comuns a todas as pessoas, em todas as culturas e de diferentes origens. Entre eles estão o tabu do incesto de mãe e filho, o uso de música e dança, bem como estruturas linguísticas mais complexas, como o uso de palavrões (ou seja, palavras proibidas), pronomes e até estruturas básicas como verbos. Esses resultados são complementados por uma grande quantidade de evidências da neuroanatomia, das quais se segue que muitos padrões de comportamento humano são controlados por certas partes do cérebro e que essas partes do cérebro são semelhantes em todas as pessoas. Em conjunto, isso sugere que muitos padrões de comportamento muito especializados são costurados em certas partes do cérebro.
Algumas pessoas concluem desses resultados que são necessárias explicações separadas para essas muitas funções cerebrais e que, como resultado, a atividade cerebral não pode ser simplificada, ou seja, você não pode dar uma explicação simples de como o cérebro funciona (e talvez criar um algoritmo simples para inteligência). Por exemplo, um conhecido pesquisador de IA que mantém essa visão é
Marvin Minsky . Nas décadas de 1970 e 1980, ele desenvolveu sua teoria da The Mind Society, com base na idéia de que a mente humana é uma grande comunidade de processos computacionais simples, mas muito diferentes, que ele chamou de agentes. Em seu livro, descrevendo a teoria, Minsky resume tudo o que considera uma vantagem desse ponto de vista:
Que truque nos torna inteligentes? O truque é que não há foco. O poder da mente nasce da nossa grande variedade, e não de qualquer princípio simples e ideal.
Respondendo às resenhas de seu livro, Minsky especulou ainda mais a motivação para escrever o livro, citando um argumento semelhante baseado na neuroanatomia e na psicologia evolutiva:
Agora sabemos que o próprio cérebro consiste em centenas de locais e núcleos diferentes, cada um dos quais com elementos e propriedades arquiteturais significativamente diferentes, e que muitos deles estão envolvidos na realização de aspectos claramente diferentes de nossa atividade mental. , , , «» «» .
Minsky, é claro, não está sozinho em sustentar esse ponto de vista; Dou-o como exemplo, apoiando-me em tais argumentos. Acho esses argumentos interessantes, mas não acho que a evidência a favor deles seja convincente o suficiente. De fato, o cérebro consiste em um grande número de áreas diferentes que desempenham funções diferentes, mas não decorre disso que é impossível dar uma explicação simples do cérebro. Talvez essas diferenças arquitetônicas surjam com base em um princípio básico comum, assim como os movimentos de cometas, planetas, sol e estrelas surgem de uma única força de atração. Nem Minsky nem mais ninguém puderam provar de forma convincente a ausência de tais princípios.Sou tendencioso a favor da existência de um algoritmo simples para inteligência. Basicamente, essa ideia, apesar dos argumentos não convincentes apresentados acima, gosto porque é otimista. No caso da pesquisa científica, o otimismo injustificado geralmente se mostra mais produtivo do que o pessimismo justificado, uma vez que o otimista tem a coragem de tentar tentar algo novo. Esse é o caminho para a descoberta, mesmo que você não esteja descobrindo o que esperava originalmente. Um pessimista pode se mostrar mais "certo" no sentido estrito, mas abrirá menos que um otimista.Esse ponto de vista contrasta fortemente com o modo como geralmente avaliamos idéias, tentando entender se elas estão certas ou erradas. Essa é uma estratégia inteligente para trabalhar com estudos diários ou pequenos. No entanto, é possível avaliar de tal maneira que idéias grandes e ousadas que definem um programa de pesquisa inteiro estejam incorretas. Às vezes, temos apenas evidências fracas sobre a exatidão da ideia. Podemos recusar humildemente segui-lo e passar todo o nosso tempo examinando cuidadosamente as evidências disponíveis, tentando descobrir qual é a verdadeira. Ou podemos simplesmente aceitar que até agora ninguém sabe ao certo e trabalhar ativamente no desenvolvimento de uma idéia grande e ousada, percebendo que, embora não tenhamos garantias de sucesso, só assim podemos expandir os limites de nosso entendimento.Dado tudo isso, em sua forma mais otimista, ainda não acredito que algum dia encontraremos um algoritmo simples para a inteligência. Mais precisamente, não acredito que alguma vez encontraremos a oportunidade de escrever em python (ou C, ou Lisp, ou outra coisa) um programa muito curto - digamos, até mil linhas de código - que implementa inteligência artificial. E acho que nunca encontraremos uma rede neural descrita muito simples que possa implementar a IA. Mas acredito que vale a pena agir como se pudéssemos encontrar esse programa ou rede. Esse é o caminho para as idéias e, a seguir, podemos um dia entender o suficiente para escrever um programa mais longo ou criar uma rede mais complexa que demonstre inteligência. Portanto, vale a pena agir como se houvesse um algoritmo extremamente simples para inteligência.Na década de 1980, Jack Schwartz , um excelente matemático e cientista da computação , foi convidado para um debate entre apoiadores da AI e céticos. O debate ficou fora de controle, os apoiadores começaram a fazer declarações excessivas sobre coisas incríveis que estavam prestes a aparecer, e os céticos apenas reforçaram seu pessimismo, dizendo que a IA era simplesmente impossível de criar. Schwartz estava presente fora do debate e ficou em silêncio quando a discussão se intensificou. Durante a pausa, ele foi convidado a falar e descrever seus pensamentos sobre o tópico em discussão. Ele disse: "Bem, antes de algumas dessas idéias, cem outros prêmios Nobel podem acontecer." Na minha opinião, esta é a resposta perfeita. A chave para a IA são idéias simples e poderosas, e podemos e devemos buscá-las de maneira otimista. Mas precisaremos de muitas dessas idéias e ainda temos um longo caminho a percorrer!