Aplicação da teoria da informação à busca de sinais de civilizações extraterrestres

Se você está procurando sinais de civilizações alienígenas, por que não praticar primeiro em alguns sistemas de transferência de informações que não pertencem aos seres humanos existentes em nosso planeta? Com as baleias, um sistema global de comunicações existe há milhões de anos - mais do que o Homo sapiens geralmente existe. As abelhas, comunicando-se em parte através da dança, realizaram um debate democrático sobre os melhores lugares para cavar por milhões de anos antes que as pessoas apresentassem um sistema político democrático. Cheio de outros exemplos. Nenhum dos meus conhecidos que estudou o sistema de comunicação de outros animais, depois disso, chegou à conclusão de que essa espécie era mais burra do que ele pensava.
Estudando os meios de comunicação animal, meus colegas e eu desenvolvemos um novo tipo de detector, um filtro de "inteligência de comunicação" que determina se um sinal do espaço pertence a uma civilização tecnologicamente avançada. A maioria das tentativas anteriores no projeto SETI procurou transmissões de rádio em uma faixa de frequência estreita ou sinais ópticos que oscilavam rapidamente. A julgar pelo nosso conhecimento no campo da astrofísica, esses sinais seriam claramente artificiais, e sua descoberta significaria a presença de tecnologias capazes de transmitir um sinal a distâncias interestelares. Os SETIs geralmente descartam sinais de rádio de banda larga e pulsos ópticos lentos, cuja origem é menos óbvia. Embora esses sinais possam muito bem ter sido enviados por seres sencientes, eles podem vir de fontes naturais de ondas de rádio, como nuvens de gás interestelares, e ainda não tivemos uma boa maneira de distinguir entre eles.

Simplificando, já podíamos receber uma mensagem de criaturas inteligentes e negligenciá-la, porque não correspondia às nossas expectativas sobre como esse sinal deveria parecer. Esta pode ser a razão pela qual, após 50 anos de pesquisa, não encontramos nenhuma comunicação interestelar.
Na última década e meia, meus colegas e eu propusemos uma maneira melhor. Aplicamos a
teoria da informação aos sistemas de comunicação de pessoas e animais, e agora podemos dizer com certeza em que casos certos seres vivos transmitem idéias complexas uns aos outros, sem ao menos saber o que estão dizendo. Usamos o termo “sistema de comunicação” para não decidir antecipadamente se outras espécies têm uma linguagem no sentido humano da palavra. As comunicações complexas obedecem às regras gerais de sintaxe, das quais se segue a existência do que pode ser chamado de "conteúdo razoável". Se tivermos uma mensagem grande o suficiente, podemos avaliar o grau de complexidade ou a estrutura das regras. Na matemática da teoria da informação, essa estrutura é chamada de "
entropia condicional da informação " e é composta de conexões matemáticas entre unidades elementares de comunicação, como letras e
fonemas . No discurso cotidiano, consideramos a gramática uma estrutura e, em um nível mais básico, a compilação de palavras e frases a partir de sons. E pela primeira vez no Instituto SETI em Mountain View, na Califórnia, começamos a procurar essas estruturas nos dados coletados pelo SETI.
Meus colegas Brenda McCowan, Sean Hanser, da Universidade da Califórnia em Davis, e eu decidimos estudar criaturas, socialmente complexas e altamente dependentes da comunicação acústica, e usando sinais sonoros que poderíamos classificar. Portanto, nossos três primeiros indivíduos foram
golfinhos (Tursiops truncatus),
macacos-esquilo (Saimiri sciureus) e
baleias jubarte (Megaptera novaeangliae).
Um aspecto da linguística humana, manifestado nos primeiros estudos de palavras, letras e fonemas, é conhecido como
lei de Zipf , nomeada para o linguista de Harvard
George Zipf . Nos textos em inglês, as letras "e" são mais do que as letras "t", as letras "t" são mais do que as letras "a" e assim por diante, até o mais raramente usado "q". Se você criar uma lista de letras de "e" a "q" em frequência decrescente e construir a frequência de seu uso em um gráfico logarítmico, esses valores se estabelecerão em uma linha reta inclinada a 45 graus - ou seja, em uma linha reta com uma inclinação de -1 [Simplificando, a frequência de uso da enésima letra é inversamente proporcional ao seu número de série n / aprox. transl.]. Se você fizer o mesmo com texto composto de caracteres chineses, receberá o mesmo viés. O mesmo vale para letras, palavras ou fonemas para conversas em japonês, alemão, hindi e dezenas de outros idiomas. E balbuciar balbuciar não obedece à lei de Zipf. Seu viés é menor que -1, porque emite sons quase por acidente. Mas à medida que você aprende o idioma, o viés aumenta gradualmente e chega a -1 aos 24 meses de idade.
Os linguistas matemáticos afirmam que esse viés de -1 indica que a sequência de sons ou símbolos da escrita contém complexidade suficiente para pertencer ao idioma. Essa é uma condição necessária, mas não suficiente - ou seja, este é o primeiro teste de complexidade, mas não prova de sua presença. O próprio Zipf acreditava que a razão desse viés de -1 está em um compromisso, que ele chamou de "princípio do menor esforço". Esse é o equilíbrio entre o indivíduo transmissor que está tentando usar menos energia para enviar o sinal e o destinatário que deseja obter mais redundância para garantir que toda a mensagem seja recebida.
O principal na aplicação da teoria da informação é o isolamento das unidades de sinal. Por exemplo, se traçarmos todos os pontos e traços do código Morse no gráfico, obteremos uma inclinação Zipf da ordem de 0,2. Mas se considerarmos a sequência de pontos e hífens - ponto, ponto, traço, traço, ponto e traço e variações mais longas como unidades elementares - o viés mudará para -1, refletindo como as letras do alfabeto são codificadas neste sistema. Dessa maneira, com a ajuda da engenharia reversa, as unidades de significado originais podem ser reconhecidas.
A maioria dos linguistas sugeriu que a lei de Zipf caracteriza apenas as línguas humanas. Ficamos felizes em descobrir, plotando a frequência de assobios de golfinhos adultos em um gráfico que eles também obedecem à lei de Zipf! Mais tarde, quando dois pequenos golfinhos-nariz-de-garrafa nasceram no Sea World, na Califórnia, registramos seus assobiadores infantis e descobrimos que, para eles, a encosta Zipf correspondia à do murmúrio de bebês humanos. Acontece que os bebês golfinhos murmuram e assobiam, aprendendo seu sistema de comunicação da mesma maneira que os bebês humanos aprendem a língua. Quando os golfinhos completaram 12 meses de idade, a frequência de distribuição dos sons em seu apito atingiu uma inclinação de -1.
Embora ainda não tenhamos decifrado o que os golfinhos dizem, descobrimos que eles e as baleias têm sistemas de comunicação com uma complexidade interna que se aproxima da linguagem humana. Essa complexidade torna tolerante a falhas de comunicação. Qualquer criatura que troque informações deve ser capaz de fazer isso, apesar do ruído ao redor, obstáculos e outros fenômenos que interferem na propagação do sinal. A linguagem humana é estruturada para fornecer redundância. Em um nível básico, essa estrutura determina a probabilidade de uma determinada carta. Se eu lhe disser o que a palavra pretende, você pode adivinhar que a primeira letra dessa palavra será "t", já que esta é a primeira letra mais popular para palavras em inglês. Seu palpite será o mais provável, mas um pouco informativo. Podemos dizer que você escolheu a opção mais fácil. Se você parasse na letra "q" e adivinhasse, teria recebido informações mais precisas sobre a palavra que eu tinha concebido, se realmente começar com "q".
Vamos seguir em frente. Se eu dissesse que estava pensando na segunda letra da palavra, cuja primeira letra é "q", você adivinharia imediatamente que essa letra é "u". Porque Porque você [o leitor de inglês] sabe que essas duas letras em inglês ocorrem junto com quase 100% de probabilidade. Para adivinhar as informações ausentes, você usou não apenas a probabilidade das letras aparecerem, mas também a probabilidade condicional associada às duas letras - a probabilidade de a palavra conter a letra “u” se for conhecido que a letra “q” já existe. Nosso cérebro usa probabilidades condicionais quando é necessário corrigir erros na transmissão de informações - texto confuso em uma impressão com um cartucho acabando ou palavras pouco distinguíveis em uma chamada barulhenta.

Em inglês, as probabilidades condicionais podem ser especificadas até nove palavras seguidas. Se uma palavra estiver faltando, você poderá adivinhar que tipo de palavra ela é. Se você perder duas palavras seguidas, ainda poderá restaurá-las com frequência. Um pequeno exemplo de uma frase sem uma única palavra: "Como você se sente hoje?". É fácil adivinhar que está faltando. Agora considere uma frase sem duas palavras: "Como você está hoje?" Pode haver: "Como Inocente se sente hoje?" Pode haver outras opções. Obviamente, quanto mais palavras faltam, mais difícil é entendê-las a partir do contexto e menor a probabilidade condicional. Para a maioria das línguas escritas da humanidade, a probabilidade condicional desaparece quando faltam cerca de nove palavras seguidas. Se faltarem 10 palavras, você não fará ideia do que podem ser essas palavras. Na linguagem da teoria da informação, isso significa que a entropia da palavra humana atinge a nona ordem.
Encontramos probabilidades condicionais semelhantes em sistemas de comunicação animal. Por exemplo, gravamos os sons de baleias jubarte conversando no sudeste do Alasca com Fred Sharp, da Alaska Whale Foundation. As baleias jubarte são conhecidas por suas músicas, que geralmente são gravadas quando se aproximam do Havaí para procriação. No Alasca, seus sons são muito diferentes: os sons destinados a conduzir peixes na rede consistem em gorgolejos e gritos sociais, não em canções. Gravamos essas vocalizações na presença e na ausência de ruído do barco. Calculamos em que medida o oceano funciona como uma estática em uma linha telefônica. Em seguida, usamos a teoria da informação para quantificar quanto as baleias precisariam desacelerar sua vocalização para receber mensagens sem erros.
Como esperado, na presença de ruído do barco, as baleias diminuíram a velocidade da vocalização, assim como uma pessoa diminui a velocidade de uma conversa telefônica na presença de ruído. Mas eles diminuíram em apenas 3/5 a quantia que teoricamente deveriam ter atingido para garantir a transmissão de mensagens sem erros de interpretação. Como eles conseguiram desacelerar tão levemente quando o ruído do ambiente claramente exigia mais? Pensamos nisso por algum tempo e depois percebemos que a estrutura das regras em seu sistema de comunicação é provavelmente tal que os dois quintos restantes do sinal podem ser restaurados. As baleias jubarte usavam as probabilidades condicionais de suas contrapartes sônicas. Eles não precisavam receber a mensagem inteira para poder preencher os espaços vazios.

Encontramos a estrutura interna na comunicação dos golfinhos. A diferença era que os golfinhos tinham cerca de 50 sinais principais e as baleias jubarte tinham centenas deles. Agora estamos coletando informações para determinar qual é o grau máximo de entropia em um sistema de comunicação de baleia jubarte.
Para testar a possibilidade de nossa abordagem de separar a astrofísica de sinais razoáveis, passamos a exemplos da radioastronomia. Quando os astrônomos Jocelyn Bell Burnel e Anthony Hewish descobriram pulsares estelares em 1967, eles foram apelidados de "MZCH", ou seja, "homenzinhos verdes" [LGM]. Devido à clara periodicidade dessas fontes de rádio, alguns cientistas começaram a especular que elas podem ser os faróis de civilizações extraterrestres avançadas. Com a ajuda de Simon Johnston, da Australian National Radio Astronomy Society, analisamos os pulsos
pulsares em Sails e obtivemos a inclinação Zipf de -0,3. Isso não corresponde a nenhum dos idiomas conhecidos. Além disso, não encontramos praticamente nenhuma estrutura de probabilidade condicional nos sinais pulsares. E, de fato, hoje se sabe que os pulsares são os remanescentes naturais das supernovas. Acontece que a teoria da informação pode facilmente distinguir entre um sinal inteligente imaginário e uma fonte natural.
Agora, estamos analisando dados de microondas obtidos do Conjunto de Antenas Allen do Instituto SETI, composto por 42 telescópios, visualizando na faixa de 1 a 10 GHz. Além do esquema usual de busca por ondas de rádio em banda estreita, estamos começando a aplicar medidas da teoria da informação. Se, por exemplo, encontrarmos sinais que obedecem à lei de Zipf, isso nos inspirará a continuar trabalhando e a procurar a estrutura sintática nos sinais na tentativa de determinar a complexidade de uma mensagem em potencial.
Para transferir conhecimento, mesmo uma civilização extraterrestre muito avançada precisará obedecer às regras da teoria da informação. Mesmo que provavelmente não possamos decifrar essa mensagem devido à falta de símbolos comuns (temos o mesmo problema com as baleias jubarte), podemos ter uma idéia da complexidade de seu sistema de comunicação - e, consequentemente, dos processos de pensamento. Se, por exemplo, as probabilidades condicionais do sinal encontrado no SETI forem da 20ª ordem, isso significará não apenas a natureza artificial do sinal, mas também a enorme complexidade da linguagem em comparação com qualquer outra terrestre. Teremos uma medida quantitativa da complexidade dos processos de pensamento que transmitem informações aos seres extraterrestres.
Lawrence Doyle é diretor do Instituto de Metafísica da Física no Principle College, pc. Illinois e organizador do Grupo de Astrofísica Quântica do SETI. Ele era membro da missão Kepler da NASA e liderou a equipe que descobriu o primeiro planeta com uma órbita múltipla (apelidada de Tatooine).