Aplicación de la teoría de la información a la búsqueda de señales de civilizaciones extraterrestres.

Si está buscando señales de civilizaciones extraterrestres, ¿por qué no practicar primero en algunos sistemas de transferencia de información que no pertenecen a humanos que existen en nuestro planeta? Con las ballenas, un sistema de comunicaciones global ha existido durante millones de años, más tiempo del que existe el Homo sapiens Las abejas, comunicándose entre sí en parte a través del baile, mantuvieron un debate democrático sobre los mejores lugares para excavar durante millones de años antes de que la gente creara un sistema político democrático. Lleno de otros ejemplos. Ninguno de mis conocidos que estudiaron el sistema de comunicación de otros animales, después de eso, llegó a la conclusión de que esta especie era más tonta de lo que pensaba.
Al estudiar los medios de comunicación animal, mis colegas y yo desarrollamos un nuevo tipo de detector, un filtro de "inteligencia de comunicación" que determina si una señal del espacio pertenece a una civilización tecnológicamente avanzada. La mayoría de los intentos anteriores en el proyecto SETI buscaron transmisiones de radio en un rango de frecuencia estrecho o señales ópticas de parpadeo rápido. A juzgar por nuestro conocimiento en el campo de la astrofísica, tales señales serían claramente artificiales, y su descubrimiento significaría la presencia de tecnologías capaces de transmitir una señal a distancias interestelares. Los SETI generalmente descartan señales de radio de banda ancha y pulsos ópticos lentos, cuyo origen es menos obvio. Aunque estas señales podrían muy bien haber sido enviadas por seres sensibles, podrían provenir de fuentes naturales de ondas de radio, como las nubes de gas interestelar, y todavía no hemos tenido una buena manera de distinguirlas.

En pocas palabras, ya podríamos recibir un mensaje de criaturas inteligentes y descuidarlo, porque no estuvo a la altura de nuestras expectativas sobre cómo debería ser esa señal. Esta puede ser la razón por la que durante 50 años de búsqueda, no hemos encontrado ninguna comunicación interestelar.
Durante la última década y media, mis colegas y yo hemos encontrado una mejor manera. Aplicamos la
teoría de la información a los sistemas de comunicación de personas y animales, y ahora podemos decir con certeza en qué caso ciertos seres vivos transmiten ideas complejas entre sí, sin siquiera saber lo que están diciendo. Utilizamos el término "sistema de comunicación" para no decidir de antemano si otras especies tienen un idioma en el sentido humano de la palabra. Las comunicaciones complejas obedecen las reglas generales de sintaxis, de las cuales se deriva la existencia de lo que se puede llamar "contenido razonable". Si tenemos un mensaje lo suficientemente grande, podemos evaluar el grado de complejidad o la estructura de las reglas. En las matemáticas de la teoría de la información, esta estructura se denomina "
entropía de información condicional " y se compone de conexiones matemáticas entre unidades elementales de comunicación, como letras y
fonemas . En el discurso cotidiano, consideramos que la gramática es una estructura y, en un nivel más básico, la compilación de palabras y oraciones a partir de sonidos. Y por primera vez en el Instituto SETI en Mountain View en California, comenzamos a buscar tales estructuras en los datos recopilados por SETI.
Mis colegas, Brenda McCowan, Sean Hanser, de la Universidad de California en Davis, y yo decidimos estudiar criaturas, tanto socialmente complejas como altamente dependientes de la comunicación acústica, y usando señales de sonido que pudiéramos clasificar. Por lo tanto, nuestros primeros tres sujetos fueron
delfines nariz de
botella (Tursiops truncatus),
monos ardilla comunes (Saimiri sciureus) y
ballenas jorobadas (Megaptera novaeangliae).
Un aspecto de la lingüística humana, manifestado en los primeros estudios de palabras, letras y fonemas, se conoce como la
ley de Zipf , llamada así por el lingüista de Harvard
George Zipf . En los textos en inglés, las letras "e" son más que las letras "t", las letras "t" son más que las letras "a", y así sucesivamente, hasta la "q" más raramente utilizada. Si construye una lista de letras de "e" a "q" en frecuencia decreciente, y construye la frecuencia de su uso en un gráfico logarítmico, entonces estos valores se establecen en una línea recta inclinada a 45 grados, es decir, en una línea recta con una pendiente de -1 [En pocas palabras, La frecuencia de uso de la enésima letra es inversamente proporcional a su número de serie n / aprox. transl.]. Si haces lo mismo con el texto compuesto por caracteres chinos, obtienes el mismo sesgo. Lo mismo será cierto para las letras, palabras o fonemas para conversaciones en japonés, alemán, hindi y docenas de otros idiomas. Y balbucear balbucear no obedece la ley de Zipf. Su sesgo es menor que -1, porque produce sonidos casi por accidente. Pero a medida que aprende el idioma, el sesgo aumenta gradualmente y alcanza -1 a la edad de 24 meses.
Los lingüistas matemáticos afirman que este sesgo de -1 indica que la secuencia de sonidos o símbolos de escritura contiene suficiente complejidad para pertenecer al idioma. Esta es una condición necesaria pero no suficiente, es decir, esta es la primera prueba de complejidad, pero no prueba de su presencia. El propio Zipf creía que la razón de este sesgo de -1 radica en un compromiso, al que llamó el "principio de menor esfuerzo". Este es el equilibrio entre el individuo transmisor que está tratando de usar menos energía para enviar la señal y el destinatario que quiere obtener más redundancia para asegurarse de recibir todo el mensaje.
Lo principal en la aplicación de la teoría de la información es el aislamiento de las unidades de señal. Por ejemplo, si trazamos todos los puntos y guiones del código Morse en el gráfico, obtenemos una pendiente Zipf del orden de 0.2. Pero si tomamos la secuencia de puntos y guiones (punto, punto, guión, guión, punto y guión, y variaciones más largas como unidades elementales), el sesgo cambiará a -1, lo que refleja cómo se codifican las letras del alfabeto en este sistema. De esta manera, con la ayuda de la ingeniería inversa, se pueden reconocer las unidades originales de significado.
La mayoría de los lingüistas han sugerido que la ley de Zipf caracteriza solo los idiomas humanos. ¡Con gusto descubrimos trazando la frecuencia de silbidos de delfines nariz de botella adultos en un gráfico que también obedecen la ley de Zipf! Más tarde, cuando nacieron dos pequeños delfines nariz de botella en Sea World en California, registramos sus silbidos infantiles y descubrimos que para ellos la pendiente Zipf correspondía a la del murmullo de bebés humanos. Resulta que los bebés de delfines murmuran y silban, aprendiendo su sistema de comunicación de la misma manera que los bebés humanos aprenden el lenguaje. Cuando los delfines cumplieron 12 meses, la frecuencia de distribución de los sonidos en su silbato alcanzó una pendiente de -1.
Aunque todavía tenemos que descifrar lo que dicen los delfines, hemos descubierto que ellos y las ballenas tienen sistemas de comunicación con una complejidad interna que se aproxima al lenguaje humano. Esta complejidad hace que la comunicación sea tolerante a fallas. Cualquier criatura que intercambie información debería poder hacer esto, a pesar del ruido circundante, los obstáculos y otros fenómenos que interfieren con la propagación de la señal. El lenguaje humano está estructurado para proporcionar redundancia. En un nivel básico, esta estructura determina la probabilidad de una letra dada. Si te digo a qué se refiere la palabra, puedes adivinar que la primera letra de esta palabra será "t", ya que esta es la primera letra más popular para las palabras en inglés. Su presentimiento será el más probable, pero un poco informativo. Podemos decir que ha elegido la opción más fácil. Si se detuvo en la letra "q" y adivinó, habría recibido información más precisa sobre la palabra que había concebido, si realmente comienza con "q".
Sigamos adelante. Si dijera que estaba pensando en la segunda letra de la palabra, cuya primera letra es "q", inmediatamente adivinaría que esta letra es "u". Por qué Porque usted [el lector de inglés] sabe que estas dos letras en inglés ocurren juntas con casi un 100% de probabilidad. Para adivinar la información faltante, usó no solo la probabilidad de que aparezcan las letras, sino también la probabilidad condicional asociada con las dos letras: la probabilidad de que la palabra contenga la letra "u" si se sabe que la letra "q" ya existe. Nuestro cerebro utiliza probabilidades condicionales cuando es necesario corregir errores en la transmisión de información: texto borroso en una copia impresa con un cartucho que se agota, o palabras mal distinguibles en una llamada telefónica ruidosa.

En inglés, las probabilidades condicionales se pueden especificar hasta nueve palabras seguidas. Si falta una palabra, puede adivinar qué tipo de palabra es. Si pierde dos palabras seguidas, aún puede restaurarlas a menudo desde el contexto. Un breve ejemplo de una oración sin una sola palabra: "¿Cómo te sientes ___ hoy?". Es fácil adivinar que te estás perdiendo. Ahora considere una oración sin dos palabras: "¿Cómo ___ ___ usted mismo hoy?" Puede haber: "¿Cómo se siente Inocente hoy?" Puede haber otras opciones. Obviamente, cuantas más palabras faltan, más difícil es comprenderlas desde el contexto y menor es su probabilidad condicional. Para la mayoría de los idiomas escritos de la humanidad, la probabilidad condicional desaparece cuando se pierden unas nueve palabras seguidas. Si faltan 10 palabras, no tendrá idea de cuáles podrían ser esas palabras. En el lenguaje de la teoría de la información, esto significa que la entropía de la palabra humana alcanza el noveno orden.
Encontramos probabilidades condicionales similares en los sistemas de comunicación animal. Por ejemplo, grabamos los sonidos de las ballenas jorobadas hablando en el sureste de Alaska con Fred Sharp de la Alaska Whale Foundation. Las ballenas jorobadas son conocidas por sus canciones, que generalmente se graban cuando se acercan a Hawai para reproducirse. En Alaska, sus sonidos son muy diferentes: los sonidos destinados a conducir peces en la red consisten en gorjeos y gritos sociales, no en canciones. Grabamos estas vocalizaciones tanto en presencia como en ausencia de ruido del barco. Calculamos en qué medida el océano funciona como una estática en una línea telefónica. Luego, utilizamos la teoría de la información para cuantificar la cantidad de ballenas que necesitarían para ralentizar su vocalización para recibir mensajes sin errores.
Como era de esperar, en presencia de ruido del bote, las ballenas disminuyeron la velocidad de la vocalización, al igual que una persona ralentiza una conversación telefónica en presencia de ruido. Pero disminuyeron en solo 3/5 de la cantidad que en teoría deberían haber logrado para garantizar la transmisión de mensajes sin malas interpretaciones. ¿Cómo lograron hacer una desaceleración tan leve cuando el ruido ambiental claramente requería más? Pensamos en esto por algún tiempo, y luego nos dimos cuenta de que la estructura de las reglas en su sistema de comunicación es probablemente tal que las dos quintas partes restantes de la señal pueden restaurarse. Las ballenas jorobadas usaban las probabilidades condicionales de su contraparte sónica de palabras. No necesitaban recibir el mensaje completo para poder completar los espacios vacíos.

Encontramos la estructura interna en la comunicación de los delfines. La diferencia era que los delfines tenían alrededor de 50 señales principales, y las ballenas jorobadas tenían cientos de ellas. Ahora estamos recopilando información para determinar cuál es el grado máximo de entropía en un sistema de comunicación de ballenas jorobadas.
Para probar la posibilidad de nuestro enfoque para separar la astrofísica de las señales razonables, pasamos a ejemplos de radioastronomía. Cuando los astrónomos Jocelyn Bell Burnel y Anthony Hewish descubrieron los púlsares estelares en 1967, fueron apodados "MZCH", es decir, "pequeños hombres verdes" [LGM]. Debido a la clara periodicidad de estas fuentes de radio, algunos científicos han comenzado a especular que pueden ser los faros de civilizaciones extraterrestres avanzadas. Con la ayuda de Simon Johnston de la Sociedad Australiana de Radioastronomía Nacional, analizamos los pulsos de
púlsar en Sails y obtuvimos la pendiente Zipf de -0.3. Esto no coincide con ninguno de los idiomas conocidos. Además, no encontramos prácticamente ninguna estructura de probabilidad condicional en las señales del púlsar. Y, de hecho, hoy se sabe que los púlsares son los restos naturales de las supernovas. Resulta que la teoría de la información puede distinguir fácilmente entre una señal inteligente imaginaria y una fuente natural.
Ahora estamos analizando los datos de microondas obtenidos del Conjunto de Antenas Allen del Instituto SETI, que consta de 42 telescopios, que se ven en el rango de 1 a 10 GHz. Además del esquema habitual de búsqueda de ondas de radio de banda estrecha, estamos comenzando a aplicar medidas desde la teoría de la información. Si, por ejemplo, encontramos señales que obedecen la ley de Zipf, esto nos inspirará a seguir trabajando y a buscar la estructura sintáctica en las señales en un intento por determinar la complejidad de un mensaje potencial.
Para transferir conocimiento, incluso una civilización extraterrestre muy avanzada deberá obedecer las reglas de la teoría de la información. Incluso si probablemente no podamos descifrar dicho mensaje debido a la falta de símbolos comunes (tenemos el mismo problema con las ballenas jorobadas), podemos tener una idea de la complejidad de su sistema de comunicación y, por lo tanto, de los procesos de pensamiento. Si, por ejemplo, las probabilidades condicionales de la señal encontrada en SETI son del orden 20, esto significará no solo la naturaleza artificial de la señal, sino también la enorme complejidad del lenguaje en comparación con cualquier terrestre. Tendremos una medida cuantitativa de la complejidad de los procesos de pensamiento que transmiten información a los seres extraterrestres.
Lawrence Doyle es director del Instituto de Metafísica de Física de Principle College, pc. Illinois, y organizador del Grupo de Astrofísica Cuántica en SETI. Fue miembro de la misión Kepler en la NASA y dirigió el equipo que descubrió el primer planeta con una órbita múltiple (apodado Tatooine).