Como construir um microscópio probabilístico

imagem

Segundo rumores, a 20th Century Fox lançará um remake do filme de ficção científica de 1966 Fantastic Journey em alguns anos . Segundo a trama, os protagonistas são comprimidos e injetados no corpo humano, através dos quais viajam em um submarino de tamanho microscópico. Nessas escalas, o fluxo sanguíneo se transforma em turbulência perigosa, os corpos brancos podem engolir um navio, e a tensão superficial de uma gota se transforma em uma barreira intransponível.

A expansão destrói nossa compreensão intuitiva do que é importante para nós, do que tem poder e do que é perigoso. Para sobreviver, você precisa reconfigurar a intuição. Mesmo que qualquer efeito em escalas familiares possa ser negligenciado, um efeito ligeiramente menos desprezível pode se tornar incrivelmente importante em escalas desconhecidas.

imagem

Como entendemos o que pode ser importante em uma escala desconhecida? Acontece que existe uma teoria matemática de grandes desvios que funciona com probabilidades da mesma maneira que o raio decrescente trabalhou com a equipe da Fantastic Travel. Enquanto a teoria clássica da probabilidade lida com as probabilidades de eventos comuns, a teoria dos grandes desvios se especializa em eventos extremamente raros que surgem quando vários outros incomuns se fundem. Ele nos permite ampliar um microscópio probabilístico para determinar as maneiras menos prováveis ​​de como um evento extremamente improvável pode ocorrer.

A partir do momento em que a teoria foi formulada há 50 anos, o matemático S.R. Srinivasa Varadhan, foi cuidadosamente estudado e desenvolvido. Ele mostra como o comportamento médio de um sistema aleatório pode se desviar do típico. Ao comparar cuidadosamente todas as raras possibilidades, você pode ver como muitas vezes subestimamos as probabilidades de eventos incomuns quando limitamos nossa atenção às formas usuais em que elas podem ocorrer.

Vamos fazer uma viagem com um microscópio em nossas mãos

Operador de alta frequência


Um operador de alta frequência realiza longas sequências de transações. Em cada um deles, sua condição com um valor inicial de US $ 1.000.000 aumenta em meio por cento ou diminui em meio por cento, e a probabilidade de qualquer resultado é ½. Quanto dinheiro ele provavelmente terá em um milhão de transações?

Ele pode raciocinar assim: cada transação aumenta ou diminui o mesmo valor, portanto o valor médio não muda e, no final, ele deve ter US $ 1 milhão restante.

E aqui está outro argumento: quando ele vence, sua fortuna é multiplicada por 1,005. Ao perder, então em 0,995. Tanto isso como outro o multiplica por 1.005 x 0.995 = 0,999975. Para um milhão de transações, 500.000 desses e outros casos ocorrerão; portanto, o milhão original se transformará em $ 1.000.000 x (0,999975) 500.000, que é aproximadamente igual a US $ 3,73.

Qual raciocínio é verdadeiro? Curiosamente, ambos, mas o segundo será mais importante. Muito provavelmente, o comerciante não terá mais nada, mas se aumentarmos o conjunto de eventos improváveis ​​em que ele vence, veremos essas opções nas quais ele vence bastante. A função principal aqui é I (x), uma função de relacionamento que mostra como a probabilidade de obter o resultado x diminui com um aumento no número de transações. Aqui x é um número, mas, dependendo da tarefa, pode ser uma trajetória aleatória, uma estrutura de rede aleatória ou geometria aleatória do universo. I (x) = 0 corresponde a um caso típico com uma probabilidade não muito pequena - no nosso caso, esta é uma opção em que o estado do trader diminui com uma taxa exponencial. Grandes valores de I (x) correspondem ao exponencialmente menos provável x.

O valor médio determina um compromisso entre uma probabilidade exponencialmente decrescente e um estado exponencialmente crescente. Alguns de x acabam sendo muito grandes, apesar do pequeno tamanho da probabilidade correspondente a eles. A otimização desse compromisso confirma a ingênua noção intuitiva de que o resultado médio da negociação será igual a US $ 1 milhão - embora você possa ter certeza de que quase todos os traders perderão quase tudo. Se houver 1 milhão de traders, e cada um deles fizer um milhão de transações com capital de US $ 1 milhão, o resultado médio será realmente igual a US $ 1 milhão. Mas essa média será determinada por 1 a 2 traders, em cujas contas haverá centenas de bilhões de dólares. A maior parte do dinheiro estará nas contas de um pequeno número de comerciantes aleatórios,e a maioria dos traders perderá tudo.

As chances de ganhar ou permanecer por conta própria não excedem 1 em 100.

Nó de telefone


O principal problema das redes de comunicação é determinar a probabilidade de congestionamento. O buffer de dados do nó de telefone ou da Internet pode ter uma capacidade suficiente para a carga média, mas não o suficiente para lidar com uma quantidade incomum de solicitações simultâneas.

Os matemáticos do laboratório de Bella, Alan Weiss e Adam Shwartz, indicaram a aplicação da teoria dos grandes desvios às redes de comunicação em 1995. Em teoria, a probabilidade de um evento raro diminui exponencialmente com o tamanho do sistema. Na linguagem da matemática, a probabilidade muda como e -n * I (x), onde n denota tamanho, x é o caminho para um evento raro, I é a função de proporção que fornece a probabilidade relativa de escolher esse caminho. Eventos raros geralmente acontecem de maneira previsível - que minimiza a função de relacionamento - e ocorrem em grupos separados por longos intervalos de tempo.

Em qualquer tarefa, a dificuldade reside em determinar (e interpretar com êxito) a função de relacionamento. Ele fornece a probabilidade relativa de todas as seqüências de cargas, das quais combinações que levam a sobrecargas e com o menor valor da função de razão, ou seja, a maior probabilidade, podem ser derivadas. Essas combinações determinam a frequência do congestionamento, bem como sua natureza: quantas fontes estarão ativas, quais serão e com que rapidez ela conseguirá lidar com o congestionamento.

Como um exemplo simples, considere uma rede telefônica na qual cada um de um grande número de usuários - digamos, um milhão - se conecta em momentos aleatórios, para que, em média, permaneçam na linha 1% do tempo. (Assumimos que eles fazem chamadas independentemente uma da outra e com chances iguais a qualquer hora do dia). A rede precisa de 10.000 linhas de comunicação para atender às demandas médias. A empresa, usando grandes desvios, estimou que, quando 10.500 linhas de comunicação fossem comissionadas, ela ficaria em estado de sobrecarga por cerca de 2 minutos por ano.

Imagine que, além da rede, meio milhão de jogadores comece a usar consoles que estão na linha 1% do tempo, mas que exijam grande largura de banda - eles pegam 5 linhas cada. Os novos usuários também precisam, em média, de 10.000 linhas, então a empresa decide dobrar sua capacidade para 21.000 linhas. Mas, como resultado, a rede está sobrecarregada por vários minutos por semana. Uma análise da função de relacionamento mostra que jogadores que usam a mesma capacidade de rede, em média, como outros usuários, usam 8% mais linhas durante o congestionamento e que 250 linhas adicionais restauram o tempo de atividade da rede. Se traçarmos a carga de rede segundos antes do congestionamento, veremos que ela quase sempre segue um certo padrão, inclinando-se suavemente para cima antes decomo bater abruptamente no teto - e essa curva também pode ser calculada como uma função de minimização da relação.

Nas redes descentralizadas modernas que trocam pacotes, a função de relacionamento pode ajudar a detectar botnets, redes de computadores infectados por vírus que os criminosos usam para enviar spam e ataques a sistemas. A idéia é identificar o computador que controla a rede de bots que se comunica com um número extraordinariamente grande de outros computadores e, em seguida, confirma a identificação encontrando correlações incomuns nos computadores com os quais se comunica. Para esse fim, os pesquisadores da Universidade de Boston usaram uma função de relacionamento que poderia descrever, entre todas as razões, por que um conjunto improvável de computadores desconectados poderia se comunicar com o mesmo servidor remoto, qual das opções para correlacionar suas comunicações seria mais provável. (Wang, J. & Paschalidis, ICDetecção de redes de bots baseada em anomalia e detecção da comunidade. Transações IEEE sobre Controle de Sistemas de Rede (2016). Recuperado em DOI: 10.1109 / TCNS.2016.2532804.)

Sementes para dormir


Diapausa - um atraso no desenvolvimento biológico, ocorrendo frequentemente em um estágio inicial. Muitas espécies de plantas produzem sementes que não começam a se desenvolver imediatamente, mas permanecem inativas por um longo tempo e formam um suprimento estável. Dado que a batalha pela sobrevivência geralmente se transforma em "quem chega primeiro e mais", um atraso aleatório no desenvolvimento é um pequeno mistério ambiental.

Para entender a situação, Shripad Tuljapurkar e eu, em nosso trabalho conjunto, examinamos um modelo simples: uma espécie com um ciclo de vida de dois anos em que cresce de sementes a adultos pelo primeiro ano e gasta o segundo na produção de sementes. (Steinsaltz, D. & Tuljapurkar, S. Taxas de crescimento estocásticas para histórias de vida com migração rara ou diapausa. ArXiv: 1505.00116 (2015).) Fizemos a seguinte pergunta: como a taxa de crescimento afetará o fato de que algumas sementes permanecerão em hibernação por um ano?

No caso em que o crescimento, a sobrevivência e a produção de sementes de um ano para o outro permanecem constantes, a resposta é óbvia: o atraso no crescimento dos indivíduos atrasa o crescimento da população. Mas sob condições ambientais variadas, tudo acontece de maneira diferente. Mesmo um pequeno atraso leva a um aumento acentuado da população.

imagem

Se 1% das sementes espera um ano, seria de esperar que uma trajetória genealógica típica sofresse 1 atraso de 100 anos e caísse em condições ambientais típicas ao crescer. Mas as gerações subsequentes de sementes terão trajetórias muito raras que perduram com mais freqüência, nas quais esses atrasos ocorrem apenas nos piores anos, quando o crescimento significa quase morte certa ou a incapacidade de produzir sementes. Essas trajetórias servem como grandes desvios - exponencialmente raros - mas, com o tempo, produzem exponencialmente mais descendentes. A taxa de crescimento populacional é finalmente determinada por esses caminhos improváveis. Em outras palavras, se rastrearmos a trajetória de um indivíduo que vive hoje, parecerá uma sequência de acidentes bem-sucedidos.

A mesma matemática funciona para a migração, apoiando o importante princípio de proteção de habitat: a visão se beneficiará da capacidade de se mover entre dois territórios igualmente bons, onde as condições climáticas mudam aleatoriamente de ano para ano. Cada indivíduo, acompanhando a história da família, encontrará nela ancestrais que fugiram de um lugar, por acaso, pouco antes do início do cataclismo, ou chegaram a outro lugar justamente quando havia muita comida. Este é um caso especial de evolução banal: a maioria dos organismos vivos morre sem deixar a prole, mas você pode rastrear seus ancestrais por bilhões de gerações e não encontrar perdedores. Sorte sua!

Centenários


Tendo vivido até uma certa idade - o que acaba sendo menor do que a maioria das pessoas pensa, já que a probabilidade de você viver mais um ano é de no máximo 12 anos - você enfrentará o fato de que sua condição física e probabilidade de viver mais um ano diminuem o tempo todo, mesmo que por curtos períodos, você pode obter melhorias. Os demógrafos teóricos consideravam modelos de envelhecimento nos quais a “capacidade de sobrevivência” de um indivíduo serve como uma variável aleatória que muda em pequenos passos, e que é mais provável que mude para baixo do que para cima, e a probabilidade de morte aumenta quanto mais baixa a capacidade de sobrevivência.

Não é de surpreender que, seguindo esse modelo, possa ser calculado que a capacidade de sobrevivência média de uma população diminua em função da idade ... até algum ponto. Mas uma pequena parte da população sobrevive até uma certa idade, e esses são indivíduos excepcionais. Talvez eles tenham tido sorte de ganhar na loteria genética. Talvez as batidas aleatórias da vida os direcionassem em uma direção relativamente positiva.

Seja como for, o modelo prevê que a capacidade de sobrevivência dos sobreviventes deixa gradualmente de declinar. Cada indivíduo ainda está diminuindo, mas aqueles que diminuíram são levados por uma mulher idosa com uma foice. A capacidade de sobrevivência total dos sobreviventes atinge um equilíbrio chamado “distribuição quase-estacionária” entre trajetórias individuais caindo e examinando indivíduos em excesso na parte inferior da distribuição de capacidade de sobrevivência.

Na linguagem dos grandes desvios, existe uma função da razão I (x) - onde x é o registro de sobrevivência vitalícia - que é zero para trajetórias que permanecem próximas da média. Aqueles que se desviam fortemente da média têm uma função de relacionamento positivo, ou seja, sua probabilidade é exponencialmente menor. Em um modelo típico, você pode descobrir que, entre todos os caminhos da vida que duram de maneira incomum, os mais prováveis ​​são aqueles que mantiveram acidentalmente a capacidade de sobrevivência em um nível incomumente alto do que aqueles que seguiram um caminho descendente normal e não morreram acidentalmente.

Segue-se que a taxa de mortalidade - a probabilidade de morrer no próximo ano para um indivíduo de uma certa idade - aumenta na idade adulta e depois se equilibra em uma idade muito respeitável. Esse padrão, o "platô de mortalidade", pode ser visto claramente em organismos como Drosophila e nemátodos, se observado em grandes quantidades nas mesmas condições de laboratório - a taxa de mortalidade é igualada no laboratório mais comum Drosophila, Drosophila melanogaster, já com 4 semanas de idade. (Vaupel, JW, et al. Trajetórias biodemográficas da longevidade. Science 280, 855-860 (1998).)

O platô de mortalidade nas pessoas não apareceu até que a população crescesse e os cuidados de saúde melhorassem, para que pessoas suficientes pudessem viver até 100 anos ou mais. Em média, a taxa de mortalidade de uma pessoa dobra a cada 8 anos, variando de 30 s e 90 s. Se coletarmos uma amostra de americanos nascidos em 1900, sua taxa de mortalidade aos 90 anos foi de cerca de 0,16, ou seja, 16% deles morreram este ano. Dobra mais que aos 98 anos e nunca mais dobra. A maior taxa de mortalidade registrada é de 0,62 aos 108 anos. Depois disso, os dados se tornam muito pequenos, mas uma análise minuciosa de pessoas com mais de 110 anos de todo o mundo mostra de forma convincente que, nas condições atuais, o coeficiente se igualará em algum lugar na faixa de 0,4 a 0,7.(Vaupel, JW & Robine, JM Emergência de supercentenários em países de baixa mortalidade. North American Actuarial Journal 6, 54-63 (2002))

Source: https://habr.com/ru/post/pt401517/


All Articles