Wie man ein probabilistisches Mikroskop baut

Bild

Gerüchten zufolge wird 20th Century Fox in ein paar Jahren ein Remake des Science-Fiction-Films Fantastic Journey von 1966 veröffentlichen. Entsprechend der Handlung werden die Protagonisten komprimiert und in den menschlichen Körper injiziert, durch den sie sich in einem U-Boot von mikroskopischer Größe bewegen. In solchen Maßstäben verwandelt sich der Blutfluss in gefährliche Turbulenzen, weiße Körper können ein Schiff verschlucken und die Oberflächenspannung eines Tropfens wird zu einer unüberwindlichen Barriere.

Das Skalieren zerstört unser intuitives Verständnis dessen, was für uns wichtig ist, was Macht hat und was gefährlich ist. Um zu überleben, müssen Sie die Intuition neu konfigurieren. Selbst wenn ein Effekt auf vertrauten Skalen vernachlässigt werden kann, kann ein etwas weniger vernachlässigbarer Effekt auf unbekannten Skalen unglaublich wichtig werden.

Bild

Wie verstehen wir, was in ungewohntem Umfang wichtig sein kann? Es stellt sich heraus, dass es eine mathematische Theorie großer Abweichungen gibt, die mit Wahrscheinlichkeiten genauso arbeitet wie der abnehmende Strahl mit dem Fantastic Travel-Team. Während sich die klassische Wahrscheinlichkeitstheorie mit den Wahrscheinlichkeiten gewöhnlicher Ereignisse befasst, ist die Theorie großer Abweichungen auf äußerst seltene Ereignisse spezialisiert, die auftreten, wenn mehrere eher ungewöhnliche Ereignisse verschmelzen. Es ermöglicht uns, ein probabilistisches Mikroskop zu vergrößern, um die am wenigsten wahrscheinlichen Möglichkeiten zu bestimmen, wie ein äußerst unwahrscheinliches Ereignis auftreten kann.

Von dem Moment an, als die Theorie vor 50 Jahren formuliert wurde, hat der Mathematiker S.R. Srinivasa Varadhan, es wurde sorgfältig studiert und entwickelt. Es zeigt, wie das durchschnittliche Verhalten eines Zufallssystems vom typischen abweichen kann. Wenn Sie alle seltenen Möglichkeiten sorgfältig vergleichen, können Sie sehen, wie oft wir die Wahrscheinlichkeiten ungewöhnlicher Ereignisse unterschätzen, wenn wir unsere Aufmerksamkeit auf die üblichen Arten beschränken, in denen sie auftreten können.

Machen wir eine Reise mit einem Mikroskop in der Hand

Hochfrequenzhändler


Ein Hochfrequenzhändler führt lange Transaktionssequenzen durch. Bei jedem von ihnen steigt sein Zustand mit einem Anfangswert von 1.000.000 USD um ein halbes Prozent oder sinkt um ein halbes Prozent, und die Wahrscheinlichkeit eines Ergebnisses beträgt ½. Wie viel Geld wird er wahrscheinlich in einer Million Transaktionen haben?

Er kann so argumentieren: Jede Transaktion steigt oder fällt um den gleichen Betrag, sodass sich der durchschnittliche Betrag nicht ändert, und am Ende sollte er noch 1 Million Dollar übrig haben.

Und hier ist ein weiteres Argument: Wenn er gewinnt, wird sein Vermögen mit 1,005 multipliziert. Beim Verlieren dann bei 0,995. Sowohl das als auch ein anderes multiplizieren es mit 1.005 x 0,995 = 0,999975. Bei einer Million Transaktionen treten 500.000 dieser und anderer Fälle auf, sodass aus der ursprünglichen Million 1.000.000 USD x (0,999975) 500.000 USD werden, was ungefähr 3,73 USD entspricht.

Welche Argumentation ist richtig? Seltsamerweise beides, aber der zweite wird wichtiger sein. Höchstwahrscheinlich wird der Trader nichts mehr übrig haben, aber wenn wir die Anzahl der unwahrscheinlichen Ereignisse erhöhen, bei denen er gewinnt, werden wir solche Optionen sehen, bei denen er stark gewinnt. Die Schlüsselfunktion hier ist I (x), eine Beziehungsfunktion, die zeigt, wie die Wahrscheinlichkeit, das Ergebnis x zu erhalten, mit zunehmender Anzahl von Transaktionen abnimmt. Hier ist x eine Zahl, aber je nach Aufgabe kann es sich um eine zufällige Flugbahn, eine zufällige Netzwerkstruktur oder eine zufällige Geometrie des Universums handeln. I (x) = 0 entspricht einem typischen Fall mit einer nicht sehr geringen Wahrscheinlichkeit - in unserem Fall ist dies eine Option, bei der der Zustand des Händlers mit einer exponentiellen Rate abnimmt. Große Werte von I (x) entsprechen dem exponentiell am wenigsten wahrscheinlichen x.

Der Durchschnittswert bestimmt einen Kompromiss zwischen einer exponentiell abnehmenden Wahrscheinlichkeit und einem exponentiell ansteigenden Zustand. Einige von x erweisen sich trotz der geringen Größe der ihnen entsprechenden Wahrscheinlichkeit als sehr groß. Die Optimierung dieses Kompromisses bestätigt die naive intuitive Vorstellung, dass das durchschnittliche Handelsergebnis 1 Million US-Dollar betragen wird - obwohl Sie sicher sein können, dass fast alle Händler fast alles verlieren werden. Wenn es 1 Million Händler gibt und jeder von ihnen eine Million Operationen mit einem Kapital von 1 Million US-Dollar durchführt, entspricht das durchschnittliche Ergebnis tatsächlich 1 Million US-Dollar. Dieser Durchschnitt wird jedoch von 1-2 Händlern bestimmt, auf deren Konten sich Hunderte von Milliarden US-Dollar befinden. Das meiste Geld wird auf den Konten einer kleinen Anzahl von zufälligen Händlern sein, und die meisten Händler werden alles verlieren.

Die Gewinnchancen oder die Wahrscheinlichkeit, alleine zu bleiben, überschreiten 1 zu 100 nicht.

Telefonknoten


Das Hauptproblem von Kommunikationsnetzen besteht darin, die Wahrscheinlichkeit einer Überlastung zu bestimmen. Der Datenpuffer des Telefonknotens oder des Internets kann eine Kapazität haben, die für die durchschnittliche Last ausreicht, aber nicht ausreicht, um eine ungewöhnliche Anzahl gleichzeitiger Anforderungen zu verarbeiten.

Mathematiker aus Bellas Labor, Alan Weiss und Adam Shwartz, wiesen 1995 auf die Anwendung der Theorie großer Abweichungen auf Kommunikationsnetze hin. Theoretisch nimmt die Wahrscheinlichkeit eines seltenen Ereignisses exponentiell mit der Größe des Systems ab. In der Sprache der Mathematik ändert sich die Wahrscheinlichkeit als e- n * I (x) , wobei n die Größe bezeichnet, x der Pfad zu einem seltenen Ereignis ist und I die Verhältnisfunktion ist, die die relative Wahrscheinlichkeit angibt, diesen Pfad zu wählen. Seltene Ereignisse treten normalerweise auf vorhersehbare Weise auf - eine, die die Beziehungsfunktion minimiert - und treten in Gruppen auf, die durch lange Zeitintervalle voneinander getrennt sind.

Bei jeder Aufgabe liegt die Schwierigkeit darin, die Beziehungsfunktion zu bestimmen (und erfolgreich zu interpretieren). Sie gibt die relative Wahrscheinlichkeit aller Folgen von Lasten an, aus denen Kombinationen abgeleitet werden können, die zu Überlastungen führen und den geringsten Wert der Verhältnisfunktion, dh die größte Wahrscheinlichkeit, aufweisen. Diese Kombinationen bestimmen die Häufigkeit der Überlastung sowie deren Art: Wie viele Quellen werden aktiv sein, welche Quellen werden sie sein und wie schnell wird es gelingen, die Überlastung zu bewältigen.

Stellen Sie sich als einfaches Beispiel ein Telefonnetz vor, in dem sich eine große Anzahl von Benutzern - beispielsweise eine Million - zu zufälligen Zeiten verbindet, sodass sie durchschnittlich 1% der Zeit in der Leitung bleiben. (Wir gehen davon aus, dass sie unabhängig voneinander und zu jeder Tageszeit mit gleichen Chancen telefonieren). Das Netzwerk benötigt 10.000 Kommunikationsleitungen, um die durchschnittlichen Anforderungen zu erfüllen. Mit großen Abweichungen schätzte das Unternehmen, dass bei Inbetriebnahme von 10.500 Kommunikationsleitungen etwa 2 Minuten pro Jahr überlastet sein würden.

Stellen Sie sich vor, dass zusätzlich zum Netzwerk eine halbe Million Spieler Konsolen verwenden, die 1 Prozent der Zeit in der Leitung sind, aber eine große Bandbreite benötigen - sie nehmen jeweils 5 Leitungen auf. Neue Benutzer benötigen außerdem durchschnittlich 10.000 Leitungen. Daher beschließt das Unternehmen, seine Kapazität auf 21.000 Leitungen zu verdoppeln. Infolgedessen ist das Netzwerk jedoch einige Minuten pro Woche überlastet. Eine Analyse der Beziehungsfunktion zeigt, dass Spieler, die im Durchschnitt dieselbe Netzwerkkapazität wie andere Benutzer verwenden, während der Überlastung 8% mehr Leitungen verwenden und dass zusätzliche 250 Leitungen die Netzwerkverfügbarkeit wiederherstellen. Wenn wir die Netzwerklast Sekunden vor der Überlastung zeichnen, werden wir feststellen, dass sie fast immer einem bestimmten Muster folgt und sich sanft nach oben biegt, bevor sie abrupt an der Decke anliegt - und diese Kurve kann auch als Minimierungsverhältnisfunktion berechnet werden.

In modernen dezentralen Paketenetzwerken kann die Beziehungsfunktion dazu beitragen, Botnets, Netzwerke von mit Viren infizierten Computern zu erkennen, mit denen Kriminelle Spam versenden, und Angriffe auf Systeme. Die Idee ist, den Botnetz-steuernden Computer zu identifizieren, der mit einer ungewöhnlich großen Anzahl anderer Computer kommuniziert, und dann die Identifizierung zu bestätigen, indem ungewöhnliche Korrelationen in den Computern gefunden werden, mit denen er kommuniziert. Zu diesem Zweck verwendeten Forscher der Boston University eine Beziehungsfunktion, die unter anderem beschreiben konnte, warum eine unwahrscheinlich große Anzahl nicht verbundener Computer mit demselben Remote-Server kommunizieren konnte. Welche der Optionen zur Korrelation ihrer Kommunikation wäre am wahrscheinlichsten. (Wang, J. & Paschalidis, IC-Botnet-Erkennung basierend auf Anomalie und Community-Erkennung. IEEE-Transaktionen zur Steuerung von Netzwerksystemen (2016). Abgerufen von DOI: 10.1109 / TCNS.2016.2532804.)

Schlafender Samen


Diapause - eine Verzögerung der biologischen Entwicklung, die häufig in einem frühen Stadium auftritt. Viele Pflanzenarten produzieren Samen, die sich nicht sofort entwickeln, aber lange ruhen und eine stabile Versorgung bilden. Angesichts der Tatsache, dass der Kampf ums Überleben normalerweise zu "wer zuerst und in mehr kommt" wird, ist eine zufällige Entwicklungsverzögerung ein kleines Umwelträtsel.

Um die Situation zu verstehen, haben Shripad Tuljapurkar und ich in unserer gemeinsamen Arbeit ein einfaches Modell untersucht: eine Art mit einem zweijährigen Lebenszyklus, in dem sie im ersten Jahr vom Samen zum Erwachsenen wächst und das zweite Jahr in der Samenproduktion verbringt. (Steinsaltz, D. & Tuljapurkar, S. Stochastische Wachstumsraten für Lebensgeschichten mit seltener Migration oder Diapause. ArXiv: 1505.00116 (2015).) Wir haben die folgende Frage gestellt: Wie wird sich die Wachstumsrate auf die Tatsache auswirken, dass einige der Samen im Winterschlaf bleiben für ein Jahr?

In dem Fall, in dem das Wachstum, das Überleben und die Produktion von Saatgut von Jahr zu Jahr konstant bleiben, liegt die Antwort auf der Hand: Wachstumsverzögerung von Individuen verzögert das Bevölkerungswachstum. Aber unter verschiedenen Umgebungsbedingungen sieht alles anders aus. Schon eine leichte Verzögerung führt zu einem starken Bevölkerungswachstum.

Bild

Wenn 1% der Samen pro Jahr wartet, würde man erwarten, dass eine typische genealogische Flugbahn eine Verzögerung von 100 Jahren erfährt und beim Aufwachsen in typische Umweltbedingungen fällt. Aber nachfolgende Generationen von Samen werden sehr seltene Trajektorien haben, die häufiger verweilen, wobei diese Verzögerungen nur in den schlimmsten Jahren auftreten, wenn Wachstum fast sicheren Tod oder die Unfähigkeit bedeutet, Samen zu produzieren. Diese Trajektorien dienen als große Abweichungen - exponentiell selten - aber im Laufe der Zeit produzieren sie exponentiell mehr Nachkommen. Die Bevölkerungswachstumsrate wird letztendlich durch diese unwahrscheinlichen Wege bestimmt. Mit anderen Worten, wenn wir die Flugbahn eines heute lebenden Menschen zurückverfolgen, wird dies wie eine Folge erfolgreicher Unfälle aussehen.

Dieselbe Mathematik funktioniert für die Migration und unterstützt das wichtige Prinzip des Lebensraumschutzes: Die Ansicht wird von der Fähigkeit profitieren, sich zwischen zwei gleich guten Gebieten zu bewegen, in denen sich die Wetterbedingungen von Jahr zu Jahr zufällig ändern. Jedes Individuum, das die Familiengeschichte verfolgt, wird darin Vorfahren finden, die zufällig kurz vor Beginn der Katastrophe von einem Ort geflohen sind oder an einem anderen Ort angekommen sind, als es reichlich zu essen gab. Dies ist ein Sonderfall der banalen Evolution: Die meisten lebenden Organismen sterben, ohne Nachkommen zu hinterlassen, aber Sie können Ihre Vorfahren über Milliarden von Generationen verfolgen und keine solchen Verlierer treffen. Glück für dich!

Hundertjährige


Wenn Sie bis zu einem bestimmten Alter gelebt haben - was sich als geringer herausstellt als die meisten Menschen denken, da die Wahrscheinlichkeit, dass Sie ein weiteres Jahr leben, maximal 12 Jahre beträgt -, werden Sie mit der Tatsache konfrontiert, dass Ihre körperliche Verfassung und die Wahrscheinlichkeit, ein weiteres Jahr zu leben, ständig abnimmt, auch wenn für kurze Zeit können Sie Verbesserungen erzielen. Theoretische Demografen betrachteten Alterungsmodelle, bei denen die „Überlebensfähigkeit“ eines Individuums als Zufallsvariable dient, die sich in kleinen Schritten ändert und die sich eher nach unten als nach oben ändert, und die Wahrscheinlichkeit des Todes steigt, je geringer die Überlebensfähigkeit ist.

Es ist nicht überraschend, dass nach diesem Modell berechnet werden kann, dass die durchschnittliche Überlebensfähigkeit einer Bevölkerung in Abhängigkeit vom Alter abnimmt ... bis zu einem gewissen Punkt. Aber ein kleiner Teil der Bevölkerung überlebt bis zu einem bestimmten Alter, und dies sind außergewöhnliche Individuen. Vielleicht hatten sie das Glück, die genetische Lotterie zu gewinnen. Vielleicht haben die zufälligen Unebenheiten des Lebens sie in eine relativ positive Richtung gelenkt.

Wie dem auch sei, das Modell sagt voraus, dass die Überlebensfähigkeit der Überlebenden allmählich nicht mehr abnimmt. Jedes Individuum nimmt immer noch ab, aber diejenigen, die abgenommen haben, werden von einer alten Frau mit einer Sense weggebracht. Die Gesamtüberlebensfähigkeit der Überlebenden erreicht ein Gleichgewicht, das als "quasistationäre Verteilung" bezeichnet wird, zwischen einzelnen Trajektorien, die abfallen, und dem Screening überschüssiger Individuen im unteren Teil der Überlebensfähigkeitsverteilung.

In der Sprache der großen Abweichungen gibt es eine Funktion des Verhältnisses I (x) - wobei x die Aufzeichnung der Überlebensfähigkeit für das Leben ist -, das für Trajektorien, die nahe am Durchschnitt bleiben, Null ist. Diejenigen, die stark vom Durchschnitt abweichen, haben eine positive Beziehungsfunktion, dh ihre Wahrscheinlichkeit ist exponentiell geringer. In einem typischen Modell können Sie feststellen, dass unter allen Lebenswegen, die ungewöhnlich lange dauern, diejenigen am wahrscheinlichsten sind, die versehentlich die Überlebensfähigkeit auf einem ungewöhnlich hohen Niveau gehalten haben, als diejenigen, die einem normalen absteigenden Weg gefolgt sind und nicht versehentlich gestorben sind.

Daraus folgt, dass die Sterblichkeitsrate - die Wahrscheinlichkeit, im nächsten Jahr für eine Person eines bestimmten Alters zu sterben - im Erwachsenenalter zunimmt und sich dann in einem sehr respektablen Alter ausgleicht. Ein solches Muster, das „Plateau der Mortalität“, ist bei Organismen wie Drosophila und Nematoden deutlich zu erkennen, wenn es in großen Mengen unter denselben Laborbedingungen beobachtet wird - die Mortalitätsrate wird im häufigsten Labor Drosophila, Drosophila melanogaster, bereits im Alter von 4 Wochen ausgeglichen. (Vaupel, JW, et al., Biodemographische Trajektorien der Langlebigkeit. Science 280, 855-860 (1998).)

Das Sterblichkeitsplateau zeigte sich bei Menschen erst, als die Bevölkerung wuchs und sich die Gesundheitsversorgung verbesserte, so dass genügend Menschen bis zu 100 Jahre oder länger leben konnten. Im Durchschnitt verdoppelt sich die Sterblichkeitsrate einer Person alle 8 Jahre und reicht von 30 s bis 90 s. Wenn wir eine Stichprobe von Amerikanern nehmen, die 1900 geboren wurden, lag ihre Sterblichkeitsrate nach 90 Jahren bei etwa 0,16, dh 16% von ihnen starben in diesem Jahr. Mit 98 Jahren verdoppelt es sich mehr als, und dann verdoppelt es sich nie mehr. Die höchste gemessene Sterblichkeitsrate liegt bei 0,62 im Alter von 108 Jahren. Danach werden die Daten sehr klein, aber eine gründliche Analyse von Menschen über 110 Jahren aus aller Welt zeigt überzeugend, dass sich der Koeffizient unter den gegenwärtigen Bedingungen irgendwo im Bereich von 0,4 bis 0,7 ausgleichen wird. (Vaupel, JW & Robine, JM Entstehung von Superhundertjährigen in Ländern mit niedriger Sterblichkeit. North American Actuarial Journal 6, 54-63 (2002))

Source: https://habr.com/ru/post/de401517/


All Articles