Genetik der Romanesco-Sorte: ein fraktales mathematisches Modell der Genexpression



Was haben Schneeflocken, Romanesco-Kohl, Seesterne, Blitze und Bäume gemeinsam? Sie werden es nicht sofort sagen, aber aus mathematischer Sicht haben alle diese Objekte ein gemeinsames Merkmal - die Fraktalität. In den Augen der Mathematik gehorcht alles in unserer Welt den Gesetzen der „Königin der Wissenschaften“. Jedes Phänomen, jeder Prozess oder jedes Objekt kann in mathematischer Form ausgedrückt werden, so dass es sozusagen aus einem neuen Blickwinkel analysiert werden kann. Seit vielen Jahren versuchen Wissenschaftler, die perfekte mathematische Darstellung von Genen, ihren Beziehungen und den Prozessen, an denen sie beteiligt sind, zu erstellen. Heute werden wir darüber sprechen, wie Fraktale dazu beigetragen haben, den Grundstein für ein völlig neues mathematisches Modell menschlicher Gene aus der Perspektive von Krebs zu legen. Was ist ein Fraktal, warum ist es für Genetiker und Mathematiker so wichtig und wie kann ein neues mathematisches Modell der modernen Medizin helfen? Wir werden im Bericht der Forschungsgruppe nach Antworten suchen. Lass uns gehen.

Theoretischer Rückzug

Zunächst lohnt es sich, kurz herauszufinden, was ein Fraktal ist und womit es gegessen wird.

Ein Fraktal ist eine Menge mit Selbstähnlichkeitseigenschaften. Einfach ausgedrückt, wenn etwas aus mehreren Mini-Kopien von sich selbst besteht.



Fraktale finden sich in verschiedenen physikalischen Phänomenen: von der Diffusion bis zur Turbulenz. Dies kann als natürliche Manifestation von Fraktalen bezeichnet werden. Die Leute fanden auch die Verwendung von Fraktalen: in Computergrafik, Funktechnik, Netzwerktechnologien usw.

Fraktale sind im Film „Doctor Strange“ (2016) sehr farbenfroh, wenn der Ältere den Protagonisten auf eine Exkursion entlang paralleler Dimensionen schickt.


Ein etwas unangenehmer Anblick, der aber deutlich die Fraktalität zeigt.

Sogar in den Regalen des Supermarkts finden sich Manifestationen von Fraktalität, nämlich das Beispiel von Romanesco-Kohl oder Blumenkohl.

Wenn wir berücksichtigen, dass es ziemlich viele Arten von Mengen mit fraktalen Eigenschaften gibt, kann argumentiert werden, dass fast alles um uns herum auf die eine oder andere Weise mit Fraktalen verbunden ist. Und der menschliche Körper, insbesondere seine Gene, ist keine Ausnahme. Da Fraktale durch Sortieren der Komponenten mathematisch erklärt werden können, kann die Verwendung eines solchen Modells für menschliche Gene erheblich zum Verständnis der verschiedenen Prozesse in unserem Körper beitragen, einschließlich verschiedener Krankheiten, Pathologien und anderer unangenehmer Dinge.

Einer der wichtigsten Prozesse in unserem Körper ist die Genexpression (Bild 1a ), wenn die Erbinformation der Gene in ein funktionelles Produkt umgewandelt wird. Mit anderen Worten, unsere Zellen steuern durch Genexpression ihre Struktur und Funktion. Unsere Gene sind eine Datenbank, aus der alle Körperzellen Informationen ableiten und danach die notwendigen Funktionen ausführen. Daher wächst in unserem Mund kein Haar, das Immunsystem bekämpft Infektionen, Blutzellen transportieren Sauerstoff usw. Alle diese Prozesse finden genau aufgrund der Programmierung von Zellen zur Ausführung spezifischer Aufgaben statt, was wiederum durch Proteinsynthese aus der Aktivierung eines bestimmten Gens möglich ist.


Bild Nr. 1

Die Regulation der Genexpression gibt an, wann, wie viel und wie lange bestimmte Proteine ​​produziert werden müssen. Daher ist die Untersuchung dieses Prozesses von großer Bedeutung für ein umfassendes Verständnis der Funktionsweise bestimmter Kontrollmechanismen von Organismen.

Dieser komplexe Prozess ist für Wissenschaftler wichtig, da sie die Möglichkeit haben, ihn zu kontrollieren, und in der Lage sind, bestimmte synthetische Zellen mit klaren Funktionen zu erzeugen, insbesondere indem sie ein Krebsmedikament für eine effektivere Behandlung an das „Herz“ einer Krankheit abgeben.

Um die Methoden zur Behandlung solcher Krankheiten zu verbessern, ist es notwendig, den genetischen Aspekt genauer zu lernen. Zu diesem Zweck schlagen Wissenschaftler vor, den menschlichen Körper in Form eines Programms darzustellen, bei dem Gene als Codezeilen fungieren, die geändert werden können, wenn das Programm mit einer Fehlfunktion arbeitet. Um dies zu realisieren, müssen Sie zuerst ein mathematisches Modell des Gens erstellen. Im Moment existieren solche Modelle bereits, aber sie können nicht repräsentativ sein, da sie darauf abzielten, die Dynamik im Gennetzwerk zu untersuchen. In derselben Studie, in der das Konzept der Fraktale angewendet wurde, beschlossen die Wissenschaftler, sich auf den Expressionsprozess eines bestimmten Gens zu konzentrieren und dann die Kreuzkorrelation zwischen Gen- FT * -Paaren anzuwenden ( 1b ).
Der Transkriptionsfaktor (FT) * ist ein Kontrollprotein für die mRNA-Synthese, das Informationen über die Primärstruktur von Proteinen auf der DNA-Matrix durch Verknüpfung mit spezifischen DNA-Stellen enthält.
Einfach ausgedrückt, beschlossen die Wissenschaftler, etwas tiefer zu graben, nachdem sie nicht die gesamte „Wand“ als Ganzes, sondern einzelne „Ziegel“ untersucht hatten.

Forschungsergebnisse

Die Testpersonen in dieser Studie waren der Pilz Saccharomyces cerevisiae (Bäckerhefe) und das Bakterium Escherichia coli (Escherichia coli).

Durch Analyse der statistischen Daten der genetischen Expression der Versuchspersonen wurde der Hurst-Koeffizient * berechnet.
Der Hurst-Koeffizient * ist ein Maß für die Zeitreihenanalyse.
Zeitreihen * - Eine Reihe statistischer Daten, die in unterschiedlichen Zeitintervallen zu einem Indikator erfasst werden.


Bild Nr. 2

Die Abbildungen 2a (Hefe) und 2b (Escherichia coli) zeigen bilogarithmische Diagramme * von Fluktuationen als Funktion der Skala der FT-Zeitreihen.
Der bilogarithmische Graph * ist ein zweidimensionaler Datengraph , der eine logarithmische Skala auf beiden Achsen (vertikal und horizontal) verwendet.
Die Steigung der Kurve in diesen Diagrammen entspricht dem Hurst-Koeffizienten. Es ist erwähnenswert, dass 95% (Hefe) und 98% (Bazillus) der Zeitreihen von Genen eine langfristige Abhängigkeit zeigten * .
Langzeitabhängigkeit * - ein Indikator für die Analyse von Zeitreihen, der die langsame Abschwächung der statistischen Abhängigkeit zweier Punkte mit zunehmendem Zeitintervall zwischen ihnen anzeigt. Sie wird durch den Hurst-Koeffizienten-Indikator bestimmt - von 0 bis 1. Wenn der Indikator über 0,5 liegt, haben wir eine starke langfristige Beziehung unter 0,5 - der gegenteilige Effekt.
Der Hurst-Koeffizient der Langzeitabhängigkeit betrug in diesem speziellen Fall 0,5, was theoretisch auf seine Abwesenheit hinweist. Eine weitere Analyse der Daten ergab jedoch, dass dieser Indikator einen Wert von 0,5 überschreitet, was auf das Vorhandensein einer langfristigen Abhängigkeit der Zeitreihen von der genetischen Expression hinweist ( 2c und 2e ). Dies legt nahe, dass die Zeitreihen von Gen-FT nicht als zufällig betrachtet werden können. Daher sollten sie auf der Grundlage der Markov-Kette modelliert werden, wenn es eine Reihe von Ereignissen gibt, deren Zufälligkeit jeweils ausschließlich vom vorherigen Ereignis abhängt.

Wie Gene zeigten auch Transkriptionsfaktoren eine langfristige Beziehung: bei 97% für Hefe und für Bazillus (Diagramme 2d und 2f ).

Geben Sie nun eine Prise Fraktalanalyse in die gemeinsame Schüssel. Zunächst machen Wissenschaftler uns auf die Bimodalität der Verteilung des Hurst-Koeffizienten aufmerksam. Dies ist am besten in den Diagrammen 2c und 2e zu sehen. Wissenschaftler erklären diese Beobachtung durch die Tatsache, dass es Diffusionsprozesse in der Genexpression gibt, die mehrere Diffusionspotentiale haben. Daher kann die Bimodalität durch die Nichtgleichgewichts-Brownsche Bewegung mit unterschiedlichen Potentialen erklärt werden. Diese Aussage erfordert jedoch zusätzliche Beweise, nach denen Wissenschaftler in den folgenden Studien suchen werden.

Und jetzt kehren wir zur Multifraktalität zurück. Die Wissenschaftler verwendeten eine multifraktale Analyse von Detrend-Fluktuationen, um das Vorhandensein / Fehlen von multifraktalen Merkmalen in Zeitreihen der Genexpression zu bestimmen. Diese Analyse zeigte das Vorhandensein sowohl von Genen als auch von FT.

Die Wissenschaftler wendeten auch die Bootstrap * -Methode an, um das Vorhandensein einer Langzeitabhängigkeit angesichts der begrenzten Länge experimenteller Zeitreihen genau zu bestimmen (genauer zu bestätigen).
Bootstrap * - eine Technik zur Analyse von Statistiken über Wahrscheinlichkeitsverteilungen.
Für jede Zeitreihe der Genexpression wurden 10 zufällige Unterintervalle hergestellt, von denen jedes 90% des geordneten Fragments der anfänglichen Zeitreihe enthielt. Ferner wurde für alle Optionen der Hurst-Koeffizient berechnet. Somit wurde der Unterschied zwischen den Indikatoren der experimentellen Zeitreihen und zufälligen Versionen erhalten. Für E. coli betrug der Unterschied nur 0,006% und für Bäckerhefe noch weniger - 0,0001%. Somit wurde das Vorhandensein einer Langzeitabhängigkeit in beiden Proben bestätigt.

Nachdem die interessierenden Eigenschaften des Gens und der FT getrennt betrachtet wurden, begannen die Wissenschaftler, Gen-FT-Paare als ein einziges Objekt zu analysieren. Die Berechnung des Kreuzkorrelationsindex ergab, dass 98% der Gen-FT-Paare (in beiden Proben) die Eigenschaften der Langzeitabhängigkeit besitzen ( 3a ).


Bild Nr. 3

Eine multifraktale Analyse von Detrend-Fluktuationen bestätigte das Vorhandensein multifraktaler Merkmale in Gen-FT-Paaren (Grafik 3b ).

Es ist erwähnenswert, dass unabhängig von der Tatsache, dass sowohl fraktale als auch langfristige Kreuzkorrelationen in Genpaaren und Transkriptionsfaktoren in Genregulationsnetzwerken beobachtet wurden, die Kreuzkorrelation nicht für alle Paare gleich war. Die Diagramme 3c (Hefe) und 3d (Escherichia coli) zeigen die Kreuzkorrelation von Gen-FT-Paaren.

Die Wissenschaftler verwendeten diese Diagramme, um die Informationsentropie und damit den Informationsgehalt des Genregulationsnetzwerks für verschiedene Zelltypen zur quantitativen Analyse und Spezifikation von Genregulationsnetzwerken zu messen. Entropieindikatoren waren: 4,18 - Hefe, 5,29 - E. coli. Dies deutet darauf hin, dass das Genexpressionsnetzwerk in Bäckerhefe viel größer ist und eine komplexere Dynamik aufweist als das Genexpressionsnetzwerk in Escherichia coli.

Und jetzt ist das Interessanteste die Erstellung eines mathematischen Modells. Wissenschaftler haben zwei Versionen des Modells ausgewählt: das Mandelbrot-Set und das Set in Form von Wavelet-Dyadenbäumen.

Unter Verwendung der zuvor erhaltenen Indikatoren des Hölder-Koeffizienten im multifraktalen Spektrum fanden die Wissenschaftler heraus, dass nur 0,04 aller Gen-FT-Paare im Genregulationsnetzwerk der Bäckerhefe mit dem Mandelbrot-Set modelliert werden können. Und in E. coli kann mit dieser Methode kein einziges Paar modelliert werden.

Wenn wir die Paare betrachten, die simulieren konnten, dann gab es eine große Diskrepanz in den Daten zwischen dem Modell und den experimentellen Beobachtungen. Zusammenfassend ist die Modellierungsmethode aufgrund des Mandelbrot-Sets nicht geeignet.


Bild Nr. 4

Die Ergebnisse der Verwendung des auf dem Mandelbrot-Satz basierenden Modells sind in den obigen Grafiken dargestellt. Das hellste ist 4c , wo wir sehen können, wie stark die Daten divergieren.

Die Wissenschaftler verglichen auch die beobachtete Multifraktalität von Interdependenzen im Genregulationsnetzwerk und das multifraktale Modell zufälliger Kaskaden auf Wavelet-dyadischen Bäumen.

Die Forscher beschlossen zu prüfen, ob das logarithmische Modell der W-Kaskade für die Darstellung von Gen-FT-Paaren in Genregulationsnetzwerken geeignet ist. Basierend auf dem empirischen Spektrum und dem Spektrum der Singularitäten wurden die Parameter dieses Modells berechnet. Als nächstes wurden Berechnungen der Schnittbereiche der berechneten und empirischen Multifraktalspektren durchgeführt, deren Verhältnis zum Hauptkriterium für die Annahme oder Ablehnung dieses mathematischen Multifraktalmodells wurde.


Bild Nr. 5

Wie aus den obigen Diagrammen ersichtlich ist, die die simulierten und empirischen Multifraktalspektren zeigen, korreliert dieses Modell fast vollständig mit den Daten der zuvor durchgeführten Beobachtungen und Berechnungen.

Um die Nuancen der Studie genauer kennenzulernen, empfehle ich Ihnen, den Bericht der Forschungsgruppe unter diesem Link zu lesen .

Nachwort

Diese größtenteils theoretische Studie bietet ein großes Potenzial für die praktische Anwendung, da sie dazu beitrug, das Netzwerk zur Regulierung der Genexpression mathematisch zu modellieren - einer der wichtigsten Prozesse in jedem lebenden Organismus. Komplexe Prozesse sind schwer zu verstehen, egal wie seltsam es klingt. Um die Aufgabe zu erleichtern, ist es notwendig, den Prozess in Komponenten zu unterteilen, ihre „Karten“ zu erstellen und der gewünschten Route zu folgen, wobei alle wichtigen Merkmale und Eigenschaften zu beachten sind. Die mathematische Modellierung ist wie nichts anderes dafür großartig. Nachdem wir das mathematische Modell eines Objekts oder Prozesses untersucht haben, können wir verstehen, womit wir es zu tun haben, bevor wir mit dem Studium des tatsächlichen Objekts oder Prozesses fortfahren.

Diese Studie bestätigte erneut, dass nicht nur Physik und Chemie die Welt regieren, sondern dass Mathematik bei weitem nicht der letzte Platz auf dem Olymp der Wissenschaften ist.

Vielen Dank für Ihre Aufmerksamkeit, bleiben Sie neugierig und haben Sie eine tolle Arbeitswoche, Jungs.

Vielen Dank für Ihren Aufenthalt bei uns. Gefällt dir unser Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung aufgeben oder Ihren Freunden empfehlen, einen Rabatt von 30% für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s von $ 20 oder wie teilt man den Server? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).

VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s bis zum 1. Januar kostenlos, wenn Sie für einen Zeitraum von sechs Monaten bezahlen, können Sie hier bestellen.

Dell R730xd 2 mal günstiger? Nur wir haben 2 x Intel Dodeca-Core Xeon E5-2650v4 128 GB DDR4 6 x 480 GB SSD 1 Gbit / s 100 TV von 249 US-Dollar in den Niederlanden und den USA! Lesen Sie mehr über den Aufbau eines Infrastrukturgebäudes. Klasse mit Dell R730xd E5-2650 v4 Servern für 9.000 Euro für einen Cent?

Source: https://habr.com/ru/post/de434174/


All Articles