Wie das russische Biotech-Start-up zur Krebsbekämpfung beiträgt

Bioinformatik Andrey Afanasyev ist einer der Gründer des Biotech-Startups yRisk. In einem Interview sagte Andrei, welche Technologien er einsetzt, um festzustellen, ob eine Person für erbliche Krebsarten prädisponiert ist, wie es mit der Biotechnologie in Russland steht und ob die Biotechnologie Arbeit für Programmierer leistet.



Über yRisk


Andrej, Sie sind der Gründer des yRisk-Genlabors, Sie suchen nach Mutationen in Genen und einer Veranlagung für die Onkologie. Sagen Sie mir bitte, wie geschieht dies in der Praxis?

Wir führen einen Test auf das Vorhandensein von sogenannten erblichen Tumorsyndromen durch, was sich in einem relativ jungen Lebensalter von bis zu 50 Jahren in einem hohen Krebsrisiko niederschlägt.

Wie machen wir diesen Test? Wir entnehmen einer Person Blut aus einer Vene, wie bei einem normalen Bluttest, extrahieren wir DNA aus diesem Blut und analysieren die DNA auf einem speziellen Gerät, das als Sequenzer bezeichnet wird. Der Sequenzer liefert eine Menge Daten, Gigabyte und sogar Dutzende Gigabyte pro Sample. Anschließend analysieren wir sie mithilfe spezieller Algorithmen, Datenbanken, Empfehlungen zur Analyse dieser Daten und generieren einen mehrseitigen Bericht, in dem wir angeben, ob es im Vergleich zum Durchschnitt erhöhte Risiken gibt und was mit ihnen zu tun ist, wenn Risiken bestehen.

In diesem Interview spricht Andrej ausführlich über erbliche Tumorsyndrome.

Wie ist dies alles in Bezug auf die Technologie angeordnet? Wie verarbeiten Sie diese Daten? Hast du eine eigene Software?

Wir hatten in meiner letzten Firma beim Start von iBinom Erfahrung mit dem Schreiben solcher Software. Wir haben einen Cloud-Service für die bioinformatische Verarbeitung von Sequenzerdaten erstellt und unsere Erfahrung genutzt, um diese Verarbeitung für uns selbst zu implementieren.

Bei iBinom haben wir Cloud-Verarbeitung durchgeführt, Amazon S3 als Speicher und Amazon Elastic Computing Cloud als Rechenknoten verwendet. Jetzt funktioniert alles auf einem lokalen Server, auf dem wir eine Reihe von Bioinformatikprogrammen bereitstellen.

Zunächst wird die Qualität der vom Sequenzer kommenden Eingangsdaten analysiert. Es gibt ein spezielles Programm zur Analyse der Qualität von FastQC-Daten: Mit dessen Hilfe werden verschiedene Statistiken, Verteilungen usw. erstellt.

Wenn die Qualität zu diesem Zeitpunkt gut ist, werden die sogenannten Datenausrichtungen durchgeführt - Ausrichtung oder Zuordnung oder Zuordnung. Es gibt kein etabliertes russisches Wort. Die Ausrichtung ist aus rechnerischer Sicht eine schwierige Aufgabe, sie nimmt für jede Probe viel Zeit in Anspruch.

Nach dem Abbilden der Daten wird der sogenannte Variantenaufruf mit verschiedenen statistischen Algorithmen durchgeführt. Danach werden die gefundenen Optionen für alle verfügbaren Datenbanken mit Anmerkungen versehen.

Nach der Annotation wird eine große Excel-Platte mit Optionen und Funktionen erhalten. Und in diesem großen Excel-Tablet wählen wir die Optionen bereits mit unseren Augen aus und analysieren sie nach den ACMG-Kriterien (Kriterien des American College of Medical Genetics).

Diese Analyse ist nicht mehr automatisierbar, Sie müssen direkt zu den Publikationen gehen, diese durchlesen. Wenn dort einer steht, wird ein Häkchen gesetzt, wenn dort ein anderer steht, wird beispielsweise kein Häkchen gesetzt. Und dies geschieht für jede Probe, mehrere hundert Datensätze müssen manuell eingesehen werden.

Und hier hilft maschinelles Lernen nicht, nur manuelle Arbeit?

Ja, maschinelles Lernen funktioniert hier nicht, da Artikel, die von Menschen geschrieben wurden, in einer für Menschen lesbaren Form und nicht in einer maschinell lesbaren Form geschrieben sind. Wir haben versucht, die Datenextraktion mithilfe neuronaler Netze zu spielen und dabei verschiedene Ansätze zu verwenden, um Bedeutungen aus dem Text herauszuholen. Wir haben dies vor 3 Jahren im Rahmen des Labors zur funktionellen Analyse des Genoms getan, aber wir haben gesehen, dass hier keine nennenswerten Fortschritte erzielt wurden.

In der Biologie ist dies im Allgemeinen eine ziemlich wichtige Geschichte: Die Daten sind nicht maschinenlesbar und das Markup der Daten selbst ist sehr komplex. Sie können nicht einfach ein paar Leute einstellen, die sagen, dass hier eine Katze und hier ein Hund, hier eine Ampel und hier ein Übergang ist. Dies sollte von Personen gelesen werden, die über eine gute biologische Ausbildung verfügen.

Es gibt Versuche, automatisierte Datenbanken dort zu sammeln, aber als Person, die einige dieser Datenbanken verwendet, kann ich sagen, dass die Qualität dort schrecklich ist. Ziemlich oft lesen die Leute, relativ gesehen, etwas in der Anmerkung, verstehen es irgendwie und schreiben zum Beispiel, dass die Option pathogen ist, obwohl man zum Text des Artikels geht und im Klartext sagt, dass sie nicht pathogen ist. Das ist genau das Gegenteil. Daher enden hier die Möglichkeiten irgendeiner Computerverarbeitung, und alle relevanten Informationen müssen mit den Augen durchgesehen werden.

Laut Ihrer Website ist der Test zu 99,99% genau und das klingt wirklich cool. Wenn dieser Text so effektiv ist, warum kann er nicht in einem normalen Krankenhaus durchgeführt werden?

Dieser Test erfordert Ausrüstung - Sequenzer, Sequenzer sind immer noch Forschungsinstrumente, und der Test, den wir durchführen, ist Forschung.

Medizinische Laboratorien wollen sich nicht mit Forschungsgeräten anlegen. Dafür gibt es viele Gründe: angefangen bei der Tatsache, dass sie keine Mehrwertsteuererstattung erhalten können, bis hin zur Gefahr, dass sie von Roszdravnadzor auf Reagenzien oder Geräte untersucht werden, die nicht als medizinisch registriert sind.

Hier ist die Geschichte sehr einfach. Die gesetzlich vorgeschriebenen medizinischen Tests werden an alten Geräten und alten Reagenzien durchgeführt. Tests, die nicht medizinisch sind, können nicht auf bestimmte Weise vermarktet oder vermarktet werden. Zum Beispiel kann ein nicht-medizinischer Test nicht mit Regierungsgeldern gekauft werden, die für Medikamente bereitgestellt werden, oder VHI kann nicht gedeckt werden.

Deshalb stehen wir hier an vorderster Front. Sprechen Sie davon, dass Tests wie unsere, die auf der Sequenzierung einer neuen Generation basieren, für einige Zeit, mindestens vier Jahre, medizinisch behandelt werden sollten. Aber die Dinge sind noch da.

Gibt es eine Prognose, wann es öffentlich verfügbar sein wird?

Ich glaube nicht, dass es in Russland eines Tages öffentlich verfügbar sein wird. Irgendwann wird es wahrscheinlich, aber sicher nicht in naher Zukunft. Unser Gesundheitsminister sagt, dass wir ein Referenzgesundheitssystem haben. Wir haben eine Reihe drängenderer Probleme, zum Beispiel den grundlegenden Zugang zu vielen Drogen. Wenn Sie lesen, was die Leute aus den Fonds schreiben, können Sie sehen, dass auf dem Gebiet der Drogenversorgung alles schrecklich ist.

Dieser Test ist ein Problem für Weiße. Wenn es jemandem gut geht, hat er Geld, und er kann es wieder tun.

Haben Sie vor, etwas anderes zu entwickeln?

Wir haben Pläne für verschiedene Produkte zur Familienplanung und zum Schwangerschaftsmanagement. Hier wollen wir partnerschaftlich mit anderen Kliniken zusammenarbeiten.

Wir haben das erste Produkt für die Onkologie hergestellt, in der Hoffnung, dass es in Russland nachgefragt wird, aber in zwei Jahren haben wir festgestellt, dass die Nachfrage nach diesem Produkt überbewertet wurde, und jetzt wollen wir zu etwas anderen Produkten wechseln.

Andrejs Vortrag über existierende Theorien des Alterns, ausgefallene, langlebige Tiere und Arzneimittel, die der Menschheit helfen können, mit dem Altern fertig zu werden

Über Bioinformatik


Was macht die Bioinformatik heute auf der ganzen Welt? Was sind die am häufigsten gestellten Aufgaben?

Bioinformatik nennt man normalerweise Menschen, die einige angewandte Rechenprobleme für die Biologie lösen. Das heißt, die Aufgaben, denen die Bioinformatik gegenübersteht, sind die Aufgaben von Biologen.

Die schönsten wissenschaftlichen Aufgaben sind Fortschritte beim Verständnis der Evolution und bei der Entwicklung der Evolutionstheorie. Denn aus dem Vergleich von Genomsequenzen kann man eine Menge interessanter Dinge über den Verlauf der Artenentwicklung, über die Bestimmung der Beziehung zwischen einigen Arten und anderen, über verschiedene Fragen zur Anhäufung von Mutationen, über leicht schädliche Mutationen und so weiter erfahren. Dies ist aus wissenschaftlicher Sicht wahrscheinlich das interessanteste.

Aus der Sicht der angewandten Dinge, wozu die Bioinformatik heute verwendet wird, dient sie zur Analyse von Genomsequenzen. Die Analyse genomischer Sequenzen ist Aufgabe von Erbkrankheiten oder Krebs. Die Daten des Genoms von Menschen, die an Erbkrankheiten leiden, werden analysiert, um eine Diagnose zu stellen, um eine Behandlung zu entwickeln und um zu verstehen, wie oft dies auftritt. Dies ist eine Aufgabe.

Die zweite Aufgabe ist onkologisch. Die Daten des Tumorgenoms werden analysiert, um zu verstehen, welche Treibermutationen es gibt, welche Passagiermutationen, welche Mutationen zur Entwicklung einer neuen Therapie verwendet werden können, wie sich der Tumor entwickelt und welche Arten von Tumoren auftreten.

Das dritte ist die Populationsgenomik. Dies ist ein Versuch zu verstehen, wie genetisch wir uns unterscheiden, was die Merkmale verschiedener Populationen sind und was damit zu tun ist.

Welche jüngste Entdeckung in der Bioinformatik hat Sie besonders beeindruckt?

Es ist schwierig, über die Entdeckung in der Bioinformatik zu sprechen, da sie meistens direkt zur Hand ist. Ich sage etwas, das der Realität näher kommt, da wissenschaftliche Dinge wahrscheinlich nicht sehr interessant sind.

Es gab eine interessante Arbeit von Snyder zur Bioinformatik-Analyse des Mikrobioms seines Körpers für ein Jahr. Fast jeden Tag maß er, wie sich sein Mikrobiom veränderte, und veröffentlichte Daten zu dieser Streuung. Es hat sich im Laufe des Jahres ziemlich stark verändert.

Seitdem sind Populationsmikrobiomdaten zu erwarten. Es ist sehr interessant, wie sich verschiedene Mikrobiome für verschiedene Menschen im Laufe des Jahres unterscheiden, jedoch voneinander abhängig von ihrem Wohnort, Lebensstil und dergleichen.

Wie entwickeln sich die Biotechnologien in Russland?

Darüber kann ich nur gut oder in irgendeiner Weise sprechen :) Im weitesten Sinne passiert etwas in Russland. Auf der medizinischen Seite passiert natürlich auch etwas, aber es ist unvergleichlich kleiner und langsamer als in den USA. Warum? Seien wir ehrlich, denn die russische Medizin ist klein und rückständig.

Wir haben praktisch keine Entwicklung unserer eigenen Medikamente. Das Maximum, das wir tun, sind Generika und Biosimilars. Bei fast allen Originalpräparaten der russischen Entwicklung handelt es sich um Fuflomycin, für das keine normalen Wirksamkeitsnachweise vorliegen. Natürlich ist hier alles ziemlich traurig.

Wir als isolierter medizinischer Markt sind sehr klein, wir haben hier kein spezielles Motiv. Trotzdem haben wir verschiedene interessante Unternehmen an der Schnittstelle von IT und Biotechnologie. Warum sind sie da? Weil wir viele gute IT-Spezialisten haben und IT-Spezialisten nach Biotechnologie streben. Und wenn sie verstehen, dass der nächste Uber für Zahnärzte aus irgendeinem Grund nicht in Russland startet oder die nächste elektronische Patientenakte, bekommen sie manchmal bessere Ideen.

Ich mag UNIM wirklich. Sie machten eine ziemlich einfache Sache: Sie digitalisierten die Histologie. Alle Krebsdiagnosen werden durch histologische Untersuchung bestätigt. Histologische Untersuchung ist, wenn Zellen entnommen, in besonderer Weise angefärbt und mikroskopisch untersucht werden. UNIM digitalisierte diese mikroskopischen Bilder in hoher Auflösung, mit Zoom und mit Cloud-Speicher.

Und jetzt wird die histologische Sektion nicht durch ein Mikroskop betrachtet, sondern auf einem Computerbildschirm, und nicht ein Arzt, sondern drei. Und nicht nur ein Arzt, der ein ärztliches Attest erhalten hat, sondern auch eine interne Ausbildung bei der UNIM absolviert und Prüfungen bestanden hat, unabhängig vom Staat. Dies alles erhöht die Genauigkeit der Diagnose erheblich.

Aus technologischer Sicht ist dies keine sehr schwierige Sache, aber die Vorteile sind kraftvoll und cool. Das Speichern großer Bilder ist zwar auch recht schwierig, aber hier gibt es keine Wunder für maschinelles Lernen.

Können Sie einige andere Beispiele für russische Biotechnologieprojekte nennen, die Sie mögen?

Mir gefällt, was die Jungs in Atlas machen. Sie machen genetische Tests. Ihre ursprüngliche Idee ist die Schaffung einer Privatklinik, in der Entscheidungen auch auf genetischen Testdaten beruhen. Anfänglich hatten sie die falsche Technologie für Gentests entwickelt und Mikrochiptests durchgeführt. Aus diesen Daten können nur wenige medizinische Informationen gewonnen werden.

Sie gaben kürzlich bekannt, dass sie das Complete Genome-Produkt hergestellt haben, liebe, aber medizinisch relevantere Informationen können von diesem Produkt erhalten werden. Ich mag die Art und Weise, wie sie Kundenservice betreiben, visuelle Dinge. Schön, solide, cool.

In der Regel sind digitale Produkte in der Medizin in Russland nicht technologisch, banal oder einfach. Stanislav Sazhin hat ein gutes altes soziales Netzwerk für Ärzte. Es ist eine klare Geschichte, denn Pharmaunternehmen können nicht einfach so für verschreibungspflichtige Medikamente im Internet werben und sie können nur für Ärzte werben. Und hier knüpfen Sie ein soziales Netzwerk, in das sich nur ein Arzt eintragen kann, und fügen eine Kopie Ihres Diploms bei. Und dort können Sie die Werbung von Pharmaunternehmen verdrehen. Und es geht ihm gut. Kommerziell ist dies wahrscheinlich eines der erfolgreichsten Unternehmen in der digitalen Medizin. Aber es ist nicht atemberaubend, wenn wir darüber reden.

Oder Zoon Service - ein Marktplatz für medizinische Dienstleistungen. Normale digitale Geschichte: Labors und Kliniken veröffentlichen ihre Beschreibungen und so weiter. Dies hilft, Leads zu generieren, ist aber auch hier nicht atemberaubend.

Ein ausführlicher Vortrag darüber, welche Bioinformatikunternehmen derzeit in Russland und der Welt existieren

Sprechen wir über den zweiten Teil des Wortes "Bioinformatik". Welche Arbeit für Programmierer ist in der Biotechnologie? Und gibt es welche?

Natürlich. Schließlich muss jemand die Infrastruktur aufbauen, um all unsere Bioinformatik-Software auszuführen. Jemand muss eine neue Bioinformatik-Software schreiben.

Es gibt verschiedene Ansätze. Das erste: einen Biologen zu nehmen und ihm das Programmieren beizubringen, das zweite: Informatik zu nehmen und ihm Biologie beizubringen. Gut und das dritte: den Menschen zu nehmen und ihn und Biologie und Programmierung zu studieren. Hier ist die Geschichte so, dass, wenn Sie einen Biologen nehmen und ihm das Programmieren beibringen, nicht immer ein normales Ergebnis erzielt wird. Wenn Sie einen Programmierer nehmen und Biologie lernen, dann bringen Sie ihm tatsächlich die Datenanalyse bei, und er wechselt schnell an einem hochbezahlten Ort in die Datenwissenschaft.

Ich muss ehrlich sagen, dass es keine Gehälter wie in der IT gibt. Überall wird es niedrigere Gehälter geben. Und auch in der Bioinformatik sind die Gehälter niedriger als nur bei der Analyse von Daten für eine digitale. Und das ist natürlich ein Problem, weil viele Leute, ein paar meiner Bioinformatik-Freunde, gearbeitet haben, dafür gesorgt haben, dass sie ein paar Cent bekommen, und dann wieder zur IT zurückgekehrt sind. Hier wird die Konkurrenz nicht gepflegt. Die Menschen gehen normalerweise aus ideologischen Gründen, aber für eine lange Zeit schlüpfen sie nicht in diese ideologischen Überlegungen.

Wenn ein Entwickler beschloss, dass er auch im Kampf gegen Krebs helfen möchte, was sollte er dann tun, wohin? Oder nirgendwo hingehen?

Nun, er kann an der Bilderkennung arbeiten, an der Datenanalyse arbeiten, interessante Fähigkeiten und Erfahrungen sammeln. Es gibt hier keine großen Unternehmen, es wird also immer noch eine Art Startup sein. Wenn Sie müde werden oder das Gehalt gering erscheint, können Sie jederzeit zurückgehen.

Über die Popularisierung der Wissenschaft


Sie sind einer der Popularisierer der Bioinformatik. Wie und warum hast du damit angefangen?

Ich habe damit angefangen, weil es mir gefällt. Ich mag es zu sprechen, ich mag es zu sprechen, mit dem Publikum zu sprechen, um einige meiner Ideen zu vermitteln. Ich freue mich, also mache ich es.

Ich habe 2014 mit Science Slam angefangen, die Jungs haben mich eingeladen zu sprechen und gesagt, dass sich dein Leben danach ändern und nicht mehr so ​​sein wird wie zuvor. Lass dich nicht täuschen :)

Sie sind großartig, damit Anfänger sofort im freundlichsten und warmesten Klassenzimmer sein können. Es berührt und danach möchte ich weiter sprechen.

Dieselbe Performance bei Science Slam, die die Liebe zur Popularisierung der Wissenschaft auslöste

Haben Sie das Gefühl, dass das Interesse an diesem Thema wächst?

Ich denke schon Dinge, die mit Training und Unterhaltung zu tun haben - sie sind natürlich auf dem Vormarsch. Dies macht sich sowohl in der Anzahl der Kurse, an denen meine Freunde und ich teilnehmen, als auch in der Anzahl der vorhandenen Vorträge und in der Anzahl der Personen bemerkbar, die mich anrufen, um zu sprechen.

Als es anfing, schien es mir, dass dies eine Art nerdiges Thema war, und jetzt sehe ich, dass dies der vollständigste Mainstream ist. Die Leute gehen gerne herum und stellen Fragen. Ich selbst lerne gerne durch Kommunikation mit Menschen, lese auch gerne Bücher, aber es ist am besten, schnell in eine Art menschlichen Kontakt mit einem Thema einzusteigen. Und ich bin sehr froh, dass sich das alles entwickelt.

Langsam kann man sogar den wissenschaftlichen Markt sagen. Dies ist für Doktoranden in ihrer Freizeit keine Aktivität mehr.

Oft trittst du nicht in Moskau auf?

Natürlich! Ich spreche ständig und mit großer Freude in verschiedenen Städten. Nur in diesem Jahr trat ich in Nischni Nowgorod, Twer, Jekaterinburg, Krasnojarsk, St. Petersburg, Nowosibirsk, in der Stadt Plyos auf. In den letzten Jahren ist es auch Murmansk, Tscheljabinsk, Tjumen, Bratsk, Sayanogorsk, Wladiwostok.

Wie sieht es mit der Popularisierung in den Regionen aus?

In den Regionen ist alles in Ordnung. Ich habe einen Freund, Misha Kaptyug, der das Projekt „Smart Cities“ durchführt. Er hat jetzt Berichterstattung - ungefähr die Hälfte aller Regionen. Dies ist eine Wissenschaftsshow für Kinder, aber tatsächlich für die ganze Familie. Und mit ihnen läuft alles gut.

Das heißt, dieses Thema ist keineswegs nur Moskau, es bewegt sich in den Regionen und von ganz anderen Seiten. Ich arbeite oft mit meinen Lieblingsinformationszentren für Atomenergie zusammen - ICAE, ein Rosatom-Projekt zur Popularisierung der Wissenschaft. Das heißt, es geht nicht darum, das Atom und die Errungenschaften der Atomwissenschaftler bekannt zu machen, sie rufen alle an, organisieren Wissenschaftsfestivals und zeigen, dass die Rosatom Corporation zum Wohle ist. Dies ist meiner Meinung nach eines der guten Beispiele für ein Unternehmensprojekt.

Nun, in vielen Städten gibt es Einheimische, die alles organisieren und fördern. Zum Beispiel, eine sehr coole Community in Tver, haben sie sogar angefangen, ein Magazin zu veröffentlichen. In Jekaterinburg gibt es ein wundervolles Jelzin-Zentrum, in dem viele Veranstaltungen stattfinden und in dem auch die gesamte wissenschaftliche Versammlung stattfindet.

Im Allgemeinen gibt es eine Bitte, es gibt eine Nachfrage nach mir als Dozent, und ich bin sehr froh, dass es in allen Regionen eine gewisse Bewegung gibt.

24. Januar wird Andrei auf einer Konferenz über das Verhältnis von IT und Wissenschaft Mieloconf sprechen . Andrei wird Ihnen sagen, was Sie tatsächlich aus einem Gentest lernen können und wie die Arbeit mit genetischen Daten aussieht.

Kommen Sie und lernen Sie uns kennen!

Source: https://habr.com/ru/post/de481894/


All Articles