Bioinformatik Andrey Afanasyev是yRisk生物技术创业公司的创始人之一。 在接受采访时,安德烈(Andrei)讲述了他们使用哪些技术来确定一个人是否易患遗传性癌症,俄罗斯的生物技术状况如何以及生物技术程序员是否有工作。

关于yRisk
安德烈(Andrey),您是yRisk基因实验室的创始人,您正在寻找基因突变和肿瘤学易感性。 请告诉我,这在实践中是如何发生的?
我们对所谓的遗传性肿瘤综合征的存在进行了测试,这转化为在相对年轻的年龄(甚至长达50岁)的生命中罹患癌症的高风险。
我们如何进行这项测试? 我们像从正常的血液测试中一样,从静脉中收集人的血液,从血液中提取DNA,然后在称为测序仪的特殊设备上分析DNA。 从定序器中可以获取大量数据,每个样本的数据量为千兆字节甚至数十千兆字节。 然后,我们使用特殊算法,数据库,分析这些数据的建议对它们进行分析,并生成多页报告,其中可以告诉您相对于平均水平而言是否存在增加的风险,以及存在任何风险时应如何处理。
在这次采访中,安德烈(Andrey)详细讨论了遗传性肿瘤综合症。
这一切在技术方面如何安排? 您如何处理这些数据? 您有自己的软件吗?我们在iBinom初创公司的上一家公司编写此类软件的经验。 我们为定序器数据的生物信息学处理提供了云服务,并利用我们的经验为自己实现了这种处理。
在iBinom,我们进行了云处理,使用Amazon S3作为存储,使用Amazon Elastic Computing Cloud作为计算节点。 现在,所有这些都可以在本地服务器上运行,我们在该服务器上部署了一组生物信息学程序。
首先,分析来自定序器的输入数据的质量。 有一个用于分析FastQC数据质量的特殊程序:在其帮助下,可以构建各种统计信息,分布等。
如果在此阶段质量良好,则执行所谓的数据对齐-对齐,映射或映射。 没有确定的俄语单词。 从计算的角度来看,比对是一项艰巨的任务,每个样品都需要花费大量时间。
映射数据后,使用各种统计算法执行所谓的变量调用。 之后,将为所有可用数据库注释找到的选项。
批注后,将获得带有选项和功能的大型Excel板。 在这种大型Excel数位板中,我们已经可以用眼睛选择各种选项,并根据ACMG标准(美国医学遗传学学院的标准)对其进行分析。
此分析不再可以自动化,您需要直接转到出版物,仔细阅读它们。 如果将一个写在其中,则将打勾,如果将另一个打入,则不打勾。 对于每个样本都需要这样做,因此必须手动查看数百条记录。
在这里,机器学习无济于事,只能做手工工作?
是的,机器学习在这里不起作用,因为人们写的文章是以人类可读的形式而不是机器可读的形式编写的。 我们尝试使用神经网络玩数据提取,使用不同的方法从文本中获取含义。 3年前,我们在实验室中进行了基因组功能分析的框架,但我们发现这里没有取得重大进展。
在生物学中,这通常是一个很重要的故事:数据不是机器可读的,并且数据本身的标记非常复杂。 您不能只雇用一群人说这是猫,这是狗,这是交通信号灯,这是过渡。 受过良好生物学教育的人应该阅读此书。
有尝试在此收集自动化数据库,但是作为使用这些基础中的一些基础的人,我可以说那里的质量很糟糕。 相对而言,人们经常阅读注解中的某些内容,以某种方式理解它并写道,例如,该选项是致病的,尽管您转到文章的正文并以纯文本形式表示它不是致病的。 恰恰相反。 因此,某种计算机处理的可能性到此结束,所有相关信息都必须用眼睛观察。
您的网站说测试准确率为99.99%,听起来确实很酷。 如果这篇文章如此有效,为什么不能在正规医院做呢?此测试需要设备-音序器,音序器仍是研究仪器,而我们正在进行的测试是研究。
医学实验室不想弄乱研究设备。 造成这种情况的原因有很多:从他们无法获得增值税退税的事实开始,到他们有可能受到Roszdravnadzor检查未注册为医疗的任何试剂或设备的风险而结束的事实。
这里的故事很简单。 根据法律,这些测试是在旧设备和旧试剂上进行的。 非医学测试不能以特定方式销售或销售。 例如,不能用分配给政府的药品购买非医疗测试,或者不能承保VHI。
因此,我们处于最前沿。 有人说,基于新一代测序的像我们这样的测试,应该在相当长的一段时间(至少四年)内进行医疗。 但是事情仍然存在。
是否有任何公开预测?我不相信在俄罗斯有一天会公开。 可能会在某个时候出现,但肯定不会在不久的将来出现。 我们的卫生部长说,我们有一个参考医疗系统。 我们还有许多紧迫的问题,例如,基本药物的获取。 如果您阅读人们从基金中写的内容,您会发现在药物供应领域,一切都非常糟糕。
这个测试对白人来说是个问题。 当一个人做得很好时,他就有钱了,他可以去再做一次。
您是否有计划开发其他产品?我们有与不同产品相关的计划,用于计划生育,怀孕管理。 在这里,我们想与其他诊所合作。
我们制作了与肿瘤学相关的最初产品,希望在俄罗斯有需求,但是在两年内我们意识到对它的需求被高估了,现在我们希望切换到稍有不同的产品。
安德烈(Andrey)关于衰老,奇特的长寿动物和药物的现有理论的演讲可以帮助人类应对衰老关于生物信息学
当今世界,生物信息学在做什么? 他们面临的最实用的任务是什么?生物信息学通常被称为解决生物学应用计算问题的人。 也就是说,生物信息学面临的任务是生物学家的任务。
最美丽的科学任务是在理解进化和发展进化理论方面的进步。 因为从基因组序列的比较中,人们可以得到很多有趣的事情,例如物种进化的过程,确定某些物种与其他物种之间的关系,关于突变积累的不同问题,关于轻微有害的突变等等。 从科学的角度来看,这可能是最有趣的。
从应用事物的角度来看,现在使用什么生物信息学技术来分析基因组序列。 基因组序列的分析是遗传性疾病或癌症的任务。 分析患有遗传性疾病的人的基因组数据,以便建立诊断,开发治疗方法,以了解这种情况的发生频率。 这是一项任务。
第二项任务是肿瘤学。 分析肿瘤基因组的数据,以试图了解存在哪些驱动突变,哪些客运突变,哪些突变可用于开发新疗法,肿瘤如何发展以及发生了哪些肿瘤。
第三件事是种群基因组学。 这是一种尝试,以了解我们在遗传上有何不同,不同人群的特征是什么以及如何处理所有这些。
您最近对生物信息学的发现有何印象?
很难说出生物信息学中的发现,因为它通常在您的指尖。 我要说的是更接近现实的事物,因为科学事物不太可能变得非常有趣。
斯奈德做了一件有趣的工作,对他的身体的微生物组进行了生物信息学分析,为期一年。 几乎每天,他都测量他的微生物组如何变化,并发布有关此散布的数据。 全年变化很大。
从那时起,可以预期种群微生物组数据。 有趣的是,一年中不同人群的微生物群落如何不同,但彼此之间却有所不同,这取决于他们的居住地,生活方式等。
俄罗斯的生物技术如何发展?
关于这一点,我只能说得很好或以任何方式说:)从广义上讲,俄罗斯正在发生一些事情。 在医学方面,当然也发生了一些事情,但是它比美国发生的事情小且慢。 怎么了 实话实说,因为俄罗斯医学很小而且落后。
我们几乎没有自己的药物开发。 我们要做的最大事情是仿制药和生物仿制药。 俄罗斯开发的几乎所有原始药物都是fuflomycin,它们没有有效的正常经证实的证据。 当然,这里的一切都很难过。
作为一个孤立的医疗市场,我们很小,在这里我们没有特殊动机。 但是,在IT和生物技术的交界处,我们有许多有趣的公司。 他们为什么在那里? 因为我们有很多优秀的IT专家,所以IT专家致力于生物技术。 而且,当他们了解到出于某种原因而导致牙医的下一个麻烦不在俄罗斯或下一个电子病历中起飞时,有时他们会想到更好的主意。
我非常喜欢UNIM。 他们做了一件相当简单的事情:将组织学数字化。 所有癌症诊断均通过组织学检查证实。 组织学检查是指采集细胞,以特殊方式染色并用显微镜检查的时间。 UNIM通过缩放和云存储以高分辨率将这些显微图像数字化。
现在,组织学部分不是通过显微镜观察的,而是在计算机屏幕上观察的,不是一名医生,而是三名医生。 不仅是获得医生证明的医生,而且还在UNIM接受了内部培训并通过了考试,无论州身在何处。 所有这些都大大提高了诊断的准确性。
从技术的角度来看,这并不是一件很难的事,但是好处却是强大而又酷的。 尽管存储大图片也很困难,但是这里对于机器学习毫无疑问。
您能否举一些您喜欢的俄罗斯生物技术项目的其他例子?我喜欢Atlas中的人在做什么。 他们进行基因测试。 他们最初的想法是创建一个私人诊所,在该诊所中,决策也将基于基因检测数据。 最初,他们想出了错误的基因测试技术,进行了微芯片测试-从这些数据中,几乎无法获得医学信息。
他们最近宣布,他们亲爱的完成了全基因组产品,但是可以从该产品获得更多医学相关信息。 我喜欢他们做客户服务的方式,视觉效果。 美丽,坚固,酷。
通常,俄罗斯的医学数字产品不是技术,平庸,简单的东西。 斯坦尼斯拉夫·萨任(Stanislav Sazhin)为医生建立了良好的旧社交网络。 这是一个清楚的故事,因为制药公司不能像在互联网上那样宣传处方药,而只能向医生做广告。 在这里,您正在建立一个社交网络,只有医生可以在其中注册,并附上您的文凭副本。 在这里,您可以扭曲制药公司的广告。 而且他做得很好。 在商业上,这可能是数字医学领域最成功的公司之一。 但是当我们谈论它时,这并不惊人。
或Zoon服务-医疗服务市场。 正常的数字历史记录:实验室和诊所张贴其描述等。 这有助于产生销售线索,但同样,这也不是令人叹为观止的。
关于俄罗斯和世界上现在存在哪些生物信息学公司的详细讲座让我们谈谈“生物信息学”一词的第二部分。 程序员在生物技术领域的工作是什么? 还有吗?当然可以 毕竟,有人需要构建基础结构来运行我们所有的生物信息学软件。 有人需要编写新的生物信息学软件。
有几种方法。 第一个:接受生物学家教他如何编程,第二个:接受计算机科学教他生物学。 第三点:带人并研究他和生物学,以及编程。 这里的故事是这样的,如果您带生物学家教他编程,那么通常不会得到正常的结果。 如果您选择一名程序员并学习生物学,那么您实际上是在教他数据分析,然后他很快就进入了高薪领域的数据科学领域。
我必须老实地说,没有IT部门这样的薪水水平。 到处都会有较低的薪水。 而且,在生物信息学中,薪水也比分析数字数据中的薪水低。 当然,这是一个问题,因为很多人(我的许多生物信息学朋友)都在工作,确保他们得到了几分钱,然后又回到了IT部门。 在这里,竞争没有得到维持。 人们通常出于某种意识形态的原因而去,但很长一段时间以来,他们对这些意识形态的考虑却丝毫未言。
如果某个开发人员决定他也想在抗癌方面提供帮助,那么他应该怎么做,应该去哪里? 还是无处可去?好吧,他可以去从事图像识别,去进行数据分析,获得有趣的技能和经验。 这里没有大公司,所以它仍然会是某种初创公司。 如果您感到疲倦或薪水似乎不高,可以随时返回。
关于科学普及
您是生物信息学的普及者之一。 您如何以及为什么开始这样做?
我开始这样做是因为我喜欢它。 我喜欢讲话,喜欢交谈,与听众交谈,传达我的一些想法。 我很高兴,所以我做到了。
我从2014年开始参加《科学大满贯》,这些家伙邀请我发言,并说,此后,您的生活将会改变,并且将与以往不同。 不要上当:)
它们很棒,可以让新手立即进入最友好,最热情的教室。 令人感动,之后我想继续发言。
在《科学大满贯》中有同样的表演,开始了对科学普及的热爱您是否对此主题越来越感兴趣?我也这么认为 与培训和娱乐有关的事情-当然还在增加。 在我和我的朋友参加的课程数量,在现有的讲座数量以及打电话给我发言的人数中,这都是显而易见的。
当它开始时,在我看来这是一个讨厌的话题,现在我看到这是最完整的主流。 人们喜欢四处逛逛并提出问题。 我本人喜欢通过与人沟通来学习,也喜欢读书,但是最好以某种人际交往的方式快速进入话题。 我很高兴这一切正在发展。
慢慢地,人们甚至可以说出科学市场。 这不再是研究生在业余时间的活动。
您经常不在莫斯科表演吗?当然可以! 我不断愉快地在不同的城市讲话。 仅今年以来,我就在普利奥斯市的下诺夫哥罗德,特维尔,叶卡捷琳堡,克拉斯诺亚尔斯克,圣彼得堡,新西伯利亚进行了表演。 在过去的几年中,它也是摩尔曼斯克,车里雅宾斯克,秋明州,布拉茨克,萨亚诺戈尔斯克,符拉迪沃斯托克。
在该地区的普及情况如何?在该地区,一切都很好。 我有一个朋友Misha Kaptyug,他正在做“智慧城市”项目,现在他的研究范围覆盖了所有地区的一半。 这是针对儿童的科学表演,但实际上是针对整个家庭的。 他们的一切进展顺利。
就是说,这个话题绝不仅仅是莫斯科,这个话题正在各个地区,并且从完全不同的方面出发。 我经常与我最喜欢的原子能信息中心-ICAE合作,这是有关科学普及的Rosatom项目。 也就是说,这与普及原子和原子科学家的成就无关,他们根本不召集所有人,组织科学节,同时表明Rosatom公司是有益的。 我认为,这是公司项目的一个很好的例子。
好吧,在许多城市,都有当地人组织和推广这一切。 例如,在特维尔一个非常酷的社区,他们甚至开始发行杂志。 叶卡捷琳堡(Yekaterinburg)有一个很棒的叶利钦中心(Yeltsin Center),其中发生了许多活动,整个科学聚会也在这里进行。
总的来说,有一个要求,对我的要求是担任讲师,我很高兴在所有地区都有动静。
1月24日,Andrei将在关于IT与科学的关系Mieloconf的会议上发表讲话。 安德烈(Andrei)会告诉您,您可以从基因测试中实际学到什么,以及如何处理基因数据。
快来结识!