生物大草原中的计算机科学潜艇

生物信息学正在迅速普及,并已从极客的庇护所转变为众所周知的成熟学科。我认为大多数《极客时间》的读者都可以自信地说,兔子不仅是宝贵的皮毛和3-4公斤的食用肉,而且是44条染色体,多种蛋白质,转录和翻译机制,仅此而已。如果我说可以研究和分析所有这些信息,我也不会让任何人感到惊讶,不仅是在无菌实验室的显微镜下站在白大褂下,而且还带着笔记本电脑躺在沙发上,喝点苏格兰威士忌。但是,它们通常不会超出此知识范围。我决定尝试纠正这种烦人的误解,并从实际角度简短地探讨生物信息学从内部看的方式根据我的经验。

在本文中,我将收集我自己三年前在我还是数学系学生时提出的问题,我将尝试回答这些问题。



为什么需要生物信息学?


非正式地说,生物信息学的任务是在生物数据中寻找逻辑。这些数据是在实验过程中获得的,如果对于生物学家来说,数据看起来像是发光的鱼或照片中美丽的彩色斑点,那么对于生物信息学而言,数据表示为:

  • 字符串(描述DNA / RNA /蛋白质的字符序列);
  • 三维坐标和二维坐标(显微镜数据);
  • 实数数组(例如,每个数可以是实验测量的蛋白质或其一部分的质量);
  • 非负整数的向量(例如,离散对象的覆盖深度,即所谓的reads);
  • 零和一的矩阵(例如,不同类型的细菌能否彼此相处);

以及使用数学对象的许多其他可能的真实生物现象的表示。

生物学家有更多有趣的数据吗?


无疑。但是生物信息学不需要在周末去实验室(例如,细胞培养不了解周末,并且往往会在没有适当照顾的情况下死亡)。生物学研究通常持续数年(取决于模型生物的特性),而生物信息学的进展主要取决于解决算法问题和编写“智能”代码的能力。嗯,在世界任何地方进行远程工作的可能性也无疑是对生物信息学的青睐。



生物信息学中有多少生物,信息学有多少?


这在很大程度上取决于特定的研究中心和研究小组。您需要最低程度地了解生物学-没有人会在一项科学项目上将您嚼到学校数学问题的水平。您必须根据对生物学的了解来为情况建模。但是,并没有真正深刻的理解,因此,如果您决定处理这门特殊科学,那么仅记住雌蕊和雄蕊的事实就不会成为障碍。在从事生物信息学项目的过程中,生物学的基本基础已经很容易学习。

对于未来“来自信息学”的生物信息学来说,真正有用和必要的是对生物技术的知识,即如何获取数据,在实验过程中可能出现什么问题。我认为,沿着分子生物学的某些过程奔波是足够的,但是花时间并认真地理解用于实验的现代设备的操作原理。

我建议在培训过程中“来自生物学”的未来生物信息学首先跳过方法和算法的证明和描述,并将其作为“黑匣子”进行研究,也就是说,在纯粹的应用方面:“在输入处为A-在输出处为B”,否则存在风险”在理论计算中淹没了几年。但是,由于错过了理论知识并在实践中学习了一些知识,因此您很容易返回并用不同的眼睛看它。

但是,如果我成为生物信息学者,那么我会知道生物信息学吗?


不幸的是,没有。就像其他任何科学一样,当前的生物信息学包括很多部分。例如,如果我们将其与物理学进行比较,那么很明显,理论力学的专家在理解量子物理学的最新文章时可能会遇到某些困难,而且,他很可能没有时间阅读这些文章。

在生物信息学中,有很多章节适合您的每种口味:

  • 进化(不仅以“棘皮动物优先”的形式出现,而且还鲜为人知,例如在癌性肿瘤中发生的进化)
  • 寻找导致疾病的遗传选择
  • 与某些类型的“对人体有害”蛋白结合的药物的构建和选择
  • 基因功能及其注释的研究
  • 结构生物信息学(具有2D和3D结构的操作,例如蛋白质或RNA)
  • 基因组组装
  • 绘制一张地图,显示所有这些混乱的蛋白质/ RNA / DNA /脂肪/聪明的想法/健身房/克里姆林宫饮食与其他事物如何相互作用(类似于此视频中的内容,但更有趣,更复杂)
  • 对复杂系统建模(例如从胚胎发育生物体)
  • 神经生物学(或更确切地说,是对神经生物学家获得的数据进行分析);

还有更多(请原谅我忘记提及的生物信息学领域)。

最后三点通常被称为系统生物学,但是正如他们所说,这些科学处于“交汇点”,您可以以最小的努力来回跳跃。

选择生物信息学作为您的职业有意义吗?


要回答这个问题,请根据您的重要程度分配以下特征(将等级6分配给最重要的特征,将1分配给最不重要的特征),然后用指示的符号进行总结。

+我一直想成为一名科学家,并感到我为人类的未来做出了一定的贡献。
+我对生命科学感兴趣,我希望能够每天学习有关生物学的新知识,但是我在大学的学习与生物学无关-或-我是生物学家,但我对用移液管进行单调的技术操作感到厌倦,我想要更多了解我收到的数据类型并能够使用它们。
+生物信息学作为计算机科学的一部分对我来说很有趣,在我看来,您需要考虑很多任务。
-我想大学毕业后马上获得高薪。
-我想像一位真正的科学家一样,一直穿白大褂。
-我喜欢思考任务并阅读有关生物学的有趣文章,但我不喜欢编程。

如果您得到的结果小于0,则绝对不应该使用生物信息学。您会因测试的松散和通用性而感到痛苦,但是您了解它的想法,甚至喜欢它吗?给结果加3点。



生物信息学的职业阶梯是什么样的?


“如果真的愿意,您可以飞入太空”,但是如果您身高2米,体重150公斤,则不太可能被带入航天员小队。但是生物信息学呢?

基础教育


职业是受过高等教育的。本科学习可以是非人道主义的。经济学,物理学,化学,数学,更不用说计算机科学和生物学了。

硕士学位课程的最有利选择是生物信息学硕士学位课程或本科课程的“加法”,因此在这两个步骤之后,您将获得一些生物学的东西和一些计算能力。的确,要进入一个完全不同的裁判官区并非易事。

至于有可能获得生物信息学专业的高等教育的第一阶段(学士/专科)的可能性,我对此持模棱两可的态度。

生物信息学应该是一种有意识的选择,放学后做出这样的选择看起来相当困难,但是如果您确定这是您的要求,那么为什么不这样做。但是,“立即接受一般教育然后选择专业化”的方法给我留下了深刻的印象,而不是立即开始朝狭窄的方向努力。我不确定经过4-6年的培训后是否可以轻松地再培训另一位专家,但是有一些成功实现razbiofinformatization的例子。

额外的教育


为了熟悉生物信息学,已经创建了许多在线课程(Stepic.org俄语,Stepse.org俄语,Coursera,edX等)。在在线课程中,有一些非常有用的课程(我会推荐UCSD的生物信息学算法课程和Duke大学的进化课程),注册后再进行,如果它变得无聊或困难-您可以冷静地退出这项业务,而不会浪费任何时间或精力你的神经。的确,对于全日制教育而言,有动力去做事(比喻地讲,穿着三件套西装,手里捧着一束鲜花,扣眼里放着康乃馨),以便生物信息学立即意识到这种关系对您很重要。

额外的教育是一件奇妙的事情,它具有几乎相同的优势-周末或晚上上课(不会干扰基础学习或工作),热情的团队甚至常常没有学费。但是-这些课程的选择非常艰巨,课程众多,步伐很快。因此,如果您只是想了解是否进一步从事生物信息学,那最好先做一下-查看在线课程,与专业人士交谈,阅读通俗的科学知识(我认识的人写的东西) -有关Habrahabr的文章,有关Geektimes的文章,以及对Biomolecule如果我去了生物信息学,让他们教我”的评论)。



据我所知,在俄罗斯还有两个附加计划-圣彼得堡的生物信息学研究所(IB)和首都莫斯科的生物信息学学院(MBS)。在我看来,它们在专长领域所获得的知识水平大约与治安官水平相当,但是只有“一只稀有鸟类会到达第聂伯河的中部”-许多学生上了十二堂课后就掉下来了-哦,收集河马并不容易。

我本人毕业于生物信息学研究所,是学术大学(SPbAU)硕士课程的一部分,因此,我将向您详细介绍IS(MBSB与Yandex分手后我对MBSB一无所知)。该课程为期一年,每周六上课。我几乎喜欢所有的研讨会和讲座,但是培训中最杰出的部分是科学项目。那里的科学顾问来自俄罗斯和奸诈的外国领先的科学中心。从理论上讲,项目应该首先是教育性的,但往往不是一门真正的科学。曾经有一段光荣的时光:不眠之夜充斥着阿拉伯童话故事“ 1000和1个剧本”(实际上,最初的故事是印度教),对项目的激烈辩护,以及对科学文章产生的最前沿的参与感,这种翻译通常可以在Geektimes见面。哦,对了,那里有自助餐。套装现在要去那里。同时,信息安全的优点和缺点是缺乏基本学科-仅生物信息学,仅此而已。

如果您想要更多的科目和基础培训,那么拥有技术学士/专业文凭的持有人可以像我一样,立即进入算法生物信息学的2年制硕士课程。录取过程是标准的:在线申请直到仲夏,然后是面试。 2016/18年度的申请受理已经开始。但是生物学家去那里是完全没有意义的。

为了完成这个故事,我必须使用我的代理商网络。在发布前夕,一名侦察员最终违反了无线电静默模式,并将有关MBS的放射图交给了总部。关于MBS学习过程的解密消息的主要内容是:a)从HSE获得官方文凭的可能性;b)存在一些基本学科,例如Matan(在我看来,这是一种嘲弄,但是Matan很有用,因此可以使思想井然有序);c)研究项目是在莫斯科领先的生物信息学的指导下进行的;d)由于作业量大,学生不得不流连忘返,集体思考问题;e)然而,学生们高兴地尖叫着,要求更多的生物信息学。MBS的招募将于5月开始。

暑期学校


另一类继续教育。据我所知:对于学生来说,这里有一个分子和理论生物学学院(更多的是生物学,但对于未来的生物信息学来说,无疑是有好处的),对于学生和“新手”的研究生来说,是外国生物信息学研究所(LSB)暑期学校 -位于加州研究暑期学校统计组学(RSSSO)如果只是简要介绍一下我上过的学校-LSP非常适合简短地介绍生物信息学,那么RSSSO适用于已经了解计算生物学是什么并且想“吸收”其统计基础的人们。在LSB / RSSSO中,一个人可以/应该参加有趣的科学项目,在此期间,您可以在短时间内感到自己像一名真正的科学工作者。这也是夏天与大公司一起玩乐的好方法。LSB在莫斯科和圣彼得堡的RSSSO-克罗地亚的斯普利特市交替进行。SHMTB将在巴塞罗那。

职业生物信息学


职业生涯从下一个开始-攻读硕士课程后,您可以找到生物信息学专家的工作(是的,是的,我听到令人愤慨的声音,有可能在获得学士学位之后,在放学之后以及在读完幼儿园之后,但让我们同意毕业是最好的许多参数参考点)。可以在俄罗斯(在blastim.ru网站上收集空缺数据库)和国外都可以做到这一点。第二种选择是获得博士学位或博士学位。如果您是一名优秀的专家,那么在几乎所有国家/地区(甚至在俄罗斯,甚至在哥斯达黎加)都可以找到研究生院非常简单。文凭的等级起着作用,但不是决定性的。在国外还是在国内,哪种更好?暂停这个问题。也许,当您成熟进入研究生院时,您将自己决定。无论如何,在研究生学习的过程中,您很可能在另一个国家实习几个月或多次。

博士后已经有3种选择:

第一种是了解生活是易逝的,完全放弃科学,去Yamalo-Nenets自治Okrug养鹿。我们将不讨论此选项,因为它不再与本文的主题相关(但我建议您提防狼而不是愤怒的鹿,它们的角看起来很危险)。

第二种选择是继续你的学术生涯,第三种是-进入该行业(许多公司正在寻找具有适当特征的专家)。学术生涯涉及获得数个实习机会,简称为博士后。博士后的薪水是研究生的几倍,但通常比从事该行业的专家的薪水低。获得博士学位后在行业中找工作 (可选)几个后文​​档要简单得多。然后,您可以担任研究人员的永久职位,或者尝试创建自己的实验室并领导该实验室。这是一件复杂的事情,老实说,我对“超越博士后”一事一无所知。

而不是结论


我将继续回答您对本文评论中提出的问题。另外,如果对此感兴趣,我可以在另一篇文章中谈论我在做什么(研究遗传和表观遗传变异性与疾病之间的联系)。

作者简介:莫斯科国立大学机械学院专家,2013;工学硕士(生物信息学),MIIT SPbAU,2015; 目前是巴塞罗那CRG疾病基因组和表观基因组变异的研究生。

希望本文对您有所帮助。

PS在发送此文章之前,同事已经阅读过,并说它写得太悲观了。我敢向读者保证,几年前我问这些问题时,我得到的答案要暗得多。

Source: https://habr.com/ru/post/zh-CN390563/


All Articles