大家好,我叫Alexander Sokolov,我想告诉您我是如何在家制作测序仪的-一种用于解码DNA的设备。 这种设备的市场价格约为1000万卢布。

遗传学的简要介绍。 如果您突然想起,在2003年发表了一个轰动性的声明:科学家终于破译了人类基因组。 基因组是由DNA构建的,而DNA是人体的源代码。 DNA是由4种核苷酸组成的双链,在人类基因组中重复约30亿次。 就像计算机上的所有信息都以位加密一样,组装人体所有蛋白质的指令也以核苷酸加密。 也就是说,知道了DNA中核苷酸的顺序后,理论上我们可以收集所有必需的蛋白质并获得人体模型。 因此,从标准意义上讲,科学家们并没有解密DNA,而只是在计算机上将化学序列翻译为一组零和一。 接下来要做的是一个单独的对话。 例如,目前我们只了解整个基因组阵列中只有5%的功能(这是蛋白质编码)。 剩下的95%只能做什么。
2003年,人类DNA测序的成本约为1亿美元。 随着时间的流逝,这个数字已经下降,现在已经接近一千美元。 您需要付费,您的DNA进行了测序,并提供了具有3 GB信息的硬盘-数字化基因组。
当今市场上有三种主要的音序器。 产量最高的Hiseq及其NovaSeq接收器提供最便宜的(荧光)测序。 它的发射之一持续了几天,在此期间,几个人的基因组被立即处理。 但是,发射本身的成本约为一万美元。 顺便说一句,该设备本身的成本约为100万美元,并且由于它在大约3年后就已过时,因此要想获得回报,它必须每天为您带来1000美元。
去年夏天,第二个设备出现在市场上。 它被称为纳米孔,是基于一种非常有趣的技术,当DNA通过纳米孔进行测序时。 最便宜的Nanopore变体定位为一次性家庭定序器,价格为1000美元。
第三种设备是PGM,这是一种半导体定序器,在其祖国的价格为50,000美元,在俄罗斯大约为1000万卢布(包括交货,通关等)。 测序过程大约需要几个小时。
好吧,我没有一千万,但我想要PGM。 我必须自己做。 首先,简要介绍半导体排序的发生方式。 整个DNA链分为300-400个核苷酸的片段,称为读段。 然后将读段附着到小球体上,并复制多次-结果,一堆相同的DNA片段“悬挂”在每个球体上。 必须进行复制才能放大每个特定读取的信号。 一组不同的区域称为DNA库。
PGM的核心是一次性芯片-一种类似于相机中的矩阵的矩阵,但是它不是对光做出响应的像素,而是对酸碱平衡变化做出响应的pH晶体管。 所得的DNA文库被装载到包含1000万个孔的芯片上;每个孔的底部是一个pH晶体管。 洞中只有一个球体,因此只能读取一种类型(具有一个特定的核苷酸序列)。 然后将试剂送入芯片,使DNA开始自我复制。 然后线性复制,也就是说,核苷酸按照其在母链中的排列顺序连接到新创建的链上。 因此,将一种类型的核苷酸送入芯片-并立即记录某些孔的pH变化(这意味着该核苷酸已连接到它们)。 然后输入不同类型的核苷酸并记录孔中的pH变化等,因此,通过将所有四种类型的核苷酸多次应用于芯片,我们可以获得每次读取的核苷酸序列信息。 然后,通过数学方法,将读取的短片段收集到计算机中的一条链中。 为了或多或少有把握地收集它,每次阅读应阅读约100次。
图1。 半导体排序现在,让我们找出设备本身的组成。 众所周知,这里有芯片,试剂供应系统和主板。 所有排序均精确地在芯片上进行-设备的其余部分仅向芯片发送某些信号,输送试剂,从芯片读取模拟信号,将其数字化并将接收到的信息流驱动到计算机,在计算机上进行数据的存储和处理。
图 2.音序器一次性放置该芯片,使用后将其丢弃。 因此,在PGM工作的地方,可以免费获得任何数量的此类芯片。 你问为什么要买它们? 事实是我已经设法反复使用该芯片。 实际上,它是永恒的:将其充分冲洗-可以一次又一次地使用。 在准确性上,它与新的没有什么不同。 我的主意是为该共享软件芯片制造设备。
因此,我面临着对芯片进行反向工程的任务。 当然,找不到令人垂涎的微电路的文档-制造商不会分享生产秘密,而是想以50,000美元的价格冷静地出售他们的设备。开始时,我做了最明显,最简单的方法:接触面是测试仪。 清楚数字和模拟I / O,电源等的位置。 一些信息是从芯片上的专利中获得的。 但是,当然,这还不足以创建完整的产品。 我仍然摆弄芯片,检查各种猜测,尝试给出信号,但基本上没有前进。 我不得不暂停这个项目。
图 3.芯片然后突然在Habrahabr上,我遇到了著名博客
BarsMonster的一篇文章,内容涉及他如何进行芯片逆向工程! 他受到启发,写信给他,写信给其他爱好者,并向基辅(Kiev)发送了一个请求,在那里他从事摄影筹码的工作。 他们从基辅(Kiev)回答说,他们不知道如何分层抛光,他们只能射击顶层,而且由于我的芯片是多层的,因此不清楚触点的轨迹在哪里。 然后,他遇到了一位也从事芯片逆向工程的美国人,向他发送了他的微电路,但即使在这里,它也不仅仅是拍照上层。 然后,我在互联网上看到了一篇有关那些能够反转Sony PlayStation芯片等的文章(“荣耀归功于英雄!”,就是这样,如果有人知道的话)。 我决定给他们写问题,找到他们的昵称-然后我意识到其中之一对我很熟悉。 最近,一个朋友把我带到了一个“也从事业余遗传学研究”的朋友,我们在Skype上与该朋友交谈,完成了对话。 现在我知道我的新朋友是反向工程芯片的超级大师。 我在那里写信给他。 然而,事实证明,尽管他准备提供帮助,但他没有显微镜。 死胡同了。
几个月后,在附近的实验室发现了必要的显微镜! 没错,内置的相机太糟糕了,我通过目镜在手机上拍摄了照片,并收到了以下质量的照片:
图 4.显微镜下的芯片然后,在最近的一个新年,我的工作中出现了一台可容纳13万的出色显微镜(我是量子密码学的专家)。 梦想成真。 最终,我能够正常从上方拍摄芯片。
图 5.我的工作显微镜然后...然后,我仍然必须自己掌握抛光技术。 抛光的困难在于去除厚度约为1微米的金属层-芯片的宽度为1厘米。 为了进行比较,我要说的是,允许误差每1 km的误差不超过10厘米,我非常努力。 下图显示了我的工作结果:
图 6.光学显微镜下的逆向工程下部硅层,具有晶体管的上部层,第一,第二,第三和第四金属层非常清晰可见。
该芯片由重复区域(例如移位寄存器)组成,从这些图片中可以很方便地对其进行分析:可以立即清楚地了解不同层上发生了什么。 我以丰富的逻辑“逆转”了最“填充”的部分,这些重复了很多次。 但是最困难的事情是跟踪整个芯片上的走线,以了解外部接触指的是什么。 从新年假期到2月底,我手持一台漂亮的新显微镜,忙着完成这项工作-我一直坐在工作到晚上十点,“颠倒了”。 然后发生了一个新的奇迹:一个朋友能够在MIREA的电子显微镜上组织芯片的免费照相。 第一季度的“ Photosession”碎屑 厘米是50 GB的黑白照片。
现在,所有这些单张照片都必须以某种方式组合成一张完整的照片。 几乎在同一天,我在python上编写了一个程序,该程序生成一个HTML文件-在浏览器中打开它时,我得到了所需的东西。 (顺便说一句,最推荐的歌剧是最古老的10歌剧院,我推荐它!)然后,我在javascript上编写了另一个程序,该程序可让您比较图层,在各图层之间平滑过渡,对齐它们,选择比例等。最后,在我手中有解决主要问题的所有工具。 我跟踪了贯穿芯片的路径,并将其整个结构恢复到最后一个晶体管。
X射线下拍摄的芯片切片的另一张照片(在MIREA中):
图 7.电子显微镜可以看到带有读取球的球落在的孔。 下面是三层甚至更低的金属层-一层带有晶体管。
为更美好的未来而奋斗的下一个阶段是为该芯片创建主板。 设计并发送了生产订单。 同时,法院和案件使用了带有FPGA的Mars Rover-2开发板来处理该芯片。 (FPGA大概是10,000个通用逻辑元素的阵列;通过对FPGA进行编程,我们可以获得可以轻松处理千兆位信息流的任何逻辑。)我自己为FPGA编写了固件,此外,我编写了用于动态控制系统的软件。它为FPGA设置了整个配置。 然后半年的假期又出现了(他出差去贝加尔湖,在实验室里准备了一家工厂,并向普京证明了这一点)。 但是最后,星星聚集了:我有时间,现成的木板到了-我组装了系统。
图 8.“铁”的创造他发出了所有必要的信号,然后-奇迹! -我看到了示波器芯片上的信号。 (我曾经在eBay上以6,000卢布购买了一个示波器,另外还购买了1,000欧元的固件。)这些斑点在图片中清晰可见-一些试剂的液滴。
图 9.来自示波器芯片的信号现在,我需要弄清楚如何将这张照片数字化并将其传输到计算机。 我把这个设置放在一起:
图10。 仪表电路
图 11.准备安装有一台计算机可以通过FPGA向板子提供控制数据。 评估板生成数字信号并将其发送到芯片。 来自芯片的信号先到达放大器,再到达板上的ADC,然后被数字化并通过COM端口传输到计算机。 通常,COM端口的带宽很小:每秒15 KB(因为一个芯片中有100万到1000万个“像素”,最大传输速度为115200波特)。 尽管如此,图片最终还是到达了计算机。
图 12.计算机上的已处理信号。上图显示,将DNA文库提供给使用过的旧芯片时,芯片的填充不均匀:边缘-程度较小。 不同的颜色是由于pH晶体管两端的电压不同所致。 也就是说,我们可以清楚地区分读取读球的孔-稍后这将有助于我们控制芯片的冲洗。
因此,下一个任务是冲洗芯片。 有必要确保他变得像新人一样。 幸运的是,我有一个全新的芯片作为参考样品。 在图 可以看出,在有源区域中,这种芯片几乎具有相同的颜色(垂直重复条纹只是噪声,干扰)。
图 13.冲洗芯片在图。 13 B芯片洗得不好-它是多色的。 在图13中,D是用过的但洗得很干净的芯片。 可以看到沿边缘的梯度消失了。 但是,值得证明它确实很干净并且可以重复使用。
由于DNA库在酸性环境中附着在芯片的钽涂层上,并在碱性条件下(即在高pH下)分离,因此使用特殊的半自动移液器用不同pH的溶液洗涤芯片。 到目前为止,我设法实现了几乎完整的切屑清洁。
我感兴趣的是,为什么当我完全理解芯片的结构时,我没有下令订购它的制造商,而是更喜欢继续搜索和购买二手芯片,修补其清洗等。是的,因为微电路的发展它要花费大量金钱,数百万美元,而其中很大一部分将用于最终产品的物理调试:装配,调整晶体管的所有参数等。也就是说,仅复制逻辑电路是不够的。 因此,我有条件地选择了免费的,现成的-设计,制造,调试-的微电路,从而节省了大量资金,严重降低了该项目的成本。
我的下一个任务是组装一个更先进的设备,该设备将允许更快地将信息传输到计算机,并且同时不会由大量单独的板组成。
图14下一版设备的开发我带了一块新的带有FPGA的主板-在同一芯片上,有2个ARM内核和Linux,有千兆以太网和其他“好东西”,但是与以前的版本不同,它没有ADC。 后来,他设计了另一块带有高速ADC和所有其他必要元件的电路板。 推出-一切正常。
最终设备的外观还有什么要做? 只有三件事。
第一个。 需要千兆位互联网,快速将数据传输到计算机。 我昨天才意识到这一点。
第二个。 试剂供应系统。 设计特殊阀门已经在进行中。
第三。 用于处理芯片信息的软件。 我仍然对该软件有疑问,因此我邀请程序员进行协作。
最终设备的价格为1000万卢布。 测序的费用为数千美元。 芯片的价格从100美元到1,000美元不等-取决于其中“像素”的数量。 (顺便说一句,芯片修复本身可以带来可观的收益,特别是考虑到冲洗只需点击几下。)也可以购买试剂,但将来会创建它们。
总的来说,所有这些都很有趣,但是主要的是未来。 今天,生物技术在世界科学技术进步中的地位与80年代的计算机技术相同。 上个世纪。 此外,测序是现代生物学和医学的关键领域之一。 而且,当然,生物技术是非常有利可图的。
最近,S5半导体定序器已经出现在市场上,并且我打算在不久的将来切换到它。
我将很高兴与想要以某种方式参与该项目开发的每个人聊天!
没有
弗拉基米尔·祖博夫 (
Vladimir Zubov)的理论培训,该项目将无法实现。 我对他表示感谢。
感谢您的关注!