解决辐射问题是“太空电子史上的转折点”
Phobos-Grunt是现代俄罗斯最雄心勃勃的太空项目之一,于2012年初坠入大海。 该飞船原本应该降落在破旧的火星卫星火卫一表面上,收集土壤样本,然后将其带回地球。 但是,相反,由于在启动发动机之前机载计算机出现故障,他无助地在
低地球轨道 (DOE)上漂泊了数周,而发动机原本应该将船送往火星。
在随后的
报告中,俄罗斯当局将大量带电粒子归咎于与SRAM芯片相撞的银河系宇宙射线,并由于流过该芯片的过多电流而导致该芯片失效。 为了解决此问题,计算机上运行的两个处理器(计算机)开始重新启动。 之后,探针进入安全待机模式,以接收来自地球的命令。 不幸的是,没有收到指示。
船舶离开美国能源部后,通信天线应该达到了设计运行模式。 但是,没有人预见到拒绝,因此,探针不会到达此阶段。 与粒子碰撞后,Phobos-Grunt陷入了僵局。 启动机载引擎应该触发天线的部署。 只能使用来自地球的命令来启动引擎。 而且此命令无法发出,因为未部署天线。 计算机错误导致任务崩溃,该任务已经进行了几十年。 非政府组织非政府组织团队的成员尤其应对此负责。 Lavochkin,设备制造商。 在开发过程中,列出其计算机上正在工作的内容比列出不工作的内容要容易得多。 但是,他们犯的每一个小错误都残酷地提醒人们,开发太空级计算机非常复杂。 一旦跌倒,数十亿美元就被烧掉了。
开发人员只是低估了太空计算机的难度。
怎么这么慢?
“好奇号”是备受喜爱的火星全地形车,它在两个BAE RAD750处理器上运行,时钟频率高达200 MHz。 它具有256 Mb RAM和2 Gb SSD。 在2020年的前夕,RAD750是最先进的单核空间级处理器。 今天,这是我们可以送入深空的最佳条件。
但是,不幸的是,与我们口袋里的智能手机相比,RAD750的性能只能令人遗憾。 它的电路基于PowerPC 750,该处理器是IBM和Motorola在1997年推出的与Intel Pentium II竞争的产品。 这意味着当今太空中使用的技术最先进的太空设备可以毫无问题地发射第一台《星际争霸》(1998年),但是,面对对计算能力的更高要求时,它将遇到问题。 忘记在《孤岛危机》中玩火星吧。
同时,RAD750的价格约为200,000美元,但是您不能仅仅将iPhone扔进去就可以了吗? 在速度方面,好几代iPhone离开RAD750的价格仅为每台1,000美元,远低于200,000美元,Phobos-Grunt团队试图做类似的事情。 他们试图提高速度并节省资金,但最终他们走得太远了。
Phobos Grunt SRAM存储器芯片被严重带电粒子损坏,标记为WS512K32V20G24M。 他在太空工业中举世闻名,因为2005年,T。Page和J. Benedetto在布鲁克海文国家实验室的粒子加速器中对这些芯片进行了
测试 ,以测试它们在受到辐射时的性能。 研究人员将这些芯片描述为“极度脆弱”,即使在布鲁克海文市拥有的最低能量暴露条件下,它们的故障仍然发生。 结果并不令人惊讶,因为WS512K32V20G24M并非为空间而设计。 它们是为军事航空而开发的。 但是,它们比太空类存储芯片更容易找到并且更便宜,因此Phobos-Grunt的开发人员决定采用它们。
美国空军研究实验室的研究员Tyler Lovely说:``发现太空中存在各种类型的辐射已经成为太空电子史上最重要的转折点之一,同时还需要了解这种辐射对电子的影响以及芯片增强和伤害减轻技术的发展。'' 辐射的主要来源是宇宙射线,太阳过程以及位于地球磁场边界处的质子和电子带,称为
范艾伦辐射带 。 与地球大气碰撞的粒子中,质子占89%,阿尔法粒子占9%,较重原子核占1%,自由电子占1%。 它们的能量可以达到10
19 eV。 要在探针中使用不适合太空的芯片,这种探针必须在太空中移动数年,这意味着麻烦。 报纸《 Krasnaya Zvezda》
写道 ,在Phobos-Grunt上使用的芯片中有62%不适合在太空中使用。 62%的探查计划包括“让iPhone拧在那儿”的情绪。
辐射成为问题
如今,宇宙射线已成为创建太空级计算机时要考虑的关键因素之一。 但这并非总是如此。 1960年代
,第一台计算机通过双子座运载工具之一进入太空。 为了获得驾驶汽车的许可,我必须经历一百多个不同的测试。 工程师测试了它如何响应振动,真空,极端温度等行为。 这些测试都没有考虑辐射的影响。 但是,车载计算机“ Gemini”运行良好,没有任何问题。 那是因为他太大了,无法拒绝。 从字面上看。 一个
11升重12公斤的盒子里可以容纳多达19.5 KB的内存。 整个计算机重26公斤。

在计算机行业中,处理器的进步通常是减小组件尺寸并提高时钟速度。 我们使晶体管越来越小,从240 nm到65 nm,再到14 nm,再到7 nm,已经到了现代智能手机。 晶体管越小,导通和关断所需的电压越低。 因此,辐射实际上不会影响具有大型组件的旧处理器-更确切地说,所谓的
孤独的干扰 。 与粒子碰撞产生的电压太小,无法影响足够大的计算机的运行。 但是,当人们渴望进入太空时,为了减少每个芯片中的晶体管数量而开始减少组件的尺寸时,由电压产生的微粒就足以引起问题。
更常见的是,工程师们通过提高处理器性能来提高其时钟速度。 在英特尔386SX的控制下,自动化工作在航天飞机控制室中,它的工作频率为20 MHz。 现代处理器的最高峰值可达5 GHz。 时钟频率确定处理器每单位时间可处理的周期数。 辐射的问题在于,与粒子的碰撞可能会在短时间内破坏处理器内存(L1或L2高速缓存)中的数据。 事实证明,带电粒子每隔一秒钟就会产生问题的机会有限。 在时钟速度小的处理器中,这个数字很小。 但是随着频率的增加,这些瞬间的数量在一秒钟内增加了,这使得处理器对辐射更加敏感。 因此,具有增强的抗辐射性的处理器几乎总是比商用处理器慢。 宇宙处理器工作如此缓慢的主要原因是,几乎所有可以加速它们的方法都使它们更加脆弱。
幸运的是,可以避免此问题。
我们处理辐射
“以前,通过改进的半导体工艺可以将辐射最小化,”欧洲航天局VISI / ASIC工程师Roland Weigand说。 “采用处理器的商业核心并对其进行处理以增加其抗辐射性就足够了。” 这种制造辐射防护技术使用的材料是蓝宝石或砷化镓,与硅不同,它们对辐射的反应不大。 以这种方式制造的处理器在辐射较高的环境中(例如在太空中)可以很好地工作,但是为了生产它们,必须对整个工厂进行重新装备。
为了提高性能,我不得不使用越来越多的高级处理器。 鉴于现代半导体工厂的成本,对于像太空这样的利基市场,制造工艺的特殊改变已不再可行。 结果,这迫使工程师使用受单一干扰的商业处理器。 “为了减少这种影响,我们不得不改用其他技术来提高抗辐射能力,这就是我们所说的设计辐射防护,” Weigand补充道。
设计保护使制造商能够使用标准的CMOS制造工艺。 这样的太空级处理器可以在商业工厂中生产,从而将其成本降低到合理的水平,并使太空任务开发商能够赶上商业报价。 辐射是利用工程天才来解决的,而不仅仅是材料的物理特性。 “例如,三重模块冗余(TMI)是保护芯片免受辐射影响的最流行的方法之一,在其他方面则是完全标准的,” Weigand解释说。 “每条信息的三个相同副本始终保持在内存中。” 在阅读阶段,将阅读所有三个内容,并且大多数人会选择正确的版本。”
如果所有三个副本都相同,则认为信息正确。 当两个副本相同但一个副本不同时,会发生相同的事情-正确的副本由多数票选择。 但是,当所有三个副本都不相同时,系统会记录错误。 这个想法是将相同的信息存储在位于芯片上三个不同位置的三个不同的存储器地址。 为了破坏数据,两个粒子必须与存储相同信息粒子的两个副本的那些位置同时发生碰撞,这是极不可能的。 这种方法的缺点是处理器有多余的工作。 他需要进行三次操作,这意味着他只能达到速度的三分之一。
因此,最新的想法是使空间级处理器的性能更接近于商用处理器。 工程师可以决定最重要的保护位置,而不是保护整个芯片上的系统免受辐射。 在哪里可以拒绝它。 这大大改变了设计优先级。 较旧的太空处理器对辐射不敏感。 新处理器对此很敏感,但是它们被设计为自动应对辐射可能引起的所有错误。
例如,LEON GR740是最新的欧洲太空级处理器。 预计他在地球的对地静止轨道上每天将遭受9次单一干扰。 诀窍是它们将全部被系统阻止并且不会导致操作错误。 GR740的设计使其不会在每300年发生一次功能错误。 即使在这种情况下,他也可以重新启动。

欧洲选择开放
LEON SPARC系列空间级处理器是欧洲在空间应用中最受欢迎的选择。 “在90年代,当选择SPARC规范时,它就已经深深地嵌入了整个行业,” Weigand说。 “ Sun Microsystems已在成功的工作站上使用了它。” 据他介绍,过渡到SPARC的主要原因是软件支持和平台的开放性。 开放式架构意味着每个人都可以使用它而不会产生许可问题。 这很重要,因为在如此狭小的空间中,许可证的成本分布在少数设备中,这会严重增加其成本。
结果,ESA通过在许可问题上的痛苦经验中学到了东西。 迄今为止,欧洲使用的第一台太空SPARC处理器ERC32使用的是商用处理器。 它基于开放式体系结构,但是处理器电路是专有的。 “这导致了问题。 “通常无法访问专有系统的源代码,因此很难对项目进行更改,以增强辐射防护,” Weigand说。 因此,下一步,ESA开始开发自己的处理器LEON。 “他的项目完全在我们的控制之下,我们终于有机会使用我们想要的所有辐射防护技术。”
LEON处理器产品线的最新发展是四核GR740,其工作频率约为250 MHz。 (Weigand表示,他预计首批发货将在2019年底之前交付)。 GR740
采用65纳米制程技术制造 。 这是一个基于芯片的系统,设计用于基于SPARC32架构的通用高速计算。 “创建GR740的目标是提高速度,并能够向集成电路中添加其他设备,同时保持与以前的欧洲太空级处理器的兼容性,” Weigand说。 GR740的另一个特点是其先进的容错系统。 处理器可以处理由于辐射引起的大量错误,并且仍然可以确保软件的不间断运行。 每个单元和GR740功能都针对最高速度进行了优化。 这意味着对单个干扰敏感的组件与其他可以轻松应对的组件相邻。 而且所有敏感组件都用于电路中,以通过冗余减少错误的影响。
例如,GR740上的某些触发器是常规的商用CORELIB FF。 之所以选择在此芯片上使用它们,是因为它们占用的空间较小,从而增加了计算密度。 不利之处在于它们受到单一干扰,但是他们借助TMI模块解决了这一问题。 从这些触发器读取的每条信息均通过在足够远的所有模块之间进行表决来确认,以使一个事件不会影响几个位。 对于由SRAM单元组成的处理器高速缓存L1和L2实施了类似的方案,该高速缓存L1和L2也受到单个干扰。 当此类方案开始对性能产生太大影响时,ESA工程师便改用耐干扰的SKYROB触发器。 但是,它们占用的空间是CORELIB的两倍。 在尝试提高空间计算机的计算能力时,您总是必须做出一些妥协。
到目前为止,GR740已经很好地通过了多次辐射测试。 该芯片被具有
线性能量转移 (LET)的重离子激发,达到125 MeV * cm
2 / mg,并且它们可以正常工作而没有任何故障。 为了进行比较,当只有LET的粒子达到约0.375 MeV * cm
2 / mg时,由于Phobos-Grunt掉落的SRAM芯片失败了。 GR740承受的辐射强度是其300倍。 除了几乎完全不受单个干扰的影响外,GR740在其使用寿命期间还可以吸收多达300条窃取辐射。 在测试期间,Weigand团队甚至对其中一个处理器进行了293度的辐照,但尽管如此,该芯片仍照常工作,而没有出现退化迹象。
尽管如此,尚未完成显示GR740能够吸收的真正最大电离剂量的测试。 所有这些数字一起表明,该处理器在地球的地球静止轨道上工作,应每350年产生一个功能错误。 在低轨道,这一时期增加到1310年。
即使是这样的错误也不会杀死GR740。他只需要重启即可。
美国选择专利解决方案
美国空军研究实验室的Lovelie说:“由于人们在使用它们方面有更多的经验并得到了各种软件的支持,因此在美国开发的空间级处理器传统上是基于PowerPC等专有技术的。” 毕竟,空间计算的历史始于IBM为1960年代的Gemini任务开发的数字处理器。并且IBM使用专有技术。迄今为止,BAE RAD处理器基于PowerPC,而IBM,苹果和摩托罗拉的财团共同努力,使BAE RAD处理器诞生了。在航天飞机和哈勃望远镜驾驶舱的计算机中运行的处理器是基于英特尔提供的x86架构制造的。 PowerPC和x86都是专有技术。沿袭这一传统,该领域的最新项目也基于封闭技术。高速太空飞行计算机(HPSC)与PowerPC和x86的不同之处在于后者被称为台式机处理器。 HPSC基于ARM体系结构,该体系结构如今可在大多数智能手机和平板电脑上使用。HPSC由NASA,美国空军研究实验室和负责生产的波音公司开发。 HPSC基于四核ARM Cortex A53处理器。他将通过AMBA总线连接两个这样的处理器,最后将提供一个八核系统。因此,其速度将在2018年的中端智能手机领域,例如三星Galaxy J8或HiKey Lemaker或Raspberry Pi等开发板。的确,这些指标是在防辐射之前给出的,它将使速度降低两倍以上。但是,我们不再需要阅读枯燥的头条新闻,即好奇号漫游车的200个处理器无法赶上一部iPhone。 HPSC推出后,只需三到四个芯片即可与iPhone进行速度比较。“由于我们还没有真正的HPSC进行测试,因此我们只能对其性能做出合理的假设,” Lovelie说。经过仔细研究的第一个参数是时钟频率。 Cortex A53商用八核处理器通常在1.2 GHz(对于HiKey Lemaker而言)至1.8 GHz(如Snapdragon 450)上运行。为了弄清楚辐射防护后的HPSC时钟频率是多少,Lovely 比较了各种太空级处理器作为商业对手。 MHz 500 MHz。而且对于太空级芯片而言,仍然是一个极高的速度。如果该频率确实如此,那么PS HPSC将成为空间级处理器增加通常的频率会成为严重的问题。如今,功能的最强大防辐射处理器是BAE RAD5545。这是一台采用45纳米制造工艺制造的64位四核计算机,其时钟频率为466 MHz,耗散功率高达20W。而20瓦是体面的。 13英寸MacBook Pro 2018中的Quad Core i5耗散28瓦功率。它可以将铝制外壳加热到很高的温度,最高可以开始给用户造成麻烦。在高计算负载期间,风扇会立即打开以冷却整个系统。但是仅在风扇根本不会帮助太空,因为没有空气会吹到热芯片上。唯一可行的散热方法是辐射,这需要时间,当然,热管会帮助散热。处理器,但这种热量最终应该散布到某个地方。有些任务的能源预算非常有限,他们根本买不起RAD5545这样的强大处理器。因此,欧洲GR740的耗散能源功率仅为1.5瓦。它不是最快的,但是最有效的。它只是为您提供每瓦最大的计算量。 10 W HPSC仅次于它,但并非总是如此。“每个HPSC内核都有其自己的模块,包括单个命令流,多个数据流,OKMD(单指令多数据,SIMD)。自90年代以来,OKMD技术就经常在商用台式机和移动计算机中使用。它可以帮助处理器更好地处理视频游戏中的图像和声音处理。假设我们需要使图片变亮。它有很多像素,每个像素的亮度都需要增加两个。如果没有OKMD,处理器将需要依次执行所有这些求和,一个接一个。使用OKMD,可以并行化此问题。处理器接受多个数据点(图像中所有像素的亮度值),并与它们执行相同的指令,同时为所有像素加一个减法。而且,由于Cortex A53处理器是为处理大量媒体内容的智能手机和平板电脑而设计的,因此HPSC也能够做到这一点。Lovely说:“这在诸如图像压缩,处理或立体视觉之类的任务中特别有益。” -在不使用此功能的应用程序中,HPSC的性能比GR740和其他快速空间处理器好一些。但是当它可以使用时,该芯片就大大领先于其竞争对手。”将科幻小说带回太空探索
来自美国的芯片开发商往往更强大,但对能量处理器的要求也更高,因为与航空同行相比,NASA的机器人和载人飞行任务通常规模更大。在欧洲,在可预见的将来,没有计划将人或全地形车送上月球或火星大小的汽车。如今,ESA专注于探测器和卫星,它们通常在有限的能源预算下工作,因此选择更轻便,更节能的产品(例如GR740)更加有意义。 HPSC最初旨在将NASA的科幻野心带到世界各地。例如,2011年,美国国家航空航天局(NASA)的“改变游戏规则”开发计划(GA)进行了一项研究,研究15-20年内太空中的计算请求将如何变化。该机构各个中心的专家团队已编制了一系列任务清单,高级处理器可以在载人和机器人任务中完成这些任务。他们确定的首要任务之一是对设备状态的持续监控。这项任务归结为存在不断监控关键组件状态的传感器。从所有这些传感器获取高频数据需要快速处理器。如果每10分钟有数据传到某处,速度较慢的计算机可能会完成任务,但是如果您需要每秒多次检查所有设备以提高效率,类似于实时监控,您的处理器应该运行得非常快。所有这些都需要进行开发,以便宇航员可以坐在控制面板的前面,控制面板将显示船舶的真实状态,并能够发出语音警报和精美的图形。为了支持此类图形,还需要快速计算机。但是,科幻小说的目标并不能以座舱告终。探索其他世界的宇航员可能会在头盔中内置增强现实系统。他们的环境将通过计算机生成的视频,声音和GPS数据得到补充。从理论上讲,增强现实将提高研究人员的效率,标记值得探索的区域并警告潜在的危险情况。当然,在头盔中嵌入增强现实只是几种可能性之一。研究中提到的其他选项包括便携式设备,例如智能手机,以及被模糊地描述为“其他显示信息的可能性”。这样的计算突破将需要更快的空间级处理器。同样,这样的处理器应该改善机器人的任务。主要例子之一是在困难的地形上着陆。选择一个降落在地面上的位置始终是安全与科学价值之间的折衷。最安全的地方是没有石头,丘陵,山谷和岩石露头的平坦飞机。从科学的角度来看,最有趣的地方在地质上将是多种多样的,这意味着有大量的石头,丘陵,山谷和岩石露头。解决这个问题的一种方法就是所谓的。基于地形的导航(NOM)。配备了NOM系统的全地形车将能够识别重要的信号,发现潜在的危险并绕开它,这会将着陆半径缩小到100 m,问题是当今现有的太空级处理器太慢,无法以这种速度处理图像。NASA的一个团队在RAD 750上启动了NOM性能测试,发现从单个摄像机进行更新大约需要10秒钟。不幸的是,如果您跌落在火星表面,则需要10秒。要将全地形车降落在半径为100 m的站点上,必须每秒处理一次来自相机的更新。为了使每米精确降落在站点上,您每秒需要10次更新。来自NASA的其他计算希望是可以基于传感器读数,智能绘图,高级自治等来预测即将发生的灾难的算法。所有这些都超出了当前空间级处理器的能力。因此,在研究中,NASA工程师给出了支持此类任务所需的计算能力的估计值。他们发现监视船舶状况和在困难条件下着陆将需要10到50 GOPS(每秒千兆操作)。具有时尚显示屏和先进图形的未来派科幻飞行器将需要50-100 GOPS。增强现实头盔或其他设备也是如此。它们还会消耗50到100 GOPS。理想情况下,未来的太空处理器将能够轻松支持所有这些项目。如今,HPSC的功耗为7到10瓦,能够提供9-15 GOPS。这本来可以使极端降落成为可能,但是HPSC的设计可以使这一数字大大增加。首先,这15个GOPS不包括从OKMD获得的性能优势。其次,该处理器可以与其他HPSC和外部设备(例如专用FPGA或GPU处理器)配合使用。因此,未来的航天器可能具有多个并行运行的分布式处理器,并且专用芯片可以处理某些任务,例如图像处理或信号。无论人类关于深空的梦想何去何从,工程师们都已经知道当前计算能力处于发展的哪个阶段。LEON GR740将于今年晚些时候提供给ESA,并且在通过一些额外的测试后,应该准备在2020年投入使用。HPSC的生产阶段则应从2012年开始,到2022年结束。2022年的测试需要几个月的时间。美国国家航空航天局(NASA)应在2022年底之前收到现成的HPSC芯片。这意味着,在不考虑使进展复杂化的其他因素的情况下,至少宇宙硅的发展速度将使其能够为2024年人类重返月球做准备。