科学工作已经过时; 接下来等着我们

现代形式的科学工作已成为允许进步发展的发明之一。 在十七世纪形成它的形式之前,作品的结果是通过信件,短暂的演讲形式或全部以书本形式私下传播的。 没有地方公开讨论渐进式进展。 杂志在其页面上留有空间来描述单个实验或较小的技术进步,因而在不断发展的科学中造成了混乱。 从那时起,科学家开始模仿社交昆虫:它们不断前进,发出嗡嗡声,就像一群蜜蜂。

从某种意义上说,最早的作品比今天的更具可读性。 他们的专业性较低,更直接,简短且不那么正式。 Matanalysis是在不久之前发明的。 有关正在研究的主题的全部数据都可以放在一个页面上的一个板上。 所有与结果相关的计算都是手工完成的,也可以进行检查。

科学越困难,就越难以报告其结果。 今天的作品比以往任何时候都更长,并且充满术语和各种符号名称。 它们依赖于一组计算机程序,这些程序可以生成数据,清理数据,构建图形并处理统计模型。 这些程序有时写得很粗心,专注于结果,以至于也会导致可重复性危机-也就是说,这项工作无法满足其主要任务:报告所发现的内容非常简单,以便其他人也可以做到。

也许应该怪罪于打印纸张的习惯。 科学方法以软件的速度发展。 最重要的是,要求物理学家,生物学家,化学家,地质学家,甚至人类学家和心理学家必须掌握编程语言和“ 数据 ”程序包。 尽管过去400年来,传达科学成果的主要方式没有改变。 当然,这些作品可以发布在Internet上-但页面上仍然是文本和图像。

如果我们今天从头开始制定科学工作标准,将会发生什么? 我最近与布雷特·维克托Bret Victor )进行了交谈, 布雷特·维克托Bret Victor)在苹果公司工作,负责iPad用户界面的早期原型,现在在加利福尼亚州奥克兰市拥有自己的实验室,研究计算系统的未来。 Victor长期以来一直认为科学家仍然没有充分利用计算机。 他说:“情况与印刷机和书籍的发展没有太大不同。” 在古腾堡之后,印刷机主要用于复制圣经书法。 为了发明一本现代书籍,需要将近100年的技术和概念上的改进。 “在整个时期,人们都拥有一种新的印刷技术,他们用它来复制旧媒体。”

维克多(Victor)重述了Dunak Watts和Stephen Strogatz撰写的杂志文章“小世界网络的集体动力学”,展示了可以实现的目标。 他之所以选择它,是因为它是所有科学中最常被引用的著作之一,并且因为它是清晰呈现信息的模型。 (斯特罗加克最著名的是《纽约时报》的《数学要素》一书的作者。)

Watts-Strogac的著作以与大多数其他著作相同的方式描述了重要发现,包括文字,图片,数学符号。 而且,就像大多数作品一样,尽管有明确的描述,但这些发现很难被消化。 工作中最困难的地方是描述过程或算法的地方,因为读者必须像维克多所说的那样承担“计算机的角色”,试图通过算法的各个步骤来记下正在发生的事情。

Victor修改后,解释性文字开始与交互式图表交替显示,以说明每个步骤。 在此版本中,可以使用一个示例来跟踪算法的操作。 您甚至可以控制它。



斯特罗加克钦佩维克多的选择。 他后来对我说,他很遗憾,在数学中已有数百年的历史,尽可能严格和正式地撰写作品是一种传统,甚至常常忽略了数学家用来发现发现的视觉线索。

Stogac研究非线性动力学和混沌,易于同步或自组织的系统:萤火虫的眨眼,节拍的滴答声,心脏细胞的电脉冲。 关键在于此类系统可以循环工作,并且Strogac可以通过圆点将其可视化:当该点返回到起点时,它是萤火虫的闪烁或触发了心脏细胞。 他说:“将近25年以来,我一直在制作小型计算机动画,这些动画以圆圈表示的圆点运行,颜色表示频率。” 他说:“红色是慢家伙,紫色是快……所有这些点在我的计算机上旋转,我整天都在这样做。” 与捕获500个时间序列中的彩色点相比,我要好得多。 同样,我几乎看不到,因为实际上它看起来根本不像那样。 我研究动态过程,因此它们的呈现也应该是动态的。”

程序是动态媒体,但纸张不是。 从这个意义上讲,像Strogac那样研究动力系统的研究如此频繁地散布在纸上却没有旋转点的优势,这似乎很奇怪,因为正是这些点帮助他了解了自己的见解并可以帮助看到这是给读者的。

这是科学交流的全部问题:如今,人们常常使用计算机来发现科学成果。 想法是复杂的,动态的,以内在的眼光捕捉它们并不容易。 虽然最受欢迎的用于传播结果的工具仍然是PDF-实际上是在模拟一张纸。 我们可能可以提出更好的建议。

斯蒂芬·沃尔夫拉姆(Stephen Wolfram)15岁时发表了他的第一篇科学著作。 在该研究所学习结束之前,他已经发表了10篇著作,到20岁时,在1980年,他已经在加州理工学院完成了粒子物理学博士学位。 当最严肃的科学家认为计算机工作低于他们的尊严时,他的超级武器就是那些日子里积极使用计算机。 他在一次采访中说:“到那时,我可能使用了世界上最多的计算机代数。” 这非常方便,我可以在计算机上进行所有计算。 在我的科学作品中张贴特别华丽的公式非常有趣。”

随着研究的雄心壮志,他越来越多地将现有软件带到了可能性的极限。 对于一个项目,他必须使用六种不同的软件工具。 他说:“我花了很多时间将它们捆绑在一起。” “而且我决定,我应该尝试创建一个单一的系统,该系统可以满足我所需的一切-可以永远增长的系统。” Wolfram没有继续他的学术活动,而是决定创建Wolfram Research,并为科学家提供理想的计算环境。 1988年4月18日在《福布斯》(Forbes)上的标题为:“物理学奇才进入商业界”(巫师科学家开始从事这项业务)。

在公司称为其主要产品的Mathematica系统的中心,有一个记事本,您可以在其中一行上写命令,而在另一行上查看结果。 写“ 1/6 + 2/5”,他会给你“ 17/30”。 要求他乘以多项式,他就会服从。 Mathematica有能力进行分析,数论,几何,代数。 它具有计算化学反应和过滤遗传数据的功能。 她的数据库包含伦勃朗的所有图片,她可以及时为您提供他调色板的散布图。 它内置了轨道力学模型,如果引擎在10,000 km处熄火,它将能够计算F / A-18大黄蜂可以计划多远的距离。 Mathematica中的记事本不仅记录了用户的计算结果,而且还记录了他与全知的甲骨文的对话记录。 钨称精心编写的笔记本为“计算论文”。

笔记本界面是西奥多·格雷(Theodore Gray)的创意,灵感来自与Apple的旧代码编辑器一起工作。 大多数编程环境允许您逐行或一次全部执行代码。 Apple Editor允许您选择代码的任何部分并仅执行它。 格雷将这些基本概念转移到了Mathematica,而史蒂夫·乔布斯本人则帮助他改进了设计。 记事本旨在将科学编程变成一个交互式练习,在该练习中,可以从计算实验的结果中学习到数十次,数百次纠正和重新启动单个命令,从而使您可以更深入地了解数据。

尽管记事本可以动态地响应代码的更改,但由于它具有绘制图形,图像和漂亮的数学公式的能力,因此它特别擅长应付任务。 在Mathematica中,您可以输入语音记录,对音频记录应用复杂的数学过滤器,并可视化生成的声波。 通过使用鼠标拖动参数,您可以更改其外观并查看哪些过滤器在使用时效果最佳。 Gray说,该软件包能够在一个简单的界面中轻松处理许多不同的计算任务的能力是“从字面上看的几个世纪的工作”的结果。

Wolfram在其演讲,博客条目,演示文稿和新闻发布中多次重复了该工作的基本构想。 不仅制作出色的软件,而且在科学课本身中创造了一个转折点。 在十七世纪中叶,戈特弗里德·莱布尼兹(Gottfried Leibniz)开发了一个积分和导数(熟悉的∫和dx / dt)记录系统,这使数学分析的复杂思想变得机械化。 莱布尼兹认为,在更广泛的应用中使用类似的符号可以创建“思想代数”。 从那时起,逻辑学家和语言学家一直梦想着一种通用语言,该语言可以消除歧义,并将复杂问题的解决变成一种分析。

Wolfram的职业包括不断地尝试将世界上的所有知识整合到Mathematica中,然后再通过该公司的“计算知识引擎” Wolfram Alpha加以利用,背后有许多机会来回答诸如Siri和Alexa等电子助手的问题。 这是Wolfram尝试创建的Interlingua(一种对人和机器都同样可以理解的编程语言)的一种语言-万物的代数。

这项任务具有雄心壮志。 在1990年代,Wolfram有时嘲笑公众,说在创建公司的过程中,他正在从事一项革命性的科学项目。 期望增加了。 最终,项目到达了:一本巨大的书,一块煤渣块的厚度,几乎是相同的重量,并带有永恒的标题:“ 新型科学 ”。

事实证明这是使用Mathematica笔记本进行的详细研究,由最简单的计算过程-细胞自动机创建了令人惊讶的复杂模式。 进行这项研究既是为了研究,也是为了理解简单的规则如何产生复杂的自然现象,例如龙卷风或软体动物的壳模式。 沃尔夫拉姆(Wolfram)未经独立编辑发表的这些研究,不断提醒着它们的重要性。

您遇到的钨合金越多,听起来就越像他的风格。 在1988年发表的一篇关于他的文章中,《福布斯》试图找出这种现象的根源:“正如享负盛名的普林斯顿大学高级研究所所长哈里·沃尔夫(Harry Wulf)所言,沃尔夫拉姆是23岁时最年轻的高级科学家之一。 “孤独,孤独和独特的感觉支撑了性格上的困难。”

当Wolfram的一位助手在会议上宣布一项重大数学发现时,这是“新型科学”的重要组成部分,Wolfram威胁要起诉他,如果发表该论文。 他当时说:“在严肃的研究小组中,不允许年轻的研究人员谈论老年人的工作。” 其他科学家批评沃尔夫拉姆的大量著作是基于其他著作,但没有提及它们。 “他暗示他是过去20年来一直是复杂系统理论中心思想的主要思想的作者,”一位研究员在2002年对《泰晤士报高等教育》杂志说。

钨的自夸似乎更加令人惊讶,因为它是完全可选的。 他的成就不言而喻-如果他愿意的话。 发布后,Mathematica几乎立即获得了成功。 用户长期以来一直在等待这种产品。 在大学中,该程序已与Microsoft Word一样普遍。 另一方面,沃尔夫勒姆(Wolfram)利用稳定的收入聘请了各个领域的其他工程师和专家,为他无尽的计划提供了越来越多的信息。 如今,Mathematica知道脚的解剖结构和物理定律,音乐,针叶树的系统以及第一次世界大战的主要战役。 沃尔夫拉姆本人曾帮助教授他的古希腊数字书写程序。

所有这些知识都是“计算的”。 如果需要,您可以用x指示战斗在索姆河上的位置,并用y指示距此地方50 km半径内1916年的每日降雨量,Mathematica将计算在第一次世界大战下雨的战斗中是否还有更多的死亡人数。



沃尔夫拉姆在博客中写道:“我注意到了一个有趣的趋势。” -选择从考古学到动物学的任何X区域。 然后,“计算X”将与其连接,该X已经存在或即将诞生。 这被认为是该领域的未来。“ Wolfram认为,这些领域的专家越熟练地掌握计算方法,公开领域的范围就会越广。Mathematica中的笔记本可以成为科学的加速器,因为它可以引发新的思维方式。”观察起来最有趣“他说”,人们在17世纪有机会阅读数学记录时发生了同样的转变。这成为一种交流形式,它具有非常重要的特征-能够 新的开始。”

这样的想法是,这种“科学作品”可以具有与斯特罗加奇和维克托想要的一样的动力-交互图散布在文本中-并具有额外的优势,即生成这些图和所有数据的所有代码将可供读者访问谁可以看着他们并与他们一起玩。 “老实说,当您在笔记本中用Wolfram语言编写如此简单易懂的内容时,就没有欺骗的余地。 存在就是它,它以它的工作方式起作用。 “没有办法调整结果,”沃尔夫拉姆说。

用Mathematica笔记本写作品意味着要揭示作品的结果和方法。 和科学工作,以及您编写它所做的一切。 结果,不仅使读者更容易理解它,而且使再现(或不再现)更加容易。 当全球数以百万计的科学家逐渐为科学做出贡献时,将所有这些工作变成重要事情的唯一方法就是使其他人能够在这些贡献的基础上可靠地建立一些东西。 沃尔夫拉姆说:“这是以计算论文的形式完成的科学工作所能达到的。”

沃尔夫勒姆说,他对计算论文没有得到普及感到惊讶。 他回想起1980年代初期与科学出版物巨人Elsevier的合作。 “ Elsevier雇用我就诸如“科学出版物的未来将是什么样的情况”提供咨询。” 这是在Mathematica笔记本问世之前,但他推动它们从大约同一区域发言。 “几年前,我再次与公司管理层的人交谈。 在那次会议上,我意识到-天哪,我在35年前说的完全一样!”

我与西奥多·格雷(Theodore Gray)进行了交谈,后者离开了Wolfram Research,成为一名作家。 他说,他在笔记本上的工作特别是受到他的感觉的激励,这种感觉在1990年代就已经形成,“很明显,所有使用任何数据或数学,建模或图表的科学交流和技术作品,或方案之类的东西,不需要在纸上发表。 他说,到1990年,这一点已经很明显了。

他说:“在过去的29年中,除了一些了解这一点的人之外,整个社区都没有采取这种方法,这一事实令人震惊和惊讶,”他说。 “从字面上看,不可能计算出损失了多少,浪费了多少时间,被误解或陈述了多少结果。”

在2001年初,费尔南多·佩雷斯(Fernando Perez)意识到他在20年前与沃尔夫拉姆(Wolfram)处于大致相同的位置。他是一名物理学家,他将工具发挥到极致。他使用了一整套系统,其中包括Mathematica,看来完成每个任务都需要从一种工具切换到另一种工具。他回忆说,他的桌子上放着6-7本关于编程的不同书籍。他想为科学计算创建一个统一的环境。

但是他没有开始开设公司,而是找到了两名科学家,一名来自德国加州海洋研究所的科学家以及一名来自加州理工学院的计算机科学研究生,他们的想法大致相同。他们都爱上了一种开源通用编程语言Python,并开始独立地为其创建工具以简化与科学家合作的语言:简化了数据集和图形处理的工具,鼓励了更多的研究编程风格。

佩雷斯将三个项目合二为一,并控制了他。从一开始,IPython项目(我的意思是交互式)就是开源的。该程序不仅仅是免费的,任何人都可以学习并修复其代码,为共同的事业做出自己的贡献。该决定是有意做出的。佩雷斯说:“我对能够与他人分享我的工作这两个道德方面都很感兴趣,”佩雷斯本人是哥伦比亚人,在那里很难获得商业计划,“这也是认识论的动机。”他认为,如果科学需要开放,那么用于科学的工具应该开放。商业软件的源代码无法合法阅读,是“科学思想的对立面”,其目的是打开自然界的黑匣子。

因此,使用了Python。该语言的基本版本不如运行Mathematica的Wolfram语言强大。但是,如果Mathematica从程序员大军中汲取了能力,那么Python的骨干将得到庞大的附加功能库的支持-图像处理,音乐创作,AI,语言分析,图形绘制-由一群免费为开源贡献力量的人创建。 Python成为了科学计算的事实上的标准,因为像Perez这样的开源开发人员为此创建了有用的工具。 Python被开发人员吸引了,因为它是科学计算的事实上的标准。像任何社交网络一样,编程语言社区蓬勃发展或死亡,这要归功于这些反馈循环的力量。

用于IPython的记事本界面的想法来自Mathematica。佩雷斯(Perez)赞赏Mathematica笔记本如何鼓励研究风格的工作。 “可以草绘一些东西,因为那是您对任务进行推理的方式,也是您对任务的理解方式。”计算笔记本“凸显了生活叙事的理念。您可以考虑整个过程,并根据需要将计算机有效地用作反射和计算合作伙伴。”

IPython小组没有开发专用的独立应用程序,更不用说花费了几个世纪的时间了,而是与IPython小组-Perez一起加入了加利福尼亚理工大学圣路易斯·奥比斯波分校和Min Reagan-Kelly大学的物理学教授Brian Granger,来自加利福尼亚大学伯克利分校的科学候选人从事计算物理领域的研究,以简单的网页形式制作了笔记本。该界面缺乏史蒂夫·乔布斯作品的美感和复杂性。但是,使用Web时,IPython会获得免费的附加组件:每当Google,Apple或随机程序员发布新的图表工具或发布改进的数学代码时,IPython都会获得这种改进。 “一切都很好,”佩雷斯说。

宣布首次确认重力波探测的工作以传统方式以PDF的形式发布,但配有IPython笔记本在笔记本中,您可以跟踪为文章生成所有图形的所有工作。每个人都可以自己运行代码,根据需要对其进行更正,以进行计算,以便更好地了解其工作原理。在笔记本的某个位置,叙述到达了引力波产生的信号转变为声音的部分-您可以在浏览器中播放它,听到科学家第一次听到的声音,从两个相撞的黑洞中发出g声。



“我认为科学界已经采用了这种工具,并且已经被认为是通用的,”佩雷斯(Perez)小组的西奥多·格雷(Theodore Gray)说。 “但是Mathematica尚未得到这样的采用。” 在公共领域的Github上已经发布了130万个此类笔记本。 它们被谷歌,彭博社和美国国家航空航天局使用; AI音乐家,老师和研究人员; 和“几乎在地球上的所有国家”。

每次,IPython选择一条包含其他内容的开发路径,因此,它不再被称为IPython。 该项目在2014年更名为Jupyter,以强调它不仅适用于Python。 Jupyter笔记本类似于Mathematica笔记本,仅适用于任何编程语言。 您可以为Python,C,R,Ruby,JavaScript或Julia创建记事本。 任何人都可以为其编程语言创建Jupyter支持。 如今,它已支持100多种语言。

西奥多·格雷(Theodore Gray)为原始的Mathematica笔记本设计了界面,他说,为了实验,他曾经试图支持其他编程语言。 “什么都没有,”他告诉我。 -该公司对此不感兴趣。 而且,如果您需要支持多种语言,则不能像以前那样谨慎地进行。”

在某种意义上,埃里克·雷蒙德(Eric Raymond)在1997年发表的题为“ 大教堂和集市 ”的文章已成为现代开源运动的主要文件。 它拒绝了这样的观点,即需要像大教堂一样建造复杂的软件,“由个别的巫师或孤立地工作的法师小团队精心制作”。 Raymond作为Linux内核开发经理之一的经验告诉他,“定义各种源代码项目的巨大噪音市场”具有优势。 他写道:“如此的集市风格行之有效的事实令人震惊。” 在他的文章中,他试图解释为什么“ Linux世界不仅没有摆脱误解,而且似乎以大教堂建造者难以想象的速度从一项伟大的成就发展为另一项成就。”

Mathematica在Raymond的Linux经验之前就已经在开发中,并且已经开发了很多年。 这是大教堂的精髓,其建造者仍对集市持怀疑态度。 格雷谈到开源系统时说:“总是有混乱的余地。” -运动部件的数量巨大,不同部件控制着不同的组。 可以说,您将永远无法像在单个商业产品中一样,将它们组合到一个集成系统中,而只有中间一个疯子。”

自然,疯子是斯蒂芬·沃尔夫拉姆。 格雷指出,在墨索里尼的带领下,火车如期进行。 他说:“比喻是不好的,但我赞成中间有个​​疯子。” Mathematica笔记本电脑是一款更具凝聚力的设计,更精美的产品-在很大程度上,是因为每个决定都来自一个固执的天才。 沃尔夫勒姆对我说:“我从朱派特那里看到了这些家伙,他们的平均水平与90年代的水平相当。” 他说他们偷工减料。 “而且我们确实在努力做对。”

但是,科学界很难宣传商业软件。 尽管Wolfram Research多年来一直在分发免费的记事本程序,并且尽管大多数主要大学都拥有允许其学生和教师自由使用Mathematica的许可证,但是对于出版商而言,选择开放的PDF格式以支持商业产品可能太多了。 “到目前为止,情况是这样的:如果您尝试将Mathematica的笔记本发送到日记本,他们会抱怨:我们没有Mathematica,这是一个非常昂贵的程序,请给我们一些更标准的东西。”

沃尔夫拉姆(无论个人还是公司)都在夸耀产品的优越性和必要性,以至于连Gray都将它与无法插拔的Crossfit拥护者进行比较,这一事实也无济于事。 毕竟,斯蒂芬·沃尔夫拉姆(Stephen Wolfram)还是他的一本关于细胞自动机的著作,名为“一种新型科学”。 在有关计算科学的文章中,他写道:“使用沃尔夫勒姆语言表达计算思想的想法是计算论文的中心。”



也许是这样-也许只有在有一个超级语言支持的情况下,或者在财力雄厚且对工作有浓厚兴趣的公司的支持下,计算笔记本才能扎根。 但是相反的情况可能是正确的。 整合工作尽管更加混乱,但可能会变得更加可靠,并且是获得科学界信任的唯一途径。

沃尔夫勒姆在沃尔夫勒姆之外没有注意到太多,也许由于这个原因,Mathematica笔记本仍然很不透明,他的对手(虽然是次要的,简化的但开放的)似乎正在征服世界。

计算笔记本取代科学期刊中的PDF尚需时日,因为这将意味着科学本身的激励结构发生变化。 直到期刊开始要求科学家向他们发送笔记本,直到免费分发其工作和数据成为获得声望或获得资金的一种方式,人们才有可能像以前一样做所有事情。

我与一名成为程序员并为Jupyter做出贡献的神经科学家进行了交谈,他告诉我,负责他曾经工作过的实验室的教授最初是一名电生理学家-他通过植入的电极测量了神经元的活性。 他说:“获得这样的数据是一项昂贵而昂贵的项目。” “您收集一片数据并可以处理它,直到您的职业生涯结束。”

Jupyter的创建者Perez在2013年的博客文章中写道:“在这个阶段,没有理性的人会认为科学研究的实践正在发生转变。”科学越来越多地使用计算和必要的技能来成为一名优秀的科学家,在行业中变得越来越有吸引力。 大学正在流失组织创业公司的最佳人选,而离开了谷歌和微软。 他写道:“在过去的十年中,许多才华横溢的同事们绝望地离开了学术界,”我无法回想他们中的许多人,这些人对多年后的发展并不满意。

佩雷斯(Perez)向我讲述了有关科学家们牺牲了学术生涯进行软件开发的故事,因为软件开发在他们的研究领域中并非毫无价值。 matplotlib的创建者,可能是科学论文中最常用的图表绘制工具,是神经生物学的博士后,但出于行业原因,他不得不离开学术界。 NumPy(现在流行的数值计算工具)的创建者也发生了同样的事情。 佩雷斯说:“我收到了许多同事和资深同志的明确评论,他们说:停止这样做,您将花费自己的职业生涯和才华。” 他们毫不尴尬地建议我“回归物理学,数学,撰写文章”。

但是那些留下来的人正在进步。 佩雷斯最近在伯克利统计局找到了工作。 在我们交谈之后的第二天,根据完全基于Python和Jupyter笔记本构建的程序,他应该向高年级学生讲授数据科学。 他说:“我认为,针对年轻学生的本课程版本吸引了1200名学生。” “这是加州大学伯克利分校历史上发展最快的课程。” 而所有这些都是基于开源工具的。”

那些寻求改善科学研究实践的人也梦想着改善自己的研究成果。 莱布尼兹的录音使记录分析变得容易,扩大了可想像的空间。 当今最大的科学挑战通常是计算难题:如何在基因组数据中整合数十亿个配对碱基,将蛋白质组学数据,患者历史病历和药理学结果整合到一个人如何生病的统一数据库中,是数十倍还有什么需要帮助他的? 在实践中,如何处理无数的有关温度和降水,海洋学,火山和地震活动的新数据? 如何创建和理解思维大脑的神经联系图? 如果您为科学家配备计算笔记本或笔记本的某些更高级版本,则可能有助于将他们的想法提高到当今尚无法解决的问题水平。

有一次,佩雷斯告诉我,朱比特计划向伽利略致敬-也许是现代意义上的第一位科学家。 Jupyter徽标是伽利略原始绘画的抽象版本,描绘了木星的卫星。 佩雷斯说:“伽利略无处可去买望远镜。” “他必须自己做。”

Source: https://habr.com/ru/post/zh-CN412249/


All Articles