Le travail scientifique est dépassé; ce qui nous attend ensuite

Le travail scientifique - sous sa forme moderne - est devenu l'une des inventions qui ont permis au progrès de se développer. Avant que sa forme ne soit développée au XVIIe siècle, les résultats de l'œuvre ont été transmis en privé en lettres, de manière éphémère dans des conférences, ou tous ensemble dans des livres. Il n'y avait pas de place pour un débat public sur les progrès graduels. Laissant de l'espace sur leurs pages pour décrire des expériences individuelles ou de petites avancées techniques, les magazines ont créé le chaos à partir d'une science en expansion. Depuis lors, les scientifiques ont commencé à ressembler à des insectes sociaux: ils ont constamment avancé, avec un bourdonnement comme une meute d'abeilles.

Dans un certain sens, les premières œuvres étaient plus lisibles que les œuvres d'aujourd'hui. Ils étaient moins spécialisés, plus simples, courts et moins formels. La matanalyse n'a été inventée que peu de temps auparavant. L'ensemble complet de données sur le sujet à l'étude pourrait tenir dans une plaque sur une page. Tous les calculs relatifs aux résultats ont été effectués à la main et ont également pu être vérifiés.

Plus la science devient difficile, plus il est difficile de rendre compte de ses résultats. Le travail d'aujourd'hui est plus long que jamais et plein de jargon et de diverses désignations symboliques. Ils dépendent d'un ensemble de programmes informatiques qui produisent des données, nettoient les données, construisent des graphiques et traitent des modèles statistiques. Et ces programmes sont parfois si négligemment écrits et tellement axés sur le résultat qu'ils contribuent également à la crise de la répétabilité - c'est-à-dire que le travail ne répond pas à sa tâche principale: rendre compte de la découverte faite est assez simple pour que quelqu'un d'autre puisse le faire aussi .

Il vaut peut-être la peine de blâmer l'habitude du papier sur lequel les papiers sont imprimés. Les méthodes scientifiques évoluent à la vitesse du logiciel; surtout, les physiciens, les biologistes, les chimistes, les géologues et même les anthropologues et les psychologues doivent être capables de maîtriser les langages de programmation et les packages de programmes " datalogical ". Et tandis que la principale façon de transmettre les résultats scientifiques n'a pas changé au cours des 400 dernières années. Bien sûr, l'œuvre peut être publiée sur Internet - mais il s'agit toujours de texte et d'images situés sur la page.

Que se passerait-il si nous développions aujourd'hui une norme de travail scientifique? J'ai récemment discuté avec Bret Victor , un chercheur qui a travaillé chez Apple sur les premiers prototypes de l'interface utilisateur pour l'iPad, et dirige maintenant son propre laboratoire à Auckland, en Californie, pour étudier l'avenir des systèmes informatiques. Victor a longtemps cru que les scientifiques ne profitaient toujours pas pleinement de l'ordinateur. "La situation n'est pas très différente de celle de l'imprimerie et de l'évolution des livres", a-t-il déclaré. Après Guttenberg, les presses à imprimer étaient principalement utilisées pour reproduire la calligraphie biblique. Près de 100 ans d'améliorations techniques et conceptuelles ont été nécessaires pour inventer un livre moderne. «Il y a eu toute une période pendant laquelle les gens ont eu une nouvelle technologie d'impression et l'ont utilisée pour reproduire d'anciens supports.»

Victor a montré ce qui peut être accompli en refaisant un article de magazine écrit par Dunak Watts et Stephen Strogatz, «La dynamique collective des réseaux des petits mondes». Il l'a choisi parce que c'est l'une des œuvres les plus citées de toutes les sciences, et parce que c'est un modèle pour une présentation claire de l'information. (Strogac est surtout connu comme l'auteur de la colonne The Elements of Mathematics dans le New York Times.)

Le travail de Watts-Strogac a décrit les découvertes clés de la même manière que la plupart des autres - sous forme de texte, d'images, de symboles mathématiques. Et, comme dans la plupart des œuvres, ces découvertes sont très difficiles à digérer, malgré une description claire. Les endroits les plus difficiles à travailler étaient ceux qui décrivaient des procédures ou des algorithmes, car le lecteur devait assumer le "rôle de l'ordinateur", comme l'a dit Victor, essayant de garder une image de ce qui se passait dans son esprit, en passant par les étapes de l'algorithme.

Après la révision de Victor, le texte explicatif a commencé à alterner avec des diagrammes interactifs illustrant chaque étape. Dans cette version, il était possible de retracer le fonctionnement de l'algorithme à l'aide d'un exemple. Vous pourriez même le contrôler.



Strogac admirait l'option de Victor. Il m'a dit plus tard qu'il était très désolé qu'en mathématiques depuis des centaines d'années, il soit de tradition d'écrire des œuvres aussi strictement et formellement que possible, souvent même en omettant les indices très visuels que les mathématiciens utilisent pour faire leurs découvertes.

Stogac étudie la dynamique non linéaire et le chaos, des systèmes sujets à la synchronisation ou à l'auto-organisation: le clignotement des lucioles, le tic-tac des métronomes, les impulsions électriques des cellules cardiaques. La clé est que ces systèmes fonctionnent en cycles, et Strogac le visualise à travers des points dans un cercle: lorsque le point revient au point de départ, c'est un clignotement d'une luciole ou un déclenchement d'une cellule cardiaque. «Depuis près de 25 ans, je fais de petites animations informatiques de points tournant en rond, avec des couleurs indiquant leur fréquence», a-t-il déclaré. "Les rouges sont des gars lents, les violettes sont rapides ... Tous ces points tournent sur mon ordinateur, je fais ça toute la journée", a-t-il déclaré. Je suis bien meilleur pour capturer des motifs dans des points colorés qui traversent l'écran que dans 500 séries chronologiques. De même, je verrai peu, car en réalité ça ne ressemble pas du tout à ça. J'étudie les processus dynamiques, leur présentation doit donc également être dynamique. "

Les programmes sont des supports dynamiques, mais pas le papier. En ce sens, il semble étrange que des études telles que celles de Strogac consacrées aux systèmes dynamiques soient si souvent diffusées sur papier sans l'avantage de faire tourner des points - car ce sont précisément ces points qui l'ont aidé à voir ce qu'il a vu et pourraient aider à voir C'est pour le lecteur.

C'est tout le problème de la communication scientifique: aujourd'hui, les résultats scientifiques se retrouvent souvent sur ordinateur. Les idées sont complexes, dynamiques, il n'est pas facile de les capturer avec un regard intérieur. Et tandis que l'outil le plus populaire pour diffuser les résultats reste le PDF - simulant littéralement un morceau de papier. Nous pouvons probablement trouver quelque chose de mieux.

Stephen Wolfram a publié son premier travail scientifique à l'âge de 15 ans. À la fin de ses études à l'institut, il avait déjà publié 10 ouvrages et à l'âge de 20 ans, en 1980, il avait déjà terminé son doctorat en physique des particules au California Institute of Technology. Sa super arme était l'utilisation active d'un ordinateur à l'époque où les scientifiques les plus sérieux considéraient le travail informatique comme inférieur à leur dignité. «À ce moment-là, j'ai probablement utilisé l'algèbre informatique le plus au monde», a-t-il déclaré dans une interview. C'était très pratique, je pouvais juste faire tous les calculs sur l'ordinateur. Je me suis amusé à publier des formules particulièrement ornées dans mes travaux scientifiques. »

Avec l'ambition croissante de ses recherches, il a de plus en plus amené les logiciels existants aux limites des possibilités. Pour un projet, il a dû utiliser une demi-douzaine d'outils logiciels différents. «J'ai passé beaucoup de temps à tout lier ensemble», a-t-il déclaré. "Et j'ai décidé que je devrais essayer de créer un système unique qui ferait tout ce dont j'avais besoin - un qui pourrait croître pour toujours." Et au lieu de poursuivre ses activités académiques, Wolfram a décidé de créer Wolfram Research et de créer un environnement informatique idéal pour les scientifiques. Le titre à Forbes, le 18 avril 1988, se lisait comme suit: «Un expert en physique entre dans le biz» [Un sorcier scientifique a fait son affaire].

Au centre du système Mathematica, comme la société a appelé son produit principal, il y a un bloc-notes dans lequel vous écrivez des commandes sur une ligne et voyez les résultats sur une autre. Écrivez «1/6 + 2/5» et il vous donnera «17/30». Demandez-lui de multiplier les polynômes et il obéira. Mathematica est capable de matanalyse, théorie des nombres, géométrie, algèbre. Il a des fonctions pour compter les réactions chimiques et filtrer les données génétiques. Sa base de données contient toutes les photos de Rembrandt, et elle peut vous donner un diagramme de la dispersion de sa palette dans le temps. Des modèles de mécanique orbitale y sont intégrés, et il sera en mesure de calculer jusqu'où le F / A-18 Hornet peut planifier si ses moteurs s'arrêtent à une altitude de 10000 km. Le bloc-notes de Mathematica n'est pas seulement un enregistrement des calculs de l'utilisateur, mais une transcription de sa conversation avec l'oracle omniscient. Tungsten appelle les cahiers soigneusement rédigés «essais de calcul».

L'interface pour ordinateur portable a été conçue par Theodore Gray, inspirée par le travail avec l'ancien éditeur de code pour Apple. La plupart des environnements de programmation vous permettent d'exécuter du code ligne par ligne ou en une seule fois. Apple Editor vous a permis de sélectionner n'importe quelle partie du code et de l'exécuter uniquement. Gray a transféré ces concepts de base à Mathematica, et il a été aidé à améliorer la conception par nul autre que Steve Jobs lui-même. Le bloc-notes est conçu pour transformer la programmation scientifique en un exercice interactif dans lequel les commandes individuelles peuvent être corrigées et redémarrées des dizaines et des centaines de fois, en apprenant des résultats d'expériences de calcul, ce qui vous permet de mieux comprendre les données.

Le bloc-notes est particulièrement bon pour faire face à ses tâches en raison de sa capacité à dessiner des graphiques, des images et de belles formules mathématiques, malgré le fait que tout cela réponde dynamiquement aux changements dans le code. Dans Mathematica, vous pouvez entrer dans l'enregistrement vocal, appliquer des filtres mathématiques complexes aux enregistrements audio et visualiser l'onde sonore résultante. En faisant glisser les paramètres avec la souris, vous pouvez changer son apparence et voir quels filtres fonctionnent le mieux lorsque vous jouez avec eux. La capacité du package à gérer facilement autant de tâches de calcul différentes dans une interface simple est le résultat de "littéralement des siècles de travail", explique Gray.

La vision qui sous-tend le travail a été répétée à plusieurs reprises par Wolfram dans ses conférences, articles de blog, présentations et communiqués de presse. Non seulement créer de bons logiciels, mais créer un point d'inflexion dans la classe de sciences elle-même. Au milieu du XVIIe siècle, Gottfried Leibniz a développé un système d'enregistrements d'intégrales et de dérivées (les familiers ∫ et dx / dt), qui ont rendu mécaniques les idées complexes de l'analyse mathématique. Leibniz pensait que des symboles similaires dans une application plus large pouvaient créer une «algèbre de pensées». Depuis lors, les logiciens et les linguistes rêvent d'un langage universel capable d'éliminer l'ambiguïté et de transformer la solution de problèmes complexes en une sorte de matanalyse.

La carrière de Wolfram consiste en des tentatives constantes d'intégrer toutes les connaissances du monde dans Mathematica, puis de les rendre disponibles via Wolfram Alpha, le «moteur de connaissances informatiques» de l'entreprise, derrière de nombreuses opportunités de répondre aux questions d'assistants électroniques tels que Siri et Alexa. Il s'agit de la tentative de Wolfram de créer Interlingua, un langage de programmation qui est également compréhensible pour les personnes et les machines - l'algèbre de tout.

La tâche est typiquement ambitieuse. Dans les années 1990, Wolfram taquinait parfois le public avec des commentaires selon lesquels, dans le processus de création de son entreprise, il travaillait sur un projet scientifique révolutionnaire. L'attente a grandi. Enfin, le projet est arrivé: un énorme livre, l'épaisseur d'un parpaing, et presque le même poids, avec un titre éternel: « Science d'un nouveau type ».

Cela s'est avéré être une étude détaillée réalisée à l'aide de blocs-notes Mathematica, des modèles étonnamment complexes créés par les processus de calcul les plus simples - les automates cellulaires. L'étude a été menée à la fois simplement dans un but de recherche et afin de comprendre comment des règles simples peuvent générer des phénomènes naturels complexes - par exemple, une tornade ou un motif de coquille de mollusque. Ces études, publiées par Wolfram sans édition indépendante, ont été accompagnées de rappels constants de leur importance.

Plus vous rencontrez Tungsten, plus cela ressemble à son style. Dans un article de 1988 sur lui, Forbes a essayé de trouver les racines de ce phénomène: «Comme Harry Wulf, un ancien directeur du prestigieux Institute for Advanced Studies (à Princeton), où Wolfram était l'un des plus jeunes scientifiques à 23 ans, a déclaré qu'il avait "Des difficultés de caractère cultivées, soutenues par un sentiment de solitude, d'isolement et d'unicité."

Lorsque l'un des assistants de Wolfram a annoncé une découverte mathématique importante lors de la conférence, qui était un élément clé du «nouveau type de science», Wolfram a menacé de le poursuivre si le travail était publié. "Dans aucun groupe de recherche sérieux, un jeune chercheur ne sera autorisé à parler de ce que fait le senior", avait-il déclaré à l'époque. D'autres scientifiques ont critiqué le livre massif de Wolfram pour être basé sur d'autres travaux, mais ne les ont pas mentionnés. "Il laisse entendre qu'il est l'auteur des principales idées qui ont été l'idée centrale de la théorie des systèmes complexes au cours des 20 dernières années", a déclaré un chercheur au magazine Times Higher Education en 2002.

L'éloge de Tungsten semble d'autant plus surprenant qu'il est complètement facultatif. Ses réalisations parlent d’elles-mêmes - s’il les laissait faire. Mathematica a atteint le succès presque immédiatement après son lancement. Les utilisateurs attendent depuis longtemps un tel produit; dans les universités, le programme est devenu aussi courant que Microsoft Word. Wolfram, d'autre part, a utilisé un revenu stable pour embaucher des ingénieurs et des experts supplémentaires dans divers domaines, fournissant de plus en plus d'informations à son programme insatiable. Aujourd'hui, Mathematica connaît l'anatomie du pied et les lois de la physique, la musique, la systématique des conifères et les principales batailles de la Première Guerre mondiale. Wolfram lui-même a aidé à enseigner son programme d'écriture de chiffres grecs archaïques.

Toutes ces connaissances sont «calculées». Si vous le souhaitez, vous pouvez indiquer avec x l'emplacement de la bataille sur la Somme , et avec y les précipitations quotidiennes en 1916 dans un rayon de 50 km de cet endroit, et Mathematica calculera s'il y a eu plus de morts pendant les batailles de la Première Guerre mondiale quand il pleuvait.



"J'ai remarqué une tendance intéressante", a écrit Wolfram dans un article de blog. - Choisissez n'importe quel domaine X, de l'archéologie à la zoologie. Ensuite, le «X calculateur» sera connecté à celui-ci, qui existe déjà ou est en train de naître. Et cela est considéré comme l'avenir de ce domaine. "Wolfram soutient que mieux les experts dans ces domaines maîtrisent les méthodes de calcul, plus le domaine de l'ouvert s'élargit. Le cahier de Mathematica peut devenir un accélérateur de la science, car il peut donner naissance à un nouveau style de pensée." Il est très intéressant d'observer "Il dit," comment se produit la même transition qui a eu lieu au 17ème siècle, lorsque les gens ont eu l'occasion de lire des enregistrements mathématiques. Cela devient une forme de communication avec une caractéristique très importante - la capacité de nouveau départ. "

L'idée est qu'un «travail scientifique» de ce type puisse avoir le même dynamisme que Strogac et Victor voulaient - des diagrammes interactifs entrecoupés de texte - avec l'avantage supplémentaire que tout le code qui génère ces diagrammes et toutes les données seront accessibles au lecteur qui peut les regarder et jouer avec eux. «Honnêtement, lorsque vous écrivez quelque chose de si simple et compréhensible en langue Wolfram dans un cahier, il n'y a pas de place pour la tromperie. Il y a ce qui existe, et cela fonctionne comme cela fonctionne. Il n'y a aucun moyen d'ajuster le résultat », explique Wolfram.

Écrire un travail dans le cahier Mathematica signifie révéler à la fois les résultats et les méthodes de votre travail; et le travail scientifique, et tout ce que vous avez fait pour l'écrire. En conséquence, il sera plus facile pour les lecteurs non seulement de le comprendre, mais aussi de le reproduire (ou de ne pas le reproduire). Lorsque des millions de scientifiques du monde entier apporteront progressivement leur contribution à la science, la seule façon de transformer tout ce travail en quelque chose d'important sera de permettre aux autres de construire de manière fiable quelque chose sur la base de ces contributions. «C'est ce que le travail scientifique réalisé sous la forme d'essais informatiques peut réaliser», a déclaré Wolfram.

Wolfram se dit surpris que les essais informatiques n'aient pas gagné en popularité. Il rappelle son travail avec Elsevier, le géant des publications scientifiques, au début des années 1980. «Elsevier m'a engagé pour me consulter sur quelque chose comme« à quoi ressemblera l'avenir des publications scientifiques ». C'était avant l'avènement des cahiers Mathematica, mais il les a poussés à parler de la même région. «Il y a quelques années, j’ai de nouveau parlé à un membre de la direction de l’entreprise. Et lors de cette réunion, j'ai réalisé - oh mon Dieu, j'ai dit exactement la même chose il y a 35 ans! »

J'ai parlé à Theodore Gray, qui a quitté Wolfram Research pour devenir écrivain. Il a dit que son travail sur le cahier en particulier était motivé par ses sentiments, qui s'étaient déjà bien formés dans les années 1990, «que, évidemment, toutes les communications scientifiques et tous les travaux techniques qui utilisaient des données ou des mathématiques ou de la modélisation ou des graphiques ou régimes ou quelque chose comme ça, pas besoin de publier sur papier. C'était assez évident en 1990 ", a-t-il dit.

"Au cours des 29 dernières années, le fait qu'à l'exception de certaines personnes qui l'ont compris, la communauté dans son ensemble n'a pas adopté cette approche, a été perçu avec horreur et surprise", a-t-il déclaré. "Il est littéralement impossible de calculer combien a été perdu, combien de temps perdu, combien de résultats sont mal compris ou déformés."

Au début de 2001, Fernando Perez s'est rendu compte qu'il était à peu près dans la même position que Wolfram il y a 20 ans. Il était un physicien diplômé qui a amené ses outils à la limite de leurs capacités. Il a utilisé tout un tas de systèmes, et Mathematica parmi eux, et il semblait que pour terminer chaque tâche, il fallait passer d'un outil à un autre. Il rappelle que sur son bureau se trouvaient 6 à 7 livres différents sur la programmation. Il voulait créer un environnement unifié pour le calcul scientifique.

Mais au lieu de commencer à ouvrir une entreprise, il a trouvé deux scientifiques, un océanographe allemand et un étudiant diplômé en informatique de Caltech, qui pensaient dans la même direction. Ils sont tous tombés amoureux de Python, un langage de programmation polyvalent open-source, et ont commencé indépendamment à créer des outils pour simplifier le travail avec le langage pour les scientifiques: des outils qui ont simplifié le travail avec les ensembles de données et les graphiques, encourageant davantage de styles de programmation de recherche .

Perez a réuni trois projets en un et a pris le contrôle de lui. Dès le début, le projet IPython (je voulais dire interactif) était open source. Le programme n'était pas seulement gratuit, n'importe qui pouvait étudier son code et le corriger, apportant sa contribution à la cause commune. Cette décision a été prise intentionnellement. «J'étais intéressé à la fois par l'aspect éthique de pouvoir partager mon travail avec les autres», a déclaré Perez, lui-même originaire de Colombie, où l'accès aux programmes commerciaux était plus difficile, «et par une motivation épistémologique». Il croyait que si la science devait être ouverte, alors les outils utilisés pour travailler avec elle devraient être ouverts. Un logiciel commercial, dont le code source ne pouvait pas être lu légalement, était «l'antithèse de l'idée de science», dont le but est d'ouvrir la boîte noire de la nature.

Par conséquent, Python a été utilisé. La version de base du langage n'est pas aussi puissante que le Wolfram Language, sur lequel Mathematica fonctionne. Mais si Mathematica tire ses capacités du travail de l'armée de programmeurs, l'épine dorsale de Python est prise en charge par une bibliothèque massive de fonctionnalités supplémentaires - traitement d'images, création musicale, IA, analyse de langage, graphisme - créées par une communauté de personnes contribuant gratuitement à l'open source. Python est devenu la norme de facto pour le calcul scientifique, car les développeurs open source tels que Perez ont créé des outils utiles pour cela; Python a été attiré par les développeurs car il s'agissait de la norme de facto pour le calcul scientifique. Des communautés de langages de programmation, comme tout réseau social, prospèrent ou meurent grâce à la puissance de ces boucles de rétroaction.

L'idée d'une interface de bloc-notes pour IPython provient de Mathematica. Perez a admiré la façon dont les cahiers Mathematica encourageaient un style de travail de recherche. "Il était possible d'esquisser quelque chose, car c'est ainsi que vous raisonnez sur une tâche, c'est ainsi que vous la comprenez." Les cahiers informatiques «mettent en avant l'idée de la narration vivante. Vous pouvez réfléchir au processus et utiliser efficacement l'ordinateur comme, si vous le souhaitez, un partenaire de réflexion et d'informatique. »

Au lieu de développer une application autonome dédiée, sans parler de l'âge des hommes, l'équipe IPython - Perez a rejoint Brian Granger, professeur de physique à la California Polytechnic University à San Luis Obispo et Min Reagan-Kelly, Candidate of Science de l'Université de Californie à Berkeley, travaillant dans le domaine de la physique informatique, a réalisé des cahiers sous la forme de simples pages Web. L'interface n'a pas la beauté des œuvres de Steve Jobs et leur complexité. Mais en utilisant le Web, IPython a reçu des modules complémentaires gratuits: chaque fois que Google, Apple ou un programmeur aléatoire a publié un nouvel outil de cartographie ou publié un code mathématique amélioré, cette amélioration a été attachée à IPython. "Tout a bien payé", a déclaré Perez.

L'ouvrage annonçant la première détection confirmée d'ondes gravitationnelles a été publié de manière traditionnelle, sous forme de PDF, mais complet avec un cahier IPython . Dans le bloc-notes, vous pouvez suivre tout le travail qui a généré tous les graphiques de l'article. Chacun peut exécuter le code lui-même, le corriger comme bon lui semble, jouer avec les calculs afin de mieux comprendre son fonctionnement. À un certain moment dans le cahier, le récit atteint la partie où le signal généré par les ondes gravitationnelles se transforme en son - et vous pouvez le jouer dans le navigateur, entendre ce que les scientifiques ont entendu pour la première fois, le gargouillis de deux trous noirs en collision.



«Je pense que la communauté scientifique a adopté cet outil, et il est déjà considéré comme universel», explique Theodore Gray à propos du groupe Perez. "Mais Mathematica n'a pas encore atteint une telle adoption." Sur Github dans le domaine public a déjà publié 1,3 million de ces cahiers. Ils sont utilisés par Google, Bloomberg et la NASA; Musiciens, enseignants et chercheurs en IA; et "dans presque tous les pays de la Terre".

Chaque fois, IPython a choisi un chemin de développement qui comprenait autre chose et, par conséquent, il ne s'appelle plus IPython. Le projet a été renommé Jupyter en 2014 pour souligner qu'il ne fonctionne pas uniquement avec Python. Le bloc - notes Jupyter est similaire au bloc-notes Mathematica, ne convient qu'à tout langage de programmation. Vous pouvez créer un bloc-notes pour Python, ou C, ou R, ou Ruby, ou JavaScript, ou Julia. Tout le monde peut créer un support Jupyter pour son langage de programmation. Aujourd'hui, il est pris en charge par plus de 100 langues.

Theodore Gray, qui a conçu l'interface pour le bloc-notes Mathematica original, a déclaré qu'il avait essayé une fois de prendre en charge d'autres langages de programmation dans un souci d'expérience. «Il n'en est rien résulté», m'a-t-il dit. - L'entreprise n'était pas intéressée à soutenir cela. Et si vous devez prendre en charge de nombreuses langues, vous ne pouvez pas le faire avec autant de soin. »

L' essai d' Eric Raymond de 1997 intitulé « La cathédrale et le bazar » est en quelque sorte devenu le principal document du mouvement open source moderne. Il rejette l'idée selon laquelle un logiciel complexe doit être construit comme une cathédrale, "soigneusement conçu par des sorciers individuels ou de petites équipes de mages travaillant de manière isolée". L’expérience de Raymond en tant que responsable du développement du noyau Linux lui a appris qu’un «énorme bazar bruyant avec différents objectifs et approches», qui définit les projets de code source, est un avantage. "Le fait qu'un tel style de bazar fonctionne et fonctionne bien a été un choc", a-t-il écrit. Avec son essai, il a essayé d'expliquer pourquoi "le monde Linux non seulement ne s'est pas éloigné des malentendus, mais il semble découler d'une réussite à l'autre à une vitesse que les constructeurs de la cathédrale peuvent difficilement imaginer".

Mathematica était en développement bien avant l'expérience Linux de Raymond et est en développement depuis de nombreuses années. C'est la quintessence de la cathédrale, et ses constructeurs sont toujours sceptiques à l'égard du bazar. «Il y a toujours de la place pour le chaos», explique Gray à propos des systèmes open source. - Le nombre de pièces mobiles est énorme et différentes pièces contrôlent différents groupes. Vous ne réussirez jamais à les regrouper dans un système intégré de la même manière que cela est possible dans un seul produit commercial, avec le seul maniaque au milieu, pour ainsi dire. »

Le maniaque, naturellement, est Stephen Wolfram. Gray a noté que sous Mussolini, les trains roulaient dans les délais. «L'analogie est mauvaise», a-t-il dit, mais «je suis pour la présence d'un maniaque au milieu.» Mathematica Notebook est un produit conçu de manière plus cohérente et plus poli - en grande partie parce que chaque décision a été prise par l'esprit d'un génie obstiné. "J'ai vu ces gars de Jupyter", m'a dit Wolfram, "et ils sont en moyenne au niveau de ce que nous avions dans les années 90". Il dit qu'ils ont coupé les coins ronds. "Et nous essayons vraiment de bien faire les choses."

Mais il est difficile pour la communauté scientifique d'annoncer des logiciels commerciaux. Bien que Wolfram Research distribue un programme de bloc-notes gratuit depuis des années, et bien que la plupart des grandes universités disposent d'une licence qui permet à leurs étudiants et enseignants d'utiliser Mathematica librement, il peut être trop difficile pour les éditeurs de se retirer du format PDF ouvert au profit d'un produit commercial. "Jusqu'à présent, la situation est la suivante: si vous essayez d'envoyer un cahier de Mathematica au journal, ils se plaindront: nous n'avons pas Mathematica, c'est un programme très cher, donnez-nous quelque chose de plus standard."

Le fait que Wolfram, à la fois une personne et une entreprise, vante intrusivement la supériorité du produit, sa nécessité, de sorte que même Gray le compare aux adhérents de crossfit, qui ne peuvent pas être branchés, n'aide pas non plus. C'est après tout le même Stephen Wolfram, qui a nommé son livre sur son travail sur les automates cellulaires, «Une science d'un nouveau type». Dans son article sur la science informatique, il écrit: «Au centre des essais informatiques se trouve l'idée d'exprimer des pensées informatiques en utilisant le Wolfram Language.»



C'est peut-être le cas - peut-être que les ordinateurs portables informatiques ne peuvent prendre racine que s'ils sont pris en charge par une seule superlangue ou par une entreprise aux poches profondes et fortement intéressée par leur travail. Mais il est possible que l'inverse soit vrai. Des efforts intégrés, bien que plus chaotiques, peuvent s'avérer plus fiables, ainsi que le seul moyen de gagner la confiance de la communauté scientifique.

Wolfram ne remarque pas grand-chose en dehors de Wolfram, et peut-être pour cette raison, le cahier Mathematica reste assez opaque, et son adversaire - bien que secondaire et simplifié, mais ouvert - semble conquérir le monde.

Il faudra un certain temps avant que les ordinateurs portables remplacent le PDF dans les revues scientifiques, car cela signifiera un changement dans la structure d'incitation de la science elle-même. Jusqu'à ce que les journaux commencent à exiger des scientifiques qu'ils leur envoient des cahiers, et jusqu'à ce que la distribution gratuite de leurs travaux et données devienne un moyen de gagner du prestige ou de recevoir un financement, les gens sont susceptibles de tout faire comme avant.

J'ai parlé avec un neuroscientifique qui est devenu programmeur et a contribué à Jupyter, et il m'a dit que le professeur qui dirigeait le laboratoire où il travaillait était à l'origine un électrophysiologiste - il a mesuré l'activité des neurones à travers des électrodes implantées. «L'obtention de telles données est un projet tellement coûteux et coûteux», a-t-il déclaré que personne ne les partagera jamais. «Vous collectez une tranche de données et pouvez les traiter jusqu'à la fin de votre carrière.»

"A ce stade, aucune personne raisonnable ne prétendra que la pratique de la recherche scientifique connaît un changement", a écrit Perez, le créateur de Jupyter, dans un article de blog de 2013. La science utilise de plus en plus l'informatique et les compétences nécessaires pour devenir un bon scientifique, devenir plus attrayant dans l'industrie. Les universités perdent les meilleures personnes qui organisent leurs startups, ainsi que de partir pour Google et Microsoft. «Sous mes yeux, de nombreux collègues talentueux ont désespérément quitté le monde universitaire au cours de la dernière décennie», a-t-il écrit, «et je ne me souviens d’aucun d’eux qui n’auraient pas été satisfaits de cela plusieurs années plus tard.»

Perez m'a raconté des histoires de scientifiques qui ont sacrifié des carrières universitaires pour le développement de logiciels, car le développement de logiciels n'était pas sans valeur dans leur domaine d'étude. Le créateur du matplotlib, probablement l'outil de cartographie le plus couramment utilisé dans les articles scientifiques, était un postdoctorant en neurobiologie, mais il a dû quitter le monde universitaire pour le bien de l'industrie. La même chose s'est produite avec le créateur de NumPy, l'outil de calcul numérique désormais populaire. Perez a déclaré: "J'ai reçu des commentaires sans ambiguïté de nombreux collègues et camarades supérieurs qui ont dit: arrêtez de faire cela, vous passez votre carrière et votre talent." Sans gêne, ils m'ont conseillé de "revenir à la physique, aux mathématiques, à écrire des articles".

Mais ceux qui restent font des progrès. Perez a récemment obtenu un emploi au Département de statistique de Berkeley. Un jour après notre conversation, il était censé enseigner à des étudiants seniors la science des données, selon un programme entièrement construit sur des cahiers Python et Jupyter. «La version de ce cours pour les jeunes étudiants, je pense, a attiré 1 200 étudiants», a-t-il déclaré. «Ce fut le cours à la croissance la plus rapide de l'histoire de l'Université de Californie à Berkeley.» Et tout cela est basé sur des outils open source. »

Ceux qui cherchent à améliorer la pratique des études scientifiques rêvent également d'améliorer leurs résultats. L'enregistrement de Leibniz, qui a facilité l'enregistrement de la matanalyse, a élargi l'espace de l'imaginable. Les plus grands défis scientifiques d'aujourd'hui sont souvent des puzzles informatiques: comment intégrer des milliards de bases appariées dans les données du génome, et 10 fois plus de données protéomiques et de données historiques sur les patients, et des résultats pharmacologiques dans une base de données cohérente sur la façon dont une personne est tombée malade et que faut-il faire pour l'aider? Comment, en pratique, aborder un flot infini de nouvelles données sur la température et les précipitations, l'océanographie, l'activité volcanique et sismique? Comment créer et comprendre des cartes des connexions neuronales du cerveau pensant? Si vous équipez les scientifiques de cahiers de calcul ou de versions plus avancées d'entre eux, cela peut aider à élever leurs esprits au niveau des problèmes qui ne sont pas disponibles aujourd'hui.

À un moment donné, Perez m'a dit que le projet Jupyter honorait Galileo - peut-être le premier scientifique au sens moderne. Le logo Jupyter est une version abstraite des dessins originaux de Galileo représentant les lunes de Jupiter. "Galileo n'avait nulle part où aller pour acheter un télescope", a déclaré Perez. "Il a dû faire le sien."

Source: https://habr.com/ru/post/fr412249/


All Articles