Visualisation de l'arbre des primates

Visualisation de l'arbre des primates


Stanislav Drobyshevsky a publié au début de l'année un arbre détaillé de l'origine des primates . Version PDF


Les commentateurs de Vkontakte ont demandé une version interactive ( 1, 2, 3, 4 ), car elle est plus pratique à apprendre et plus facile à mettre à jour lorsque de nouvelles données apparaissent.


Olya Mokhova et moi avons décidé d'aider la paléo-primatologie et avons réalisé un prototype sur d3js.


A gauche se trouve le schéma d'origine, à droite notre version:
Avant et après


Site du projet


Je vais vous dire comment s'est déroulé le travail et quelles techniques nous ont aidés.


But


Nous voulons d'abord faire un schéma scientifique populaire, une version plus avancée de la célèbre image:
Évolution humaine


Mais à ce sujet, il y a déjà un excellent projet de Gleb Krauklish .


Nous décidons d'aller dans l'autre sens: réaliser un prototype de système d'agrégation de données archéologiques. Bien sûr, je veux faire un mégaprojet avec le mouvement des plaques tectoniques, des photos de trouvailles, des informations détaillées sur chaque taxon, des liens vers Wikipedia et un graphique de la température annuelle moyenne. Mais nous décidons de commencer par créer une version interactive du schéma existant.


La conception


Dans le circuit d'origine, la couleur n'est presque jamais utilisée. Vous pouvez montrer en couleur, par exemple, sur quel continent la bête a été trouvée.


Je veux aussi montrer plus clairement la hiérarchie des taxons (groupes d'organismes).


Je fais le premier croquis:


Premier croquis


Des questions se posent immédiatement. Par exemple: «Les liens familiaux devraient-ils en quelque sorte dépendre de la nidification des taxons?» Nous devons creuser dans Wikipedia, en apprendre davantage sur la cladistique et la monophilie . J'apprends de Stanislav qu'il n'y a pas de cladisme sur le diagramme, ce qui signifie que l'arbre des liens familiaux ne doit pas nécessairement coïncider avec la nidification des taxons.


Je dessine un morceau du circuit avec des données similaires aux vraies. J'essaie d'utiliser les données les plus gênantes pour collecter autant de cônes que possible au stade de la mise en page. Je prends des noms qui ne correspondent pas, je montre comment la valeur du curseur est superposée à un autre texte.


Disposition


Base de données


Le projet est hébergé sur les pages Github . Au départ, nous voulions préparer les données dans une table Google, puis les convertir en csv et les valider dans un github. En conséquence, nous avons décidé de charger les données directement à partir de la table Google.


Avantages de cette solution:


  • Stanislav Drobyshevsky peut modifier les données sans notre aide.
  • Dans le processus de développement, il était souvent nécessaire de corriger les erreurs, d'essayer un ordre de données différent. La table Google nous a fait gagner beaucoup de temps.

Inconvénients:


  • Il se charge un peu plus longtemps, mais pas critique.
  • Si vous gâtez les données du tableau, le site tombe également immédiatement en panne. Cependant, le tableau Google conserve un historique des modifications, en cas de problème, vous pouvez revenir à l'ancienne version. Vous pouvez également dupliquer la feuille de calcul avant d'apporter des modifications et utiliser le doublon comme sauvegarde.

Copier les données


La principale difficulté est l'imbrication profonde des taxons. Voici une liste de tous les rangs:


  1. Escouade de la paix
  2. Détachement
  3. Sous-ordre
  4. Infra squad
  5. Parvotryad
  6. Superfamille
  7. Famille
  8. Sous-famille
  9. Genre

Pour simplifier la copie des données et leur vérification, j'ai peint des dés colorés sur le dessus du circuit. La couleur signifie le rang du taxon, les noms sont signés en haut.


Jeu de couleurs
Version complète


Lelya Kolesnikova est venue à la rescousse. Il copie les données du PDF dans un tableau de 300 lignes. Bien sûr, je veux automatiser le processus, mais c'est difficile: certaines nuances ne sont pas évidentes même avec un transfert manuel.


Oeuvre


Les images aident à diversifier une toile monotone et à imaginer à peu près à quoi ressemblent les représentants des taxons. Nous faisons appel au projet illustrateur. Tatyana Sergeevna se met aux affaires.


Nous discutons des références:
Les références


Nous sélectionnons des photographies et des reconstitutions de représentants typiques, dessine Tanya. Certaines illustrations géométriques aident à détourner l'attention des détails, qui varient considérablement d'une espèce à l'autre.


Processus de dessin


Vérification des données


Lors du transfert de PDF vers des données, des erreurs se sont glissées. Par conséquent, avant de montrer le schéma à Stanislav, nous nous vérifions.


  1. Chaque pays ne devrait concerner qu'un seul des continents. Je vérifie cette conformité avec une plaque pivot:

Tableau croisé dynamique pour vérifier les emplacements .


  1. Pour faciliter la vérification des périodes, j'écris un mini-script sur d3, qui signe le début et la fin des périodes directement sur le graphique. Il fallait le faire dès le début.

Périodes signées


  1. Parfois, les noms des taxons sont similaires, mais en réalité différents. Pour me protéger de telles erreurs, j'insère des images de hachage à côté des colonnes de taxons. Si deux mots diffèrent d'au moins une lettre, les images seront probablement différentes et une erreur sera détectée:

Images de hachage


Les images sont chargées à partir de http://avatars.adorable.io/


Des difficultés


Au cours du travail, des problèmes intéressants surgissent, nous en discutons avec Stanislav.


Par exemple, certains taxons proviennent de plus récents. Par exemple, Amphipithecidae → Oligopithecinae → Perupithecus ucayaliensis. Bien sûr, cela est impossible, les représentants d'Amphipithecidae et Oligopithecinae antérieurs n'ont pas encore été trouvés. Nous décidons d'augmenter artificiellement le taxon parent dans le passé:


La solution au problème du "primer"


Au début, nous pensions que les connexions n'étaient possibles qu'entre «briques», mais il s'est avéré que nous avions besoin de pouvoir connecter tous les taxons: les «briques» et les «cadres». Nous devons jusqu'à présent supprimer les connexions problématiques (de l'infra-détachement EOSIMIIFORMES)


L'incapacité à construire des flèches à partir des surtaxes


Parfois, des choses intéressantes se présentent:


Semnopitek mystérieux


Pour l'avenir


  • La tâche maximale est de faire une base de découvertes archéologiques et de les montrer sur ce diagramme. Maintenant, on ne sait pas d'où viennent toutes ces rayures, quelles sont les découvertes archéologiques derrière elles.
  • Ajoutez la capacité de communiquer entre les taxons de n'importe quel rang. Maintenant, seules les briques peuvent être connectées les unes aux autres. Par conséquent, nous ne pouvons pas montrer un lien avec le schéma d'origine EOSIMIIFORMES → Amphipithecidae
  • Afficher les lieux de découvertes archéologiques directement sur la carte.
  • La Terre a radicalement changé en 65 millions d'années. Il serait intéressant de déplacer le curseur sur la timeline pour changer la forme de la carte de couleurs ci-dessous.
  • Vous pouvez soigneusement récupérer les noms des taxons sur le côté gauche, comme sur la table de Tufty .
  • Lorsque vous cliquez sur un taxon, affichez des informations détaillées à son sujet.
  • Les anthropologues n'ont pas une seule vision de l'évolution. Je voudrais visualiser cette incertitude à l'avenir et voir avec quoi tout le monde est d'accord et quelles opinions divergent.

Site du projet


Selon vous, qu'est-ce qui s'est bien passé et qu'est-ce qui est mauvais? Comment amélioreriez-vous le projet?


Si vous avez des données intéressantes qui doivent être traitées, visualisées et montrées aux gens - écrivez, nous serons heureux de coopérer: ivan@dianov.org, télégrammes: @ivan_dianov

Source: https://habr.com/ru/post/fr430324/


All Articles