Le manuel R a récemment été la publication non académique la plus citée dans les articles universitaires.

Dans la base de données bibliographiques Web of Science, le guide «R: un langage et un environnement pour le calcul statistique» a récemment * contourné les autres sources mentionnées dans la section Références des publications indexées par cette base de données. Malheureusement, son accès est limité et il est difficile de donner un lien (pour chaque session, un lien est généré), mais un certain nombre d'utilisateurs ** peuvent reproduire mes observations, sous la coupe, il est décrit comment et avec quelles réserves, il vaut la peine de comprendre le titre de l'actualité.

image

L'illustration montre une liste des sources les plus citées dans les publications indexées par WoS, qui elles-mêmes ne sont pas indexées par WoS dans la collection principale (Core Collection), mais se trouvent uniquement dans la base de données de références bibliographiques.

Outre le fait que trois publications indexées (toutes en biologie) sont toujours en avance sur le manuel R, et à bien d'autres égards, il s'agit d'un dossier assez limité avec un certain nombre d'hypothèses. Premièrement, cela ne concerne que WoS, dans la base de données Scopus, qui est souvent mentionnée avec WoS, la nomenclature «Manuel diagnostique et statistique des troubles mentaux» est toujours (mais à en juger par le taux de croissance, pas pour longtemps) dépassant le manuel sur R. Deuxièmement, Bien sûr, je suis conscient qu'il s'agit d'un record absolu, sans normalisation par domaine de connaissance, année de publication, etc. Troisièmement, je n'utilise probablement pas le calcul le plus honnête, à savoir, je résume les citations de toutes les versions du manuel (ainsi que d'autres références bibliographiques de ce type - toutes les versions de DSM, tous les volumes de recettes numériques, etc.), alors que dans le calcul habituel, sans de toute sommation, le manuel ne se trouve qu'à la 40e place (ci-après en 51, 61, etc. le lieu est également là, mais daté d'une année différente, d'une version différente du manuel, l'article a avant le colon est écrit en majuscules, etc. .).

image
TOP 25 catégories WoS citées par le manuel. La situation est similaire dans Scopus.

image
Une augmentation du nombre de citations du manuel dans Scopus, avec des valeurs similaires pour WoS.

Il convient également de garder à l'esprit que, dans tous les cas, si les auteurs d'une publication académique ont utilisé une sorte d'outil (au sens large, qu'il s'agisse de matériel ou de logiciel, ou d'un théorème, ou d'un argument logique, etc.), ils donneront certainement un lien vers celui-ci, donc l'objet d'une étude distincte, à quel point une telle mention fréquente du manuel reflète son utilisation fréquente dans la rédaction d'articles scientifiques (on sait que R est populaire en science, la question est différente, selon les chiffres, peut-être y a-t-il une autre source non universitaire, de effectivement utilisé souvent, mais pas mentionné dans la bibliographie).

Par exemple, selon cette revue, de facto, lors de la recherche dans la base de données Google Scholar et selon les données de 2018, SPSS est utilisé une fois et demie plus souvent pour la rédaction d'ouvrages académiques. L'auteur explique cela par la complexité de la maîtrise de R. Je souhaiterais cependant une analyse comparative sur différentes bases, car la sélection des publications indexées et, par conséquent, les indicateurs de citation diffèrent.

Pourquoi R est-il si important pour les scientifiques? Andy Wills dans le Linux Journal écrit sur R à la lumière de l'idée d'Open Science, et à propos de la pertinence de la crise de reproductibilité en psychologie. Le psychologue et data-scientiste Evgeny Tomilov , vers qui je me suis tourné, a justifié l'importance de R pour la science dans la réponse:
R vous permet de créer des protocoles de recherche reproductibles, y compris les données et leur traitement. Dans des conditions de falsification totale et un besoin urgent d'augmenter la reproductibilité et la crédibilité des travaux scientifiques, l'utilisation de cet outil est au moins utile, et au moins éthique.
Z.Y. Il est également intéressant de noter que Google Scholar a un profil R Core Team similaire aux profils de chercheurs individuels, avec un bon indice Hirsch de 50 (pour cela, vous devez avoir plus de 50 publications, de sorte que la publication de 50 d'affilée, lorsqu'elle est classée par le nombre de citations, doit avoir un nombre citations égales à 50).

* La date exacte est difficile à nommer en raison des particularités du calcul et du détail des données, très probablement cela s'est produit au cours des derniers mois.

** à savoir, les propriétaires de la carte de bibliothèque de la Bibliothèque nationale russe, RSL, et de la bibliothèque Gorky et de la carte d'étudiant de l'Université d'État de Saint-Pétersbourg, ainsi que de plusieurs autres universités.

Comment reproduire KDPV:

Dans la section «Recherche par référence bibliographique», vous pouvez entrer la requête 1000-2999 dans la recherche par année et obtenir un échantillon de 264 millions de résultats sur 268 (les autres n'ont probablement pas indiqué l'année, mais il est peu probable qu'ils soient en quelque sorte essentiels pour les manipulations ultérieures) . Classement par nombre de citations. Ensuite, exportez les résultats et filtrez ceux qui ont une colonne Source, mais pas de colonne En-tête (par exemple, dans le cas d'un article de revue, le nom de la revue est donné dans le premier cas, et le titre de la publication dans le second, puis le contenu les deux colonnes seront identiques, et uniquement dans le cas de sources non indexées, la colonne "En-tête" sera vide). Et vous pouvez manuellement ou via un script pour obtenir les résultats du résumé des citations pour chaque enregistrement unique (c'est-à-dire combiner des données sur les références bibliographiques exportées citées dans différentes orthographes, indiquant différentes éditions, des pages individuelles, etc.).

Source: https://habr.com/ru/post/fr460169/


All Articles