R手册最近成为学术论文中引用最多的非学术出版物。

在Web of Science书目数据库中, “ R:用于统计计算的语言和环境”指南最近*绕过了该数据库建立索引的出版物的“参考”部分中提到的其他来源。 不幸的是,对它的访问受到限制,并且很难给出链接(对于每个会话都会生成一个链接),但是许多用户**可以重现我的观察结果,在标题下描述了如何以及如何保留,值得理解新闻的标题。

图片

该图显示了由WoS索引的出版物中引用次数最多的来源列表,这些出版物本身并未在主要馆藏(核心馆藏)中被WoS索引,而是仅在书目参考数据库中。

除了三个索引出版物(全部在生物学上)仍领先于R手册这一事实之外,在许多其他方面,由于许多假设,这是相当有限的记录。 首先,它只涉及WoS,在Scopus数据库中(经常与WoS一起提到),术语“精神障碍诊断和统计手册”仍然(但从增长率来看,不是很长时间)在手册R之前。当然,我知道这是绝对记录,没有按知识领域,出版年份等进行归一化。 第三,我可能使用的不是最诚实的计算方式,即我总结了该手册所有版本的引用(以及其他此类书目参考文献-DSM的所有版本,所有数字配方等),而在通常的计算中,没有在任何总结中,该手册仅位于第40位(此后在51、61等处也存在),但该日期可追溯到不同的年份,该手册的不同版本,用大写字母写在冒号之前的冠词a等。 )。

图片
手册引用的前25种WoS类别。 Scopus中的情况与此类似。

图片
Scopus中该手册的引用数量有所增加,而WoS的值与此相似。

还需要记住的是,并非所有情况下,如果学术出版物的作者使用某种工具(广义上来说,无论是硬件还是软件,定理或逻辑论据等),他们肯定会给出与它的链接,因此在另一项研究的主题中,如此频繁提及该手册多少反映了其在撰写科学论文中的频繁使用(众所周知,R在科学中很流行,根据数字,问题有所不同,也许还有其他一些非学术来源,de实际使用 经常,但不是在参考书目中提到)。

例如,根据此评论,实际上,当搜索Google学术搜索数据库并根据2018年的数据时,SPSS被用于撰写学术作品的频率提高了一半。 作者通过掌握R的复杂性来解释这一点。但是,我希望在不同的基础上进行比较分析,因为索引出版物的选择以及引文指标的不同。

为什么R对科学家如此重要? 《 Linux Journal》中的Andy Wills根据开放科学的思想以及与心理学中可再现性危机的相关性来撰写有关R的文章。 我求助的心理学家和数据科学家Evgeny Tomilov在回答中证明了R对科学的重要性:
R使您可以创建可重复的研究方案,包括数据及其处理。 在完全伪造的情况下,以及迫切需要提高科学作品的可重复性和可信度的情况下,使用此工具至少是有用的,至少是合乎道德的。
Z.Y. 有趣的是,在Google学术搜索中,有一个R Core Team个人资料,类似于单个研究人员的个人资料,Hirsch指数为50(为此,您需要发表50篇以上的出版物,而按引用次数进行排名的连续50篇出版物中应该有一个数字)引用次数等于50)。

*由于计算和详细数据的特殊性,很难给出确切的日期,这很可能是在最近几个月中发生的。

**,即俄罗斯国家图书馆,RSL,高尔基图书馆的借书证的所有者和圣彼得堡国立大学以及其他几所大学的学生证。

如何复制KDPV:

在“按参考书目搜索”部分中,您可以按年份在查询中输入查询1000-2999,并从268个样本中获得2.64亿个结果的样本(其余的样本可能未指明年份,但对于以后的操作而言,它们不太可能必不可少) 。 按引用次数排名。 接下来,导出结果,并过滤出具有“来源”列但没有“标题”列的结果(例如,对于期刊文章,在第一种情况下给出期刊名称,在第二种情况下给出出版物的标题,然后是内容两列都将相同,并且仅在未索引源的情况下,“标题”列将为空)。 而且,您可以手动或通过脚本获取汇总每个唯一记录的引用的结果(即,将以不同拼写方式引用的导出书目参考中的数据进行组合,以指示不同的版本,各个页面等)。

Source: https://habr.com/ru/post/zh-CN460169/


All Articles