高引用量并不靠谱!MIT开发科研「星探」识别「高影响力论文」

贝壳号 | 发布于2021-05-29

新智元导读】MIT发现新的科研「星探」DELPHI,识别高影响力的论文数量是高引的2倍,且其中有60%都是被「高引」忽略的「科研新星」

 MIT的研究人员建立了一个「人工智能框架」——从发表过的论文登出版物中收集模式,通过学习,识别出对未来将会产生巨大影响的技术,并发出「早期提醒」。

 这一框架叫DELPHI,全称Dynamic Early-warning by Learning to Predict High Impact(通过学习来预测高影响力的动态预警)。 

DELPHI的表现怎么样呢?

 在一次对其能力的回顾试验中,DELPHI识别出了一个专家列表中所有具有开创性的重大生物技术论文,有的论文仅仅发表了一年。

 麻省理工媒体实验室(MIT Media Lab)附属研究机构的James W. Weis和Media Lab分子机器研究小组负责人、媒体艺术与科学教授Joseph Jacobson用DELPHI挑选了50篇他们认为到2023年会产生重大影响的论文。

高引用量并不靠谱!MIT开发科研「星探」识别「高影响力论文」

James W. Weis

高引用量并不靠谱!MIT开发科研「星探」识别「高影响力论文」

  Joseph Jacobson

这50篇论文主题涵盖用于癌症治疗的DNA纳米机器人、高能量密度的锂氧电池、使用深层神经网络的化学合成等等。

 DELPHI对研究人员来说是一种有效的工具,可以帮助他们更好地利用科研基金,发现众多技术中可能被搁置的 「璞玉」。

 政府、慈善机构和风投也可以根据DELPHI做出更有效的决定,支持科学事业

 根据James W. Weis的介绍,从本质上讲,DELPHI的算法通过从科学史中学习模式,然后在新出版物上进行模式匹配,从而发现蕴藏高影响力但发表时间不长的论文,通过跟踪观点的早期传播,DELPHI可以预测这些观点会在多大程度上快速或以一种有意义的方式扩散到更广泛的学术界。

 该研究的相关论文已经在Nature Biotechnology上发表。

 高引用量并不靠谱!MIT开发科研「星探」识别「高影响力论文」

 科研「星探」,发现科研中被搁置的「璞玉」

 20世纪80年代以来,美国科学出版物呈指数型增长,这为DELPHI的建立提供了大量数据信息。

 不过,DELPHI并没有局限在单一维度的衡量标准,如引用量来判断论文的影响力,而是利用期刊文章元数据的全时间序列网络,来揭示其在科学生态系统中传播的更高维度模式。

 其结果是一个知识图谱,其中包含代表论文、作者、机构和其他数据的节点之间的连接。这些节点之间复杂连接的强度和类型决定了它们在框架中使用的属性。

 这些节点和边界定义了一个基于时间的图表,DELPHI 使用这个图表来学习可以预测未来影响的模式。

 高引用量并不靠谱!MIT开发科研「星探」识别「高影响力论文」

这些网络特征一起被用来预测科学影响,在论文发表五年后落入时间尺度节点中心度前5%的论文被认为是DELPHI旨在识别的 「高影响力」目标集。

 这些前5%的论文占图中总影响的35%,DELPHI还可以使用时间尺度节点中心度前1%、10%和15%的截止点。

 DELPHI的结果表明,高影响力的论文传播速度会非常快,而且会跨越本身学科,传播到其他的学科和学术团体。

 两篇论文的引用量也许一样,但高影响力论文会收获更多更深入的关注,而影响力低的论文就算在不断传播,但并没有获得真正的关注和利用。

 DELPHI有助于激励团队成员相互协作,即使彼此不认识,通过提供科研基金让这些人一起解决跨学科问题。

 DELPHI识别的论文数是凭「引用量」识别的论文数的「2倍」,而且其中有「60%」都是此前被忽略的科研「璞玉」。

 推动基础研究就要大量尝试,并能够快速利用这些想法中最好的部分。

高引用量并不靠谱!MIT开发科研「星探」识别「高影响力论文」

MIT Media Lab

这一研究就是要测试能否以更大的规模完成这项任务——利用整个科学界,因为它也是整个学术图谱的一部分,这样在发现高影响力论文的过程中会更具包容性

 不过为了让DELPHI更准确地预测,研究人员正在使用机器学习来提取和量化隐藏在已有数据的维度和动态中的信号。

 DELPHI做更公平的「星探」

 研究人员表示,他们希望利用DELPHI降低评估论文时的偏见。

 毕竟,过去的研究显示,引用和期刊影响因子数等其他指标也可以被操纵。

 「我们希望可以利用这一点找到最值得研究的研究人员,不管他们隶属于哪个机构,也不管他们之间有多少联系」,Weis表示。

 然而,和所有的ML框架一样,框架设计者和使用者都应该警惕偏见,对此,Weis表示,

 「我们需要不断意识到我们的数据和模型中潜在的偏差。我们希望 DELPHI 能够以一种不那么偏颇的方式帮助我们找到最好的研究,因此我们需要注意,我们的模型不会仅仅根据H指数、作者引用量或机构关系等次优指标来预测未来的影响。」

 DELPHI可以成为一个强大的工具,帮助科学资金变得更加高效和有效,也许还可以用来创造与科学投资有关的新的金融产品。

 很多极具天赋的人和令人惊叹的技术都因为各种原因被忽略了,而机器学习可以帮助开发有效工具,发现这些「璞玉」,这不管对投资者还是科研事业都是极具意义和价值的。

编辑按:本文转载至微信公众号 “新智元”贝壳投研经授发布

飞鲸投研从多维度分析,整理了一份《成长50》的名单,可以关注同名公众号:"飞鲸投研":feijingtouyan,进行领取(点击复制)

该文观点仅代表作者本人,飞鲸投研系信息发布平台

/阅读下一篇/

浪潮信息掌门人张磊辞职,副董事长彭震代行其职

热门推荐