您的位置:首页 >人工智能 >正文

在大量研究发现AI可以帮助科学家检验事实

一种实验工具可帮助研究人员浏览大量的文献,以检查新兴研究是否遵循科学共识。

重要性:自从大流行开始以来,大量的相关预印本和论文由具有不同专业知识的人们制作,并通过不同程度的同行评审进行了审查。这对试图增进对病毒的理解的研究人员从虚构的科学事实中进行分类提出了挑战。

工作原理:由位于西雅图的研究型非营利组织艾伦人工智能研究所(AI2)开发的SciFact工具旨在帮助实现这一过程。在搜索栏中输入科学依据(例如,“高血压是covid的合并症”(翻译:高血压会导致covid患者的并发症)),并将在饲料中填充相关论文,标明是支持或驳斥该论断。它还显示每篇论文的摘要,并突出显示其中的特定句子,这些句子为评估索赔提供了最相关的证据。

如何构建:该系统基于称为VeriSci的神经网络构建。它接受了从Wikipedia编译的现有事实检查数据集的培训,并在包含1409个科学主张以及5183个摘要的新科学事实检查数据集上进行了微调。

AI2的研究人员使用Semantic Sc​​holar整理了后一个数据集,Semantic Sc​​holar是一个公开获取的科学论文数据库,该非营利组织自2015年以来一直保持该数据库。他们从数十种在生活和医学领域广受好评的期刊中随机选择了一份论文样本科学,包括细胞,自然和JAMA。然后,他们从包含引文的论文中提取句子,并请专家注释者将其重写为科学说法,这些说法可能被文献证实或相抵触。对于每个声明,注释者然后通读相应引用的摘要,并确定包含支持或反驳证据的句子。

表现如何:研究人员针对与covid-19相关的科学说法测试了VeriSci时,发现它检索了相关论文并在36次中准确地标记了23次。尽管性能不完美,但结果仍然优于在其他现有事实检查数据库上训练的相同神经网络,并成为第一个已知的概念证明,说明基于AI的科学事实检查系统如何可行。将来,可以通过使用更多培训数据来部分减少该工具的某些错误;其他人将需要在自然语言理解方面的进一步发展。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。