人工智能在科技出版中的应用

2020-06-09

628

人工智能（Artificial Intelligence，AI）是一个在许多行业都很流行的术语，因为人工智能具有快速完成通常需要人类做更多工作的任务的潜力。曾经被认为是计算机软件的终结，真正的人工智能的早期形式现在被用来解决现实世界的问题。

人工智能解决方案正在进行中

科学出版已经在使用一些早期的人工智能技术来解决某些问题，例如：

•确定新的同行评论员：编辑人员通常负责管理自己的评论员名单，其中包括寻找新的评论员。智能软件可以从编辑可能没有考虑过的web资源中识别出新的潜在评审者。

•打击剽窃：目前的许多剽窃算法与文本一字不差。同义词或释义的使用可以挫败这些服务。然而，新的软件可以识别整个句子或段落的组成部分（很像人类的大脑）。它能识别并标记出声音相似的文件段落和句子。

•糟糕的报告：如果作者未能报告关键信息，例如样本量，编辑需要就是否接受或拒绝一篇论文作出明智的决定，那么编辑和审稿人应该意识到这一点。新技术可以扫描文本以确保正确报告所有必要的信息。

•糟糕的统计数据：如果科学家对他们的数据进行不适当的统计检验，这可能导致错误的结论。人工智能可以识别出最合适的测试来获得可靠的结果。

•数据制作：人工智能通常可以检测数据是否经过修改，或者是否生成了新数据，以达到预期的结果。

这些只是人工智能开始面临的几个重大挑战。目前正在处理其他任务，如验证作者身份、影响因素预测和关键字建议。

在StatReviewer，我们使用更严格定义为机器学习的方法来生成科学手稿的统计和方法学评论。机器学习需要大量的信息，并利用这些信息训练软件进行识别。这方面的一个典型例子是字符识别：软件暴露于（即接受过）字母A上的数千种变体中，并学会识别图像中的不同。机器学习被认为是真正人工智能的先驱。

在不远的将来，这些萌芽的技术将发展成为极其强大的工具，使我们今天所面临的许多问题变得微不足道。

全自动化的窘境

今后，软件将能够完成面向主题的稿件审查。当与自动化的方法审查相结合时，这将实现一个完全自动化的发布过程——包括发布决定。这就是滑坡变得特别滑的地方。

一方面，自动化一个决定我们所看重的“好科学”的过程有风险，充满了伦理困境。科学期刊的编辑和审稿人提供的策展帮助我们从研究中的噪音中分离出信号，并提供了一个什么是“重要”的概念。如果我们让这个过程失去人性，我们就需要警惕

关于我们允许人工智能传递的价值观。必须保持警惕。

另一方面，自动化出版将加快科学交流。当提交到发表的时间以毫秒为单位时，研究人员可以更快地分享他们的发现。此外，消除了人为偏见，使自动化出版成为一种无偏见的方法。

最后，如果科学朝着一个更“开放”的范式前进，那么完全自动化的伦理就变得不那么棘手，因为出版过程不再决定科学的重要性。这将留给科学信息的消费者和聚合者。

那为什么要用人工智能呢？

我们目前的出版模式为潜在的掠夺性期刊/出版商创造了一个机会，他们可以不经审查就拿作者的钱出版自己的作品。事实上，这种情况的频繁发生告诉我们，出版界没有足够的能力来处理正在产生的大量科学著作。人工智能解决方案将有助于从两个方面解决这一短缺问题。首先，人工智能将通过寻找新的审稿人、创建自动审稿等方式，提高发布高质量作品的整体能力；其次，使用人工智能技术，将有可能对已发表的作品进行自动回顾，并快速确定没有履行维护适当标准义务的组织。

天网——自动化程度多深算太多了？

今天，我们已经有了科学信息的自动化消费者（我已经写了一些），在未来，我们也将有先进的人工智能消费它。这些“人工智能消费者”将掌握科学史。他们将接收新发布的信息，并注意如何将其添加到以前的信息中。不久，人工智能可能会提出新的实验，以继续研究某一特定课题。在一些工业中，实验是机械地进行的，它们是由人工智能自动启动的……你可以看到这是如何失控的。在这一点上，一个没有监督的人工智能决定了科学研究的方向，是我们必须警惕的。真正的发现应该完全是人类的想法。