研究发现：人工智能可以提高维基百科的可靠性

　　SIDE 从维基百科上的声明到新引文建议的决策流程如下：(1)将声明发送到 Sphere 检索引擎，该引擎从 Sphere 语料库中生成潜在候选文档列表;(2) 验证引擎对候选文件和与权利要求相关的原始引文进行排名;(3) 如果原始引文的排名不高于候选文献，则建议从检索到的候选文献中使用新的引文。请注意，验证引擎的分数可能表明验证可能失败，如示例中报告的那样。图片来源：《自然机器智能》(2023)。DOI：10.1038/s42256-023-00726-1

　　关于维基百科的有用性有足够多的不同意见，足以填满一本百科全书。

　　小说家尼科尔森·贝克 (Nicholson Baker) 称维基百科(其开发者称之为世界上所有知识的集合)的数据纲要“是一件令人难以置信的事情。它庞大得令人难以置信，而且它是独特的、谨慎的、混乱的、有趣的、令人震惊的和充满了激烈的争议——而且它是免费的，而且速度很快。”

　　作者奥斯卡·奥利克-艾斯 (Oscar Auliq-Ice) 宣称维基百科是“一种革命性的资源，改变了人们访问和共享信息的方式”。

　　一些人认为这个庞大的在线资源——截至本周包含超过 670 万篇文章(英文)，由超过 43 亿个单词组成——是一项宏伟但存在缺陷的事业。

　　“维基百科就像一个花坛，大部分都很漂亮，但也有一些丑陋的杂草，”环境专家史蒂文·马吉说。

　　幽默家史蒂芬·科尔伯特注意到维基百科的集体性质，它向任何自愿提供信息的人开放，他建议“当我寻找知识……或者当我想创造一些知识时，维基百科是我第一个去的地方。”

　　但对某些人来说，维基百科是一颗苦药丸。“我不需要无线访问维基百科。我宁愿炒自己的小肠，也不愿持续访问一个克林贡语条目比拉丁语条目长的网站，”研究生院院长塔拉·布拉巴宗 (Tara Brabazon) 说道澳大利亚查尔斯达尔文大学文化研究教授。

　　虽然通常被认为是值得称赞的快速信息来源，但始终建议用户进行尽职调查，而不是仅仅依赖一种信息来源。相反，他们应该查看其他网站，探索文章链接，也许最重要的是，查看每个维基百科条目末尾列出的来源。

　　来自世界各地的专家都是维基百科的定期撰稿人，大多数都遵循有关中立性和使用信誉良好的来源的准则。尽管还可以进行改进，但该系统总体上可以正常工作。

　　本周，《自然机器智能》发表了一篇题为“利用人工智能提高维基百科可验证性”的文章，介绍了一家总部位于伦敦的人工智能公司，该公司致力于增强维基百科参考系统的可靠性。它通过检查来源并识别那些准确的信息和那些有问题的信息，然后提供自己的建议来做到这一点。

　　知识发现平台 Samaya AI 联合创始人法比奥·佩特罗尼 (Fabio Petroni) 表示：“改进参考资料的过程可以借助由信息检索系统和语言模型提供支持的人工智能来解决。机器可以帮助人类找到更好的引文，这项任务需要理解语言并掌握在线搜索。”

　　他的团队在维基百科条目的庞大数据集上训练他们的模型，然后用它来审查以前没有扫描过的文章。它分析了来源并提供了替代参考站点，然后维基百科用户检查了其结果。

　　研究人员发现，当名为 SIDE 的人工智能系统将维基百科来源归类为不可验证并提供自己的替代方案时，70% 的用户更喜欢 SIDE 的建议。

　　在大约一半的案例中，SIDE 推荐了维基百科提供的相同来源作为其第一个参考。

　　“我们证明现有技术已经达到了可以有效、务实地支持维基百科用户验证声明的阶段，”彼得罗尼说。

　　他表示，未来的研究将集中于互联网文本之外的维基百科参考文献，例如图像、视频和纸质出版物。

　　“我们希望这项工作可以在更广泛的背景下使用……帮助人类检查事实。更广泛地说，我们相信这项工作可以在网上带来更值得信赖的信息，”彼得罗尼说。

　　更多信息：Fabio Petroni 等人，利用 AI 提高维基百科的可验证性，Nature Machine Intelligence(2023)。

编辑：澜澜

免责声明：文章转载自网络。文章内容不代表本站观点，本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺，仅供读者参考，风险自己甄别并承担后果；如有侵权请及时联系本站，我们会及时删除处理！

图文推荐

资讯

开封第41届菊花文化节开幕诚邀四海宾朋来开

产业

阳东区红丰镇千亩澳洲坚果喜获丰收带动全镇

图文推荐

相关阅读

资讯

产业

新闻排行