当前位置:首页 > 视频中心

科技湃|新闻业福音!开发出自动添加标签“机器人”

时间: 2024-03-05 09:57:34 |   作者: 视频中心

  若你常常在线发稿,那么一定很熟悉正式发稿前必须历经的繁琐过程——为文章添加关键词、标签。现在,《》研究与发展中心研发了一款可以自动添加文章标签的编辑工具,为记者编辑省了事儿。

  据美国媒体7月30日报道, 这款编辑工具就像办公软件自带的拼写检查一样,会在文字被录入电脑的同时给予标签建议。

  关键词与标签可以很好地辅助读者阅读与之相类似的文章,探索类似话题,或是为其提供灵感与新的发现。同时,为文章添加标签还能够在一定程度上帮助新闻制作人以一种全新的方式来收集选题。这也是《》选择创造“自动添加标签机器人”的原因之一。

  研发者旨在利用交互页面,探索机器学习与记者协同作业的可能性。据介绍,编辑器所运用的机器学习技术互动性很强,它会融入写作过程而非被动筛选关键词。此款编辑器可以承载巨额工作量,协助记者集中精力审稿与修改。

  据悉,《》的这款编辑器与汤森路透公司的Open Calais系统相似。两者皆可以从任何文本类型中提炼元数据。《》的编辑器特别的是,通过连接系统内部的语料库与一个人工神经网络(ANN, artificial neural network)来阅读和分析文本。

  当一名记者利用编辑器写作时,他/她所敲下的每一个单词或语句都会传回人工神经网络,经过处理后,被评注的短语在文中则会被突出标示。当记者完成写作时,他们只需阅读重点标示部分,再进行简单的检查与删减即可。

  除此之外,《》研发的编辑器还能够给大家提供文字列表供记者做必要的人工判断。例如,对引用来源的鉴定与事实的确认等。

  “起先,我们着眼于在文章中进行少量标签。但我们也相信这个技术有更多的应用可能。它可以服务于简历修改或是会议发表。”《》研究与发展中心创意总监亚力西斯·劳埃德(Alexis Lloyd)表示。

  研究与发展实验室的迈克·达沃(Mike Dewar)表示,这款自动标签系统最显著的特性是,意在唤醒并展示一些记者脑中关于新闻不同角度的思考,需要人和机器互补并通力合作。人类可以很好地掌握语言,理解文本并找出文字间的联系,而机器则有极其强大的计算能力和完美记忆力。编辑器的人工神经网络可以将文字与《》数据库中每篇文章词句的索引之间建立连接。

  为文章添加标签对于《》来说并不是一件轻松的工作。《》新闻标签系统的历史可以追溯到100年前。正是这些元数据使得《》可以辟出专门的“时报话题集”板块。

  在编辑器被开发之前,添加标签的工作是纯手工的,它依赖于记者为每个故事提供上下文的语境。在某些文章中,手动添加标签的过程可能会发生滞后。《》的创新报告数据显示,在编辑器开发前的元数据系统内部有很多空隙,这是一个亟待解决的战略弱点。

  “大家常常忘了元数据。”《金融时报》科技主管约翰·多诺万(John O’Donovan)表示,“大家都畅想着文字可以被随意排列,但忘了在描述内容时语句的构建是有序的。当你缺少元数据的时候,你所有的财富都失去了价值。因为缺少线索去挖掘你的财富。”

  劳埃德表示,这款编辑器的作用不单单是让整个元数据的处理过程变得更有效率,它也使得整个文字编辑过程变得颗粒化。使用编辑器就像用梳子以单词为基本单位梳理文章,经过“梳理”的人名、地点、公司以及事件等等信息都会变得更加丰富。而更丰富的信息可以为许多潜在产品打开大门。“有了这些元数据作为基础,许多新平台都能借助它诞生并蒸蒸日上。”她说,“这是我们关于新闻业未来形式的一些畅想。”

  据悉,这款编辑器耗费了整个研究室四个月的时间。但目前《》的记者和编辑们还不可以使用此款编辑器。“与许多产品原型一样,它的研发是为了探索更多可能性。”劳埃德表示,“它不是一个一经开发就会被全面投入新闻制作中去的产物。”

  尽管目前编辑器可能还不会走出《》的研究与发展实验室,但劳埃德表示,这次开发为新闻从业者带来的启示是:可以多利用自动化或是机器学习技术让记者的工作负担减轻。

  目前,机器人技术造福新闻行业的消息屡见不鲜。今年三月,就曾表示计划用自动播报服务来增加大学体育新闻的覆盖率。劳埃德也多次尝试了人机合作的实验。当然,劳埃德表示新闻从业者不必为行业内正慢慢地减少的工作机会而感到恐慌。“我们正在思索自动化或是计算机化将为新闻行业注入怎样强大的力量。”劳埃德说。

相关视频MORE +