防范 AI 最前线的 OpenAI,开发了一个会写假新闻的 AI 模型
作者:CQITer小编 时间:2019-02-18 21:47
「我开车去西雅图找一份新工作。我给车加好汽油,插入钥匙,然后让它跑起来。我想象着那一天会是什么样。一百年后的今天,那是 2045 年,我在中国贫困地区的一所学校当老师,教授中国历史和科学史。」
这个 AI 模型写的「新闻」更是真实到人类有理由恐慌。「一节装载受控核材料的火车车厢今天在 Cincinnati 被盗,下落不明。」还是仅仅依靠一句开头,GPT-2 便编写出了由 7 个段落组成的新闻,中间还引述了一些政府官员的言论。当然,具体官员和他们所说的话全是算法自己编造的。
GPT-2 是 OpenAI 最新发布的「AI 写手」算法模型,它可以完成阅读理解、常识推理、文字预测、文章总结等多种任务,专家认为,这款「AI 写手」的出现将「打开智能的阀门」。它的出现,让人兴奋,也让人恐惧。人类还无法确定它能做什么,在虚假信息泛滥互联网的当下,它也被视为威胁。因此,OpenAI 选择不公布完整的 AI 模型。
当地时间 2 月 14 日,非营利性人工智能研究公司 OpenAI 公布了「AI 写手」GPT-2。为了执行所谓的「语言建模」(language modeling)任务,作为 GPT 接班人的 GPT-2 被创造了出来。简单来说,它具有根据当前已有的单词预测接下来的文本,并进行补充的能力。

图片来源:OpenAI 官方博客
和之前已有的文本模型,GPT-2 有以下两方面的开创性优势:
一是它纳入的参数比之前更多。OpenAI 的研究总监 Dario Amodei 声称,GPT-2 是之前最先进的 AI 模型的 12 倍大,它的数据集(dataset)是后者是 15 倍大,同时,数据集的范围也更加广泛。据介绍,它是由包含了大约 1000 万篇文章的数据集训练而来。这些文本足足有 40GB,是 35000 部《白鲸》的体量。
二是它纳入的参数并不限于特有领域,它抓取了网络社区 Reddit 上那些投票数超过 3 次以上的链接,也就是说,由此训练而来的模型将比那些专为特定领域打造的模型更加「通用」,OpenAI 的研究人员表示,这个没有经过任何领域数据专门训练的模型甚至比后者表现得更好。
据 The Verge 报道,就荒诞的《回收利用为什么对世界有害?》为题,「GPT-2 写出了一篇有理有据的文章,」加利福尼亚实验室的工程副总裁 David Luan 惊喜道,「这是篇可以直接提交给 SAT(美国高考)并取得好成绩的东西。」
除了能写好「高考作文」,得益于「零度学习」(zero-shot)的设定,GPT-2 还能在无需使用相关数据集的前提下,在某些特定领域(如维基百科、新闻或书籍)训练其他语言模型。根据 OpenAI 给出的数据,GPT-2 在 Winograd Schema、LAMBADA 和其他语言建模任务中达到了当前最佳成绩。

图片来源:OpenAI 官方博客。注:在图中,(+) 表示该领域得分越高越好,(-) 表示得分越低越好。
此外,在知识问答、阅读理解、总结和翻译等语言任务上,GPT-2 也不需要使用特定任务的训练数据,它可以从原始文本开始学习,并在文本连贯性、流畅性取得不错表现。当然,这个模型现阶段还存在一些不足。比如,由于抓取的是网站上的文本,它在写新闻的时候,习惯在段落插入「ADVERTISEMENT」字样和广告内容。有时也会出现文本重复、建模失败以及不自然的主题切换等问题。
GPT-2 能做些什么?OpenAI 给出了一些应用方向。比如,它能用于开发 AI 写作助理、更强大的语音助手、提高不同语言之间无监督机器翻译(Unsupervised Machine Translation)的性能,甚至构建更好的语音识别系统。
OpenAI 研究人员 Jeff Wu 举例说,「我们也许可以用工具帮助作家寻找创意或者生成对话。或者,也许可以用工具检查语法错误,查看软件代码是否有漏洞。优化软件之后,未来也许还能为企业或者政府决策者提炼总结性文本。The Verge 报道称,像 GPT-2 这样的系统一旦成熟,对各行各业来说,都是福音。最寻常的,它们可以大大提高聊天机器人的交谈能力,帮助解决从客户投诉到医疗保健等领域的问题。
在虚假信息正在蔓延并威胁全球科技产业的背景下,一个擅长制造假新闻的「高材生」很难不被声讨。


