防范 AI 最前线的 OpenAI，开发了一个会写假新闻的 AI 模型

作者：CQITer小编时间：2019-02-18 21:47

字号

「四月间，天气寒冷晴朗，钟敲了十三下。」当人类把《一九八四》这个著名的开头输入到 Open AI 刚展示的语言算法模型 GPT-2 后，这个包含了 15 亿个参数（parameters）的模型识别出了这种模糊的未来派小说基调，开始了创作。

「我开车去西雅图找一份新工作。我给车加好汽油，插入钥匙，然后让它跑起来。我想象着那一天会是什么样。一百年后的今天，那是 2045 年，我在中国贫困地区的一所学校当老师，教授中国历史和科学史。」

这个 AI 模型写的「新闻」更是真实到人类有理由恐慌。「一节装载受控核材料的火车车厢今天在 Cincinnati 被盗，下落不明。」还是仅仅依靠一句开头，GPT-2 便编写出了由 7 个段落组成的新闻，中间还引述了一些政府官员的言论。当然，具体官员和他们所说的话全是算法自己编造的。

GPT-2 是 OpenAI 最新发布的「AI 写手」算法模型，它可以完成阅读理解、常识推理、文字预测、文章总结等多种任务，专家认为，这款「AI 写手」的出现将「打开智能的阀门」。它的出现，让人兴奋，也让人恐惧。人类还无法确定它能做什么，在虚假信息泛滥互联网的当下，它也被视为威胁。因此，OpenAI 选择不公布完整的 AI 模型。

AI 写手

当地时间 2 月 14 日，非营利性人工智能研究公司 OpenAI 公布了「AI 写手」GPT-2。为了执行所谓的「语言建模」（language modeling）任务，作为 GPT 接班人的 GPT-2 被创造了出来。简单来说，它具有根据当前已有的单词预测接下来的文本，并进行补充的能力。

防范 AI 最前线的 OpenAI，开发了一个会写假新闻的 AI 模型

图片来源：OpenAI 官方博客

和之前已有的文本模型，GPT-2 有以下两方面的开创性优势：

一是它纳入的参数比之前更多。OpenAI 的研究总监 Dario Amodei 声称，GPT-2 是之前最先进的 AI 模型的 12 倍大，它的数据集（dataset）是后者是 15 倍大，同时，数据集的范围也更加广泛。据介绍，它是由包含了大约 1000 万篇文章的数据集训练而来。这些文本足足有 40GB，是 35000 部《白鲸》的体量。

二是它纳入的参数并不限于特有领域，它抓取了网络社区 Reddit 上那些投票数超过 3 次以上的链接，也就是说，由此训练而来的模型将比那些专为特定领域打造的模型更加「通用」，OpenAI 的研究人员表示，这个没有经过任何领域数据专门训练的模型甚至比后者表现得更好。

据 The Verge 报道，就荒诞的《回收利用为什么对世界有害？》为题，「GPT-2 写出了一篇有理有据的文章，」加利福尼亚实验室的工程副总裁 David Luan 惊喜道，「这是篇可以直接提交给 SAT（美国高考）并取得好成绩的东西。」

自己插广告的作者

除了能写好「高考作文」，得益于「零度学习」（zero-shot）的设定，GPT-2 还能在无需使用相关数据集的前提下，在某些特定领域（如维基百科、新闻或书籍）训练其他语言模型。根据 OpenAI 给出的数据，GPT-2 在 Winograd Schema、LAMBADA 和其他语言建模任务中达到了当前最佳成绩。

防范 AI 最前线的 OpenAI，开发了一个会写假新闻的 AI 模型

图片来源：OpenAI 官方博客。注：在图中，(+) 表示该领域得分越高越好，(-) 表示得分越低越好。

此外，在知识问答、阅读理解、总结和翻译等语言任务上，GPT-2 也不需要使用特定任务的训练数据，它可以从原始文本开始学习，并在文本连贯性、流畅性取得不错表现。当然，这个模型现阶段还存在一些不足。比如，由于抓取的是网站上的文本，它在写新闻的时候，习惯在段落插入「ADVERTISEMENT」字样和广告内容。有时也会出现文本重复、建模失败以及不自然的主题切换等问题。

GPT-2 能做些什么？OpenAI 给出了一些应用方向。比如，它能用于开发 AI 写作助理、更强大的语音助手、提高不同语言之间无监督机器翻译（Unsupervised Machine Translation）的性能，甚至构建更好的语音识别系统。

OpenAI 研究人员 Jeff Wu 举例说，「我们也许可以用工具帮助作家寻找创意或者生成对话。或者，也许可以用工具检查语法错误，查看软件代码是否有漏洞。优化软件之后，未来也许还能为企业或者政府决策者提炼总结性文本。The Verge 报道称，像 GPT-2 这样的系统一旦成熟，对各行各业来说，都是福音。最寻常的，它们可以大大提高聊天机器人的交谈能力，帮助解决从客户投诉到医疗保健等领域的问题。

「做好准备」

在虚假信息正在蔓延并威胁全球科技产业的背景下，一个擅长制造假新闻的「高材生」很难不被声讨。

责任编辑：CQITer新闻报料：400-888-8888 本站原创，未经授权不得转载

关键词 >>OpenAI GPT-2 AI

继续阅读

猫咪的诱惑，圣诞夜玩出不一样的高度｜精分剧场

HoloLens 2 的出场没有 Minecraft，它更强大也更「企业」了

3.8 开抢｜FIIL无线耳机、10000张优惠券、惊喜福利免费送，来开启未来品质生活！

热新闻

7天 30天 1年