19 岁的科大讯飞,想用 AI 打开新世界的大门
作者:媒体转发 时间:2018-07-23 21:22
从智能语音技术起步,开发智能语音平台,建立中文语音交互技术标准,科大讯飞在人工智能领域逐渐成为领军者,而伴随在消费端的产品持续输出,讯飞输入法、讯飞翻译机等则让越来越多人看到了中国科技企业在人工智能领域的跃进。
今年 5 月,曾任职微软亚洲研究院首席研究员、副院长、微软公司合伙人的李世鹏加入科大讯飞,担任科大讯飞副总裁、讯飞 AI 研究院联席院长,在业内引起不小轰动。
李世鹏于 1995 年正式进入微软,2015 年出任硬蛋科技 CTO,其主要研究领域是信号与图像处理、图像与视频编码、应用层网络技术、数字版权管理及无线通信与网络等,这些领域与人工智能技术存在很多分叉,伴随李世鹏的加入,科大讯飞的未来之路无疑引起外界更多好奇。
7 月 21 日,在极客公园 Rebuild 2018 科技商业峰会现场,李世鹏教授通过演讲和我们分享了科大讯飞将如今通过人工智能技术进一步影响不同行业,以及科大讯飞的人工智能未来会迈向何方。
以下内容来自李世鹏教授在 Rebuild 2018 科技商业峰会的演讲分享(极客公园经过编辑整理,略有删节):
从感知智迈向认知智能我们知道人工智能有两个途径,一是现在大家习以为常,通过深度学习和大数据的方式来研究人工智能。这种方法现在是 99% 以上的公司都在做的,确实在很多领域能帮助我们提高生产效率。
但这个方法最大的瓶颈就是数据,能不能有更聪明的人工智能最后取决于能不能更有效的获得一些被标注的数据。如果你用更多的数据就能让人工智能做更多的事情。如果大家到深圳或者其他传统的生产线去看,很多生产线改成了数据标注线,很多工人在那儿标注数据。从另外一个层面反映现在大部分人工智能还是一个「人工」。

另外一条路,就是对人脑的认知。通过对人脑的研究去找到一些新方法。现在有一个理论,就是通过小数据构建大模型。假如你给某人看一个杯子,他看几次就知道,下次再看到尽管不是同样形状的但这还是一个杯子。
因为人的认知不单是形状,还从功能上去认识这个杯子。怎样在人脑认知种发现人工智能一些新的认识?这是很好的研究课题,也是科大讯飞联合很多世界顶尖学校比如 MIT 等在做的事情。
现在大部分人工智能还停留在感知智能阶段。感知智能包括语音识别,就包括翻译、人脸识别等,但真正对内容的理解没有那么深。而更高一级,认知智能是更高层次的对内容的认识,这是真正人工智能的必经之路

认知就是尝试理解,在 2017 年 10 月份科大讯飞参加了斯坦福大学发起的阅读理解测试,是当时的世界纪录保持者,经过这段时间进展,很多其他研究单位也赶上来了,但是我们现在还是世界上三个在阅读理解能力超过人的阅读能力的公司之一。
第二,用机器人或人工智能来对论文、作文进行评估。我们目前对中文的作文和英文的作文,都进行了很有效的评估。这一系统已经在江苏大学的入学考试中投入使用。除了更准确之外,它还比人更有一致性,这一点很重要。
过去我们通过图灵测试测试机器的认知程度,现在很多机器都可以达到这样的水平,所以就有了改进版的测试方式 Winograd Schema Challenge,它从一些常识性的知识推理来看机器是否达到了认知。

比如说「爸爸没法举起儿子,因为他很重」这个问题,这里面在问谁重?我们人回答很简单,就是通过直觉肯定儿子重,所以爸爸举不起来。但机器来回答这个问题可能就没有那么容易了,因为他没有这个常识和直觉。常识性问题,是人工智能领域研究的热门课题。如果这个方面有突破的话,我相信人的认知方面就有很大的进展。
从语音向综合场景扩展我们去年展示了语音合成声音的成果,今年又有一些进展。我们可以以任何人的口气讲任何的话,甚至是任何的语音。这听上去有点可怕,但是我们可以为人做更好的服务。比如你可以用父母的声音给小孩讲故事,或者用已经不在的老人的声音给孩子讲话,这都是有价值的应用。


