我查了下机器翻译专利的申请量,于是有了些思考
作者:网友投稿 时间:2018-10-05 09:02
近日,机器翻译受到格外关注,很多关心中译语通的朋友纷纷问询机器翻译的未来到底会是什么样子?一时间被问得也觉得需要好好思考下。于是默默地、很是认真地梳理了2015年以来中译语通在机器翻译及其核心组件语料库方向申请受理的专利情况,也想借以认真判断一下和国内巨头们的差距到底有多大。

为了比较准确的分析自家研发水平到底咋样,所以还是比较认真的设定了一些标准。比如,近年来机器翻译发展尤为迅速,特别是2016年神经网络算法的出现使得机器翻译技术有了突破性发展,所以选取了时间区间2015年至今,在专利分类中G06F17(特定功能的数字计算设备或数据处理设备或数据处理方法)进行比对。此外,在专利检索引擎我们使用了我们自家的JoveEye科技大数据平台()和合享Incopat专利检索系统()交叉验证,避免俺们自家的系统搞区别对待。
首先,为了避免遗漏,我使用最宽的条件进行检索,将“翻译”作为关键词在专利分类计算机领域进行检索,得到申请专利数量排名前10的公司列表如下:

然后我们再将“机器翻译”、“文本翻译”作为关键词进行检索,相关专利申请数量排名前五的公司如下:

还是为了避免遗漏,我们又将“语音翻译”、“图片翻译”、“图像翻译”、“视频翻译”、“字幕翻译”、“辅助翻译”、“翻译系统”、“文件翻译”、“网页翻译”作为关键词进行检索,相关专利申请数量排名前五的公司如下:

然后,我把“机器翻译”、“文本翻译”、“语音翻译”、“图片翻译”、“图像翻译”、“视频翻译”一起合并作为关键词检索分析,专利申请数量排名前五的公司如下:

至此,在机器翻译领域国内的大体情况已大概能知晓。但为了更加的严谨,我对这五家公司的专利类型做了些分析。因为在搜索过程中,我发现有些专利是指的机器翻译应用装置等相关的申请。所以,想看看真正机器翻译核心技术研发的专利情况如何。





考虑到搜狗和网易有道在业内的知名度,我也对他们的相关专利进行了了解,按照我第一步最宽的条件以“翻译”为关键词进行检索,结果是搜狗拥有18个,网易有道有5个。

在最开始我提到过,神经网络算法从2016年开始推动了机器翻译技术的发展,各家也当然会加强此算法的专利研究。我特别看了一下从2015年到2018年的情况,百度拥有8个、中译语通拥有7个、腾讯拥有2个、科大讯飞拥有2个,而且大部分发力阶段都从2017年开始。
如果要全面分析机器翻译技术的发展,光在国内肯定是不够的。我又继续以机器翻译、文本翻译为关键词对于国外专利情况进行了检索和分析,排名前五的公司不出意外的依然是耳熟能详的国际大品牌:




