2019年,TensorFlow被拉下马了吗?
作者:网友投稿 时间:2019-04-09 16:56
2018年9月,作者曾就需求、使用和受欢迎程度三方面比较了所有主要的深度学习框架,其中TensorFlow是无可争议的重量级冠军,PyTorch是赢得大量口碑的后起之秀。
过去的六个月,领先的深度学习框架又有什么变化呢?

为回答这一问题,作者不仅查看了Indeed、Monster、LinkedIn和SimplyHired上的职位列表数量,而且评估了谷歌搜索量、GitHub动态、Medium和ArXiv文章以及Quora主题关注者的变化。总的说来,这些资源全面描述了需求、使用和兴趣三方面的增长。
集成和更新
从工具本身来说,近来TensorFlow和PyTorch框架都出现了几项重大发展。
2018年10月,PyTorch v1.0预发布,同时fastai v1.0发布。二者的发布是标志框架成熟的重大里程碑。
2019年3月4日,TensorFlow 2.0 alpha版发布,增加了一些新功能,改善了用户体验。TensorFlow 2.0 alpha版更紧密地集成了Keras,作为其高阶API。
方法论
Keras和fastai与TensorFlow和PyTorch紧密集成在一起,因而本文在比较时将二者包含在内。Keras和fastai还为评估TensorFlow和PyTorch提供了可以参考的评估范围。

作者在本文中不会探究其他深度学习框架。作者希望收到反馈,证明Caffe、Theano、MXNet、CNTK、PaddlePaddle、DeepLearning4J或Chainer值得讨论。虽然这些深度学习框架各有其优点,但就其增长轨迹而言,似乎不太可能接近TensorFlow或PyTorch。这些框架也未能与TensorFlow或PyTorch紧密耦合。
搜索日期为2019年3月20日-21日。源数据在谷歌表格中。
让我们看一下各类深度学习框架的结果吧!
在线职位列表变化
为了确认哪种深度学习库在当今求职市场中受欢迎,作者搜索了Indeed、LinkedIn、Monster和SimplyHired中的职位列表。
作者首先搜索术语「机器学习」,其后为框架/库名。所以,作者以「机器学习 TensorFlow」评估TensorFlow。基于历史比较的原因,作者采用了这种评估方法。不包含「机器学习」的搜索没有产生明显不同的结果。搜索区域是美国。
作者从2019年3月的职位列表数量中减去六个月前的数量,结果如下:

TensorFlow的职位列表增长略高于PyTorch。Keras的职位列表也出现了增长——约是TensorFlow增长的一半。FastAI依然没有出现在任何职位列表中。
需要注意的是,除了LinkedIn,PyTorch在所有求职网站上的增加职位列表数量都超过了TensorFlow。还需要注意的是,就绝对项而言,TensorFlow出现在职位列表中的数量几乎是PyTorch或Keras三倍。
平均谷歌搜索活动的变化
最大搜索引擎中的网页搜索是衡量受欢迎程度的一个标准。作者查看了过去一年里Google Trends的搜索历史。作者还搜索了全世界对「机器学习」和「人工智能」分类的兴趣。谷歌没有给出绝对搜索数量,但提供了相对数据。
作者将过去六个月与在之前六个月的搜索兴趣平均分进行比较。

在过去六个月,TensorFlow的相对搜索数量减少,而PyTorch的相对搜索数量增加。
下图来自谷歌,直接显示了过去一年的搜索兴趣。

TensorFlow显示为蓝色,Keras黄色,PyTorch红色,fastAI绿色。
新Medium文章
Medium是数据科学文章和教程的流行阵地。作者希望读者可以喜欢!😃
过去六个月里,作者使用Medium.com的谷歌站点搜索,结果发现TensorFlow和Keras发表的文章数量相当,而PyTorch相对较少。

作为高阶API,Keras和fastAI非常受深度学习新从业人员的欢迎。Medium中有很多教程介绍了这些框架的使用方式。
最新arXiv文章
作为最流行的预印版论文发布平台,大多数学术类深度学习文章在arXiv上发表。作者根据过去六个月的谷歌站点搜索结果来搜索提及每种框架的最新文章。

TensorFlow有接近3000篇文章,在这方面占有很大优势,大多数最新AI论文使用的是TensorFlow框架(说好的学界爱用PyTorch呢?)。
最新GitHub动态
GitHub上的最新动态是框架受欢迎程度的另一指标。作者在下图列出了star、fork、watcher和contributor的数量。

在每种类别中,TensorFlow上的GitHub动态最多。但是,PyTorch在watcher和contributor的增长方面与TensorFlow相当接近。此外,Fastai上也有大量的新增contributor。
毫无疑问,Keras的一些贡献者会在TensorFlow库中工作。值得注意的是,TensorFlow和Keras都是由谷歌人牵头的开源产品。
Quora新关注者
作者将新的Quora主题关注者添加进参考标准中——这是一个以前没有数据的新分类。

过去六月里,TensorFlow增加了最多的新话题关注者。PyTorch和Keras相差甚多。
作者在添加所有数据后将其合并成一个指标。
增长分数过程
作者创建了增长评分机制:
所有特征的数值范围为0-1。
汇总了「线上职位列表」和「GitHub动态」子分类。
基于下列百分比的加权分类。

可理解性乘以加权分数100。
将每个框架的类别分数汇总为单个增长分数。



