2019年必知的10大顶级Python库
作者:CQITer小编 时间:2019-07-31 21:35
作为数据科学和机器学习相关的研究和开发人员,大家每天都要用到 python。在本文中,我们将讨论一些 python 中的顶级库,开发人员可以使用这些库在现有的应用程序中应用、清洗和表示数据,并进行机器学习研究。
我们将讨论以下 10 个库:
TensorFlow
Scikit-Learn
Numpy
Keras
PyTorch
LightGBM
Eli5
SciPy
Theano
Pandas

简介
python 是最流行和使用最广泛的编程语言之一,它已经取代了业界许多编程语言。
python 在开发人员中流行的原因有很多。然而,最重要的一点是它有大量的库供用户使用。
python 的简单性吸引了许多开发人员为机器学习创建新的库。由于有大量的库,python 在机器学习专家中变得非常流行。
所以,这里要介绍的第一个库是 TensorFlow。
1.TensorFlow

什么是 TensorFlow?
如果你目前正在使用 python 进行机器学习项目,那么你可能听说过这一个流行的开源库,那就是 TensorFlow。
这个库是由 Google 与 Brain Team 合作开发的,几乎每一个 Google 的机器学习应用程序都用到了 TensorFlow。
TensorFlow 就像一个计算库,用于编写涉及大量 tensor 操作的新算法。由于神经网络可以很容易地表示为计算图,因此它们可以使用 TensorFlow 作为 tensor 的一系列操作来实现。另外,tensor 是表示数据的 n 维矩阵。
TensorFlow 的特征
1.快速响应的结构
使用 TensorFlow,我们可以很容易地可视化图的每个部分,这在使用 Numpy 或 SciKit 时是做不到的。
2.灵活
TensorFlow 的一个非常重要的特性是,它的操作非常灵活。这意味着它具有模块性,可以让你把希望独立出来的部分分出来
3.容易训练
对于分布式计算来说,它很容易在 CPU 和 GPU 上训练。
4.并行神经网络训练
TensorFlow 提供了管道流,从这个意义上说,你可以训练多个神经网络和多个 GPU,这使得模型在大型系统上非常有效。
5.大型社区
不用说,它是由 Google 开发的,已经有一个庞大的软件工程师团队在不断地改进稳定性。
6.开源
这个机器学习库最好的一个特点是,它是开源的,任何人只要有连接互联网就可以使用它。
TensorFlow 被用在哪里?
你每天都在使用 TensorFlow,你使用的 Google Voice Search 或 Google Photos 等应用程序都是使用这个库开发的。
在 TensorFlow 创建的所有库都是用 C 和 C++编写的,但是,它有一个复杂的前端,是用 python 实现的。你的 python 代码将被编译,然后在使用 C 和 C++构建的 TensorFlow 分布式执行引擎上执行。
实际上,TensorFlow 的应用是无限的,这就是它美妙的地方。
2.Scikit-Learn

什么是 Scikit-Learn?
它是一个与 NumPy 和 SciPy 相关联的 python 库。它被认为是处理复杂数据的最佳库之一。
在这个库中进行了许多修改。其中一个修改是交叉验证特性,它提供了使用多个度量的能力。许多训练方法,如物流回归和最邻近算法,都没有得到什么改善。
Scikit-Learn 的特性
交叉验证:有多种方法可以检查不可见数据上受监督模型的准确性。
无监督学习算法:同样,在产品中有大量的算法——从聚类、因子分析、主成分分析到无监督神经网络
特征提取:用于从图像和文本中提取特征(例如一段文字)
Scikit Learn 被用在哪里?
它包含许多实现标准机器学习和数据挖掘任务的算法,如降维、分类、回归、聚类和模型选择。
3.Numpy


