Python深度学习基础 机器学习
人工智能(AI)是使计算机能够模仿人类认知行为或智能的任何代码、算法或技术。机器学习(ML)是人工智能的一个子集,它使用统计方法使机器能够学习并随着经验的增加而提高。深度学习是机器学习的一个子集,它使多层神经网络的计算变得可行。机器学习被视为浅层学习,而深度学习则被视为具有抽象性的分层学习。
机器学习涉及一系列广泛的概念。这些概念列举如下
- 有监督的
- 无监督的
- 强化学习
- 线性回归
- 成本函数
- 过度拟合
- 欠拟合
- 超参数,等等。
在监督学习中,我们学习从标记的数据中预测数值。一种有助于此的ML技术是分类,目标值是离散值;例如,猫和狗。机器学习中另一种可能有帮助的技术是回归。回归在目标值上发挥作用。目标值是连续值;例如,股市数据可以用回归来分析。
在无监督学习中,我们从没有标记或结构化的输入数据中进行推断。如果我们有一百万份医疗记录,而我们必须对其进行理解,找到潜在的结构、异常值或检测异常情况,我们使用聚类技术将数据划分为广泛的聚类。
数据集被划分为训练集、测试集、验证集等。
2012年的一项突破使深度学习的概念变得突出。一个算法使用2个GPU和大数据等最新技术成功地将100万张图片分为1000个类别。
深度学习和传统机器学习的关系
传统机器学习模型中遇到的主要挑战之一是一个叫做特征提取的过程。程序员需要有针对性地告诉计算机需要寻找的特征。这些特征将有助于做出决策。
将原始数据输入到算法中很少有效果,所以特征提取是传统机器学习工作流程中的一个关键部分。
这给程序员带来了巨大的责任,而算法的效率在很大程度上依赖于程序员的创造性。对于复杂的问题,如物体识别或手写识别,这是一个巨大的问题。
深度学习,具有学习多层表征的能力,是少数帮助我们进行自动特征提取的方法之一。低层可以被认为是在进行自动特征提取,几乎不需要程序员的指导。