钉钉杯大数据竞赛中机器学习与深度学习的区别解析_华体育app官网

2024-06-09 华体育app官网

翻译过来就是：“一个电脑程序要达成目标（T），如果电脑获取的关于T的经验（E）越多就表现（P）得越好，那么我们就可以说这个程序‘学习’了关于T的经验。”

简单来说，就是解释什么叫“机器的学习”，如果输入的经验越多表现的越好，这就叫“学习”嘛。

这个so easy，我也不想多解释了。我们高中都做过这样的题目，给你一堆点，你做出一条直线尽可能去拟合样本点，那这个直线就是你“学习”出来的，然后就可以用这个直线.风暴预测系统：

我们首先浏览所有的历史风暴数据，从这些大量的数据中学习出某些“模式”，这些“模式”包含了具体的哪些条件可以导致风暴。

比如我们也许能够最终靠学习历史数据发现：温度超过40度，湿度在80-100之间，就易发生风暴。种种类似的模式。

这里注意了！“温度”、“湿度”等等指标，就是机器学习中的“特征”，而这些特征都是人工设置好的！就是说，我们在做这样一个预测系统的时候，首先由专家通过一系列分析哪些“特征”是重要的，然后机器就通过一系列分析历史数据中的这些特征的数据，来找到相应的模式，也就是怎样的特征的组合会导致怎样的结果。

我试着翻译一下：深度学习是一种特殊的机器学习，它能够得到高性能也十分灵活。它可以用概念组成的网状层级结构来表示这样一个世界，每一个概念更简单的概念相连，抽象的概念通过没那么抽象的概念计算。（有没有大佬帮忙指正一下？）

我们从一个简单的例子来看看我们认知层面上是如何区分物体的。比如我们要区分下面的形状，那个是圆的那个是方的：

我们的眼睛第一件要做的事情，就是看看这个形状有没有4条边。如果有的线条边是不是连在一起，是不是等长的，是不是相连的互相垂直。如果满足上面这些条件，那么我们大家可以判断，是一个正方形。

从上面的过程能够准确的看出，我们把一个复杂的抽象的问题（形状），分解成简单的、不那么抽象的任务（边、角、长度...）。深度学习从很大程度上就是做这个工作，把复杂任务层层分解成一个个小任务。

如果是传统机器学习的方法，我们会首先定义一些特征，如有没有胡须，耳朵、鼻子、嘴巴的模样等等。总之，我们第一步要确定相应的“面部特征”作为我们的机器学习的特征，以此来对我们的对象进行分类识别。

而现在，深度学习的方法则更进一步。深度学习自动地找出这个分类问题所需要的重要特征！而传统机器学习则要求我们人工地给出特征！

2然后根据上一步找出的很多小元素（边、角等）构建层级网络，找出它们之间的各种组合；

这里我没找到猫和狗的神经网络图片，倒是看到人像识别的一个示意图，觉得挺好的：

能够正常的看到4层，输入的是Raw Data，就是原始数据，这个机器没法理解。于是，深度学习首先尽可能找到与这个头像相关的各种边，这些边就是底层的特征（Low-level features），这就是上面写的第一步；然后下一步，对这些底层特征进行组合，就可以看到有鼻子、眼睛、耳朵等等，它们就是中间层特征（Mid-level features），这就是上面写的第二步；最后，我们队鼻子眼睛耳朵等进行组合，就可以组成各种各样的头像了，也就是高层特征（High-level features）这样一个时间段就可以识别出或者分类出各种人的头像了。

上面我们大概了解了机器学习和深度学习的工作原理，下面我们从几个重要的方面来对比两种技术。

可以发现，深度学习适合处理大数据，而数据量比较小的时候，用传统机器学习方法也许更合适。

深度学习十分地依赖于高端的硬件设施，因为计算量实在太大了！深度学习中涉及很多的矩阵运算，因此很多深度学习都要求有GPU参与运算，因为GPU就是专门为矩阵运算而设计的。相反，普通的机器学习随便给一台破电脑就可以跑。

特征工程就是前面的案例里面讲过的，我们在训练一个模型的时候，需要首先确定有哪些特征。

在机器学习方法中，几乎所有的特征都一定要通过行业专家在确定，然后手工就特征进行编码。

然而深度学习算法试图自己从数据中学习特征。这也是深度学习十分引人注目的一点，毕竟特征工程是一项十分繁琐、耗费很多人力物力的工作，深度学习的出现大幅度减少了发现特征的成本。

在解决问题时，传统机器学习算法通常先把问题分成几块，一个个地解决好之后，再重新组合起来。但是深度学习则是一次性地、端到端地解决。如下面这个物体识别的例子：

如果任务是要识别出图片上有哪些物体，找出它们的位置。那么传统机器学习的做法是把问题分为两步：发现物体和识别物体。首先，我们有几个物体边缘的盒型检测算法，把所有可能的物体都框出来。然后，再使用物体识别算法，例如SVM在识别这些物体中分别是什么。

但是深度学习不同，给它一张图，它直接给出把对应的物体识别出来，同时还能标明对应物体的名字。这样就能做到实时的物体识别。例如YOLO net就可以在视频中实时识别：

深度学习需要花大量的时间来训练，因为有太多的参数需要去学习。顶级的深度学习算法ResNet需要花两周的时间训练。但是机器学习一般几秒钟最多几小时就可以训练好。

但是深度学习花费这么大力气训练处模型必然不会白费力气的，优势就在于它模型一旦训练好，在预测任务上面就运行很快。这才能做到我们上面看到的视频中实时物体检测。

最后一点，也是深度学习一个缺点。其实也说不上是缺点吧，那就是深度学习很多时候我们难以理解。一个深层的神经网络，每一层都代表一个特征，而层数多了，我们也许根本就不明白他们代表的啥特征，我们就没法把训练出来的模型用于对预测任务进行解释。例如，我们用深度学习方法来批改论文，也许我们训练出来的模型对论文评分都十分的准确，但是我们没办法理解模型到底是啥规则，这样的话，那些拿了低分的同学找你质问“凭啥我的分这么低啊？！”，你也哑口无言····因为深度学习模型太复杂，内部的规则很难理解。

但是机器学习不一样，比如决策树算法，就可以明确地把规则给你列出来，每一个规则，每一个特征，你都可以理解。

但是这不是深度学习的错，只能说它太牛逼了，人类还不够聪明，理解不了深度学习的内部的特征。

以上就是有关于机器学习和深度学习的联系和区别了。首先说说感受吧，感觉很多国外的文章，尤其是这样的类似科普文章写的真心棒！很好理解，而且解释的非常详细，这是很多国内博客所不能比的。所以建议我们大家有问题能多搜搜国外的文章读一读，而且其实英文也用的很简单。

7月份接下来数模人人都在打的由阿里巴巴钉钉举办的钉钉杯大数据建模挑战赛，

，赛题主要包含数据挖掘和数据分析两大类，数模国赛与美赛中C题每年选题占比最大的大数据题型，涉及建模中常用到的数据预处理、神经网络、机器学习和深度学习算法，决策树等等，都是和大数据相关知识紧密相连的，作为国赛前大型热身练手的绝佳机会。报名网址：

国乒海外军团四大女将:田志希身材丰腴还开放,张本美和颜值最高

OpenAI泄密者公布165页文件：2027年实现AGI、计算集群将耗资千亿美元

5-1！16岁天才助攻双响巴萨金童梅开二度西班牙2场10球剑指夺冠

女子跟在睡觉的宝宝说要吃饭结果宝宝意识慢慢请醒网友:快起来啦还有18年就高考了

[上一篇] 【醉翁之艺】围术期神经功能保护系列之四：使用机器学习预测ICU患者的谵妄发生

[下一篇] 拟定规矩与履行纪律：买卖成功的两层柱石