开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

FrankSun · 2019年12月26日

问一道题:NO.PZ2018101901000003

问题如下:

Which of the following statements about Machine Learning is most likely correct?

选项:

A.

The underfitting in Machine Learning which treats true parameters as if they are noise will make a too complex model.

B.

Machine Learning doesn’t need human judgement.

C.

Machine Learning is sometimes similar to "black box" approaches.

解释:

C is correct.

考点:Machine Learning.

解析:A选项说,机器学习中低度拟合这个现象,是指在并没有学习完全的情况下把真实的特征当成了noise,这样会导致模型太复杂。这个说法是错误的。其中,前半句是对的,但低度拟合并不是导致模型变得复杂,而是使模型太过于简单化,没有抓住所有特点。B选项说,机器学习不再需要人类的判断,这个说法也是错误的。我们在机器学习里面还是需要人类工程师的判断,比如算法的选择等。C选项说,机器学习有时候类似于黑盒子的一个方法,这个描述是正确的。它并没有一个显性的编程,我们在使用中只要调用相应的模块即可。所以本题选择C选项。<\p>

菲菲老师,这道题我不是很明白,能够解释一下吗?谢谢

2 个答案
已采纳答案

星星_品职助教 · 2019年12月26日

同学你好,

A选项underfitting的意思是应该有的特征没抓住,导致模型过于简单,所以才“欠”拟合。例如一个现象应该用10个变量来解释,现在只用了5个,模型太简单了。少了的那5个变量的特征就没抓住。导致模型对于真实情况的拟合不足。作为对比,overfitting会导致过于复杂的模型。所以A选项不正确。

B选项说的太绝对了。机器学习还是需要人参与的,举个例子。如果项目的目的是分类,可能会有多种算法都可以达到分类的目的,那么具体选用哪种算法就需要人来选择。此外一些数据需要事先设定,以分类树的算法为例,树一共要有几层?每层的关键值怎么取?都是需要在计算之前人工事先设定的。但如果B选项说的是机器学习中的非监督式学习不需要人工来添加标签就对了。

C选项中的“black box”可以理解为只是知道自己给计算机输入了什么,但是计算机如何得到的结果的这整个过程我们是不知道的。就类似计算机是在一个你看不到里层的黑盒子里面完成了整个过程。“black box”是机器学习很多复杂算法的缺点之一。

举个更直接的例子,例如计算器上第三排年金的五个键。即使是没有学习过年金原理的使用者光告诉他们如何去按键也能算出答案,但如何得到最终答案的过程对于没学过年金的人来说就是一个“黑盒子”。所以C选项正确。

这三个选项所体现的知识点到二级还会深化学习,加油




FrankSun · 2019年12月27日

谢谢老师,但是这个noise具体指什么呢

星星_品职助教 · 2019年12月27日

字数比较多,新起条回复哈

星星_品职助教 · 2019年12月27日

同学你好,

回复一下追问的问题。“noise”或者中文的“噪声项”指的是局部特征。也就是所选择的样本数据集里的数据的自身特征,这个特征是不能推广到其他数据集里的。如果机器学习抓住了这个局部特征,就会导致预测出错。

还是以上课天鹅的那个例子为例。例如有翅膀,会游泳,有细长的脖子这种就是整体特征,是适合于所有的天鹅的,也是应该被模型所包含进去的,可以进行有效预测的(如果这些特征没包含进去,就是underfitting)。但如果样本数据集里的天鹅图片都是白色天鹅,这时候这个“白色”就是这个样本数据集里的自身或者局部特征。如果样本数据集里恰好所有的天鹅都是白色,那么这个特征就有可能被模型错误的抓住了,这个时候用这个模型去预测一只鸟是不是天鹅就会出错(因为会排除黑天鹅)。这同时也是overfitting的问题,因为特征抓的太多,模型过于复杂,反而抓住了不应该去抓住的局部特征,导致预测出错。