开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

Nimo. · 2024年02月27日

B为什么不对

NO.PZ2022123001000163

问题如下:

Which of the following errors would most likely be a result of overfitting a machine learning model?

选项:

A.

Inability to recognize relationships within the training data

B.

A predictive model that treats true parameters as if they are noise

C.

The discovery of unsubstantiated patterns that lead to prediction errors

解释:

Overfitting a model can lead to the discovery of unsubstantiated patterns that lead to prediction errors and incorrect output forecasts.

A is incorrect. The inability to recognize relationships within the training data most likely results from underfitting the model.

B is incorrect. The development of a predictive model that treats true parameters as if they are noise is most likely a result of underfitting the model.

老师,能否解释下三个选项都在说什么?我认为B的意思是说因为过度学习,把应该正确的(比如黑天鹅也是天鹅)当成了错误的(认为只有白天鹅才是天鹅),所以选了B。

1 个答案
已采纳答案

品职助教_七七 · 2024年02月27日

嗨,爱思考的PZer你好:


Overfitting是模型对于training data里的关系分析的太细,导致这个模型只适用于这一个training data set,换了其他的数据集模型就失效了,即无法去做预测。

所以,A选项说模型没有能力识别training data里的关系是错误的。在overfitting下,不但正确的关系会被识别,连一些仅适用于本数据集的规律也被模型识别出来了。由于这些“规律”并不适用于其他的数据集,所以是一种未被证实的伪规律,也就是C选项中说的unsubstantiated patterns。如果基于这个“规律”在别的数据集里做预测就会产生prediction error。C选项的描述是正确的。

B选项描述的不是overfitting,而是underfitting的情况。underfitting是模型分析的太粗糙以至于没有抓全training data中的规律。这些(本应被抓住但却没被抓住的)的规律和相关参数就因此无法显示在模型里,被当成了无关数据(noise)。

----------------------------------------------
努力的时光都是限量版,加油!

  • 1

    回答
  • 0

    关注
  • 178

    浏览
相关问题