开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

飞翔的小老虎 · 2021年08月24日

residual and standard error and R-Squared

为什么去掉有residual的observation会degrade strength of regression? 不应该是当扔掉了有residual的sample,直线拟合的更好了,不应该是upgrade吗?






2 个答案
已采纳答案

星星_品职助教 · 2021年08月24日

@飞翔的小老虎

对的,如果删除large value,那么拟合程度就会变好,连带着SEE变小,R-squared变大。其实道理就是把不好的删除重新估计(拟合程度)就会变好,把好的删除就会变差。关键点就是看删除的是small(好的)还是large(不好的)

--------------

但不能全部删除,残差是散点真实值和方程估计值之间的差,全部删除残差后相当于全部删除了散点,也就没有回归直线了。

星星_品职助教 · 2021年08月24日

同学你好,

这是因为删除的是“small residual values”。然后又是用“reduced sample”来重新估计。

例如有5个数字,3个是10,2个是1,平均值是32/5=6.4;现在剔除这两个1,重新估计的平均值是30/3=10,所以均值变大了。

同理,删除了small residual value后,剩下的都是大的residual value,所以re-estimate后关于残差的相关估计就都会变大。也就是拟合程度变得不好。

反应在SEE上就是变大,反应在R-squared上就是变小,反应在整条直线方程上就是拟合程度变差。

  • 2

    回答
  • 0

    关注
  • 316

    浏览
相关问题