开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

安娜徐 · 2021年08月07日

为什么有多重共线性,R square 和F statistic 就会高估?


1 个答案

星星_品职助教 · 2021年08月07日

同学你好,

一般的说法是F检验显著,R-squared很大。这个是基础,先解释这一层。

-------

以Y=b0+b1X1+b2X2+ε为例,多重共线性指的是X1和X2之间存在强相关关系(所以应该去掉其中的一个)。

①F检验

F test检验的是方程“整体”是否成立,虽然在多重共线性的背景下,X1和X2可以认为是同一个东西,但X1(或X2)还是可以解释Y的。所以方程作为整体是成立的,F检验显著。


②R-squared

R-squared表示方程对Y的解释力度,和第①点类似,由于Y还是可以被X1(或X2)解释的,所以R-squared也很高。

--------

但因为方程此时实际上是有问题的,所以F检验其实不该这么显著(等价于F-statistics不应该像计算出来的这么大),R-squared也不应该这么大。

所以做F-statistics和R-squared都是被高估了的。

(高估其实是一个数学问题,涉及到复杂的证明,原版书上是不讲的。所以按照以上逻辑去理解和记忆就可以了)

  • 1

    回答
  • 0

    关注
  • 430

    浏览
相关问题