开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

ciaoyy · 2018年07月26日

问一道题:NO.PZ2016062402000026

问题如下图:

    

选项:

A.

B.

C.

D.

解释:


D选项与解释里的答案是反的呀?  过度解释--R^2过大,因为X变量太多,如果少了一个能够影响已有变量的omitted variable,那么解释力度应该下降才对?不知道我的逻辑错在哪里?  

1 个答案
已采纳答案

orange品职答疑助手 · 2018年07月26日

同学你好。假设X为因变量,Y为自变量。如果存在第三个变量Z能够同时影响YX,并且这个变量Z没有纳入我们的模型方程中,那么X对于Y的解释力度就会被高估。这是因为,变量X其实本身是无法具有现在这么高的解释力度的,它之所以现在解释力度高,是因为它包含了一个被我们所遗漏掉的、和X相关的、对Y有解释作用的变量Z。所以,如果这种情况下是高估的。

ciaoyy · 2018年07月27日

还是感觉有疑问,为什么遗漏掉一个跟X有关的变量反而会造成X解释力度被高估呢? 视频只讲到了遗漏变量,相当于该变量进入了残差项,使得残差项与已知变量之间不独立,违反回归分析的前提,但并没有涉及到X解释力度的问题。而且按照R^2的定义,有效(对Y真正有影响的)解释变量个数越多,那么模型就越好,explanarory power就越强,而这道题里面反而遗漏一个重要变量使得X的解释力度上升了,高估了整个regression analysis的explanatory power,好奇怪啊

orange品职答疑助手 · 2018年07月27日

上面那个是比较偏直觉的解释。或者同学你换种角度来理解:在多元回归中,R方被修正R方所改善,修正R方中,随着自变量个数k的增加,修正R方是降低的,这点可通过修正R方的式子看出来