02:08 (2X)
但是不是说异方差和自相关不影响系数的估计么?为什么书上定义还说异方差和自变量相关?
发亮_品职助教 · 2024年10月31日
嗨,努力学习的PZer你好:
是的,这三个问题一般不影响系数的consistency,如下是原版书的原文(Heteroskedasticity原文没有提到):
Positive serial correlation does not affect the consistency of regression coefficients,
but it does affect statistical tests.
Multicollinearity does not affect the consistency of regression coefficient estimates, but
it makes these estimates imprecise and unreliable.
但都会影响到accuracy, Heteroskedasticity和serial correlation是会影响到standard error的准确性,从而使得假设检验有问题。multicollinearity是使得coefficient estimate unstable
Heteroskedasticity增加样本数量在一定程度上可以增加accuracy,但不能彻底消除,需要进行robust standard errors,解决方法的说法包括:heteroskedasticity-consistent standard errors or White-corrected standard errors.
Serial correlation也一样,一定程度上可以提升accuracy,但不能彻底解决,应该是adjust the standard errors to account for serial correlation,解决方法可能的说法包括,serial-correlation consistent standard errors, serial correlation and heteroskedasticity adjusted standard errors, Newey–West standard errors, and robust standard errors.
以上这些方法是直接修正standard errors,所以顺带把heteroskedasticity的问题也解决了。
multicollinearity提升sample size是解决的一个方法。其他的方法还有:调整模型结构——增加or减少自变量,自变量使用不同的代理数据(Using a different proxy for one of the variables)
----------------------------------------------虽然现在很辛苦,但努力过的感觉真的很好,加油!
发亮_品职助教 · 2024年10月30日
但是不是说异方差和自相关不影响系数的估计么?
是异方差和自相关不影响系数的无偏性(系数估计)。 但是存在异方差和自相关时,算出来的标准误会有问题,这会影响到假设检验的准确性。
所以会影响到系数估计的有效性。 有异方差可能会说明模型存在问题需要修正。
为什么书上定义还说异方差和自变量相关?
这是conditional Heteroskedasticity的定义。这点没有太多的原因推导,就是人为定义概念。
即,residual和independent variable存在systematic relationship,残差项的方差与自变量存在关联。
这可能会说明残差项里面的一些信息没有被自变量Independent variable充分解读出来,导致残差项里面的一些信息仍然与自变量存在一定correlation,随着自变量的改变,残差项就会跟着改变。