菲菲_品职助教 · 2018年09月02日
同学你好,下面我对你说的这四种bias进行定义和举例,更多的内容可以再去听一下基础班R11里面关于five kinds of bias的内容,里面有更详细的讲解和举例,我每个偏差只列举了老师讲的其中一个例子。
Data-mining bias: 数据挖掘偏差,把偶然当必然,算出来的统计指标可能没有经济学意义上的解释。比如说把股票的收益率跟降雨量之间做了一个相关关系,发现有一个很强的相关性,所以就得出结论说:降雨量越高的年份股票收益率涨的也越好一些。这就是典型的把偶然当成了必然,没有经济学意义上的解释,就不是必然会出现的一个规律。
Sample selection bias:样本选择偏差,在你选择抽样的时候有一些数据被你自然而然排除在外了,那就意味着整个抽样的过程有失偏颇,样本本身对总体不够有代表性。比如说一个综艺节目对全国有小孩的女生做调研,有了小孩之后是不是烦恼变多了。他们通过信访的方式来进行调研,通过收回来的信他发现大概有70%左右的女生都认为烦恼变多了。然后他就得到结论说,有了小孩之后会对家庭造成烦恼,这就产生了样本选择偏差,因为若通过信访的方式,很多有了小孩之后很快乐的妈妈都不一定会进行回复,那些内心有很大的不满的人反而更愿意回信,这样就自然而然会把那些有了小孩之后变快乐的家庭排除在外了,因为错误的抽样方式从而导致对结果造成偏差。
Look-ahead bias:前视偏差,用将来的数据进行判断导致判断不可行,因为站在现在这个时间点,将来的数据你是得不到的,那么这种判断规则就是不可用的。比如说我用P/E选股,通过过去的数据我发现P/E越低,将来的股价往往会上涨。比如我现在站在2020.1.1的时间点想根据P/E来进行选股,“E”代表的是去年一整年的每股净收益,但是2019年的年报还没有披露,所以现在根本得不到这个指标,这个P/E是在将来才会得到的,所以用将来才能得到的指标作为一个选股策略是不可行的。
加油~