开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

梦梦 · 2024年08月15日

关于spearman correlation(rank correlation)

NO.PZ2023091601000088

问题如下:

A risk analyst is assessing the correlation between the returns of two financial assets. The analyst wants to determine if the two sets of returns are dependent. Which of the following is correct regarding correlation and dependence?

选项:

A.

Returns on financial assets tend to be independent.

B.

Pearsons correlation measures both linear and nonlinear dependence.

C.

Correlation and the regression slope are closely related.

D.

If the returns of the two assets are normally distributed, their rank correlation and Pearsons correlation would not be equal.

解释:

C is correct. Correlation and the slope of the regression are intimately related, as regression explains the sense in which correlation measures linear dependence.

A is incorrect. Financial assets are highly dependent and exhibit both linear and nonlinear dependence.

B is incorrect. Pearsons correlation only measures linear dependence.

D is incorrect. The rank correlation is virtually identical to the Pearsons (also known as

linear) correlation for normal random variables.

老师好,红色划线的句子,是说X和Y如果是线性关系,比如Y=a+bX,p(X,Y)和p(X的rank Y的rank)结果接近?

那线性关系存在outlier吗?是不是可以理解为不存在所以二者结果接近?

D选项,为什么正态分布就没有outlier?尾部不也是极端值吗?

3 个答案
已采纳答案

李坏_品职助教 · 2024年08月20日

嗨,努力学习的PZer你好:


C选项意思是,X与Y这两个变量之间的相关系数ρ,和回归方程中的斜率项(就是X的系数)是高度关联的。


在线性回归中,

斜率项的公式如下:

而相关系数公式如下:

所以相关系数ρ = 斜率项b * X的方差 / 根号下(X的方差*Y的方差) = (斜率项b * X的标准差) / Y的标准差。

可以看到X与Y相关系数ρ与斜率项b是高度关联的。


D选项说了两个变量(两个return变量)都是正态分布,也就是outlier不存在。

如果有Outlier, 那么pearson线性相关系数会有干扰项,而spearman rank相关系数不会受干扰(因为Outlier排序之后就不那么夸张了),此时两种相关系数的取值不一样。

既然都已经是正态分布,outlier不存在,那么pearson线性相关系数与spearman rank相关系数的结果得出来是一样的。这和变量的顺序没啥关系,X取值大的,其排名自然也靠后;同样,Y取值大的,其排名也会靠后,两种相关系数不会不一样。


----------------------------------------------
加油吧,让我们一起遇见更好的自己!

梦梦 · 2024年08月22日

哦,好的,谢谢

李坏_品职助教 · 2024年08月23日

嗨,努力学习的PZer你好:


加油~~

----------------------------------------------
虽然现在很辛苦,但努力过的感觉真的很好,加油!

李坏_品职助教 · 2024年08月15日

嗨,爱思考的PZer你好:


  1. 红色划线的句子就是你说的这个意思,没错。即便存在少量的outlier,对于两种correlation的影响也不会太大。
  2. 所谓的outlier意思是显著偏离了分布函数的观测值。正态分布的尾部的大部分观测值,别管是多大或者多小的数,依然是符合正态分布函数的。D选项已经说了return服从正态分布,意思就是outlier不会有太大的影响。

两种正态分布变量的rank correlation与linear correlation是相等的,这是一个数学结论。

----------------------------------------------
加油吧,让我们一起遇见更好的自己!

梦梦 · 2024年08月20日

老师好,C选项:比如Y=2+4X,Y=6+10X,这俩等式的pearson correlation都等于1,X和Y存在线性关系,那X的系数是多少又对correlation有啥影响呢?C能举个例子吗? D选项,如果X,Y都服从正态分布,为什么pearson correlation和spearman correlation就一样呢?如果X和Y的值,与结果的顺序值差异很大,计算结果也一样?为啥?

  • 3

    回答
  • 0

    关注
  • 166

    浏览
相关问题