網頁

2019年7月26日 星期五

Covariance and Correlation

共變異數(Covariance)和相關性(Correlation)非常有助於理解兩個連續變量之間的關係。 共變異數指出兩個變量是在相同方向(正變異數)還是在相反方向(負變異數)上變化。 變異數值沒有意義,只有符號才有用。 而相關性解釋了一個變量的變化導致第二個變量的比例變化有多大。 相關性在-1到+1之間變化。 如果相關值為0則表示變量之間沒有線性關係,但可能存在其他函數關係。

讓我們詳細了解這些術語:



Covariance:
在共變異數研究中,只有符號才有意義。 正值顯示兩個變量在相同方向上變化,而負值顯示它們在相反方向上變化。

兩個變量x和y之間的共變異數可以計算如下:



其中:
(i) x̄是x的樣本均值
(ii) ȳ是y的樣本均值
(iii) x_i和y_i是樣本中第i個記錄的x和y的值。
(iv) n是樣本中的記錄

Significance of the formula:
(i) 分子:x中的方差量乘以y中的方差量。
(ii) 共變異數單位:x的單位乘以y的單位
(iii) 因此,如果我們改變變量的單位,共變異數將具有新的值,但是符號將保持相同。
(iv) 因此,共變異數的值沒有任何意義,但是如果它是正的那麼兩個變量在相同的方向上變化,否則它們是負的,那麼它們在相反的方向上變化。

Correlation:
由於共變異數只能說明有關方向,不足以完全理解其關連性,我們將共變異數分別用x和y的標準差分開,得到相關係數介於-1到+1之間。

(i) -1和+1表示兩個變量都具有完美的線性關係。
(ii) 負數意味著它們與相關係數因子成反比。
(iii) 正值表示它們彼此成正比,均值在相同方向上隨相關係數因子變化。
(iv) 如果相關係數為0則表示變量之間沒有線性關係,但可能存在其他函數關係。
(v) 如果兩個變量之間根本沒有關係那麼相關係數肯定是0但是如果它是0那麼我們只能說沒有線性關係但是可能存在其他函數關係。
x和y之間的相關性可以計算如下:



其中:
(i) S_xy是x和y之間的共變異數。
(ii) S_x和S_y分別是x和y的標準偏差。
(iii) r_xy是相關係數。
(iv) 相關係數是無因次量。 因此,如果我們改變x和y的單位,那麼係數值也將保持相同。
讓我們通過下圖了解相關係數的意義是什麼:

what is correlation coefficient.
Correlation Coefficient


參考
https://ashutoshtripathi.com/2019/01/15/covariance-and-correlation/

沒有留言:

張貼留言