21. Estimació de la correlació a partir de mostres

Índex | Anterior | Següent | Taules

 

Distribució mostral del coeficient de correlació

Com qualsevol altre estadístic, el coeficient r de Pearson té una distribució mostral: si reiteradament extraiem mostres d'N elements amb dues variables i en calculem el coeficient de correlació r, aquests formaran una distribució.

Però a diferència del que passa amb molts d'altres estadístics, aquesta distribució no és normal. Només s'acosta a la normalitat quan el valor de ρ és baix. Això és un greu inconvenient, ja que no es poden establir intervals de confiança per als valors de ρ elevats, que justament són els que més sovint interessen.

 

Transformació de Fisher

Fisher va introduir un nou estadític, f (també representat amb z'), definit mitjançant la transformació

f = [ ln (1 + r ) - ln ( 1 - r ) ] / 2

El paràmetre corresponent és φ, que es relaciona amb ρ mitjançant una fórmula anàloga.

L'estadístic f té una distribució gairebé normal, amb un error estàndard

σf = 1 / [ N - 3 ]1/2

Taules per al càlcul de la f en funció de la r i al revés

 

Interval de confiança per a ρ a partir de la r

L'establiment d'un interval de confiança per a la ρ exigeix quatre passos successius:

1) Transformem la r en f

2) Calculem l'error estàndard σf en funció d'N

3) Establim l'interval de confiança per a φ

φ = f ± zc σf

4) Convertim els valors superior i inferior de φ a valors de ρ

Per tal d'evitar les complexitats de càlcul en els passos primer i quart es fan servir taules.

Suposem una mostra de 150 elements que ha donat un valor r=0,738; volem conèixer el valor de ρ per a un interval de confiança del 99%.

r = 0,738 ==> f = 0,9461

σf = 1 / 1471/2 = 0,082

Pz = 0,495 ==> z=2,575
φ = 0,9461 ± 2,575 . 0,082 ==>
0,7337 < φ < 1,1585

0,6253 < ρ < 0,8206