19. Línies d'ajustament

Índex | Anterior | Següent | Taules

 

Selecció d'una línia d'ajustament

A la vista d'un diagrama de dispersió, la disposició dels punts acostuma a suggerir-nos un determinat tipus de línia. Acceptat aquest, hem d'assegurar que la línia concreta que triem sigui com més explicativa millor. Això significa que per a cada tipus de línia s'ha desenvolupat una sèrie de relacions matemàtiques que ens en permeten deduir l'equació i valorar el nivell de correlació que aquesta expressa.

Pot succeir que a primera vista no poguem endevinar un tipus de línia satisfactòria; en aquests casos no tenim més remei que fer diverses proves i calcular per a cada una el nivell de correlació, a fi de seleccionar la més adequada.

 

Significat dels valors y' donats per una línia d'ajustament

Les línies d'ajustament adopten la forma genèrica

y' = f(x)

i fan correspondre a cada valor d'x un valor teòric y', que pot coincidir o no amb el valor real y.

El significat dels valors donats per una línia d'ajustament és lleugerament diferent segons que es tracti d'una població o d'una mostra:

 

Rectes d'ajustament

De totes les línies d'ajustament possibles, la més senzilla és la recta:

y' = Ax + B

Donada aquesta recta, a cada valor x correspon un valor y'. Aquest valor y' pot correspondre o no al valor veritable; si no hi correspon, la diferència entre els valors teòric i real és la desviació.

Suposem el punt (2, 11) i la línia d'ajustament y' = 3x + 4; per al valor x=2 el valor teòric y' és

y' = 3 . 2 + 4 = 10

Com que el valor real d'y no és 10 sinó 11, per a aquest punt la desviació és

d = y - y' = 11 - 10 = 1

 

Mètode dels mínims quadrats

Naturalment desitgem que les diferències entre els valors teòrics i els reals de la y siguin com més petits millor. Però una equació pot donar un ajustament molt bo per a una punt i molt dolent per a un altre; el que ens interessa és una equació que doni ajustaments bons per al conjunt de tots els punts: com més petites seran les desviacions en conjunt, més podrem dir que l'equació és realment d'ajustament.

Això ens porta a la formulació de diversos requisits; el que es fa servir més sovint és l'anomenat dels mínims quadrats. Considerem òptima l'equació tal que la suma dels quadrats de totes les desviacions sigui mínima:

Σ ( y - y' )2 = mínim

 

Recta de mínims quadrats

Si l'equació és una recta i compleix el requisit dels mínims quadrats, s'anomena recta d'ajustament de mínims quadrats.

Es demostra que l'equació d'aquesta recta és

( y' - μy ) / ( x - μx ) = σxy / σx2

Calcularem la recta d'ajustament de mínims quadrats de la població (-3, -5), (-1, 1), (2, 3), (3, 4), (5, 8), (6, 7), (7, 7)

1) Càlculs previs:

μx = 2,714
μy = 3,571

σxy = Σ[(x-μx)(y-μy)] / N = 95,143 / 7 = 13,592

σx2 = Σ(x-μx)2 / N = 81,429 / 7 = 11,633

2) Equació

(y' - 3,571) / (x - 2,714) = 13,592 / 11,633 ==>
y' = 1,168 x + 0,400

A continuació hi ha un gràfic representatiu; la línia vermella és la recta d'ajustament de mínims quadrats, i les línies verticals verdes representen les desviacions entre els valors teòrics i els valors reals.

recta d'ajustament de mínims quadrats

 

Propietats de la recta de mínims quadrats

De la fórmula per a l'establiment de l'equació de la recta de mínims quadrats es desprenen dues importants conseqüències: