4. Centralitat i dispersió, II

Índex | Anterior | Següent

 

Mitjana aritmètica

La mitjana aritmètica és una mesura de centralitat donada per la fórmula

μ=Σxi / N

en què μ és la mitjana aritmètica, xi és cada un dels valors de la distribució, Σ significa la suma de tots i N és el nombre d'elements de la distribució

Donada la mateixa distribució del tema anterior,

{2, 2, 3, 4, 5, 5, 7, 7, 8, 8, 9}

tindrem que

μ = (2+2+3+4+5+5+7+7+8+8+9) / 11 = 60 / 11 = 5,455

 

Variància i desviació estàndard

La variància es representa com σ2 i es defineix així:

σ2 = Σ(xi-μ)2 / N

L'arrel quadrada de la variància, σ, s'anomena desviació estàndard.

Tornant a l'exemple esmentat en l'apartat anterior, tindrem:

σ2 = [ (-3,455)2 + (-3,455)2 + (-2,455)2 + (-1,455)2 + (-0,455)2 + (-0,455)2 + 1,5452 + 1,5452 + 2,5452 + 2,5452 + 3,5452 ] / 11 =
= 62,727 / 11 = 5,702

I la desviació estàndard és

σ = 5,7021/2 = 2,388

Hi ha una definició alternativa de la desviació estàndard en la qual el denominador N és substituït per N-1. La justificació d'aquesta definició alternativa es troba en la teoria de les mostres.

 

Biaix

Diem que una distribució és simètrica quan el valor de la mediana coincideix amb el de la mitjana aritmètica i a més tota la resta de valors es poden agrupar en parelles en què les diferències amb el valor de la mitjana aritmètica siguin les mateixes amb el signe canviat. Gràficament en resulta un polígon de freqüències simètric en relació amb l'abscissa corresponent a la mitjana aritmètica.

Qualsevol distribució que no compleixi aquest requisit és asimètrica o esbiaixada. Qualitativament observem que hi ha distribucions quasi simètriques i d'altres de molt esbiaixades. Això ens porta a mirar de quantificar-ne el biaix.

El biaix es defineix a partir dels valors individuals, del de la mitjana aritmètica i del de la desviació estàndard, segons la fórmula següent:

Σ(xi-μ)3 / Nσ3

Tornant a l'exemple reiterat, tenim

( - 41,226 - 41,226 - 14,788 - 3,077 - 0,094 - 0,094 + 3,691 + 3,691 + 16,493 + 16,493 + 44,567 ) / ( 11 . 2,3883 ) = 15,570 / 149,792 = 0,104

El valor del biaix pot ésser positiu, negatiu o nul. De la fórmula i de la definició de simetria es dedueix immediatament que si la distribució és simètrica el valor del biaix és 0.

La mitjana aritmètica tendeix a ésser més gran que la mediana si el biaix és positiu i més petita si és negatiu, però no necessàriament ha d'ésser així. La coincidència entre la mitjana aritmètica i la mediana és una condició necessària, però no suficient, per a la simetria.

La distribució {2, 5, 7, 9, 12} és simètrica i tant la mitjana aritmètica com la mediana valen 7. I la distribució {3, 4, 6, 7, 10} no és simètrica, però tant la mitjana aritmètica com la mediana valen 6.

 

Curtosi

Qualitativament observem que hi ha distribucions en què els valors tendeixen a escampar-se d'una manera uniforme entre el màxim i el mínim i d'altres en què tendeixen a concentrar-se al voltant del centre amb uns pocs valors esparsos allunyats. I entre les unes i les altres es situen tots els casos possibles. Per descriure aquest fet introduïm el terme curtosi; de les primeres distribucions en diem platicúrtiques; de les segones, leptocúrtiques, i de les intermèdies, mesocúrtiques.

Quantitativament definim així la curtosi:

[ Σ(xi-μ)4 / Nσ4 ] - 3

Aplicat al mateix exemple és:

[ ( 142,418 + 142,418 + 36,298 + 4,476 + 0,043 + 0,043 + 5,705 + 5,705 + 41,982 + 41,982 + 158,011 ) / ( 11 . 2,3884 ) ] - 3 =
= 579,079 / 357,701 - 3 = -1,381

Les distribucions platicúrtiques tenen curtosi negativa i les leptocúrtiques, positiva.

Hi ha un tipus especial de distribució que es caracteritza per tenir nuls el biaix i la curtosi: és l'anomenada distribució normal, a la qual ens referirem en detall més endavant.

 

Mitjana geomètrica i mitjana harmònica

Tot i que la mitjana aritmètica és la mesura de centralitat calculada més sovint utilitzada, no és pas l'única. En casos especials es fan servir altres mesures; entre aquestes destaquen la mitjana geomètrica i la mitjana harmònica.

La mitjana geomètrica és l'arrel N-èsima del producte dels N valors individuals:

(x1x2x3...xN)1/N

La mitjana harmònica és l'invers de la mitjana aritmètica dels inversos:

1 / [ Σ(1/xi) / N ]