3. Centralitat i dispersió, I

Índex | Anterior | Següent

 

Mesures de centralitat i de dispersió

Per a la descripció sintètica de la distribució d'una variable quantitativa és molt útil de poder disposar d'uns pocs paràmetres que en resumeixin les característiques principals.

Les propietats més importants d'una distribució són les que ens informen sobre la centralitat i sobre la dispersió. En llenguatge informal: quins són els valors centrals de la distribució i en quin grau s'escampa la resta de valors al voltant del valor central.

Això pot enfocar-se de dues maneres diferents:

A aquests dos procediments se n'hi ha d'afegir un tercer, que respon al concepte de majoria de valors: és la moda.

 

Moda

La moda d'una distribució és el valor més freqüent de la variable. Si aquesta ha estat distribuïda en classes, la freqüència es refereix al nombre de casos inclosos en cada classe; això fa entendre que la moda pot variar d'acord amb la tria de classes que s'hagi fet.

La moda no és única quan hi ha dos o més valors - o classes - empatats en nombre d'elements. En aquests casos es parla de distribució multimodal.

En un sentit més ampli també es parla de distribució multimodal quan el polígon de freqüències té més d'un màxim (encara que no sigui un màxim absolut).

La moda és només una mesura de centralitat des d'un punt de vista de probabilitats, pel fet que habitualment els valors centrals són alhora els més freqüents.

El concepte de moda es pot aplicar també a variables qualitatives.

 

Paràmetres basats en l'ordenació dels elements

Amb el procediment basat en l'ordenació dels elements la mesura de la centralitat és donada per un paràmetre anomenat mediana. La dispersió és donada per un conjunt de paràmetres, entre els quals destaquen els quartils i el rang semiinterquartílic.

 

Mediana

La mediana d'una distribució de valors és el valor de l'element que ocupa el lloc central un cop ordenada la sèrie d'elements segons el seu valor.

Donada la distribució

{2, 2, 3, 4, 5, 5, 7, 7, 8, 8, 9}

que té 11 elements, la mediana serà el valor que ocupa el lloc 6è, és a dir, 5.

Si la distribució té un nombre parell d'elements, s'agafa com valor de la mediana el valor mitjà dels dos valors que ocupen la posició central.

Des d'un punt de vista geomètric, la mediana és el valor de la X de la vertical que divideix la corba de freqüències en dues parts d'àrees iguals.

 

Màxim i mínim; quartils, decils i percentils

Un cop ordenats els valors d'una distribució, n'hi ha un que és el mínim i un altre que és el màxim.

Si dividim la distribució - un cop ordenada - en quatre parts iguals, els valors divisoris de les parts constitueixen els quartils. El segon quartil, com és obvi, coincideix amb la mediana.

Així en la distribució del punt anterior el mínim és 2, el màxim 9, el primer quartil 3 i el tercer quartil 8.

Anàlogament podem definir decils (10 parts) i percentils (100 parts).

El cinquè decil és la mediana; el 25è percentil és el primer quartil, el 50è percentil és la mediana i el 75è percentil és el tercer quartil.

 

Rang i rang semiinterquartílic

La diferència entre el màxim i el mínim s'anomena rang.

El rang semiinterquartílic es defineix com

(Q1-Q3) / 2

on Q1 i Q3 són els quartils primer i tercer.

El rang semiinterquartílic és molt emprat com mesura de la dispersió, ja que és molt poc sensible als valors extrems escadussers.

Tornant al mateix exemple, el rang semiinterquartílic és

(8 - 3) / 2 = 2,5

 

Diagrames de caixa

Els diagrames de caixa representen gràficament la mediana, el primer i el tercer quartil i el màxim i el mínim, i a vegades d'altres paràmetres. En el gràfic següent se'n presenta la versió més simple amb les mateixes dades de l'exemple anterior:

diagrama de caixa