1. Conceptes fonamentals

Índex | Següent

 

Estadística

L'estadística s'ocupa de recollir dades sistemàticament i de presentar-les d'una manera resumida, fàcilment intel·ligible. Quan l'estadística es limita a aquesta comesa, parlem d'estadística descriptiva.

Molt sovint, però, recollim dades d'un conjunt reduït anomenat mostra per tal de fer-les extensives a un altre conjunt més ampli, anomenat univers o població, del qual la mostra forma part. En aplicar les mesures realment fetes en la mostra al conjunt de la població incorrem en una possibilitat d'error, de manera que les conclusions s'han de fer en termes de probabilitat; en aquest cas parlem d'estadística inductiva o inferencial.

 

Variables i tipus de variables

Cada un dels individus d'una població es caracteritza per una sèrie d'atributs mesurables d'una manera uniforme. Aquests atributs constitueixen variables, que adopten un valor en cada un dels individus. El conjunt de tots els valors teòricament possibles constitueixen el domini de la variable.

Les variables són quantitatives quan s'expressen amb un nombre i qualitatives quan no s'hi expressen. Les variables quantitatives són discretes quan per naturalesa només hi són vàlids un determinat conjunt de valors, i contínues quan hi són possibles tots els valors dins el domini.

Si en un conjunt de persones descrivim aquestes mitjançant el nom, l'any de naixement i el pes, la primera és una variable qualitativa, la segona una de quantitativa discreta i la tercera una de quantitativa contínua.

 

Distribucions de freqüència

Quan disposem d'un gran nombre de dades d'una variable quantitativa, és útil de distribuir-los en categories o classes. Cada classe queda delimitada per un valor inferior i un valor superior, la diferència entre els quals constitueix l'interval de classe (generalment constant); el punt mig entre aquests dos valors constituiex la marca de classe.

El nombre d'individus que pertany a cada classe és la freqüència de classe i el conjunt de totes les freqüències de classe constitueix la distribució de freqüències.

Si volem descriure la població d'un país per edats, pot ésser útil l'agrupació dels anys de naixença en grups de 5 (per exemple, nascuts entre 1960 i 1964).

Aquesta mena d'agrupaments fan perdre part del detall original de les dades, però faciliten molt la visió de conjunt.

 

Distribucions de freqüències relatives

La freqüència relativa d'una classe és la freqüència de la classe dividida per la suma total de freqüències de totes les classes. S'expressa en tant per 1 o en tant per cent.

El conjunt de totes les freqüències relatives constitueix la distribució de freqüències relatives.

 

Poblacions i mostres

El conjunt dels individus sobre els quals ens interessa conèixer alguna característica s'anomena població. Molt poques vegades és factible un estudi estadístic exhaustiu de tota la població sobre la qual estem interessats; ens cal recórrer a les mostres.

No és possible investigar les preferències de tots els possibles compradors d'una nova línia de cotxes; no és possible fer el seguiment d'un nou fàrmac sobre tots els malalts d'una determinada malaltia; no és possible dur a terme un control de qualitat sobre tots els objectes sorgits d'una línia de fabricació. En aquests casos recorrem a mostres.

La teoria de les mostres s'ocupa de tres problemes:

 

Paràmetres i estadístics

Les mesures atribuïdes al conjunt d'una població s'anomenen paràmetres; les mesures obtingudes a partir de les mostres són els estadístics. Quan treballem amb mostres, els estadístics ens serviexen per a conèixer, amb la màxima precisió possible, els paràmetres.

Acostumem a representar els paràmetres amb lletres gregues, i els estadístics amb lletres llatines:

Denominació Paràmetre Estadístic
Mitjana aritmètica μ M
Desviació estàndard σ s
Proporció π p
Correlació ρ r