12. Estimació de la mitjana aritmètica, I

Índex | Anterior | Següent | Taules

 

Teorema del límit central

El teorema del límit central afirma que, donada una distribució amb una mitjana μ i una desviació estàndard σ, la distribució de les mitjanes aritmètiques mostrals

Suposem la població U={3, 4, 5, 9}. Per a aquesta població tenim:

μ = (3+4+5+9) / 4 = 5,25
σ2 = ([-2,25]2+[-1,25]2+[-0,25]2+3,752) / 4 = 5,188

A continuació establim totes les mostres possibles de (per exemple) 2 elements, i per a cada mostra calculem la mitjana aritmètica:

M{3, 3} = 3,0
M{3, 4} = 3,5
M{3, 5} = 4,0
M{3, 9} = 6,0
M{4, 3} = 3,5
M{4, 4} = 4,0
M{4, 5} = 4,5
M{4, 9} = 6,5
M{5, 3} = 4,0
M{5, 4} = 4,5
M{5, 5} = 5,0
M{5, 9} = 7,0
M{9, 3} = 6,0
M{9, 4} = 6,5
M{9, 5} = 7,0
M{9, 9} = 9,0

Per a aquesta distribució de mitjanes aritmètiques mostrals tenim que

μM = (3+3,5+4+6+3,5+4+4,5+6,5+4+4,5+5+7+6+6,5+7+9) / 16 = 5,25

valor que coincideix exactament amb la mitjana aritmètica poblacional.

Pel que fa al quadrat de l'error típic, tenim

σM2 = [(3-5,25)2 + (3,5-5,25)2 + ... + (7-5,25)2 + (9-5,25)2] / 16 = 2,594

Podem comprovar que aquest valor, 2,594, coincideix exactament amb el valor donat per l'expressió

σM2 = σ2 / N = 5,188 / 2 = 2,594

Anàlogament podríem comprovar, fent els càlculs corresponents, que la distribució mostral te un biaix i una curtosi inferiors als de la distribució poblacional: la distribució mostral s'acosta més a la normalitat. N'és un símptoma el fet que la mediana, que en la distribució poblacional és de 4,5, en la distribució de les mitjanes aritmètiques mostrals passa a ser de 4,75, i s'acosta doncs més a la mitjana aritmètica poblacional, 5,25.

 

La paradoxa de la mida de la mostra

El teorema del límit central té dos aspectes sorprenents i contraintuïtius:

 

Conseqüències

De la segona propietat de les que s'han esmentat en el primer apartat deduïm que la mitjana aritmètica d'una mostra és un estimador no esbiaixat de la mitjana aritmètica poblacional.

Com a conseqüència de la primera propietat, podem construir intervals de confiança, ja que la distribució mostral és aproximadament normal. Ens cal, però, conèixer l'error típic.

Per la tercera propietat tenim que, si coneixem la desviació estàndard poblacional, podem calcular fàcilment l'error estàndard. Si no coneixem la σ poblacional, haurem d'estimar-la, de la manera que veurem més endavant.

 

Procediment d'estimació de μ

Començarem amb un supòsit poc freqüent, però molt interessant des del punt de vista teòric:

El procediment és el següent:

  1. Seleccionem un interval de confiança P, que s'adeqüi a les nostres necessitats.
  2. Estimem μ per punt fent μ = M.
  3. A partir de σ i N calculem σM.
  4. Busquem el valor de zc a les taules per al valor de Pz (atenció a la forma de presentació de la taula!).
  5. A partir de zc i de σM calculem l'interval.

També es pot plantejar el problema invers: conegut l'interval, calcular P. En aquest cas s'inverteix l'ordre d'aplicació de les relacions matemàtiques dels dos darrers passos: primer calculem zc i després les taules ens donen P.

En la fabricació d'una determinada peça mecànica sabem que la desviació estàndard del pes és de 4,25 grams. Hem extret una mostra de 80 peces i les hem pesades, i hem obtingut una mitjana de 552,3 grams. Volem conèixer el pes de les peces corresponent a un interval de confiança del 95%.

1) Estimem μ per punt:

μ = 552,3

2) Càlcul de σM

σM2 = 4,252 / 50 = 0,361
σM = 0,601

3) Consulta de les taules:

Pz = P / 2 = 0,475 =>
zc=1,96

4) Càlcul de l'interval:

μ = M ± σM zc = 552,3 ± 1,96 . 0,601 =>
553,5 > μ > 551,1

Però si, com és més habitual, no coneixem σ, haurem d'arbitrar algun procediment per estimar-la.

I si la mostra és petita, no podrem fer servir la relació entre z i percentils, i haurem de cercar un procediment diferent.