14. Estimació de la mitjana aritmètica, II

Índex | Anterior | Següent | Taules

 

Solució del desconeixement de σ

Per a estimar l'interval de confiança per a μ ens cal conèixer M i σM, i per a conèixer aquesta darrera dada ens cal conèixer σ. Si, com és habitual, desconeixem el valor de σ, hem d'estimar aquest paràmetre.

L'estimador no esbiaixat de σ és s; però si la mostra és molt gran és indiferent, a efectes pràctics, l'ús de s' o el de s.

Hem extret una mostra de 60 alumnes d'una universitat, n'hem mesurat l'alçada en cm i hem obtingut els resultats següents: M=171,2 i s=7,1. A partir d'aquestes dades volem coneixer l'alçada mitjana de la població amb un interval de confiança del 99%.

1) Estimem μ per punt considerant que és igual a M:

μ = 171,2

2) Estimem σ a partir de s':

σ = 7,1

o, millor encara, a partir de s

σ = 7,1 . [( 60 / 59 )]1/2 = 7,16

(Observem la petita diferència quan la mostra és gran.)

3) Càlcul de σM

σM2 = 7,162 / 60 = 0,854
σM = 0,924

4) Consulta a les taules:

pz = p / 2 = 0,495 ==>
zc=2,58

5) Càlcul de l'interval:

μ = M ± σM . zc = 171,2 ± 0,924 . 2,58 ==>
173,6 > μ > 168,8

 

Mostres petites: t d'Student

Quan la mostra és petita (menor de 30 subjectes) la distribució mostral és massa allunyada de la normalitat. Si féssim servir el raonament anterior, obtindríem resultats enganyosament fiables.

En aquests casos s'introdueiex un nou estadístic, la t d'Student.

La definició de la t és molt similar a la de la z, però s'hi fa servir la M i la s.

t = (x-M) / s

Amb les eines del càlcul de probabilitats s'estudia la relació entre la probabilitat p i el valor de t; però a diferència del que es fa amb la z, s'hi introduiex una nova variable, ν=N-1, essent N la mida de la mostra. Aquesta variable s'anomena graus de llibertat. En resulta una família de corbes:

distribució d'Student

Hi ha taules que relacionen les tres variables, p, ν i t.

Taules per al càlcul de la P en funció de la z i al revés

 

Aproximació de t a z

A mesura que N esdevé més i més gran, la diferència entre les distribucions de la z i de la t, i per tant la diferència de les àrees que delimiten, tendeixen a anul·lar-se. Així, per a pz=0,95 el valor de z és 1,96. Per al mateix valor de pt alguns valors de t són:

ν t
5 2,57
30 2,04
120 1,98

Quan ν es fa infinit, el valor de t coincideix exactament amb el de z.

Si la mostra és gran, doncs, és pràcticament indiferent l'ús de z a partir de s', l'ús de z a partir de s o el de la t, encara que des del punt de vista rigorosament matemàtic el valor exacte s'obté d'aquesta darrera forma sigui quina sigui la mida de la mostra.

 

Càlcul d'intervals de confiança

Els intervals de confiança es calculen d'una manera anàloga a com es fa amb les z.

μ = M ± σM tc

en què

A partir de la mostra

{62, 64, 65, 65, 68}

volem conèixer μ amb un interval de confiança del 99%.

1) Calculem M:

M = (62+64+65+65+68) / 5 = 64,800

2) Calculem s:

s = ( 2,82 + 0,82 + 0,2 2 + 0,2 2 + 3,22 ) / 4 = 4,700

3) Calculem σM

σM2 = 4,72 / 5 = 4,418 ==>
σM = 2,102

4) Busquem a les taules el valor de t per a Pt = 0,99 i N=5. Com que la taula de què disposem aquí dóna els valors per a 1-2Pt, fem

1-2Pt = 1 - 0,99 = 0,01
ν = N - 1 = 4

La taula ens indica que

tc = 4,60

5) Finalment, calculem μ:

μ = 64,800 ± 2,102 . 4,60 ==>
55,13 < μ < 74,47

Suposem ara que en comptes de trobar l'interval de confiança amb la t ho haguéssim fet amb la z. Els punts 1-3 serien els mateixos, i a partir d'aquí

4) Busquem a les taules el valor de z per a P = 0,99. Tenim que Pz = 0,495 i la taula ens dóna, per a aquest valor,

z = 2,58

5) Calculem μ:

μ = 64,800 ± 2,102 . 2,58 ==>
59,38 < μ < 70,22

Convé adonar-se bé del significat d'aquesta discrepància. A primera vista sembla que aquest darrer mètode és més fiable, perquè dóna un interval de confiança més ajustat. La realitat és, però, justament el contrari: l'interval més ajustat és fruit del fet d'haver aplicat a una mostra petita unes relacions que només es compleixen bé en les mostres grans. El que obtenim, doncs, és una falsa confiança. Encara més greu seria si en comptes de treballar amb s ho haguéssim fet amb s'.

A mesura que les mostres es fan més grans, els resultats obtinguts convergeixen ràpidament i l'elecció d'un mètode o altre és a la pràctica indiferent.