Ormazábal, F.J. (Coord.) Vilà, R.; Mateo, M. ; Torrado, M.;
Berlanga, V.; del Barrio, J.; Ruiz, A.
Departament de Mètodes d'Investigació i Diagnòstic en
Educació (MIDE)
Facultat de Pedagogia
Universitat de Barcelona
Facult
Aquesta publicació compta amb la següent llicència de Creative Commons:
!
"#$ %
&'
"#$(
Para citar la obra:
Ormazábal, F.J. (coord.) Vila, R.; Mateo, M.; Torrado, M.; Berlanga, V.; Del Barrio, J.;
Ruiz, A. (2012) Estadística inferencial aplicada a l’educació. Barcelona: Universitat de
Barcelona. Dipòsit Digital http://hdl.handle.net/2445/21383
2
INDEX
Estadística Inferencial
1.1 Conceptes bàsics
4
1.1.1 Distribució mostral de mitjanes
6
1.1.2 Distribució mostral de proporcions
7
1.1.3 Altres distribucions mostrals
7
1.2 Teoria de l’estimació estadística
8
1.2.1 Interval de probabilitat
8
1.2.2 Interval de confiança
11
1.3 Teoria de la decisió estadística
17
1.3.1 Errors i riscos
18
1.3.2 Potència d’un contrast
19
1.3.3 Grau de significació
20
1.3.4 Contrasts unilaterals i bilaterals
21
3
1.1 Conceptes Bàsics
L'Estadística Inferencial es basa en la inferència estadística. No es limita a l'estudi
purament descriptiu d'unes dades, sinó que, a partir de les dades observades en
una mostra (d'on obtenim els estadístics), s'infereix (es generalitza) l'estudi a la
població d'aquesta mostra (paràmetres).
MOSTRA
ESTADÍSTICS
Ẋ
SX
pO
n
POBLACIÓ
PARÀMETRES
µ
σX
p
N
MOSTRA
Inferència
POBLACIÓ
Procés pel qual, a partir de les dades d'una mostra,
establim conclusions per a la població
La inferència estadística és correcta sempre que la mostra sigui representativa. Una
mostra és representativa quan:
... És un subconjunt de la població.
... Té una mida suficient (depèn de la precisió que es desitgi i del risc
d'error).
... La tècnica de selecció de la mostra és correcta (mostreig).
Error mostral: És la diferència entre un estadístic (mostra) i el seu paràmetre
(població). Pot ser de dos tipus:
• Aleatori: És el degut a l'atzar, es produeix quan fem un mostreig probabilístic o
aleatori. Es pot calcular i controlar si es coneix quina llei de probabilitat segueix.
• De biaix: Es deu a altres causes, a més de l'atzar, i es produeix (entre altres
motius) quan utilitzem un mostreig no probabilístic. El problema no és que el biaix
sigui gran o petit, sinó que no el podem calcular, ja que no coneixem quina Llei
segueix.
Distribució mostral i error típic: Es distingeix entre distribució poblacional,
distribució d'una mostra i la distribució mostral.
4
DISTRIBUCIÓ POBLACIONAL (és la distribució d’una variable en la població)
N
µ
σ2
σ
p
q
σ
µ
Distribució de X
en diverses mostres:
X
n1
n2
n3
n4
n5
ni
X1
X2
X3
X4
X5
Xi
S21
S22
S23
S24
S25
S2i
S1
S2
S3
S4
S5
Si
DISTRIBUCIÓ MOSTRAL D’ESTADÍSTICS
σX =
σPo =
DISTRIBUCIÓ MOSTRAL DE MITJANES:
DISTRIBUCIÓ MOSTRAL DE PROPORCIONS:
σ
n
pq
n
XX = µ
X
XPo = p
Po
Error típic (o error estàndard) és la desviació típica de la distribució mostral:
... de mitjanes
σX =
σ
n
... de proporcions
σPo =
pq
n
5
Teorema del Límit Central:
B Els estadístics obtinguts en les mostres tendeixen a agruparBse al voltant del
paràmetre.
B Quan "n" augmenta els estadístics estan més agrupats.
B Si les mostres són grans (n ≥ 30) i la població d'origen segueix la Llei
Normal, la gràfica de la distribució mostral és simètrica i té forma de
campana, és a dir, segueix la Llei Normal. També pot seguir altres models: t
de Student, χ2 (khi Quadrat), F de Snedecor.
B Poden definir distribucions mostrals per diferències i sumes d'estadístics.
1.1.1 Distribució mostral de mitjanes
B Segueix la Llei Normal.
B La mitjana X X és el paràmetre (o sigui, la mitjana de la població: µ).
B La desviació típica (o error típic):
* Si la població és infinita o el mostreig és amb reemplaçament (no exhaustiu):
σX
=
σ
n
* Si la població és finita i el mostreig és sense reemplaçament (exhaustiu):
σX
=
σ
n
N−n
N −1
.
..on
N = Mida de la població
n = Mida de la mostra
Exemple: Què passa amb l’error típic quan augmenta la mida de la mostra?
µ = 10 i σ = 2
Si n = 25
X X = µ = 10
2
σX =
= 0'4
25
Si n = 100
X X = µ = 10
σX =
Si n = 400
2
= 0'2
100
Observem:
B En tots els casos,
XX = µ
( és el
paràmetre)
B L'error típic disminueix a mesura que
augmenta n, perquè influeix menys
l'atzar.
X X = µ = 10
σX =
2
= 01
'
400
6
1.1.2 Distribució mostral de proporcions
B
B
Segueix la Llei Normal.
La mitjana de les proporcions observades (po) és el paràmetre
( Xpo = p)
B
La desviació típica (error típic):
* Si la població és infinita o el mostreig amb reemplaçament (no exhaustiu):
σ po
=
p ⋅q
n
* Si la població és finita o el mostreig sense reemplaçament (exhaustiu):
σ po
=
p ⋅q
n
N−n
N −1
Exemple: Què passa amb l’error típic quan augmenta la mida de la mostra?
p = 0'6
n = 25
Xpo = p = 0'6
σpo =
n = 100
0'6 ⋅ 0'4
= 0'0979
25
Xpo = p = 0'6
0'6 ⋅ 0'4
σpo =
= 0'0489
100
n = 400
Xpo = p = 0'6
σpo =
Observem:
B En tots els casos,
Xpo = p (és el
paràmetre)
B L'error típic disminueix a mesura que
augmenta n, perquè influeix menys
l'atzar.
0'6 ⋅ 0'4
= 0'0245
400
1.1.3 Altres distribucions mostrals
D’una manera similar, hi ha distribucions mostrals d’altres estadístics, com els que
segueixen: la mitjana, quartils, desviació semintercuartílica, coeficient de variació,
decils, etc.
7
1.2 Teoria de l’Estimació Estadística
Els dos pilars bàsics de l'Estadística Inferencial són:
• La Teoria de l'estimació estadística
• La Teoria de la decisió estadística
La Teoria de l'estimació Estadística tracta de l'estimació de paràmetres a partir dels
estadístics. Es basa en els conceptes de: distribució mostral i error típic o error
estàndard. Com moltes de les distribucions mostrals segueixen una llei Normal, de
la qual coneixem la mitjana (el paràmetre) i la desviació típica (error típic o
estàndard), podem resoldre qualsevol problema de probabilitat sense necessitat de
resoldre integrals, simplement utilitzant la taula de la Llei Normal Estàndard
(centrada i reduïda: µ Z = 0, σZ =1), com fèiem per a qualsevol distribució X que
segueix la Llei Normal. L'algorisme és el mateix, però utilitzant en cada cas la
mitjana i la desviació típica corresponent.
Xi − X
Sx
Xi = X + Sx ⋅ Zi
Z
TAULA
po
X
X
Zi =
DISTRIBUCIÓ MOSTRAL
DE PROPORCIONS:
DISTRIBUCIÓ MOSTRAL
DE MITJANES:
DISTRIBUCIÓ NORMAL
DE X:
TAULA
Zi =
X−µ
σx
X = µ + σx ⋅ Zi
Zi =
po − p
σpo
Z
TAULA
po = p + σpo ⋅ Zi
Z
TAULA
TAULA
TAULA
Pr.
Pr.
Pr.
% (A)
% (A)
% (A)
Interval de Probabilitat
1.2.1 Interval de probabilitat
És un interval (simètric) al voltant d'un paràmetre que conté una proporció 1 B α
dels estadístics de la distribució mostral.
α
/2
1-α
α
/2
INTERVAL DE PROBABILITAT
Per conveni en Ciències Humanes i Socials el α sol valer:
8
α = 0’05 ( 5% )
α = 0’01 ( 1% )
Així doncs,
1-α
Si α = 0’05
1 - α = 0’95 (95%)
Si α = 0’01
1 - α = 0’99 (99%)
L'interval de probabilitat permet predir amb un risc α (0'05 o 0'01) d’equivocarBse,
els límits dins dels quals es trobaran, partint d'un paràmetre poblacional, els 1 B α
(0'95 o 0'99, 95% o 99%) dels estadístics observats en mostres de grandària n
extretes a l'atzar de la població. Dit en altres paraules, l'interval de probabilitat
conté dins dels seus límits 1 B α (0'95 o 0'99, 95% o 99%) de la distribució mostral.
A) Interval de probabilitat de mitjanes (o d'una mitjana)
És un interval simètric al voltant de la mitjana de la població µ que conté una
proporció igual a 1 B α de les mitjanes observades en mostres de grandària n
extretes a l'atzar de la població.
σx =
α
σ
n
X
Z
1-α
/2
µ − Zα/2
σ
n
µ
X = µ + σx ⋅ Zi
α
µ + Zα/2
X ∈ µ ± Z α /2 ⋅ σ X = µ ± Z α /2
σ
n
/2
pr, %
(A)
σ
n
Exemple. S'accepta que els CI es distribueixen en la població segons una llei
normal Ci = 100 i σCI = 15. Calcular entre quins valors estaran els CI mitjans (95%,
99%) de mostres a l'atzar de:
a) 100 subjectes
b) 50 subjectes
c) 25 subjectes
9
a) n = 100
a 1.
a 2.
15
102 '94 ( máx . )
= 100 ± 2 '94 〈
97 '06 ( mín . )
100
15
103'87 ( máx . )
( α = 0 '01), 1 − α = 0 '99 CI ∈ 100 ± 2 '58
= 100 ± 3'87 〈
96 '13( mín . )
100
( α = 0 '05), 1 − α = 0 '95 CI ∈ 100 ± 1'96
b) n = 50
b 1.
b 2.
15
104 '16 ( máx . )
= 100 ± 4 '16 〈
95'84 ( mín . )
50
15
105'47 ( máx . )
( α = 0 '01), 1 − α = 0 '99 CI ∈ 100 ± 2 '58
= 100 ± 5'47 〈
94 '53( mín . )
50
( α = 0 '05), 1 − α = 0 '95 CI ∈ 100 ± 1'96
c) n = 25
c 1.
c 2.
15
105'88 ( máx . )
= 100 ± 5'88 〈
94 '12 ( mín .)
25
15
107 '74 ( máx . )
( α = 0 '01), 1 − α = 0 '99 CI ∈ 100 ± 2 '58
= 100 ± 7 '74 〈
92 '26 ( mín . )
25
( α = 0 '05), 1 − α = 0 '95 CI ∈ 100 ± 1'96
Observem:
B En els tres casos el interval 1 B α = 0'99 és més ampli que 1 B α = 0'95, ja
que ha de contenir una proporció més gran (99%> 95%) d'estadístics.
B A mesura que disminuïm n (mida de les mostres) l'interval de probabilitat es
va ampliant o, el que és el mateix, la dispersió dels estadístics és més gran
com menor és n. Això és així, perquè, com més petit és n, més influeix l'atzar.
B) Interval de probabilitat de proporcions (o d'una proporció)
És un interval simètric al voltant de la proporció de la població (p) que conté una
proporció 1 B α de les proporcions observades (po) en mostres de grandària n
extretes a l'atzar de la població origen.
σpo =
α
/2
p - Z α/2 σpo
p⋅q
n
po = p + σpo Zi
Zi
1-α
p
po
α
p + Z α/2 σpo
/2
pr, %
(A)
10
σpo ∈p ± Zα/2 ⋅ σpo = p ± Zα/2 ⋅
p⋅q
n
Exemple. Sabem que una determinada assignatura és suspesa pel 30% de
l'alumnat. Calcular entre quins valors oscillaran els percentatges de suspesos
(α=0,05) en mostres a l'atzar de: a) 100 alumnes b) 400 alumnes
a) n = 100
a 1. ( α = 0'05), 1 − α = 0'95 po ∈ 0'3 ± 1'96
0'3898 → 38'98%
0'3 ⋅ 0'7
= 0'3 ± 0'0898〈
0'2102 → 21'02%
100
b) n = 400
b1. (α = 0'05), 1 − α = 0'95 po ∈ 0'3 ± 1'96
0'3449 → 34'49%
0'3 ⋅ 0'7
= 0'3 ± 0'0449 〈
0'2551 → 25'51%
400
1.2.2 Interval de confiança
L'interval de Probabilitat serveix per resoldre una qüestió de simple predicció (dels
estadístics a partir del paràmetre), però no per a l'estimació estadística pròpiament
dita (estimar paràmetres a partir dels estadístics).
PARÀMETRES
Predicció
Estimació
ESTADÍSTICS
Dos tipus d'estimació estadística:
B
Estimació puntual: a partir d'un estadístic hem de donar un sol i únic valor
per al paràmetre.
Es demostra matemàticament que, en general, la millor estimació puntual d'un
paràmetre (µ, σ2, σ, p) és el seu estadístic corresponent (Ẋ, S2, S, po),
especialment si treballem amb mostres grans (n ≥ 30).
Aquest tipus d'estimació té l'inconvenient que no indica quina és la precisió
d'aquesta estimació. És per aquest motiu que s'utilitza l'estimació per interval.
11
B
Estimació per interval: permet estimar els paràmetres a partir del seu
estadístic corresponent, amb un risc d'error conegut (i petit).
Interval de Confiança: és un interval (simètric) al voltant d'un estadístic que té
una probabilitat 1 B α (generalment 0'95 o 0'99) de contenir el paràmetre.
Un interval és un valor lineal que queda definit pels seus dos límits (superior i
inferior). Els límits de l'interval de confiança van ser denominats per R.A. Fisher,
límits de confiança o límits fiducials.
També es basa en els conceptes de distribució mostral i error típic. Com aquesta
segueix la llei normal (per a mostres grans) el:
95% = (1 B α = 0'95) està comprès entre + 1'96 Z
99% = (1 B α = 0'99) està comprès entre + 2'58 Z
+ Z α/2
A) Interval de confiança d'una mitjana
És un interval simètric al voltant de la mitjana observada que té una probabilitat 1 B
α de contenir la mitjana de la població (µ).
σX =
α
1-α
/2
X − σx ⋅ Zα/2
µ ∈ X ± σ x ⋅ Zα/2 = X ±
σ
n
α
X
/2
X + σx ⋅ Zα/2
σ
Sx
⋅ Zα/2 → X ± Zα/2 ⋅
n
n
Podem calcular la mida de la mostra que ha de fer com a mínim per poder realitzar
l'estimació del paràmetre. Aquest mida dependrà de la precisió (error màxim = e) i
aquest per la seva banda, dependrà del risc α que estiguem disposats a admetre.
B Per poblacions infinites o mostreig no exhaustiu:
Zα/2 ⋅ σ
Z2 α/2 ⋅ σ 2
σ
⋅ Zα/2 ⇒ n =
⇒ n=
e=
2
e
e
n
2
12
B Per poblacions finites o mostreig exhaustiu:
e=
σ
N ⋅ Z2 α/2 ⋅ σ 2
N−n
⋅ Zα/2 ⇒ n = 2
⋅
Z α/2 ⋅ σ 2 + e 2 ( N − 1)
N −1
n
Exemple. Un grup de 100 alumnes d'Estadística ha obtingut en una prova una
mitjana de 5'8 punts i una desviació típica de 1'2. Estimar la mitjana de la població
origen d'aquest grup:
a) Quina és l’estimació puntual de la mitjana de la població?
b) Quina és l’estimació de la mitjana de la població, amb un nivell de confiança del
95%?
c) I amb un nivell de confiança del 99%?
1a ) µ = X = 58
'
12
'
'0352
' ± 0'2352〈655648
= 58
'
100
12
'
'
1c) µ ∈58
' ± 2'58 ⋅
' ± 0'3096〈561096
= 58
4904
'
100
1b ) µ ∈58
' ± 196
' ⋅
Exemple. El mateix però en un grup de 36 alumnes.
2 a ) µ = X = 58
'
12
'
'
' ± 0'392〈56192
= 58
'408
36
12
'
316
2 c) µ ∈58
' ± 2'58 ⋅
' ± 0'516〈56''284
= 58
36
2 b ) µ ∈58
' ± 196
' ⋅
Exemple. Es vol estimar la mitjana de l'alumnat d'una determinada assignatura.
S'accepta que la seva desviació típica és 0'8. Calcular la mida mínima necessària de
la mostra.
a) α = 0'01 i e= 0'2
2'58 ⋅ 0'8
= 106'5024 → 107
0'2
2
n=
b) α = 0'05 i e= 0'2
1'96 ⋅ 0'8
'
= 614656
→ 62
0'2
2
n=
c) α = 0'01 i e= 0'1
13
2'58 ⋅ 0'8
n=
= 426'0096 → 427
0'1
2
d) El mateix que al c, però sabent que N = 512
n=
512 ⋅ 2'582 ⋅ 0'82
21811692
'
=
= 232'7797 → 233
2
2
2
2'58 ⋅ 0'8 + 01
9'3701
' (511)
B) Interval de Confiança de Proporcions (mostres grans)
És un interval simètric al voltant de la proporció observada (po) que té una
probabilitat 1 B α de contenir la proporció de la població (p).
σp =
α
1-α
/2
po - Z α/2 σp
B
α
/2
po + Z α/2 σp
Per poblacions infinites o mostreig no exhaustiu:
p ∈ po ± Zα/2 ⋅ σp = po ± Zα/2
B
po
p⋅q
n
p⋅q
n
Per poblacions finites i mostreig exhaustiu:
p ∈ po ± Zα/2 ⋅ σp = po ± Zα/2
p⋅q N − n
n
N −1
Si es desconeixen p i q (que és lògic):
a) S'estimen a partir de dades obtingudes en estudis anteriors.
b) Es realitza un sondeig previ (estudi pilot).
c) S'agafa el cas més desfavorable p = q = 0,5 (perquè el producte p • q és
màxim: p • q = 0'25).
d) S'utilitzen els valors observats (po i qo):
14
p ∈ po ± Zα/2
po ⋅ qo
n
Hi ha condicions d'aplicació: mostres grans, és a dir,
tots els productes n • p, n • q, n • po han de valer
com a mínim 5.
De manera similar al cas de la mitjana, podem calcular la mida mínima de la
mostra que necessitem per estimar el paràmetre (p), en funció del risc α i la
precisió o error màxim (e).
B Per poblacions infinites o mostreig no exhaustiu:
p⋅q
e = Zα/2 ⋅
n
2
Zα/2 ⋅ p ⋅ q
→ n=
e2
Zα/2
→ n = p⋅q
e
2
B Per poblacions finites i mostreig exhaustiu:
p⋅q N − n
e = Zα/2 ⋅
n
N −1
N ⋅ Z2 α/2 ⋅ p ⋅ q
→ n= 2
e ( N − 1) + ( Z2 α/2 ⋅ p ⋅ q )
Exemple. En un grup de 30 alumnes d'Estadística han aprovat 18. Quina serà la p
d'aprovats de l'assignatura?
B E. puntual:
po → p =
18
= 0'6
30
p = po = 0'6
B E. interval (α = 0'01):
p ∈0'6 ±
0'6 ⋅ 0'4
8308
⋅ 2'58 = 0'6 ± 0'2308〈00''3692
30
Exemple. Com a l’anterior (po = 0,6) però en un grup de 100 alumnes.
B E. puntual: p = po = 0'6
B E. interval (α = 0'01):
p ∈0'6 ±
0'6 ⋅ 0'4
⋅ 2'58 = 0'6 ± 01264
〈00''7264
'
4736
100
15
Exemple. En un estudi d'opinió en el qual només s'ha de contestar sí / no, es
desconeix la tendència de la població. Es vol saber quants individus serà necessari
enquestar per estimar la proporció de resposta amb un error màxim del 4% i una
probabilitat de 0'95.
n=
Z2 α /2 ⋅ p ⋅ q 196
' 2 ⋅ 0'5 ⋅ 0'5
=
= 600'25 → 601
e2
0'04 2
Exemple. Igual que en el problema anterior, però en el cas que hàgim estimat que
el percentatge de respostes a favor està entre el 60% i el 70%.
1'962 ⋅ 0'6 ⋅ 0'4
n=
= 576'24 → 577
0'04 2
Exemple. Si el 75% de l'alumnat aprova una determinada assignatura Quants
alumnes aprovarien en un grup de 200? (α = 0,05)
po ∈ p ± Zα/2
p⋅q
0'75 ⋅ 0'25
81⋅ 200 = 162
= 0'75 ± 196
'
= 0'75 ± 0'06〈00''69
⋅ 200 = 138
n
200
Exemple. Igual que en l'anterior, però en un grup de 64 alumnes.
po ∈ 0'75 ± 196
'
0'75 ⋅ 0'25
8561⋅ 64 = 55
= 0'75 ± 01061
〈00''6439
'
⋅ 64 = 41
64
16
1.3 Teoria de la Decisió Estadística
Tracta de la presa de decisions en Estadística. També es basa en els conceptes de
distribució mostral i error típic.
Es diu prova d'hipòtesis o contrast d'hipòtesis al procediment mitjançant el qual
s'arriba a la decisió de rebutjar o no una determinada hipòtesi.
Hipòtesi: És una proposició o afirmació, que relaciona de forma concreta variables,
que la naturalesa de la qual no coneixem amb absoluta certesa i que, justament per
això, es planteja en termes de conjectura, una cosa que possiblement és certa,
alguna cosa a verificar.
Dos tipus de Hipòtesis estadístiques:
B
Hipòtesi Nulla (H0): la que ens plantegem a priori a verificar i que
"acceptem" o rebutgem després de l'anàlisi estadística de les dades (diferència
estadísticament nulla o no significativa, prou petita com per poder ser
explicada per l'atzar).
B
Hipòtesi Alternativa (H1): és la complementària (no només la contrària) de la
H0 (diferència estadísticament diferent de zero o significativa: massa gran o
diferent de zero com per no ser explicada només per l'atzar).
La teoria de la decisió també es basa en els conceptes de distribució mostral i error
típic:
1-α
α
/2
H1
H0
Zona de probabilitat 1 B α
Zona de no rebuig de la H0
Zona no crítica
Nivell de confiança 1 B α
α
H0
/2
H1
H1
Zona (es) de rebuig de la H0
Zona (es) d’acceptació de la H1
Zona (es) crítiques
Nivell de significació α
Dos tipus de decisions:
17
B Rebutjar la Ho: "Rebutgem la H0 amb un risc α i acceptem la H1" (diferència
significativa).
B No rebutjar ("acceptar") la Ho: "Res s'oposa a acceptar la H0" (diferència no
significativa).
1.3.1 Errors i riscos
Dos tipus d'errors (o riscs d'error):
α: de primera espècie o error típic
β: de segona espècie o error típic II
REALITAT
DECISIÓ
H0 VERDADERA
H0 FALSA
Rebutjar la H0
α: error típic I
o de 1ª espècie
No rebutjar la H0
(acceptar)
Decisió correcta
Decisió correcta (potència d’un
contrast 1 – β)
β: Error típic II
o de 2ª espècie
α: risc d'error conegut (fixat a priori) i petit, habitualment 0'05 (5%) o 0'01 (1%).
β: risc d'error desconegut, perquè depèn de la diferència entre el paràmetre real i el
paràmetre teòric i generalment el paràmetre real el desconeixem.
Anomenarem (en el cas de les mitjanes):
µ : paràmetre teòric.
µ ': paràmetre real (desconegut).
X: estadístic observat.
α = 0’05
n = 36
' ⋅
e = 196
µ = 400
µ’1 = 402
µ’2 = 404
σ=6
σ’1 = 6
σ’2 = 6
6
'
= 196
36
β1
α
/2
397
398
399
400
401
α
/2
β2 402
403
404
405
406
Cas 1: µ‘1 = 402, σ1 = 6
18
407
Cas 2: µ‘2 = 404, σ2 = 6
En el cas 1 (diferència µ‘1 - µ = 402 – 400 = 2) el risc β (intersecció) és ≅ 40 %. En
canvi, en el cas 2 (µ‘2 - µ = 404 – 400 = 4), la diferència és major i el risc β és menor
que en el cas 1.
1.3.2 Potència d’un contrast (funció de potència) (1 D β )
Capacitat que té un contrast per detectar que la H0 és falsa i rebutjarBla. Com
augmentar la potència (1 B β) d'un contrast? (disminuir β):
B Augmentar α (mala solució).
B Augmentar n: la distribució mostral té menys desviació i l'interval de probabilitat
es redueix i també β (sense augmentar α).
µ = 400
µ’ = 403
σ = σ’= 6
α = 0’05
µ = 400
µ‘ = 403
n = 36
'
e = 196
6
'
= 196
36
α
/2
α
/2
β
397
398
399
400
401
402
403
404
405
406
403
404
405
406
n = 64
6
e = 196
'
= 147
'
64
α
/2
397
398
β
399
400
401
α
/2
402
19
En augmentar n (de 36 a 64) els intervals són més estrets i, per tant, el risc β
(intersecció) disminueix.
1.3.3 Grau de significació (P)
És la probabilitat d'observar un valor igual o major al estadístic (quan la H0 és
verdadera) o la probabilitat associada a l’estadístic de contrast.
En els outputs de programes informàtics figura la dada p, i serveix per a la presa
de decisió estadística.
Exemple. La X està a la zona crítica, el valor p (p/2) és menor que α (α/2), per tant,
la decisió és rebutjar la Hipòtesi nulla (H0)
H1
α
1−α
/2
α
/2
µ
X
p/2
X
Exemple. La X està a la zona no crítica, el valor p és més gran que α , per tant, la
decisió és que res no s'oposa a acceptar la Hipòtesi nulla (H0).
p/2
α
p/2
/2
α
µ
/2
X
X
Si p és major o igual a α “ s'accepta” la H0,
en canvi si p és menor a α “s’accepta” la H1
20
1.3.4 Contrasts unilaterals i bilaterals
B C. Bilateral
És aquell contrast on
l’α està situat en ambdós
extrems de la distribució.
B C. de dues cues
B C. no direccional
µ‘ = µ
H0 :
X=µ
(bidireccional)
µ‘ ≠ µ
H1:
X≠µ
α
α
/2
H1
H0
/2
H1
B C. Unilateral
B C. d’una cua
B C.direccional
(unidireccional)
Aquell contrast on l’α està situat en un dels extrems
(inferior o esquerre; superior o dret) de la distribució.
H0 :
µ‘ ≥ µ
H0 :
X≥µ
H1:
µ‘ µ
X µ
µ‘ < µ
H1:
X<µ
µ‘ > µ
X>µ
α
α
H1
H0
H0
H1
Avui en dia els contrastos unilaterals estan força qüestionats perquè:
B
Són menys exigents que els bilaterals.
B
Amb els bilaterals també podem saber si és inferior o superior.
En principi i sempre que no tinguem un criteri explícit (si és superior o inferior, ha
millorat o empitjorat, etc) els contrastos els plantejarem com a bilaterals.
21
Risc α
10%
5%
2%
1%
0’10
0’05
0’02
0’01
1’645
1’96
2’33
2’58
1’28
1’645
2’05
2’33
Bilateral
Zα
α/2
Unilateral
Zα
α
22