Capitulo I Muestreo CORREGIDO
Capitulo I Muestreo CORREGIDO
Capitulo I Muestreo CORREGIDO
CAPITULO I
INTRODUCCIÓN AL MUESTREO
1. 1 INTRODUCCIÓN.
Muestreo es el proceso por el cual se realiza inferencias a la
población examinando una parte de ella; este proceso es
aplicable en nuestra vida personal y cotidiana así por
ejemplo una pareja contrae matrimonio en base a un corto
enamoramiento, con un simple grano de arroz el ama de
casa prueba si todo el arroz esta cocinado en un recipiente,
probando el café contenido en una cucharadita se determina
la calidad de la marca del café, los dosajes y análisis
clínicos (sangre, orina, etc.) Se realizan en base a muestras,
una muestra de roca lunar proporcionan información
científica sobre el origen de la luna, una zona turística de un
país muestra lo atractivo de una parle turística de dicho país
y así diferentes aspectos de la vida, cultura y ciencia son
investigados en base a muestras.
1
Métodos Estadísticos Varela/Llanos /Asnate
1. 2 VENTAJAS DE MUESTREO:
El estudio de una muestra tiene ventajas potenciales en los
diferentes campos de la actividad humana e investigación
científica. Las ventajas del muestreo son:
3
Métodos Estadísticos Varela/Llanos /Asnate
1. 5 METODOS MUESTRALES.
1. Muestreo Probabilística; Es un proceso muestral
donde cada elemento de la población tiene una
probabilidad perfectamente conocida de ser incluida en
la muestra, solo una muestra probabilística proporciona
estimaciones con medida de ser precisión.
2. Muestreo estratificado.
Es un método que trata de diseñar una muestra más
eficiente que la que se tiene por un procedimiento
simple, el muestreo estratificado requiere que la
población este dividida en grupos homogéneas o clases
llamadas estatus. Para seleccionar muestras se toman de
cada uno de los estratos y hacer las respectivas
estimaciones de los parámetros mas usados: Promedio,
Desviación estándar o desviación típica, o error típico,
coeficientes de variación y otros.
7
Métodos Estadísticos Varela/Llanos /Asnate
3. Muestreo Sistemático:
El muestreo sistemático es otra forma de seleccionar
“n” elementos de una población de tamaño “N”, donde
se seguirá un orden pre establecido es decir tomando
elementos cada cierto número constante de espacios o
cada cierto número de elementos, puesto que las
unidades para este tipo de muestreo deben estar
ordenadas o factibles de ser ordenados, su aplicación
generalmente es en estudio de archivos, estudio de
clientes, etc.
4. Muestreo de Conglomerados.
Se refiere al procedimientos se refiere al procedimiento
de dividir a la población en grupos o conglomerados de
unidades o elementos de la población y se extrae
muestras de conglomerados que representen a la
población cuando se observan todas las unidades
elementales en las agrupaciones muéstrales se conoce
como el nombre de muestreo monoetapico, cuando se
extrae una muestra de todas las agrupaciones se conoce
con el nombre de bietapico en ambos procedimientos
también se muestrea aleatoriamente.
TÉRMINOS BÁSICOS
PARAMETROS POBLACIONALES
El PARAMETRO es una función de los valores de todas las
N unidades de la población. Este valor es único, constante y
por lo general desconocido.
Entre los parámetros más usuales tenemos:
MEDIA POBLACIONAL
Es la media aritmética de los valores de la variable
poblacional en estudio. Se obtiene dividiendo el total
poblacional por el número de unidades de la población. Se
denota por Y o X . Así:
Y X
Y= X=
N N
10
Métodos Estadísticos Varela/Llanos /Asnate
VARIANZA POBLACIONAL
Llamamos varianza poblacional a la variabilidad de los
valores de la variable en estudios en la población y es
medida por la media aritmética del cuadrado de las
desviaciones de las observaciones poblacionales con
respecto a su media.
Se denota por y2 así:
1 N
σ 2y = (Yi-Y) 2
N i=1
1 N
S2Y = (Yi-Y) 2
N-1 i=1
11
Métodos Estadísticos Varela/Llanos /Asnate
RAZÓN POBLACIONAL
Se obtiene dividiendo los totales o medias poblacionales
correspondientes a dos variables estudio, se denota por R,
Así:
Y Y
R= =
X X
1 N
C(X,Y)=σ YX = (Yi -Y)(Xi -X)
N i=1
12
Métodos Estadísticos Varela/Llanos /Asnate
σ XY
ρ XY =
σYσX
PROPORCIÓN POBLACIONAL
Si “A” unidades del total N poseen un cierto atributo o
pertenecen a una cierta categoría (tal como N° de viviendas
que no poseen desagüe), la proporción poblacional P de
tales unidades es:
A
P=
N
N! N
=
n!(N-n)! n
AB, AC, BC
1 1
La probabilidad es igual a: =
N Pn N(N-1)...(N-n+1)
1 n!(N-n)!
b.2 Sin considerar el orden:
N N!
La probabilidad es igual a: n
MUESTREO ESTRATIFICADO
1. INTRODUCCION.
En ocasiones la población que se va a investigar se
fracciona o subdivide en grupos de características similares,
En cada subdivisión la población tiende a ser más
16
Métodos Estadísticos Varela/Llanos /Asnate
19
Métodos Estadísticos Varela/Llanos /Asnate
3 . NOTACIONES:
h : Denota el estrato ( h = 1, ... L)
i : Denota la unidad dentro del estrato
L : Denota el número de estratos.
Nh: Número de unidades en el estrato “h” o tamaño de
estrato.
nh : Número de unidades de la muestra seleccionada en el
estrato “h” o tamaño de muestra en el estrato h.
yhi: indica el valor de la i-ésima unidad observada en el
estrato “h”
Nh
Wh = : Ponderación del estrato “h” en la
N
población
nh
fh = : Fracción de muestreo en el estrato “h”
Nh
20
Métodos Estadísticos Varela/Llanos /Asnate
Nh
Y
i=1
hi
Yh = : Media del estrato "h"
Nh
nh
y hi
yh Medía de la muestra del estrato “h”
nh
(Estimador insesgado de Yh )
Nh
(Y hi Y h )2
Sh2 Varianza Práctica del estrato “h”
Nh 1
nh
(y hi y h )2
sh2 Varianza de la muestra en el estrato
nh 1
“h”.
Y h Nh y h Estimador insesgado del Total del
Estrato “h”
4. ESTIMADORES
A.-ESTIMADOR DE LA MEDIA POBLACIONAL ( y st )
El estimador de la media poblacional en el muestreo
estratificado es:
L L
Y h N h yh
y st
N N
Donde:
yh : Media de la muestra en el estrato "h"
21
Métodos Estadísticos Varela/Llanos /Asnate
22
Métodos Estadísticos Varela/Llanos /Asnate
estudio Yh
i 1
Yhi ; Yˆ
h N y
h h Y
h 1
Yh ; y st
h 1
Yh Yst
TOTAL
Yh Y
MEDIA Yh ; yh Y ; yst / N Yˆst / N
Nh N
Para una
variables Yh y
estudio Rh ; rh h
Xh xh Y
RAZON R ; Rˆ st Yˆst / Xˆ st rst
DE X
TOTALE
S
23
Métodos Estadísticos Varela/Llanos /Asnate
PROBLEMAS RESUELTOS
1.- En una población con N = 6, A = 4 y A’ = 2, calcular el
valor de a para todas las posibles muestras simples
aleatorias de tamaño 3.
a) Verificar los teoremas dados para la media y la
varianza.
b) Verificar que:
N n Es un estimador insesgado de la varianza de
pq
( n 1) N
p.
Solución
a) Si el muestreo es sin reemplazo el número total de
muestras a seleccionar será:
N 6
20
n 3
A 2 A
P ; Q 1/ 3
N 3 N
Ahora, sea A1, A2, A3, A4 los elementos de A y B1, B2 los
elementos de A, entonces tenemos:
Muestras a p q Pq (p –
P2)
(1) A1A2A3 3 1 0 0 1/9
(2) A1A2A4 3 1 0 0 1/9
(3) A1A2B1 2 2/3 1/3 2/9 0
(4) A1A2B2 2 2/3 1/3 2/9 0
(5) A1A3A4 3 1 0 0 1/9
(6) A1A3B1 2 2/3 1/3 2/9 0
(7) A1A3B2 2 2/3 1/3 2/9 0
(8) A1A4B1 2 2/3 1/3 2/9 0
(9) A1A4B2 2 2/3 1/3 2/9 0
(10) A1B1B2 1 1/3 2/3 2/9 1/9
(11) A2A3A4 3 -1 0 0 1/9
(12) A2A3B1 2 2/3 1/3 2/9 0
24
Métodos Estadísticos Varela/Llanos /Asnate
b) b.1.-
E( p) pi Pr ob( pi) (40 / 3)(1/120) 2 / 3 P
Luego: E (p) = P
b.2.-
V ( p) ( pi P)2 Pr ob( pi) ( pi P)2 (1/ 20)
= (8/9) (1/20) =
2/45
Por otra parte:
PQ N n (2 / 3)(1/ 3) 6 3
(2 / 27)(3 / 5) 2 / 45
n N 1 3 5
Luego: PQ N n
n N 1
N n (6 3)
c) E ( s 2p )
(n 1) N
E ( pq)
(3 1)6
pi qi Pr ob( Pq
i i)
25
Métodos Estadísticos Varela/Llanos /Asnate
0.6 0.0669
De donde: LSp = 0.6669 LIp = 0.5331
Luego los límites de A en la población serán:
LSA = NLSp = 2000(0.6669) = 1334
LSA = NLSp = 2000(0.5331) = 1066
Por consiguiente, con el 95% de confianza, el número de
colegios a favor de la propuesta se encuentra entre 1,066 y
1334.
26
Métodos Estadísticos Varela/Llanos /Asnate
b. Nivel de significancia:
= 0.05
c. Distribución para la prueba: Distribución normal
d. Función Pivotal:
pP
z
sp
e. Valor Experimental:
0.6 0.5
zo 3.039
0.0329
Donde:
N n
s 2p pq
(n 1) N
2000 200
(0.6)(0.4)
(200 1)2000
= 0.00108
Luego: sp = 0.0329
f.- RR y RA de Ho
RA/Ho: Si z < 1.64 se acepta Ho
RA/Ho: Si z > 1.64 se acepta Ho
g. como zo pertenece a la RR/Ho, entonces se acepta H1
h. Conclusión: La mayoría de los colegios están a favor
de la propuesta.
Nota: Z = 3.039 le corresponde una probabilidad de 0.0012,
o sea que la prueba es casi concluyente; pues se acepta Ha
con el 0.12% de participación del azar.
27
Métodos Estadísticos Varela/Llanos /Asnate
28
Métodos Estadísticos Varela/Llanos /Asnate
29
Métodos Estadísticos Varela/Llanos /Asnate
Cond.
Prob.
(p-P)
a2
a3
30
Métodos Estadísticos Varela/Llanos /Asnate
Muestras
Cond.
Prob.
(p-P)
a2
a3
p
C1C2C3D1 3 1 3/4 1/5 ¼ C1D1D2D3 1 3 1/4 1/5 -1/4
C1C2C3D2 3 1 3/4 1/4 C2D1D2D3 1 3 1/4 -1/4
C1C2C3D3 3 1 3/4 1/4 C3D1D2D3 1 3 1/4 11/4
C1C2D1D2 2 2 2/4 1/4
C1C2D1D3 2 2 2/4 0
C1C2D2D3 2 2 2/4 0
C1C3D1D2 2 2 2/4 3/5 0
C1C3D1D3 2 2 2/4 0
C1C3D2D3 2 2 2/4 0
C2C3D1D2 2 2 2/4 0
C2C3D1D3 2 2 2/4 0
C2C3D2D3 2 2 2/4 0
Para n’=4:
b.1.- E( p ) pi Pr ob. Cond . pi
= (1/5)(3/4)+(2/4)(3/5)+(1/4)(1/5) = 1/2
Luego se cumple la relación:
E (p) = P
b.2.- V( p ) ( p P)2 Pr ob. Cond . pi
= (1/4) (1/5) + (0) (3/5) + (-1/4) (1/5) =
= 1/40
Por otra parte,
31
Métodos Estadísticos Varela/Llanos /Asnate
N ' n ' PQ
V( p ) Se cumple
N ' 1 n '
Solución
a) Estimador del porcentaje de familias en el área, que
cuentan con baño interior de uso exclusivo:
32
Métodos Estadísticos Varela/Llanos /Asnate
y DE ( p) 0.0012648 3.6%
Aˆ N (1 n / N )
pq
n 1
donde; pˆ a / n 34 / 290 0.1172
(0.1172)(0.8828)
(14,828) (1 290 /14828)
289
= 14,828 (0.018735)
= 278 familias
p
a i
= 22/104 = 0.21154 = 21.15%
m i
V ( p)
nm 2 n 1
Donde: n es el tamaño de muestra de conglomerados
(familias)
m es el tamaño familiar promedio = m/n = 104/30
34
Métodos Estadísticos Varela/Llanos /Asnate
= 3.4667
personas
Como N es desconocido, asumimos que n/N tiende a
0
Luego:
1 32 2(0.21154)(87) (0.21154(404)
V ( p) 2 0.00184
30(3, 46667) 29
Ahora varianza Binomial:
pq
V( p ) Donde n es el número de personas que
n
consultaron al dentista
(0.21154)(0.7884)
0.001603
104
Por consiguiente podemos concluir que la varianza
Binomial es menor que la hipergeométrica.
INFORMACIÓN DE UNA MUESTRA SIMPLE
ALEATORIA DE 30 FAMILIAS
N° de N° de Dr. Visto No miai a 2 mi2
i
familia persona en el año
s s Si (ai)
mi
1 5 1 4 5 1 25
2 6 0 6 0 0 26
3 3 1 2 3 1 9
4 3 2 1 6 4 9
5 2 0 2 0 0 4
6 3 0 3 0 0 9
7 3 1 2 3 1 9
8 3 1 2 3 1 9
9 4 1 3 4 1 16
10 5 0 4 0 0 16
11 3 1 2 3 1 9
35
Métodos Estadísticos Varela/Llanos /Asnate
12 2 0 2 2 0 4
13 7 2 5 14 4 49
14 4 1 3 4 1 16
15 3 0 3 0 0 9
16 5 1 4 5 1 25
17 4 4 0 16 16 16
18 4 1 3 4 1 16
19 3 1 2 3 1 9
20 3 0 3 0 0 9
21 4 1 3 4 1 16
22 3 0 3 0 0 9
23 3 1 2 3 1 9
24 1 0 1 0 0 1
25 2 0 2 0 0 4
26 4 0 4 0 0 16
27 3 1 2 3 1 9
28 4 1 3 4 1 16
29 2 0 2 0 0 4
30 4 0 4 0 0 16
36
Métodos Estadísticos Varela/Llanos /Asnate
1,536.64
n 869 granjas
1536.64
1
2, 000
b.- Para una zona con 200,000:
no/N = 1536.64/200,000 = 0.768% que es menor del 5%
Por consiguiente “n” óptimo es igual a:
n = 1,537
c.- Para una zona con 5’000,000 de granjas
no/N = 0.03073% que es menor del 5%
Por consiguiente, el tamaño de muestra óptimo, será igual a:
n = 1,537
Nota: A mayor tamaño de población no corresponde mayor
tamaño de muestra; esto se puede apreciar en el ejercicio. El
tamaño de muestra está en relación con el coeficiente de
seguridad y la precisión.
Solución
a) Para propietarios:
N n PQ
V( p ) (0.02) 2
N 1 n
37
Métodos Estadísticos Varela/Llanos /Asnate
i) Para P = 45%
(4000 n) (0.45)(0.55)
0.0004
3999 n
De donde
n = 535.945
i) Para P = 5% = 0.05
(4000 n) (0.05)(0.95)
0.0001
3999 n
de donde
n = 424.67
ii) Para P = 10% = 0.10
(4000 n) (0.10)(0.90)
0.0001
3999 n
de donde
n = 734.84
38
Métodos Estadísticos Varela/Llanos /Asnate
7 6 5 4 3
1 3 2 1 1
Solución
La varianza de la muestra es:
s2
1
fi yi2
fi yi 2 (1/ 49) 54, 497 (1471)2
50
n 1
fi
= 229
Suponiendo que el valor de s2 es el valor de s2 en la
población, entonces el tamaño de muestra previa para el
total de firmas será:
N 2 Z 2 S 2 N 2 Z 2 S 2 (676)2 (2)2 (229)2
no 418.59
d2 d2 (1000)2
39
Métodos Estadísticos Varela/Llanos /Asnate
no 418.59
Ahora, como 0.5947 0.05
N 676
Entonces, el tamaño de muestra para el total será:
n 418.59
n o 258.51 259 hojas
no 1 0.5947
1
N
Por consiguiente, para estimar el número total de firmas se
necesita una muestra de 259 hojas.¨
de donde:
Q 0.99
n 2
2, 475 Individuos
CV( p ) P (0.20) 2 (0.01)
40
Métodos Estadísticos Varela/Llanos /Asnate
2
1.10
n= = 484 trabajadores
0.05
ii) tamaño de muestra según área:
El máximo coeficiente de variación en áreas corresponde a
acres en avena con un CV (y) = 0.44 y como se desea CV
2
0.44
(y) = 0.025, entonces: n= = 310
0.025
42
Métodos Estadísticos Varela/Llanos /Asnate
43
Métodos Estadísticos Varela/Llanos /Asnate
Solución
Sea yi el valor de la variable aleatoria, entonces:
n1 = 20 y i 1.4941 y 2
i 0.11197099
1 yi
2
2
s2 yi
2
1 0.11197099 (1.4941)
n1 1 n1 19 20
= 1.8644736 x 10-5
Luego:
s2 2 1.8644736 x105 2
n 1 7 1 82
v n1 2.5 x10 20
y por consiguiente, se necesitarán:
n – n1 = 82 – 20 = 62 observaciones más
44
Métodos Estadísticos Varela/Llanos /Asnate
Solución
La relación entre el rango (R) y la varianza de la
distribución matemática puede utilizarse para estimar la
varianza. Deming (1,960) dio las siguientes reglas para
estimar la varianza dado el rango y si la forma de la
distribución era conocida o supuesta.
Coeficiente
Tipo de Desviación
Media Varianza de
Distribuc. Estándar
variación
Binomial (p) p(1- R
(1 p) / p
Rectangular (R) p)/R2 p(1 p)
Triangular I (1/2)R R2/12 0.58
0.29R
Triângulo (1/3)R R2/18 0.71
0.24R
II (2/3)R R2/18 0.35
0.24R
Normal (1/2)R R2/36 1/3
R/6
45
Métodos Estadísticos Varela/Llanos /Asnate
46
Métodos Estadísticos Varela/Llanos /Asnate
47
Métodos Estadísticos Varela/Llanos /Asnate
48
Métodos Estadísticos Varela/Llanos /Asnate
49
Métodos Estadísticos Varela/Llanos /Asnate
6, 000 4, 000
X 5, 000
2
6, 000 4, 000
S 333
6
Por consiguiente, para una seguridad del 95% (Z = 1.96) y
un error relativo del 3% obtenemos:
2 2
no = ZS 1.96 x333 19
d 0.03 x5000
(Tamaño muy próximo al calculado anteriormente)
51
Métodos Estadísticos Varela/Llanos /Asnate
Obser Muest X1 X2 X3 X4 X5 X6 X7 X8
vació ral N°
no Pobla X14 X18 X18 X16 X10 X4 X43 X32
eleme cional 9 6 2 7 2 6 9 9
nto N°
Sˆ sx2 321.11
2
x
3.2.- INTERVALICAS
Para la construcción de los intervalos de confianza para la
media y el total es necesario el cálculo de las varianzas de
los estimadores y para ello se requiere determinar el tipo de
muestreo a trabajar.
1) El tipo de muestreo se determina mediante la fracción
muestral. Así en nuestro ejemplo:
52
Métodos Estadísticos Varela/Llanos /Asnate
Del total:
Vˆ ( Xˆ ) N 2 ( s 2 / n) (600) 2 (4296.33) 1546678.800
Luego;
sx 39,327.84
Nota: Al trabajar con los estimadores de los estimadores,
sólo requerimos del tamaño de población; el resto, es
información muestral lo cual constituye una gran ventaja.
Intervalos de confianza:
Para la Media:
Xˆ t( / 2n1 ) s Xˆ
4,487 x 4758
Así, la remuneración promedio de los docentes con 10 a 20
años de servicio a diciembre de 1987 y con una
probabilidad del 95% fluctúa entre 2’692.004.7 y
2’854,743.3
Nota: Se emplea el coeficiente de confianza t( / 2;n 1) por ser
la muestra menor de 30.
IV.- APLICACIONES
53
Métodos Estadísticos Varela/Llanos /Asnate
C. Estimación Interválica
Xˆ Z / 2 sx
20,000 1.96 (1391.4)
17,272.86 X 22,727.14 kg
54
Métodos Estadísticos Varela/Llanos /Asnate
y 5 6 7 5 6 5 5 5 6 7 7 7 5 5 7
i 2 2 3 7 8 4 3 1 3 0 0 1 5 9 1
x 3 4 5 4 4 4 4 3 4 4 5 5 4 4 4
i 8 3 0 5 5 2 0 8 6 8 3 0 0 7 7
5 7 7 6 5 5 5 5 6 5 7 4 5 5 7
8 2 4 3 3 2 6 7 0 8 4 8 2 7 0
4 4 4 4 4 3 4 4 4 4 5 3 3 4 4
4 8 9 6 0 9 2 1 6 4 0 7 9 4 8
Estimar:
a) La talla media de los niños a los 7 meses de edad.
b) El error estándar del estimador.
55
Métodos Estadísticos Varela/Llanos /Asnate
Cálculos previos
y i y 11391; s 8.1467
1,833; 2
i y
56
Métodos Estadísticos Varela/Llanos /Asnate
N
k 1
k pk qk ck
Donde:
N, denota el tamaño del i-ésimo estrato
pi , denota la proporción poblacional para el i-ésimo estrato
ci , denota el costo por obtener una reservación individual
de i-ésimo estrato.
57
Métodos Estadísticos Varela/Llanos /Asnate
y8 42.50
y9 39.00
Solución:
Es conveniente presentar los datos y cálculos de la
muestra como se indica en la tabla.
Al sumar las cantidades en la columna “y”,
obtenemos:
9
y
i 1
i = 368.00
De la columna de y 2 , tenemos
9
y
i 1
i
2
= 15,332.50
y 1
368.00
y i 1
40.39
9 9
58
Métodos Estadísticos Varela/Llanos /Asnate
2
S = i 1 i 1 i 1
n 1 8
= 1 15,332.50 (368) 1 15,332.50 15, 047.11
2
8 9 8
= 35.67
Utilizando la ecuación, obtenemos el límite para el error de
estimación.
s2 N n 35.67 484 9
2 Vˆ ( y) 2 2
n N 9 484
60
Métodos Estadísticos Varela/Llanos /Asnate
N 2
n
( N 1) D 2
B 2 32
Donde D 2.25
4 4
1000(625)
Así, n 217.56
999(2.25) 625
61
Métodos Estadísticos Varela/Llanos /Asnate
= 333.56
Esto es, 334 estudiantes deben ser entrevistados para
estimar la proporción de estudiantes que está a favor de una
propuesta de código de honor, con un límite para el error de
estimación de B = 0.5.
ni ni
( yi
j 1
j yi )2 y
j 1
2
ij ni yi2
si2
ni 1 ni 1
65
Métodos Estadísticos Varela/Llanos /Asnate
=
1 (155)2 (0.871)(35.358) (62) 2 (0.871)(232.411) (93)2 (0.871)(87.636)
(310)2 20 8 12
66
Métodos Estadísticos Varela/Llanos /Asnate
67
Métodos Estadísticos Varela/Llanos /Asnate
N
i 1
i i
2
N1 12 N 2 22 N 3 32
N i
2
i
2
/ wi
6, 991.275 6, 991.275
n i 1
56.7
3
96.100 27.125
N 2 D N i i2
123.225
i 1
Solución:
N i i
i 1
2
Donde: Ni i (50)(2.5) (40)(2.0) 125 80 205
i 1
Entonces:
ni = n Ni i
n
125
0.61n
2
N i i
205
i 1
80
y n2 n 0.39n
205
Entonces w1 = 0.61 y w2 = 0.39
Debemos calcular las siguientes cantidades para poder
encontrar n:
2
N
i 1
i i
2
(50)(2.5) 2 (40)(2.0) 2 472.50
70
Métodos Estadísticos Varela/Llanos /Asnate
B 2 (1)2
D 0.25
4 4
Usando la ecuación tenemos:
2
3
Ni i
n i 1
2
N 2 D N i i2
i 1
(205)2
n 16.83
(90) (0.25) 472.50
2
n1 = n w1 = (17) (0.61) = 10
n2 = nw2 = (17) (0.39) = 7
71
Métodos Estadísticos Varela/Llanos /Asnate
L 2
ˆ
V (Yst ) N Wh
2 2 Sh
(1 f h )
h 1 nh
L
S2
V (Yˆst ) N 2 Wh2 h
h 1 nh
L
Sh2 L
Sh2
= Nh ( Nh nh )
h 1 nh
= Nh2
h 1 nh
L
Sh2 L
Sh2
= Nh ( Nh nh )
h 1 nh
= Nh2
h 1 nh
72
Métodos Estadísticos Varela/Llanos /Asnate
L
sh2
y Z / 2 W n h
2
nh
L
sh2
Y Z / 2 N Wh2 nh
73
Métodos Estadísticos Varela/Llanos /Asnate
PROBLEMAS
1.- Sea la población hipotética de 6 familias (N = 6),
clasificadas en N1 = 3 familias del sector I y N2 = 3 familias
del sector II; para las cuales presentamos los siguientes
datos correspondientes al ingreso familiar.
FAMILIAS
DEL SECTOR I DEL SECTOR II
N1 = 3 N2 = 3
Y1i Y2i
Y11 = 2 Y21 = 8
Y12 = 4 Y22 = 12
Y13 = 6 Y23 = 16
Y1 = 12 Y2 = 36
Y1 4 Y 2 12
a. Número de estratos: L = 2
L2
b. N N h N1 N 2 3 3 6
h 1
d. Total Poblacional
L L Nh
Y Yh Yhi Y1 Y2 12 36 48
h 1 h 1 i 1
Y1 12
En sector I Y1 4
N1 3
Y2 36
En sector II Y2 12
N2 3
f. Media poblacional o ingreso familiar promedio
Y (Y1 Y2 ) (12 36)
Y 8
N ( N1 N 2 ) 33
Demostración:
3
a) N° de muestras en cada estrato: De estrato I 3
2
3
De estrato II 3
2
b) N° de muestras posibles a seleccionar de la población:
3 3
9
2 2
c) Muestras y estimadores
Estratos
75
Métodos Estadísticos Varela/Llanos /Asnate
I II y1 y2 y1 y2 N1 y1 N1 y 2 Y st y st
2,4 8,12 6 20 3 10 9 30 39 39/6
8,16 24 12 36 45 45/6
12,16 28 14 42 51 51/6
2,6 8,12 8 20 4 10 12 30 42 42/6
8,16 24 12 36 48 48/6
12,16 28 14 42 54 54/6
10 20 5 10 15 30 45 45/6
24 12 36 51 51/6
28 14 42 57 57/6
a)
M 9
E (Yˆst ) Y st P(Yˆst ) 39 / 6(1/ 9) 45 / 6(1/ 9) ... 57 / 6(1/ 9)
= (1/9)(432) = 48
Como Y = Y1 + Y2 = 12 + 36 = 48
Entonces: E(Yˆ ) Y 8 st y
Por consiguiente, Yˆst es INSESGADO de Y
b)
E ( y st ) y st P( yst ) 39 / 6(1/ 9) 45 / 6(1/ 9) ... 57 / 6(1/ 9)
= (1/9)(432/6) = 8
Como Y = Y/N = 48/6 = 8
Entonces: E( y st ) Y 8 y
Por consiguiente, y st es INSESGADO de Y
Ejemplo:
76
Métodos Estadísticos Varela/Llanos /Asnate
En estrato I En estrato II
s (2 4) / 2 2
2
1
2
s22 (8 12) 2 / 2 8
= (2 – 6)2/2 = 8 = (8 – 16)2/2 = 32
= (4 – 6)2/2 = 2 = (12 – 16)2/2 = 8
b) Estimador de la varianza de y st
Se obtiene para cada muestra de tamaño n = 4
Para muestra: (2, 4, 8, 12) obtenemos:
2 2
S
Vˆ ( y st ) Wh2 (1 f h ) h
h 1 nh
77
Métodos Estadísticos Varela/Llanos /Asnate
N ( N1 n1 ) s1 N2 ( N2 n2 ) s2
2 2 22
= 1
N N1 n1 N N2 n2
= 3 (3 2) 2 3 (3 2) 8 15
2 2
3 3 2 6 3 2 36
y de esta manera obtenemos todos los valores de la columna
Vˆ ( y )
st
c) Valor esperado de Vˆ ( y st )
M
E Vˆ ( y st ) Vˆ ( y st )P Vˆ ( y st )
N1 n1 S12 N n S2
= W12 W22 2 2 2
N1 n1 N 2 n2
78
Métodos Estadísticos Varela/Llanos /Asnate
1 L N h2 PhQh
V ( pst )
N2
n
h
a. Encontrar P, ph
80
Métodos Estadísticos Varela/Llanos /Asnate
Y 1i
2
P1 40%
N1 5
5
Y 2i
4
P2 80%
N2 5
La proporción poblacional es:
10
Y 1i
6
P 60%
N1 10
Que se puede obtener también como:
L
N P h h
N1 P1 N 2 P2 5(2 / 5) 5(4 / 5)
P 6 /10 60%
N N 10
y 1i
1
p1 50%
n1 2
81
Métodos Estadísticos Varela/Llanos /Asnate
n2
y 2i
2
p2 66.7%
n2 3
P1 = p1 = 50% = 1/2
P2 = p2 = 66.7% = 2/3
3. Estimador de P:
pst =
N h ph
(5)(1/ 2) (5)(2 / 3)
7 /12
N 10
Por consiguiente: P pst 7 /12 58.3%
82
Métodos Estadísticos Varela/Llanos /Asnate
Estratos
I II p1 p2 pst
1, 0 0.5 0.50
1, 0 1, 0 0.5 0.5 0.50
0, 0 0.0 0.25
1, 0 0.5 0.75
1, 1 1, 0 1.0 0.5 0.75
0, 0 0.0 0.50
1, 0 0.5 0.50
0, 1 1, 0 0.5 0.5 0.50
0, 0 0.0 0.25
4.50
83
Métodos Estadísticos Varela/Llanos /Asnate
Nh sh Nh
nh (500) nh (500)
Nh sh N
84
Métodos Estadísticos Varela/Llanos /Asnate
A
'
fijacione
Estrato N h' ss' Y h Nh' y h s (nh)
Proporciona
Neyman Proporcional
l al total Yh'
I 2812.5 2444 84 153 50
II 417.2 5854 125 138 120
III 4569.6 7007 138 115 144
IV 3708.8 6685 112 73 137
V 1358.8 2355 41 21 49
TOTAL 16566.9 24345 500 500 500
(89)2 (15.8)2 89 41
84374 + 108136 + 106902 +
41 89
76960 + 26011 = 402356
85
Métodos Estadísticos Varela/Llanos /Asnate
(89)2 (15.8)2 89 49
150447 + 113908 + 100624 +
49 89
54645 + 18137 = 437761
Cuadro N° 3
Varianzas del N° total de cabezas de ganado de acuerdo a
las diferentes afijaciones
Estrato Neyman Proporcional Proporcional a Yh
'
86
Métodos Estadísticos Varela/Llanos /Asnate
Cuadro N° 1
Estimaciones del N° total de familias, proporción con radios
a transistores y costo de muestrear una familia en cada
ciudad.
Ciudad h N° de Proporción con Costo de
familias Nh radio Ph muestreo Ch
I 140 000 0.10 2.25
II 30 000 0.25 1.00
170 000
87
Métodos Estadísticos Varela/Llanos /Asnate
PhQh
I 0.450 63 000 0.20 28 000 7 369
II 0.4330 12 990 0.4330 12 990 3 419
10
75 990
788
n1
2
n2 ? x x
3
1 2
89
Métodos Estadísticos Varela/Llanos /Asnate
2 2
x x (n 2 ) 1 / 2 (n 1 ) 1 / 2
3 3
2 1
n 2 (6 x3) / 2
2
n 2 81 Rpta.
9.- Se extrae dos muestras aleatorias de una misma
población y si el error estándar de una de ellas es k
veces el error estándar de la media de la otra ¿Cuál
es la relación entre los tamaños de ambas muestras?
Solución:
x
n1 n 2 ? x 1
n1
1 / 2
x k. x
1 2
.n 1 k. .n -1/2
n1 1 n1 1
Rpta.
n2 k2 n2 k2
10.- Una firma constructora de canales desea estimar la
residencia promedio de las barras de acero utilizadas
para dichas construcciones. ¿Qué tamaño de muestra
se requiere para garantizar que habrá un riesgo solo
del 0.001 de sobrepasar un error de 5Kg o más en la
estimación? La desviación estándar de la resistencia
de este tipo de barras se estima en 50 libras.
Solución:
90
Métodos Estadísticos Varela/Llanos /Asnate
50 lb.
E Z 1 x z . .......... .....(*)
n
0.4536
E 50 lb.( ) 22.68 kg
1 lb,
0.001 1 - 0.999
№ de unidades 0 1 2 3 4 5 10 12
defectuosas
№ de cajas 37 16 8 8 4 2 2 13
examinadas
91
Métodos Estadísticos Varela/Llanos /Asnate
E2= 0.12
n=80
80
P 0.02 5% sin reemplazo
4000
Y 1.725
S 2 7.95
95% Z 1.96
Z 2 SN
n
d 2 N S2 Z 2
Z 2 S 2y N
n1 2
d 1 N Z 2S 2y
(1.96) 2 (7.95)(4000)
n1
(0.06) 2 (4000) (1.96) 2 (7.95)
n 1 2718 Rpta.
Z 2 S 2y N
n2
d 22 N Z 2S 2
Z 2S 2y N (1.96) 2 (7.95)(4000)
n2
d NZ S
2
2
2 2
y (0.12) 2 (4000) (1.96) 2 (7.95)
n 2 1386 Rpta.
93
Métodos Estadísticos Varela/Llanos /Asnate
Solución:
Z 2S (1.96) 2 (1.2) 2
n 2 61.4656
E (0.3) 2
n 62 Rpta.
14.- ¿Cuántos alumnos deben encuestarse para estimar el
número total de lapiceros anuales que consumen los
1500 alumnos de la especialidad con una precisión de
500 lapiceros y una seguridad del 95%?. En una
encuesta preliminar se obtuvo que la desviación
estándar fuera de 3 lapiceros.
Solución:
N 1500
Z 2 95% 1.96
i 3 i2 9
d 500
N 2 Z 2S 2
n
d2
(1500) 2 (1.96) 2 (9)
n
(500) 2
n 311.16 312
n 312
5%
N 1500
312
n 258.278
312
1
1500
n 259 Rpta.
94
Métodos Estadísticos Varela/Llanos /Asnate
Solución:
6 8 10 12 14
6 6,6 6,8 6,10 6,12 6,14
8 8,6 8,8 8,10 8,12 8,14
10 10,6 10,8 10,10 10,12 10,14
12 12,6 12,8 12,10 12,12 12,14
14 14,6 14,8 14,10 14,12 14,14
Diagonal superior
Diagonal inferior
Para muestra de tamaño 2:
Con reemplazo
Nn=52=25 todos
Sin reemplazo:
Considerando el orden:
5!
P25 20 parte diagonal superior e inferior
(5 2)!
Sin considerar el orden:
5!
C 52 10 diagonal superior
(2!)(3!)
96
Métodos Estadísticos Varela/Llanos /Asnate
b) L.C(P) P Z 1 - f pq n 1 2n
L.C(P) 0.6 1.96( (0.9)(0.6)(0.4)(12000) 1 400
L.C(P) (0.667; 0.533)
V ( P)
10000 500
V ( P) 0.000456
Luego el error estandar sería :
S(e) (0.000456) 0.021
Límite
PKS(p) Probabilidad
Superior Inferior
0.41(0.021) 0.421 0.379 68%
0.42(0.021) 0.442 0.358 95%
0.43(0.021) 0.463 0.337 99.7%
99
Métodos Estadísticos Varela/Llanos /Asnate
d1 177 177
P1 0.298
n1 416 177 593
n1 n
Como se conoce N 1 , reemplazam os f 1 por f
N N
p1q1 p1q1 1 (0.298)(0.702)
V(P) (1 - f 1 ) V(P) (1 - f) 1
n1 n1 6 593
V ( P ) 0.0003312
El error estándar será :
S(P) 0.0003312 0.0182
c) El tamaño medio de una familia inmigrante:
Yi 2442
Y1 3.188
n1 766
Como no se conoce , reemplazam os f 1 por 1 16
(1 - f1 ) S12 (1 f)S12
V (Y1 )
n1 n1
(17.785 (2442) 2 ) 1
Donde : S12 (766 1) 13.072
766
100
Métodos Estadísticos Varela/Llanos /Asnate
1 13.072
V (Y ) 1 0.016
16 766
Error estándar será :
S(Y) 0.016 0.1265
El coeficiente de variación es :
S(Y) 0.1265 3.188
CV(Y) (100) 3.97%
Y 100
N
d) Y1 Y1 16(245) 3920
Varianza estimada es:
N(1 - f)S12
V (Y1 ) donde :
n1
S Y1
Y1 1
2
(215) 2 1
2 2
(n 1)
1053
1000 999
1
n
1 0.994
V (Y1 ) (16000) 2 1 238540.8
6 1000
Su error estándar será :
S(Y) 238540.8 488.41
S(y) 488.41
La C.V(y) es : C.V(y) ( )(100) 12.46 Rpta.
y.100 3920
102
Métodos Estadísticos Varela/Llanos /Asnate
(0.5)(0.5)
n 278 Deberían ser encuestada s
(0.03)2
b) Para estimar las proporciones individuales Pi:
Rango de
Clase Pi (1/Pi) N=(PQ/V0Pi)
ingresos
1 De <5000 0.50 2 556
2 De 5000 a 0.38 2.6316 732
3 <100000 0.12 8.333 2317
De 10000 a
más
n=(PQ/V0) [(1/Pi) –
Pi - Pj [(1/Pi) – (1/Pj)]
(1/Pj)]
P1 – P2 4.6316 1288
P1 – P3 10.3330 2873
P2 – P3 10.9649 3048
103
Métodos Estadísticos Varela/Llanos /Asnate
104
Métodos Estadísticos Varela/Llanos /Asnate
n0 Z 2 PQ PQ PQ PQ
n n0
n0
d2 d
2
V S ( P )
2
0
1
N Z
(0.5)(0.5)
n0 625
(0.02) 2
625
n 588 cuestionarios
625
1
10000
105
Métodos Estadísticos Varela/Llanos /Asnate
MUESTREO SISTEMÁTICO
2 u 21 u 22 u 23 u2 j u 2k
i u i1 ui 2 ui 3 u ij uik
n u n1 un2 u n3 u nj u nk
A continuación se muestra los elementos de la tabla anterior
de izquierda a derecha empezando por la primera unidad de
la primera fila y pasando a la primera unidad de la fila
siguiente cuando se agota cualquier fila. Tendremos la
siguiente estructura:
i\j 1 2 3 j …k
1 u1 u2 u3 u j u k
2 u k 1 u k 2 u k 3 u k j u k k
3 u 2 k 1 u 2k 2 u 2 k 3 u 2 k j u 2 k k
i u ( i 1) k 1 u (i 1) k 2 u (i 1) k 3 u (i 1) k j u (i 1) k k
106
Métodos Estadísticos Varela/Llanos /Asnate
107
Métodos Estadísticos Varela/Llanos /Asnate
108
Métodos Estadísticos Varela/Llanos /Asnate
ESTIMADORES Y VARIANZAS
n 1 X ij n 1 n
Total X Yij X ij Xˆ k X ij N X ij Nx j
i j 1 1 i 1 n n i 1
k N
109
Métodos Estadísticos Varela/Llanos /Asnate
X ij
X ij n
1 n 1
Media X Yij Xˆ nk X ij x j
N
i j 1 1 n i 1
nk
k
Aij
Aij n 1
1 n
proporción P Yij Pˆ nk Aij Pˆ j
nk i j 1 1 n i 1
k
n 1 A n
1 n
Totaldeclase X Yij Aij Aˆ k Aij N Aij NPˆ j
ij
i j 1 1 i 1 n n i 1
k N
Media Xˆ x j
proporción Pˆ Pˆ j
Totaldeclase Aˆ NPˆ j
VARIANZAS DE LOS ESTIMADORES
Definimos la cuasivarianza entre las k muestras posibles o
cuasivarianza intermuestral como:
110
Métodos Estadísticos Varela/Llanos /Asnate
S
2 1 n k
x j X 2
k 1 i j
bs
ij
i 1 j 1 i 1 j 1 i 1 j 1
N 1S 2 ( N k ) S ws
2
( k 1) Sbs2
Entre n k 2
( x X ) 2
k-1 S bs
muestras
i j
n k
( X x )
Dentro de 2 2
N-k S bs
muestras i j
n k
( X X )
k-1+(N-k) 2 2
total S ws
= N-1 i j
111
Métodos Estadísticos Varela/Llanos /Asnate
V Xˆ V x j 1 f bs ,
2
S
n
V Xˆ V Nx j N 2V x j N 2 1 f bs
2
S
n
1 k
k j
1 n k
nk i j
1 n k
N i j
2
1 k
V Pˆ V Pˆ j Pˆ j P Pˆ j P Pˆ j P PQ Pˆ j Qˆ j
2 2
k j
1 k
n k
1 k
V Aˆ V NPˆ j N 2V Pˆ j N 2 Pˆ j P N Pˆ j P N 2 PQ Pˆ j Qˆ j
2 2
k j i j k j
2 X ij X X zj X
k n
i z
w
j
,
N n 1 2
2
nk j i
112
Métodos Estadísticos Varela/Llanos /Asnate
n N n
V Xˆ V Nx j N 2V x j N 2 1 n 1 w N N 1 1 n 1 w
2 2
S
n n
V Pˆ j
PQ
n
1 n 1 w V Aˆ N 2 PQ 1 n 1 w
n
Según esta expresión, la precisión del muestreo sistemático
puede analizarse en función del coeficiente de correlación
intramuestral, de tal modo que la precisión máxima se
produce para w 1 /( n 1) , y la mínima para w 0 ,
igualándose la precisión del muestreo sistemático con la del
muestreo aleatorio simple para w 0 . De esta forma, para
valores de w entre 1 /( n 1) y 0, el muestreo sistemático
es mas precisó que el aleatorio simple, y para valores de w
entre 0 y 1, el muestreo sistemático es menos preciso que el
aleatorio simple. Por lo tanto, en cuanto a precisión,
convienen valores negativos del coeficiente de correlación
intraconglomerados w .
1 j k
1 X1 Xj Xk
2 X 1 k X jk
X k k
114
Métodos Estadísticos Varela/Llanos /Asnate
i X 1 ( i 1) k X j ( i 1) k X k ( i 1) k
n X 1 ( n 1) k X j ( n 1) k X k ( n 1) k
Obtener una muestra sistemática seria entonces seria
entonces equivalente a obtener une muestra estratificada
con la finalidad con unidades por estrato. debe tenerse en
cuenta ,sin embargo ,que en el muestreo estratificado
aleatorio la selección se efectúa independientemente en
cada estrato ,mientras que en el muestreo sistemático todos
los elementos seleccionados ocupan el mismo lugar o
numeró de orden dentro de cada zona de k elementos , con
la que no hay aleatoriedad de selección .además ,seria
conveniente que a las zonas sistemáticas de k elementos
cada una (estratos) sean lo mas homogéneas posible dentro
de ellas y heterogéneas entre ellas .estas clasificaciones de
los elementos de la población en n filas de k unidades
cada una origina la siguiente tabla del análisis de la
varianza poblacional:
n k
Dentro de estratos N n ( X
i j
ij X i )2
2
S wst
n k
Total n 1 ( N 1) N 1 ( X ij X j ) S2
i j
115
Métodos Estadísticos Varela/Llanos /Asnate
1 n k
( X ij X i ) 2
2 2
S wss
N n i j
Tenemos:
n k n k n k
( N 1) S 2 ( N n) S wst
2
(n 1) S bst
2
h i
n
1
i n
S2 1 1 n
V Xˆ V X st Wh2V X h Wi 2V X i 2 1 f i i 2 1 S i2
L n
ni n k i
N n 2
2
X ij X i n 2 k X ij X i S wst 1 f
1 1 n 1 k 1 n k 2
S wst
1
2
n2 k i k 1 j i j Nn n
( N n) S wst
2
X ij X i X Zj X z k n
1 k n
n j i z
k 2 X ij X i X zj X z
covX ij ; X zj 2 j i z
wst k n
nn 1k 1S wst2
k n
1 1
ij i ij i
2 2
X X X X
N j i 1 N j i 1
( N n) S wst
2
V Xˆ V X j 1 f wst 1 n 1 wst
2
S
n
Y lo mismo se calculará las varianzas del resto de los
estimadores en función del coeficiente de correlación
intraestratal wst .
La precisión máxima, que evidentemente se da cuando el
error de muestreo es cero V X j 0 , se produce si
n 1 wst 1 , luego se puede asegurar que la precisión
máxima si:
V X j 0 wst
1
n 1
La precisión mínima, que evidentemente se da cuando la
varianza es máxima, se produce si wst 1 (valor máximo
de wst que será el que efectivamente hace máxima V X j
117
Métodos Estadísticos Varela/Llanos /Asnate
wst 0 V X j 1 f
2
S wst
n
Como lo que el muestreo sistemático coincide en precisión
con el muestreo aleatoria independiente en cada estrato. De
esta forma, wst es en cierta forma una medida de la falta
de aleatoriedad en la selección de unidades para la muestra
en las distintas zonas sistemáticas (filas o estratos).
ESTIMACIÓN DE LA VARIANZA
No podemos decir que en muestreo sistemático haya un
método directo para la estimación de varianzas a partir de
una muestra sistemática. Tenemos las siguientes
situaciones:
a. próximo a cero o S 2 ws S 2
Si el coeficiente de correlación intramuestral se aproxima a
cero puede suponer la población y si S 2 ws S 2 la precisión
del aleatorio simple y el estratificado coinciden, con lo que
la estimación de ka varianza puede realizarse con la misma
expresión que en muestreo aleatorio simple, es decir:
Sˆ 2
Vˆ x (1 f )
n
Siendo Ŝ 2 la cuasivarianza de la muestra sistemática
b. st próximo a cero
Si st se aproxima a cero se puede utilizar el muestreo
sistemático como muestreo estratificado considerando cada
zona sistemática como un estrato y seleccionando una
118
Métodos Estadísticos Varela/Llanos /Asnate
n n n
Sˆ 2 2 2
2
x x 2 2 1 f
Vˆ xst Wh2 1 f h h 1 f h1 h 2 x xh 2
2 2
2
2
h1
h nh h n 2 n h
1 t
xt
t 1
xc
120
Métodos Estadísticos Varela/Llanos /Asnate
1 j k
1 X1 Xj Xk
2 X 1 k X jk X k k
i X 1 ( i 1) k X j ( i 1) k X k ( i 1) k
n X 1 ( n 1) k X j ( n 1) k X k ( n 1) k
121
Métodos Estadísticos Varela/Llanos /Asnate
PROBLEMAS RESUELTOS
123
Métodos Estadísticos Varela/Llanos /Asnate
124
Métodos Estadísticos Varela/Llanos /Asnate
Grado
Fuen s de
Sumas de Cuadrados Cuadrados Medios
te Libert
ad
n k _ _
Entre
k-1=5- ( x j X ) 2 1.72 S bs2 1.72 / 4 1.43
1=4 i j
N- n k _
N- n k _
n S2 S2 1 0.43
V Pˆ V PˆJ 1 BS (1 f ) BS 1 0.0344
N n n 5 10
2
ˆ ˆ ˆ S BS
V A V NPJ N V PJ N (1 f )
2 2
50 2 * 0.0344 86
n
125
Métodos Estadísticos Varela/Llanos /Asnate
6 6
ˆQ ˆ 1
2
S P 10 10
V P1 1 f
ˆ ˆ 1
1
(1 f ) 1 1
1 1
0.0213
n n 1 5 10 1
126
Métodos Estadísticos Varela/Llanos /Asnate
3 3
ˆ ˆ ˆ 1
1 10 10
2
S PQ
Vˆ Pˆ2 1 f 2 (1 f ) 2 2 1 1 0.0186
n n 1 5 10 1
1 1
1
Sˆ Pˆ3Qˆ 3 1 101 10
2
V P3 1 f
ˆ ˆ (1 f )3
1 0.008
n n 1 5 10 1
Vˆ Pˆ4 Vˆ Pˆ3 0.008
2 2
ˆ ˆ ˆ 1
1 10 10
2
S PQ
Vˆ Pˆ5 1 f 5 (1 f ) 5 5 1 1 0.0142
n n 1 5 10 1
1 f n/2
n h
2 1 0.2
Vˆ Pˆ1 2 xh1 xh 2 2 (1 1) 2 (1 0) 2 (0 1) 2 (1 0) 2 (0 1) 2 0.032
10
1 f 1 0.2
n/2
Vˆ Pˆ2 2 x xh2 (0 0) 2 (0 1) 2 (1 0) 2 (0 0) 2 (1 0) 2 0.024
2
h1 2
n h 10
Vˆ Pˆ3 0.008(0 1) 2 0.008 Vˆ Pˆ4
127
Métodos Estadísticos Varela/Llanos /Asnate
Vˆ Pˆ5 0.008 (1 0) 2 (1 0) 2 0.016
Las mejores según el método del muestreo estratificado
también resultan ser la tercera y la cuarta, y además
coinciden en varianza con el método anterior. Para las
restantes muestras se observa ganancia en presión del
método de estimación utilizando la formula del muestreo
aleatorio simple. La proporción estima de de piezas
defectuosa producidas será la derivada de la 3ª o 4ª muestra,
esto es Pˆ Pˆ Pˆ 1 / 10 ; es decir que estima 10% de
3 4
producción defectuoso
128
Métodos Estadísticos Varela/Llanos /Asnate
Solución:
Si definimos una variable dicotómica A, a la que
asignamos el valor 1 para los hogares en que los ingresos
mensuales superan los 1500 soles y el valor de 0 para el
resto de los hogares, y clasificamos los 36 hogares en 9 filas
de 4 viviendas cada una(muestreo sistemático uno en 4)
siguiendo el orden del enunciado del problema, tendremos
la siguiente tabla:
0 0 1 0 ¼
1 1 1 0 ¾
0 0 1 1 ½
1 0 1 1 ¾
0 0 0 1 ¾
1 1 0 0 ½
1 1 0 1 ¾
0 1 1 1 ¾
1 1 0 0 ½
5 5 5 5 5
9 9 9 9 9
V Pˆ 0
4 9 9 9 9 9 9 9 9
También podemos calcular la varianza del estimador de la
proporción como
1 k
k j 1
20 20 1 5 4 5 4 5 4 5 4
V Pˆ PQ Pˆ j Qˆ j 1 0
36 36 4 9 9 9 9 9 9 9 9
129
Métodos Estadísticos Varela/Llanos /Asnate
130
Métodos Estadísticos Varela/Llanos /Asnate
N-
Dentr n k _ 2
S ws 8.88 / 32 0.277
o
k=36-
4=32
i
( X ij x j ) 2 8.88
j
N- n k _ S 2 8.88 / 35 0.254
Total 1=36-
1=35
(Xi j
ij X j ) 8.88
2
131
Métodos Estadísticos Varela/Llanos /Asnate
ˆ ˆ
V P V Pj 1
n S bs2
1 f
S bs2 1 0
1 0
N n n 49
Del valor de la varianza puede deducirse el valor del
coeficiente de correlación intramuestral a través de la
formula:
2
V (x j ) (1 (n 1) )
n
Tendremos:
35
0.254
36 1 1
0 (1 (9 1) ) 0.125
9 8 n 1
133
Métodos Estadísticos Varela/Llanos /Asnate
Entre n-1=9-1=8
i
( x j X ) 2 1.388 S bs2 1.388 / 8 0.1735
j
n k _
n k _
134
Métodos Estadísticos Varela/Llanos /Asnate
S2 n 0.277
V Pˆst 1 f wst (1 (n 1) st ) 0.16 2 1 (1 (n 1)(0.125))
n 36 n
n5
V Pˆst 1 f
S2 n 0.254
0.16 2 1 n8
n 36 n
Obviamente el tamaño de muestra necesario para cometer el
mismo error de muestreo es mayor en muestreo aleatorio
simple que en muestreo sistemático, ya que en este
135
Métodos Estadísticos Varela/Llanos /Asnate
RECOMENDACIONES Y SUGERENCIAS
Observación
137
Métodos Estadísticos Varela/Llanos /Asnate
138
Métodos Estadísticos Varela/Llanos /Asnate
CAPITULO II
INTRODUCCIÓN
143
Métodos Estadísticos Varela/Llanos /Asnate
MEDICION DE LA CALIDAD.
La calidad no se puede definir con precisión sin
cuantificarla. Esto quiere decir que tenemos que dedicar
tanto esfuerzo y meditación como podamos para idear
144
Métodos Estadísticos Varela/Llanos /Asnate
145
Métodos Estadísticos Varela/Llanos /Asnate
146
Métodos Estadísticos Varela/Llanos /Asnate
HISTOGRAMAS.
Después de obtenidos los datos del problema es practico
representarlos de una forma grafica de tal manera que
refleje la dispersión de los valores respecto a la media, con
este grafico reflejaremos resultados de un proceso para
todas las causas por lo que es muy útil para estudiar los
factores que intervienen en la calidad.
GRAFICOS DE CONTROL
Los diagramas de control siguen utilizándose
actualmente en el control de calidad por las siguientes
razones.
Son una herramienta contrastada para mejorar la
productividad ya que al reducir el rechazo y la
reelaboración los costos disminuyen y la capacidad
de la producción aumenta
Son eficaces para evitar defectos preventivamente,
manteniendo el proceso bajo control durante la etapa
de fabricación, lo que evita el costo de separar los
artículos correctos de los defectuosos después de su
fabricación.
Evitan ajustes innecesarios al proceso derivados de
posibles variaciones anormales ilusorias que
posiblemente no lo sean.
Proporcionan información para el análisis, ya que a
menudo el patrón de los puntos en el diagrama de
control contiene información diagnostica para un
149
Métodos Estadísticos Varela/Llanos /Asnate
Entradas Controlables
X1 X2 ….............XP
Entradas Característica de
Calidad ( y )
PROCESO
Z1 Z2 ....................ZQ
Entradas Incontrolables
150
Métodos Estadísticos Varela/Llanos /Asnate
152
Métodos Estadísticos Varela/Llanos /Asnate
155
Métodos Estadísticos Varela/Llanos /Asnate
xi x
j 1
ij
x i 1
, siendo x , i 1,2,3,4,...., k
k ni
Como: E ( xI ) = E(x ) =
Sabemos que E ( xI ) = y ( xI ) =
ni
entonces por el teorema del
x límite central se cumple
N ( 0 ,1)
/ n
que:
156
Métodos Estadísticos Varela/Llanos /Asnate
x-μ
-k α k α μ-k α σ/ n i x μ+k α σ/ ni
σ / ni
157
Métodos Estadísticos Varela/Llanos /Asnate
CASO B
CUANDO NO SE CONOCEN ni ni .-
Supongamos que una característica de calidad X
cuantitativa esta distribuida normalmente, con media
y desviación estándar , ambas desconocidas, lo cual es
habitual en la practica, hay que estimarlas a partir de k
muestras preliminares, tomadas cuando se considera que
el proceso esta bajo control. Estas estimaciones suelen
basarse en una cantidad de 20 a 25 muestras como
mínimo. Supongamos que se dispone de k muestras
cada una con ni observaciones de la característica de
calidad X dada. Por lo general los ni serán pequeños,
muchas veces igual a 4, 5 o 6 . Sean x1, x2 , x3 , x4 ,
x5 , .............., xK las k medias de las muestras.
158
Métodos Estadísticos Varela/Llanos /Asnate
xi x
j 1
ij
x i 1
, siendo x , i 1,2,3,4,...., k
k ni
Para fijar los límites de control se necesita también un
estimador de la desviación estándar . Es posible
evaluar a partir de los recorridos Ri de las k muestras.
Sabemos que
E(Ri) = d2
Supongamos que una característica de calidad X
cuantitativa esta distribuida normalmente, con media y
desviación estándar , ambas desconocidas, lo cual es
habitual en la practica, hay que estimarlas a partir de k
muestras preliminares, tomadas cuando se considera que el
proceso esta bajo control. Estas estimaciones suelen basarse
en una cantidad de 20 a 25 muestras como mínimo.
Supongamos que se dispone de k muestras cada una con ni
observaciones de la característica de calidad X dada. Por lo
general los ni serán pequeños, muchas veces igual a 4, 5 o 6
. Sean x1, x2 , x3 , x4 , x5 , .............., xK las k medias de
las muestras. Entonces, el mejor estimador de , la media
del proceso, es la gran media o media de las medias de las k
muestras. Que se obtiene mediante:
k ni
x i x
j 1
ij
x i 1
, siendo x , i 1,2,3,4,...., k
k ni
159
Métodos Estadísticos Varela/Llanos /Asnate
x x
P k
Ri / d 2
k 1
n
xx
k
R / d2
k x k
R
xi x k
R
d2 n d2 n
n
161
Métodos Estadísticos Varela/Llanos /Asnate
L.C.S . d 2 k n d 2 k
i
n i
Linea central d 2
L.C.I . d 2 k n d 2 k
i
n i
162
Métodos Estadísticos Varela/Llanos /Asnate
Linea central d 2
L.C.I .
d 2 3 ni d 2 3 ni D 1
d3 , en cuyo caso :
D2 d 2 3d 3 y D1 d 2 3d 3
una vez que tenemos los limites de control para cada
muestra podemos optar por graficarlos, pero las líneas de
control no serán líneas rectas.
Observación:
Cuando los tamaños de las muestras (ni) no difieren
mucho, se puede tomar como valor común n la media de
todos los tamaños de muestras ni.
También se puede optar por tomar un n común igual al
valor mayor de los ni , con lo que obtendríamos limites
de control bastante sensibles.
163
Métodos Estadísticos Varela/Llanos /Asnate
L.C.S . d 2 k n d 2 k n
Linea central d 2
L.C.I . d 2 k n d 2 k n
CASO B:
CUANDO SE NO CONOCEN ni ni .-
Supongamos que una característica de calidad X
cuantitativa esta distribuida normalmente, con media y
desviación estándar , ambas desconocidas. Si X1, X2,
X3,........XN. es una muestra de tamaño N, entonces el rango
R = Max (XI ) – Min (XI ), i = 1,2,.....,N sigue una
distribución de media
E( R ) = d2 y desviación típica ( R ) = ij , para i =
1,....k, siendo
164
Métodos Estadísticos Varela/Llanos /Asnate
k n k n
R R Ri R R
d2 d2
165
Métodos Estadísticos Varela/Llanos /Asnate
k n k n
L.C.S . R R 1 R
d2 d
2
Linea central R
k n k n
L.C.I . R R 1 R
d2 d
2
CRITERIO TRES SIGMA (3 ).- Estos límites se
obtienen reemplazando a kα por 3 que aproximadamente
equivale a α = 0.002, los límites de control quedan de la
siguiente forma:
3 n 3 n
L.C.S . R R 1 R D R
d2 d2 4
Linea central R
3 n 3 n
L.C.I . R R 1 R D R
d2 d2 3
D3 y D4 son valores totalmente conocidos
3 n 3 n
D4 = 1 y D3 = 1
d2 d2
DIAGRAMAS DE CONTROL PARA x Y DE S
Sabemos que por lo general que para controlar una
característica de calidad en una variable cuantitativa
generalmente se calcula el valor medio, pero también se
pueden utilizar los diagramas de x y de S por separado
para cada característica de la calidad, sin embargo si dichas
características están estrechamente relacionadas se debe
utilizar
El diagrama de control de x y de S simultáneamente.
Cuando el tamaño maestral es moderadamente grande,
digamos mayor que 10 o 12, el método del rango para
estimar S pierde eficiencia estadística. En estos casos es
mejor reemplazar los gráficos de x y de R por los de x y
166
Métodos Estadísticos Varela/Llanos /Asnate
S i C4
k k C 4 k 1 C42 S i C 4 k 1 C 42
1 C 2
4
168
Métodos Estadísticos Varela/Llanos /Asnate
CUANDO SE NO CONOCEN ni ni .-
Supongamos que una característica de calidad X
cuantitativa esta distribuida normalmente, con media y
desviación estándar , ambas desconocidas, lo cual es
habitual en la practica, hay que estimarlas a partir de k
muestras preliminares, tomadas cuando se considera que el
proceso esta bajo control. Estas estimaciones suelen basarse
en una cantidad de 20 a 25 muestras como mínimo.
Supongamos que se dispone de k muestras cada una con ni
observaciones de la característica de calidad X dada. Por lo
general los ni serán pequeños, muchas veces igual a 4, 5 o 6
. Sean x1, x2 , x3 , x4 , x5 , .............., xK las k medias de
las muestras y S1, S2, S3,.........,Sk las k desviaciones
estándar de las muestras :
Para fijar los límites de control se necesita también un
estimador de la desviación estándar . Es posible
evaluar a partir de las desviaciones estándar SI de las k
muestras. Sabemos que
E(Si) = C4
Donde C4 depende de n y esta tabulado, y por lo tanto es
conocido. De esta forma resulta que SI / C4 es un estimador
insesgado de para i = 1, 2, 3,.........., k
E ( Si / C4 ) Si / C4 C4 / C4
Para hallar promediamos los estimadores Si / C4 para i =
1, 2, 3, .........., k de la forma siguiente
1 k
1 k
S Si S
i
k i 1
k i 1 C4 C4 C4
169
Métodos Estadísticos Varela/Llanos /Asnate
x i x
j 1
ij
x i 1
, siendo x , i 1,2,3,4,...., k
k ni
Para fijar los límites de control se necesita también un
estimador de la desviación estándar . Es posible
evaluar a partir de las desviaciones estándar SI de las k
muestras. Sabemos que
171
Métodos Estadísticos Varela/Llanos /Asnate
E(Si) = C4
Donde C4 depende de n y esta tabulado, y por lo tanto es
conocido. De esta forma resulta que SI / C4 es un estimador
insesgado de para i = 1, 2, 3,.........., k
E ( Si / C4 ) Si / C4 C4 / C4
Para hallar promediamos los estimadores
x x Si / C4 para i = 1, 2, 3, .........., k
N ( 0 ,1)
S / C4
n
de la forma siguiente
1 k
1 k
S Si S
i i 1
k
k i 1 C4 C4 C4
El estimador resulta ser así un estimador insesgado de ,
ya que:
1 k Si 1 k k
E
k i 1 C4 k i 1 k
Como ya tenemos estimaciones de y , podremos
utilizarlos para hallar los limites de control. Por el teorema
del límite central se cumple que:
Por lo tanto, mediante la distribución normal N( 0 , 1 ), para
un α dado podremos calcular kα tal que:
Pero de esta expresión se deduce que FN(0,1)( kα ) – FN(0,1)(-
kα) = 1 - α
FN(0,1)( kα) – (1 - FN(0,1)( kα) = 1 - α
2FN(0,1)( kα) – 1 = 1 – α
FN(0,1)( kα) = 1 - α /2, con lo cual kα valdrá
F (1 - α /2 )
1
173
Métodos Estadísticos Varela/Llanos /Asnate
EJERCICIOS RESUELTOS
CARTAS DE CONTROL POR VARIABLES:
1. A continuación se dan las medidas del maquinado de una
ranura en un bloque Terminal de auto.
serie mediciones
1 77 80 78 72 78
2 76 79 73 74 73
3 76 77 72 76 74
4 74 78 75 77 77
5 80 73 75 76 74
6 76 81 79 76 76
7 75 77 75 76 77
8 79 75 78 77 76
9 76 75 74 75 75
10 71 73 71 70 73
11 72 73 75 74 75
12 75 73 76 73 73
13 75 76 78 79 77
14 77 77 78 77 76
15 77 76 77 77 77
16 77 77 77 79 79
probabilística)
CRITERIO 3 :
Para la media
LC x 3 x A
1
LCS 77.97; LCI 73.58
c 2
n
174
Métodos Estadísticos Varela/Llanos /Asnate
Para el rango
LCS D 4
R 9.06; LCI D 3
R0
175
Métodos Estadísticos Varela/Llanos /Asnate
176
Métodos Estadísticos Varela/Llanos /Asnate
177
Métodos Estadísticos Varela/Llanos /Asnate
78.029
75.775
Promedio = 75.78
Media
Nivel sigma: 3
LCS = 8.06
2
Amplitud
Promedio = 3.81
0 LCI = .00
1.0 3.0 5.0 7.0 9.0 11.0 13.0 15.0
2.0 4.0 6.0 8.0 10.0 12.0 14.0 16.0
Nivel sigma: 3
178
Métodos Estadísticos Varela/Llanos /Asnate
3.0
2.5
2.0
1.5
1.0
LCS = 3.31
.5 Promedio = 1.59
Nivel sigma: 3
Para la media
LC x u / 2 x A 1
LCS 77.25; LCI 74.30
c 2
n
179
Métodos Estadísticos Varela/Llanos /Asnate
Para el rango
LCS D 1
/ 2
R
6.59; LCI D /2
R
1.04
d 2 d 2
78.029
75.775
Promedio = 75.78
Media
180
Métodos Estadísticos Varela/Llanos /Asnate
3.0
2.5
2.0
1.5
Desviación típica
1.0
LCS = 2.71
.5 Promedio = 1.59
LCS = 6.59
2
Amplitud
Promedio = 3.81
0 LCI = 1.04
1 3 5 7 9 11 13 15
2 4 6 8 10 12 14 16
LC x 3 x A 1
LCS 33.57; LCI 32.629
c 2
n
182
Métodos Estadísticos Varela/Llanos /Asnate
P x A1 x x A1 P 5.60 1.342 * 0.1 x 5.60 1.3242 * 0.1
5.75 5.47 5.75 5.47
p 5.47 x 5.73 P z P 1.34 z 1.34 81.98%
0.1 0.1
5 5
LCI D * R 0 *16.456 0
3
183
Métodos Estadísticos Varela/Llanos /Asnate
6 50 46 49 52 53
7 46 44 52 55 50
8 50 49 54 52 48
9 54 54 49 50 50
10 58 55 52 56 53
11 56 51 49 50 47
12 54 50 56 47 51
13 47 50 50 47 53
14 57 53 52 49 57
15 48 49 51 50 44
16 51 51 45 54 48
17 49 53 46 49 51
18 53 50 47 50 49
19 56 52 52 50 55
20 46 55 48 51 55
Para el rango
LCS D 4
R 15.96; LCI D 3
R0
185
Métodos Estadísticos Varela/Llanos /Asnate
186
Métodos Estadísticos Varela/Llanos /Asnate
187
Métodos Estadísticos Varela/Llanos /Asnate
53.142
50.790
Promedio = 50.79
Media
Nivel sigma: 3
10
LCS = 15.96
Amplitud
Promedio = 7.55
0 LCI = .00
1 3 5 7 9 11 13 15 17 19
2 4 6 8 10 12 14 16 18 20
Nivel sigma: 3
188
Métodos Estadísticos Varela/Llanos /Asnate
Muestra Mediciones
1 17,2 17,1 17,2 17,3 17,3
2 17,2 17,2 17,4 17,4 17,4
3 17,5 17,4 17,3 . .
4 17,2 17,2 17,2 17,2 17,4
5 17,4 17,4 17,2 . .
6 17,3 17,4 17,3 17,4 .
7 17,4 17,3 17,3 17,4 17,3
8 17,2 17,1 17,4 17,2 17,3
9 17,4 17,3 17,4 17,3 .
10 17,3 17,4 17,2 17,3 17,3
189
Métodos Estadísticos Varela/Llanos /Asnate
Para la media
LC x u / 2 x A
1
entonces 0,08078661
c 2
n
190
Métodos Estadísticos Varela/Llanos /Asnate
191
Métodos Estadísticos Varela/Llanos /Asnate
192
Métodos Estadísticos Varela/Llanos /Asnate
17.381718
17.302273
17.222828 LCS
Promedio = 17.3023
Media
17.143383 LCI
1 2 3 4 5 6 7 8 9 10
Nivel sigma: 3
193
Métodos Estadísticos Varela/Llanos /Asnate
.4
.3
.2
VAR00008
LCS
.1
Amplitud
Promedio
0.0 LCI
1 2 3 4 5 6 7 8 9 10
Nivel sigma: 3
.2
.1
LCS
Promedio
0.0 LCI
1 2 3 4 5 6 7 8 9 10
Nivel sigma: 3
196
Métodos Estadísticos Varela/Llanos /Asnate
ˆ p
P k
p
k 1
p (1 p )
n
197
Métodos Estadísticos Varela/Llanos /Asnate
2FN(0,1)( kα) – 1 = 1 – α
FN(0,1)( kα) = 1 - α /2, con lo cual kα valdrá
F (1 - α /2 )
1
p (1 p )
L.C.S p k
n
Linea Central p
p(1 p)
L.C.S p k
n
CASO B
CUANDO NO SE CONOCE P
198
Métodos Estadísticos Varela/Llanos /Asnate
d i
p i 1
m
que es un estimador insesgado de p
n
i 1
i
p (1 p )
L.C.S p 3
n
Linea Central p
p (1 p )
L.C.S p 3
n
CRITERIO PROBABILISTICO
p (1 p )
L.C.S p k
ni
Linea Central p
p (1 p )
L.C.S p k
ni
p(1 p )
L.C.S p 3
ni
Linea Central p
p(1 p )
L.C.S p 3
ni
200
Métodos Estadísticos Varela/Llanos /Asnate
n i pˆ i
p i 1
k
n i 1
i
CASO A
CUANDO SE CONOCE LA VERDADERA
FRACCION DISCONFORME p
Supongamos que se conoce la verdadera fracción
disconforme p en el proceso de fabricación, para construir el
diagrama de control np se toman muestras subsecuentes de
n unidades (subgrupos), se calcula en cada una la fracción
muestral disconforme p̂ , y se grafica el estadístico n p̂ en
el diagrama para cada muestra.
LIMITES DE CONTROL
Para calcular los limites probabilisticos de control al nivel
de utilizamos la distribución del estadístico n p con
lo que sabemos que para cada muestra
ˆ np
np
N( 0 , 1 )
np(1 p)
201
Métodos Estadísticos Varela/Llanos /Asnate
ˆ np
P k k 1
np
np(1 p)
np k np (1 p ) ˆ
p np k np (1 p )
CRITERIO PROBABILISTICO.-
L.C.S np k np (1 p )
Linea Central np
L.C.S p k np (1 p )
CRITERIO TRES SIGMA
L.C.S np 3 np (1 p )
Linea Central np
L.C.S p 3 np (1 p )
CASO B
202
Métodos Estadísticos Varela/Llanos /Asnate
203
Métodos Estadísticos Varela/Llanos /Asnate
204
Métodos Estadísticos Varela/Llanos /Asnate
205
Métodos Estadísticos Varela/Llanos /Asnate
P
di 102 102 0.02
ni 24 * 200 4800
p1 p 0.020.98
LC p 3 0.02125 3 0.02 0.0297
200 200
LCS 0.050
LCI -0.0097 0
206
Métodos Estadísticos Varela/Llanos /Asnate
207
Métodos Estadísticos Varela/Llanos /Asnate
,06
,04
NªDEFECT
Centro = ,02
208
Métodos Estadísticos Varela/Llanos /Asnate
.75
.50
Prob acum esperada
.25
0.00
0.00 .25 .50 .75 1.00
muestra d
1 1
2 2
3 5
4 6
5 3
209
Métodos Estadísticos Varela/Llanos /Asnate
6 5
7 2
8 1
9 1
10 0
11 0
12 1
13 0
14 1
15 0
16 2
17 1
18 0
19 0
20 1
21 1
22 0
23 0
24 1
25 0
210
Métodos Estadísticos Varela/Llanos /Asnate
u
ui
34
0.03
m 50 * 25
u
LC u u / 2
n
0.03
LC 0.03 3
25
LC 0.03 0.06997142
LCS 0.09717142
LCI 0
211
Métodos Estadísticos Varela/Llanos /Asnate
212
Métodos Estadísticos Varela/Llanos /Asnate
213
Métodos Estadísticos Varela/Llanos /Asnate
.12
.10
.08
.06
.04
LCS = .10
214
Métodos Estadísticos Varela/Llanos /Asnate
muestra ui
1 7
2 14
3 13
4 17
5 7
6 11
7 6
8 11
9 16
10 13
11 17
12 10
13 7
14 8
15 21
16 12
17 8
18 9
19 5
20 27
21 9
215
Métodos Estadísticos Varela/Llanos /Asnate
22 15
23 3
24 7
25 5
a) Construir el grafico adecuado para una
probabilidad del 99%(use la aproximación
normal)
¡Error! No hay tema especificado.
Gráfico de control: UI
30
20
UI
10
LCS = 18.89
Centro = 11.12
0 LCI = 3.35
1 3 5 7 9 11 13 15 17 19 21 23 25
216
Métodos Estadísticos Varela/Llanos /Asnate
1 7
2 14
3 13
4 17
5 7
6 11
7 6
8 11
9 16
10 13
11 17
12 10
217
Métodos Estadísticos Varela/Llanos/Asnate
13 7
14 8
16 12
17 8
18 9
19 5
21 9
22 15
24 7
25 5
total 227
218
Métodos Estadísticos Varela/Llanos/Asnate
219
Métodos Estadísticos Varela/Llanos/Asnate
u
ui
227
10.3
m 23
u
LC u u / 2
n
10.3
LC 10.3 2.33
1
LC 10.3 7.48
LCS 17.80
LCI 2.83
Gráfico de control: UI
20
10
UI
LCS = 17.80
Centro = 10.32
0 LCI = 2.83
1 3 5 7 9 11 13 16 18 21 24
220
Métodos Estadísticos Varela/Llanos/Asnate
Gráfico de control: c
20
10
Disconformidades
UI
LCS = 17.80
Centro = 10.32
0 LCI = 2.83
1 3 5 7 9 11 13 16 18 21 24
c 5 .8 c 12
LC c c LC c c
LC 5.8 5 .8 LC 12 12
LC 5.8 LC 12
LCS LCS
LCI LCI
CAPITULO III
DISEÑOS EXPERIMENTALES
222
Métodos Estadísticos Varela/Llanos/Asnate
223
Métodos Estadísticos Varela/Llanos/Asnate
ANALISIS DE VARIANZA
Es una técnica en el que la varianza total de un conjunto de
datos se divide en varios componentes, cada uno de los
cuales tiene asociado una fuente específica de variación, de
manera que durante el análisis es posible encontrar la
224
Métodos Estadísticos Varela/Llanos/Asnate
225
Métodos Estadísticos Varela/Llanos/Asnate
Tratamientos Total
1 2 3 ... k
Y11 Y12 Y13 ... Y1k
Observaciones
ni
i 1
Y. j
226
Métodos Estadísticos Varela/Llanos/Asnate
nj
SCT SCt
Tratamientos Total
1 2 3 ... t
Y11 Y21 Y31 ... Y1t
Y12 Y22 Y32 Yt2
Y13 Y23 Y33. Yt3.
Observacione . . .
s . . . .
y1n1 y2n2 y3n3 ytn
Totales T1 T2 T3 ... Tt
T Ti
Número de
observaciones n n n ... N tn
Medias ... T
Y.1 Y.2 Y.3 Yt Y
tn
227
Métodos Estadísticos Varela/Llanos/Asnate
tratamientos
El modelo será:
Yij u ti ij
H 0 : τ1 τ 2 τ3 ... τ t 0 vs
H1 : τ i 0
228
Métodos Estadísticos Varela/Llanos/Asnate
229
Métodos Estadísticos Varela/Llanos/Asnate
Telares (Lib/min)
1 2 3 4 5
14.0 13.9 14.1 13.6 13.8
14.1 13.8 14.2 13.8 13.6
14.2 13.9 14.1 14.0 13.9
14.0 14.0 14.0 13.9 13.8
14.1 14.0 13.9 13.7 14.0
Solución
Telares (Lib/min)
1 2 3 4 5
14.0 13.9 14.1 13.6 13.8
14.1 13.8 14.2 13.8 13.6
14.2 13.9 14.1 14.0 13.9
14.0 14.0 14.0 13.9 13.8
14.1 14.0 13.9 13.7 14.0
Yi 70.4 64.6 70.3 68.0 69.1
Ni. 5 5 5 5 5
yi . 14.08 13.92 14.06 13.8 13.82
231
Métodos Estadísticos Varela/Llanos/Asnate
y.. = 348.4
N = 25
Y.. = 13.936
SCT =
Y .. 348.4 2
y N 2
ij (14 14.1 ... 14 )
2 2 2
25
06376
SCt =
y 2
i
Y
.
2
(70.4) 2 (69.6) 2 ... (69.1) 2 4855.3 0.3416
ni N
SCE = yij2
y 2
i.
SCT SCt = 0.6376 – 0.3416 =
ni
0.296
Cuadro ANVA
232
Métodos Estadísticos Varela/Llanos/Asnate
Tipo de líquido
1 2 3 4
17.6 16.9 21.4 19.3
18.9 15.3 23.6 21.1
16.3 18.6 19.4 16.9
17.4 17.1 18.5 17.5
20.1 14.5 20.5 18.3
21.6 20.3 22.3 19.8
y.. = 458.2
N = 24
y.. = 19.092
233
Métodos Estadísticos Varela/Llanos/Asnate
SCT =
2
y 458.2 2
yij2 N
..
(17.62 18.9 2 ... 19.82 )
24
96.158
SCt =
y 2
i
y 2
..
(11.9 2 107.7 2 ... 112.9 2 )
8747.80 30.165
ni N 6
Maquina
A B C D E
11.95 12.18 12.16 12.25 12.10
12.00 12.11 12.15 12.30 12.04
234
Métodos Estadísticos Varela/Llanos/Asnate
Solución
Realizando los cálculos
Maquina
A B C D E
11.95 12.18 12.16 12.25 12.10
12.00 12.11 12.15 12.30 12.04
12.25 12.08 2.10 12.02
12.10 12.02
Yi 48.30 24.29 36.39 36.65 48.18
Ni. 4 2 3 3 4
yi . 12.075 12.145 12.3 12.217 12.045
y.. = 193.81
N = 16
y.. = 12.113
SCT =
2
y 193.812
yij2 N
..
(11.952 122 ... 12.022 )
16
0.144
SCt =
y 2
i
y 2
.. 48.302 24.29 2 36.39 2 36.652 48.182 193.812
0.05943
ni N 4 2 3 3 4 16
235
Métodos Estadísticos Varela/Llanos/Asnate
Además:
b
i 1
i 0 ; ij DNI (0, )
237
Métodos Estadísticos Varela/Llanos/Asnate
Distancia Sujeto
(pies) 1 2 3 4 5
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
Solución:
Realizando los cálculos
Distanc Sujeto
ia (pies) 1
2 3 4 5 yi. ni.
y i.
238
Métodos Estadísticos Varela/Llanos/Asnate
4 10 6 6 6 6 34 5 6.8
6 7 6 6 1 6 36 5 5.2
8 5 3 3 2 5 18 5 3.6
10 6 4 4 2 3 19 5 3.8
y.i 28 19 19 11 20 y..
n.j 4 4 4 4 4 N=20
7 4.75 4.75 2.75 5
y. j y .. =
4.85
SCT =
y 2
97 2
y ij
2
N
..
(10 7 ... 3 )
2 2 2
20
84.55
SCτ =
y 2
i ..
y..2 (282 19 2 ... 20 2 )
470.45 = 36.30
ti N 4
y 2
.j
y..2 (34 2 26 2 ... 19 2 )
SCB = 470.95
ni N 5
= 503.4 – 470.45 = 32.95
SCE = SCT - SCτ - SCB
= 84.55 – 36.30 – 32.95 = 15.30
CUADRO ANVA
239
Métodos Estadísticos Varela/Llanos/Asnate
240
Métodos Estadísticos Varela/Llanos/Asnate
37 59 51
43 51 80
57 53 68
C 60 62 71
66 71 55
Solución:
241
Métodos Estadísticos Varela/Llanos/Asnate
37 59 51
43 51 80
57 53 68
C 60 62 71
66 71 55
n3j 5 5 5 15 884 58.933
y3j 263 296 325
15 15 15 N = 45
725 805 905 =
n.j y
48.33 53.66 60.33 ..
y.j. 3 7 3 2445
y.j.
y .. =
54.111
1
242
Métodos Estadísticos Varela/Llanos/Asnate
SCT =
y...2
yij212 N
60 2 582 ...712 552 132845
= 139307 – 132845 = 6462
CUADRO ANVA
Y Y2
i 1 j 1
2
ij ( k ) Yij2( k ) Yij2( k )
i 1 k 1 j 1 k 1
T2
M YY 2
m
RYY
R i
2
Suma de cuadrado por renglón
m M YY
CYY
C i
2
Suma de cuadrados por columna
m M YY
EYY = Y2 – MYY – RYY – CYY - TYY Suma de cuadrados
del error experimental
244
Métodos Estadísticos Varela/Llanos/Asnate
245
Métodos Estadísticos Varela/Llanos/Asnate
Z
S R C (m 1)T
2
(m 1) 2 (m 2) 2
Recuerde que los grados de libertad asociados con el error
experimental y el total reducidos cada uno en una unidad es
decir (m-1) (m-2) – 1 y m2 – 1, respectivamente.
246
Métodos Estadísticos Varela/Llanos/Asnate
Sujetos Observadores
1 2 3 4 5 6 7 8
1 A128 D108 C110 B106 E100 F102 G112 H110
2 B122 C100 D120 A128 F108 E130 H120 G110
3 D110 A 48 B110 C120 G102 H108 E108 F104
4 C 96 B 96 A 90 D106 H 96 G 90 F 98 G 98
5 E120 F128 G130 H128 A110 D132 C128 B134
6 F140 E128 H130 G130 B126 C108 D142 A140
7 G110 H108 E110 F106 D114 A110 B114 C118
8 H102 G118 F108 E110 C114 B110 A122 D110
Sujetos Observadores α = 5% yi
1 2 3 4 5 6 7 8
1 A128 D108 C110 B106 E100 F102 G112 H11 876
2 B122 C100 D120 A128 F108 E130 H120 0 938
3 D110 A 48 B110 C120 G102 H10 E108 G11 810
4 C 96 B 96 A 90 D106 H 96 8 F 98 0 770
5 E120 F128 G130 H128 A110 G 90 C128 F104 1010
6 F140 E128 H130 G130 B126 D13 D142 G 98 1044
7 G110 H108 E110 F106 D114 2 B114 B134 890
8 H102 G118 F108 E110 C114 C108 A122 A14 894
A11 0
0 C118
B110 D11
0
y.j 928 834 908 934 870 890 944 924 y.. =
Observ A B C D E F G H 7232
. 876 918 894 942 904 894 902 902
yk
247
Métodos Estadísticos Varela/Llanos/Asnate
SCfil(sujeto) =
yi2. y..2 876 2 9382 ... 894 2 7232 2
m m2
8
64
= 824,699 – 817,216 = 7483
y2 y 2 9282 ... 924 2 7232 2
SCcol (obs) = . j ..2
m m 8 64
= 818,834 – 817,216 = 1218
y.2k y..2 876 2 ... 902 2 7232 2
SCtrata (orden) 2
m m 8 64
= 817,545 – 817216 = 329
SCerror = SCtotal - SCfil(sujeto) - SCcol (obs) - SCtrata (orden)
= 14000 –7483 – 1218 – 329 = 4970
y2
SCtotal = yijk 2
...2
m
7232
= 1282 122 2 ... 110 2
64
= 831216 – 817216 = 14,000
CUADRO ANVA
248
Métodos Estadísticos Varela/Llanos/Asnate
TERMÓMETROS
1 2 3 4
0.95 0.33 -2.15 1.05
1.06 -1.46 1.70 1.27
1.96 0.20 0.48 -2.05
Solución
Realizando los cálculos se tiene:
TERMÓMETROS
1 2 3 4
0.95 0.33 -2.15 1.05
1.06 -1.46 1.70 1.27
1.96 0.20 0.48 -2.05
muestra nj 3 3 3 3 N = 12
Sumas x.j 3.97 -0.93 0.03 0.27 X.. = 3.34
_
1.323 -0.31 0.01 0.09 _
Promedio x . j x .. = 1.113
S C total = x 2 ..
X ij2
N
249
Métodos Estadísticos Varela/Llanos/Asnate
x 2 . j x 2 ..
S C tratam = nj
N
= (3.97) 2 (0.93) 2 (0.03) 2 (0.27) 2
0.93
3 3 3 3
x2 . j
S C error = X 2
ij
nj
= 22.809 -
(3.97) 2
(0.93) (0.03) (0.27) 2
2 2
3 3 3 3
= 22-809 – 5.566 = 17.24
a) Cuadro ANVA.
b)
FUENTE SC G.L
Cuadrado F F
s Medios calc Teórico
Tratamiento 4.64 4 -1 = 3 1.55 0.71 F 0.95 (3)
Error 17.24 12 - 4 = 2.16 8 (8) = 4.07
8
Total 21.88 12 - 1 =
11
SCtratam=
(48.87) 2 (48.92) 2 (48.92) 2 (36.63) 2 (24.36) 2 (207.7) 2
4 4 4 3 2 17
a) CUADRO ANVA
252
Métodos Estadísticos Varela/Llanos/Asnate
SEMILLAS
lenteja trebol girasol trigo maíz Alegría
2.25 5.13 4.97 1.45 1.29 5.78
2.46 4.17 4.86 1.60 1.69 3.99
3.02 5.67 5.08 2.03 1.49 4.15
2.04 4.21 4.08 1.52 1.62 3.41
2.53 3.89 4.27 1.56 1.34 2.90
1.86 4.01 3.77 1.68 3.29 3.32
253
Métodos Estadísticos Varela/Llanos/Asnate
SEMILLAS
lentej trebo giraso trigo maíz Alegrí
a l l a
2.25 5.13 4.97 1.45 1.29 5.78
2.46 4.17 4.86 1.60 1.69 3.99
3.02 5.67 5.08 2.03 1.49 4.15
2.04 4.21 4.08 1.52 1.62 3.41
2.53 3.89 4.27 1.56 1.34 2.90
1.86 4.01 3.77 1.68 3.29 3.32
MUESTR 6 6 6 6 6 6 N = 36
A
SUMAS 14.16 27.08 27.03 9.84 10.72 23.55 X..=112.
38
PROMED 2.366 4.513 4.505 1.64 1.787 2.925 _
IO X ..=
17.73
(112.38) 2
SC total = (2.25)2 + (2.46)2 + ........ + (3.32)2 -
36
= 418.212 – 350.813 = 67.399
S C Tratam =
(1416) 2 (27.08) 2 (27.03) 2 (9.84) 2 (10.72) 2 (23.55) 2 (112.38) 2
6 6 6 6 6 6 36
254
Métodos Estadísticos Varela/Llanos/Asnate
SCM
Fuente SC G.L. (Varianza Fcalc
)
Tratam. 54.32 6-1 = 5 10.864 24.917 F 0.95 (5) (30) =
Error 13.07 36-6= 0.436 2.53
8 30
Total 67.07 36-1 =
8 35
NÚMERO DE RATÓN
255
Métodos Estadísticos Varela/Llanos/Asnate
1 2 3 4 5 6 7 8
19 73 50 11 1 26 12 47
26 70 59 10 11 15 12 47
12 12 11 9
11
Solución:
Realizando los cálculos se tiene:
NÚMERO DE RATÓN
1 2 3 4 5 6 7 8
1 73 50 11 1 26 12 47
9 70 59 10 11 15 12 47
2 12 12 11 9
6 11
MUESTR 2 2 2 3 3 4 3 2 N = 21
A
SUMAS 4 143 109 33 24 63 33 94 X .. = 544
5
PROMED 2 71.5 54. 11 8 15.75 11 47 _
IO 2. 5 X
5 ..=241.25
(544) 2
5 C total = (19)2 + (26)2 + ........ + (47)2 -
21
= 23808 – 14092.19
= 9715.81
256
Métodos Estadísticos Varela/Llanos/Asnate
5CTratam=
(45) 2 (143) 2 (109) 2 (33) 2 (24) 2 (63) 2 (33) 2 (94) 2 (544) 2
2 2 2 2 3 4 3 2 21
= 23505.75 – 14092.19
= 9413.56
5 C Tratam = 23808.23505.75
= 302.25
H 0 : u1 = u2 = u3 = ...........= uk
H 1 : No todas las u; son iguales
Rechazamos Ho
Si existe diferencia significativa entre los ratones)
257
Métodos Estadísticos Varela/Llanos/Asnate
LOTE TRATAMIENTOS
50ºF 55ºF 60ºF 70ºF
1 8 5 7 10
2 14 10 3 5
3 12 8 6 5
4 9 8 5 7
5 12 9 4 8
Solución:
Realizando los cálculos se tiene
n=5
N = nk = (5) (4) = 20
N = 20
x 2 . j X 2 ..
5 C tratam =
n N
(55) (40) 2 (25) 2 (35) 2 (155) 2
2
=
5 20
= 1295 – 1201.25
258
Métodos Estadísticos Varela/Llanos/Asnate
= 93.75
x 2 . i X 2 ..
5 C bloques =
K N
=
(30) 2 (32) 2 (31) 2 (29) 2 (33) 2
1201.25
4
Rechazamos Ho
259
Métodos Estadísticos Varela/Llanos/Asnate
MEDICAMENTOS
HOSPITALE A1 A2 A3 A4
S
B1 10 11 12 10
B2 19 9 18 7
B3 11 8 23 5
¿Son
efectivos los medicamentos de los medicamentos con
= 0.01
Solución:
Medias
MEDICAMENTOS Sumas _
HOSPITALES Xi x i.
A1 A2 A3 A4 X .. = 207.7
B1 10 11 12 10 43 10.75
B2 19 9 18 7 53 13.25
B3 11 8 23 5 47 11.75
Sumas X . j 40 28 53 22 X .. = 143 -
_ 13.333 9.333 17.667 7.33 -- _
Medias x i .j x .. = 1.917
260
Métodos Estadísticos Varela/Llanos/Asnate
n=3
(40) 2 (28) 2 (53) 2 (22) 2 (143) 2
SC tratam =
3 12
= 1892.33 – 1704 – 083
= 188.25
(43) 2 (53) 2 (47) 2 (22) 2
SC bloques = 1704.083
4
= 1716.75 – 1704.083 = 12.667
2 2 2 (143) 2
SCtotal = (10) + (19) + ....... + (5) -
12
= 2019 – 1704.083 = 314.917
261
Métodos Estadísticos Varela/Llanos/Asnate
MÉTODOS DE
EXTRACCIÓN
Condiciones De
Conservación A B C D
1 1.35 1.13 1.06 0.98
2 1.40 1.13 1.26 1.22
3 1.49 1.46 1.40 1.35
SC Tratam =
(4.24) (3.72) (3.72) 2 (3.55) 2 (15.23) 2
2 2
3 12
263
Métodos Estadísticos Varela/Llanos/Asnate
MÉTODOS DE EXTRACCIÓN
OPERADORES A B C
Solución
N = (3) (5) = 15
MÉTODOS DE Medias
EXTRACCIÓN _
Sumas xi.
OPERAD Xi
X .. =
ORES A B C
207.7
264
Métodos Estadísticos Varela/Llanos/Asnate
= 140.290 – 140282.691
= 0.642
265
Métodos Estadísticos Varela/Llanos/Asnate
Aceptamos Ho
No existe diferencia significativa entre los tipos de llave
b) No hay medidas que son significativamente diferentes
entre sí.
266
Métodos Estadísticos Varela/Llanos/Asnate
MACROMOLÉCULA NO IÓNICA
CONSERVA
DORES Myrj Pluronic Tween Peg
52 F - 68 80 4000
Solución
Medias
MACROMOLÉCULA NO IÓNICA _
CONSERVA x i.
DORES Sumas
Myrj 52 Pluronic Tween Peg Xi
F - 68 80 4000
N = (3) (4) = 12
267
Métodos Estadísticos Varela/Llanos/Asnate
SCtratam=
(709) 2 (336) 2 (1249) 2 (319) 2 (2613) 2
3 12
= 759113 – 568 980.75
= 190132.25
(518)2 (727)2 (1368)2
SC bloques = 568980.75
3
= 667069.25 – 568980.75
= 98088.5
SC total = (146)2 + (199)2 + ........ + (108)2 – 568980.75
= 996037 – 568980.75
= 427 056.25
SC error = 427056.25 – 98088.5 – 190132.25
= 138 835.3
Fuente SC G.L.
SCM Fcal
(Varianzas c
)
Tratamientos 190132.2 4-1 63377.417 2.73
5 =3 9
Bloques 98088.5 3-1 = 49044.25 2.12 F0.95
(conservadores 2 0 (2) (6)
) =5.1
4
Error 138835.5 (3)(2 23139.25
)=6
Total 427056.2 N-1
5 = 11
268
Métodos Estadísticos Varela/Llanos/Asnate
TIEMPO DE
CONSERVADO ALMACENAMIENTO
RES 0 días 1 2 6 sem.
sem. sem.
Ninguno 4.80 4.78 4.60 4.30
Ácido benzoico 4.72 4.70 4.48 4.47
Propil parabeno 4.79 4.60 4.65 4.35
Metilparabeno 4.79 4.70 4.70 4.25
Clorobutanol 4.80 4.78 4.62 4.34
Cloruro de 4.79 4.75 4.70 4.32
benzalconio
TIEMPO DE Medias
“BLOQUES” ALMACENAMIENTO _
Sumas xi.
0 1 2 6
Xi
CONSERVA días sem. sem. sem.
DORES
Ninguno 4.80 4.78 4.60 4.30 18.48 4.62
Ácido 4.72 4.70 4.48 4.47 18.37 4.59
benzoico 4.79 4.60 4.65 4.35 18.39 4.598
Propil 4.79 4.70 4.70 4.25 18.44 4.61
parabeno 4.80 4.78 4.62 4.34 18.54 4.635
Metilparaben 4.79 4.75 4.70 4.32 18.56 4.64
o
Clorobutanol
Cloruro de
benzalconio
Sumas X . j 28.6 28.3 27.7 26.03 X ..= --
9 1 5 110.78
_ 4.78 4.71 4.62 4.338 -- _
Medias x .j 2 8 5 x .. =
4.616
n=6
N = (6) (4) = 24
(28.69) 2 (28.31) 2 (27.75) 2 (26.03) 2 (110.78) 2
SCtratam=
6 24
= 512.033 – 511.342
= 0.691
(18.48)2 (18.37)2 (18.39)2 (18.44)2 (18.54)2 (18.56)2
SCbloques= 511.342
4
= 511.350 – 511.342 = 0.008
270
Métodos Estadísticos Varela/Llanos/Asnate
CUADRO ANVA
SCM
Fuente SC G.L. (Varianz F.calc
as)
Tratamientos 0.691 4-1 = 3 0.2303 43
Bloques 0.008 6-1 = 5 0.0016
Error 0.08 (3)(5) = 15 0.0053
Total 0.779 N-1 = 23
VITAMINA
FAMILIA
A B C
1 11.2 9.3 10.4
2 9.7 12.0 11.5
3 8.2 9.4 8.9
4 9.1 10.1 7.9
5 11.0 10.3 10.8
6 7.3 9.1 8.4
7 8.2 8.5 10.1
271
Métodos Estadísticos Varela/Llanos/Asnate
Solución:
“BLOQUE VITAMINA
Medias
S” Sumas
_
FAMILIA A B C Xi xi.
1 11.2 9.3
10.4 30.9 10.3
2 9.7 12.0
11.5 33.2 11.067
3 8.2 9.4
8.9 26.5 8.833
4 9.1 10.1
7.9 27.1 9.033
5 11.0 10.3
10.8 32.1 10.7
6 7.3 9.1
8.4 24.8 8.26
7 8.2 8.5
10.1 26.8 8.933
Sumas X . j 64.7 68.7
68 X ..= --
201.4
_ 9.243 9.814 9.714 -- _
Medias x .j x .. =
9.59
n=7
N = 21
CUADRO ANVA
273
Métodos Estadísticos Varela/Llanos/Asnate
Solución
OS) 1 2 3 Xi xi.
A 14 18 15 47 15.667
B 12 16 14 42 14
C 16 17 12 45 15
D 15 19 14 48 16
E 10 12 12 34 11.333
F 11 13 9 33 11
Sumas X . j 78 95 76 X ..= --
249
_ 13 15.83 12.66 -- _
Medias x .j 3 7 x .. =
13.833
274
Métodos Estadísticos Varela/Llanos/Asnate
275
Métodos Estadísticos Varela/Llanos/Asnate
Solución:
Realizando los cálculos
DIETA Medias
“BLOQUE Sumas _
S” A B Xi xi.
n=10
N = (10) (2) = 20
= 229059 – 228980 = 79
SC total = (105)2 + (101)2 + ........ + (108)2 – 228980
= 229154 – 228980 = 174
276
Métodos Estadísticos Varela/Llanos/Asnate
SC error = 174 – 79 – 80 = 15
Fuente SC G.L.
SCM Fcalc F
Varianzas teórico
Tratamiento 80 2-1 = 1 80 47.99 F0.95 (1)
(9) =
5.12
Bloques 79 10-1 = 8.778 5.266
9
error 15 (1)(9) 1.667
=9
total 174 N-1 =
19
277
Métodos Estadísticos Varela/Llanos/Asnate
OBSERVADOR
SUJETO 1 2 3
1 190 193 187 186 192 190
2 172 170 167 166 168 169
3 180 178 176 177 178 181
4 206 204 200 201 203 205
5 175 173 172 173 176 177
a) Decir y examinar si cada factor es fijo o
aleatorio.
b) Efectuar el análisis de varianza de dos factores
adecuado.
Solución
OBSERV SUJETO
ADOR ni xi
1 2 3 4 5
1 190 172 180 206 175
193 170 178 204 173
nij 2 2 2 2 2 10
xij. 383 342 358 410 348 1841
2 187 164 176 200 172
186 166 177 201 173
nij 2 2 2 2 2 10
xij. 1802
3 192 168 178 203 176
190 169 181 205 177
nij 2 2 2 2 2 10
xij. 1839
n.j 6 6 6 6 6 N=
x.j. 113 100 107 1219 1046 30 x... =
8 9 0 5482
I=3
FILAS (A)
278
Métodos Estadísticos Varela/Llanos/Asnate
= 1006350.333 – 1001744.133
= 4606.2
INTERACCIÓN (A, B)
SCAB = 4721.867 – 96.467 – 4606.2 = 19.2
SUB TOTAL
SCSUB TOTAL =
(383) 2 (342) 2 (358) 2 (410) 2 (353) 2 (5482) 2
.....
2 2 2 2 2 2
279
Métodos Estadísticos Varela/Llanos/Asnate
Rechaza Ho
H1 : Existe diferencia entre los observadores
(FACTOR FIJO)
Rechaza Ho
H1 : Existe diferencia entre los sujetos (FACTOR
ALEATORIO)
Acepta Ho
Ho : No hay efecto de interacción
280
Métodos Estadísticos Varela/Llanos/Asnate
HÁBITOS PRUEBA
DE Banda
FUMAR Bicicleta Caminata
esfuerzo
No 12.8 16.2 22.6
fumadores 13.5 18.1 19.3
11.2 17.8 18.9
Fumadores 10.9 15.5 20.1
moderados 11.1 13.8 21
9.8 16.2 15.9
Grandes 8.7 14.7 16.2
fumadores 9.2 13.2 16.1
7.5 8.1 17.8
Solución:
HÁBITO PRUEBA
S DE xi
Biciclet Banda Camina ni
FUMAR
a esfuerz ta
o
No 12.8 16.2 22.6
fumadores 13.5 18.1 19.3
11.2 17.8 18.9
nij 3 3 3 9
xij. 37.5 52.1 60.8 150.4
Fumadore 10.9 15.5 20.1
s 11.1 13.8 21
moderado 9.8 16.2 15.9
s
281
Métodos Estadísticos Varela/Llanos/Asnate
nij 3 3 3 9
xij. 31.8 45.5 57 134.3
Grandes 8.7 14.7 16.2
fumadores 9.2 13.2 16.1
7.5 8.1 17.8
nij 3 3 3 9
xij. 25.4 3.6 50.1 111.5
n.j 9 9 9 N = 27
x.j. 94.7 133.6 167.9 x... = 396.2
I=3
FILAS (A)
(150.4) 2 (134.3) 2 (111.5) 2 (396.2) 2
SCA =
9 9 9 27
= 5898.767 – 5813.868 = 84.899
COLUMNAS (B)
(94.7) 2 (133.6) 2 (167.9) 2
SCB = 5813.868
9 9 9
= 6111.94 – 5813.868 = 298.072
= 4606.2
INTERACCIÓN (A B)
SCAB = 385.785 – 84.899 – 298.072 = 2.814
SUB TOTAL
SCSUB TOTAL =
(37.5) 2 (52.1) 2 (60.8) 2 (31.8) 2 (50.1) 2
..... 5813.868
3 3 3 3 3
= 6199.653 – 5813.868
= 385.785
ERROR
282
Métodos Estadísticos Varela/Llanos/Asnate
TOTAL
SCtotal = (12.8)2 + (113.5)2 + . . . . + (17.8)2 – 5813.868
= 6258.9 – 5813.868
= 445.032
Rechaza Ho
H1 : Las pruebas son significativamente diferentes.
Rechaza Ho
H1 : Las pruebas son significativamente diferentes
Acepta Ho
Ho : Si existe efecto de interacción
Solución:
VALORES HUMEDAD
CODIFICADO
S ni
xi
TEMPERATU 10% 50%
RA
23 24
24 24
-29ºC
25 25
24 26
nij 4 4
8
xij. 96 99 195
26 24
25 25
21ºC
26 26
26 26
nij 4 4
8
xij. 103 101 204
25 27
26 26
71ºC
26 28
28 28
284
Métodos Estadísticos Varela/Llanos/Asnate
nij 4 4
8
xij. 105 109 211
I=3
n.j 12 12
N = 24 x... =
x.j. 304 309
613 FILA
S (A)
(195) 2 (204) 2 (214) 2 (613) 2
SCA =
8 8 8 24
= 15679.625 – 15657.042
= 22.583
COLUMNAS (B)
(304) 2 (309) 2
SCB = 15657.042
12 12
= 15658.083 – 15657.042 = 1.041
INTERACCIÓN
SCAB = 26.808 – 22.583 – 1.041
= 2.584
SUB TOTAL
SCSUB TOTAL =
(96) 2 (99) 2 (103) 2 (101) 2 (105) 2 (109) 2
15657.042
4 4 4 4 4 4
= 15683.25 – 15657.042
= 26.208
ERROR
SCerror = 41.958 – 26.208 = 15.75
TOTAL
SCtotal = (23)2 + (24)2 + ....... + (28)2 – 15657.042
285
Métodos Estadísticos Varela/Llanos/Asnate
= 15699 – 15657.042
= 41.958
CUADRO ANVA = 0.05
SCM
Fuente SC G.L. F.calc F teórico
Varianzas
Filas 22.583 3-1= 2 11.292 12.905 F0.95 (2) (18) =
3.555
Columna 1.041 2-1= 1 1.041 1.19 F0.95 (1) ( 18) =
4.414
Interacción 2.584 (2)(1) = 1.292 1.477 F0.95 (2) (18) =
2 3.555
Subtotal 26.208 3(2)-1 = --
5
Error 15.75 24-6 =18 0.875
Total 41.958 N-1 = 23 --
Rechaza Ho
H1 : Existe diferencia significativa entre las temperaturas
Rechaza Ho
Ho : No existe diferencia entre las humedades
Acepta Ho
Ho : No existe efecto de interacción
17. Se probaron cinco variedades de duraznos y cuatro
fertilizantes. De cada parcela experimental se seleccionaron
al azar 3 cuadros y se anotaron sus cosechas como sigue:
Solución:
286
Métodos Estadísticos Varela/Llanos/Asnate
PRUEBA
FERTILIZANTES
1 2 3 4 5
1 57 26 39 23 48
46 38 329 36 35
28 20 43 18 48
2 67 44 57 74 61
72 68 61 47 60
66 64 61 69 75
3 95 92 91 98 78
90 89 82 85 89
89 99 98 85 95
4 92 96 98 99 99
88 95 93 90 98
99 99 98 98 99
287
Métodos Estadísticos Varela/Llanos/Asnate
PRUEBA
xi ..
FERTIL ni .
1 2 3 4 5
IZANTE
S
57 26 39 23 48
1 46 38 329 36 35
28 20 43 18 48
3 3 3 3 3 15
nij
131 84 121 77 13 544
xij.
1
67 44 57 74 61
2 72 68 61 47 60
66 64 61 69 75
3 3 3 3 3 15
nij
205 176 179 190 19 946
xij.
6
95 92 91 98 78
3 90 89 82 85 89
89 99 98 85 95
3 3 3 3 3 15
nij
274 280 271 268 26 1355
xij.
2
92 96 98 99 99
4 88 95 93 90 98
99 99 98 98 99
3 3 3 3 3 15
nij
279 290 287 287 29 1441
xij.
6
12 12 12 12 12 N=
n.j
889 830 822 822 88 60 x... =
x.j.
5 4286
a) Construya una tabla de ANDEVA
288
Métodos Estadísticos Varela/Llanos/Asnate
FILAS (A)
(544) 2 (946) 2 (1355) 2 (1441) 2 (4286) 2
SCA =
15 15 15 15 60
= 340223.867 – 306163.267
= 34060.6
COLUMNAS (B)
SCB =
(889) 2 (830) 2 (860) 2 (822) 2 (885) 2
306163.267
12 12 12 12 12
= 306477.5 – 306163.267
= 314.233
INTERACCIÓN (A B)
SCAB = 35282.733 – 34060.6 – 314.233 = 907.9
SUB TOTAL
SCSUB TOTAL =
(57) 2 (46) 2 (99) 2
..... 306163.267
3 3 3
= 341446 – 306163.267
= 35282.733
TOTAL
SCtotal = (57)2 + (46)2 + . . . . + (99)2 – 306163.267
= 343854 – 306163.267
= 37690.733
289
Métodos Estadísticos Varela/Llanos/Asnate
CUADRO ANVA
= 0.05
Modelo
Fuente SC G.L. Varianzas F teórico
Fijo
Filas (A) 34060.6 4-1 = 11353.533 188.597 F0.95 (3) (40) =
3 2.84
Columnas 314.233 5-1 = 78.558 1.305 F0.95 (4) ( 40) =
(B) 4 2.61
Interacción 907.9 (3)(4) = 75.658 1.257 F0.95 (12) (40)
(AB) 12 =2
Subtotal 35282.733 20-1 = --
19
Error 2408 60-20 = 60.20
40
Total 37690.733 60-1 =
59
290
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMAS PROPUESTOS
PROBLEMA 01 : “ Cada cual con su juego”
291
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 02:
Un fabricante de papel utilizado para fabricar bolsas para
caramelos, está interesado en mejorar la resistencia a la
tensión del producto. El grupo de ingeniería del producto
piensa que la resistencia a la tensión es una función de la
concentración de madera dura en la pulpa, y que el rango de
interés práctico de las concentraciones de madera dura está
entre 5 y 20%. El equipo de ingenieros responsable del
estudio decide investigar cuatro niveles de concentración de
madera dura: 5, 10, 15 y 20”. Para ello, decide fabricar seis
especímenes de prueba para cada nivel de concentración,
utilizando una planta piloto. Los 24 especímenes se someten
a prueba en un probador de tensión de laboratorio, en un
orden aleatorio. Los datos de este experimento aparecen en
la tabla siguiente:
Tabla Resistencia del papel a la tensión (psi).
292
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 03 :
En Design and Analysis of Experiments, tercera edicación
(John Wiley, 1991),D.C. Montgomery describe un
experimento de un solo factor donde se utiliza un modelo de
efectos aleatorios, en el que una compañía textil produce
una tela en varios telares. La compañía tiene interés en la
variabilidad de la resistencia a la tensión de un telar a
otro. Para investigar esta variabilidad, un ingeniero de
producción selecciona al azar cuatro telares y determina la
resistencia da la tensión de las muestras de tela domadas
aleatoriamente de cada telar. Los datos obtenidos aparecen
en la tabla siguiente:
Tela Observaciones Tot Prom
r 1 2 3 4 al edio
1 98 97 99 96 390 97.5
2 91 90 93 92 366 91.5
3 96 95 97 95 383 95.8
4 95 96 99 98 388 97.0
152 95.45
7
PROBLEMA 04 :
Supóngase que en un experimento industrial un ingeniero
está interesado en cómo varía la absorción media de
humedad en el concreto de entre cinco diferentes mezclas
de concreto. Las mezclas varían en el porcentaje en peso de
un cierto ingrediente importante. se exponen a la humedad
durante 48 horas. Se decide probar 6 para cada mezcla, lo
que requiere la prueba de un total de 30 muestras. Los datos
se registran en la tabla siguiente.
Absorción de humedad en mezclas de concreto
Mezcla (% de peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 5.11 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 320 16,85
3416 3663 2791 3664 4
Media 553.33 569.3 610.5 465.1 610.6 561.8
3 0 7 7 0
294
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 05 :
Parte del estudio “Serum Inorganic Phosphorus Levels in
Children with Seizure disorders Taking Anticonvulsant
Drugs”, que se llevó a cabo en la Virginia Polytechnic
Institute and State University en 1982, se diseñó para medir
los niveles de actividad de fosfatasa alcalina de suero
(unidades Bessey – Lowry) en niños que padecían ataques
convulsivos y quienes habían recibido terapia
anticonvulsionante bajo el cuidado de un especialista
privado. Se encontraron cuarenta y cinco sujetos para el
estudio y se clasificaron en cuatro grupos de acuerdo con la
medicina que se les proporcionó.
295
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 06 :
Parte del estudio “Serum Inorganic Phosphorus Levels in
Children with Seizure disorders Taking Anticonvulsant
Drugs”, que se llevó a cabo en la Virginia Polytechnic
Institute and State University en 1982, se diseñó para medir
los niveles de actividad de fosfatasa alcalina de suero
(unidades Bessey – Lowry) en niños que padecían ataques
convulsivos y quienes habían recibido terapia
anticonvulsionante bajo el cuidado de un especialista
privado. Se encontraron cuarenta y cinco sujetos para el
estudio y se clasificaron en cuatro grupos de acuerdo con la
medicina que se les proporcionó.
296
Métodos Estadísticos Varela/Llanos/Asnate
297
Métodos Estadísticos Varela/Llanos/Asnate
Detergente A: 77 81 71 76 80
Detergente B: 72 58 74 66 70
Detergente C: 76 85 82 80 77
PROBLEMA 08 :
Un laboratorista quiere comparar la fuerza de ruptura de tres
clases de cuerda y originalmente había planificado repetir
cada determinación seis veces. No obstante al no contar con
el tiempo suficiente, debe basar su análisis en los resultados
siguientes (en onzas);
Cuerda 1: 18.0 16.4 15.7 19.6 16.5
18.2
Cuerda 2: 21.1 17.8 18.6 20.8 17.9
19.0
Cuerda 3: 16.5 17.8 16.1
298
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 09 :
Se realiza un experimento para determinar el efecto de
cuatro sustancias químicas diferentes sobre la
resistencia de una tela. Las sustancias se emplean como
parte del proceso terminal de planchado permanente. Para
ello se escogen cinco muestras de tela y se aplica un diseño
aleatorizado por bloques completos mediante la prueba de
cada sustancia en un orden aleatorio sobre cada una de las
muestras de tela. Los datos aparecen en la tabla. Se probará
la diferencia en las medias utilizando para ello el análisis de
varianza con = 0.01.
299
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 10:
En un número reciente de la revista Fortune se relata el
intento de un importante empresa de electrónica para
establecer un sistema que diera a los empleados la
oportunidad de calificar el rendimiento de sus supervisores
y otro personal directivo. Supongamos que se eligen al azar
a cinco empleados y se les pide que califiquen a cuatro de
sus directivos conforme a una escala de 10 a 50. los
resultados podrían ser los de la tabla siguiente:
Directivo (tratamiento)
Empleados 1 2 3 4 Xi
1 31 35 46 38 37.50
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 52 39 39.25
5 14 20 40 20 23.50
Xi 23 28.4 43.6 30.6
X 31.4
300
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 11 :
En un experimento se quieren comparar las capacidades de
reproducción de frecuencias bajas de 4 recubrimientos de
cinta magnética, y se van a efectuar 5 observaciones de cada
uno. El experimento podría realizarse en un DCA,
simplemente obteniendo las 20 mediciones con la misma
máquina reproductora y aleatorizando el orden de las 20
observaciones. Nótese que aquí una unidad experimental
está definida por el orden de la observación. A pesar de lo
anterior el experimentador decir que es conveniente probar
los tratamientos bajo condiciones más diversas, y se
propone utilizar 5 diferentes grabadoras para el
experimento, utilizando cada grabadora como un bloque en
el que se probarán los 4 tratamientos (recubrimientos). El
propósito del experimento no es comparar las grabadoras,
las cuales han sido escogidas precisamente porque son de
diferentes calidades, sino comparar los 4 recubrimientos. En
este caso usar 4 grabadoras (bloques) distintas tiene el
único propósito de que las conclusiones del experimento
sean válidas bajo diversas condiciones. Se supone que el
uso de varias grabadoras no introducirá mayor error en el
diseño porque las frecuencias se compararán
exclusivamente dentro de cada bloque. Una vez realizadas
las 20 observaciones se obtiene los siguientes resultados.
Las respuestas son las frecuencias mínimas reproducidas
(en Hertz).
301
Métodos Estadísticos Varela/Llanos/Asnate
3 32 19 37 27 115 28.75
4 18 9 26 23 76 19.00
5 26 18 29 20 93 23.25
Yi. 126 76 161 118 481
Y i. 25.2 15.2 32.2 23.6
303
Métodos Estadísticos Varela/Llanos/Asnate
2
Respuesta: F0 con F10 ,0.10 = 2.9245. Puesto que F0 <
2.9245, la conclusión es que con un nivel de significancia
de 0.10 las 3 variedades de maíz tienen el mismo
rendimiento.
PROBLEMA 13:
Para el ensamble de un artículo en particular se están
considerando cuatro máquinas diferentes, M1, M2, M3 y M4.
Se decide que deben utilizarse seis operadores diferentes en
un experimento de bloques aleatorizado para comparar las
máquinas. Las máquinas se asignan a cada operador en un
orden aleatorio. La operación de las máquinas requiere
determinada destreza física y se anticipa que habrá una
diferencia entre los operarios en cuanto a la velocidad con la
cual operarán la maquinaria. Se registraron los siguientes
tiempos, en segundos, para el ensamble del producto
determinado.
Operador 1 M2 M4 M3 M1
39.8 41.3 40.2 42.5
Operador 2 M3 M1 M2 M4
40.5 39.3 40.1 42.2
Operador 3 M2 M1 M4 M3
40.5 39.6 43.5 41.3
304
Métodos Estadísticos Varela/Llanos/Asnate
Operador 4 M4 M2 M1 M3
44.2 42.3 39.9 43.4
Operador 5 M1 M3 M2 M4
42.9 44.9 42.5 45.9
Operador 6 M2 M4 M3 M1
43.1 42.3 45.1 43.6
305
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 14:
En relación con los datos, específicamente,
GPA GPA GPA
Bajo típico Alto
71 92 89
Escuela A
Escuela B 44 51 85
Escuela C
50 64 72
Escuela D
67 81 86
306
Métodos Estadísticos Varela/Llanos/Asnate
CAPITULO IV
PRUEBAS NO PARAMETRICAS
INTRODUCCION
La estadística no paramétrica en contraste con la
estadística paramétrica no se ocupa de hacer estimaciones y
pruebas de hipótesis acerca de parámetros y no depende del
conocimiento de cómo se distribuye la población.
1. DISTRIBUCIÓN JI-CUADRADO ( 2 )
Es necesario comentar la distribución Ji-
cuadrada para el uso de la prueba Ji-Cuadrado. En
realidad la distribución ji-cuadrada es la distribución
muestral de s2. O sea que si se extraen todas las
muestras posibles de una población normal y a cada
muestra se le calcula su varianza. Se obtendrá la
distribución muestral de varianzas. Para estimar la
varianza poblacional o la desviación estándar. Se
necesita conocer el estadístico 2 . Si se elige una
muestra de tamaño n de una población normal con
varianza 2 .
2
n 1 s 2
El estadístico: X tiene una
2
distribución muestral que es una distribución ji-
308
Métodos Estadísticos Varela/Llanos/Asnate
X 2
n 1 s 2
donde n es el tamaño de la muestra.
2
s2 la varianza muestral y 2 la varianza de la
población de donde se extrajo la muestra. El
estadístico ji-cuadrada también se puede dar con la
x x
2
siguiente expresión: X 2
2
309
Métodos Estadísticos Varela/Llanos/Asnate
Grafico Nº 1
1 v 1 x
f ( x) x 2
e 2
2
v
2 2 v
Para x 0 v 0
310
Métodos Estadísticos Varela/Llanos/Asnate
Ejemplo:
Númer
o de 0 1 2 3 4 5 Total
caras
Númer
o de 38 144 342 287 164 25 1000
series
Solución:
311
Métodos Estadísticos Varela/Llanos/Asnate
2. Nivel de significancia:
0, 05
3. Estadística de Prueba:
k
(oi - ei )2
Se usa la prueba Ji-cuadrada. x 2 =
i=1 ei
4. Muestra:
312
Métodos Estadísticos Varela/Llanos/Asnate
2, 47
Por lo tanto p 0, 494 . Así pues. La
5
distribución binomial ajustada viene dada por
P( x k ) Ck5 (0, 494) k (0,506) n k .
Número
de P(x= Frecuencia Frecuencia
caras caras) esperada observada
(x)
0 0.0332 33.2 38
1 0.1619 161.9 144
2 0.3162 316.2 342
3 0.3087 308.7 287
4 0.1507 150.7 164
5 0.0294 29.4 25
313
Métodos Estadísticos Varela/Llanos/Asnate
5. Regla de decisión:
Entonces
k
(oi - ei )2 (38 33, 2)2 (25 29, 4) 2
x2 = ... 7,54
i=1 ei 33, 2 29, 4
Grados de libertad: k 1 m 6 1 1 4
Si X R2 9.49 no se rechaza H º
Si X R2 9.49 se rechaza H º
6. Conclusión:
314
Métodos Estadísticos Varela/Llanos/Asnate
... ...
.... .... .... .... ....
. .
... ...
.... .... .... .... ....
. .
...
Fila s f s1 f s1 f s1 . f sr Fs
...
Total C1 C2 C3 . Cr n
316
Métodos Estadísticos Varela/Llanos/Asnate
Solución:
2. Nivel de significancia:
5%
3. Estadística de Prueba:
s r (oij - eij )2
Se usa la prueba Ji-cuadrada. x 2 =
i=1 j=1 eij
4. Muestra:
125* 230
- e11 125*115 33,05 , e12 60, 09 ,
435 435
125*90
e13 25,86
435
318
Métodos Estadísticos Varela/Llanos/Asnate
5. Regla de decisión:
Estadística
Matemática Total
[0-10> [10-14> [14-20]
70 40 15
125
[0-10> (33,05) (60,09) (25,86)
30 130 25
185
[10-14> (48,91) (97,82) (38,28)
15 60 50
125
[14-20] (33,05) (60,09) (25,86)
Entonces:
Si X R2 9.49 no se rechaza H º
319
Métodos Estadísticos Varela/Llanos/Asnate
Si X R2 9.49 se rechaza H º
5. Conclusión:
320
Métodos Estadísticos Varela/Llanos/Asnate
321
Métodos Estadísticos Varela/Llanos/Asnate
322
Métodos Estadísticos Varela/Llanos/Asnate
Ejemplo:
Otras
Ley del Ciencia Derech Tota
facultade
Aborto s o l
s
A
82 70 62 214
favor
En
93 62 67 222
contra
323
Métodos Estadísticos Varela/Llanos/Asnate
Sin
decisió 25 18 21 64
n
Total 200 150 150 500
Solución:
2. Nivel de significancia:
5%
3. Estadística de Prueba:
s r (oij - eij )2
x =
2
4. Muestra:
324
Métodos Estadísticos Varela/Llanos/Asnate
64*150
e31
64*200
25,6 e32
64*150
19,2 , e33 19,2
500 500 500
5. Regla de decisión:
Otras
Ley del Tota
Ciencias Derecho facultade
Aborto l
s
A favor 82 (85,6) 70 (64,2) 62 (64,2) 214
En contra 93 (88,8) 62 (66,6) 67 (66,6) 222
Sin
25 (25,6) 18 (19,2) 21 (19,2) 64
decisión
Total 200 150 150 500
Entonces:
3 3 (o - e )2
( 82 - 85,6 )2 ( 21 - 19,2 )2
x = ... 1,53
2 ij ij
325
Métodos Estadísticos Varela/Llanos/Asnate
Si X R2 9.49 no se rechaza H º
Si X R2 9.49 se rechaza H º
6. Conclusión:
326
Métodos Estadísticos Varela/Llanos/Asnate
327
Métodos Estadísticos Varela/Llanos/Asnate
328
Métodos Estadísticos Varela/Llanos/Asnate
Ejemplo:
Solución:
H 0 : PM PF 0,5
H1 : PM PF 0,5
329
Métodos Estadísticos Varela/Llanos/Asnate
2. Nivel de significacincia:
5%
3. Estadística de Prueba:
Distribución Binomial
4. Muestra:
7
Bx Ci7 (0, 5)i (0, 5)15i 0, 24
i 0
5. Regla de decisión:
Si B x se rechaza la H º
Si B x No se rechaza la H º
6. Conclusión:
330
Métodos Estadísticos Varela/Llanos/Asnate
331
Métodos Estadísticos Varela/Llanos/Asnate
332
Métodos Estadísticos Varela/Llanos/Asnate
333
Métodos Estadísticos Varela/Llanos/Asnate
H º : Md Mdo
H 1 : Md Mdo
Ejemplo:
NIÑA 1 2 3 4 5 6 7 8 9 10
CALIFICACI 1
4 5 8 8 9 6 7 6 6
ON 0
Tabla:
334
Métodos Estadísticos Varela/Llanos/Asnate
NIÑA 1 2 3 4 5 6 7 8 9 10
SIGNO - 0 + + + + + + + +
Por ejemplo:
Cuando n= 9
335
Métodos Estadísticos Varela/Llanos/Asnate
p ( x 1) 0.0195
y
p ( x 8) 0.0195
En Minitab:
336
Métodos Estadísticos Varela/Llanos/Asnate
337
Métodos Estadísticos Varela/Llanos/Asnate
P( xi yi ) P( xi yi ) P( xi yi ) 0.5
338
Métodos Estadísticos Varela/Llanos/Asnate
Ejemplo:
Pareja 1 2 3 4 5 6 7 8 9 10 11 12
Con xi 1.5 2.0 3.5 3.0 3.5 2.5 2.0 1.5 1.5 2.0 3.0 2.0
Sin yi 2.0 2.0 4.0 2.5 4.0 3.0 3.5 3.0 2.5 2.5 2.5 2.5
Signo de
la
diferencia - 0 - + - - - - - - + -
xi y i
339
Métodos Estadísticos Varela/Llanos/Asnate
H º : Md x Md y 0
H a : Md x Md y 0
En Minitab:
340
Métodos Estadísticos Varela/Llanos/Asnate
341
Métodos Estadísticos Varela/Llanos/Asnate
342
Métodos Estadísticos Varela/Llanos/Asnate
Ejemplo:
URBANA RURAL
35 25 29 50
26 27 50 37
27 45 43 34
21 33 22 31
27 26 42
38 46 47
23 41 42
25 32
M d 33 34 / 2 33.5
344
Métodos Estadísticos Varela/Llanos/Asnate
21 27 34 43
22 27 35 45
23 27 37 46
25 29 38 46
25 31 41 47
26 32 42 50
26 33 42 50
Nº de datos por
encima de la 6 8 14
mediana
Nº de datos por
debajo de la 10 4 14
mediana
16 12 28
345
Métodos Estadísticos Varela/Llanos/Asnate
x 2Y n ad bc n 2 /( a b)(c d )( a c)(b d )
2
GENERALIZACION DE LA PRUEBA DE LA
MEDIANA
La prueba de la mediana puede generalizarse usando
cualquier numero fijo de percentiles de los datos
combinados en lugar de la mediana solamente los números
de cada muestra que caen entre percentiles combinados se
anotan en una tabla y luego se analizan como en una tabla
de contingencia. La hipótesis de que las K muestras se han
sacado aleatoriamente de poblaciones con distribuciones
iguales se rechaza si la x² observada es significativamente
mayor que la teórica. En este problema el numero de grados
de libertad es (k -1) (r-1). Siendo el número de categorías
usado.
Por ejemplo la siguiente tabla contiene para tres muestras (k
= 3) de tamaño 20 c/u. el numero de observaciones por
encima de p75 . Entre p50 y p75 y por debajo de p 25 .
El estadígrafo de prueba de x² tiene (3 1)( 4 1) 6 grados
de libertad. Las frecuencias esperadas para este ejemplo son
todas iguales a:
346
Métodos Estadísticos Varela/Llanos/Asnate
Frec. 1 2 3 Total
O 5 7 3
> p75 15
E 15*20/6=5 5 5
O 3 3 9
p50 y p75 15
E 5 5 5
O 4 7 4
p 25 y p50 15
E 5 5 5
O 8 3 4
< p 25 15
E 5 5 5
O 20 20 20 60
Total
E 20 20 20 60
347
Métodos Estadísticos Varela/Llanos/Asnate
348
Métodos Estadísticos Varela/Llanos/Asnate
350
Métodos Estadísticos Varela/Llanos/Asnate
EJERCICIOS RESUELTOS
Solución:
1. H 0 : ˆ 2000 psi
H1 : ˆ 2000 psi
351
Métodos Estadísticos Varela/Llanos/Asnate
Observaciones
Signo
a de a
de
al la al
la
esfuerzo diferenci esfuerzo
diferencia
cortante a cortante
xi xi -2000 xi xi -2000
1 2158,70 + 11 2165,20 +
2 1678,15 - 12 2399,55 +
3 2316,00 + 13 1779,80 -
4 2061,30 + 14 2336,75 +
5 2207,50 + 15 1765,30 -
6 1708,30 - 16 2053,50 +
7 1784,70 - 17 2414,40 +
8 2575,10 + 18 2200,50 +
9 2357,90 + 19 2654,20 +
10 2256,70 + 20 1753,70 -
2. Regla de decisión:
352
Métodos Estadísticos Varela/Llanos/Asnate
3. Cálculos:
P 2 P( R 14, cuando p 1/ 2
20
P 2 Cr20 (0, 5) r (0, 5) 20 r 0,1153
r 14
4. Conclusión:
353
Métodos Estadísticos Varela/Llanos/Asnate
Calificación Calificación
Signo de la diferencia
Signo de la diferencia
Catador
Catador
Cereza
Cereza
Uva
Uva
1 4 2 + 21 3 5 -
2 1 3 - 22 4 4 0
3 2 2 0 23 1 5 -
4 5 3 + 24 1 3 -
5 3 1 + 25 4 3 +
6 3 2 + 26 5 2 +
7 4 4 0 27 3 5 -
8 1 5 - 28 3 1 +
9 5 4 + 29 2 2 0
10 4 2 + 30 2 5 -
11 3 2 + 31 5 4 +
12 4 1 + 32 5 4 +
13 2 3 - 33 4 3 +
14 1 4 - 34 3 3 0
15 5 4 + 35 1 5 -
16 4 3 + 36 2 5 -
354
Métodos Estadísticos Varela/Llanos/Asnate
17 5 3 + 37 3 2 +
18 2 4 - 38 4 4 0
19 4 2 + 39 4 2 +
20 5 5 0 40 5 3 +
Solución:
H º : p 50%
H 1 : p 50%
2. Nivel de significación:
0.10
4. Cálculos:
355
Métodos Estadísticos Varela/Llanos/Asnate
p p 0.5
p (1 p) 0.5(1 0.5) 0
p (1 p) 0.5(0.5)
12
p p( x 12cuandoP 1 / 2 C k33 (0.5) 32
k 0
0.0076
5. Decisión:
P
p
N
21
p
33
p 0.6363
356
Métodos Estadísticos Varela/Llanos/Asnate
El valor z es:
n
X
Z 2
1
n
2
33
21
Z 2
1
33
2
Z 1.5666
P 0.94062
357
Métodos Estadísticos Varela/Llanos/Asnate
DIFERENCI
DIFERENCI
INDIVIDUO
VALORACI
A DE
SIGNO
ON
LA
A
PRODUCTO PRODUCTO
ORIGINAL NUEVO
A 6 8 -2 -
B 4 9 -5 -
C 5 4 1 +
D 8 7 1 +
E 3 9 -6 -
F 6 9 -3 -
G 7 7 0 0
H 5 9 -4 -
Solución:
358
Métodos Estadísticos Varela/Llanos/Asnate
H º : p 0.5
H1 : p 0.5
359
Métodos Estadísticos Varela/Llanos/Asnate
360
Métodos Estadísticos Varela/Llanos/Asnate
H1 : p 0.5
361
Métodos Estadísticos Varela/Llanos/Asnate
H º : p 0.5
362
Métodos Estadísticos Varela/Llanos/Asnate
SUJETO 1 2 3 4 5 6 7 8
9 1
0
RESPUEST D F F D F F F D F F
A
Solución:
1. Hipótesis
2. Nivel de Significancia:
363
Métodos Estadísticos Varela/Llanos/Asnate
- Estadístico de contraste t1 7, t 2 3, t 3
Z = -0.949
Z (0.01) = -2.33:
364
Métodos Estadísticos Varela/Llanos/Asnate
PRUEBA DE WILCOXON
x : 69,70,75,79,83,86,88,89,90,93,96,97,98,99
Solución:
1. Hipótesis:
365
Métodos Estadísticos Varela/Llanos/Asnate
2. Nivel de significación:
0.05
n( n 1)
4
14(14 1)
4
14(15)
4
52.5
n(n 1)( 2n 1)
24
(11)(12)( 23)
24
15.93
366
Métodos Estadísticos Varela/Llanos/Asnate
X
Z
5. Decisión:
Z 0.05 1.64
Solución:
- La media:
n( n 1)
4
(31)(32)
4
248
368
Métodos Estadísticos Varela/Llanos/Asnate
- La varianza:
n(n 1)( 2n 1)
24
(31)(32)(63)
24
2.064
T = 51.03
T T
189 248
Z
51.03
Z 1.16
Solución:
1. Hipótesis:
H º : 1 2 0
H 1 : 1 2 0
2. Nivel de significación:
0.05
3. Estadística:
4. Región crítica:
5. Cálculos:
DEPENDIENTE DEPENDIENTE
A B
VENT RANG VENT RANG
AS O AS O
197 1 190 3
194 2 180 7
188 4 175 8
185 5 172 10
182 6 167 13
173 9 166 14
169 11 160 17
169 12 157 18
371
Métodos Estadísticos Varela/Llanos/Asnate
DEPENDIENTE A DEPENDIENTE B
VENTAS RANGO VENTAS RANGO
164 15 155 19
166 16 150 21
154 20 146 23
149 22 145 24
142 26 143 25
139 28 140 27
137 29 135 30
130 35 135 31
134 32
133 33
131 34
122 36
120 37
118 38
109 39
98 40
95 41
372
Métodos Estadísticos Varela/Llanos/Asnate
n1 ( n1 1)
U n1 n 2 T1
2
(16)(17)
U (16)( 25) 241
2
U 400 136 241
U 295
n1 n2
Media :
2
(16)( 25)
2
400
2
200
n1n2 (n1 n2 1)
Varianza : U2
12
(16)( 25)(16 25 1)
U2
12
(400)( 42)
U2
12
16800
U2
12
U 1400
U 37.4
373
Métodos Estadísticos Varela/Llanos/Asnate
MEDICINA MEDICINA
ANTERIOR NUEVA
5 1
9 2
12 3
14 4
15 6
16 7
17 8
20 10
374
Métodos Estadísticos Varela/Llanos/Asnate
21 11
22 13
23 18
24 19
25
Solución:
1. Hipótesis:
H º : 1 2 0
H 1 : 1 2 0
2. Nivel de Significación:
0.01
3. Estadística:
4. Región Crítica:
375
Métodos Estadísticos Varela/Llanos/Asnate
5. Cálculos:
n1 (n1 1)
U n1 n2 T1
2
(12)(13)
U (12)(13) 102
2
U 156 78 102
U 132
n1 n2
Media :
2
(12)(13)
2
156
2
78
n1n2 (n1 n2 1)
Varianza : U2
12
376
Métodos Estadísticos Varela/Llanos/Asnate
(12)(13)(12 13 1)
U2
12
(156)( 26)
U2
12
4056
U2
12
U 338
U 18.38
U
Z
U
132 78
Z
18.38
Z 2.93
377
Métodos Estadísticos Varela/Llanos/Asnate
EJERCICIOS PROPUESTOS
17 15 29 19 18 20 22 25 27 9
24 20 6 24 14 17 15 23 24 26
19 23 19 16 22 28 24 17 20 13
19 10 18 31 13 23 20 17 24 14
378
Métodos Estadísticos Varela/Llanos/Asnate
Día 1 2 3 4 5 6 7 8 9 10
A 172 165 206 184 174 142 190 169 161 200
B 201 179 159 192 177 170 182 179 169 210
45 73 46 124 33 57 83 34 26 17
36 60 44 119 35 51 77 29 24 11
379
Métodos Estadísticos Varela/Llanos/Asnate
Método A 77 54 67 74 71 66
Método B 60 41 59 65 62 64 52
Método C 49 52 69 47 56
381
Métodos Estadísticos Varela/Llanos/Asnate
11 de
4 10 2 6 4 12
abril
18 de
8 5 13 8 8 10
abril
23 de
7 9 11 2 4 7
abril
S1 25 29 42 16 31 14 33 45 26 34 30 43 28 19
S2 18 37 40 56 49 28 20 34 39 47 31 65 38 32 24 49
S3 21 36 34 19 46 25 38 31 20 26 30 18
383
Métodos Estadísticos Varela/Llanos/Asnate
62 57
53 59
69 42
65 56
65 47
67 62
76 67
52 70
52 63
59 66
59 69
67 73
384
Métodos Estadísticos Varela/Llanos/Asnate
D
N
N
N
N
N
N
N
N
N
N
D
D
N
N
D
D
D
S S S S E E E S S S S S S S E E E S S E E E E
carretera, un inspector obtuvo la siguiente disposición
de árboles sanos y enfermos
385
Métodos Estadísticos Varela/Llanos/Asnate
386
Métodos Estadísticos Varela/Llanos/Asnate
CAPITULO V
INTRODUCION A LAS SERIES DE TIEMPO
5.1. INTRODUCCIÓN A LA ELABORACIÓN DE
PRONÓSTICOS
387
Métodos Estadísticos Varela/Llanos/Asnate
390
Métodos Estadísticos Varela/Llanos/Asnate
392
Métodos Estadísticos Varela/Llanos/Asnate
393
Métodos Estadísticos Varela/Llanos/Asnate
394
Métodos Estadísticos Varela/Llanos/Asnate
componente
Razón de la
Definición
Influencia
Duración
del
Patrón de
Debido a
Sistemático
movimientos
Tendencia
cambios en
ascendentes, general o
tecnología. Varios años
persistente, a largo
Población,
plazo
riqueza, valores.
Fluctuaciones Debido a
Dentro de
periódicas bastante condiciones de
Sistemático
12 meses (o
Estacional
395
Métodos Estadísticos Varela/Llanos/Asnate
Desplazamientos o
movimientos
Por lo
respectivos
Debido a general de 2
ascendentes y
interacciones de a 10 años
descendentes mediante
numerosas con
Sistemático
Debido a
variaciones
Las fluctuaciones
aleatorias en los
erráticas o (residuales)
No Sistemático
datos o debido a
en una serie de tiempo
Irregular
acontecimientos Duración
q existen después de
imprevistos breve y no
tomar en cuanta los
como huelgas, respectiva.
defectos sistemáticos –
huracanes,
tendencias estacional y
inundaciones,
cíclico
asesinatos,
políticos, etc.
Por lo tanto el total a lo largo de los 25 años no existe un
patrón sistemático y observable de los cambios en los
ingresos por ventas al menudeo en los meses de junio y
agosto. Por consiguiente, los resultados obtienen reciben la
influencia de factores irregulares o aleatorias.
Yi Ti * Si * Ci * li (2)
398
Métodos Estadísticos Varela/Llanos/Asnate
399
Métodos Estadísticos Varela/Llanos/Asnate
Y
n
Y i mínimo (4)
i
i 1
n n
X i Yi
n
(5)
X iYi i 1
n
i 1
bi i 1
2
n
Xi
n
X i 1
2
i i 1
Y la interpolación de:
400
Métodos Estadísticos Varela/Llanos/Asnate
b0 Y b1 X (6)
Una vez realizados obtenida la línea Y b0 b1 X 1 ,
se pueden sustituir los valores de X en la forma (3) para
pronosticar diversos valores de Y. Sin embargo, se puede
observar que cuando se usa el método de los mínimos
cuadrados para ajustar la tendencia lineales en serie de
tiempo, los valores observados de la serie (valores Y) por
lo general se registran en forma anula durante varios años
consecutivos (valores X). Por lo tanto, cuando se operan
con datos de una serie de tiempo anual los esfuerzos de
calculo se pueden simplificar si se “si se codifican” en
forma apropiada los valores X. Sin embargo, el programa de
codificación que se elija depende de si los datos de serie de
tiempo se han obtenido de un número par o impar de años.
-3 -2 -1 0 1 2 3
X i Yi
(7)
b1 i 1
n
X
i 1
2
i
Y i
b0 Y i 1 (8)
n
402
Métodos Estadísticos Varela/Llanos/Asnate
Impuestos
Año (Millones de
dólares)
1973 55.4
1974 61.5
1975 68.7
1976 87.2
1977 90.4
1978 86.2
1979 94.7
1980 103.2
1981 119.0
1982 122.4
1983 131.6
403
Métodos Estadísticos Varela/Llanos/Asnate
1984 157.6
1985 181.0
1986 217.8
1987 244.1
404
Métodos Estadísticos Varela/Llanos/Asnate
103.2 0 0
1980 0
157.6 630.4 16
1984 4
181.0 905.0 25
1985 5
217.8 1.306.8 36
1986 6
405
Métodos Estadísticos Varela/Llanos/Asnate
XY i i
3, 322.1
b1 i 1
n
11.9
X 2 280
i
i 1
Y
n
Y i
1,822.8
b0 Y i 1
121.4
n 15
Yi 121.4 11.9 X ;
406
Métodos Estadísticos Varela/Llanos/Asnate
1988 Y16 121.4 11.9 (8) 216.6 millones
Más aún, para los años 1989 hasta 1991 se pronostica que la
tendencia en pagos es:
407
Métodos Estadísticos Varela/Llanos/Asnate
1989 Y17 121.4 11.9 (9) 228.5 millones
1990 Y18 121.4 11.9 (10) 240.4 millones
1991 Y19 121.4 11.9 (11) 252.3 millones
408
Métodos Estadísticos Varela/Llanos/Asnate
409
Métodos Estadísticos Varela/Llanos/Asnate
n n
X i Yi
X iYi i 1 i 1
n
n
2, 520.4
(91)(313.9)
14
bi i 1
2.1
91
2 2
n
Xi 819
i 1
n
14
X
i 1
2
i
n
Y puesto que:
n n
Yi
313.9 X i
91
Y i 1
22.42 y X i 1
6.5
n 14 n 14
Entonces:
410
Métodos Estadísticos Varela/Llanos/Asnate
Pagos
Año (Millones de
dólares)
1974 10.1
1975 11.3
1976 13.8
411
Métodos Estadísticos Varela/Llanos/Asnate
1977 16.1
1978 17.1
1979 18.0
1980 20.2
1981 22.9
1982 24.5
1983 25.9
1984 27.6
1985 30.1
1986 34.8
1987 41.5
(Millones
Año Xi de X iYi X i2
dolaress)
1974 0 10.1 0 0
412
Métodos Estadísticos Varela/Llanos/Asnate
413
Métodos Estadísticos Varela/Llanos/Asnate
Yi 8.8 2.1X i
1991 Y18 8.8 2.1 (17) 4.5 millones de dólares
Y1 b0 b1 X 1 b11 X 12 (9)
415
Métodos Estadísticos Varela/Llanos/Asnate
Donde:
n n n
I. Yi nb0 b1 X i b11 X i 2
i 1 i 1 i 1
(10a)
n n n n
II. X iYi b0 X i b1 X i 2 b11 X i3
i 1 i 1 i 1 i 1
(10b)
n n n n
III. X i 2 b0 X i 2 b1 X i3 b11 X i 4
i 1 i 1 i 1 i 1
(10c)
416
Métodos Estadísticos Varela/Llanos/Asnate
n n n
X i 91,
i 1
Yi 313.9,
i 1
X Y 2,520.4
i 1
i i ; n 14
n n n n
X
i 1
i
2
819, X i 1
i
3
8, 281 , X i 4 89.271,
i 1
X
i 1
i Yi 24,877.0
2
Yi 11.1 .89 X i .094 X i 2
417
Métodos Estadísticos Varela/Llanos/Asnate
1991 Y18 11.1 .89(17) .094(172) 53.4 millones de dólares
418
Métodos Estadísticos Varela/Llanos/Asnate
Yi b0b1 X i (11)
Donde:
log Yi log b0 X i log b1 (12)
419
Métodos Estadísticos Varela/Llanos/Asnate
n n
X i log Yi
X i log Yi i 1
n
i 1
log b1 2
n
Xi
n
X
i 1
2
i i 1
n
(13)
log Y i
log b0 i 1
X log b1 (14)
n
n n
X i log Yi
X i log Yi i 1
n
i 1
129.55270
(91)(18.43915)
14
log b1 .0426296
91
2 2
n
Xi 819
X 2i i 1
n
14
i 1 n
10
1984 10 27.6 1.44091 14.40910
0
12
1985 11 30.1 1.47857 16.26427
1
14
1986 12 34.8 1.54158 18.49896
4
16
1987 13 41.5 1.61805 21.03465
9
n=1 18.4391 81
91 313.9 129.52270
4 5 9
421
Métodos Estadísticos Varela/Llanos/Asnate
Y puesto que:
n
X i
91
X i 1
6.5
n 14
Entonces:
log Y i
18.43915
log b0 i 1
X log b1 (6.5)(.426296) 1.03999
n 14
log Yi 1.03999 .0426296 X i
bº = antilog1.03999 11.0
b1 = antilog.0426296 1.031
422
Métodos Estadísticos Varela/Llanos/Asnate
Yi 11.0(1.1031) X i
1991 Y18 1.03999 .0426296(17) 1.7646932
Y18 anti log1.7464932 58.2 millones de dólares
O
1991 Y18 11.0(1.1031)17 58.3 millones de dólares
423
Métodos Estadísticos Varela/Llanos/Asnate
424
Métodos Estadísticos Varela/Llanos/Asnate
Yi Ti .Ci .li Yi
Por lo que:
Yi Ti .Ci .I i
Yi Yi
425
Métodos Estadísticos Varela/Llanos/Asnate
Pero puesto que Yi Ti se tiene:
Yi Ti .Ci .I i
Ci .I i
Yi Yi
426
Métodos Estadísticos Varela/Llanos/Asnate
428
Métodos Estadísticos Varela/Llanos/Asnate
Análisis residual
Una vez que un modelo en particular se ha ajustado a una
determinación de serie de tiempo, se pueden trazar los
residuales a lo largo de n periodo como se muestra en la
figura 12a), si este modelo se ajusta adecuadamente, los
residuales presentan el componente irregular de la serie de
tiempo y, por consiguiente deben estar distribuidos en
forma aleatoria en la serie. Por otra parte, como se muestra
en las otras tres secciones de la figura 12, si el modelo no se
ajusta adecuadamente los residuales pueden presentar algún
patrón sistemático como fallas para explicar la tendencia
(b), la variación cíclica (c) o, con datos mensuales, explicar
la variación estacional (d).
430
Métodos Estadísticos Varela/Llanos/Asnate
431
Métodos Estadísticos Varela/Llanos/Asnate
n
Variación no exp licada ( Yi Y1 ) (16)
i 1
Principio de la parquedad
433
Métodos Estadísticos Varela/Llanos/Asnate
Y1 Yt 1 (19)
435
Métodos Estadísticos Varela/Llanos/Asnate
436
Métodos Estadísticos Varela/Llanos/Asnate
438
Métodos Estadísticos Varela/Llanos/Asnate
Promedios móviles
( L 1 ) / 2
1
Yi
L
L
Y( i t )
t ( 1 L ) / 2
(20)
441
Métodos Estadísticos Varela/Llanos/Asnate
1) Año 2) 3) 4) 5) 6)
Millones Total Promedio Total Promedio
de móvil móvil móvil móvil
automóvil de tres de de 7 años de 7 años
es años tres años
vendidos
1960 6.7 - - - -
1961 5.5 19.1 6.4 - -
1962 6.9 20.0 6.7 - -
1963 7.6 22.3 7.4 52.4 7.5
1964 7.8 24.7 8.2 53.1 7.6
1965 9.3 25.7 8.6 56.4 8.1
1966 8.6 25.3 8.4 57.7 8.2
1967 7.4 24.8 8.3 56.6 8.1
1968 8.8 24.4 8.1 57.4 8.2
1969 8.2 23.5 7.8 56.9 8.1
442
Métodos Estadísticos Varela/Llanos/Asnate
Suavización exponencial
445
Métodos Estadísticos Varela/Llanos/Asnate
i WYi ( 1 W ) i 1 (21)
Donde:
2
W (22)
L1
O bien:
2
L 1 (23)
W
448
Métodos Estadísticos Varela/Llanos/Asnate
Y i 1 i (24)
449
Métodos Estadísticos Varela/Llanos/Asnate
Millones de W W
Año automóviles = =
vendidos .50 .25
1960 6.7 6.7 6.7
1961 5.5 6.1 6.4
1962 6.9 6.5 6.5
1963 7.6 7.0 6.8
1964 7.8 7.4 7.0
1965 9.3 8.4 7.6
1966 8.6 8.5 7.8
1967 7.4 8.0 7.7
1968 8.8 8.4 8.0
1969 8.2 8.3 8.4
1970 6.5 7.4 8.1
1971 8.6 8.0 7.8
1972 8.8 8.4 8.0
1973 9.7 9.0 8.3
1974 7.3 8.2 8.5
1975 6.7 7.4 8.5
1976 8.5 8.0 8.0
1977 9.2 8.6 8.3
1978 9.2 8.9 8.5
1979 8.4 8.6 8.5
1980 6.4 7.5 8.0
1981 6.2 6.8 7.6
1982 5.0 5.9 7.0
1983 6.7 6.3 6.9
1984 7.6 7.0 7.1
1985 8.0 7.5 7.3
1986 7.5 7.5 7.4
450
Métodos Estadísticos Varela/Llanos/Asnate
Y 1988 WY1987 ( 1 W ) Y 1987
452
Métodos Estadísticos Varela/Llanos/Asnate
454
Métodos Estadísticos Varela/Llanos/Asnate
2 Y2 61.5
Y
T2 Y2 Y1 61.5 55.4 6.1
Y
Ti .3( Ti 1 ) .7( i i 1 )
Y n j n j( Tn ) (26)
Donde:
Y n j Valor pronosticado j años en el futuro
n Nivel de las series suavizadas calculado en el periodo
n más reciente
Tn = valor del componente de tendencia calculado en el
periodo n más reciente
j = número de años en el futuro
456
Métodos Estadísticos Varela/Llanos/Asnate
pagos del impuesto sobre la renta federal para los años 1988
a 1991 se obtienen de la ecuación en la forma siguiente:
Y n j n j( Tn )
457
Métodos Estadísticos Varela/Llanos/Asnate
458
Métodos Estadísticos Varela/Llanos/Asnate
Y i 1Yi 1 i (27)
Donde:
460
Métodos Estadísticos Varela/Llanos/Asnate
462
Métodos Estadísticos Varela/Llanos/Asnate
463
Métodos Estadísticos Varela/Llanos/Asnate
p
Z (30)
p
Donde:
464
Métodos Estadísticos Varela/Llanos/Asnate
Y i 1 Yi 1 2 Yi 2 p Yi p (31)
Donde
Y i = El valor ajustado de la serie al tiempo i
Yi 2 = El valor observado de la serie al tiempo i 1
Yi 2 = El valor observado de la serie al tiempo i 2
Yi p = El valor observado de la serie al tiempo i p
, 1, 2 ,, p
, 1 , 2 ,, p
= Estimaciones de
regresión de los parámetros
Donde:
Y n j 1 Yn j 1 2 Yn j 2 p Yn j p
465
Métodos Estadísticos Varela/Llanos/Asnate
Y n 2 1 Yn 1 2 Yn 3 Yn 1
Y así sucesivamente.
Y i -11.04+1.154Y1-i, -.199Yi-2 + . 290Yi – 3
11.04, 1 1.154, 2 .199 , 3 .290
Y n j 11.04 1.154 Y n j 1 .199 Y n j 2 .290 Y n j 3
1988: 1año por Y 16 -11.04 + 1.154 (244.1) - .199
(217.8) + .290 (181.0)
anticipado = 279.8 millones de dólares
1989: 2añospor Y 17 - 11.04 + 1.154 (279.8) - .199
(244.1) + .290 (217.8)
anticipado = 326.4 millones de dólares
1990: 3 años por Y 18 -11.04+ 1.154 (326.4) - .199
(279.8) + .290 (244.1)
anticipado = 380.7 millones de dólares
1991: 4 años por = Y 19 -11.04+1.154 (380.7) - .199
(326.4) +.290 (279.8)
anticipado = 444.5 millones de dólares
468
Métodos Estadísticos Varela/Llanos/Asnate
469
Métodos Estadísticos Varela/Llanos/Asnate
Hº = 3 = 0
H1 = 3 0
De la ecuación se tiene:
3 .290
Z .65
S 3 .499
Para probarlo:
H º = 2 = 0
470
Métodos Estadísticos Varela/Llanos/Asnate
Contra:
H1 = 2 0
De la ecuación se tiene:
2 .022
Z .06
S 2 .400
Es más, S 1 , la desviación estándar del parámetro autor
regresivo de primer orden estimado, es 0.0494. Para
probarlo.
Para probarlo
H º = 1 = 0
Contra
H1 = 2 0
De la ecuación se tiene
471
Métodos Estadísticos Varela/Llanos/Asnate
1 1.173
Z 23.74
S1 .0494
Yn j 5.992 1.173 Y n j i
472
Métodos Estadísticos Varela/Llanos/Asnate
1988 1 año por Y16 5.992 1.173(244.1)
anticipado 280.3 millones de dólares
1989 2 año por Y17 5.992 1.173(280.3)
anticipado 322.8 millones de dólares
1990 3 año por Y18 5.992 1.173(322.8)
anticipado 372.7 millones de dólares
1991 4 año por Y19 5.992 1.173(372.1)
anticipado 431.2 millones de dólares
473
Métodos Estadísticos Varela/Llanos/Asnate
Yi = Ti . Si . Ci . Ii
474
Métodos Estadísticos Varela/Llanos/Asnate
476
Métodos Estadísticos Varela/Llanos/Asnate
n n
X i Yi
X iYi i 1 i 1
n
n 132.7
bi i 1
2
7.5829
n 17.5
Xi
i 1
n
X
i 1
2
i
n
Impuestos X i2
Año Xi XiYi
( $ Millones)
1982 0 31.3 0 0
1983 1 43.7 43.7 1
1984 2 62.0 124.0 4
1985 3 74.9 124.7 9
1986 4 74.7 298.8 16
1987 5 63.2 316.0 25
n=6 15 349.8 1.007.2 55
Y puesto que:
n n
Y i
349.8 X i
15
Y i 1
58.3 y X i 1
2.5
n 6 n 6
Entonces:
477
Métodos Estadísticos Varela/Llanos/Asnate
Yi 39.34 7.5829 X i
Donde el origen = 1982 y X unidades = 1 año
Para convertir este modelo de tendencia anual a una base
mensual primero se divide la intercepción entre 12 y la
pendiente entre 144. Lo que determina que
39.34 7.5829
Yi X i 3.2786 .05266 X i
12 14
Donde el origen = 30 de junio – 1ª de julio 1982 y X
unidades = 1mes
Yi 3.2786 .05266( X i .5)
3.2786 .05266( X i .0633)
478
Métodos Estadísticos Varela/Llanos/Asnate
Por lo que
Yi 3.3049 .05266 X i
Donde el origen = 15 julio 1982 y X unidades = 1mes
Para esta serie la nueva pendiente señala que (en una base
mensual) los valores monetarios de los contratos de
construcción residencial extendidos por esta compañía han
ido aumentando a una tasa de 0.05266 millones de dólares
(es decir, 52.66 miles de dólares) por mes. Esto se muestra
en la figura 20, donde la pendiente de la tendencia lineal
mensual ajustada presenta una ligera tendencia a aumentar
con el transcurso del tiempo. Por supuesto que esta ecuación
se puede usar para proyectar valores futuros dé tendencias
mensuales en los contratos de construcción residencial. Sin
embargo, puesto que los factores estaciónales influyen sobre
estas series de tiempo mensuales, no se harán pronóstico
futuros amenos de haber desarrollado un índice estacional,
que explique las fluctuaciones de un mes a otro: esto se
lograra en la sección siguiente:
479
Métodos Estadísticos Varela/Llanos/Asnate
480
Métodos Estadísticos Varela/Llanos/Asnate
de totales móviles
efecto estacional
2) Contratos de
móviles e meses
centrados de 12
promedio móvil
6) Razones al
dePromedios
1) Año y mes
construcción
móviles a 12
eliminado el
($ millones)
12 meses
residencial
estacional
3) Totales
4) Totales
7) Indice
8) Daros
móviles
meses
meses
5)
1982 Ene 1.6 - - - - .698 2.3
Feb 1.6 - - - - .765 2.1
Mar 2.3 - - - - 1.080 2.1
Ab 3.0 - - - - 1.114 2.7
May 3.1 - - - - 1.158 2.7
Jun 3.1 31.4 - - - 1. 172 2.6
Jul 3.1 32.0 63.4 2.64 1.174 1.116 2.8
Ago 2.8 32.9 64.9 2.70 1.037 1.121 2.5
Set 3.0 34.2 67.1 2.80 1.071 1.033 2.9
Oct 3.2 35.2 69.4 2.89 1.107 1.103 2.9
Nov 2.4 36.1 71.3 2.87 .808 .895 2.7
Dic 2.2 37.2 73.3 3.05 .721 .746 2.9
1983 Ene 2.2 38.2 75.4 3.14 .701 .698 3.2
Feb 2.5 39.5 77.7 3.24 .772 .765 3.3
Mar 3.6 40.3 79.8 3.32 1.084 1.080 3.3
Ab 4.0 410.2 81.5 3.40 1.176 1.114 3.6
May 4.0 42.5 83.7 3.49 1.146 1.158 3.5
Jun 4.2 43.5 86.0 3.58 1.173 1. 172 3.6
Jul 4.1 44.3 87.8 3.66 1.120 1.116 3.7
Ago 4.1 45.3 89.6 3.73 1.099 1.121 3.7
Set 3.8 47.0 92.3 3.85 .987 1.033 3.7
Oct 4.1 4/8.5 95.5 3.98 1.030 1.103 3.7
Nov 3.7 50.3 98.8 4.12 .898 .895 4.1
Dic 3.2 52.1 102.4 4.27 .749 .746 4.3
1984 Ene 3.0 53.7 105.8 4.41 .680 .698 4.3
Feb 3.5 55.8 109.5 4.56 .768 .765 4.6
Mar 5.3 57.6 113.4 4.72 1.123 1.080 4.9
481
Métodos Estadísticos Varela/Llanos/Asnate
Yi Ti .Si .Ci .I i
Si .I i
promedio móvil centrado Ti .Ci
(33)
484
Métodos Estadísticos Varela/Llanos/Asnate
Mes
1982 1983 1984 1985 1986 1987 Mediana e
Enero - .701 .680 .670 .713 .784 .701
Febrero - .772 .768 .661 .728 .837 .768
Marzo - 1.084 1.123 1.054 1.095 .904 1.084
Abril - 1.176 1.32 1.118 .955 .966 1.118
Mayo - 1.146 1.162 1.262 1.302 .879 1.152
Junio - 1.173 1.176 1.270 1.187 .977 1.173
Julio 1.174 1.120 1.098 1.086 1.144 - 1.120
Agosto 1.037 1.099 1.183 1.125 1.166 - 1.125
Setiembre 1.071 .987 1.057 1.020 1.037 - 1.037
Octubre 1.107 1.030 1.019 1.116 1.186 - 1.107
Noviembre .808 .898 .976 .946 .839 - .898
Diciembre .721 .749 .574 .774 .802 - .749
Totales 12.045
( 12,000 )( mediana )
Indice estacionl
12.045
485
Métodos Estadísticos Varela/Llanos/Asnate
486
Métodos Estadísticos Varela/Llanos/Asnate
mensual para el
3) Pronóstico
estacional
tendencia
año 1990
2) Indice
Mes
487
Métodos Estadísticos Varela/Llanos/Asnate
489
Métodos Estadísticos Varela/Llanos/Asnate
490
Métodos Estadísticos Varela/Llanos/Asnate
Yi Ti .Si .Ci .I i
TiCi .I i (34)
Si Si
Ti .C i .I i Ti .C i .I i
C i .I i (35)
Ti
Yi
491
Métodos Estadísticos Varela/Llanos/Asnate
492
Métodos Estadísticos Varela/Llanos/Asnate
Ci .I i
Ci (36)
Ii
493
Métodos Estadísticos Varela/Llanos/Asnate
494
Métodos Estadísticos Varela/Llanos/Asnate
196
196
196
197
197
197
197
197
197
197
7
8
9
0
1
2
3
4
5
6
Netas
Vent
20.0
22.8
24.3
18.8
28.3
30.4
35.8
31.6
35.7
47.2
as
Año
197
197
197
198
198
198
198
198
198
198
7
8
9
0
1
2
3
4
5
6
102.8
netas
Vent
55.0
63.2
66.3
57.7
62.8
60.8
74.6
83.9
96.4
as
495
Métodos Estadísticos Varela/Llanos/Asnate
Pagado
30.1
34.0
28.7
36.7
32.8
26.8
32.2
36.2
38.6
42.6
55.7
54.9
60.0
65.7
64.6
o
496
Métodos Estadísticos Varela/Llanos/Asnate
112.4
136.2
154.2
145.8
Cart.
31.3
33.2
37.9
42.4
45.4
51.2
59.8
69.5
72.5
78.7
85.4 a) Trace los datos en una gráfica
b) Ajuste una formula de tendencia cuadrática
a los datos y trace la curva en la gráfica.
c) Ajuste una formula de tendencia
exponencial a los datos y trace la curva en
la gráfica.
d) Para el modelo de tendencia exponencial
¿Cuál ha sido el crecimiento anual en el
importe de los créditos por ventas a plazos a
consumidores en cartera en este banco
durante los 15 años.
e) Para cada modelo ¿Cuáles son los
pronósticos de tendencias para los años
1989, 1990 y 1991?
5. Consulte el problema 1 - ventas netas anuales de
General Motors Corporation-
a) Realice un análisis residual.
498
Métodos Estadísticos Varela/Llanos/Asnate
500
Métodos Estadísticos Varela/Llanos/Asnate
Año
196
196
196
197
197
197
197
197
197
197
7
8
9
0
1
2
3
4
5
6
Utilid
acció
1.38
1.50
1.61
1.68
1.87
2.17
2.62
2.66
2.29
2.94
por
n
.
Año
197
197
197
198
198
198
198
198
198
198
7
8
9
0
1
2
3
4
5
6
acción
Utilid.
3.57
4.83
5.59
5.69
5.74
5.40
2.83
3.13
2.88
3.40
Por
501
Métodos Estadísticos Varela/Llanos/Asnate
Numero de empleados
502
Métodos Estadísticos Varela/Llanos/Asnate
504
Métodos Estadísticos Varela/Llanos/Asnate
GLOSARIO
Cuasivarianza: Característica de una muestra o población que
cuantifica su dispersión o variabilidad. La cuasivarianza se obtiene
multiplicando la varianza por
n / (n-1). La cuasivarianza muestral es un estimador centrado (no
sesgado) de la varianza poblacional.
Estimador Insesgado: Es un estimador cuyo promedio es el valor
del parámetro desconocido. Su valor esperado es el valor del
parámetro poblacional. Un estimador insesgado es uno que tiene la
propiedad de exactitud.
Insesgadez: Se denomina sesgo de un estimador a la diferencia
entre la esperanza (o valor esperado) del estimador y el verdadero
valor del parámetro a estimar. Es deseable que un estimador sea
insesgado o centrado, es decir, que su sesgo sea nulo por ser su
esperanza igual al parámetro que se desea estimar.
Intramuestra: Es la variación que se da dentro de cada muestra.
Estratal: Son las diferentes operaciones que se da entre estratos.
505
Métodos Estadísticos Varela/Llanos/Asnate
BIBLIOGRAFIA:
506