Problemas Estadística
Problemas Estadística
Problemas Estadística
En esta unidad, mi mayor tema de inters fue aprender a analizar las hiptesis
correspondientes de cada problema porque era necesario saber identificar cuando se
deba de aceptar o rechazar, debido a esto podran resultar ciertos errores que afectara
a las pruebas. Adems se relacionaba mucho con la unidad II porque se utilizaba las
distribuciones y considero que me ayudo ms para comprender.
Mi tema de inters en esta unidad considero que fueron todos porque al momento de
estudiarlos, se me hizo muy interesante aprender a resolver con ayuda de programas
como Excel ya que tambin ayudo a que las clases fueran ms dinmicas. Tambin me
agrado que mis compaeros expusieran temas porque aprend ms por los ejemplos
que mencionaban y as el profesor resolva las dudas que surgan, eso me ayud
mucho.
La ltima unidad me gust porque fue autodidacta, resolv problemas solo utilizando
libro o medios electrnicos. Por lo que considero que aprend mucho y tambin fue de
mucha ayuda conocer los diseos de experimentos porque en los prximos semestres
utilizaremos estos conceptos para investigaciones cientficas y me alegra que sea as
ya que siempre es saludable conocer un poco ms sobre los temas de una asignatura
para lograr un mayor aprendizaje.
UNIDAD I
Unidad I Estadstica descriptiva
Nm. de Lmite Limite Frecuencia Lmite Lmite Marca Frecuencia Frecuencia Frecuencia
clase inferior Superior real real de clase relativa % absoluta relativa
inferior superior (X) acumulada
f =72 100%
12
10
8
Frecuencia
6
0
0.5 8.5 16.5 24.5 32.5 40.5 48.5 56.5 72.5
Lmites
Figura 1.1 Grafica de consumo de agua en habitantes de la ciudad de La Paz por mes.
L . I . C .+ L. I . S .C . 9+ 24
= =16.5
LR= Clase 2
Fc 8
( 100 )= ( 100 )=11.11
FR % = f =N 72
80
70
60
50
Frecuencia acumulada 40
30
20
10
0
8 17 27 39 46 52 56 67 72
Lmite
120
100
80
40
20
0
0.5 8.5 16.5 24.5 32.5 40.5 48.5 56.5 64.5 72.5
Limites
x =media=
f =33.84
N
~
x=mediana ~
x=31
fx ( x) (x)2 f (x)2
Donde:
3627
~
x=24.5+
12 (
8 ~
x=30.5 )
1
^x =Lni+ ( 1 + 2)i 1 =1210 1=2 2=127 2=5
Medidas de dispersin
=Desviacin poblacional
S=Desviacin muestral
v=
(x)2 n 30
n
2 (x)2
v= =varianza poblacional
n
s=
(x)2 n< 30
n1
=
( x )2 x =
n
=20.08
Datos agrupados
KN
, K =1,2,3
1. la clase donde se encuentra 4 en la tabla de frecuencias acumuladas.
kn
Qk=Li+
4
( Fi1
fi )
k =1,2,3
Donde:
Decil
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
KN
, K =1,2, ,9
Buscamos la clase donde se encuentra 10 en la tabla de las
frecuencias acumuladas.
kn
Dk=Li+ (
10
F i1
fi )
a k=elnumero de decil a calcular .
Donde:
Li : Lmite inferior de la clase donde se encuentra el decil.
a : Amplitud de clase
Percentil
Es una medida estadstica que se usa mucha cuando se quiere clasificar o ubicar
caractersticas en las personas. Estas medidas son nmeros que dividen una sucesin
de datos ordenados en cien partes porcentualmente iguales.
kn
pk=Li + (f
100 ia
fi )
Donde:
pk= Percentil
n= Es el total de datos
f i = Frecuencia absoluta
Datos no agrupados
Cuartil y percentil
El procedimiento para determinar el valor de los cuartiles es el mismo que para los
percentiles y se muestra a continuacin:
kn
2. Calcular , donde n es el tamao de la muestra y k la medida de
100
kn
3. a) Si el resultado del clculo anterior ( 100 ) es un nmero entero entonces se
kn
b) Si el resultado del clculo anterior ( 100 ) no es un nmero entero, este se
Decil
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribucin en partes, de tal manera que cada una de ellas contiene el
mismo nmero de frecuencias. Los Deciles (Di) Son los valores de la variable que
dividen a la distribucin en las partes iguales, cada una de las cuales engloba el 10 %
de los datos. En total habr 9 deciles.
X1 , X2 , X3, X n
Si se tiene una serie de valores se localiza mediante las formulas
Coeficiente de variacin
s
CV = (100 ) CV = (100 )
x
Donde:
CV =Coeficiente de variacin
s =Desviacin estndar muestral
Para interpretar fcilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en
tanto por cien.
Mide la variacin de los datos respecto a la media, sin tener en cuenta las unidades en
la que estn.
sx
r= Siendo s x la desviacin tpica y x la media del conjunto de
|x|
X1 , X2 , X3, X n x 0
observaciones ( )y
Para datos no agrupados
Cuartil Decil
n 1
Q1=X +
4 2
5n 1
D 5=X +
2n 1 10 2
Q2=X +
4 2
8n 1
D 8= X +
3n 1 10 2
Q3=X +
4 2
X =mediana=31
50 n 1 90 n 1
P50=X + P90=X +
100 2 100 2 Q2 D5 P50= X
2n 1
Q2=X +
4 2
2(31) 1
Q2=2 + Q2=36.5
4 2
Para datos agrupados
3n
Q3=Li +(4
fa DQ
fQ 3
3
. a k=3 )
Q3=48.5+ ( 5452
4 )
.8 Q =52.5 3
3 n 3(72) 216
= = =54
4 4 4
8n
D8=LRi+ (
10
fa DD
fD
. a k =8
8
8
)
D8=56.5+ ( 57.656
11 )
.8 D =57.67 8
8 n 8 (72) 576
= = =57.6
10 10 10
90 n
P90=LRi+ (
100
fa R D
f 90
.i
90
)
P90=56.5+ ( 64.856
11 )
.8 P =62.9
8
90 n 90(72) 6480
= = =64.8
100 100 100
Coeficiente de variacin
20.08
=0.59
CV= = 33.83
3 (mediamoda)
Asimetra= Desviacin estndar
90 14 48 84 11 68 27 42 66 78 54 32 10 55 35 60 24 12 58 41 43 81 69 33 51 15 76 49
13 40 22 31 75 57 21 39 30 20 47 29 38 16 70 88 34 25 52 17 44 53 26 62 26 35 44 53
18 36 45 54 72 63 59 48 50 41 38 64 19 73 37 82 28 46 28 46 51 52 50 47 23
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 26 27 28 28 29 30 31 32 33 34 35
35 36 37 38 38 39 40 41 41 42 43 44 44 45 46 46 47 47 48 48 49 50 50 51 51 52 52 53
53 54 54 55 57 58 59 60 62 63 64 66 68 69 70 72 73 75 76 78 81 82 84 88 90
2. Construir tabla.
Nm. de Lmite Limite Frecuencia Lmite Lmite Marca Frecuencia Frecuencia Frecuencia
clase inferior Superior real real de clase relativa % absoluta relativa
inferior superior (X) acumulada
f =81 100%
Frecuencia 10
8
6
4
2
0
0 9.5 21.5 33.5 45.5 57.5 69.5 81.5
limtes
Figura 1.4 Grafica de consumo de alimentos chatarra en habitantes del estado de Baja
California Sur por mes.
L . I . C .+ L. I . S .C . 33+34
= =33.5
LR= Clase 2
Fc 12
( 100 )= ( 100 ) =14.81
FR % = f =N 81
90
80
70
60
50
Frecuencia acumulada 40
30
20
10
0
21 33 45 5 69 81 93
Lmite
120
100
80
60
Frecuencia relativa acumulada %
40
20
0
9.5 21.5 33.5 45.5 57.5 69.5 81.5 93.5
Limites
1
^
X =LRi+( )a
1+ 2
^ 1916
X =46+( )(12)
(1916 ) + ( 199 )
^
X =47.2
fx ( x) (x)2 f ( x)2
x =media=
f =44.83
N
UNIDAD II
Unidad II Variables aleatorias discretas y continuas
2
( z)
1 2
f ( z )= e
2
Ejemplo:
S= {A, A, S}
n( E1 ) x
p ( E )=
n (s)
p=
n p=1
Distribucin de probabilidad
x F(x)
0 1/8
1 3/8
2 3/8
3 1/8
Actividad:
f(x)
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4
f(x)
Cuando
24=16
Distribucin de probabilidad
X F(x)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/6
Actividad:
S={A,A,A,A-A,A,A,D-A,A,D,A-A,A,D,D-A,D,A,A-,A,D,A,D-A,D,D,A-A,D,D,D-D,A,A,A-
D,A,A,D-D,A,D,A-D,A,D,D-D,D,A,A-D,D,A,D-D,D,D,A-D,D,D,D
Distribucin de probabilidad
X F(x)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/6
0 p( x) 1
()= x 1 p ( xc )
i=1
( x )=( 0 ) ( 161 )+ ( 1 ) ( 16
4
)+( 2) ( 166 )+( 3 ) ( 164 )+( 4 ) ( 161 )=2
X =2
= ( x )2 p ( x)
i=1
=(02)2 ( 161 )+ ( 12) ( 164 )+( 22) ( 166 )+ ( 32) ( 164 )+ ( 42) ( 161 )=1
2 2 2
2
=varianza
2=
2= 1
=1
1 f ( x ) 0
2
f ( x ) =1
x
AOS P(X)
3 0.03
4 0.05
5 0.07
6 0.10
7 0.14
8 0.20
9 0.18
10 0.12
11 0.07
12 0.03
13 0.01
1
0.25
0.2
0.15
0.1
0.05
0
-1.56 3 4 5 6 7 8 9 10 11 12 13 17.36
Actividad:
n=90,000
=800
=300
X ( X ) Z
800 800-800 0
1100800 500800
Z= =1 Z= =1
300 300
a P( x >1400)
b p(x <1400)
500 1100
AT =0.5+0.4772
AT=0.9772
T= 0.9772 (90000)
T= 87948
c) p(x >650)
AT=0.5 0.1915
AT=0.3085
T=0.3085 (90000)
T=27765
Actividad: Utilice la tabla de z para calcular el rea bajo la curva normal entre los
valores z dados.
Z 0.00 a
1.6 0.4452
Z=0 Z=1.6
b
Z 0.00
0.9 0.3159
Z=-0.9 Z=0
c
Z 0.00
-1.3 0.4452
1.8 0.4641
0.8673
Z=-1.3 Z=1.8
d
Z 0.00
0.6 0.2257
1
0.8673
Z=0.6 Z=1.2
e
Z 0.00
-1.55 0.2257
1.74 0.4591
0.8955
Z= -1.55 Z=1.74
Actividad: una variable x tiene una distribucin normal, con una media poblacional
igual a 10 y una desviacin estndar igual a 2. Encuentre las probabilidades siguientes.
13.510
=1.75
2
A ( 1.75 )=0.4599
8.210
=0.9
2
A (0.9)= 0.3159
AT= 0.5 0.3159
AT= 0.1841=18.41%
A (0.3)= 0.1179
AT= 0.5 + 0.1179
AT=0.2358=23.58%
Z0
Actividad: Determine el valor de tal que
0.90
p ( z 0 < z < z 0 )= =0.45
2
z 0=1.64
z 0=1.64
z 0=1.96
z 0=1.96
Conel aument 2.25 en cada lado, resulta ser 0.025
z 0=2.57
p ( z< z 0 ) =0.3594
4
z 0=0.50.3594
z 0= 0.1406
!=Factorial
0 !=1
nCr=n C x =5 C 2
nPn=nPx
Distribucin binomial
p ( x , n , p )=nCx P x q nx
p ( x , n , p )=nCr Pr qnr
n! r nr
p ( x , n , p )= ps
r|(nr )|!
p ( x , n , p )=nCr Pr qnr .
( media )=nP
( desviacin )= npq
2 ( varianza ) =npq
Actividad: S se sabe que en cada 10 artculos se tiene un xito financiero y una mini
empresa ha decidido producir 10 artculos.
x 1
p= = =0.1 probabilidad de exito
n 10
q=1 p
q=10.1
q=0.90
a Cul es la probabilidad de que exactamente un artculo tenga xito financiero?
p ( x , n , p )=nCr Pr qnr
101
p (1,10,0.10 )=10 C1 (0.10)(0.90)
P(3) 0.0573
P(4) 0.0116
P(5) 1.488x10-3
P(6) 1.37781x10-4
P(7) 8.748x10-6
P(8) 3.645x10-7
P(9) 9x10-9
P(10) 1x10-10
0.2636
10
p (1,10,0.10 )=10 C0 (0.10)(0.90)
Probabilidad de complemento.
P( E)c =10.7320
P( E)c =0.2674=26.74
X P(x)
0 0.3474
1 0.3839
2 0.1937
3 0.0573
4 0.01116
5 1.488x10-3
6 1.37781x10-4
7 8.748x10-6
8 3.645x10-7
9 9x10-9
10 1x10-10
p(x)
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7 8 9 10
p(x)
Condiciones: =np
P(x > z)
2720 26.520
z= z=
4.427 4.427
z=1.58 z=1.4682
Ay =0.50.4429=0.0571 Ay =7.1
0.0571 X 100=5.71
Actividad: una fbrica informa que el 40% de sus cuentas por cobrar a otras empresas
comerciales estn sobre vencidas. Pero un ingeniero toma una muestra aleatoria de 8
de esas cuentas.
1.67%
27.86%
68.44%
a) x=0
b) x=3
c) 3, 4, 5,6, 7, 8
p ( x , n , p )=nCr Pr qnr
X p
0 0.0167
3 0.2786
4 0.2322
5 0.1238
6 0.0412
7 0.007
8 0.0006
0.6844
Actividad: se inspeccionan los granes lotes de productos que llegan a una planta
manufacturera a fin de encontrar artculos defectuosos, mediante un plan de muestreo.
Se selecciona una muestra aleatoria de n artculos de cada uno de los siguientes lotes y
se inspeccionaron la muestra, anotando el numero x de defectuosos. S x es menor que
o igual algn nmero de aceptacin a especifcalo, se aceptara el lote. S x es mayor
que a, se rechaza el citado lote.
Supngase que un fabricante utiliza un plan de muestreo con n=10 y a=1. Si el lote
contiene exactamente 5% de artculos defectuosos.
91.38%
x Aceptan 0.1
x> Rechazan 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
12.33%
Distribucin de Poisson
Las nicas suposiciones que se requieren para poder utilizar la distribucin de Poisson
como modelo para los experimentos descritos anteriormente son que los eventos
ocurran de forma aleatoria e independiente uno de otro.
x e
p ( x )=
x!
x e
p ( x )=
x!
==np Poisson
= npq =
2=npq 2=
Actividad: si un banco recibe en promedio igual a 6 cheques falsos al da, Cules son
las probabilidades de que sirva?
2.231 x 104
b Menos de 6 computadoras
11
3.22 x 1 0
Distribucin hipergeomtrica
N Nmero de elementos de la
poblacin
T K C X N K NT C nx ( T K X )( nk N T )
p ( x )=
N Cn Nn
Media nK
=
N
Varianza K ( nK ) n(N n)
2
n (N 1)
Desviacin estndar
k ( N K ) n( Nn)
N 2 ( N 1)
N=20
T=2
2 C 2 18 C1
n=3 P ( 2 )= =0.015
20 C 3
x=2
N-K= 20-2= 18
N-X= 3-2= 1
N=24
n=3
1 C6 23 C 2
T=6 P (1 ) = =0.45
24 C 3
X=1
N-K=23
n- k= 2
N=20
5C 5 20 C 5
n=10 P (5 ) = =0.016
20 C 10
T=5
X=5
N-K=5
n-K=5
P(x)}= 8, 9 ,10
p ( x , n , p )=nCr Pr qnr
=7.5
=2.29
p ( 9,25,0.3 )= 0.1336
p (10,25,0.3 )=0.0916
Sumatoria= 0.3902
x 10.57.5
Z= = =1.31
2.9
A=0.4049
39.02%
2835
2605
s
s X=
n
X =
n
= parametro
X =Media
x
t=
s
s X =
n
n=8 n<30
=3000 <3000
X =2858.75 2859
x X 2
s=
s=146.76
38593000
t=
147
8
0.975 p( x ) 0.99 Por lo tanto si existe evidencia.
1.356
b =0.01 n=25
2.485
c =5 n=16
1.746
n=50 das
=871 TON/ da
S=21 TON/ da
=880 TON /da
=0.05
x 871880
z= = =3.30
s 21
=
n 50
n=4
9.4 x 10.97510
t= = =1.59
12 s 1.2175
s=
.2 n 4
10.
7
11.
6
=0.10
>10
X =10.975
S= 1.2175
0.90< p<0.80
2
( n1)s
X 2=
2
Gl=k-1
K=17
=0.05 X 2=27.5871 27.59
Actividad: Un gerente de control de calidad de una compaa estaba convencido de
que una balanza para pesar materia primaria, variaba segn una distribucin estndar
poblacional igual a 2. A fin de probar el equipo se pes una carga de 107 Lb, y se
registraron las mediciones de 104.1, 105.4, 108.4, 109.2, 112.4. No corresponde estos
datos a la afirmacin del gerente? Utilice un nivel de significancia es igual a 0.10.
=2
2
=4
104.1
105.2
108.4
109.2
112.4
S=3.31
S2=10.97
Gl=k-1
Gl=5-1= 4
2
X
=0.05 } =9.49
2
( n1)s 2 ( 51 ) 10.97
X 2= = =10.97
2 4
=21.4
n=25
2
=15
2 >15
Gl=k-1
Gl=25-1= 24
2
( n1)s ( 24 ) 21.4
=0.01 X 2=42.98 X 2= = =34.24
2 15
n=22
Gl=22-1= 21
=0.05 X 2 =32.6706
2
( n1)s ( 21 ) 14.14
X 2= = =11.8776
2 25
Distribucin de Fisher
Gl=v1=n1 -1
Gl=v2=n2-1
Ejemplo:
Gl=v1=n1 -1
V1=15-1
V1=14
Gl=v2=n2-1 F =2.329
V2=18-1
V2=17
=0.05
S12=7.14
n1= 10
S22=3.21
n2=8
Gl= =n1-1
Gl= =10-1
Gl= 9
2
s 1 7.14
Gl= =n2-1 Fc= 2
= =2.22
s 2 3.21
Gl= =8-1
Gl= 7 F /2=3.677
f (1)
Es esta evidencia suficiente para indicar que la varianza 1 es mayor que la varianza 2.
Realice la prueba con =0.05 .
S12=18.3
n1= 13
S22=7.9
n2=13
Gl=
Gl1= 12
Gl2= 12 =2.687
s 12 18.3
Fc= 2 = =2.31
s2 7.9
V2/v1 0.10 Fc 12
12 2.14 2.31 2.687
Proporcionan los datos informacin suficiente para indicar una diferencia en la variacin
de los contenidos de impureza para los embarques de dos proveedores. Realice la
prueba con un nivel de significancia de 0.10. Qu recomendaras al fabricante de
productos farmacuticos basndose en los resultados?
S12=0.273
n1= 10
S22=0.094
n2=10
Gl1= 9
Gl2= 9 =3.179
s 12 0.273
Fc= 2
= =2.904
s 2 0.094
Teorema de Chevyshev
Teorema: sea x una variable aleatoria o media y desviacin estndar. Entonces para
cualquier nmero positivo k la probabilidad de que un valor de y se encuentre en el
1 1
1 2 p ( k x +k ) 1 2
intervalo [ k , + k ] es al menos k es decir; k
Actividad: supongamos que x es una variable aleatoria con una media poblacional
=100 y =5 . Encuentre la conclusin que se puede derivar de la desigualdad de
K=2
3
p ( 90 x 110 )
4
K=3
8
p ( 85 x 115 )
9
Estime la probabilidad que x se encuentre entre 100-20=80 y 100+20=120
1
p ( 80 x 120 ) 1 2
k
p ( 80 x 120 ) 0.93
2 Selecciona otro nmero entero que ser el nmero de individuos entre los sujetos, por
ejemplo, (5).
Hiptesis:
Proposicin que establece relaciones, entre los hechos; y para otras es una posible
solucin al problema.
1.-Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2.-Interpretar correctamente los datos del enunciado diferenciando los parmetros de
los estadsticos. As mismo se debe determinar en este punto informacin implcita
como el tipo de muestreo y si la poblacin es finita o infinita.
3.-Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere
evaluar el universo de donde proviene la muestra. En este punto se determina el tipo de
ensayo (unilateral o bilateral).
4.-Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico,
el cual se obtiene dependiendo del valor de (Error tipo I o nivel de significancia) o en
funcin del estadstico lmite de la distribucin muestra. Cada una de las hiptesis
deber ser argumentada correctamente para tomar la decisin, la cual estar en funcin
de la hiptesis nula o Ho.
5.-Calcular el estadstico real, y situarlo para tomar la decisin.
6.-Justificar la toma de decisin y concluir.
Hiptesis nula:
La hiptesis nula consiste en una afirmacin acerca de la poblacin de origen de la
muestra. Usualmente, es ms simple (menor nmero de parmetros, por ejemplo) que
su antagonista. Se designa a la hiptesis nula con el smbolo H0.
Hiptesis alternativa:
Prueba de un extremo
Prueba de dos extremos
Pruebas bilaterales
Una prueba de hiptesis de dos extremos es aquella en la cual la hiptesis nula afirma
que las variables son iguales o no a algo, tal como una estimacin de porcentaje. En
este tipo de prueba hay tres regiones a considerar: dos regiones de rechazo y una
regin de aceptacin. En una prueba de dos extremos, podrs determinar si debes o no
rechazar la hiptesis nula con base a la evidencia de cualquier extremo. En este tipo de
prueba, la regin de aceptacin es menor (lo que significa que es ms difcil de
demostrar) a causa de los dos extremos o variables, dentro de la prueba.
Pruebas unilaterales:
Una prueba de un extremo es aquella que mide la distribucin normal estndar, basada
en la hiptesis o supuesto de que los parmetros que se miden sern mayores o
menores que una estadstica en particular. En este tipo de prueba, las variables que se
estn probando se dividen en dos regiones: una regin de rechazo y una regin de
aceptacin. Aqu es donde la mayor o menor a los conceptos entra en juego, ya que
dicta dnde la muestra se divide en regiones. La prueba se determina por la mayor o
menor que el valor que se indica en la hiptesis, y se rechaza la hiptesis si los datos
en la regin de rechazo resultan ser ciertos.
Regin de aceptacin:
Es la regin complementaria de la anterior .Si el valor evaluado del estadstico
pertenece a ella No rechazamos la hiptesis.(Las hiptesis nunca se aceptan de forma
definitiva, slo se aceptan provisionalmente, es decir ,no se rechazan, a la espera de
una nueva informacin que eventualmente pueda llevarnos a rechazarla en el futuro).
La designaremos por R0. Evidentemente los conjuntos de puntos que forman ambas
regiones son disjuntos.
Regin de rechazo:
Los valores del estadstico de contraste que nos conducen a rechazar la hiptesis H0
forman la Regin Critica o Regin de Rechazo del contraste.
Errores de tipo 1:
Errores de tipo 2:
Frmulas
Estimador insesgado: = x
Estimador sesgado: x
Estimador insesgado: x =S x
Tamao de muestra para proporciones:
z2 pq
2
n=
E2
Estimacin puntual: =n
Actividad:
a) n=100 =9
b) n=50 2=12
poblacional para:
0.9
E=1.96 =0.1769
a) 100
3.46
E=1.96 =0.96
b) 50
0.01
E=1.96 =0.00196
c) 100
0.94
E=2.58 =0.2234
d) 120
1.84 1.84
13.11.96 < <13.1+ 1.96
e) 36 36
12.49+13.70
L. C 12.49< <13.70 =13.09 13.10
2
0.1047 0.1047
2.731.96 < <2.73+1.96
64 64
2.6 2.6
22.11.65 < < 22.1+ 1.65
f) 45 45
L. C 21.46< <22.73
4
>147+2.33
g) 30
>148.70
DATOS
96.11
85.20
91.41
92.63
88.88
93.62
93.38
89.67
93.48
89.81
96.21
93.42
92.73
89.82
86.23
n = 15 =0.02
gl = n-1 x =91.50
gl = 15-1 s=3.22
gl = 14
0.02
= =0.01=t 2 =2.6295 Intervalo de confianza para
2
(n1)s 2 (n1)s2
<<
x2 x 2 (1 )
2 2
x 2 =29.1413
2
H 0 : 0
H1 : 0
Prueba unilateral, una cola, un extremo
H 0 : 0
H1 : 0
H 0 : 0
H1 : 0
Z c > Z y Z c <Z
Dos extremos: 2 2
Proporciona los datos evidencia para indicar que la media poblacional es mayor que
2.3? Haga la prueba con =0.05
e) Suponga que se quiere demostrar que los datos muestrales apoyan la hiptesis de
que la media poblacional es menor que 2.9. Enuncie la hiptesis nula y la alternativa de
la prueba. Sera esta prueba de uno o dos extremidades de cola?
f) Suponga que desea detectar un valor de que la media poblacional difiere de 2.9.
Enuncie la hiptesis nula y alternativa para la prueba. Indica la hiptesis alternativa
una prueba de una o de dos colas?
H A : >2.3
a)
H 0 : 2.3
b)
c)
0.5 0.45
zc = 2.04
Z =1.65
x 2.42.3
Z= = =2.04
s 0.29
d) x = n 35
disminuy.
H 0 : P=0.08
H A : P<0.08
H 0 : =2.9
e) Si existe suficiente evidencia de que la media
H A : <2.9 poblacional es menor
0.45 0.5
Z =1.65
-
2.42.9
Z= =10.2
0.29 Cay en la regin de rechazo, la hipotesis es verdadera.
35
2.9
0.4750 0.4750
Z =1.96
2
H 0 : =2.9
A : 2.9
s s
x z < < x + z
g) 2 n 2 n
0.29 0.29
2.41.96 < <2.4 +1.96
35 35
2.30< <2.49
Actividad 3: Para evaluar dos frmacos contra cierta enfermedad se integran dos
grupos formados por dos muestras aleatorias n 1=n2=100 c/u. A cada grupo se observa
que de la primera muestra se tomaron 65 y de la segunda 75 que se recuperaron con el
frmaco en grupos correspondientes.
Para ver si estas diferencias son significativa aborde el frmaco 2, probar la hiptesis
para la diferencia de proporciones y obtenga el intervalo de confianza al 99% para estas
diferencias de la proporciones de cada una de la poblaciones o tratamientos.
Datos:
n1=100 x1=65 *Si no dan un nivel de significancia es 95%
n2=100 x2=75 *Es una prueba de dos extremos
x1
p1= =0.65
n1
0.95
x
p2= 2 =0.7
n2
Z 2 =1.96 Z 2 =1.96
x 1+ x 2
= =0.7
n1+ n2
=0.05 Z 2 =1.96
Si no nos dan el valor D0=0 y si nos las dan dice que habr una pequea diferencia.
( p 1 p2 )D 0
zc=
H 0 : p1 p 2=D0
p1 q1
n1
p q
+ 2 2
n2
H A : p1 p2 D0
Datos
x1
p1= =0.1 1) H 0=P0 =0.1 es de un extremo
n1
H A =P> 0.1
2)
x2 26
p2= = = =0.13 3) q = 1 p q = 1 0.1 q = 0.9
n2 200
0.130.1
z= =1.41
4)
(0.1)(0.9)
200
z c > z o bien1.41>1.65
n = 200 5) Regin de decisin
=0.05
0.130.12.33
( 0.1 ) ( 0.9 )
200
< <0.130.1+ 2.33
( 0.1 ) ( 0.9 )
200
0.0194< <0.079
Datos
=30
n=40
x =3.2
S= 0.3
=0.90 =0.1
s s
x Z < < x +Z
a) 2 n 2 n
0.3 0.3
3.2 1.65 < <3.2+1.65
40 40
s 0.3
b) Z + n =1.65 40 =0.078
2
c) =95
( n1 ) s 2
2
< < x 21
x 2
2
6
0.78=1.96 = =0.25
90
H 0 : =3.0 =0.05
d)
3.23.0
Z= = =4.21
s 0.3
n 40
z c > z o bien4.21>1.61 se rechaza H A
Regin de rechazo
Mtodos no paramtricos
Estadstica paramtrica
Las mquinas de las pruebas de hiptesis, analizadas hasta ahora han hecho
referencia respecto a los parmetros de la poblacin como la x y la porcin. Estas
Estadstica no paramtrica
Por fortuna, recientemente los estadsticos han desarrollado tcnicas tiles que no
hacen suposiciones restrictivas respecto a la forma de las poblaciones. Estas se
conocen como pruebas sin distribucin o, ms comnmente pruebas no paramtrica se
refiere a algo distinto del valor de un parmetro de formacin.
Prueba de signos
Actividad 1: Use la prueba de signo para ver si hay diferencia entre el nmero de das
requeridos para pagar una cuenta de un nmero de artculos antes y despus.
Use un nivel de significancia de 0.05
Antes 33 36 41 32 39 47 34 29 32 3 40 42 33 36 29
4
Despus 35 29 38 34 37 47 36 32 30 3 41 38 37 35 20
4
Signo - + + - + 0 - - + 0 - + - + +
7
= =0.53
13
6
Q= =0.46
13
Error estndar
p =
( 0.5 )( 0.5 )
13
=0.13
ph 0 + z
2 pq
n
L. C . I =0.51.96
( 0.5 ) ( 0.5 )
13
=0.228
L. C . S=0.5+1.96
( 0.5 ) ( 0.5 )
13
=0.77
Se acepta H0
No hubo cambio en el nivel de significancia de 0.5
Ante 2 3 3 1 3 2 2 3 3 4 4 2 3 2 4 2 2 3 3 2 2 2 4 4 3
s 9 4 2 9 1 2 8 1 2 4 1 3 9 5 2 0 5 3 4 6 1 2 5 3 1
Desp 3 1 2 2 2 2 2 3 1 2 2 2 4 3 2 2 2 3 1 2 3 3 3 2 2
us 2 9 2 1 0 4 5 1 8 2 4 6 1 4 7 6 5 1 9 2 2 1 0 9 0
Sign - + + - + - + 0 + + + - - - + - 0 + + - - - + + +
os
13
= =0.56
23
10
Q= =0.43
23
ph 0 + z
2 pq
n
0.5+2.06
( 0.5 )( 0.5 )
23
=2.66
Las pruebas de suma de rango son una familia completa de pruebas. Solo nos
concentraremos en dos miembros de esta familia, la prueba de U-mann Whitney y la
prueba de Kruskal Wallis.
n1 +n 2
Media de la estadstica =
2
L.C.I y L.C.S
Actividad 1: En la tabla siguiente se muestra el nmero de artculos de dos determinadas
empresas, pruebe la hiptesis de no diferencia entre cada uno de los artculos y de las
empresas, utilizando la prueba de U-Whitney use un nivel de significancia de 1%
Empresa A Empresa B
31 44
25 30
38 34
33 47
42 35
40 32
44 35
26 47
43 48
35 34.7
Datos
n1= 10
n2= 10
R1= 93.5
R2= 116.5
n
( 1+1)
R 1=61.5
2
=n1 +n2 +
n1 +n2
= =50
2
H=
n1 n2 ( n1+ n2 +1 )
12
=13.228
89 78 80
90 93 88
92 81 86
81 87 85
76 89 79
88 71 80
85 90 84
85 96 85
87 82 90
86 85 92
100
12 R 2j
k=
n ( n+ 1 )
n 3 ( n+ 1 )
j
Distribucin de hiptesis
n2 = 10
R1=214
R2= 149.5
n=2.6361 se acepta H0
R3= 132.5
n = n1+n2+n3
=0.005
2
n =31
gl = nl
gl = k-1
gl = 3-1
gl = 2
2 n1 +n2
Media estadstica = = +1
2
n
2
n 1 n2 ( 1+ n21 )
Error estndar de la estadstica 2 n1 n2 (2 n1 n2n1 n2)
= =
A, B, A, A, A, B, B, A, B, B, A, A, B, A, B, A, A, B, B, B, A, B, B, A, A, A, B, A, B, A, A, B, B,
A, B, B, A, A, A, B, B, A, A, B, A, A, A
2n 1+n2
= +1=24.83 =3.40
2
0.9 Se aceptan H0
1
n1
Correlacin de rangos:
Esta es una medida de la correlacin que existe entre los dos conjuntos de rango, una
medida del grado de asociacin entre las variables no podremos calcular de otra
manera.
Formulacin de hiptesis
H0: Ps = 0 No existe la correlacin con relacin a los datos
1
=
Error estndar n1
PH 0 z
Lmite de la regin de aceptacin 2
Edad gerente 32 43 42 29 52 62 45 39 40 35
55 2 7 6 1 9 10 8 4 5 3
Nmero de quejas 5 2 4 4 3 2 4 5 4 6
6 (277 )
s=1 =0.6787
10 ( 102 1 )
Prueba de Kolmogrov-Smirnov
K-S
0 0 0 0 0.0002 0.0002
22 3 3754 1 1 0
9 0.2582
1.63 1.63
= =0.026 <0.2582, As que se rechaza H 0
Dn = n 3754
El siguiente paso es comprobar el valor calculado de Dn, con el valor crtico de Dn que
se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia elegido es
mayor que el valor calculado de Dn entonces aceptaremos la hiptesis nula.
a) K - S
b) Podemos concluir que estos datos en efecto provienen de una distribucin
normal? Use el nivel de significancia de 0.10
K Clase Frecuencia Frecuencia Fo FE Desviaci
observada acumulativa n
observada absoluta
1.22
Dn= 1200 = 0.0352 se rechaza
UNIDAD IV
Si hay varios puntos de datos que caen sobre una recta y se desea hacer una
prediccin de dnde caer otro punto (x, y), se puede hallar la ecuacin de la recta y
evaluarla para hallar y para un valor de x dado, o viceversa.
La mayora de los puntos para un conjunto de datos de la vida real no caen sobre una
sola recta, no importa cun lineal se vean. El error de medida y otros factores de la
realidad pueden entrar en juego. As que para hacer predicciones, se necesita hallar
una recta que se acerque lo ms posible a los puntos de datos. Esta clase de recta se
llama una recta de ajuste para los datos. El hallar estas rectas de ajuste le da a su
estudiante un contexto para practicar el hallar pendientes y ecuaciones, y tiene
aplicaciones tiles en ciencia y en negocios.
xx 1 y y 1
y=a+bx y y 1=b ( xx 1 ) =
x 2x 1 y 2 y 1
Una razn principal para estudiar las ecuaciones de rectas es para aprender a hacer
predicciones.
Anlisis de regresin
encontrar una recta que describa de la mejor manera cada uno de estos pares
observados.
186 85
186 83
189 85
190 86
190 85
192 90
193 87
193 91
194 90
194 92
198 93
201 103
203 100
203 102
205 101
Un primer paso en el anlisis de regresin que implica dos variables es construir una
120
100
80
Peso (kg) 60
40
20
0
185 190 195 200 205 210
Estatura (cm)
Regresin lineal
y= 0 + 1 x
una relacin lineal . La regresin lineal simple es el caso ms sencillo ya
que slo se maneja una variable independiente, por lo que slo se cuenta con dos
parmetros.
y= 0 + 1 x yi xi
Si la recta de regresin es , cada valor observado para un
xi
puede considerarse como el valor esperado de Y dado ms un error. Por lo tanto,
Y = 0 + 1 x i + i
i
Donde la variable se conoce como trmino de error aleatorio o desviacin aleatoria
en el modelo.
i
Los se suponen errores aleatorios con distribucin normal, media cero y varianza
2 ; 0 1
y son constantes desconocidas (parmetros del modelo de
regresin).
Mtodos de estimacin rectas
Este mtodo de ajuste consiste en seleccionar dos puntos del diagrama de dispersin y
trazar una lnea recta que pase por dichos puntos. El par de puntos sobre los cuales se
traza la recta es elegido de acuerdo al criterio propio del investigador o la persona que
realiza tal anlisis. La ecuacin de la recta puede ser determinada por medio de la
forma punto punto.
xx 1 y y 1
=
x 2x 1 y 2 y 1
Mtodo de semi-promedios
Para este mtodo de ajuste de rectas, la frmula que se utiliza es la siguiente:
Donde:
Observacin x y x2 xy y2
1 186 85 34596 15810 7225
2 186 83 34596 15438 6889
3 189 85 35721 16065 7225
4 190 86 36100 16340 7396
5 190 85 36100 16150 7225
6 192 90 36864 17280 8100
7 193 87 37249 16791 7569
8 193 91 37249 17563 8281
9 194 90 37636 17460 8100
10 194 92 37636 17848 8464
11 198 93 39204 18414 8649
12 201 103 40401 20703 10609
13 203 100 41209 20300 10000
14 203 102 41209 20706 10404
15 205 101 42025 20705 10201
Suma 2917 1373 567795 267573 126337
Promedio 194.4666 91.5333
267573
xy = ( 194.466 ) ( 91.533 )=38.1436
15
567795 2
x =
2 (194.466 ) =35.9748
15
38.1436
y91.533= (x 194.466)
35.9748
y91.533=1.0603 ( x194.466 )
y=1.0603 x114.6593
0 1
Consiste en determinar aquellos estimadores de y que minimizan la
i b0 b1
suma de cuadrados de los errores ; es decir, los estimadores y de
0 1
y , respectivamente, deben ser tales que:
i2
i=1
y i= 0 + 1 x + i
Del modelo lineal simple:
i = y i 0 1 x
De donde:
Elevando al cuadrado:
y
2
( i 0 1 x )
n n
i2=
i=1 i=1
0 1
Segn el mtodo de mnimos cuadrados, los estimadores de y deben
y
2
( i 0 1 x ) =0
n
0
i=1
y
2
( i 0 1 x ) =0
n
1
i=1
n n
y i=n 0 + 1 xi
i=1 i=1
n n n
o x i + 1 x i = x i y i
2
i =1 i=1 i=1
yi
n n
( x i)
i=1 i=1
n
xi
n
i=1
2
n
x i y i
i=1
b 1=
=b o +b1 x
Observacin x y x
2
xy y
2
=b o +b1 x
(1373)(2917)
267573
15
b1= =1.0644
(2917)2
567795
15
=115.5633 +1.0644 x
120
100
f(x) = 1.06x - 115.47
80
Peso (kg) 60
40
20
0
185 190 195 200 205 210
Estatura (cm)
2
Estimacin de y
y n n
respecto al valor ajustado ( se conoce como residuo.
La estimacin de 2 es:
SCE ( y i i)
2
2=s 2= =
n2 n2
SCE = ( y i i)2= [ y i( b 0+ b1 x i ) ]2
Coeficiente de correlacin
medida descriptiva que sirve para evaluar la bondad de ajuste del modelo a los datos,
ya que mide la capacidad predictiva del modelo ajustado.
Todos los puntos de la primera grfica (a) quedan exactamente en una lnea recta. En
En la segunda grfica (b), los puntos no quedan exactamente en una lnea, pero su
a la lnea de cuadrados mnimos son pequeas. Es razonable concluir en este caso que
una gran parte de la variacin de y observada puede ser atribuida a la relacin lineal
aproximada entre las variables postuladas por el modelo de regresin lineal simple.
Cuando la grfica de puntos es como la tercera grfica (c), existe una variacin
sustancial y significativa en torno a la lnea de mnimos cuadrados con respecto a la
y relacionando y con x .
La suma de cuadrados del error SCE puede ser interpretada como una medida de
cunta variacin de y permanece sin ser explicada por el modelo, es decir, cunta
STC= ( y i )2
2
Definidos estos dos trminos, el coeficiente de correlacin (o de determinacin) r
x (MDE) y (resistencia)
29.8 5.9
33.2 7.2
33.7 7.3
35.3 6.3
35.5 8.1
36.1 6.8 42.8 8.2
36.2 7
42.8 8.7
36.3 7.6
43.5 7.8
37.5 6.8
45.6 9.7
37.7 6.5
46 7.4
38.7 7
38.8 6.3 46.9 7.7
39.6 7.9 48 9.7
41 9 49.3 7.8
51.7 7.7
62.6 11.6
69.8 11.3
a) A partir de los datos obtenga una grfica 79.5 11.8
de puntos. 80 10.7
2
e) Estime la y la para esta prueba.
x 2 2
Observacin y (resistencia) x xy y
(MDE)
14
12
10
8
Resistencia (MPa)
6
0
20 30 40 50 60 70 80 90
MDE (GPa)
=b o +b1 x
(219.8)(1217.9)
10406.5
27
b1= =0.107482 0.1075
(1217.9)2
59512.81
27
b0 =8.140740.107482 ( 45.1074 ) =3.2925
=3.2925+0.1075 x
=3.2925+0.1075 ( 40 )=7.5925
2
Inciso e) Estimar la y la para la prueba.
2=
( y i i )2 = 18.7356 =0.7494 = 2= 0.7494=0.8656
n2 25
2
r =1
SCE
=1
( y i i )
2
=1
18.7356
=0.7383=73.83
2
STC ( y i ) 71.6052
El programa Microsoft Office Excel tiene la opcin de trazar esta lnea de tendencia
cuya ecuacin y valor del coeficiente de correlacin los arroja de manera automtica.
=3.2925+0.1075 x
r 2=0.7383=73.83
14
12
f(x) = 0.11x + 3.29
10 R = 0.74
8
Resistencia (MPa)
6
0
20 30 40 50 60 70 80 90
MDE (GPa)
tambin se puede usar sola para medir el grado de asociacin entre dos variables, por
lo que utilizaremos dos medidas que describen la correlacin que son:
1) El coeficiente de determinacin.
2) El coeficiente de correlacin
2
El coeficiente de determinacin ( r ) es la principal forma en que podemos medir el
grado o fuerza de asociacin que existe entre dos variables x , y . Debido a que
usamos una muestra de puntos para desarrollar rectas de regresin, nos referimos a
esta medida como el coeficiente de determinacin.
Variacin de los valores y alrededor de la recta de regresin:
y y c 2
y y 2
Coeficiente de determinacin:
y y c 2
y y 2
r 2=1
a y +b xy n y 2
r 2=
y 2n y 2
Coeficiente de correlacin
r= r 2
En que se utiliza?
Ejemplo:
La principal ventaja de la regresin mltiple es que nos permite utilizar ms informacin
disponible para estimar la variable dependiente.
Pasos:
Problema
X1
Entonces, seguiremos usando X, pero agregaremos un subndice (por ejemplo, ,
X2
) para diferenciar cada una de las variables independientes.
En regresin simple
En regresin mltiple
Donde:
a =ordenada Y
X1 X2
y = valores de las dos variables independientes
b1 b2 X1 X2
y = pendientes asociadas con y , respectivamente.
Visualizacin de la regresin mltiple
Podemos visualizar la ecuacin de estimacin simple como una recta en una grfica; de
manera similar, podemos representar una ecuacin de regresin mltiple de dos
variables como un plano. Se trata de una forma o figura tridimensional, con profundidad,
largo y ancho.
El problema consiste en decidir cul de los planos que podemos dibujar ser el que
mejor se ajuste. Para hacer esto, de nuevo utilizaremos el criterio de mnimos
cuadrados y localizaremos el plano que minimice la suma de los cuadrados de los
errores, es decir, de las distancias de los puntos alrededor del plano a los puntos
correspondientes sobre el plano.
Ecuaciones
Se sustituye valores
Se resuelve la ecuacin
Sustituyendo en Y^ =a+b1 X 1 +b2 X 2
Y^ =13.828+0.564 X 1+1.099 X 2
Ejemplo
Y^ =a+b1 X 1 +b2 X 2
Es decir, encuentre los estimadores de mnimo cuadrados que mejor describan estas
tres variables.
Ejercicio
Y C =a+b1 x1 +b 2 x 2+ b3 x3
4.0688
2
Cul es el valor del coeficiente de determinacin ( r ) y coeficiente de
correlacin?
0.9834
Cul es el valor pronosticado para Y cuando X1=5.8,X2,X3=5.1?
UNIDAD V
Unidad V Diseo de experimentos
El diseo estadstico de experimentos es precisamente la forma ms eficaz de hacer
pruebas. El diseo de experimentos consiste en determinar cules pruebas se deben
realizar y de qu manera, para obtener datos que, al ser analizados estadsticamente,
proporcionen evidencias objetivas que permitan responder las interrogantes planteadas,
y de esa manera clarificar los aspectos inciertos de un proceso, resolver un problema o
lograr mejoras. Algunos problemas tpicos que pueden resolverse con el diseo y el
anlisis de experimentos son los siguientes:
Comparar a dos o ms materiales con el fin de elegir al que mejor cumple los
requerimientos.
Determinar los factores (las x vitales) de un proceso que tienen impacto sobre
una o ms caractersticas del producto final.
Para que un estudio experimental sea exitoso es necesario realizar, por etapas,
diferentes actividades. A continuacin se describen de manera breve las etapas del
diseo de experimentos con objeto de dar una visin global delo que implica su correcta
aplicacin.
Planeacin
2. Elegir la(s) variable(s) de respuesta que ser medida en cada punto del diseo y
verificar que se mide de manera confiable.
No se trata de que el experimentador tenga que saber a priori cules factores influyen,
puesto que precisamente para eso es el experimento, pero s de que utilice toda la
informacin disponible para incluir aquellos que se considera que tienen un mayor
efecto.
4. Seleccionar los niveles de cada factor, as como el diseo experimental
adecuado a los factores que se tienen y al objetivo del experimento.
Este paso tambin implica determinar cuntas repeticiones se harn para cada
tratamiento, tomando en cuenta el tiempo, el costo y la precisin deseada.
6. Realizar el experimento.
Seguir al pie de la letra el plan previsto en la etapa anterior, y en caso de algn
imprevisto, determinar a qu persona se le reportara y lo que se hara.
Anlisis
En esta etapa no se debe perder de vista que los resultados experimentales son
observaciones muestrales, no poblacionales. Por ello, se debe recurrir a mtodos
estadsticos inferenciales para ver si las diferencias o efectos muestrales
(experimentales) son lo suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso). La tcnica estadstica central en el anlisis de los
experimentos es el llamado anlisis de varianza ANOVA (acrnimo en ingls).
Interpretacin
Con el respaldo del anlisis estadstico formal, se debe analizar con detalle lo que ha
pasado en el experimento, desde contrastar las conjeturas iniciales con los resultados
del experimento, hasta observar los nuevos aprendizajes que sobre el pro-ceso se
lograron, verificar supuestos y elegir el tratamiento ganador, siempre con apoyo de las
pruebas estadsticas.
Diseos factoriales:
Mtodos de Optimizacin.
Experimentos con un factor
H O : 1=2==k =
H 1 : i j para alguni j
Con la cual se quiere decidir si los tratamientos son iguales estadsticamente en cuanto
a sus medias, contra la alternativa de que al menos dos de ellos son diferentes.
HO
En caso de aceptar , se concluye que los tratamientos son iguales en cuanto a la
HO
media de cierta variable de salida de inters. En caso de rechazar se acepta
H1
como verdadera la hiptesis alternativa , que indica que al menos dos de los
H O : 1=2==k =
H 1 : i j para alguni j
que se prueba con la tcnica estadstica llamada Anlisis de Varianza (ANOVA) con
uno, dos, tres o cuatro criterios de clasificacin, dependiendo del nmero de factores de
bloques incorporados al diseo.
bloqueo
Y i : + i + i
DCA 0 Un criterio
Y i : + i + i+ ij
DBCA 1 Dos criterios
Donde:
Y = Es la variable de salida
en cada diseo, incorpora un trmino adicional por cada factor de bloqueo controlado.
De acuerdo con los modelos dados en la tabla, para cada diseo comparativo se tienen
al menos dos fuentes de variabilidad: los tratamientos o niveles del factor de inters y el
error aleatorio.
Se agrega una nueva fuente de variabilidad por cada factor de bloque que se controla
directamente. Se observa que los diseos suponen que no hay efectos de interaccin
entre los factores, lo cual sera lo deseable que ocurra; de no ocurrir as, tal efecto se
recarga al error y el problema de comparacin no se resuelve con xito.
Un efecto de interaccin entre dos factores hace referencia a que el efecto de cada
factor depende del nivel en que se encuentra el otro.
Se supone que las k poblaciones son independientes y que estn distribuidas en forma
H O : 1=2==k
Y ij : + i+ ij
Donde:
Y = Es la variable de salida
STC=SCT + SCE
La identidad anterior expresa cmo las variaciones entre los tratamientos y dentro de
los tratamientos contribuyen a la suma total de cuadrados. Sin embargo, se puede
obtener mucha informacin si se investiga el valor esperado tanto de SCT como de
SCE.
Ejercicios
Los totales para las cuatro muestras son, respectivamente, 3.21, 2.72, 2.76 y 3.00; el
gran total es 11.69 y los clculos requeridos para obtener las sumas de cuadrados
necesarias son los siguientes:
11.69
2
C=
2 2 2 2
(3.21) +(2.72) +(2.76) +(3.00)
SS(Tr)= 2.8470=0.0130
12
Total 47 0.0809
F0.05
Como el valor obtenido para F excede de 2.82, el valor de con 3 y 44 grados de
nc 7 7 7 21
x 2 / N SSE= X 2 [T 2C /nC ]
2
SST = (T C / nc )
284 2
SSE=39903845.71=144.29
SST =3845.71
Tabla ANOVA
Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio
Total
F(MSTR / MSE) =0.309
Interpretacin
F(2/ 18)=0.35546
, es el valor crtico de la distribucin F.
Intra-grupos
21
Total
1460.958
Total 1460.958 23
1) Calculo los grados de libertad, en el total son n-1 y n=24, por lo tanto son 23. Los
grupos a comparar son 3 por lo tanto los grados de libertad son 2, verifico que (2+21)
son los 23 del total.
4) Con la suma de cuadrado Intra y los grados de libertad calculo la media cuadrtica
Intra =813.374/21=38.732.
Hiptesis:
H 0=1= 2=3
i
Para i = 1,2,, a, j = 1,2,, b y k= 1,2,, r. Aqu es la gran media, es el
ijk
repeticin. Se supondr que son variables aleatorias independientes que tienen
Las hiptesis tambin se pueden plantear con los efectos descritos en el modelo:
Estas hiptesis se prueban mediante la tcnica de anlisis de varianza, que para un
como,
SC
El factor ( n1 ) en los grados de libertad de la suma de cuadrados del error ( ),
seala que se necesitan al menos dos rplicas del experimento para calcular este
componente y, por ende, para construir una tabla de ANOVA. Recordemos que las
sumas de cuadrados divididas entre sus correspondientes grados de libertad se llaman
C M
cuadrados medios2 ( CM ). Al dividir stos entre el cuadrado medio del error ( )
FV SC GL CM F0 Valor- p
Efecto B S CB b1 C MB C M B /C M E P( F> F B0 )
C ME
Error S CE ab(n1) C ME
Total S CT abn1
Y al final, al restar stas del total, se obtiene la suma de cuadrados del error como:
Ejercicios
1. Un ingeniero est diseando una batera que se usar en un dispositivo que se
someter a variaciones de temeraturas extremas. El nico parametro del diseo
que puede seleccionar en este punto es el material de la placa o anodo del a
bateria, y tiene tres elecciones posibles. Cuando el dispositivo est fabricado y
se envi al campo, el ingeniero no tendr control sobre las temperaturas
extremas en las que operar el dispositivo, pero sabe por experiencia que la
temperatura probablemente afectara la vida efectiva de la bateria. En este
problema, construya una tabla de anlisis de varianza para la vida de la batera.
3799 2
=77,646.97
36
60 2
74 2+ +
155 2 +
130 2 +
3799
2
1
a
y2
SS Material = y i
2
1300 + ( 1501 2 ]
2
bn i=1 abn
998 2+
1
(3)(4)
b
1 y2
SS Temperatura=
an j=1
2
yj
abn
3799 2
1291 2+ ( 770 2 ]
1738 2 +
1
(3)( 4)
a b
1 y2
SS Interracin= y ij
2
SS Material SS Temperatura
n i=1 j=1 abn
539
342
3799
2
2
229 ++ ( 2 ]
1
4
Total 77,646.97 35
F0.05,4 .27=2.73
Puesto que , se concluye que hay una interaccin significativa entre los
Solucin
1j
2j
3j
Tabla ANOVA
Fuente de Suma de Grados de Cuadrado
variacin cuadrados libertad medio F0 Valor P
Tipo de Impulsor
Sistema de B1 B2 B3 B4
Misiles
A1 34 30.1 29.8 29
1.- H '0 no existe diferencia en las tasas medias de consumo del propulsor cuando
2.- H '0' no existe diferencia en las tasas medias de consumo de los cuatro tipos de
propulsor
3.- H '0' ' no existe interaccin entre los diferentes sistemas de misiles y los diferentes
tipos de propulsor
Solucin
'
1. a) H 0 : 1= 2= 3=0
b) H 0' : 1= 2= 3=0
''
c) H 0 :( )11 =( )12==( )34 =0
'
i' s
2. a) H 1 : al menos una de las no es igual a cero.
''
i' s
b) H 2 : al menos una de las no es igual a cero.
'' '
c) H 3 : al menos una de las ( )ij ' s no es igual a cero.
3. =0.05
As pues
2
710.2
2
SST =(34.0) +(32.7)2+ + ( 29.1 )
2
21704.6821016.00=91.68
2
228.8
710.2 2
237.4 2 +
2
244 +
SSA=
21056.0821016.00=40.08
57.9 2
2
65.2 + +
66.7 2+
SS ( AB ) =
21056.08+ 21016.00=22.17
SSE=91.6814.5240.0822.17=14.91
6. Decisin:
'
a) Rechazar H 0 y concluir que diferentes sistemas de misiles dan como resultado
b) Rechazar H 0' y concluir que no hay que las medias de los promedios de ignicin
de los impulsores no son las mismas para los cuatro tipos de impulsores.
''
c) Aceptar H 0 y concluir que no hay interaccion entre los diferentes sistemas de
Total 91.68 23
ij ik jk
principales y , y son los efectos de la interaccin de 2 factores
El trmino se denomina efecto de interaccin de 3 factores, y representa la no
ij
aditividad de las sobre los diferentes niveles del factor C. Igual que antes, la
suma de todos los efectos principales es igual a 0, y la suma sobre cualesquiera de los
subndices de los efectos de la interaccin entre 2 y 3 factores es igual a 0. En muchas
situaciones experimentales estas interacciones de orden superior son insignificantes y
sus cuadrados medios slo reflejan variacin aleatoria; pero se debe describir el
anlisis en su forma ms general.
Nuevamente, para realizar pruebas vlidas de significancia debe suponerse que los
errores son valores de variables aleatorias independientes y con distribucin normal,
La filosofa general respecto al anlisis es la misma que la que se estudi para los
experimentos de 1 y 2 factores. La suma de cuadrados se divide en 8 trminos, donde
cada uno representa una fuente de variacin de los que se obtienen estimados
2
independientes de cuando todos los efectos principales y de la interaccin son
Los clculos en una tabla de anlisis de varianza para un problema de 3 factores con n
rplicas de corridas para cada combinacin de factores:
1 2 3
C
Total
15 Minutos
B C Total
A
1 32.8 31.0 34.8 1 98.6
2
2 34.7 31.6 31.4 97.7
3 42.2 35.1 1
33.6 109. 101.
110.9 211.3
2 7 6 192.
Total 109.7 97.7 99.8 307.8
3 97.7 94.5 2
99.8 103. 202.
1 9
C
Total
20
1 2 3
Minuto
s
A
1 34.5 31. 34.9 101.
2 32.0 9 32.5 3
3 35.1 30. 35.7 94.5 B
0 103.
32. 9 A
Total
6
1 2 3
Total 101. 94. 103. 299.
6 5 1 2
1 67.3 61.9 69.7 199.9
2 66.7 61.6 63.9 192.2
3 77.3 67.7 69.3 214.3
1 2
6872.846809.65=63.19
214.3 2
606.4 2
192.2 2+
2
199.9 +
SSA=
6823.63680965=13.98
2
202.9
606.4 2
192.2 2+
211.3 2 +
SSB=
6819.836809.65=10.18
2
299.2
606.4 2
307.2 2+
SSC=
6810.836809.65=1.18
2
69.3
2
66.7 ++
67.3 2+
SS ( AB )=
4.78
103.4 2
2
97.7 ++
98.6 2 +
SS ( AC ) =
2.92
103.1 2
97.7 2 ++
109.7 2+
SS ( BC )=
3.64
35.7 2
2
34.7 ++
32.8 2+
SS ( ABC )=
SSE=63.1913.9810.181.184.782.923.644.89=21.62
Efectos principales
A 13.98 2 6.99 11.65
B 10.18 2 5.09 8.48
C 1.18 1 1.18 1.97
Interaccin de dos
factores
AB 4.78 4 1.20 2.00
AC 2.92 2 1.46 2.43
BC 3.64 2 1.82 3.03
Interaccin de tres
factores
ABC 4.89 4 1.22 2.03
Total 63.19 53
Ninguna de las interacciones muestra un efecto significativo al nivel =0.05 . Los
efectos del operador y del catalizador son significativos en tanto que el tiempo de
lavado no tiene un efecto significativo sobre el comportamiento para el rango utilizado.
ijk
sentidos se encierran en crculo en esta tabla.
< 0.01 ), como sucede con la profundidad de corte ( 0.05< <0.10 ). Existe cierta
evidencia de una ligera interaccin entre estos factores, ya que la prueba de F para la
interaccin AB es exactamente menor que el 10% del valor crtico.
Tasa de
alimentacin (A) 45.5625 1 45.5625 18.69
Profundidad de 1
corte (B) 10.5625 10.5625 4.33
Interaccin de tres
factores
ABC 5.0625 1 5.0625 2.08
Total 92.9375 15
3. Supondremos que se toma una observacin por cada combinacin de factores, por
tanto hay un total n= abc observaciones.
El E.M.V de de es = y...
Los E.M.V. de los efectos principales son: i = i.. ... ; j = .j. ... ; k =
..k ...
Los E.M.V. de las interacciones de segundo orden son: ( ij) = yij. i.. .j. +
... ( ) ik = yi.k i.. ...k + ... ; jk = y.jk .j. ...k + ...
Descomposicin de la variabilidad
Se estn investigando los efectos sobre la resistencia del papel que producen la
concentracin de fibra para madera (factor A), la presin del tanque (factor B) y el
tiempo de coccin e la pulga (factor C). Se seleccionan dos niveles de la concentracin
de madera (T1, T2), tres niveles de la presin (1, 2, 3) y los dos niveles de tiempo
(t1, t2). Pueden considerarse todos los factores fijos. Analizar los resultados y obtener
las conclusiones apropiadas.
1 2
1 2 3 1 2 3
2 y 211=26 y 221 =28 y 231 =30 y 212 =30 y 222 =34 y 232 =32
Vamos a calcular los totales marginales y las sumas de cuadrados:
AXB 1 2 3 A
AXC 1 2
1 y 11=32 y 12=27
2 y 21BX
=84C 1
y 22=96 2
2 y 21=48 y 22=57
3 y ,31=32 y ,22=30
La tabla anova resultante es:
TOTAL 1752.9 11
Realizando los contrastes al nivel de significacin del 5%, se concluye que son
significativos los efectos de los factores A (F0,05,1,2 = 18,51), B y A B (F0,05,2,2 =
19).
Comparacin de las medias de los tratamientos
H 0=1= 2==K = H 1 : i j ,
Cuando se rechaza y se acepta para algn
H 0 : i j H 1 : i j para toda i j
H0
Mtodo LSD (diferencia mnima significativa). Una vez que se rechaz en el
ANOVA, el problema es probar la igualdad de todos los posibles pares de medias con la
hiptesis. Para k tratamientos se tienen en total k(k-1)/2 pares medias. Se rechaza
H 0 : i j
si ocurre |Y iY J|> LSD , donde
LSD=t
2
,N k
1 1
. CME( + )
ni n j
ni=n j
balanceado, es decir, si la diferencia mnima significativa se reduce a
LSD=t
2
,N k 2
. CME( )
n
Q ,m , n m
de rango estudentizado, que representamos con , donde son los grados
de libertad del numerador n los grados de libertad del denominador, el cual
representamos con . Se rechaza
H 0 : i j
, si ocurre |Y iY J|>Tukey , donde
ni=n j =n
Cuando el diseo est balanceado, es decir, si
1
n
CME . Si alguna o todas las muestras tienen tamaos diferentes se reemplazan
ni ,
con n por la media armnica de las al calcular el error estndar de los promedios.
ni ,
La media armnica de las est dada por
Se rechaza
H 0 : i= j ,
si ocurre |Y iY J|> Dunnet
Ejercicios
1. Se realiz un experimento para comparar cinco marcas diferentes de filtros de
aceite para automviles con respecto a su capacidad de atrapar materia extraa.
i
Sea la cantidad promedio verdadera de material atrapado por filtros marca
tabla siguiente es una tabla ANOVA que resume la primera parte del anlisis.
Tabla ANOVA
F0.05,4 .40=2.61, H 0
Como es rechazada a un nivel de 0.05. Ahora utilice el
i
procedimiento de Tukey para buscar diferencias significativas entre laas . En
ordenar las cinco medias muestrales en orden creciente, y se subraya cada par que
difiera en menos de 0.4:
As pues las marcas 1 y 4 no son significativamente diferentes una de otra, pero s son
ms altas de manera significativa que las otras tres marcas en sus contenidos promedio
verdaderos. La marca 2 es significativamente mejor que la 3 y 5 pero peor que la 1 y 4 y
las marcas 3 y 5 no difieren en modo significativo.
Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error
de 141.6, los grados de libertad del error son 48 8 =40
Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan para = 0.05,
2 p 8 y 40 grados de libertad. El siguiente paso es ordenar las medias en orden
creciente para establecer los "rangos".
D8
El rango entre las medias mxima y mnima se compara con , esto es,
D7
El prximo paso es comparar subconjuntos de siete medias con el rango .
4 5
, entonces
3 1
, entonces
D7
Como los dos exceden el rango se subdividen estos dos subconjuntos en
4 5
, entonces
3 8
, entonces
2 1
, entonces
D6
Nuevamente stos exceden , entonces stos se subdividen en subconjuntos de
cinco medias:
4 =1
entonces
3 5
, entonces
2 8
, entonces
6=1
, entonces
Como las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261 que
fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan
con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan
con D4; por lo tanto,
2=5
,entonces,
Los resultados se muestran grficamente en la siguiente figura, donde las medias que
estn debajo de una lnea no son significativamente diferentes.
El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3
son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor
que las 8 y 7 y las dems grasas no son significativamente diferentes en relacin con la
cantidad absorbida.
factor y n=5 rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para
ilustrar cmo puede aleatorizarse el orden de lad corridas, suponga que las corridas se
numeran de la siguiente manera:
Buscar en la distribucin t
Calcular la diferencia minima significativa
Figura 5.5.2. Dos posbiles arreglos para tres fertilizantes, A,B y C, con la restriccin que cada
fertilizante debe aparecer una vez en cada nivel de agua (bloque). La distribucin de niveles de
agua es siempre la misma para cda fertilizante.
En el diseo de dos factores cada tratamiento aparece con la misma frecuencia en cada
bloque. Por consiguiente, el efecto del factor bloqueado no contribuye a la
incertidumbre en la estimacin de los efectos principales del factor de tratamiento.
Como consecuencia de que cada tratamiento debe salir con la misma frecuencia en
cada bloque, la nica aleatorizacin en la asignacin de tratamientos para unidades
experimentales esel orden en el que salen los tratamientos en cada bloque. ste no es
un diseo completamente aleatorio; es uno en el que los tratamientos estn
aleatorizados dentro de los bloques. Debido a que cada combinacin posible de
tratamientos y bloques es incluida en el experimento, el diseo est completo . Por esta
razn el diseo se llama diseo de bloques completamente aleatorios.
Estos ltimos se pueden construir con varios factores de tratamiento y varios factores
de bloques. Se restringir este anlisis al caso donde hay un factor de tratamiento y un
factor bloqueado. Los datos de un diseo de bloques completamente aleatorios se
analizan con un ANOVA de dos sentidos, del mismo modo que seran los datos de
cualquier diseo balanceado de dos factores, completo. Sin embargo, hay una
consideracin importante. Los nicos efectos de inters son los efectos principales del
factor de tratamiento. Para interpretar estos efectos principales, no debe haber alguna
interaccin entre el tratamiento y los factores bloqueados.
Ecuacin modelo
para el diseo de
bloque aleatorizado
Y ij i j;
Donde es la medicin que corresponde al tratamiento y al bloque es la
i i j
media global poblacional; es el efecto debido al tratamiento y es el
j, ij
efecto debido al bloque al y es el error aleaotorio atribuible a la medicin
Y ij
. Se supone que los errores se distribuyen de manra normal con media cero y
Ejercicio
El P-valor para el factor fertilizante es 0.001, por lo que se concluye que el fertilizante
tiene un efecto sobre la cosecha. Se hace el supuesto de que no hay interaccin entre
el fertilizante y el factor bloqueado (parcela), por lo que se pueden interpretar los
efectos principales de fertilizante. Debido a que hay solamente una observacin para
cada combinacin de tratamiento-bloque (es decir, K=1). La suma de los cuadrados del
error (SSE) notificada en el resultado de MINITAB es realmente SSAB, la suma de
cuadrados de la interaccin, y la media cuadrtica del error (MSE) es en realidad
MSAB.
La tabla ANOVA muestra que en este experimento bloquear era necesario para detectar
el efecto fertilizante. Con este propsito, el experimento es un experimento de un solo
factor. La suma de los cuadrados delerror (SSE) sera entonces la suma SSE para el
diseo bloqueado ms la suma de cuadrados por bloques, o 651.778 + 7046.9=
77698.7. Los grados de libertad del error seran iguales a la suma de los grados de
libertad del error en el diseo bloqueado ms los grados de libertad por bloques, o 2 + 4
= 6. El error medioi cuadrtico (MSE) sera entonces 77 698.7/6 =12 950 en lugar de
162.9444, y el estadistico F para el efecto fertilizante sera entonces al menos 1, lo que
dara como resultado una falla para detectar un efecto.
1. Hipotesis nula:
Hipotesis alternativa: las no son todas iguales a cero; las no son todas
iguales a cero.
2. Nivel de significancia: =0.01
a=4, b=3,T 1=139, T 2=145, T 3=153,T 4 =128,T .1=182, T .2=176, T .3=207, T =565
y
FTr = F0.01
Dado que 11.6 supera 9.78, el valor de con 3 y 6 grados de libertad, se
F BI = F0.01
que 21.2 supera 10.92, el valor de con 2 y 6 grados de libertad, se
concluye que las diferencias entre los resultados obtenidos para los 3 motores son
significativos. Existe un efecto debido a los motores, de modo que la formacin de
bloques fue importante.
Diseos factoriales
Para aumentar el crecimiento de una planta o para aumentar el rendimiento de una
fruta o verdura, existen muchos factores que influyen directamente en el resultado,
como puede ser el tipo de riego, el nivel de fertilizacin, densidad de siembra,
actividades culturales, la aplicacin de hormonas, etc. Igual sucede con los animales, si
se desea el aumento de peso, se puede lograr modificando algunos factores, como es
las dietas, las hormonas, el manejo y otros. Cada uno de los factores puede tener
varios niveles, por ejemplo, la fertilizacin puede ser 0.01, 0.05 o 0.1 kg por planta;
igualmente el riego puede ser una lmina de 1, 2 o 3 cm. Los diseos factoriales
consisten en un anlisis de varianza donde se van a probar dos o ms factores donde
cada uno va a tener dos o ms niveles. A cada factor se le llamar factor A, B, C...etc, y
los niveles de cada factor sern 0,1,2,3...
k
El diseo 2 son muy tiles en las primeras etapas del trabajo
a , b y ab n
En esta tabla, representan totales de los valores de la
2
respuesta en los diseos individuales La simplicidad de 2 se define por
Ejercicio
1. Considrese una investigacin llevada a cabo para estudiar el efecto que tiene
la concentracin de un reactivo y la presencia de un catalizador sobre el tiempo
de reaccin de un proceso qumico. Sea la concentracin del reactivo el factor A
con dos niveles de inters, 15% y 20%. El catalizador constituye el factor B; el
nivel alto o superior denota el uso de dos sacos de catalizador y el nivel bajo o
inferior denota el uso de un solo saco. El experimento se realiza (replica o
repite) tres veces, y los datos son como sigue:
Combinacin de Replica
bajo (1 saco) -
(1) = 80(28+25+27) a = 100(36+32+32)
- +
bajo (15%) alto (20%)
Concentracion de reactivo A
Fig. 3
As
a representa la combinacin de tratamientos, en la que A se encuentra en el
nivel superior y B en el nivel inferior;
Por convencin (1) se usa para representar a ambos factores en el nivel inferior.
El efecto promedio de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel de ese factor, promediado sobre los niveles
del otro factor.
Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab tambin se usan
para representar los totales de las n rplicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que
el nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se
obtiene:
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el
nivel superior de A y el efecto de B en el nivel inferior de A.
Las frmulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
inferior ( ), o
B-
a + - - - - + + 27.2 24 51.2
b - + - - + - + 15.9 14.5 30.4
ab + + - + - - - 41 43.9 84.9
EFEC(B)= CONTRASTE(B)/(n2K-1)=60.3/(22)*2=60.3/8=7.5375
EFEC(C)= CONTRASTE(C)/(n2K-1)=-25.9/(22)*2=-25.9/8=-3.2375
EFEC(AB)=CONTRASTE(AB)/(n2K-1)=69.7/(22)*2=69.7/8=8.7125
EFEC(AC)= CONTRASTE(AC)/(n2K-1)=-4.1/(22)*2=-4.1/8=-0.5125
EFEC(BC)= CONTRASTE(BC)/(n2K-1)=6.3/(22)*2=6.3/8=0.7875
EFEC(ABC)=CONTRASTE(ABC)/(n2K-1)=-11.1/(22)*2=-11.1/8=-1.387
------------------------------------------------------------------
Average = 23.8312
A: rapidez = 16.6375
B: configuracin = 7.5375
C: ngulo = -3.2375
AB = 8.7125
AC = -0.5125
BC = 0.7875
ABC = -1.3875
SS =10,796.69-9086.85=1709.84
TOTAL
SS(A)=(CONTRASTE(A))2/(2K)n=(133.1)2/8*2=1107.22
SS(B)=(CONTRASTE(B))2/(2K)n=(60.3)2/8*2=227.25
SS(C)=(CONTRASTE(C))2/(2K)n= (-25.9)2/8*2=41.92
SS(AB)=(CONTRASTE(AB))2/(2K)n= (69.7)2/8*2=303.63
SS(AC)=(CONTRASTE(AC))2/(2K)n= (-4.1)2/8*2=1.05
SS(BC)=(CONTRASTE(BC))2/(2K)n= (6.3)2/8*2=2.48
SSERROR =1709.84-1107.22-227.25-41.92-303.63-1.05-2.48-7.70=18.565
Total 1709.83 15
Son Significativos los efectos de la rapidez de corte (A), la configuracin (B), el ngulo
de corte(C), y la interaccin de la rapidez y la configuracin(AB), con una confianza
estadstica del 95%.
3. Se trata de estudiar la influencia de los factores:
F1.4,0 .05=7.71
a menudo se puede usar un experimento factorial fraccionario donde quizs sea posible
llevar a cabo la mitad, un cuarto o incluso un octavo del plan factorial total.
Fraccin un medio del diseo 2k
Considrese el caso en el que se estudian tres factores de dos niveles cada uno, pero
en el que los experimentadores no pueden costear las 2 3 = 8 combinaciones de
tratamientos, sin embargo, si se puede costear 4 observaciones. Esto sugiere una
fraccin un medio, de un diseo 23. la fraccin un medio del diseo 2 3 se conoce
tambin como un diseo 23-1 por que tiene 23-1 = 4 combinaciones de tratamiento.
Notacin 1 Notacin 2
a + - -
b - + -
c - - +
abc + + +
I = ABC
Ntese que cualquier efecto de interaccin puede usarse para generar la columna del k-
simo factor. Sin embargo, si no se utiliza el efecto ABC... (k- 1) no se produce el diseo
de mayor o ms alta resolucin.
Otra manera de interpretar la construccin de una fraccin un medio del diseo consiste
en , ( asignar los ensayos a dos bloques, confundiendo la interaccin de mayor orden
ABC ...K. Cada bloque de 2k -1
ensayos es un diseo factorial fraccionario 2 k- 1
de
mxima resolucin.
Corrida Factorial 22
Completa , I = ABC , I = -ABC
(diseo bsico)
A B A B C=AB A B C=-AB
1 - - - - + - - -
2 + - + - - + - +
3 - + - + - - + +
4 + + + + + + + -
Tabla 4.2 Las dos fracciones un medio del diseo
Ejercicio
1. Suponga que se desea emplear una media rplica para estudiar los efectos de
cinco factores, cada uno en dos niveles, sobre alguna respuesta, y que se
conoce que cualquiera que sea el efecto de cada factor, ser constante para
cada nivel de los dems factores. En otras palabras, no hay interacciones. Sea el
contraste de defi nicin ABCDE lo que ocasiona que los efectos principales
tengan alias con interacciones de cuatro factores. El agrupamiento de contrastes
que incluyen interacciones proporciona 15 - 5 = 10 grados de libertad para el
error. Realice un anlisis de varianza con los datos de la tabla siguiente y pruebe
todos los efectos principales a un nivel de significancia de 0.05.
Las sumas de cuadrados y los efectos para los efectos principales son
Tabla ANOVA
de diseo.
Previo a revisar los mtodos, es importante saber si el ptimo que buscamos existe y
que no habr ms de uno. Una funcin que efectivamente tiene un slo ptimo recibe
un nombre especial:
Cuando tanto la funcin objetivo como las restricciones son lineales, hablamos de un
problema de "Optimizacin Convexa Lineal" o "Programacin Lineal". En el caso de
trabajar con variables discretas (es decir, que solo puedan tomar valores enteros) nos
enfrentamos a un problema de Optimizacin Combinatoria. Por raro que pueda
parecer, en general un problema de optimizacin combinatoria es ms complicado de
resolver que uno de optimizacin continua. En el medio tenemos los problemas de
Optimizacin Mixta es los cuales algunas variables son continuas y otras son
discretas. En la prctica, estos problemas se resuelven en forma ms parecida a los
problemas combinatorios que a los continuos. Un caso particular de optimizacin
combinatoria es la Optimizacin Binaria, aquella en la cual todas sus variables estn
restringidas a tomar uno de dos valores (en general, 0 y 1). Este caso es bastante raro
de encontrar en la prctica, siendo ms habitual encontrar problemas combinatorios con
algunas variables binarias (optimizacin mixta). Otra clasificacin la podemos hacer en
base a la naturaleza probabilstica del problema. Cuando podemos considerar que
todas las variables son determinsticas, estamos ante un problema determinista, en
caso contrario nos enfrentamos a un problema estocstico. El modelado y resolucin de
un problema estocstico es mucho ms complejo que el modelado de un problema
determinstico.
Dentro de estos mtodos tenemos tcnicas para abarcar una gran variedad de
problemas. Desde tcnicas exactas, como la Programacin Lineal (que se limita solo a
problemas con un conjunto solucin convexo y funcin objetivo y restricciones lineales)
hasta las tcnicas metaheursticas de solucin aproximada como la Bsqueda Tab.
Ejercicio
Cada mquina est disponible 30, 35 y 45 horas respectivamente. El beneficio por barril
de combustible obtenido con el proceso 1 es de 25 unidades monetarias; con el
proceso 2, de 18 unidades monetarias y 20 unidaes monetarias se se emplea el
proceso 3.
2. La empresa EMX aplica Metodos de optimizacion y gasta por el estudio y el
desarrollo de la aplicacin $100 pero luego de aplicar el modelo observa que la
mejora no es muy diferente a la que actualmente tena.
De igual manera, los M.O. es til cuando en los fenmenos estudiados interviene
el azar. La nocin de esperanza matemtica y la teora de procesos estocsticos
suministran la herramienta necesaria para construir el cuadro en el cual se
optimizar la funcin econmica. Dentro de este tipo de fenmenos se
encuentran las lneas de espera y los inventarios con demanda probabilstica.
Para ello se mezclan cuatro productos base, que representaremos con un nmero, y
cuyo costo y disponibilidad son:
Modelo matemtico
Sujeto a:
Notemos que un simple anlisis del modelo nos permite eliminar las variables
Zi Yj
y las variables y haciendo uso de las ecuaciones. Es siempre muy
Conclusin
Para concluir, es importante mencionar que los trabajos sealados en el presente
trabajo, son producto del esfuerzo, empeo, dedicacin y disciplina que se le puso a
todos y cada uno de, para lo cual fue indispensable el apoyo de mi docente, as como
del entusiasmo para la asignatura. Por tanto el presente portafolio es una
representacin de los logros obtenidos, as como de las reas de oportunidad que se
pueden trabajar para mejorar.