MA461 - 202202 - Semana 06 - Sesión 01

MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales
Semana 6 – Sesión 1
Logro: Al finalizar la unidad, el estudiante identifica variables independientes

aplicando la técnica de análisis de varianza con el apoyo del software Microsoft
Excel, diferenciando los experimentos de uno y dos factores.
Diseños Experimentales *
Conceptos Básicos:
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables, susceptibles a manipulación) de un
proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la
variable de salida (variable respuesta, variable dependiente no manipulable).
Ejemplo:
Suponga que el ejecutivo de marketing de la empresa ALOA S.A., desea saber si los tipos de
promoción (variable independiente) de un producto influye en los montos de ventas de este
(variable dependiente), y de ser así qué promoción sería la recomendable. Por lo tanto, se plantea
tres promociones distintas: P1, P2, P3. Vea la gráfica:
¿La diferencia en los montos de ventas promedios obtenidos con las diferentes promociones en la
muestra nos indica que efectivamente las promociones influyen en los montos de ventas, o sólo se
debe a la variabilidad inherente al muestreo? ¿La promoción 3 es más efectiva?
-1-
Factor: Es una variable independiente o de entrada que puede afectar los resultados del
experimento. Los factores se pueden clasificar en controlables y no controlables. El interés principal
del experimentador es evaluar el efecto de estos factores.
En el ejemplo anterior, la promoción es el factor en estudio.
Un experimento diseñado puede tener uno, dos o más factores en estudio, por ejemplo, podríamos
estar interesados en evaluar no sólo las promociones sino además las zonas, y el interés radicaría en
saber si las promociones tienen un efecto distinto en las zonas donde se aplican (¿hay interacción
entre la promoción y las zonas?). En este caso los factores son: Promoción y Zona.
Niveles del factor: Se llama así a los distintos valores de los factores en estudio que son evaluados.
En el ejemplo, el factor promoción tiene tres niveles (P1, P2 y P3).
Tratamiento: Un tratamiento corresponde a los niveles de un factor o a una combinación de los

niveles de dos o más factores en estudio y cuyo efecto se mide y compara con los de otros
tratamientos. En el ejemplo, los tratamientos son (P1, P2 y P3).
Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual se mide el efecto

de un tratamiento. En el ejemplo anterior, la unidad experimental sería una tienda.
Variable respuesta: Es la variable en la cual se evaluarán los efectos de los tratamientos. En el

ejemplo anterior, la variable respuesta sería las ventas.
Error experimental: Es la variabilidad existente entre los resultados de unidades experimentales

tratadas en forma similar. Cualquier factor no controlable contribuye al error experimental. El error
experimental proviene de dos fuentes principales: variabilidad inherente al material experimental y
variabilidad resultante de cualquier falta de uniformidad en la realización física del experimento. En
el ejemplo anterior, a pesar de que se aplicó la promoción 1 a las cuatro tiendas, sus ventas son
distintas.
En este curso se presentan dos casos de análisis:

a. El diseño completamente al azar (DCA): Este es un diseño en el que sólo se contempla un factor
de estudio.
b. El experimento factorial AxB: Este es un diseño con dos factores A y B en estudio, con a y b
niveles respectivamente.
Diseño Completamente al Azar (DCA)
Un Diseño Completamente al Azar, mide el efecto del factor en estudio (variable independiente de
naturaleza cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de
naturaleza cuantitativa).
Suponga que se cuenta con los resultados de k muestras aleatorias independientes, cada una de
tamaño ni, obtenidas desde k diferentes poblaciones y se desea probar la hipótesis de que las
medias de estas k poblaciones son todas iguales. Las poblaciones que se desea comparar suelen ser
producto de la aplicación de distintos tratamientos a ciertas unidades de análisis.
-2-
Los datos por analizar pueden arreglarse en una tabla como la que se muestra a continuación:
Tratamiento
Muestra Tratamiento 1 Tratamiento 2 . . . Tratamiento k
1 y11 y21 ... yk1
2 y12 y22 ... yk2
3 y13 y23 ... yk3
. . . ... .
. . . ... .
. . . ... .
ni y1n 1
y2 n 2
... yk n k
Totales yi. y1. y2. ... yk.
Considere por ejemplo el caso en el que se desea comparar el efecto de cinco programas de
incentivos en la productividad de los trabajadores; en este caso, los cinco programas de incentivos
serían los cinco tratamientos aplicados (los cuales definen las cinco poblaciones que se van a
comparar), y la unidad de análisis sería un trabajador (quien recibe el tratamiento).
Modelo:
Cada observación yij se descompone en:
y ij =μ+ τ i+ ε ij ; para i=1 , 2, ... , k ; j=1,2 , ... ,n i
Donde:
yij : Representa la j-ésima observación en la i-ésima muestra.
μ : Media general.
τi : Efecto del i-ésimo tratamiento.
ε ij : Error aleatorio asociado a la observación yij, donde ε ij ~ N (µ=0, σ 2)
Supuestos del modelo:

Los errores siguen una distribución normal (supuesto de normalidad) con varianza constante
(supuesto de homogeneidad de varianzas).
Hipótesis:
La hipótesis nula plantea que no hay efecto de los tratamientos, luego no hay diferencia en las
medias poblacionales; por lo tanto, expresamos las hipótesis de la siguiente manera:
H0: µ1 = µ 2 = … = µ k No hay diferencia en las El factor en estudio no afecta (no

medias poblacionales influye) a la variable respuesta
H1: No todas las µi son iguales Hay diferencia en las medias El factor en estudio afecta (influye) a
poblacionales la variable respuesta
-3-
Análisis de Varianza (ANOVA)
Consiste en analizar los cocientes de las varianzas para probar la hipótesis de igualdad o desigualdad
entre las medias debidas a los tratamientos. Para lo cual, se separa la variación total en las partes
con que contribuye cada fuente de variación. En el caso l DCA las fuentes de variación son:
Variación entre grupos (debida a los tratamientos) y Variación dentro del grupo (debida al error
experimental).
Con estas fuentes de variación se obtienen los cuadrados de las sumatorias de las desviaciones,
tanto del tratamiento como del error y se construye una tabla de ANOVA que nos servirá para
probar las hipótesis de este estudio.
Tabla del Análisis de Varianza

Fuente de Grados de Suma de Cuadrado
variación libertad (df) Cuadrados (ss) Medio (ms)
Fcal
k 2 2
y i • y •• SC(Tr)
Tratamientos k–1 SC (Tr )=∑ − CM( Tr)= CM (Tr )
i=1 n i n• k −1
CME
SCE
Error n. – k SCE=SCT−SC( Tr) CME=
n• −k
k n
y 2••
SCT=∑ ∑
2
Total n. – 1 y−ij
i=1 j=1 n•
Pasos para realizar el Diseño Completamente al Azar (DCA)
1) Planteamiento de la Hipótesis
Ho: El factor en estudio no afecta a la variable respuesta ( µ1 = µ2 = … = µk )
H1: El factor en estudio afecta a la variable respuesta ( No todas las µi son iguales )
2) Nivel de significación (α):
3) Estadístico de prueba:
CM (Tr )
F cal=
CME
Fcrítico = F(α; k – 1; n. – k) En Excel: =INV.F.CD(α; k – 1; n. – k)
4) Regiones críticas
-4-
5) Decisión
Criterio:
Si F cal > Fcritico se rechaza Ho
Si F cal ≤ F critico no se rechaza Ho
6) Conclusión
Se derivan de las comparaciones múltiples y de las variables específicas concerniente al

problema que se encuentra en evaluación.
Comparaciones Múltiples:
Los métodos de comparación múltiple son los procedimientos usados para comparar las medias de
tratamientos individuales en el análisis de varianza. (Montgomery, 2003, p.581)
Prueba de Tukey HSD

Se usará esta prueba para evaluar si existen diferencias significativas entre las medias de cada “par
de tratamientos”.
Ho: µi = µj
H1: µi ≠ µj Para todo i ≠ j
HSD=q α ( k , n−k )
√ CME
nk
 n = número de observaciones por tratamiento
 k = número de tratamientos
 q = es un multiplicador (Tabla de Tukey)
 CME = cuadrado medio del error
 nk = tamaño de muestra de los grupos (si no es un modelo
balanceado se usa el promedio armónico.
Comparaciones Múltiples (DMS): REGLAS A UTILIZAR
Comparaciones Intervalo Conclusión

IC(µA-µB) ( + ; +) µA-µB > 0 µA > µ B
IC(µA-µB) ( - ; -) µA-µB < 0 µA<µB
IC(µA-µB) ( - ; +) µA-µB =0 µA = µ B
-5-
Ejemplo de aplicación:
Pisko Perú S.A. desea crear una nueva marca de Pisco que tenga buena acogida en el mercado, por
lo cual está experimentando con diferentes fórmulas de Pisco para evaluar el efecto de estas nuevas
fórmulas sobre las ventas de botellas (en unidades). La empresa está promocionando 3 tipos de
fórmulas (A, B y C) en 15 licorerías con similares características. Después de un mes, se registró la
cantidad de botellas vendidas de los 3 tipos de fórmulas por licorería:
Fórmulas
Tipo A Tipo B Tipo C
56 51 50
59 50 52
54 53 51
56 51 54
58 51 52
Totales 283 256 259
Promedios 56,6 51,2 51,8
Para promocionar su nueva marca, Pisko Perú S.A. elegirá aquella fórmula o fórmulas de Pisco que
produzca mayor cantidad de botellas vendidas. Utilizando un nivel de significancia 5% ¿Cuál de las
fórmulas deberá promocionarse?
Completar la tabla y utilice las salidas obtenidas con el software SPSS:
Tabla de Análisis de varianza (ANOVA)
Fuente de Variación GL (df) SC (SS) CM (ms) Fcalc

Fórmulas 87,6
Error
Total 14 116,4
-6-
Interpretación Representación Cálculo / Análisis Argumentación

Análisis Estadístico Respuesta del
Definición del Elementos del
problema Toma de
problema diseño ANOVA Comparaciones
decisión
Solución:
Interpretación
Determinar ………….
Representación
-7-
Factor :
Tratamientos :
Variable respuesta :
Unidad experimental :
Supuestos del modelo :
Técnica estadística :
Nivel de significación :
Cálculo y Análisis
Hipótesis de Análisis de varianza (ANOVA):

Ho:
H1:
Nivel de significación:
Tabla de Análisis de varianza (ANOVA)
Fuente de Variación GL (df) SC (ss) CM (ms) Fcal

Fórmulas 87,6
Error
Total 14 116.4
CM (Tr )
F cal= =¿
CME
Fcrítico = F(α; k – 1; n. – k) = F( En Excel: =INV.F.CD(α; k – 1; n. – k) = INV.F.CD(
α = 0,05
Decisión estadística:
Conclusión estadística:
Comparaciones múltiples (DMS)

Comparaciones Lím. Inf. Lím. Sup.
IC(µ1-µ2) 3.27 7.53
IC(µ1-µ3) 2.67 6.93
IC(µ2-µ3) -2.73 1.53
-8-
Para construir la Tabla de agrupaciones usando Prueba de Tukey HSD (al 95% de confianza)
1. Debemos ordenar los promedios de los Tipos formula de pisco en orden descendente.
Conclusiones:
Argumentación
-9-

MA461 - 202202 - Semana 06 - Sesión 01

Cargado por

Copyright:

Formatos disponibles

MA461 - 202202 - Semana 06 - Sesión 01

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

MA461 - 202202 - Semana 06 - Sesión 01

Cargado por

Copyright:

Formatos disponibles

MA461 Estadística Inferencial

UNIDAD 2: Diseños Experimentales

Logro: Al finalizar la unidad, el estudiante identifica variables independientes

Tratamiento: Un tratamiento corresponde a los niveles de un factor o a una combinación de los

Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual se mide el efecto

Variable respuesta: Es la variable en la cual se evaluarán los efectos de los tratamientos. En el

Error experimental: Es la variabilidad existente entre los resultados de unidades experimentales

En este curso se presentan dos casos de análisis:

Diseño Completamente al Azar (DCA)

Totales yi. y1. y2. ... yk.

Supuestos del modelo:

H0: µ1 = µ 2 = … = µ k No hay diferencia en las El factor en estudio no afecta (no

Análisis de Varianza (ANOVA)

Tabla del Análisis de Varianza

Pasos para realizar el Diseño Completamente al Azar (DCA)

Ho: El factor en estudio no afecta a la variable respuesta ( µ1 = µ2 = … = µk )

2) Nivel de significación (α):

Fcrítico = F(α; k – 1; n. – k) En Excel: =INV.F.CD(α; k – 1; n. – k)

Si F cal ≤ F critico no se rechaza Ho

Se derivan de las comparaciones múltiples y de las variables específicas concerniente al

Prueba de Tukey HSD

Comparaciones Múltiples (DMS): REGLAS A UTILIZAR

Comparaciones Intervalo Conclusión

Completar la tabla y utilice las salidas obtenidas con el software SPSS:

Tabla de Análisis de varianza (ANOVA)

Fuente de Variación GL (df) SC (SS) CM (ms) Fcalc

Interpretación Representación Cálculo / Análisis Argumentación

Hipótesis de Análisis de varianza (ANOVA):

Tabla de Análisis de varianza (ANOVA)

Fuente de Variación GL (df) SC (ss) CM (ms) Fcal

Fcrítico = F(α; k – 1; n. – k) = F( En Excel: =INV.F.CD(α; k – 1; n. – k) = INV.F.CD(

Comparaciones múltiples (DMS)

También podría gustarte