MA461 - 202202 - Semana 06 - Sesión 01

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

MA461 Estadística Inferencial

UNIDAD 2: Diseños Experimentales

Semana 6 – Sesión 1

Logro: Al finalizar la unidad, el estudiante identifica variables independientes


aplicando la técnica de análisis de varianza con el apoyo del software Microsoft
Excel, diferenciando los experimentos de uno y dos factores.

Diseños Experimentales *

Conceptos Básicos:

Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables, susceptibles a manipulación) de un
proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la
variable de salida (variable respuesta, variable dependiente no manipulable).

Ejemplo:
Suponga que el ejecutivo de marketing de la empresa ALOA S.A., desea saber si los tipos de
promoción (variable independiente) de un producto influye en los montos de ventas de este
(variable dependiente), y de ser así qué promoción sería la recomendable. Por lo tanto, se plantea
tres promociones distintas: P1, P2, P3. Vea la gráfica:

¿La diferencia en los montos de ventas promedios obtenidos con las diferentes promociones en la
muestra nos indica que efectivamente las promociones influyen en los montos de ventas, o sólo se
debe a la variabilidad inherente al muestreo? ¿La promoción 3 es más efectiva?

-1-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Factor: Es una variable independiente o de entrada que puede afectar los resultados del
experimento. Los factores se pueden clasificar en controlables y no controlables. El interés principal
del experimentador es evaluar el efecto de estos factores.
En el ejemplo anterior, la promoción es el factor en estudio.
Un experimento diseñado puede tener uno, dos o más factores en estudio, por ejemplo, podríamos
estar interesados en evaluar no sólo las promociones sino además las zonas, y el interés radicaría en
saber si las promociones tienen un efecto distinto en las zonas donde se aplican (¿hay interacción
entre la promoción y las zonas?). En este caso los factores son: Promoción y Zona.

Niveles del factor: Se llama así a los distintos valores de los factores en estudio que son evaluados.
En el ejemplo, el factor promoción tiene tres niveles (P1, P2 y P3).

Tratamiento: Un tratamiento corresponde a los niveles de un factor o a una combinación de los


niveles de dos o más factores en estudio y cuyo efecto se mide y compara con los de otros
tratamientos. En el ejemplo, los tratamientos son (P1, P2 y P3).

Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual se mide el efecto


de un tratamiento. En el ejemplo anterior, la unidad experimental sería una tienda.

Variable respuesta: Es la variable en la cual se evaluarán los efectos de los tratamientos. En el


ejemplo anterior, la variable respuesta sería las ventas.

Error experimental: Es la variabilidad existente entre los resultados de unidades experimentales


tratadas en forma similar. Cualquier factor no controlable contribuye al error experimental. El error
experimental proviene de dos fuentes principales: variabilidad inherente al material experimental y
variabilidad resultante de cualquier falta de uniformidad en la realización física del experimento. En
el ejemplo anterior, a pesar de que se aplicó la promoción 1 a las cuatro tiendas, sus ventas son
distintas.

En este curso se presentan dos casos de análisis:


a. El diseño completamente al azar (DCA): Este es un diseño en el que sólo se contempla un factor
de estudio.
b. El experimento factorial AxB: Este es un diseño con dos factores A y B en estudio, con a y b
niveles respectivamente.

Diseño Completamente al Azar (DCA)

Un Diseño Completamente al Azar, mide el efecto del factor en estudio (variable independiente de
naturaleza cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de
naturaleza cuantitativa).

Suponga que se cuenta con los resultados de k muestras aleatorias independientes, cada una de
tamaño ni, obtenidas desde k diferentes poblaciones y se desea probar la hipótesis de que las
medias de estas k poblaciones son todas iguales. Las poblaciones que se desea comparar suelen ser
producto de la aplicación de distintos tratamientos a ciertas unidades de análisis.

-2-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Los datos por analizar pueden arreglarse en una tabla como la que se muestra a continuación:

Tratamiento
Muestra Tratamiento 1 Tratamiento 2 . . . Tratamiento k
1 y11 y21 ... yk1
2 y12 y22 ... yk2
3 y13 y23 ... yk3
. . . ... .
. . . ... .
. . . ... .
ni y1n 1
y2 n 2
... yk n k

Totales yi. y1. y2. ... yk.

Considere por ejemplo el caso en el que se desea comparar el efecto de cinco programas de
incentivos en la productividad de los trabajadores; en este caso, los cinco programas de incentivos
serían los cinco tratamientos aplicados (los cuales definen las cinco poblaciones que se van a
comparar), y la unidad de análisis sería un trabajador (quien recibe el tratamiento).

Modelo:
Cada observación yij se descompone en:
y ij =μ+ τ i+ ε ij ; para i=1 , ​​2, ... , k ; j=1,2 , ... ,n i

Donde:
yij : Representa la j-ésima observación en la i-ésima muestra.
μ : Media general.
τi : Efecto del i-ésimo tratamiento.
ε ij : Error aleatorio asociado a la observación yij, donde ε ij ~ N (µ=0, σ 2)

Supuestos del modelo:


Los errores siguen una distribución normal (supuesto de normalidad) con varianza constante
(supuesto de homogeneidad de varianzas).

Hipótesis:
La hipótesis nula plantea que no hay efecto de los tratamientos, luego no hay diferencia en las
medias poblacionales; por lo tanto, expresamos las hipótesis de la siguiente manera:

H0: µ1 = µ 2 = … = µ k No hay diferencia en las El factor en estudio no afecta (no


medias poblacionales influye) a la variable respuesta
H1: No todas las µi son iguales Hay diferencia en las medias El factor en estudio afecta (influye) a
poblacionales la variable respuesta

-3-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Análisis de Varianza (ANOVA)

Consiste en analizar los cocientes de las varianzas para probar la hipótesis de igualdad o desigualdad
entre las medias debidas a los tratamientos. Para lo cual, se separa la variación total en las partes
con que contribuye cada fuente de variación. En el caso l DCA las fuentes de variación son:
Variación entre grupos (debida a los tratamientos) y Variación dentro del grupo (debida al error
experimental).

Con estas fuentes de variación se obtienen los cuadrados de las sumatorias de las desviaciones,
tanto del tratamiento como del error y se construye una tabla de ANOVA que nos servirá para
probar las hipótesis de este estudio.

Tabla del Análisis de Varianza


Fuente de Grados de Suma de Cuadrado
variación libertad (df) Cuadrados (ss) Medio (ms)
Fcal
k 2 2
y i • y •• SC(Tr)
Tratamientos k–1 SC (Tr )=∑ − CM( Tr)= CM (Tr )
i=1 n i n• k −1
CME
SCE
Error n. – k SCE=SCT−SC( Tr) CME=
n• −k
k n
y 2••
SCT=∑ ∑
2
Total n. – 1 y−ij
i=1 j=1 n•

Pasos para realizar el Diseño Completamente al Azar (DCA)

1) Planteamiento de la Hipótesis

Ho: El factor en estudio no afecta a la variable respuesta ( µ1 = µ2 = … = µk )

H1: El factor en estudio afecta a la variable respuesta ( No todas las µi son iguales )

2) Nivel de significación (α):

3) Estadístico de prueba:
CM (Tr )
F cal=
CME

Fcrítico = F(α; k – 1; n. – k) En Excel: =INV.F.CD(α; k – 1; n. – k)

4) Regiones críticas

-4-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

5) Decisión

Criterio:
Si F cal > Fcritico se rechaza Ho

Si F cal ≤ F critico no se rechaza Ho

6) Conclusión

Se derivan de las comparaciones múltiples y de las variables específicas concerniente al


problema que se encuentra en evaluación.

Comparaciones Múltiples:
Los métodos de comparación múltiple son los procedimientos usados para comparar las medias de
tratamientos individuales en el análisis de varianza. (Montgomery, 2003, p.581)

Prueba de Tukey HSD


Se usará esta prueba para evaluar si existen diferencias significativas entre las medias de cada “par
de tratamientos”.
Ho: µi = µj
H1: µi ≠ µj Para todo i ≠ j

HSD=q α ( k , n−k )
√ CME
nk
 n = número de observaciones por tratamiento
 k = número de tratamientos
 q = es un multiplicador (Tabla de Tukey)
 CME = cuadrado medio del error
 nk = tamaño de muestra de los grupos (si no es un modelo
balanceado se usa el promedio armónico.

Comparaciones Múltiples (DMS): REGLAS A UTILIZAR

Comparaciones Intervalo Conclusión


IC(µA-µB) ( + ; +) µA-µB > 0 µA > µ B
IC(µA-µB) ( - ; -) µA-µB < 0 µA<µB
IC(µA-µB) ( - ; +) µA-µB =0 µA = µ B

-5-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Ejemplo de aplicación:
Pisko Perú S.A. desea crear una nueva marca de Pisco que tenga buena acogida en el mercado, por
lo cual está experimentando con diferentes fórmulas de Pisco para evaluar el efecto de estas nuevas
fórmulas sobre las ventas de botellas (en unidades). La empresa está promocionando 3 tipos de
fórmulas (A, B y C) en 15 licorerías con similares características. Después de un mes, se registró la
cantidad de botellas vendidas de los 3 tipos de fórmulas por licorería:

Fórmulas
Tipo A Tipo B Tipo C
56 51 50
59 50 52
54 53 51
56 51 54
58 51 52
Totales 283 256 259
Promedios 56,6 51,2 51,8

Para promocionar su nueva marca, Pisko Perú S.A. elegirá aquella fórmula o fórmulas de Pisco que
produzca mayor cantidad de botellas vendidas. Utilizando un nivel de significancia 5% ¿Cuál de las
fórmulas deberá promocionarse?

Completar la tabla y utilice las salidas obtenidas con el software SPSS:

Tabla de Análisis de varianza (ANOVA)

Fuente de Variación GL (df) SC (SS) CM (ms) Fcalc


Fórmulas 87,6
Error
Total 14 116,4

-6-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Interpretación Representación Cálculo / Análisis Argumentación


Análisis Estadístico Respuesta del
Definición del Elementos del
problema Toma de
problema diseño ANOVA Comparaciones
decisión

Solución:

Interpretación
Determinar ………….

Representación
-7-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Factor :
Tratamientos :
Variable respuesta :
Unidad experimental :
Supuestos del modelo :
Técnica estadística :
Nivel de significación :

Cálculo y Análisis

Hipótesis de Análisis de varianza (ANOVA):


Ho:
H1:
Nivel de significación:

Tabla de Análisis de varianza (ANOVA)

Fuente de Variación GL (df) SC (ss) CM (ms) Fcal


Fórmulas 87,6
Error
Total 14 116.4

CM (Tr )
F cal= =¿
CME

Fcrítico = F(α; k – 1; n. – k) = F( En Excel: =INV.F.CD(α; k – 1; n. – k) = INV.F.CD(

α = 0,05

Decisión estadística:
Conclusión estadística:

Comparaciones múltiples (DMS)


Comparaciones Lím. Inf. Lím. Sup.
IC(µ1-µ2) 3.27 7.53
IC(µ1-µ3) 2.67 6.93
IC(µ2-µ3) -2.73 1.53

-8-
MA461 Estadística Inferencial
UNIDAD 2: Diseños Experimentales

Para construir la Tabla de agrupaciones usando Prueba de Tukey HSD (al 95% de confianza)

1. Debemos ordenar los promedios de los Tipos formula de pisco en orden descendente.

Conclusiones:

Argumentación

-9-

También podría gustarte