Diesño de Un Experimento
Diesño de Un Experimento
Diesño de Un Experimento
FACTOR.- Es la VARIABLE INDEPENDIENTE que el investigador tiene bajo control y que debe
ser aplicada a las unidades experimentales y esperar el efecto o respuesta que puedan tener.
Ejemplo: En la eficiencia del lavado de ropa, los factores pueden ser: tipo de agua, tiempo de
lavado, la temperatura del agua, el tipo de máquina lavadora, la clase de agente limpiador, etc.
En el rendimiento académico de un alumno los factores que puedan influir son muchos, tales
como: el docente, el método que emplea el docente, la situación socio-económica del alumno,
la hora de las clases, los medios y materiales usados, etc.
En la mayoría de los casos el investigador trata con más de una variable independiente
o factor para observar los cambios que ocurren en la variable respuesta. Como cualquier
variable, el factor puede ser cualitativo o cuantitativo, sin embargo, salvo estudios teóricos o
simulaciones las variables son usadas en niveles que los convierten en cualitativos.
VARIABLE DEPENDIENTE.- Es la VARIABLE RESPUESTA que refleja el efecto que pueda
producir la variable independiente o factor en la unidad experimental asignada.
Ejemplo: Supongamos que queremos estudiar el rendimiento de la papa por hectárea, los
factores pueden ser muchos, tales como: el abono, el suelo, el riego, el tiempo de sembrío, los
insecticidas etc., en tanto que el rendimiento será la cantidad de papa cosechada, la calidad, el
tamaño, el sabor, etc.
VARIABLE EXÓGENA.- En todo experimento, además de las variables independientes en
estudio, existen otras que el investigador no los controla pero que pueden influir en la variable
respuesta, a estas variables se les conoce como variables exógenas, generalmente forman parte
del error, el investigador debe tener la capacidad de reducir su influencia usando el diseño
adecuado.
Ejemplo: El estudio que se hace sobre el rendimiento académico de un alumno, si el factor en
estudio es el método de enseñanza, entonces los demás factores citados anteriormente se
convierten en exógenos.
NIVEL DE UN FACTOR.- Son las diversas cantidades, valores, categorías o clasificaciones de
los factores, que deben ser aplicadas a las unidades experimentales, en otras palabras es el grado
de intensidad de un factor que se debe aplicar a un unidad experimental.
Ejemplo: En el estudio del lavado de ropa, sí el factor es la temperatura los niveles pueden ser
50º c., 60º c., 70º c. etc. En el rendimiento académico del alumno, sí el factor es el método de
enseñanza, los niveles son los diferentes métodos usados. En el rendimiento de la papa, sí el
factor es el abono, los niveles pueden ser abono animal, nitrogenado, fosfatado, o sí se usa un
tipo de abono los niveles pueden ser las cantidades usadas como 1 kg. por planta, 2kgs. por
planta, etc. En un estudio sociológico los factores pueden ser la edad, el sexo, la instrucción,
etc. Y los niveles pueden ser para la edad: menos de 10 años, de 10 a 20 años, de 20 a 30 años
y más de 30 años; para el sexo los niveles son: mujer y varón; para la instrucción los niveles
pueden ser sin educación, con primaria, con secundaria, con superior.
TRATAMIENTO.- Son cada uno de los niveles escogidos de un factor que deben ser aplicados a
una unidad experimental; en términos más amplios es el conjunto particular de condiciones
experimentales que se deben aplicar a las unidades experimentales. En caso de hayan más de
un factor o variable independiente en estudio, un tratamiento es la combinación específica de
los niveles de los factores en estudio o de los que intervienen en el experimento.
Ejemplo: Si se está estudiando el rendimiento de la papa como consecuencia de la variedad
(factor A) con tres niveles Variedad a, b y c, y el tipo de fertilizante (factor B) con tres niveles
también: Fosfatado, nitrogenado y animal; entonces un tratamiento puede ser el uso del abono
animal aplicado a la variedad “a” de la papa; en este caso habrían 9 tratamientos, una de ellas
es la indicada.
ERROR EXPERIMENTAL.- Describe el fracaso de llegar a resultados idénticos con dos unidades
experimentales tratadas idénticamente, este error puede surgir de errores experimentales en sí,
de errores de observación, de errores de medición de la variabilidad del material experimental,
de los efectos combinados de todos los factores extraños o exógenos que pudieran influir y que
no han sido considerados o controlados.
UNIDAD EXPERIMENTAL.- Es el ente más pequeño o elemental al cual se le aplica un
tratamiento en una reproducción del experimento básico. La unidad experimental dependerá del
tipo de estudio que se realiza, por lo tanto puede ser una persona, un animal, o cosa; así en
biología la unidad experimental puede ser una muestra de tejido fibroso, un ratón, una colonia
de bacterias, etc., en un experimento agrícola la unidad experimental podría ser una parcela de
terreno, una planta, un surco, una hoja, etc.
MEDIDA.- Una medida es el valor de la variable dependiente o respuesta mediante el cual se
determina el efecto de un tratamiento aplicado a una unidad experimental.
Ejemplo: En el estudio del rendimiento académico de un alumno, la medida será la nota que el
alumno obtiene después de aplicarse el método de enseñanza y luego de la correspondiente
evaluación.
CONFUSIÓN.- Es sinónimo de entremezclados, esto significa que es posible que dos o más
efectos se confundan en un experimento, por lo tanto es improbable separar sus efectos cuando
se lleva a cabo el respectivo análisis estadístico, sin embargo un buen diseño debe suprimir la
confusión, pero en otros casos se usa este hecho para simplificar análisis tedioso que se deben
hacer al usar muchos factores.
BALANCEO.- Es la obtención y distribución de las unidades experimentales adecuadas, el
agrupamiento, el bloqueo y la asignación de los tratamientos a las unidades experimentales de
tal manera que resulte una configuración balanceada, equilibrada y ponderada.
AGRUPAMIENTO.- Es la asignación o colocación de un conjunto de unidades experimentales
homogéneas en grupos de modo que los diferentes grupos puedan sujetarse a los diferentes
tratamientos, estos grupos pueden tener diferente número de unidades experimentales.
BLOQUEO.- Es la distribución de las unidades experimentales en bloques o grupos de tal manera
que las unidades experimentales dentro de cada bloque sean homogéneas, de esta manera la
mayor parte de la variación predecible entre las unidades experimentales queda confundida con
el efecto de los bloques, en otros términos el objetivo de este proceso es separar de la variación
del error experimental la variación debida a la heterogeneidad de las unidades experimentales,
por lo tanto se reducirá el valor del error experimental, y por consiguiente los resultados serán
más precisos.
INTERACCIÓN.- Es la respuesta diferencial de un nivel de un factor en combinación con los
diferentes niveles de otro u otros factores aplicados simultáneamente, es decir la interacción es
un efecto adicional debido a la influencia combinada de 2 o más factores.
El número de interacciones depende del número de factores que intervienen en el diseño, así
por ejemplo, con un factor no existe interacción, con dos factores existe una sola interacción,
con tres factores existen tres interacciones dobles y una triple, con cuatro factores existen seis
interacciones dobles, cuatro triples y una cuádruple, etc.
EFECTO PRINCIPAL.- El efecto principal de un factor, es una medida del cambio en la variable
respuesta correspondiente a cambios en el nivel de un factor promediado sobre todos los niveles
de los otros factores, es decir, permaneciendo fijos los otros factores. El número de factores
principales es igual al número de factores que intervienen en el diseño.
ANÁLISIS DE VARIANZA (ANVA).- Es un procedimiento aritmético-estadístico, mediante el cual
la variación total de un conjunto de datos se divide en dos o más componentes independientes,
y a cada uno de los cuales se les puede atribuir una causa diferente de variación.
Las suposiciones del Análisis de Varianza (ANVA), de observación única son los siguientes.
- Las t muestras observadas se toman en forma aleatoria e independiente.
- Las t poblaciones de los tratamientos están normalmente distribuidas.
- Las varianzas de las t poblaciones de los tratamientos son todas homogéneas.
ANÁLISIS DE COVARIANZA (ANCOVA).- Es una técnica estadística que se usa con la finalidad
de controlar o separar los efectos de las variables exógenas que pudieran influir en la variable
respuesta, y consiste en introducir una o más variables no aleatorias al modelo en estudio y
realizar un análisis de varianza y de regresión con ellas.
VALIDEZ INTERNA.- Se dice que un experimento es válido internamente, si arroja resultados
que estén libres de sesgos y esto depende de un buen control del error experimental y de las
variables exógenas.
VALIDEZ EXTERNA.- Es la capacidad de generalización que tienen los resultados de un
experimento, la validez externa depende del empleo de una adecuada aleatorización y de la
suficiente repetición del experimento.
SUPUESTOS
El modelo estadístico debe cumplir los siguientes supuestos:
1.- Aditividad, los efectos del modelo son aditivos.
2.- Linealidad, las relaciones entre los efectos del modelo son lineales.
3.- Normalidad, los errores o residuos son variables aleatorias y deben tener una distribución
normal con media cero y varianza constante 2
4.- Independencia, los resultados obtenidos en el experimento son independientes entre si.
5.- Homogeneidad de varianzas, Las diferentes poblaciones generadas por la aplicación de
los diferentes tratamientos deben tener varianzas iguales (2)
TIPOS DE MODELOS:
Los t niveles del factor en el experimento pueden elegirse de dos maneras:
a) MODELO I (MODELO A EFECTOS FIJOS) Modelo de Análisis de Varianza, es cuando
el investigador selecciona los t tratamientos en forma específica y desea probar la hipótesis
sobre la igualdad de las medias de los tratamientos escogidos y las conclusiones no pueden
extenderse a los demás tratamientos que no fueron considerados.
b) MODELO II (MODELO A EFECTOS VARIABLES) Modelo de Componentes de Varianza,
es cuando el investigador selecciona una muestra aleatoria de t tratamientos de una población
grande de tratamientos, en este caso las conclusiones se extiende a todos los tratamientos de la
población, considerados o no en el experimento, en este caso los i son variables aleatorias.
n
Y i Yij /n , Es el promedio de las observaciones bajo el i-ésimo tratamiento
j 1
t n
Y.. = T = Yij
i 1 j 1
Es el gran total de todas las observaciones.
_
Y.. = media total de todas las observaciones
t n
Y .. = Yij /N
i 1 j 1
= T/nt
N = nt
SCT = Y2 - Myy
t n
Y2 = Yij 2
i 1 j 1
Modelo II
E (Tr) = 2 + n2t ; E (CME) = 2
En ambos casos la Fe es igual a Tr/E.
Como se sabe, el ANVA divide a la variabilidad total de los datos contenidos en la muestra en
dos componentes:
SUMA DE CUADRADOS = SUMA DE CUADRADOS + SUMA DE CUADRADOS
DEL TOTAL ENTRE TRATAMIENTOS DENTRO DE TRATAMIENTOS (ERROR)
t n t
2 (Yi. - Y ..)(Yi.- n Y i.) = 2 (Yi. - Y ..)(Yi.- nYi./n) = 0
i 1 j 1 1
Ejemplo Nº 1
Un fabricante de papel para bolsas, está interesado en mejorar la resistencia a la tensión
del producto, el grupo de ingeniería de la empresa piensa que la resistencia a la tensión es una
función de la concentración de madera dura en la pulpa, para lo cual se sometieron a prueba 24
especímenes en un probador de tensión de laboratorio en un orden aleatorio, probando seis
especímenes por cada uno de los cuatro niveles dados, los resultados se presentan en el cuadro
siguiente, pruebe sí existe diferencia significativa entre los cuatro niveles con un 99% de
seguridad.
Concentración Observaciones
de madera % 1 2 3 4 5 6 Total Promedio
5% 7 8 15 11 9 10 60 10,00
10% 12 17 13 18 19 15 94 15,67
15% 14 18 19 17 16 18 102 17,00
20% 19 25 22 23 18 20 127 21,17
Total 383 15,96
Solución:
1) Ho: 1 = 2 = 3 = 4
H1: 1 2 3 4
2) = 0,01
3) La función pivotal es una F con 3 y 20 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 4,94
5) T = 383
6) Como Fe = 19,6 Fo = 4,94, se rechaza Ho, por lo tanto hay diferencias significativas en
la resistencia media entre los 4 niveles de concentración de madera, siendo el del 20% el
que da mayor resistencia.
Ahora Usted puede analizar la gráfica y sacar sus conclusiones
G.1. GRÁFICO DE CAJAS
30
20
10
RESISTENCIA
0
N= 6 6 6 6
5 10 15 20
CONCENTRACION DE MADERA
COEFICIENTE DE VARIACIÓN:
Es una medida de variabilidad o de dispersión indica el grado de dispersión de los datos
respecto a su promedio y sirve para analizar el grado de homogeneidad de los resultados
experimentales, para una mejor apreciación es necesario compararlo con un estándar o con otro
experimento de similares características. En el DCA el CME es el estimador de la varianza de
los datos en estudio y el coeficiente de variación se calcula usando la siguiente fórmula.
CME
CV(X) = x 100
Y ..
El coeficiente de variación para el ejemplo es el siguiente:
6,51
CV(X) = x 100 = 15,99%
15,96
Ejemplo Nº 2
Se realizó un experimento con cuatro métodos diferentes de enseñanza, para lo cual se
escogió 20 alumnos con rendimientos homogéneos, a quienes se les asignó al azar a cada grupo
compuesto por cinco alumnos cada uno y a cada grupo se le asignó un método también en forma
aleatoria; se quiere probar si los cuatro métodos son iguales, con esa finalidad después de
aplicado los métodos se les evaluó, obteniendo los resultados que se dan en el siguiente cuadro.
Use = 0,01
Tratamientos
Muestras 1 2 3 4 Total
1 73 74 67 70
2 74 75 66 71
3 72 74 68 72
4 73 76 69 70
5 75 73 70 72
Total 367 372 340 355 1434
Media 73,4 74,4 68,0 71,0 71,7
Solución:
1) Ho: 1 = 2 = 3 = 4 : 1 = 2 = 3 = 4
H1: 1 2 3 4 : 1 2 3 4
2) = 0,01
3) La función pivotal es una F con 3 y 16 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 5,29
5) T = 1434
Ejemplo Nº 3:
Se supone que la cantidad de carbón usado en la producción de acero tiene un efecto en
su resistencia a la tensión, con los datos que se presentan en el siguiente cuadro, efectúe el
análisis correspondiente, con un 99% de seguridad.
Espécimen Porcentaje de carbón Total
10% 15% 20% 25% 30%
1 25 23 42 47 28
2 26 30 38 43 29
3 28 31 43 45 33
4 24 33 34 43 35
5 22 29 37 42 34
6 23 32 34 48 33
Total 148 178 228 268 192 1014
Promedio 24,67 29,67 38,00 44,67 32.00 33,80
Solución:
1) Ho: i = 0 i = 1,2,3,4,5
H1: i 0 Para algún i
2) = 0,01
3) La función pivotal es una F con 4 y 25 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 4,18
5) T = 1014
y
2
Y2 =
ij
i 1 j 1
2
y t
Tyy = i.
- Myy
n i 1 i
Ejemplo Nº 4:
Una compañía que fabrica computadoras ha instituido 4 programas diferentes de
entrenamiento para los empleados que trabajan en operaciones de ensamblado. 24 trabajadores
repartidos en grupos de seis, tomaron los programas de entrenamiento, después del
entrenamiento se registraron los tiempos medios necesarios para el ensamblado de un
determinado circuito, para cada uno de los trabajadores, 4 trabajadores renunciaron a su empleo
durante el programa de entrenamiento, los datos se presentan en el siguiente cuadro, haga un
ANVA con un 95% de seguridad.
Trabajador Programa
Nº A B C D Total
1 60 80 97 67
2 80 81 84 84
3 69 73 93 90
4 65 69 79 78
5 -- 75 92 61
6 -- 72 -- --
Total 274 450 445 380 1549
ni 4 6 5 5 20
Promedio 68,5 75 89 76 77,45
Solución:
1) Ho: i = 0 i = 1,2,3,4
H1: i 0 Para algún i
2) = 0,05
3) La función pivotal es una F con 3 y 16 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 3,24
5) T = 1549
Ejemplo Nº 5:
Un ingeniero de producción está interesado en maximizar la resistencia a la tensión de
una nueva fibra sintética empleada para fabricar tela para pantalones, se sabe que la resistencia
depende del porcentaje de algodón que contiene la tela, el ingeniero decide probar muestras de
tela en 5 niveles de porcentaje de algodón, hace seis repeticiones para cada nivel, las muestras
fueron asignados al azar cada nivel, los resultados fueron los siguientes. Haga un ANVA con
un 95% de seguridad.
% de Observaciones
Algodón 1 2 3 4 5 6 Total Promedio
15 7 15 11 15 11 13 72 12,0
20 7 11 7 9 15 11 60 10,0
25 12 17 13 15 18 15 90 15,0
30 19 25 22 20 23 23 132 22,0
35 15 18 16 17 19 17 102 17,0
Total 456 15,2
20
10
RESISTENCIA
0
N= 6 6 6 6 6
15 20 25 30 35
PORCENTAJE
Solución:
1) Ho: i = 0 i = 1,2,3,4,5
H1: i 0 Para algún i
2) = 0,05
3) La función pivotal es una F con 4 y 25 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 2,60
5) T = 456
En este caso los efectos del tratamiento i y los errores ij son variables aleatorias
independientes, aún cuando el modelo es lo mismo que en el caso de los efectos fijos, pero los
parámetros tienen interpretaciones diferentes, pues:
V (Yij) = 2t + 2
A las varianzas 2t y 2 se les conoce como componentes de varianza, razón por el
cual al modelo se le conoce también como componentes de varianza. Para probar la hipótesis
se supone que los errores ij tienen distribución normal e independiente con media cero y
varianza constante 2 DNI (0, 2), asimismo los i DNI (0, 2t)
De acuerdo a la esperanza de los cuadrados medios de los tratamientos, no tiene sentido probar
i = 0, pues resulta más apropiado probar Ho: 2t = 0, frente a H1: 2t 0, sí 2t = 0, entonces
todos los tratamientos tienen idénticos efectos, pero sí 2t 0, entonces significa que existe
variabilidad entre los efectos de los tratamientos, en tanto que el ANVA sigue siendo lo mismo
Tyy /(t 1)
Fe = Es una F con (t-1) y t(n-1) g.l., sí Ho es cierta.
Eyy / t (n 1)
Ejemplo:
Una compañía textil produce tela en varios telares, la compañía tiene interés en conocer
si la variabilidad en la resistencia a la tensión se debe a los telares, para investigar esto un
ingeniero de producción seleccionó al azar cuatro telares y determinó la resistencia a la tensión
de las muestras de tela tomadas aleatoriamente de cada telar. Los resultados se presentan en el
siguiente cuadro. Haga un ANVA con un 99% de seguridad.
Observaciones
Telar 1 2 3 4 Total Promedio
1 98 97 99 96 390 97,5
2 91 90 93 92 366 91,5
3 96 95 97 95 383 95,8
4 95 96 99 98 388 97,0
Total 1527 95,45
Solución:
1) Ho: 2t = 0
H1: 2t 0
2) = 0,01
3) La función pivotal es una F con 3 y 12 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 5,95
5) T = 1527
Myy = (1527)2/16 = 145733, 06
Tyy = (3902 + 3662 + 3832 + 3882)/4 – 145733, 06 = 89, 19
-1
RESIDUO
-2
-3
N= 4 4 4 4
1 2 3 4
TELAR
-1
RESIDUO
-2
-3
N= 4 4 4 4
PROMEDIO
Como se puede apreciar no existe un patrón definido entre los residuos, por lo tanto la
variable respuesta original no necesita de transformaciones.