Box Plot
Box Plot
Box Plot
Diagramas de Caja
Los diagramas de caja (Chambers 1983) son una herramienta excelente para transmitir la localizacin y variacin de datos, particularmente para detectar e ilustrar cambios de localizacin y variacin entre diferentes grupos de datos.
Este diagrama de caja, que compara la energa de salida de cuatro mquinas, muestra que la mquina tiene un efecto significativo con respecto a la localizacin y a la variacin. La mquina 3 tiene la energa de salida ms alta (alrededor de 72,5); la mquina 4 tiene la menor respuesta de energa variable estando cerca del 50% de sus lecturas dentro de 1 unidad de energa. Los diagramas de caja estn formados por Eje vertical: Variable de respuesta Eje horizontal: El factor de inters Ms especficamente, nosotros 1. Calculamos la mediana y los cuartiles ( el cuartil inferior es el 25to percentil y el cuartil superior es el 75to percentil). 2. Grafique un smbolo en la mediana (o dibuje una lnea) y dibuje una caja (de ah el nombre, diagrama de caja) entre el cuartil inferior y el superior; esta caja representa el 50% medio de los datos, el cuerpo de los datos. 3. Dibuje una lnea desde el cuartil inferior hasta el punto mnimo y otra lnea desde el cuartil superior hasta el punto mximo. Tpicamente se dibuja un smbolo en estos puntos, mnimo y mximo, sin embargo, esto es opcional. De este modo el diagrama de caja identifica el 50% medio de los datos y los puntos extremos.
Se puede dibujar una sola caja para un lote de datos sin grupos distintos. Alternativamente, se puede dibujar varias cajas juntas para comparar diferentes datos o para comparar grupos en un solo conjunto de datos. Para un solo diagrama de caja el ancho de la caja es arbitrario. Cuando son varios diagramas de caja, el ancho debe ser proporcional al nmero de datos en el grupo correspondiente o muestra (algunas implementaciones de software del diagrama de caja simplemente dibujan las cajas con el mismo ancho). Hay una variacin til del diagrama de caja que identifica ms especficamente a los valores atpicos. Para crear esta variacin: 1. Calcule la mediana y los cuartiles inferior y superior. 2. Grafique un smbolo en la mediana y dibuje una caja entre los cuartiles inferior y superior. 3. Calcule el rango intercuartil (la diferencia entre el cuartil superior y el inferior y denomnelo IQ. 4. Calcule los siguientes puntos: L1 = cuartil inferior 1,5*IQ L2 = cuartil inferior 3,0*IQ U1 = cuartil superior + 1,5*IQ U2 = cuartil superior + 3,0*IQ 5. No se dibuja la lnea desde el cuartil inferior hasta el mnimo, ahora se dibuja desde el cuartil inferior hasta el punto ms pequeo que sea mayor que L1. Asimismo, ahora se dibuja la lnea desde el cuartil superior hasta el punto ms grande que sea menor que U1. 6. Los puntos entre L1 y L2 o entre U1 y U2 se dibujan como crculos pequeos. Los puntos menores que L2 o mayores que U2 se dibuja como crculos grandes. El diagrama de caja puede dar respuesta a las siguientes preguntas: 1. Es significativo un factor? 2. La localizacin cambia entre grupos? 3. La variacin cambia entre grupos? 4. Hay algn valor atpico? 5. El diagrama de caja es una herramienta importante del Anlisis Exploratorio de Datos para determinar si un facror tiene un efecto significativo en la respuesta con respecto ya sea a la localizacin o la variacin. 6. El diagrama de caja tambin es una herramienta efectiva para resumir grandes cantidades de informacin.