Diagramadecajasybigotes
Diagramadecajasybigotes
Diagramadecajasybigotes
Estadística I semestre
Diagrama de Cajas
BOXPLOT
Diagrama de cajas
Resumen gráficos para analizar la distribución de los
datos.
.
Introducción
Estos 5 valores que dan origen a un bloxplot suelen denominarse las 5 medidas de
resumen de un conjunto de observaciones..
Las líneas que se extienden paralelas a las cajas se conocen como «bigotes», y
se usan para indicar variabilidad fuera de los cuartiles superior e inferior. Los
valores atípicos se representan a veces como puntos individuales que están en
línea con los bigotes. Los diagramas de cajas y bigotes se pueden dibujar vertical
u horizontalmente.
Ing. Alcides Ramos Calcina
DIAGRAMAS DE CAJAS (BOXPLOT)
El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa (variable
numérica). El gráfico es una herramienta que permite visualizar, a través de los cuartiles, cómo es
la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc. Se
compone de:
Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja
una línea indica dónde se encuentra la mediana (segundo cuartil Q2).
Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza
en el tercer cuartil y acaba en el máximo.
Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen
ciertos requisitos de heterogeneidad de los datos.
Ing. Alcides Ramos Calcina
AED univariado
• Los diagramas de caja son muy útiles para comparar una variable en diferentes
grupos.
Ing. Alcides Ramos Calcina
2) CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Ing. Alcides Ramos Calcina
Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta:
Q3 = (39 + 39) / 2 = 39
Ing. Alcides Ramos Calcina
Construcción e interpretación de un BoxPlot
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre
el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de
los más jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido
en 14,5 años.
Ing. Alcides Ramos Calcina
Los diagramas de caja y bigote son muy utilizados para comparar distribuciones.
Se tiene el siguiente ejemplo para comparar las distribuciones de grupos de edades.
A: 35 38 32 28 30 29 27 19 48 40
B: 39 24 24 34 26 41 29 48 28 22
Ing. Alcides Ramos Calcina
Ejemplo 1:
Se estudia la respuesta dinámica en la dirección paralela al viento de construcciones con formas
angulosas durante el paso del Huracán Sandy edificaciones ubicadas en regiones costeras de
Carolina Del Norte en las que pueden suponerse el primer modo o modo fundamental de
vibración como dominante, para esto se realizan mediciones del factor de ráfaga del viento el
cual es función de varios parámetros de entre los cuales el más significativo es la velocidad del
viento. Una muestra representativa de los datos obtenidos es la siguiente:
Realizar un análisis de descriptivo para los datos del factor de ráfaga del viento durante el paso
del huracán Sandy, utilice el diagrama de cajas.
Ing. Alcides Ramos Calcina
FINESI Estadística
I Semestre
GRACIAS