Diagramadecajasybigotes

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

UNA – PUNO Facultad de Ingeniería Económica

E.P. de Ingeniería Económica

Estadística I semestre

Diagrama de Cajas

Ing. Alcides Ramos Calcina


Facultad de Ingeniería Estadística e Informática
Capítulo III Resumen de Datos

BOXPLOT
Diagrama de cajas
Resumen gráficos para analizar la distribución de los
datos.
.
Introducción

 Un boxplot, diagrama de caja o cajón con bigote corresponde a una


representación gráfica complementaria a un histograma, basada en la información
entregada por la mediana, cuartiles y valores mínimos y máximos de un conjunto
de datos.

 Estos 5 valores que dan origen a un bloxplot suelen denominarse las 5 medidas de
resumen de un conjunto de observaciones..

 Las líneas que se extienden paralelas a las cajas se conocen como «bigotes», y
se usan para indicar variabilidad fuera de los cuartiles superior e inferior. Los
valores atípicos se representan a veces como puntos individuales que están en
línea con los bigotes. Los diagramas de cajas y bigotes se pueden dibujar vertical
u horizontalmente.
Ing. Alcides Ramos Calcina
DIAGRAMAS DE CAJAS (BOXPLOT)

El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa (variable
numérica). El gráfico es una herramienta que permite visualizar, a través de los cuartiles, cómo es
la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc. Se
compone de:

 Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja
una línea indica dónde se encuentra la mediana (segundo cuartil Q2).

 Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza
en el tercer cuartil y acaba en el máximo.

 Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen
ciertos requisitos de heterogeneidad de los datos.
Ing. Alcides Ramos Calcina
AED univariado

• Los diagramas de caja son muy útiles para comparar una variable en diferentes
grupos.
Ing. Alcides Ramos Calcina

Ing. Alcides Ramos Calcina


Construcción e interpretación de un BoxPlot

Ejemplo: Utilizamos los datos de la edad de un colectivo de 20 personas.


36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

1) ORDENAR LOS DATOS


Para calcular los parámetros estadístico, lo primero es ordenar la distribución.
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

2) CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Ing. Alcides Ramos Calcina

Q1=(24 + 25) / 2 = 24,5


Construcción e interpretación de un BoxPlot

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable


que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la
media aritmética de dicho valor y el siguiente:

Me = Q2 = (33 + 34) / 2 = 33,5

Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta:

Q3 = (39 + 39) / 2 = 39
Ing. Alcides Ramos Calcina
Construcción e interpretación de un BoxPlot

3) DIBUJAR LA CAJA Y LOS BIGOTES

 El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


 La primera parte de la caja a (Q1, Q2),
Ing. Alcides Ramos Calcina

 La segunda parte de la caja a (Q2, Q3)


 El bigote de la derecha viene dado por (Q3, Xmáx).
Construcción e interpretación de un BoxPlot

4) INTERPRETACIÓN DEL DIAGRAMA

Podemos obtener abundante información de una distribución a partir de estas representaciones.


Veamos alguna:

 La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre
el 50% y el 75%.
 El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de
los más jóvenes están más concentrados que el 25% de los mayores.
 El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido
en 14,5 años.
Ing. Alcides Ramos Calcina

Seguro que tú podrás obtener más información (¡Utiliza la mediana!)


Comparación de distribuciones

Los diagramas de caja y bigote son muy utilizados para comparar distribuciones.
Se tiene el siguiente ejemplo para comparar las distribuciones de grupos de edades.
A: 35 38 32 28 30 29 27 19 48 40
B: 39 24 24 34 26 41 29 48 28 22
Ing. Alcides Ramos Calcina
Ejemplo 1:
Se estudia la respuesta dinámica en la dirección paralela al viento de construcciones con formas
angulosas durante el paso del Huracán Sandy edificaciones ubicadas en regiones costeras de
Carolina Del Norte en las que pueden suponerse el primer modo o modo fundamental de
vibración como dominante, para esto se realizan mediciones del factor de ráfaga del viento el
cual es función de varios parámetros de entre los cuales el más significativo es la velocidad del
viento. Una muestra representativa de los datos obtenidos es la siguiente:

2.08 1.81 2.14 2.09 2.14 1.67 2.00


1.73 2.35 2.28 1.26 1.42 2.39 1.16
1.26 2.17 1.58 2.45 2.29 1.45 2.08
1.10 1.65 2.33 1.56 1.24 1.68 2.38
2.28 2.04 2.45 2.17 1.87 2.46 2.27

Realizar un análisis de descriptivo para los datos del factor de ráfaga del viento durante el paso
del huracán Sandy, utilice el diagrama de cajas.
Ing. Alcides Ramos Calcina
FINESI Estadística
I Semestre

GRACIAS

En el curso se utilizan exposiciones teóricas breves,


ejercicios prácticos y casos que implican una
solución analítica con software estadístico (SPSS,
MINITAB) y EXCEL, entre otros recursos didácticos.

También podría gustarte