0% encontró este documento útil (0 votos)
37 vistas80 páginas

Estadistica p02

Este documento presenta diferentes métodos para resumir datos cualitativos y cuantitativos de manera gráfica y tabular en estadística descriptiva. Explica distribuciones de frecuencia, frecuencia relativa, frecuencia porcentual, gráficas de barras y gráficas de pastel para resumir datos cualitativos. También incluye un ejemplo detallado sobre calificaciones de calidad de hospedaje para ilustrar estos métodos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
37 vistas80 páginas

Estadistica p02

Este documento presenta diferentes métodos para resumir datos cualitativos y cuantitativos de manera gráfica y tabular en estadística descriptiva. Explica distribuciones de frecuencia, frecuencia relativa, frecuencia porcentual, gráficas de barras y gráficas de pastel para resumir datos cualitativos. También incluye un ejemplo detallado sobre calificaciones de calidad de hospedaje para ilustrar estos métodos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 80

ESTADÍSTICA DESCRIPTIVA:

PRESENTACIONES TABULARES Y GRÁFICAS

ESTADISTICA

Profesor: Francisco Javier Leiva


javier.leiva.silva@gmail.com

versión borrador Slide


1
Estadística Descriptiva: Métodos Gráficos y de Tabulación

 Resumiendo Datos Cualitativos

 Resumiendo Datos Cuantitativos

 Análisis exploratorio de datos (diagrama de tallo y


hojas)

 Tabulaciones cruzadas y diagramas de dispersión

Slide
2
Resumen de datos cualitativos

 Distribución de Frecuencia

 Frecuencia Relativa

 Distribución de Frecuencia Porcentual

 Gráficas de barra

 Gráficas de pastel

Slide
3
Distribución de Frecuencia

 Una distribución de frecuencia es un resumen tabular


de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases
disyuntas (que no se sobreponen).

 El objetivo es entregar una visión más profunda


sobre los datos que no pueden ser obtenido
rápidamente al simplemente mirar los datos
originales.

Slide
4
Ejemplo: “Marada Inn”

Se les pidió a los huéspedes que se alojaron en el


“Marada Inn” que calificaran la calidad de las
instalaciones de la siguiente manera: excelente, sobre el
promedio, promedio, bajo el promedio, o malo.
Las calificaciones entregadas por una muestra de 20
huespedes se muestran a continuación:
bajo el promedio promedio sobre el promedio
sobre el promedio sobre el promedio sobre el promedio
sobre el promedio bajo el promedio bajo el promedio
promedio malo malo
sobre el promedio excelente sobre el promedio
promedio sobre el promedio promedio
sobre el promedio promedio

Slide
5
Ejemplo: “Marada Inn”

 Distribución de Frecuencia

Calificación Frecuencia
malo 2
bajo el promedio 3
promedio 5
sobre el promedio 9
excelente 1
Total 20

Slide
6
Distribución de Frecuencia Relativa

 La frecuencia relativa de una clase es igual a la parte


o proporción de los elementos que pertenecen a cada
clase. En un conjunto de datos, en el que hay n
observaciones, la frecuencia relativa de cada clase se
determina como sigue:

𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒𝑢𝑛𝑎 𝑐𝑙𝑎𝑠𝑒=
𝑛

 Una distribución de frecuencia relativa da un


resumen tabular de datos en el que se muestra la
frecuencia relativa de cada clase

Slide
7
Distribución de Frecuencia Porcentual

 La frecuencia porcentual de una clase es la frecuencia


relativa multiplicada por 100.

 Una distribución de frecuencia porcentual da la


frecuencia porcentual de los datos de cada clase.

Slide
8
Ejemplo: “Marada Inn”

 Distribución de Frecuencia Relativa y Distribución de


Frecuencia Relativa

Frecuencia
Frecuencia
Calificación Relativa
Porcentual (%)
malo 0.10
10
bajo el promedio 0.15
15
promedio 0.25
25
Slide
9
Grafica de Barras

 Un grafico de barra es una herramienta gráfica para


representar los datos cualitativos que han sido
resumidos en una frecuencia, frecuencia relativa, o
distribución de frecuencia porcentual.

 En el eje horizontal anotamos las categorías que


fueron usadas para cada clase.

 Una escala de frecuencia, frecuencia relativa, o


frecuencia porcentual es usada en el eje vertical.

Slide
10
Grafica de Barras

 Se usan barras de un mismo ancho en cada clase, y su


altura corresponde al valor de la escala en cada clase.

 Generalmente las barras van separadas entre ellas


para enfatizar el hecho de que clase es una categoría
diferente

Slide
11
Ejemplo: “Marada Inn”

 Grafico de Barra
9
8
7
Frecuencia

6
5
4
3
2
1
Calificación
io

e
nt
ed

om re
o

om jo

io
io

le
al

pr Sob
om
pr Ba

ce
ed
ed
m

ex
pr

Slide
12
Ejemplo: “Marada Inn”

 Gráfico de Barra incorrecto


0,45
0,40
Frecuencia Relativa

0,35
0,30
0,25
0,20
0,15
0,1
00,05
Calificación
io

e
nt
ed

om re
o

om jo

io
io

le
al

pr Sob
om
pr Ba

ce
ed
ed
m

ex
pr

Slide
13
Gráficas de Pastel

 El gráfico de torta o pastel es una herramienta gráfica


comúnmente usada para representar las
distribuciones de frecuencia relativa para datos
cualitativos.

 Primero dibujamos un círculo, luego usamos las


frecuencias relativas para subdividir el círculo en
sectores que corresponden a la frecuencia relativa
para cada clase.

 Dado que un círculo tiene 360°, una clase con una


frecuencia relativa de 0,25, utilizará 0,25x360 = 90°
del círculo.

Slide
14
Ejemplo: “Marada Inn”

 Gráfico de Pastel

Exc.
malo
5%
10%
Bajo el
promedio
Sobre el
15%
promedio
45%
promedio
25%

Calificación de Calidad

Slide
15
Ejemplo: “Marada Inn”

 Información obtenida a través del anterior gráfico de


pastel:
• La mitad de los huespedes encuestados le dieron
al “Marada Inn” una calificación de “sobre el
promedio” o “excelente” (esto lo vemos en la parte
izquierda del pastel).
• Esto podría ser del agrado del dueño/gerente,
pues significa que la calidad es percibida por la
mitad de las personas mayor que promedio el
rubro.

Slide
16
Ejemplo: “Marada Inn”

 Información obtenida a través del anterior gráfico de


pastel:
• Sin embargo, también vemos que por cada
huésped que dio una calificación de “excelente”,
hay dos clientes que dieron una calificación de
“malo” (mirando la parte de arriba del pastel).
• Esto no sería del agrado del dueño/gerente,
debido a que el alto número de personas
(dentro de la muestra) que dio esta calificación,
posiblemente no se deba a una situación
puntual.

Slide
17
Moda

 La moda de una distribución es el valor de la variable


con mayor frecuencia.
 En el ejemplo del “Marada Inn” la categoría “sobre el
promedio” alcanza un 45% de las preferencias.

 Distribuciones de frecuencias:
• distribuciones unimodales: con una única moda.
• distribuciones bimodales o multimodales: dos o
más valores que alcanzan la máxima frecuencia.

Slide
18
Moda

 En el gráfico de barras del ejemplo del “Marada Inn”


se puede ver fácilmente la moda.
9
8
7
Frecuencia

6
5
4
3
2
1
Calificación
o

e
i

nt
ed

om re
o

om jo

io
io

le
al

pr Sob
om
pr Ba

ce
ed
ed
m

ex
pr

Slide
19
Moda

 De la misma forma, podemos tener otros casos, en el


que exista más de una moda. El caso de una
distribución bimodal, podría verse de la siguiente
forma:
9
8
7
6
Frecuencia

5
4
3
2
1
Clase
A B C D E
Slide
20
Mediana

 Característica de la distribución que ocupa la posición


central de la misma.

 La mediana define aquel punto que deja por debajo


de sí mismo el 50% de la distribución.

 Variables cualitativas ordinales ordenadas de menor


a mayor.

Slide
21
Resumen de datos cuantitativos

 Distribución de Frecuencia

 Distribuciones de frecuencia relativa y de frecuencia


porcentual

 Gráficos de puntos

 Histograma

 Distribuciones Acumuladas

 Ojivas

Slide
22
Ejemplo: Taller de Reparación

 El dueño de un taller de reparación quiere tener un


mejor entendimiento de los costos de los repuestos
usados en la reparación de motores.
 Así que examina los resultados de 50 clientes. Los
costos de los repuestos están expresados en la
siguiente tabla:
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 109 80
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

Slide
23
Distribución de Frecuencia

 Guías típicas para elegir el número de clases:


• Usar entre 5 a 20 clases.

• Los sets de datos con un gran número de


elementos, generalmente, van a requerir un gran
número de clases, y viceversa.

• A pesar de lo anterior, siempre es más importante


tener presente los datos que tengamos a
disposición y de la pregunta que queremos
responder.

Slide
24
Distribución de Frecuencia

 Guías típicas para elegir el ancho de las clases:


• Usar clases de un mismo ancho.

• Ancho aproximado de clase:


𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 ( 𝑒𝑛𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠)
𝐴𝑛𝑐h𝑜 𝑎𝑝𝑟𝑜𝑥 . 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒=
𝑁 ú 𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

• Al igual que para el número de clase, para el


ancho también se debe tener muy presente tanto
los datos disponibles como la pregunta a
responder.

Slide
25
Distribución de Frecuencia

 Límites de cada clase:


• Los límites de clase deben elegirse de manera que
cada dato pertenezca a una y sólo una de las
clases.
• El límite de clase inferior indica el menor valor
de los datos a que pertenece esa clase.
• El límite de clase superior indica el mayor valor
de los datos a que pertenece esa clase.

Slide
26
Distribución de Frecuencia

 Punto medio de cada clase:


• En algunas aplicaciones se desea conocer el punto
medio de las clases de una distribución de
frecuencia de datos cuantitativos.
• El punto medio de clase es el valor que queda a la
mitad entre el límite inferior y el límite superior de
la clase.

Slide
27
Ejemplo: Taller de Reparación

 Distribución de Frecuencia
Si escogemos seis clases:
Ancho aprox. por clase = (109 - 52)/6 = 9.5 10
Costo ($) Frequencia
50-59 2
60-69 13
70-79 16
80-89 7
90-99 7
100-109 5
Total 50

Slide
28
Dist. de frecuencia rel. y de frecuencia porcent.

 Distribuciones de frecuencia relativa y de frecuencia


porcentual: (se definen igual que para datos
cualitativos)
• La frecuencia relativa es el cociente, respecto al
total de observaciones, de las observaciones que
pertenecen a una clase. Si el número de
observaciones es n:
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎𝑐𝑙𝑎𝑠𝑒
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒𝑙𝑎 𝑐𝑙𝑎𝑠𝑒=
𝑛

• La frecuencia porcentual de una clase es la


frecuencia relativa multiplicada por 100.

Slide
29
Ejemplo: Taller de Reparación

 Distribuciones de frecuencia relativa y de frecuencia


porcentual

Frecuencia Frecuencia
Costo ($) Relativa Porcentual (%)
50-59 0,04 4
60-69 0,26 26
70-79 0,32 32
80-89 0,14 14
90-99 0,14 14
100-109 0,10 10
Total 1,00 100

Slide
30
Ejemplo: Taller de Reparación

 Información obtenida a través de la Distribución de


Frecuencia Porcentual
• Solo el 4% de los costos están en la clase de $50-59.

• 30% de los costos se encuentran bajo $70.

• El porcentaje más grande (32%, casi un tercio) de


los costos se encuentran en la clase de $70-79.

• 10% de los costos están en la clase de $100 o más.

Slide
31
Gráficos de Puntos

 Uno de los resúmenes de datos más simples es un


gráfico de puntos.

 En el eje horizontal se muestra los valores del rango


de datos

 Luego el valor de cada dato es representado por un


punto anotado sobre el eje.

Slide
32
Ejemplo: “Taller de Reparación”

 Gráfico de puntos

... .... .. ... ... .. .


. . . ..... .......... .. . .. . . ... . .. .
50 60 70 80 90 100 110

Costo ($)

Slide
33
Histograma

 Otra representación típica para datos cuantitativos es


un histograma.

 La variable de interés se anota en el eje horizontal, y


la frecuencia, frecuencia relativa, o frecuencia
porcentual se anota en el eje vertical.

 Se dibuja un rectángulo sobre cada clase, con un alto


correspondiendo, ya sea a la, frecuencia, frecuencia
relativa o frecuencia porcentual de esa clase.

 A diferencia de un gráfico de barras, un histograma


no tiene separación entre los rectángulos de clases
adyacentes. Slide
34
Ejemplo: “Taller de Reparación”

 Histograma
18
16
14
Frecuencia

12
10
8
6
4
2
Costo ($)
50 60 70 80 90 100 110

Slide
35
Histograma

 Histogramas con distinto tipo de sesgo.

Slide
36
Histograma

 Consideraciones:
• Una gráfica de barras y un histograma son en
esencia lo mismo; ambas son representaciones
gráficas de una distribución de frecuencia. Un
histograma es sólo una gráfica de barras sin
separación entre las barras. Para algunos datos
cuantitativos discretos, también se puede tener
separación entre las barras.

• Los valores adecuados para los límites de clase


cuando se tienen datos cuantitativos depende del
nivel de precisión de los datos.

Slide
37
Histograma

 Consideraciones:
• Una clase abierta sólo necesita el límite inferior de
la clase o el límite superior de la clase. Por
ejemplo, podría haber simplificado la distribución
de frecuencia mediante una clase abierta de “35 o
más”.

• En una distribución de frecuencia acumulada, la


última frecuencia siempre es igual al número total
de observaciones. En una distribución de
frecuencia relativa acumulada la última frecuencia
siempre es igual a 1,00 y en una distribución de
frecuencia porcentual acumulada la última
frecuencia es siempre 100.
Slide
38
Distribución Acumulada

 La distribución de frecuencia acumulada muestra el


número de items con los valores menores o iguales all
límite superior de cada clase.

 La distribución de frecuencia relativa acumulada


muestra la proporción de los items con los valores
menores o iguales al límite superior de cada clase.

 La distribución de frecuencia porcentual acumulada


muestra el porcentaje de items con los valores
menores o iguales al límite superior de cada clase.

Slide
39
Ejemplo: “Taller de Reparación”

 Distribuciones Acumuladas
Frecuencia Frecuencia
Frecuencia Relativa Porcentual
Costo ($) Acumulada Acumulada Acumulada(%)
< 59 2 .04 4
< 69 15 .30 30
< 79 31 .62 62
< 89 38 .76 76
< 99 45 .90 90
< 109 50 1.00 100

Slide
40
Ojiva

 Una ojiva es un gráfico de una distribución


acumulada.

 Los valores de los datos se anotan en el eje


horizontal.

 En el eje vertical se anotan: la frecuencia acumulada,


la frecuencia relativa acumulada o la frecuencia
porcentual acumulada.

Slide
41
Ojiva

 La frecuencia (cualquiera de las antes mencionadas)


acumulada de cada clase se anota como un punto en
el gráfico.

 Finalmente los puntos se unen con una línea.

Slide
42
Ejemplo: “Taller de Reparación”

 Ojiva:
• Debido a que los límites de las clases de los costos
de las partes son 50-59, 60-69, etc. existe una
unidad entre cada clase (por ejemplo, entre 59 y
60).

• La discontinuidad es eliminada anotando los


puntos entre medio de los límites de las clases.

Slide
43
Ejemplo: “Taller de Reparación”

 Ojiva:
• Así, podemos usar el 59,5 para la clase 50-59;
usamos el 69,5 para la clase 60-69, y así
sucesivamente…

• En caso de que las diferencias entre clase sean


mucho menores, podemos utilizar para anotar una
clase, el valor del límite inferior de la clase que
sigue menos un número muy pequeño (épsilon).

Slide
44
Ejemplo: “Taller de Reparación”

 Ojiva con la Frecuencia Porcentual Acumulada


Frecuencia Porcentual Acumulada

100

80

60

40

20

Costo ($)
50 60 70 80 90 100 110

Slide
45
Análisis exploratorio de datos

 Las técnicas del análisis exploratorio de datos


emplean aritmética sencilla y gráficas fáciles de
dibujar útiles para resumir datos.

 La técnica conocida como diagrama de tallo y hojas


muestra en forma simultánea el orden jerárquico y la
forma de un conjunto de datos.

Slide
46
El Diagrama de Tallo y Hojas

 La técnica conocida como diagrama de tallo y hojas


muestra en forma simultánea el orden jerárquico y la
forma de un conjunto de datos.

 Es similar a un histograma, pero tiene la ventaja de


mostrar los valores de los datos al mismo tiempo.

Slide
47
El Diagrama de Tallo y Hojas

 Los primeros dígitos de cada item se anotan a la


izquierda de una línea vertical.

 A la derecha de esa línea se anotan el último digito


para cada item siguiendo su orden jerárquico.

 A cada línea anotada se le llama tallo.

 Cada digito en un tallo es llamado hoja.

Slide
48
Ejemplo: “Taller de Reparación”

 Diagrama de Tallo y Hojas

5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9

• Si encerramos en un rectángulo cada tallo,


observamos lo siguiente…

Slide
49
Ejemplo: “Taller de Reparación”

 Diagrama de Tallo y Hojas

5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9

• Como los tallos representan el histograma para los


mismos datos…

Slide
50
Ejemplo: “Taller de Reparación”

 Diagrama de Tallo y Hojas

5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 918
16
10 1 4 5 5 9 14

Frecuencia 12
10
• Como los tallos representan el histograma para los
8

mismos datos… 6
4
2
Costo ($)
50 60 70 80 90 100
110
Slide
51
Diagrama de Tallo y Hojas “Estirado”

 Si creemos que el diagrama original de tallos y hojas


a condensado demasiado los datos, podemos estirar
el diagrama usando dos o mas tallos para una mismo
tallo en el original.

 Siempre que un tallo este anotado dos veces (por


ejemplo), si el primer valores corresponde a hojas con
valores 0-4 (por ejemplo), las hojas del segundo tallo
corresponderán a valores 5-9 (siguiendo el mismo
ejemplo).

Slide
52
Ejemplo: “Taller de Reparación”

 Diagrama de Tallo y Hojas Estirado


5 2
5 7
6 2 2 2 2
6 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4
7 5 5 5 6 7 8 9 9 9
8 0 0 2 3
8 5 8 9
9 1 3
9 7 7 7 8 9
10 1 4
10 5 5 9

Slide
53
El Diagrama de Tallo y Hojas

 Unidad de las Hojas


• Un solo dígito es usado para definir cada hoja.

• En el ejemplo anterior el dígito fue la unidad.

• Pero puede ser 100, 10, 1, 0,1 etc. (centenas,


decenas, unidades, decimas, etc.)

• Siempre y cuando no se indique, se asuma que el


valor de la hoja es igual a 1 (es decir, la unidad).

Slide
54
Ejemplo: Unidad de la Hoja = 0,1

Si tenemos datos con valores como:


8,6 11,7 9,4 9,1 10,2 11,0 8,8
Un diagrama de tallos y hojas de estos datos sería:

Unidad de la Hoja = 0,1


8 6 8
9 1 4
10 2
11 0 7

Slide
55
Ejemplo: Unidad de la Hoja = 10

Si tenemos datos con valores como:


1806 1717 1974 1791 1682 1910 1838
Un diagrama de tallos y hojas de estos datos sería:

Unidad de la Hoja = 10
16 8
17 1 9
18 0 3
19 1 7

Slide
56
El Diagrama de Tallo y Hojas

 Ventajas:
• El diagrama de tallo y hojas es más fácil de
construir a mano.

• En cada intervalo de clase proporciona más


información que un histograma debido a que el
tallo y la hoja proporcionan el dato.

Slide
57
Tabulaciones cruzadas y diagramas de dispersión

 Hasta el momento hemos visto métodos que se usan


para resumir los datos una variable a la vez.

 A veces el receptor de la información puede estar


interesado en algún método de tabulación o grafico
que ayuda a entender la relación entre dos variables.

 Las tabulación Cruzadas y los diagramas de


dispersión son dos métodos para resumir los datos
para dos (o más) variables simultáneamente.

Slide
58
Tabulaciones cruzadas

 La Tabulación cruzada es un método de tabulación


para resumir los datos para dos o más variables de
forma simultánea.

 Ésta se puede usar cuando:


• Una variable es cualitativa y otra es cuantitativa
• Las dos variables son cualitativas
• Las dos variables son cuantitativas

 A la izquierda y arriba de los márgenes se anotan las


clases para las dos variables.

Slide
59
Ejemplo: Viviendas en “Twin Peaks”

 Tabulación cruzada
A continuación se muestra el número de viviendas
vendidas en “Twin Peaks” para cada estilo y precio
en los últimos dos años:
Rango Estilo de Vivienda
Precio Colonial Rancho Mixto Urbano Total
< $99.000 18 6 19 12 55
> $99.000 12 14 16 3 45
Total 30 20 35 15 100

Slide
60
Ejemplo: Viviendas en “Twin Peaks”

 Información obtenida por la tabulación cruzada


anterior:
• El número de viviendas más grande en la muestra
(19) pertenece a casas del tipo “Mixto” y con un
precio menor o igual que $99.000.

• Solo 3 viviendas en la muestra pertenece a la


categoría “Urbano” y con un precio de más de
$99.000.

Slide
61
Tabulación cruzada: Porcentajes en filas o columnas

 Convertir los valores de una tabla (ya sean filas o


columnas) en porcentajes puede proveer información
adicional sobre la relación entre dos variables.

Slide
62
Ejemplo: Viviendas en “Twin Peaks”

 Filas en Porcentaje

Rango Estilo de Vivienda

Precio Colonial Rancho Mixta Urbano Total


< $99.000 32,73 10,91 34,55 21,82 100
> $99.000 26,67 31,11 35,56 6,67 100

Nota: los totales en cada fila es en verdad 100.01 pero


debido únicamente a las aproximaciones.

Slide
63
Ejemplo: Viviendas en “Twin Peaks”

 Columnas en Porcentaje

Rango Estilo de Vivienda


Precio Colonial Rancho Mixta Urbano
< $99.000 60,00 30,00 54,29 80,00
> $99.000 40,00 70,00 45,71 20,00
Total 100 100 100 100

Slide
64
Paradoja de Simpson

 Paradoja (definición):
• Hecho o expresión aparentemente contrarios a la
lógica.
• Empleo de expresiones o frases que encierran una
aparente contradicción entre sí, como en: “mira al
avaro, en sus riquezas, pobre”.

Slide
65
Paradoja de Simpson

 Es posible combinar o agregar los datos de dos o más


tabulaciones cruzadas para obtener una tabulación
cruzada resumida que muestre la relación entre dos
variables.

 En tales casos hay que tener mucho cuidado al sacar


conclusiones acerca de la relación entre las dos
variables de la tabulación cruzada agregada.

 En algunos casos las conclusiones obtenidas de la


tabulación cruzada agregada se invierten por
completo al observar los datos no agregados,
situación conocida como paradoja de Simpson.

Slide
66
Paradoja de Simpson: Ejemplo Luckett y Kendall

 Supongamos que hemos preparado dos tabulaciones


cruzadas que muestra la cantidad (y porcentaje) de
las sentencias de tribunales de primera instancia y
municipales, ratificadas y revocadas en una corte de
apelaciones, una para el juez Luckett y otra para el
juez Kendall.

Juez Luckett Juez Kendall


Tribunal de Tribunal Tribunal de Tribunal
Sentencia primera instancia municipal Total Sentencia primera instancia municipal Total
Ratificada 29 (91%) 100 (85%) 129 Ratificada 90 (90%) 20 (80%) 110
Revocada 3 (9%) 18 (15%) 21 Revocada 10 (10%) 5 (20%) 15
Total (%) 32 (100%) 118 (100%) 150 Total (%) 100 (100%) 25 (100%) 125

Slide
67
Paradoja de Simpson: Ejemplo Luckett y Kendall

 Sin embargo, en este caso, si quisiéramos agregar los


datos de tribunal de primera instancia y municipal, y
construir una sola a tabulación cruzada que contenga
la información para ambos jueces…

Juez

Sentencia Luckett Kendall Total


Ratificada 129 (86%) 110 (88%) 239
Revocada 21 (14%) 15 (12%) 36
Total (%) 150 (100%) 125 (100%) 275

Slide
68
Paradoja de Simpson: Ejemplo Luckett y Kendall

 Según lo que nos muestra esta tabla anterior, el Juez


Kendall tiene un porcentaje mayor de sus sentencias
ratificadas (88% vs. 86%), pero si analizamos los
resultados de tribunal de primera instancia y
municipal, era el juez Luckett quien tenia mejor
rendimiento (91% vs. 90% en tribunales de primera
instancia y 85% vs. 80% en tribunales municipales)
dándose así una paradoja.

• Esto se debe a la diferencia considerable entre las


cantidades entre tribunal de primera instancia vs.
tribunal municipal.

Slide
69
Diagramas de Dispersión

 Un diagrama de dispersión es una presentación


gráfica sobre la relación de dos variables
cuantitativas.

 Una variable es anotada en el eje horizontal y otra


variable es anotada en el eje vertical.

 El patrón general de los puntos nos sugiere, de forma


no necesariamente causal, la relación total entre las
variables.

Slide
70
Diagramas de Dispersión

 Una relación positiva

Slide
71
Diagramas de Dispersión

 Una relación negativa

Slide
72
Diagramas de Dispersión

 Sin aparente relación

Slide
73
Ejemplo: “Chile en Copa América 2015”

 Diagrama de Dispersión:
Suponga que queremos conocer la relación que existe
entre la “posesión del balón” y la cantidad de goles
anotados”, para lo cuál utilizaremos el rendimiento
de la selección chilena en la Copa América 2015:

y = Posesión (%) x = Goles


59 2
53 3
57 5
77 1
61 2
52 0

Slide
74
Ejemplo: “Chile en Copa América 2015”

 Diagrama de Dispersión:
y
80
Posesión del Balón (%)

75
70
65
60
55
50
x
0 1 2 3 4 5
Cantidad de Goles
Slide
75
Ejemplo: “Chile en Copa América 2015”

 El diagrama de dispersión anterior indica una


relación ligeramente negativa entre la cantidad de
goles y el porcentaje de la posesión del balón.

 La relación no es perfecta; todos los puntos en el


diagrama de dispersión no están en una sola línea
recta.

 Sin embargo, no podemos sacar una conclusión


apresurada, pues para ello necesitamos tener mayor
información.

Slide
76
Línea de Tendencia

 En los diagramas de dispersión se puede graficar una


línea de tendencia.
• Se pueden ver varios tipos de líneas de tendencia,
como por ejemplo, de tendencia lineal (línea
recta), de tendencia logarítmica, exponencial, etc.

 Esta línea es la que mejor ajusta los datos según su


característica (lineal, logarítmica, exponencial, etc.).

 Esta línea no se encuentra “al ojo” sino que existe un


proceso formal para obtenerla, sin embargo, a rasgos
generales uno puede deducir, aproximadamente,
dónde debería ubicarse.
Slide
77
Línea de Tendencia

 La siguiente línea de tendencia muestra que tuvo


para los alumnos del curso de Organización
Industrial su asistencia a clases durante el semestre y
la nota final obtenida:
6

4
Nota Final

0
0 0,2 0,4 0,6 0,8 1
Asistencia

Slide
78
Resumen de los procedimientos gráficos y tabulares

Datos
Datos Cualitativos Datos Cuantitativos

Métodos Métodos Métodos Métodos


Tabulares Gráficos Tabulares Gráficos

• Distribución • Gráficas • Distribución • Gráfico de


de Frecuencia de barras de Frecuencia Puntos
• Distribución • Gráficas • Dist. de Frec. • Histograma
de Frecuencia de pastel Relativa • Ojivas
Relativa • Dist. Frec. Acum. • Diagrama
• Distribución • Dist. Frec. de dispersión
de Frecuencia Relativa Acum.
Porcentual • Diagrama de
• Tabulación Tallos y Hojas
Cruzada • Tabulación Cruzada
Slide
79
Referencias

 Estadística para la Administración y Economía.


David Anderson, Dennis Sweeney & Thomas
Williams. 10ma edición. CENGAGE Learning.
Capítulo 2: Estadística Descriptiva: Presentaciones
Tabulares y Gráficas.

Slide
80

También podría gustarte