Tema 2 Diapositivas

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

TEMA 2:

DISTRIBUCIONES DE
FRCUENCIAS
Estadística Descriptiva
Juan A. Núñez-Serrano
1. Distribuciones de frecuencias
2. Variables con datos agrupados
3. Representaciones gráficas
a) Variables cualitativas:
➢ Diagramas sectoriales
➢ Pictogramas
b) Variables cuantitativas discretas:
➢ Diagrama de barras
➢ Diagrama en escalera (acumulado)
c) Variables cuantitativas continuas:
➢ Histograma. Densidad de frecuencias
➢ Polígono de frecuencias (acumulado)
¿Para que?

Los datos “brutos” no siempre son útiles, se debe realizar una


presentación de los mismos.
❑ Por ejemplo, cuando tenemos los datos es muy habitual
encontrarnos con lo siguiente:
• Edad de los alumnos: 19, 18, 18, 17, 20, 20, 19, 18, 17, 19, 18, 22, 24, 18.
• Sexo de los alumnos: H, H, M, M, H, M, H, H, M, H, M, M, H, M.

❑ Esto no nos sirve de mucho. Necesitamos ordenarlos, resumirlos y


explicarlos. Para esto sirve la Estadística Descriptiva.

❑ ¿Cómo ordenamos esta información? Con las tablas de


frecuencias y los gráficos.
Pasos a seguir

Llamamos distribución de frecuencias a una tabla donde se ordenan los datos de una
variable. En esa tabla se expone la información recogida en la muestra, de forma que
no se pierda nada de información (o poca).
¿Cómo se hace una tabla de frecuencias?:
1. Ordenar los valores que toma la variable estadística que se analiza ( de los datos) en
orden creciente. ( Ejemplo: salarios pizarra)
2. Identificar el número de valores diferentes que toma la variable de estudio.
3. Contar el número de veces que en la muestra se repite cada valor ( de los datos).
(Frecuencia)
4. Construcción de una tabla con los valores posibles de la variable y su frecuencia de
aparición.

Sea una muestra de tamaño N de una variable estadística X que toma k valores distintos

{xi}, i = 1, … , k → {x1, x2, …,xk}


• Si todos los datos son distintos entre entonces k es igual a….
• Si hay valores repetidos, k es menor que…
Pasos a seguir

Sea una muestra de tamaño N de una


variable estadística X que toma k
valores distintos
{xi}, i = 1, … , k → {x1, x2, …,xk}
• Si todos los datos son distintos entre sí,
N = k.
• Si hay valores repetidos, k < N.
Tablas de frecuencia y
representaciones gráficas

¡ Diferencia entre N y k ! (ejemplo sexo de los alumnos) Cuando la variable es


cualitativa… también se ordena
•Nuestros datos: H, H, M, M, H, M, H, H, M, H, M, M, H, M.
•Valores: H , M → k=2
•Frecuencias: 7, 7 → N=14
Género (xi) Frec. 8
7
(ni) 6
5
4
Hombre 7 3
2
1

Mujer 7 0
Hom bre Mujer

Las tablas de frecuencias y las representaciones gráficas son dos maneras


equivalentes de presentar la información, exponiendo ordenadamente la
información recogida en una muestra.
Tablas de frecuencias:
absolutas y relativas

❑ Frecuencias absolutas (ni): Es el número, ni , de veces que se


k
repite xi. ( Número de elementos de un colectivo cuyo valor es xi. )
n
i =1
i =N
( Pag 5 Tabla con notación estadística) Pero… (Medir es comparar…)
Frecuencias relativas es el cociente entre la frecuencia absoluta
(cada ni ) y N. Da una medida relativa al tamaño muestral k
n
necesario para comparar diferentes colectivos. fi = i ,  fi = 1
N i =1
( pag 6 tabla ejemplo) Pero… en algunos estudios es necesario responder a preguntas como
numero de individuos con un valor menor o igual a o mayor o igual a…

❑ Frecuencias acumuladas: i

• Frecuencia absoluta acumulada (Ni): es la suma de las


Ni = n
j =1
j

frecuencias absolutas de los valores inferiores o iguales a xi.

• Frecuencia relativa acumulada (Fi): son el cociente entre Ni


Fi =
frecuencia absoluta acumulada y número total de datos. También, N
es la suma de frecuencias relativas de los valores inferiores a xi.
Tablas de frecuencias:
variable discreta

Se llama tabla de frecuencias o distribución de frecuencias de


una variable discreta a una tabla donde aparecen los
distintos valores de la variable ordenados de menor a mayor
y las distintas frecuencias.

xi ni fi Ni Fi
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
... ... ... ... ...
... ... ... ... ...
... ... ... ... ...
xk nk fk Nk Fk
Tablas de frecuencias:
variable discreta

Ejemplo: Se han tomado las edades de 20 alumnos y se han obtenido los siguientes datos:
18, 20, 22, 19, 18, 20, 18, 19, 21, 20 ,20, 21, 18, 20 21, 19, 20, 21, 18, 20

•Delimite la población, la variable y los valores observados.


•Construya la tabla de frecuencias
•¿Cuántos alumnos tienen 20 años?
•¿Cuántos alumnos tienen 20 años o menos?
•¿Cuál es el % de alumnos que tienen 19 años? ¿y 21 años o más?
Tablas de frecuencias:
variable discreta

Ejemplo: Se han tomado las edades de 20 alumnos y se han obtenido los siguientes datos:
18, 20, 22, 19, 18, 20, 18, 19, 21, 20 ,20, 21, 18, 20 21, 19, 20, 21, 18, 20

•Delimite la población, la variable y los valores observados. •Alumnos, edad


•Construya la tabla de frecuencias
•¿Cuántos alumnos tienen 20 años? •7
•¿Cuántos alumnos tienen 20 años o menos? •15
•¿Cuál es el % de alumnos que tienen 19 años? ¿y 21 años o más? •15%, 25%

edad ni fi Ni Fi
18 5 0,25 5 0,25
19 3 0,15 8 0,4
20 7 0,35 15 0,75
21 4 0,2 19 0,95
22 1 0,05 20 1
Total 20 1
Tablas de frecuencias:
variable discreta
 Ejemplo: Se ha preguntado a una
población de 1509 personas por el número
de hijos. Completar la tabla de
frecuencias y responder a las preguntas: 𝑥𝑖 𝑛𝑖

 ¿Cuántos individuos tienen n0i 419


menos de 2 hijos? (En número y en 1 255
porcentaje)

2 375

 ¿Qué porcentaje de 3 215


individuos tiene 6 hijos o
menos? 4 127

5 54
 ¿Qué cantidad de hijos es
tal que al menos el 50% de 7 23

la población tiene una ocho o más 17


cantidad inferior o igual?
Total 1509
Tablas de frecuencias:
variable discreta
Ejemplo:
 ¿Cuántos individuos tienen Número de hijos
menos de 2 hijos?
 frec. indiv. sin hijos xi ni fi
Porcent.
Fi
Porcent.
+ Frec. (válido) acum.
frec. indiv. con 1 hijo 0 419 27,8 27,8
= 419 + 255 1 255 16,9 44,7
= 674 individuos= (44,7%
aprox) 2 375 24,9 69,5
3 215 14,2 83,8
 ¿Qué porcentaje de 4 127 8,4 92,2
individuos tiene 6 hijos o 5 54 3,6 95,8
menos? 6 24 1,6 97,3
 97,3%
7 23 1,5 98,9
Ocho+ 17 1,1 100,0
 ¿Qué cantidad de hijos es
tal que al menos el 50% de Total 1509 100,0
la población tiene una
cantidad inferior o igual?
Las tablas anteriores son útiles para presentar la información de una variable
cuando:

• La variable es discreta o hay pocas observaciones.


• Hay muchas observaciones de una variable pero toma pocos valores
distintos.

Si el número de valores distintos que toma la variable es grande, los datos se


agrupan en intervalos para construir la tabla de frecuencias. Esto es muy
habitual cuando las variables son continuas y las llamaremos VARIABLES
AGRUPADAS.
Pasos a seguir

¿Cómo se hace la tabla de frecuencias de variables agrupadas?:


1. Ordenar los datos en forma creciente.
2. Para agrupar los datos en intervalos se debe determinar el recorrido:
Re= xmax- xmin.
Y se debe fijar el número de intervalos (k) -entre 5 y 15, o
1+3,3·logN (Sturges)-.
Re
C=
3. Delimitar la amplitud de un intervalo (C). k
Así, las amplitudes de los intervalos (Ci) son la diferencia entre los
extremos superior e inferior del intervalo: Ci=Li-Li-1. Las amplitudes
puede ser constante o variable.
Li −1 + Li
4. La marca de clase (xi) es el valor que representa al intervalo. xi =
2
5. Contar el número de observaciones en cada clase.
6. Construcción de la tabla.
Tablas de frecuencias:
variable agrupada

Se llama tabla de frecuencias o distribución de frecuencias de una


variable agrupada en intervalos de clase a una tabla donde aparecen
los distintos intervalos ordenados de menor a mayor y las distintas
frecuencias. Su estructura será, por tanto, la siguiente:

Li-1-Li xi (marca clase) ni fi Ni Fi


L0-L1 x1 n1 f1 N1 F1
L1-L2 x2 n2 f2 N2 F2
... ... ... ... ... ...
... ... ... ... ... ...
... ... ... ... ... ...
Lk-1-Lk xk nk fk Nk Fk
Tablas de frecuencias:
variable agrupada

Ejemplo: Datos de duración de bombillas de 60 watios, expresados en número de horas


que una bombilla ha lucido antes de fundirse. Hacer tabla de frecuencias.
Tablas de frecuencias:
variable agrupada

Ejemplo:
• El recorrido Re=1198,2-810,1=388,1
• El número de clase k(intervalos)=1+3,3·log100=7 o
• La amplitud del intervalo C=388,1/8=48,512
• Se toman 8 intervalos con una amplitud constante de 50 horas.
• Se elige como límite inferior 800 horas.
Tablas de frecuencias:
variable agrupada

Ejemplo:
• El recorrido Re=1198,2-810,1=388,1
• El número de clase k(intervalos)=1+3,3·log100=7 o
• La amplitud del intervalo C=388,1/8=48,512
• Se toman 8 intervalos con una amplitud constante de 50 horas.
• Se elige como límite inferior 800 horas.

Intervalos de Frec. Absoluta Frec. Relativa


Marcas de clase Frec. Absoluta Frec. Relativa
Clase Acumulada Acumulada
xi ni fi
(Li-1-Li) Ni Fi
(800,850] 825 3 0,03 3 0,03
(850,900] 875 5 0,05 8 0,08
(900,950] 925 7 0,07 15 0,15
(950,1000] 975 12 0,12 27 0,27
(1000,1050] 1025 16 0,16 43 0,43
(1050,1100] 1075 28 0,28 71 0,71
(1100,1150] 1125 24 0,24 95 0,95
(1150,1200] 1175 5 0,05 100 1
Total 100 1
Gráficos para variables
cualitativas

30
❑ Diagramas de barra: 25

• Alturas proporcionales a las frecuencias 20


15
(abs. o rel.). 10
5
• Se pueden aplicar también a variables 0
cuantitativas discretas. Negros Marrones Verdes Azules

❑ Diagramas de sectores: 18%


• No usarlo con variables ordinales. 9%
27%

• El área de cada sector es proporcional a


su frecuencia (abs. o rel.). 46%
❑ Pictogramas:
• Fáciles de entender.
• El pictograma se debe corresponder con
la variable a analizar en cuestión
• El área de cada modalidad debe ser
proporcional a la frecuencia.
Gráficos para variables
agrupadas

❑ Pirámide de población: ❑ Pictograma:

❑ Cartograma:
Gráficos para variables
cuantitativas
419

Son diferentes en función de que las variables sean discretas o 40 0 375

continuas. Valen con frecuencias absolutas o relativas.


30 0

❑ Diagramas barras para variables


255

Recuento
215

discretas o cualitativas : 20 0

• Se deja un hueco entre barras para indicar 127

los valores que no son posibles. Frecuencia absoluta(ni) 10 0

o relativa (fi) 54
24 23 17

Valor de la variable (xi)


❑ Histogramas para variables continuas:
0 1 2 3 4 5 6 7 Ocho o más

Número de hijos

• El área que hay bajo el histograma entre


dos puntos cualesquiera indica la cantidad
25 0

(porcentaje o frecuencia) de individuos en el 20 0

intervalo.
• La amplitud del intervalo puede ser

Recuento
15 0

constante o variable. El Histograma se


calcula de forma distinta en función de 10 0

ésto.
• Amplitud distinta: Se calcula la altura del
50

intervalo (di). ni Altura del intervalo (di) o


di = frecuencia absoluta (ni)
20 40 60 80

ci Edad del encuestado


Valor de la variable (xi)
Gráficos para variables
cuantitativas

Ejemplo: longitudes de lanzamiento de peso en una competición (metros).


15,2 15,7 15,9 16 16,2 16,4
15,4 15,7 15,9 16 16,3 16,6
15,6 15,8 15,9 16 16,3 16,8
15,6 15,8 15,9 16,1 16,3 16,8
15,6 15,8 16 16,2 16,4 16,9

Intervalos de amplitud variables


Clase Amplitud Marca clase Frec. Absta. di
(15,0 - 15,4] 0,4 15,2 2 5 El histograma no representa bien
(15,4 - 15,8] 0,4 15,6 8 20 la situación, las áreas no son
(15,8 - 16,0] 0,2 15,9 8 40
proporcionales a la frecuencia.
(16,0 - 16,4] 0,4 16,2 8 20
(16,4 - 17,0] 0,6 16,7 4 6.7

¡Mejor así!
Las áreas son proporcionales a la
frecuencia y entonces las alturas son:
ni
di =
ci
Gráficos para variables
cuantitativas

Cada uno de los anteriores diagramas tiene su correspondiente diagrama


integral o acumulado. Se realizan a partir de las frecuencias acumuladas.
Indican, para cada valor de la variable, la cantidad (frecuencia) de
individuos que poseen un valor inferior o igual al mismo.
V. Discretas V. Continuas

Ni o Fi

T1 Diagrama de
escalera
fi
Polígono de
frecuencias
www.malaprensa.com

19 de diciembre de 2013 (Abc y El mundo)

• Intentan colarnos
que las subidas de
la luz de este año
no son para tanto,
comparando
variaciones cada
dos tres meses con
otras anuales.
• El incremento de
2013 era del 3,5.
www.malaprensa.com

Importancia por Temas en el discurso de investidura de Pedro Sanchez

• Intentan colarnos
que las subidas de
la luz de este año
no son para tanto,
comparando
variaciones cada
dos tres meses con
otras anuales.
• El incremento de
2013 era del 3,5.
www.malaprensa.com

14 de Octubre de 2013 (Expansión)

• Miren las cifras y


el tamaño de los
círculos.
• No guardan la
proporción ni las
superficies ni los
diámetros.
• Es pura invención.
www.malaprensa.com

25 de Mayo de 2013 (Eldiario.es)


Actualización 29 de mayo:

• Este mapa es total y estrictamente inútil para entender qué zonas del país son más o
menos propensas a la violencia de genero.
• Claro, donde vive más gente, hay más muertes que donde vive menos gente.
• Es la falacia de las comparaciones en valores absolutos, que cuando se hace entre
territorios con poblaciones muy diferentes es inútil. Es necesario relativizarlo.
www.malaprensa.com

15 de abril de 2013 (Televisión venezolana)

• Fabuloso ejemplo de gráfico truncado.


• Pero vamos, seguro que ha sido un error no intencionado, jeje.
www.malaprensa.com

16 de marzo de 2013 (El confidencial)

• Por ejemplo, Andalucía: el


círculo rojo representa
15.857 ejecuciones, y el
círculo azul 81.372 (5,13
veces más). ¿Os parece que
el círculo azul de Andalucía
es cinco veces mayor que el
círculo rojo?

• En realidad es unas 25
veces mayor.
www.malaprensa.com

16 de marzo de 2013 (El Abc)

• Las barras del gráfico superior


guardan una proporción razonable
entre sí, pero las del gráfico inferior
son completamente no
proporcionales.

• Los dos gráficos son iguales, en el


segundo han cambiado valores y
colores.
www.malaprensa.com
www.malaprensa.com

16 de marzo de 2013 (El Abc)

• Las barras del gráfico superior


guardan una proporción razonable
entre sí, pero las del gráfico inferior
son completamente no
proporcionales.

• Los dos gráficos son iguales, en el


segundo han cambiado valores y
colores.
www.malaprensa.com

16 de marzo de 2013 (El Abc)

• Las barras del gráfico superior


guardan una proporción razonable
entre sí, pero las del gráfico inferior
son completamente no
proporcionales.

• Los dos gráficos son iguales, en el


segundo han cambiado valores y
colores.

También podría gustarte