ORGANIZACIÓN DE DATOS - Variable Cualitativa
ORGANIZACIÓN DE DATOS - Variable Cualitativa
ORGANIZACIÓN DE DATOS - Variable Cualitativa
ORGANIZACIÓN DE DATOS
Clases.- Clase es cada intervalo usado para agrupar los datos de la muestra cuando el número de datos diferentes entre
sí es muy grande. Es necesario usar clases cuando la variables observada es cuantitativa continua, pero también puede
serlo cuando es discreta si el número de datos diferentes es muy grande.
Además f 1+ f 2 +…+ f m =n
m: número de clases o intervalos
n: número de observaciones.
m
n=∑ f i
i=1
2. Frecuencia Absoluta Acumulada ( F i) .- Representa a la suma en forma acumulativa de Clase en Clase de sus
Frecuencias Absolutas.
3. Frecuencia Relativa (hi ).- Frecuencia relativa de un dato o una clase es el cociente entre su frecuencia absoluta y
el tamaño de la muestra.
fi
hi =
n
De acuerdo con esta definición, las frecuencias relativas con proporciones y sus valores deben estar en el intervalo
cerrado [0, 1]. Aunque a veces las frecuencias relativas se pueden expresar en tanto por ciento, que significa el % que
representa a la cantidad de datos de una Clase con respecto al total de datos. Generalmente la frecuencia relativa se
expresa en forma porcentual:
hi∗100=h i %
4. Frecuencia Relativa Acumulada ( H i).- Representa a la suma en forma acumulativa de clase en clase de sus
respectivas frecuencias relativas.
Fi
También: H i= y se puede expresar en forma porcentual: H i∗100=H i %
n
1
ESTADÍSTICA GENERAL DISTANCIA
- Color de ojos - Profesión - Partido político
- Sexo - Raza - Nacionalidad
- Curso favorito - Estado Civil - Religión
Grado académico
Doctor
Magister
Licenciado
Bachiller
Secundaria completa
Primaria completa
Año de estudios
Primer año
Segundo año
Tercer año
Cuarto año
Quinto año
Contextura física
Muy delgado
Delgado
Medio
Robusto
A B C V V A A B B C
B B C C V V V A B A
A A V C B A V A C B
B C C A B V V A A B
2
ESTADÍSTICA GENERAL DISTANCIA
Verde 9 40 0.225 1.000 22.5% 100.0%
n=40
Interpretación:
Frecuencia absoluta
En la muestra hay 12 alumnos que prefieren el color amarillo.
En la muestra hay 11 alumnos que prefieren el color blanco.
En la muestra hay 8 alumnos que prefieren el color celeste.
En la muestra hay 9 alumnos que prefieren el color verde.
Frecuencia absoluta acumulada
En la muestra hay 12 alumnos que prefieren el color amarillo.
En la muestra hay 23 alumnos que prefieren el color amarillo y blanco.
En la muestra hay 31 alumnos que prefieren el color amarillo, blanco y celeste.
Todos los alumnos de la muestra que prefieren el color amarillo, blanco, celeste y verde.
Frecuencia Relativa
0.30 es la proporción de alumnos prefieren el color amarillo.
0.275 es la proporción de alumnos prefieren el color blanco.
0.20 es la proporción de alumnos prefieren el color celeste.
0.225 es la proporción de alumnos prefieren el color verde.
Representación gráfica de Variables cualitativas: La representación gráfica para datos cualitativos puede ser por
medio del diagrama de barras y el sector circular.
1. DIAGRAMA DE BARRAS
14
12
12 11
Número de alumnos
10 9
8
8
6
4
2
0
Amarillo Blanco Celeste Verde
Color
3
ESTADÍSTICA GENERAL DISTANCIA
35%
30%
30% 28%
25% 23%
20%
20%
15%
10%
5%
0%
Amarillo Blanco Celeste Verde
Color de la cafetería
2. SECTOR CIRCULAR: Para construir un sector circular se calcula el ángulo que corresponde a cada categoría de
la variable, denotada por C i=hi∗360. Se sugiere graficar en sentido anti horario empezando por la primera categoría.
Verde; 9 Amarillo ;
12
Celeste; 8
Blanco ;
11
Verde
23% Amarillo
30%
Celeste
20%
Blanco
28%
4
ESTADÍSTICA GENERAL DISTANCIA
Ejercicio 2: Se tiene la siguiente información que representa el Estado Civil de 50 estudiantes de post grado
encuestadas en la universidad del (edad; 20-30 años).
30
25
Número de estudiantes
25
20
15
10
10
8
5 6
0 1
Soltero Casado Viudo Divorciado Conviviente
Estado civil
16%
12%
50%
2%
20%