Clase 2
Clase 2
Clase 2
2 PRESENTACIÓN
DE DATOS DE UNA
SOLA VARIABLE
1.2.1
DISTRIBUCIÓN DE
FRECUENCIAS
Las distribuciones de frecuencias
son tablas en que se dispone las
modalidades de la variable por
filas. En las columnas se dispone el
número de ocurrencias por cada
valor, porcentajes, etc. La finalidad
de las agrupaciones en frecuencias
es facilitar la obtención de la
información que contienen los
datos.
Ejemplo: Quieren conocer si un grupo de
individuos está a favor o en contra de la
exhibición de imágenes violentas por
televisión, para lo cual han recogido los
siguientes datos:
La inspección de los datos originales no permite responder
fácilmente a cuestiones como cuál es la actitud mayoritaria
del grupo, y resulta bastante más difícil determinar la
magnitud de la diferencia de actitud entre hombres y
mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los
valores de la variable acompañados del número de veces (la
frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribución de frecuencias de los datos
del ejemplo muestra que la actitud
mayoritaria de los individuos del grupo
estudiado es indiferente.
La interpretación de los datos ha sido
facilitada porque se ha reducido el número de
números a examinar (en vez de los 20 datos
originales, la tabla contiene 5 valores de la
variable y 5 frecuencias).
Generalmente las tablas incluyen varías columnas con
las frecuencias relativas (son el número de ocurrencias
dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada
es el total de frecuencias de los valores iguales o
inferiores al de referencia, y se simbolizan "fa" o "na".
No obstante la frecuencia acumulada también es
definida incluyendo al valor de referencia), frecuencias
acumuladas relativas (la frecuencia acumulada
relativa es el total de frecuencias relativas de los
valores iguales o inferiores al de referencia, y se
simbolizan "fr" o "pa")
Ejemplo: Consideremos el siguiente
grupo de datos:
La distribución de frecuencias es:
La reducción de datos mediante el agrupamiento en frecuencias
no facilita su interpretación: La tabla es demasiado grande.
Para reducir el tamaño de la tabla agrupamos los valores en
intervalos, y las frecuencias son las de los conjuntos de valores
incluidos en los intervalos:
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor número de datos es el 34-39, o que el 75%
de los datos tiene valor inferior a 46.
Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".
Elementos básicos de las tablas de intervalos:
• Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en una
distribución de frecuencias
• Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los límites
aparentes del intervalo con mayor número de frecuencias son 34 y 39.
• Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites
son 33.5 y 39.5
• Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por dos.
Mc del intervalo del ejemplo= 36.5
• Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.
1.2.2
Presentación
Gráfica De Datos
En los análisis estadísticos, es frecuente
utilizar representaciones visuales
complementarias de las tablas que
resumen los datos de estudio.
Con estas representaciones, adaptadas en
cada caso a la finalidad informativa que
se persigue, se transmiten los resultados
de los análisis de forma rápida, directa y
comprensible para un conjunto amplio de
personas.
TIPOS DE REPRESENTACIONES GRÁFICAS
Cuando se muestran los datos estadísticos a través de representaciones
gráficas, se ha de adaptar el contenido a la información visual que se
pretende transmitir. Para ello, existen varias formas de representación:
Gráfica de barras
Gráfica de pastel
Histogramas
Polígonos de frecuencias
Ojiva
Gráficas lineales
Gráficas de puntos
Diagramas De Barras
Un gráfico de barras es una forma de resumir un conjunto de datos por
categorías. Muestra los datos usando varias barras de la misma anchura,
cada una de las cuales representa una categoría concreta. La altura de
cada barra es proporcional a una agregación específica (por ejemplo, la
suma de los valores de la categoría que representa). Las categorías
podrían ser desde grupos de edad a ubicaciones geográficas.
Si se aplica al crear el análisis, el gráfico de barras puede mostrar
información adicional en líneas de referencia o varios tipos distintos de
curvas. Estas líneas o curvas podrían, por ejemplo, mostrar si los puntos
de los datos se adaptan bien a un ajuste de curva polinómica
determinado, o resumir un conjunto de puntos de datos de muestra
ajustándolos a un modelo que describirá los datos y mostrará una curva o
una línea recta sobre la visualización. La curva normalmente cambia su
aspecto en función de los valores que se hayan filtrado del análisis. Al
pasar por encima el ratón, una sugerencia sobre herramienta mostrará la
forma en que se calcula la curva.
Ejemplo: Una tabla de datos contiene las cifras de ventas de
varias frutas y verduras distintas. El gráfico de barras puede
mostrar la suma total de ventas de varios años.