Tipos de Estadística
Tipos de Estadística
Tipos de estadística
Los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e inferencial.
Estadística paramétrica: Se caracteriza porque asume que los datos tienen una
determinada distribución o se especifican determinados parámetros que deberían
cumplirse. Así por ejemplo, en un análisis paramétrico podemos trabajar bajo el supuesto
de que la población se distribuye como una Normal (hay que justificar nuestro supuesto) y
luego sacar conclusiones bajo el supuesto que esta condición se cumple.
Estadística no paramétrica: En ella no es posible asumir ningún tipo de distribución
subyacente en los datos ni tampoco un parámetro específico. Un ejemplo de este tipo de
análisis es la prueba binomial.
Los datos agrupados se organizan en una tabla de frecuencia, siendo esta tabla el número de
veces que cada valor se repite en la serie de datos.
o Por su parte, los datos no agrupados constituyen el conjunto de datos que no han sido
clasificados y que son presentados en una tabla de datos en forma individual, es decir que
no forman parte de un conjunto. De manera general constituye una cantidad de elementos
que es menor a 30 con muy poca o nula repetición.
Existen así las medidas de tendencia central para datos no agrupados, cuyos datos se
manejan en forma simple. Primero son recolectados los datos de la población de estudio y
estos son distribuidos en una tabla y analizados sin formar clases, que son el número de
subconjuntos en que se han agrupado los datos con los mismos: cada dato mantiene su
propia identidad luego de que se ha elaborado la distribución de frecuencia.
Estos datos provienen directamente de la encuesta o estudio que se realiza, por ejemplo:
o Edades de los empleados de una tienda: 19, 22, 18, 23, 21, 19, 18, 26, 24, 26.
La media es el centro de toda la distribución, ya que en esta son representados los valores
observados; por ejemplo, si existe un grupo de personas que tienen una estatura media de
1.60 metros, pues esta cantidad representa la estatura promedio de todos, a pesar de que no
es la estatura de ninguna de las personas en forma particular.
La moda
Es la tercera de las medidas de tendencia central para datos no agrupados. Esta medida sirve
para identificar cuando un dato aparece continuamente, como también durante un periodo de
tiempo determinado. Es en sí el dato que más aparece en un grupo, también pudiendo existir
dos modas, conociéndose así como bimodal o, cuando hay más de dos modas recibe la
denominación de multimodal, que es cuando el máximo número de repeticiones se da para
tres o más números.
Para calcular la moda se deben escribir los números del conjunto y luego escribir el número o
los números que se repiten mayor cantidad de veces. En un conjunto con los siguientes
componentes: 4, 5, 8, 8, 7, 6, 8; la moda es el número 8 al ser el número que se repite más.
Estas medidas de tendencia central para datos no agrupados te permitirán analizar los datos
de un conjunto.
Para los datos agrupados debemos considerar con un valor REPRESENTATIVO de cada
intervalo que se denomina MARCA DE CLASE y asumir que TODAS las cantidades de la
frecuencia absoluta se ven representadas por ese valor.
La media se calcula sumando todos los datos y dividiendo entre el total de ellos. Pero para
datos agrupados asumimos que por ejemplo en el primer intervalo esas 5 personas todas
tienen 14.5 años… entonces queda más práctico multiplicar 5×14.5 o lo que es lo mismo
14.5+14.5+14.5+14.5+14.5.
Tabla de frecuencias
Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada
característica en que se han dividido los datos. A continuación se dan algunas definiciones
relacionadas en la construcción de la tabla de frecuencias
Definición 1
Un intervalo de clase, es cada uno de los rangos de valores en que se ha decidido agrupar
parcialmente los datos con el propósito de hacer un resumen de ellos.
Definición 2
El número de mediciones que quedan dentro del intervalo se llama frecuencia del intervalo y
se denota por . La diferencia entre el extremo mayor y el extremo menor del intervalo se
llama longitud o ancho del intervalo.
Definición 3
La marca de clase, es el punto medio del intervalo de la clase, se denota por Su valor es
obtenido al promediar los extremos del intervalo.
Definición 4
Definición 5
Definición 6
La construcción de una tabla de frecuencias para datos cuantitativos presenta como su punto
de mayor importancia la determinación del número de intervalos (clases) que la conformaran.
Este número depende de la cantidad y de la naturaleza de los datos a resumir y del propósito
que se busca con el resumen. A continuación se presentan ciertas pautas para la construcción
de una tabla de frecuencias.
2. Una vez escogido el número de intervalos, se determina la longitud que deben tener los
intervalos, dividiendo el rango en el número de clases o intervalos. rango/Número de
clases.
La construcción de una tabla de frecuencia para datos cualitativos requiere solo del
conteo del número de elementos o individuos que caen dentro de cierta clase o
categoria.
¿Qué es la estadística inferencial?
El muestreo deliberado, crítico o por juicio es aquel que se selecciona con base en
el conocimiento de una población o propósito del estudio.
El muestreo por cuotas es aquel en la que las unidades son seleccionadas en una
muestra partiendo de las características predeterminadas, de modo que la muestra
total tenga la misma distribución de características que se supone que existen en
la población que está siendo estudiada.
2. Muestreo sistemático
3. Muestreo estratificado
Intervalo de confianza
Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado.
Pensemos en una población de 4 millones de personas. ¿Podríamos saber el gasto
medio en consumo por hogar de esa población? En principio sí. Simplemente
tendríamos que hacer una encuesta entre todos los hogares y calcular la media.
Sin embargo, seguir ese proceso sería tremendamente laborioso y complicaría
bastante el estudio.
Nivel de confianza
El nivel de confianza se define como 1-alfa y sus valores más comunes son 90%,
95% y 99%.
En estadística es común tener que estimar parámetros, los cuales, nunca vamos a
poder afirmar al 100% que son el valor real que buscamos. Por ejemplo,
observando a simple vista la altura de 10 alumnos en una clase podríamos estimar
que la altura está entre 1,70 y 1,75.
Sería difícil saber con un 100% de certeza la altura media si no medimos a cada
alumno y hacemos los cálculos. Por el contrario, sí podríamos acotar un intervalo y
situar el valor dentro de este.
Partido A: 32%
Partido B: 51%
Partido C: 17%