Tema 3 EXPLORACION Y DESCRIPCION UNIVARIADA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Tema 3: EXPLORACIÓN Y DESCRIPCIÓN UNIVARIADA

Hay varios tipos de estadísticos o índices que nos ayudan a resumir y describir los valores
de la variable:
- Índices de posición: describe la posición que toma la muestra en la variable. Están
los índices de tendencia central y cuantiles. Los primeros se dividen en moda, media
y mediana.
- La variabilidad o dispersión: se refiere al grado de concentración de los datos.
entendida como la separación entre las observaciones. Nos dice si la variable en los
datos es homogénea (más concentración) o heterogéneos (menos concentración).
Es independiente, aunque complementaria de la tendencia central. Para medir esto
se usa la amplitud total, la desviación media, varianza, desviación típica, amplitud
semi-intercuartil y el coeficiente de variación.
- La forma de las distribuciones: se refiere a la simetría y a la curtosis. La primera
hace referencia al grado en que los datos tienden a repartirse de forma similar por
encima y debajo de los valores centrales. La curtosis se refiere al grado de
apuntamiento de la distribución de frecuencias, es decir, si hay más datos en la parte
cercana al promedio o en los extremos de la distribución.

Moda: la variable que más se repite. Puede ser unimodal, bimodal, etc. Puede calcularse
para todos los tipos de variables.

Mediana: divide al total de la población ordenada de mayor a menor en dos partes iguales.
Es el valor de la variable que tiene la propiedad de que la mitad de los individuos toman
valores iguales o inferiores y la otra mitad viceversa. Se calcula para cuasi-cuantitativas y
cuantitativas. Para calcular la mediana en datos no agrupados:
1. Ordenar de mayor a menor.
2. Calcular el tamaño muestral, n.
3. Sumarle 1 a n y dividir entre dos o multiplicar por 0.5.
4. a. Si el valor es entero: esa es la mediana.
5. b. Si el valor no es entero: la mediana es la media de los dos datos. Si sale 10.5,
coger media de 10 y 11.

Si la variable es cuasi-cuantitativa y los valores centrales son distintos, tendría dos


medianas.

Media: es la suma de todas las variables entre el tamaño muestral n. Se calcula para
cuantitativas. No se recomienda en distribuciones muy asimétricas. Tiene dos propiedades:
- En cualquier distribución, la media de las diferencias entre cada valor y la media es
0.
- Si sometemos una variable a una transformación lineal, su media experimentará
igual transformación.
Cuantiles

Dividen los datos de la distribución en partes que tiene cada una de ellas el mismo número
de observaciones. Así, podemos ver la posición del valor de una variable comparándola con
el resto de los valores de la muestra. Los más usados son:
- Cuartiles: dividen a la población en 4 trozos iguales. Se distinguen Q1, Q2 y Q3.
- Q1: es el valor de la variable que deja por debajo de sí el 25% con
puntuaciones inferiores.
- Q2: deja por debajo de sí el 50% con puntuaciones inferiores.
- Q3: deja por debajo de sí el 75% con puntuaciones inferiores.
Se calcula de la siguiente forma:
1. Ordenar datos de mayor a menor.
2. Calcular la posición del dato. Para el primer cuartil (n+1)/4 y para el tercero 3(n+1)/4.
3. a. Si el dato es entero: el cuartil es el valor de la observación que ocupe esa
posición.
4. b. Si tiene parte entera y decimal (e, d): el cuartil se calcula de la forma siguiente.

- Deciles: dividen a la muestra en 10 trozos iguales, Dh será el valor de la variable que


deja por debajo de sí las h décimas partes de participantes con menores
puntuaciones. k(n+1)/10.
- Percentiles: dividen a la muestra en 100 trozos iguales. El P32 será un valor tal que
el 32% de los individuos toman valores inferiores o iguales a él. k(n+1)/100.

Escalas de cuantiles
Se suele decir la cuarta parte con puntuaciones más bajas, bajas, altas y más altas.

Medidas de dispersión

a. Amplitud, rangos o recorridos.


Diferencia entre el mayor valor y el menor de un conjunto de valores. At= Máx. - Mín.
Es sensible a las fluctuaciones del muestreo y con valores extremos. La amplitud
intercuartílica se calcula así: AIQ= Q3 - Q1. Esto contiene el 50% central de los datos,
ya que a la izquierda está el 25% inferior y a la derecha el 25% superior. El rango
semi-intercuartílico o desviación cuartílica sería así:

b. Varianza y desviación típica.


La varianza se mide de una de estas formas, y la desviación típica de esta:

En cuanto a sus propiedades:


- Son invariantes frente a cambios de origen: si a todos los valores de la variable le
restamos 1, la varianza de los resultados coinciden con los originales.
- Se ven afectadas por los cambios de escala: si multiplicamos o dividimos todos
los valores, la varianza es igual a la de los valores originales multiplicada o dividida
por el cuadrado de la citada cantidad.

Si estamos con una variable que se distribuye normalmente alrededor de la media, a una
distancia de hasta una desviación típica nos encontraríamos el 68% de las observaciones, y
a 2 desviaciones típicas, al 95%.

c. Coeficientes de variación.
Permite dilucidar, de entre dos poblaciones, cuál es la que presenta mayor
dispersión. Está expresado en porcentaje. La fórmula es:

Asimetría

Se refiere al modo en que se reparten los datos a un lado u otro de la tendencia central.
Puede ser negativa, cuando las puntuaciones están por encima de la media principalmente
(cola hacia la izquierda), o positiva, cuando viceversa (cola a la derecha). El coeficiente de
asimetría se mide así:

Apuntamiento o curtosis

Analiza el grado de concentración y apuntamiento que presentan los valores alrededor de la


zona central de la distribución. Puede ser positivo, negativo o 0. El coeficiente de curtosis se
mide así:

Si la distribución es más apuntada que la normal, se dice distribución leptocúrtica (índice


positivo), si es más achatada es platicúrtica (índice negativo), si es igual es mesocúrtica.
Representación gráfica de la variabilidad y la forma de la distribución.

En el diagrama de caja y bigotes se representan los 3 cuartiles y los valores límite superior
e inferior de los datos sobre un rectángulo, alineado horizontal o verticalmente. Los lados
más largos del rectángulo muestran el recorrido intercuartílico o AIQ. El rectángulo está
dividido por un segmento vertical que indica la mediana. Las líneas que sobresalen se
llaman bigotes. Cualquier dato que esté fuera de la línea o rectángulo es un caso atípico.

Para calcular el límite superior e inferior:

Consideraciones sobre los estadísticos

Cualitativa: calcular moda.


Cuasi-cuantitativa: calcular moda, mediana, lo que implica ordenaciones (amplitud
intercuartil o semi intercuartil).
Cuantitativa: todos los índices.
Si la distribución es simétrica y unimodal: calcular moda, mediana y media.
Si es asimétrica: calcular índices basados en la mediana.

Puntuaciones diferenciales y típicas

Para hacer interpretables las puntuaciones se puede recurrir a las puntuaciones


diferenciales (Di). Xi son las puntuaciones directas, la fórmula sería:

Una vez calculado esto, se recurre a las puntuaciones típicas (Zi), se calcula así:

Esto nos indica las distancias a la media de la distribución de las puntuaciones, medidas en
unidades de desviación típica. La z sirve para calcular cuál es la puntuación más extrema y
comparar.

También podría gustarte