Unidad N1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Materia: Estadística Aplicada

Carrera: Tecnicatura Superior en Psicopedagogía


Prof. María José Monópoli
Año 2024

UNIDAD N°1: Estadística Descriptiva

La estadística es una rama de las matemáticas que se ocupa de la obtención, organización, presentación y
análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos
observados. Es una valiosa herramienta para la toma de decisiones.
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la
toma de decisiones y en su caso formular predicciones.
Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no
pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las
conclusiones obtenidas a la población.

Para introducirse en la Estadística, el primer paso es reconocer que los datos son variables por naturaleza,
no hay dos objetos, dos personas o dos procesos exactamente iguales en todos sus aspectos. Sus causas
pueden ser muchas y de diversa índole. Por menor que sea la variación siempre habrá variabilidad en los
datos.

¿Por qué necesitamos muestrear?


Cuanto mayor sea el tamaño de la población, más costoso, lento y tedioso resulta obtener información de
toda la población con el riesgo agregado de cometer errores no dependientes del muestreo como: errores
en la carga de datos, deficiencias en las instrucciones impartidas a los encuestadores, carga subjetiva de
éstos, normas poco claras en cuanto a los límites de la población que se estudia, etc.
Otras veces es imposible llevar a cabo esta tarea. Imaginemos una fábrica de lámparas led. Si deseamos
averiguar la duración promedio de todas las lámparas deberíamos ponerlas a todas en funcionamiento
hasta que se gastan. Conclusión, destruiríamos toda la producción. Este proceso de muestreo resulta
destructivo!!

Los datos son la MATERIA PRIMA de la Estadística

Página 1 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

La Estadística se alimenta de datos. Sin ellos, es imposible llevar a cabo una investigación estadística.
En otras épocas, disponer de datos y luego analizarlos era una tarea costosa y agotadora porque se basaba
en la labor manual de los empleados.
Pero los análisis estadísticos actuales acompañados de las poderosas herramientas informáticas permiten
a los directivos, asesores y personal en general contar con la suficiente información para mejorar los
procesos de la empresa haciendo un uso mucho más provechoso de los recursos.
El avance vertiginoso en tecnología informática ha permitido a la Estadística disponer de excelentes
softwares para manejar grandes volúmenes de información de manera eficiente y relativamente fácil. Si
bien EXCEL no es un software estadístico, también cuenta con algunas funciones estadísticas y gráficos
de uso frecuente.

Nota: En esta materia solo trabajaremos desde la etapa 3.

Estadística Descriptiva ó Análisis Exploratorio de datos: Utiliza métodos numéricos, tablas y gráficos
para resumir, o para representar la información, o para descubrir modelos en un conjunto de datos.

Página 2 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Estadística Inferencial: Utiliza los datos muestrales para hacer estimaciones o tomar decisiones o hacer
previsiones sobre un conjunto más grande de datos (la población de la que se eligió la muestra).
Dado que el objetivo de la Estadística Inferencial es sacar conclusiones del comportamiento de la
población en estudio basándonos solamente en los resultados de una muestra es razonable exigir que,
cualquiera sea el método de muestreo a emplear, todos deben cumplir con un requisito fundamental:
¡¡¡ La muestra extraída debe ser REPRESENTATIVA de la población!!!
Es decir: las características esenciales de la población deben verse reflejadas en la muestra. La muestra
debe comportarse como un espejo de la población, debe captar el comportamiento esencial de la
población.

GLOSARIO

POBLACIÓN: Es el conjunto formado por todos los elementos sometidos a estudio. Esos elementos
pueden ser objetos, individuos, espacios temporales o físicos.

MUESTRA: Es un subconjunto de la población que se selecciona para su análisis.

El término muestra tiene dos sentidos:


• Puede designar un conjunto de objetos acerca de los cuales se pretende determinar ciertas
propiedades, y es denominada “Muestra de Unidades”
• Pero también puede designar el conjunto de las medidas (valores observados de esas propiedades
o característica que serán denominadas VARIABLES), denominado “Muestra Estadística”.

Una terminología análoga es aplicada a “Población Estadística” y “Población de Unidades”.


Observación: Para una misma población bajo estudio, puede existir más de una población (muestra)
estadística de interés.

UNIDAD OBSERVACIONAL/ EXPERIMENTAL: Cada uno de los elementos que conforman la población
bajo estudio. Pueden tratarse de elementos tangibles como objetos, individuos o espacios físicos.

¡Consejo! Para identificar fácilmente la UNIDAD DE OBSERVACIÓN, debemos preguntarnos:


¿Qué elemento debemos muestrear para recabar la información pedida?

VARIABLE: Característica de interés que se mide u observa sobre cada elemento de la población. Cuando
se define una variable, se debe indicar claramente:

INFORMACIÓN DE INTERÉS A EXTRAER DE LA UNIDAD DE OBSERVACIÓN + UNIDAD DE


OBSERVACIÓN

DATO: Resultado observado de la variable.

Página 3 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

PARÁMETRO: Característica resumen de interés que se mide sobre todos los elementos de la población.
Resume la información de la población en un solo número. Se trata de características globales que
permiten describir el comportamiento de la población. Habitualmente son desconocidos porque, por
diversos motivos, casi nunca es posible trabajar con la población completa. En su lugar, se los estiman a
través de la información que nos proporciona la muestra. El ejemplo de parámetro más comúnmente
conocido es el promedio (aprendido en la escuela). Aquí lo llamaremos media aritmética (o simplemente
media) o promedio poblacional. Más adelante, veremos otros parámetros.

ESTIMADOR: Característica resumen de interés que se mide sobre los elementos de una muestra. Resume
la información de la muestra en un solo número. Como su nombre lo indica, sirve para estimar el valor
del parámetro correspondiente. Por ejemplo, la media poblacional se estima con la media muestral.

ESTIMACIÓN: Cada uno de los resultados posibles del estimador. Al seleccionar otra muestra, el valor
que toma el estimador puede cambiar.

CLASIFICACIÓN DE LAS VARIABLES.

Nominales
Cualitativas o Categóricas

Ordinales

VARIABLES

Discretas
Cuantitativas o Numéricas

Continuas

Variables Cualitativas o Categóricas: Se trata de variables cuyos resultados son nombres o


identificadores. También pueden ser resultados numéricos, pero en este caso las operaciones aritméticas
como sumar y obtener promedios no tienen ningún significado. Los resultados numéricos se presentan
en el caso de, por ejemplo, códigos de identificación o claves numéricas. Las variables cualitativas pueden
ser clasificadas en nominales u ordinal. Estas últimas permiten establecer una “relación de orden” entre
los datos pertenecientes a distintas categorías.

Página 4 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Variables Cuantitativas o Numéricas: Se trata de variables cuyos resultados son números. En este caso
las operaciones aritméticas como sumar y obtener promedios tienen significado. Las variables
cuantitativas pueden ser clasificadas en discretas y continuas.
• Variables cuantitativas discretas: sus resultados habitualmente provienen de un conteo.
• Variables cuantitativas continuas: sus resultados habitualmente provienen de una medición.

PRESENTACIÓN DE LA INFORMACIÓN

Una vez que un conjunto de datos está disponible, el primer objetivo de la Estadística Descriptiva es
determinar sus características importantes. Cuanto más grande sea este conjunto, más difícil es esta tarea.
Por ello, es necesario organizar los datos de alguna manera conveniente para poder comprender mejor
qué información relevante contienen dichos datos.
La mejor forma de organizarlos es resumiendo la información mediante la construcción de
tablas y gráficos adecuados. Con “adecuados” queremos decir, de acuerdo al tipo de datos y
al objetivo que persigue el estudio.

 TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS


 GRÁFICOS
 MEDIDAS DE RESUMEN

La información estadística, se presenta inicialmente en Tablas y/o Gráficos. Ambos son útiles como forma
de explorar la información y en muchos casos sugieren el análisis posterior y la formulación de hipótesis.
Una buena tabla permite en una lectura rápida advertir el comportamiento general de los datos.

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

Es una tabla que muestra el número de veces o frecuencias absoluta (𝒇𝒇𝒊𝒊 ) de diferentes categorías, valores
individuales observados ó intervalos de valores de la variable. Pueden utilizarse, por lo tanto, para datos
medidos en cualquier escala de medición.

En el caso de datos discretos con pocas categorías, se presenta en la tabla, la frecuencia, para cada valor
observado. En cambio, si las categorías son muchas, se manejan los datos como continuos.

Además de la frecuencia absoluta en la tabla de distribución de frecuencias, se pueden presentar la


frecuencia relativa (𝒇𝒇𝒇𝒇𝒊𝒊 ) y/o la frecuencia relativa porcentual (𝒇𝒇𝒇𝒇𝒊𝒊 %), que representan una
proporción y porcentaje respectivamente, del número total de observaciones, así como la frecuencia
acumulada (𝑭𝑭𝒊𝒊 ) y la frecuencia acumulada porcentual (𝑭𝑭𝒊𝒊 %) que indica el número y porcentaje
respectivamente de observaciones menores o iguales que un valor dado. Estas frecuencias acumuladas
tienen sentido sólo si el nivel medición es ordinal o numérico.

Página 5 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Con las medidas continuas es recomendable agrupar los datos en un conjunto de intervalos o clases de
modo que cada unidad de observación pueda ubicarse en una y sólo una de ellas. El número de clases
depende del número total de observaciones, éste debe ser suficiente para mostrar la forma de la
distribución; si los intervalos son pocos la información quedará demasiado agrupada y si son muchos se
obtendrá una representación muy irregular. En general varía entre 5 y 10 clases. Con la agrupación en
clases se gana en comodidad, pero se pierde información, ya que una vez agrupados, todos los datos
pertenecientes a un intervalo serán identificados para el análisis posterior con el punto medio o marca de
clase de ese intervalo. Por lo general los extremos inferiores de los intervalos se consideran cerrados y
los superiores abiertos para que no exista ambigüedad en cuanto a dónde ubicar una observación que
coincidan con dichos límites. Salvo que exista alguna razón especial, las amplitudes ó anchos de clase
(diferencia entre el límite superior y el inferior) deben ser iguales.

En el caso de datos continuos, en la tabla de distribución de frecuencias, las frecuencias absolutas


representan el número de observaciones que caen en cada intervalo.

Ejemplo 1: (Para variables nominales)

En 2022, se encuestaron a 38 alumnos al azar del Instituto y se les consultó en qué carrera se inscribieron.
Se obtuvieron los siguientes datos:

Psicopedagogía – Psicopedagogía – Psicopedagogía – Psicopedagogía - Filosofía – Filosofía – Filosofía –


Filosofía - Filosofía - Filosofía - Matemática – Matemática -Psicopedagogía -Psicopedagogía – Filosofía –
Psicopedagogía - Psicología – Psicología - Psicología - Psicología- Psicología – Psicopedagogía –
Psicopedagogía - Psicopedagogía – Filosofía- Sistemas – Sistemas –Psicopedagogía – Matemática -
Psicología – Psicología – Psicología – Matemática - Matemática - Sistemas - Ed Primaria – Ed. Primaria –
Filosofía.

a) Definir la variable de interés.

X= “Carrera en la que se inscribió un alumno ingresante del 2022”.

b) Clasificar la variable definida anteriormente.

Variable Cualitativa Nominal

Página 6 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

c) Realizar la tabla de distribución de frecuencias correspondiente.

Frecuencia
Frecuencias Frecuencia Relativa
Variable Absolutas (𝒇𝒇𝒊𝒊 ) Relativa Porcentual o
o Nro. de (𝒇𝒇𝒇𝒇𝒊𝒊 ) Porcentaje
alumnos (𝒇𝒇𝒇𝒇𝒊𝒊 %)
Psicopedagogía 11 0,2896 28,96%
Psicología 8 0,2105 21,05%
Filosofía 9 0,2368 23,68%
Matemática 5 0,1316 13,16%
Sistemas 3 0,0789 7,89%
Ed. Primaria 2 0,0526 5,26%
Total 38 1 100%

d) Interpretar en términos del problema, las frecuencias para la categoría Filosofía.

Frecuencia Absoluta=9
De los encuestados, exactamente 9 alumnos se inscribieron en 2020 en la carrera de Filosofía.

Frecuencia Relativa=0,2368
0,2368 es la proporción de alumnos encuestados que se inscribieron en 2020 en la carrera de
Filosofía.

Frecuencia Relativa Porcentual o Porcentaje= 23,68%


El 23,68% de los alumnos encuestados se inscribieron en 2020 en la carrera de Filosofía.

Ejemplo 2: (Para variables numéricas continuas)

Se consultó la edad de 50 empleados de una empresa. Los datos que se registraron fueron los siguientes:

42 41 42 44 44 36 38 41 42 44
42 39 49 40 45 32 34 43 37 39
41 39 48 42 43 33 43 35 32 34
39 35 43 44 47 40 39 42 41 46
37 49 41 39 43 42 47 48 51 52

Estos valores fueron agrupados en seis clases o intervalos de igual amplitud y presentados en la siguiente
tabla de distribución de frecuencias:

Página 7 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Variable: Marca de Frecuencias Frecuencia Frecuencia Frecuencia


Edad Clase Absolutas Frecuencia Relativa Acumulada Acumulada
(𝒇𝒇𝒊𝒊 ) Relativa Porcentual (𝑭𝑭𝒊𝒊 ) Porcentual
o Nro de (𝒇𝒇𝒇𝒇𝒊𝒊 ) o (𝑭𝑭𝒊𝒊 %)
empleados Porcentaje
(𝒇𝒇𝒇𝒇𝒊𝒊 %)
[30 – 34) 32 3 0,06 6% 3 6%
[34 – 38) 36 7 0,14 14% 10 20%
[38 – 42) 40 14 0,28 28% 24 48%
[42 – 46) 44 17 0,34 34% 41 82%
[46 – 50) 48 7 0,14 14% 48 96%
[50 – 54) 52 2 0,04 4% 50 100%
Total - 50 1 100% -

a) Definir la variable de interés y clasificarla.


b) Interpretar los valores obtenidos para la clase [42 -46)

Estas clases o intervalos no deberán construirlas.

Página 8 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

PRESENTACIÓN GRÁFICA DE LA INFORMACIÓN

Los gráficos tienen la ventaja de proporcionar en forma casi instantánea una gran cantidad de
información y deberían contribuir a hacer más comprensible el material presentado. Para ello, el gráfico
más eficiente es el que logra su propósito con la mayor sencillez posible.

Algunas consideraciones que deben tenerse en cuenta en su contribución:

• El gráfico no debe contener más líneas o símbolos que los que se puedan distinguir cómodamente
a primera vista.
• Debe estar claramente titulado y sus ejes rotulados indicando las unidades de medida.
• Deben interpretarse con precaución aquellas escalas que no comienzan en cero.
• Si se trabaja con porcentajes, se debe aclarar cuál es el total de referencia utilizado para el cálculo.

Gráfico de Sectores circulares (Pie Chart)

Es un círculo dividido en sectores cuyas áreas son proporcionales a la frecuencia de clase. Se utilizan para
presentar datos en escala nominal, cuando el número de categorías no es muy grande. Si hay varias
categorías con baja frecuencia conviene agruparlas en un solo sector. No deben compararse gráfico de
sectores expresados porcentualmente cuando los totales de referencia utilizados para su cálculo son
diferentes.
Ejemplo:

Gráfico de Barras o Bastones (Bar chart)

Se utilizan para representar la distribución de frecuencias en una escala nominal, ordinal ó numérica
discreta (si el rango de la variable es reducido). La longitud de las barras es proporcional a la frecuencia.
Ejemplos:

Página 9 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Gráfico de Barras agrupadas

Gráfico de Líneas

Se utiliza para expresar el cambio de alguna cantidad a lo largo del tiempo. Los puntos que representan
esa cantidad en momentos sucesivos se unen con segmentos rectilíneos. Se debe ser cuidadoso en la
elección de la escala y en su interpretación si se elige un origen distinto de cero.
Ejemplo:

Página 10 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Histograma

Se utilizan para representar una distribución de frecuencias de una variable cuantitativa continua. Se
construye en base a rectángulos cuyas bases son iguales a la amplitud del intervalo y las alturas son
proporcionales a la frecuencia.

Diagrama de Dispersión (Nube de puntos / Scatterplot)

Ilustran la relación entre dos variables cuantitativas continuas medidas sobre los mismos individuos.
Cada observación se representa con un punto de coordenadas (X, Y), donde X representa el valor de una
de las variables e Y, la otra.
Ejemplo:
Página 11 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

MEDIDAS DE RESUMEN

Una vez que los datos han sido recogidos, con el objeto de extraer las características importantes de tal
conjunto, no es suficiente con presentarlos en forma tabular y gráfica, es necesario resumir aún más la
información, pero de tal forma que los aspectos importantes del conjunto no se pierdan. Así se resume la
posición de una distribución y su forma. Para ello, la Estadística nos proporciona medidas descriptivas o
de resumen. Entre las principales se encuentran:

MEDIDAS DE CENTRALIZACIÓN MEDIDAS DE ORDEN MEDIDAS DE DISPERSIÓN


Media Aritmética o Promedio (𝑋𝑋�) Cuartil de Orden 1 (𝑄𝑄1 ) Rango (R)
Moda (𝑀𝑀𝑜𝑜 ) Cuartil de Orden 2 (𝑄𝑄2 ) Desvío Estándar (S)
Mediana (Md(x)) Cuartil de Orden 3 (𝑄𝑄3 ) Rango Intercuartílico (RI)
Coeficiente de Variación (CV%)
Varianza (𝑆𝑆 2 )

MEDIDAS DE CENTRALIZACIÓN

Las medidas de centralización son valores de la variable que indican el “centro” del conjunto de datos. Los
tres valores centrales más utilizados son: la media aritmética, la mediana y la moda. En general, será
necesario buscar los tres valores centrales pues ellos nos aportan informaciones que se complementan.

MODA: Es el valor que se presenta con mayor frecuencia. Se puede utilizar también frente a atributos, en
tal caso la moda es la categoría que más se observó. Cuando la variable es discreta, la moda es el dato que
más se repite. Cuando la variable es continua puede utilizarse como moda el punto medio del intervalo

Página 12 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

de mayor frecuencia, o bien podríamos hablar de clase modal para referirnos a la clase que registró la
mayor frecuencia.

MEDIA ARITMÉTICA O PROMEDIO: Es la suma de todas las observaciones dividido por el número de
observaciones. Supongamos tener n datos estadísticos que notaremos x1 , x2 , x3,…, xn . La media aritmética
o simplemente la media de estos valores, se define como la suma de todos ellos dividida por n, se nota X �,
es decir:

∑ni=1 xi

X=
n

Si algunos de los datos están repetidos, y se confecciona la tabla de distribución de frecuencias, la media
se calcula de acuerdo a una expresión que surge de la siguiente consideración: Si el dato x1 se repite f1
veces, el dato x2 , f2 veces y así hasta el dato xk que sucede fk veces, siendo n el número total de
observaciones entonces, la media aritmética es:

∑ki=1 xi ∗ fi
�=
X
n

La media aritmética en distribuciones asimétricas no representa un valor central, ya que es muy sensible
a valores extremos.

Dos propiedades importantes de la media son:

• Si a cada dato se le suma una constante, la media de estos nuevos datos es igual a la media de los
datos originales más una constante.
• Si a cada dato se multiplica por una constante, la media de estos nuevos datos es igual a la media
de los datos originales multiplicada por la constante.

Página 13 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

MEDIANA: Es la observación que deja la mitad de los datos (ordenados de menor a mayor) a cada lado.

Si el número total de observaciones n es impar, existirá una única mediana y será el valor que ocupe la
(n + 1)�
posición (ordenada) 2. Esta posición se denomina orden de la mediana.

Si el número de observaciones n es par, el orden de la mediana no es un número entero, no existe un único


valor central y la mediana se define como el promedio de las dos observaciones centrales, es decir los que
ocupan las posiciones n/2 y n/2 +1.

En la determinación de la mediana no intervienen todos los valores, sólo interesa el (ó los) valores
centrales, por lo tanto, no se ve afectada por la presencia de valores extremos, por lo que es la medida
elegida en el caso de distribuciones asimétricas.

A diferencia de la media, también puede utilizarse como medida de centralización para variables
ordinales.

MEDIDAS DE ORDEN

PERCENTILES: Los percentiles son valores que dividen al conjunto de datos, dejando por debajo de ellos
determinados porcentajes. Por ejemplo, el percentil 10 deja por debajo al 10% de los valores observados.
En general, percentil P-ésimo es el valor por debajo del cual se sitúa el P% de los valores. Se denotan
P1 , P2 , … , P99 .
Para obtenerlos se calcula el orden del percentil correspondiente, por ejemplo, el percentil 15 es igual a
15*(n+1)/100; determinado el orden del percentil queda establecida la clase que lo contiene.

𝑷𝑷∗(𝒏𝒏+𝟏𝟏)
Fórmula general para calcular el orden del percentil P-ésimo:
𝟏𝟏𝟏𝟏𝟏𝟏

CUARTILES: Son tres valores, que dividen al conjunto de datos observados en cuatro partes, de forma tal
que el 25% queda por debajo del cuartil 1, el 50% por debajo del cuartil 2 y el 75% por debajo del cuartil
3; es decir los cuartiles son los percentiles 25, 50 y 75, respectivamente. Se denotan por Q1 , Q 2 y Q 3 .

Página 14 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

MEDIDAS DE DISPERSIÓN

Expresan el grado de variación de los datos. Una medida de centralización como la media, será más
representativa del conjunto si los valores observados se encuentran cercanos a ella, es decir, si están
pocos dispersos. Dos series de mediciones pueden coincidir en media, mediana y moda y sin embargo ser
totalmente diferentes en la distribución que presentan los datos. Por esto, una medida de centralización
siempre debe ir acompañada de una de dispersión. Las más utilizadas son el rango, el rango
intercuartílico, el desvío estándar, la varianza y el coeficiente de variación.

RANGO: Es la diferencia entre la mayor observación y la menor. Conviene siempre especificar ambos
valores ya que pueden aportar importante información. El rango tiene como desventaja que su cálculo se
basa en sólo dos valores, que, además, por ser los extremos, pueden ser muy atípicos. No da información
acerca de cómo se dispersan los datos dentro del intervalo limitado por el menor y el mayor valor. Se nota
con la letra R.

𝑅𝑅 = 𝑉𝑉𝑀𝑀á𝑥𝑥 − 𝑉𝑉𝑀𝑀í𝑛𝑛

RANGO INTERCUARTILICO: Para solucionar en parte el inconveniente que presenta el rango, es que se
pensó en una medida simple que no se base en los valores extremos, el rango intercuartílico (RI) que se
define como la distancia entre el primer cuartil y el tercer cuartil: 𝑅𝑅𝑅𝑅 = 𝑄𝑄3 − 𝑄𝑄1 .
Cuando la distribución de los datos es asimétrica ó la variable es ordinal, esta es la medida de dispersión
que se utiliza.

Página 15 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

DESVÍO ESTÁNDAR: Mide la dispersión de los datos alrededor de la media aritmética. Su uso es correcto
siempre que la media sea la medida de centralización adecuada, o sea en una distribución simétrica o no
sesgada. Tiene las mismas unidades que los datos originales.

El nombre que recibe esta medida antes de extraer la raíz cuadrada se conoce como varianza, y
se nota𝑆𝑆 2 .

Dos propiedades importantes de la desviación estándar son:

• Si a cada dato le sumamos una constante, el desvío estándar conserva su valor.


• Si cada dato es multiplicado por una constante, el desvío estándar queda multiplicado por el valor
absoluto de dicha constante.
• Si la distribución de frecuencias es aproximadamente simétrica y unimodal, la media aritmética y
el desvío estándar, son buenas medidas de centralización y de dispersión respectivamente. Si la
distribución es marcadamente asimétrica, la mediana y el rango intercuartílico son las medidas
apropiadas para describir ese conjunto de datos.

COEFICIENTE DE VARIACIÓN: Es una medida de variabilidad relativa que se utiliza para comparar la
dispersión de dos o más conjuntos de datos numéricos cuando:
 Los datos se refieren a distintas características de un mismo grupo.
 Los datos se refieren al mismo carácter de distintos grupos, que presentan medias aritméticas de
diferente magnitud.
No tiene unidades y expresa la variabilidad como porcentaje de la media. Se obtiene de acuerdo a la
siguiente expresión:
Página 16 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

S
CV% = ∗ 100%

X

Ejemplo 3: Dado el siguiente conjunto de datos, calcular:

550 600 550 400 650 700 750 450 550 500 700 800

• 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴é𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 /𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃:

550 + 600 + 550 + 400 + 650 + 700 + 750 + 450 + 550 + 500 + 700 + 800 7.200
𝑋𝑋� = = = 600
12 12

• 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑀𝑀𝑜𝑜 = 550 (Frecuencia absoluta más alta es 3)


• 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑀𝑀𝑀𝑀(𝑋𝑋) = 575 (Resulta del promedio de los datos que se encuentran en la posición 6°
y 7°)

Datos ordenados de menor a mayor:

400 450 500 550 550 550 600 650 700 700 750 800
1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12°

• 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 1: 𝑄𝑄1 = 500 (Es el dato que se encuentra en la posición 3°)
• 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 3: 𝑄𝑄3 = 700 (Es el dato que se encuentra en la posición 10°)
• 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅: 𝑅𝑅 = 800 − 400 = 400
• 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼í𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙: 𝑅𝑅𝑅𝑅 = 700 − 500 = 200
• 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷í𝑜𝑜 𝐸𝐸𝐸𝐸𝐸𝐸á𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛: 𝑆𝑆 =117,2604

∑𝑛𝑛 𝑋𝑋𝑖𝑖 2 − 𝑛𝑛𝑋𝑋� 2 4485000 − 12 ∗ (600)2 165000


𝑆𝑆 = � 𝑖𝑖=1 =� =� = √13750 = 117,2604
𝑛𝑛 12 12

• 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉: 𝑆𝑆 2 = (117,2604)2 = 13750,0014

Página 17 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024

Ejemplo 4: Si los datos anteriores se disponen en una tabla de distribución de frecuencias, resulta:

Variable Frecuencia Frecuencia


X Absoluta Acumulada
400 1 1
450 1 2
500 1 3
550 3 6
600 1 7
650 1 8
700 2 10
750 1 11
800 1 12
Total n=12 -

400 ∗ 1 + 450 ∗ 1 + 500 ∗ 1 + 550 ∗ 3 + 600 ∗ 1 + 650 ∗ 1 + 700 ∗ 2 + 750 ∗ 1 − 800 ∗ 1 7.200
𝑋𝑋� = = = 600
12 12

𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑀𝑀𝑜𝑜 = 550

𝑛𝑛 + 1 13
𝑂𝑂𝑂𝑂𝑂𝑂(𝑋𝑋) = = = 6,5° → 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 𝑙𝑙𝑙𝑙 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎, 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 ∶
2 2

550 + 600 1.150


𝑀𝑀𝑀𝑀(𝑋𝑋) = = = 575
2 2

𝑛𝑛 + 1 13
𝑂𝑂𝑄𝑄1 = = = 3,25° ≅ 3° → 𝑄𝑄1 = 500
4 4
𝑅𝑅𝑅𝑅 = 700 − 500 = 200

3 ∗ (𝑛𝑛 + 1) 3 ∗ (12 + 1)
𝑂𝑂𝑄𝑄3 = = = 9,75° ≅ 10° → 𝑄𝑄3 = 700
4 4

Página 18 de 18

También podría gustarte