Unidad N1
Unidad N1
Unidad N1
La estadística es una rama de las matemáticas que se ocupa de la obtención, organización, presentación y
análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos
observados. Es una valiosa herramienta para la toma de decisiones.
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la
toma de decisiones y en su caso formular predicciones.
Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no
pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las
conclusiones obtenidas a la población.
Para introducirse en la Estadística, el primer paso es reconocer que los datos son variables por naturaleza,
no hay dos objetos, dos personas o dos procesos exactamente iguales en todos sus aspectos. Sus causas
pueden ser muchas y de diversa índole. Por menor que sea la variación siempre habrá variabilidad en los
datos.
Página 1 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
La Estadística se alimenta de datos. Sin ellos, es imposible llevar a cabo una investigación estadística.
En otras épocas, disponer de datos y luego analizarlos era una tarea costosa y agotadora porque se basaba
en la labor manual de los empleados.
Pero los análisis estadísticos actuales acompañados de las poderosas herramientas informáticas permiten
a los directivos, asesores y personal en general contar con la suficiente información para mejorar los
procesos de la empresa haciendo un uso mucho más provechoso de los recursos.
El avance vertiginoso en tecnología informática ha permitido a la Estadística disponer de excelentes
softwares para manejar grandes volúmenes de información de manera eficiente y relativamente fácil. Si
bien EXCEL no es un software estadístico, también cuenta con algunas funciones estadísticas y gráficos
de uso frecuente.
Estadística Descriptiva ó Análisis Exploratorio de datos: Utiliza métodos numéricos, tablas y gráficos
para resumir, o para representar la información, o para descubrir modelos en un conjunto de datos.
Página 2 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Estadística Inferencial: Utiliza los datos muestrales para hacer estimaciones o tomar decisiones o hacer
previsiones sobre un conjunto más grande de datos (la población de la que se eligió la muestra).
Dado que el objetivo de la Estadística Inferencial es sacar conclusiones del comportamiento de la
población en estudio basándonos solamente en los resultados de una muestra es razonable exigir que,
cualquiera sea el método de muestreo a emplear, todos deben cumplir con un requisito fundamental:
¡¡¡ La muestra extraída debe ser REPRESENTATIVA de la población!!!
Es decir: las características esenciales de la población deben verse reflejadas en la muestra. La muestra
debe comportarse como un espejo de la población, debe captar el comportamiento esencial de la
población.
GLOSARIO
POBLACIÓN: Es el conjunto formado por todos los elementos sometidos a estudio. Esos elementos
pueden ser objetos, individuos, espacios temporales o físicos.
UNIDAD OBSERVACIONAL/ EXPERIMENTAL: Cada uno de los elementos que conforman la población
bajo estudio. Pueden tratarse de elementos tangibles como objetos, individuos o espacios físicos.
VARIABLE: Característica de interés que se mide u observa sobre cada elemento de la población. Cuando
se define una variable, se debe indicar claramente:
Página 3 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
PARÁMETRO: Característica resumen de interés que se mide sobre todos los elementos de la población.
Resume la información de la población en un solo número. Se trata de características globales que
permiten describir el comportamiento de la población. Habitualmente son desconocidos porque, por
diversos motivos, casi nunca es posible trabajar con la población completa. En su lugar, se los estiman a
través de la información que nos proporciona la muestra. El ejemplo de parámetro más comúnmente
conocido es el promedio (aprendido en la escuela). Aquí lo llamaremos media aritmética (o simplemente
media) o promedio poblacional. Más adelante, veremos otros parámetros.
ESTIMADOR: Característica resumen de interés que se mide sobre los elementos de una muestra. Resume
la información de la muestra en un solo número. Como su nombre lo indica, sirve para estimar el valor
del parámetro correspondiente. Por ejemplo, la media poblacional se estima con la media muestral.
ESTIMACIÓN: Cada uno de los resultados posibles del estimador. Al seleccionar otra muestra, el valor
que toma el estimador puede cambiar.
Nominales
Cualitativas o Categóricas
Ordinales
VARIABLES
Discretas
Cuantitativas o Numéricas
Continuas
Página 4 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Variables Cuantitativas o Numéricas: Se trata de variables cuyos resultados son números. En este caso
las operaciones aritméticas como sumar y obtener promedios tienen significado. Las variables
cuantitativas pueden ser clasificadas en discretas y continuas.
• Variables cuantitativas discretas: sus resultados habitualmente provienen de un conteo.
• Variables cuantitativas continuas: sus resultados habitualmente provienen de una medición.
PRESENTACIÓN DE LA INFORMACIÓN
Una vez que un conjunto de datos está disponible, el primer objetivo de la Estadística Descriptiva es
determinar sus características importantes. Cuanto más grande sea este conjunto, más difícil es esta tarea.
Por ello, es necesario organizar los datos de alguna manera conveniente para poder comprender mejor
qué información relevante contienen dichos datos.
La mejor forma de organizarlos es resumiendo la información mediante la construcción de
tablas y gráficos adecuados. Con “adecuados” queremos decir, de acuerdo al tipo de datos y
al objetivo que persigue el estudio.
La información estadística, se presenta inicialmente en Tablas y/o Gráficos. Ambos son útiles como forma
de explorar la información y en muchos casos sugieren el análisis posterior y la formulación de hipótesis.
Una buena tabla permite en una lectura rápida advertir el comportamiento general de los datos.
Es una tabla que muestra el número de veces o frecuencias absoluta (𝒇𝒇𝒊𝒊 ) de diferentes categorías, valores
individuales observados ó intervalos de valores de la variable. Pueden utilizarse, por lo tanto, para datos
medidos en cualquier escala de medición.
En el caso de datos discretos con pocas categorías, se presenta en la tabla, la frecuencia, para cada valor
observado. En cambio, si las categorías son muchas, se manejan los datos como continuos.
Página 5 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Con las medidas continuas es recomendable agrupar los datos en un conjunto de intervalos o clases de
modo que cada unidad de observación pueda ubicarse en una y sólo una de ellas. El número de clases
depende del número total de observaciones, éste debe ser suficiente para mostrar la forma de la
distribución; si los intervalos son pocos la información quedará demasiado agrupada y si son muchos se
obtendrá una representación muy irregular. En general varía entre 5 y 10 clases. Con la agrupación en
clases se gana en comodidad, pero se pierde información, ya que una vez agrupados, todos los datos
pertenecientes a un intervalo serán identificados para el análisis posterior con el punto medio o marca de
clase de ese intervalo. Por lo general los extremos inferiores de los intervalos se consideran cerrados y
los superiores abiertos para que no exista ambigüedad en cuanto a dónde ubicar una observación que
coincidan con dichos límites. Salvo que exista alguna razón especial, las amplitudes ó anchos de clase
(diferencia entre el límite superior y el inferior) deben ser iguales.
En 2022, se encuestaron a 38 alumnos al azar del Instituto y se les consultó en qué carrera se inscribieron.
Se obtuvieron los siguientes datos:
Página 6 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Frecuencia
Frecuencias Frecuencia Relativa
Variable Absolutas (𝒇𝒇𝒊𝒊 ) Relativa Porcentual o
o Nro. de (𝒇𝒇𝒇𝒇𝒊𝒊 ) Porcentaje
alumnos (𝒇𝒇𝒇𝒇𝒊𝒊 %)
Psicopedagogía 11 0,2896 28,96%
Psicología 8 0,2105 21,05%
Filosofía 9 0,2368 23,68%
Matemática 5 0,1316 13,16%
Sistemas 3 0,0789 7,89%
Ed. Primaria 2 0,0526 5,26%
Total 38 1 100%
Frecuencia Absoluta=9
De los encuestados, exactamente 9 alumnos se inscribieron en 2020 en la carrera de Filosofía.
Frecuencia Relativa=0,2368
0,2368 es la proporción de alumnos encuestados que se inscribieron en 2020 en la carrera de
Filosofía.
Se consultó la edad de 50 empleados de una empresa. Los datos que se registraron fueron los siguientes:
42 41 42 44 44 36 38 41 42 44
42 39 49 40 45 32 34 43 37 39
41 39 48 42 43 33 43 35 32 34
39 35 43 44 47 40 39 42 41 46
37 49 41 39 43 42 47 48 51 52
Estos valores fueron agrupados en seis clases o intervalos de igual amplitud y presentados en la siguiente
tabla de distribución de frecuencias:
Página 7 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Página 8 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Los gráficos tienen la ventaja de proporcionar en forma casi instantánea una gran cantidad de
información y deberían contribuir a hacer más comprensible el material presentado. Para ello, el gráfico
más eficiente es el que logra su propósito con la mayor sencillez posible.
• El gráfico no debe contener más líneas o símbolos que los que se puedan distinguir cómodamente
a primera vista.
• Debe estar claramente titulado y sus ejes rotulados indicando las unidades de medida.
• Deben interpretarse con precaución aquellas escalas que no comienzan en cero.
• Si se trabaja con porcentajes, se debe aclarar cuál es el total de referencia utilizado para el cálculo.
Es un círculo dividido en sectores cuyas áreas son proporcionales a la frecuencia de clase. Se utilizan para
presentar datos en escala nominal, cuando el número de categorías no es muy grande. Si hay varias
categorías con baja frecuencia conviene agruparlas en un solo sector. No deben compararse gráfico de
sectores expresados porcentualmente cuando los totales de referencia utilizados para su cálculo son
diferentes.
Ejemplo:
Se utilizan para representar la distribución de frecuencias en una escala nominal, ordinal ó numérica
discreta (si el rango de la variable es reducido). La longitud de las barras es proporcional a la frecuencia.
Ejemplos:
Página 9 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Gráfico de Líneas
Se utiliza para expresar el cambio de alguna cantidad a lo largo del tiempo. Los puntos que representan
esa cantidad en momentos sucesivos se unen con segmentos rectilíneos. Se debe ser cuidadoso en la
elección de la escala y en su interpretación si se elige un origen distinto de cero.
Ejemplo:
Página 10 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Histograma
Se utilizan para representar una distribución de frecuencias de una variable cuantitativa continua. Se
construye en base a rectángulos cuyas bases son iguales a la amplitud del intervalo y las alturas son
proporcionales a la frecuencia.
Ilustran la relación entre dos variables cuantitativas continuas medidas sobre los mismos individuos.
Cada observación se representa con un punto de coordenadas (X, Y), donde X representa el valor de una
de las variables e Y, la otra.
Ejemplo:
Página 11 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
MEDIDAS DE RESUMEN
Una vez que los datos han sido recogidos, con el objeto de extraer las características importantes de tal
conjunto, no es suficiente con presentarlos en forma tabular y gráfica, es necesario resumir aún más la
información, pero de tal forma que los aspectos importantes del conjunto no se pierdan. Así se resume la
posición de una distribución y su forma. Para ello, la Estadística nos proporciona medidas descriptivas o
de resumen. Entre las principales se encuentran:
MEDIDAS DE CENTRALIZACIÓN
Las medidas de centralización son valores de la variable que indican el “centro” del conjunto de datos. Los
tres valores centrales más utilizados son: la media aritmética, la mediana y la moda. En general, será
necesario buscar los tres valores centrales pues ellos nos aportan informaciones que se complementan.
MODA: Es el valor que se presenta con mayor frecuencia. Se puede utilizar también frente a atributos, en
tal caso la moda es la categoría que más se observó. Cuando la variable es discreta, la moda es el dato que
más se repite. Cuando la variable es continua puede utilizarse como moda el punto medio del intervalo
Página 12 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
de mayor frecuencia, o bien podríamos hablar de clase modal para referirnos a la clase que registró la
mayor frecuencia.
MEDIA ARITMÉTICA O PROMEDIO: Es la suma de todas las observaciones dividido por el número de
observaciones. Supongamos tener n datos estadísticos que notaremos x1 , x2 , x3,…, xn . La media aritmética
o simplemente la media de estos valores, se define como la suma de todos ellos dividida por n, se nota X �,
es decir:
∑ni=1 xi
�
X=
n
Si algunos de los datos están repetidos, y se confecciona la tabla de distribución de frecuencias, la media
se calcula de acuerdo a una expresión que surge de la siguiente consideración: Si el dato x1 se repite f1
veces, el dato x2 , f2 veces y así hasta el dato xk que sucede fk veces, siendo n el número total de
observaciones entonces, la media aritmética es:
∑ki=1 xi ∗ fi
�=
X
n
La media aritmética en distribuciones asimétricas no representa un valor central, ya que es muy sensible
a valores extremos.
• Si a cada dato se le suma una constante, la media de estos nuevos datos es igual a la media de los
datos originales más una constante.
• Si a cada dato se multiplica por una constante, la media de estos nuevos datos es igual a la media
de los datos originales multiplicada por la constante.
Página 13 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
MEDIANA: Es la observación que deja la mitad de los datos (ordenados de menor a mayor) a cada lado.
Si el número total de observaciones n es impar, existirá una única mediana y será el valor que ocupe la
(n + 1)�
posición (ordenada) 2. Esta posición se denomina orden de la mediana.
En la determinación de la mediana no intervienen todos los valores, sólo interesa el (ó los) valores
centrales, por lo tanto, no se ve afectada por la presencia de valores extremos, por lo que es la medida
elegida en el caso de distribuciones asimétricas.
A diferencia de la media, también puede utilizarse como medida de centralización para variables
ordinales.
MEDIDAS DE ORDEN
PERCENTILES: Los percentiles son valores que dividen al conjunto de datos, dejando por debajo de ellos
determinados porcentajes. Por ejemplo, el percentil 10 deja por debajo al 10% de los valores observados.
En general, percentil P-ésimo es el valor por debajo del cual se sitúa el P% de los valores. Se denotan
P1 , P2 , … , P99 .
Para obtenerlos se calcula el orden del percentil correspondiente, por ejemplo, el percentil 15 es igual a
15*(n+1)/100; determinado el orden del percentil queda establecida la clase que lo contiene.
𝑷𝑷∗(𝒏𝒏+𝟏𝟏)
Fórmula general para calcular el orden del percentil P-ésimo:
𝟏𝟏𝟏𝟏𝟏𝟏
CUARTILES: Son tres valores, que dividen al conjunto de datos observados en cuatro partes, de forma tal
que el 25% queda por debajo del cuartil 1, el 50% por debajo del cuartil 2 y el 75% por debajo del cuartil
3; es decir los cuartiles son los percentiles 25, 50 y 75, respectivamente. Se denotan por Q1 , Q 2 y Q 3 .
Página 14 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
MEDIDAS DE DISPERSIÓN
Expresan el grado de variación de los datos. Una medida de centralización como la media, será más
representativa del conjunto si los valores observados se encuentran cercanos a ella, es decir, si están
pocos dispersos. Dos series de mediciones pueden coincidir en media, mediana y moda y sin embargo ser
totalmente diferentes en la distribución que presentan los datos. Por esto, una medida de centralización
siempre debe ir acompañada de una de dispersión. Las más utilizadas son el rango, el rango
intercuartílico, el desvío estándar, la varianza y el coeficiente de variación.
RANGO: Es la diferencia entre la mayor observación y la menor. Conviene siempre especificar ambos
valores ya que pueden aportar importante información. El rango tiene como desventaja que su cálculo se
basa en sólo dos valores, que, además, por ser los extremos, pueden ser muy atípicos. No da información
acerca de cómo se dispersan los datos dentro del intervalo limitado por el menor y el mayor valor. Se nota
con la letra R.
𝑅𝑅 = 𝑉𝑉𝑀𝑀á𝑥𝑥 − 𝑉𝑉𝑀𝑀í𝑛𝑛
RANGO INTERCUARTILICO: Para solucionar en parte el inconveniente que presenta el rango, es que se
pensó en una medida simple que no se base en los valores extremos, el rango intercuartílico (RI) que se
define como la distancia entre el primer cuartil y el tercer cuartil: 𝑅𝑅𝑅𝑅 = 𝑄𝑄3 − 𝑄𝑄1 .
Cuando la distribución de los datos es asimétrica ó la variable es ordinal, esta es la medida de dispersión
que se utiliza.
Página 15 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
DESVÍO ESTÁNDAR: Mide la dispersión de los datos alrededor de la media aritmética. Su uso es correcto
siempre que la media sea la medida de centralización adecuada, o sea en una distribución simétrica o no
sesgada. Tiene las mismas unidades que los datos originales.
El nombre que recibe esta medida antes de extraer la raíz cuadrada se conoce como varianza, y
se nota𝑆𝑆 2 .
COEFICIENTE DE VARIACIÓN: Es una medida de variabilidad relativa que se utiliza para comparar la
dispersión de dos o más conjuntos de datos numéricos cuando:
Los datos se refieren a distintas características de un mismo grupo.
Los datos se refieren al mismo carácter de distintos grupos, que presentan medias aritméticas de
diferente magnitud.
No tiene unidades y expresa la variabilidad como porcentaje de la media. Se obtiene de acuerdo a la
siguiente expresión:
Página 16 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
S
CV% = ∗ 100%
�
X
550 600 550 400 650 700 750 450 550 500 700 800
550 + 600 + 550 + 400 + 650 + 700 + 750 + 450 + 550 + 500 + 700 + 800 7.200
𝑋𝑋� = = = 600
12 12
400 450 500 550 550 550 600 650 700 700 750 800
1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12°
• 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 1: 𝑄𝑄1 = 500 (Es el dato que se encuentra en la posición 3°)
• 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 3: 𝑄𝑄3 = 700 (Es el dato que se encuentra en la posición 10°)
• 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅: 𝑅𝑅 = 800 − 400 = 400
• 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼í𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙: 𝑅𝑅𝑅𝑅 = 700 − 500 = 200
• 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷í𝑜𝑜 𝐸𝐸𝐸𝐸𝐸𝐸á𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛: 𝑆𝑆 =117,2604
Página 17 de 18
Materia: Estadística Aplicada
Carrera: Tecnicatura Superior en Psicopedagogía
Prof. María José Monópoli
Año 2024
Ejemplo 4: Si los datos anteriores se disponen en una tabla de distribución de frecuencias, resulta:
400 ∗ 1 + 450 ∗ 1 + 500 ∗ 1 + 550 ∗ 3 + 600 ∗ 1 + 650 ∗ 1 + 700 ∗ 2 + 750 ∗ 1 − 800 ∗ 1 7.200
𝑋𝑋� = = = 600
12 12
𝑛𝑛 + 1 13
𝑂𝑂𝑂𝑂𝑂𝑂(𝑋𝑋) = = = 6,5° → 𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂𝑂 𝑙𝑙𝑙𝑙 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎, 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑞𝑞𝑞𝑞𝑞𝑞 ∶
2 2
𝑛𝑛 + 1 13
𝑂𝑂𝑄𝑄1 = = = 3,25° ≅ 3° → 𝑄𝑄1 = 500
4 4
𝑅𝑅𝑅𝑅 = 700 − 500 = 200
3 ∗ (𝑛𝑛 + 1) 3 ∗ (12 + 1)
𝑂𝑂𝑄𝑄3 = = = 9,75° ≅ 10° → 𝑄𝑄3 = 700
4 4
Página 18 de 18