Est Unidad1
Est Unidad1
Est Unidad1
MÓDULO 1
ESTADÍSTICA DESCRIPTIVA
LA ESTADÍSTICA Y SU ÁMBITO
Reseña histórica
El vocablo estadística deriva de la voz latina “status” en sus dos sentidos, como estado
político y como situación geográfica.
Los orígenes de esta ciencia son limitados, pues en sus principios se entendía como
estadística la exposición oral de los hechos sobresalientes de un estado, en especial lo relativo a
cantidades de víveres y número de hombres en edad de ir al frente en épocas de guerra. Es decir,
que la palabra Estadística se usa, en un principio, para designar a la ciencia que estudia los
asuntos del Estado.
En los primeros tiempos, la estadística se limitaba a la recolección de datos que tenían que
ver con alguna cuestión determinada. En la actualidad, en cambio, el concepto de Estadística es
mucho más amplio, pues se han ido incorporando nuevas técnicas para el análisis de la
información recopilada y a partir de este análisis se infieren posibles resultados futuros que
sirven como herramientas auxiliares muy valiosas para otras disciplinas.
El origen de la estadística se remonta al siglo XVIII en que, por un lado los juegos de azar,
y por otro la ciencia política, impulsaron los estudios de probabilidad que dieron lugar a la teoría
en la que hoy se sustenta la estadística. En dicho siglo, el interés en la descripción numérica de
fenómenos relativos a ciudades, provincias, países, etc., dio origen a lo que actualmente se
conoce como estadística descriptiva.
La Estadística y la Probabilidad son necesarias y están presentes en la mayoría de las
otras ciencias, a las que pretende servir dándoles rigor en sus deducciones y claridad en la
presentación de resultados. Por este motivo, esta rama de la Matemática es de fundamental
importancia en el análisis de otras disciplinas, como por ejemplo Medicina, Ingeniería,
Geografía, Economía, etc.
La Estadística brinda un conjunto de métodos sumamente útiles en la investigación, pues
tiene mucho que ofrecer al investigador en la planificación, análisis e interpretación de
resultados de su tarea.
La estadística descriptiva, como se ha dicho anteriormente consiste en la presentación de
datos en tablas y gráficos y la determinación de parámetros característicos de un acontecimiento
o experimento, como puede ser, por ejemplo su media o promedio, su valor máximo o mínimo,
etc.
Hoy, la estadística va mucho más allá de brindar una herramienta para organizar, mostrar e
interpretar datos, es la estadística inferencial la que se ha desarrollado con mayor ímpetu en las
últimas décadas y permite extraer conclusiones tomando como base muestras que representan a
una población de la cual se investiga una determinada característica. Los resultados obtenidos en
el análisis de la muestra se extienden a la población y esta generalización permite predecir
comportamientos futuros, lo que está íntimamente ligado a la toma de decisiones. Esto último
implica un riesgo, riesgo que debe ser conocido y evaluado, ya que puede generar decisiones
incorrectas.
2
Estadística para administradores Módulo 1
Definición de Estadística
Por Estadística entendemos aquellos métodos especialmente adecuados para dar significado a
un conjunto de datos, afectados por el azar, es decir que no responden a leyes físicas o
matemáticas, usando instrumentos de la Matemática.
La primera acepción del término se corresponde con las “series estadísticas”, las que
surgen al hablar de estadísticas de producción, de precios, demográficas, etc. Estas series, una
vez elaboradas, sirven para describir al grupo en análisis y constituyen la fase previa para la toma
de decisión y la posterior actuación. Es éste el sentido con el que la palabra Estadística se utilizó
en épocas remotas. Constituía en dicha época una herramienta muy importante para el desarrollo
de la política, sobre todo la económica empresarial y la macroeconómica.
En este capítulo trataremos las cuestiones más vistosas de esta rama de la Matemática: las
tablas y gráficos estadísticos.
Actualmente es muy común ver un informe de cualquier actividad desarrollada por el
hombre acompañado de una tabla que permite visualizar con claridad los resultados obtenidos y
un gráfico que muestra con diferentes grafismos y colores la incidencia de los mismos.
Un periodista enriquece su labor con gráficos que exponen los resultados, por ejemplo, de
una encuesta; un empresario exhibe el estado financiero de su empresa; los políticos describen el
avance de su campaña, etc.
3
Estadística para administradores Módulo 1
En cualquier diario o periódico, en vez de exponer al público una gran cantidad de datos,
los que se vuelven densos y difíciles de ser leídos e interpretados, se publican los mismos
ordenados y recopilados en tablas que ayudan a la lectura y comprensión de los gráficos
adjuntos.
Según definimos, la Estadística es una ciencia que utiliza conjuntos de datos numéricos
para obtener a partir de ellos inferencias basadas en el cálculo de probabilidades. Trabajando
con dichos datos el estadístico, usando técnicas apropiadas, trata de simplificar al máximo la
información disponible para que sea clara y útil.
Por otro lado la Estadística es la ciencia que estudia a los fenómenos regidos por el azar,
midiendo los riesgos y llevando a valores numéricos los resultados de hechos aleatorios,
observando el comportamiento de una muestra y generalizando conclusiones a toda una
población . Estas conclusiones fundamentan la toma de decisiones para que las mismas sean
las acertadas y minimizar así los riesgos de equivocarse. Fundamentalmente, trata de la
generalización hacia las poblaciones de los resultados obtenidos en las muestras y de las
condiciones bajo las cuales estas conclusiones son válidas. El conjunto de estas técnicas se
llama Estadística Inferencial.
EL LENGUAJE DE LA ESTADÍSTICA
Entre los métodos estadísticos encontramos la llamada Teoría de Muestras. Esta teoría se
propone establecer resultados válidos para una población numerosa partiendo de la observación
del comportamiento de una parte de la misma, generalmente pequeña, llamada muestra, la que
bajo ciertas condiciones, resulta representativa de las características de la población en estudio
(de todas formas el problema de la representatividad de las muestras merece un cuidado especial
en cada caso)
Definiremos a continuación muchos de los términos usados en Estadística para precisar
algunos de los más frecuentes:
Población:
“Se denomina población al conjunto de todos los elementos que cumplen una determinada
característica, que deseamos medir o estudiar.”
4
Estadística para administradores Módulo 1
Ejemplos:
1. Si se pretende estudiar la intención de voto de los españoles, la población será el
conjunto de todos los españoles con derecho al voto.
2. Si se desea estudiar el peso de los vacunos de 3 años de la provincia en Entre Ríos, la
población está compuesta por todos los vacunos de dicha provincia.
3. Si se quiere investigar la producción lechera de la Pampa Húmeda, la población estará
compuesta por todos los tambos productores de leche de esta zona.
4. Si se desea conocer el nivel de satisfacción de los afiliados a una obra social, la
población está formado por todos sus afiliados.
5. Si se quiere determinar la vida útil de un lote de lámparas producidas por un turno en
una fábrica, la población está constituida por todas las lámparas del lote.
Muestra:
Ejemplos:
1. Si queremos conocer la opinión sobre las preferencias deportivas de los 743 alumnos
de un colegio puede elegirse una muestra de 40 alumnos, por ejemplo 10 alumnos de
cada curso, seleccionados por sorteo.
2. Para estudiar el peso de los vacunos antes mencionados podemos seleccionar al azar
200 vacunos de distintos sectores de la región.
3. En el caso de las lámparas, la muestra serán un conjunto de 10 ó 20 luminarias
extraídas al azar del lote.
Unidad estadística:
Ejemplos:
1. En el caso antes planteado cada vacuno es una unidad estadística.
2. Si se estudiara el salario del personal de una empresa, la población y la muestra serían
el personal completo de la empresa y cada empleado es una unidad estadística. Si el
personal ascendiera a un número muy grande, podría procederse a hacer un muestreo.
3. En el ejemplo de las lámparas, cada lámpara es una unidad estadística.
Carácter estadístico:
“Cada una de las propiedades o aspectos que pueden estudiarse en los individuos de una
población recibe el nombre de carácter o estadístico”
5
Estadística para administradores Módulo 1
Ejemplos:
1. En el caso de los vacunos antes examinado, el peso de cada vacuno es el carácter
estadístico.
2. En el caso de los salarios de los empleados de una empresa, el monto de cada salario
es el carácter estadístico.
3. Para el lote de lámparas, la duración de su vida antes de fallar es el carácter analizado.
Su clasificación es:
Consideremos un carácter cualquiera, como por ejemplo el "gusto". Este carácter, al ser
observado por un individuo, puede presentar cuatro posibilidades, es decir, es posible percibir
cuatro sensaciones diferentes: dulce, amargo, salado y ácido. Las distintas categorías de un
atributo se llaman modalidades. Por ejemplo si estudiamos el atributo “estado general de un
vacuno”, las modalidades pueden ser “bueno” o “malo”. Si estudiamos una población en relación
con el atributo nacionalidad, podemos considerar dos modalidades, “argentinos” o extranjeros”.
Otros ejemplos son: las razas, los tipos de clima, los idiomas, las preferencias, etc.
Las diversas modalidades de un carácter deben cubrir todas las posibilidades que éste
puede presentar y deben ser exhaustivas. Es decir que un individuo no puede presentar a la vez
más de una de ellas y además debe presentar alguna de ellas.
Por lo tanto, al estudiar algún carácter, como por ejemplo la raza, se deberán considerar
todas las posibles modalidades del carácter (todas las posibles razas), con objeto de poder
clasificar a todos los individuos que se observen.
Escalas nominales: ésta es una forma de observar o medir en la que los datos se ajustan
por categorías que no mantienen una relación de orden entre sí (color de los ojos, religión,
profesión, presencia o ausencia de un factor de riesgo o enfermedad, etcétera).
Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías (grados de fatiga, estadio de un tumor, nivel de conocimientos en una disciplina,
estado sanitario de una población, etcétera.)
6
Estadística para administradores Módulo 1
Se distingue:
“El carácter estadístico es discreto sólo si entre dos valores consecutivos del mismo no puede
existir un valor intermedio. Esto indica que su recorrido es un conjunto definido en el campo de
los o .”
“El carácter estadístico es continuo si entre dos valores cualesquiera de su recorrido puede
existir siempre uno intermedio. Esto indica que su recorrido es un intervalo incluido en el
conjunto de los números reales.”
1) Con el propósito de hacer una evaluación de desempeño y un ajuste de cuotas, Ralph Williams
estuvo inspeccionando las ventas de automóviles de sus 40 vendedores.
.................................................
2) Se estudió el ingreso familiar de 10000 casas de un provincia.
.................................................
3) En un equipo deportivo se tomaron 10 jugadores al azar y se les midió su estatura
.................................................
4) En un examen de selección se analizó el nivel de conocimiento de inglés de los aspirantes
clasificándolo en:
excelente, muy bueno, bueno, regular y malo
.................................................
5) La población de una región se clasificó por su religión
.................................................
6) Un investigador obtuvo las respuestas siguientes a una de las preguntas incluidas en una
encuesta de evaluación: totalmente en contra, en contra, ligeramente en contra, un poco de
acuerdo, de acuerdo, altamente de acuerdo.
.................................................
7) Para abonar el salario familiar en una institución educativa se clasificó a personal según el
número de hijos en edad escolar
.................................................
7
Estadística para administradores Módulo 1
Ejemplos:
1) Carácter estadístico cualitativo: Nivel de conocimiento de inglés de 100 ingresantes a una
Universidad. (Escala ordinal)
Nivel fi
Bueno 62
Regular 25
Malo 13
Total 100
2) Carácter estadístico cuantitativo discreto: número de hijos, en edad escolar, por obrero en
cierta institución.
8
Estadística para administradores Módulo 1
Tiempo en horas: X f
x 300 20
300 x 310 60
310 x 315 105
315 x 320 10
x 320 5
= 200
1 E
ESSPPEECCIIFFIICCAACCIIÓÓNN DDEELL PPRROOBBLLEEM
MAA
En esta etapa se deben:
22 R
REECCOOLLEECCCCIIÓÓNN YY OORRDDEENNAACCIIÓÓNN DDEE DDAATTOOSS
9
Estadística para administradores Módulo 1
Para recopilar los datos es necesario proceder con el mayor orden posible y, por lo tanto
tener en cuenta los siguientes aspectos:
Fijar los procedimientos para realizar el experimento. Por ejemplo, en el caso de aplicar un
cuestionario, no es lo mismo entrevistar a los individuos en la calle que en los domicilios; en
la experimentación se deben señalar las pautas para la ejecución de las tareas de campo o de
laboratorio.
Tener a disposición todos los elementos requeridos para recoger dichos datos, como pueden
ser: libretas de campos, elementos de medición, tablas o grillas para ser completadas,
formularios pre - impresos, etc.
Examinar el tipo de datos requeridos, es decir si son cuantitativos o cualitativos.
Disponer los datos en forma creciente o decreciente, según convenga, para que sean de fácil
ubicación y análisis.
Encontrar el rango de variación de los datos recolectados para hallar entre qué valores
máximos y mínimos se hallan comprendidos.
3 O
ORRGGAANNIIZZAACCIIÓÓNN DDEE DDIISSTTRRIIBBUUCCIIOONNEESS DDEE FFRREECCUUEENNCCIIAASS
Supongamos que se dispone de un registro de datos correspondiente al relevamiento de
100 hogares sobre diferentes aspectos, tales como el número de hijos vivos; superficie de
vivienda, sus ingresos mensuales, etc. realizado en una determinada zona del país durante el año
1999.
De los datos recopilados se desea obtener información tal como valor máximo y mínimo,
valor promedio, valor más frecuente, etc.
Para facilitar el trabajo de búsqueda y no tener que repetirlo cada vez que analicemos un
aspecto del registro, es conveniente organizarlos de alguna manera sistemática; es decir de
mayor a menor o viceversa. Este ordenamiento, según vimos en el punto anterior agiliza la
búsqueda, pero en el caso que analizamos ahora, en el cual el número de datos es muy grande,
deja de tener utilidad. Cuando se dispone de una gran cantidad de valores recopilados es
conveniente condensar, simplificar o resumir la totalidad de las observaciones.
Este es el objetivo de las distribuciones de frecuencias, las que presentan los datos
mediante tablas o cuadros que se conocen con el nombre de tablas de frecuencias.
Si en nuestro universo establecemos una relación entre un atributo susceptible de ser
medido o diferenciado X i y el número de individuos de nuestro universo que lo posee
fi encontramos una distribución de frecuencias.
10
Estadística para administradores Módulo 1
Para nuestro ejemplo, que muestra el nivel de conocimiento de inglés de 100 ingresantes a una
Universidad:
Nivel fi f ir f ir %
Bueno 62 0,62 62
Regular 25 0,25 25
Malo 13 0,13 13
Total 100 1 100
11
Estadística para administradores Módulo 1
Para el ejemplo considerado, es decir el número de hijos en edad escolar de los obreros de una
Institución:
X fi f ir f ir % Fk F kr F kr%
0 8 0,105 11 8 0,105 11
1 13 0,171 17 21 0,276 28
2 20 0,263 26 41 0,539 54
3 30 0,395 40 71 0,934 93
4 5 0,066 6 76 1 100
= 76 1 100
Rango: se denomina así a la diferencia entre el mayor y menor valor observado de la serie de
datos.
R X max X min
12
Estadística para administradores Módulo 1
Intervalos de clase: se llama de esta manera a cada uno de los subintervalos en que queda
dividido el recorrido de la VAC.
Amplitud o tamaño de clase: en una distribución de frecuencias los intervalos pueden tener
todos la misma amplitud o distinta. En general conviene, para simplificar cálculos, que los
intervalos tengan todos la misma amplitud; aunque en muchos casos la distribución en
intervalos de diferente amplitud da una idea más clara del suceso.
La amplitud se obtiene efectuando el cociente entre el rango y el número de intervalos
considerados.
R
c
K
Límites de clase: son los extremos de un intervalo de clase. La determinación de la cantidad
de cifras significativas de los mismos depende de los valores alcanzados por la variable,
pudiendo o no coincidir el límite superior de una clase con el inferior del siguiente.
Es conveniente que ninguno de los valores de la variable coincida con uno de los extremos,
pero si eso llega a suceder se debe indicar expresamente sí se lo incluye como límite superior o
inferior.
Límites reales de clase: (LRI - LRS) el límite real superior de una clase es igual a la semisuma
del límite superior de dicha clase más el inferior de la siguiente. El límite real inferior de una
clase es la semisuma del límite inferior de una clase y el superior de la anterior.
13
Estadística para administradores Módulo 1
Ejemplos:
Se dan a continuación los datos recopilados en la medición de 110 niños entre 0 y 6 meses
de vida. La VAC identifica la talla en centímetros de los niños.
El valor máximo es de 83,5 cm y el mínimo de 58,5 cm siendo, por lo tanto, el rango
de R = 25 cm.
El número de intervalos de clase es de : K = 110 10 y la amplitud c = 25/10 = 2,5 cm.
Adoptamos, para facilitar las cuentas c = 3 cm.
Xi Mi fi f ir f ir% Fk F kr F k r%
56-59 57,5 3 0,0273 2,73 3 0,0273 2,73
59-62 60,5 4 0,0364 3,64 7 0,0636 6,36
62-65 63,5 13 0,1182 11,82 20 0,1818 18,18
65-68 66,5 18 0,1636 16,36 38 0,3454 34,54
68-71 69,5 27 0,2454 24,54 65 0,5909 59,09
71-74 72,5 20 0,1818 18,18 85 0,7727 77,27
74-77 75,5 10 0,091 9,10 95 0,8636 86,36
77-80 78,5 8 0,073 7,30 103 0,9363 93,63
80-83 81,5 5 0,045 4,50 108 0,9818 98,18
83-86 84,5 2 0,018 1,80 110 1 100
110 1 100
14
Estadística para administradores Módulo 1
Diagrama de barras
Se llama diagrama de barras al gráfico que asocia a cada valor de la variable una barra,
generalmente vertical, proporcional a la frecuencia con que se presenta.
70 62
nº de ingresantes
60
Nivel fi
50
Bueno 62 40
Regular 25 30 25
Malo 13 20 13
Total 100 10
0
Bueno Regular Malo
Nivel
Argentina 810
15
Estadística para administradores Módulo 1
Histogramas
Los histogramas son diagramas de barras para las variables continuas, es decir para las que
se agrupan en intervalos de clase.
Un histograma es un conjunto de rectángulos cuyas bases coinciden con el tamaño de
clase, sus puntos medios son las marcas de clase y sus extremos son los límites reales de los
intervalos. En general las alturas corresponden a la frecuencia absoluta de cada intervalo, aunque
en algunas ocasiones la frecuencia absoluta se relaciona con el área de cada rectángulo.
Xi fi 30 27
56-59 3 25
20
nº de niños
18
59-62 4 20
13
62-65 13 15
10
8
65-68 18 10
5
3 4
68-71 27 5 2
71-74 20 0
74-77 10
9
6
-5
-6
-6
-6
-7
-7
-7
-8
-8
-8
56
59
62
65
68
71
74
77
80
83
77-80 8 Talla
80-83 5
83-86 2
110
Pirámides de población
16
Estadística para administradores Módulo 1
Polígono de frecuencias
Si en un histograma se proyectan las marcas de clase sobre las bases superiores de los
rectángulos, y a los puntos obtenidos se los une mediante tramos rectos, se obtiene una
poligonal cuyos vértices representan las frecuencias absolutas de cada una de las clases. Esta
poligonal recibe el nombre de polígono de frecuencias y, en numerosas ocasiones permite
visualizar con mayor claridad el comportamiento de una variable.
Para nuestro ejemplo sobre la talla de los recién nacidos será:
30
27
25
nº de niños
20 20
18
15
13
10 10
8
5 4 5
3 2
0
56-59
59-62
62-65
65-68
68-71
71-74
74-77
77-80
80-83
83-86
talla
17
Estadística para administradores Módulo 1
En los diagramas de sectores cada suceso está representado por un sector circular de una
amplitud proporcional a su frecuencia.
La amplitud de cada sector circular se obtiene mediante una simple regla de tres.
Ejemplos:
Para la siguiente tabla:
ARGENTINA
Idiomas % Grupos étnicos % Religiones %
Español 96 Europeo 85 Católica 93
Italiano 2 Amerindio/Mestizo 15 Protestante 2
Amerindio 1 Judía 1
Otro 1 Otra 4
IDIOMAS
96%
Español
Italiano
Amerindio
1% Otro
2%
1%
Pictogramas
Un pictograma es una representación en la que junto al gráfico de los datos aparece una
imagen relativa a lo que se mide.
18
Estadística para administradores Módulo 1
Cartogramas
Fuente:Programa PCGlobe-1992
Esta representación gráfica se utilizar para mostrar frecuencias acumuladas de las variable
aleatoria discretas. El modelo es una función “escalonada”, es decir con tramos constantes entre
dos valores consecutivos de la variable, cuyos valores se corresponden con las frecuencias
absolutas acumuladas o relativas acumuladas hasta el valor considerado.
Para el ejemplo que muestra el número de hijos en edad escolar de los empleados de una
fábrica es:
X fi Fk F kr F kr%
0 8 8 0,105 11
1 13 21 0,276 28
2 20 41 0,539 54
3 30 71 0,934 93
4 5 76 1 100
= 76
19
Estadística para administradores Módulo 1
Fk
76
71
41
21
8
0 1 2 3 4
X
A veces resulta necesario conocer cuantos datos o que proporción de ellos son menores que
un determinado valor. Para lo que es necesario mostrar las frecuencias acumuladas de una serie
de datos.
Se llama ojiva al diagrama que muestra las frecuencias acumuladas tomadas sobre los
límites reales de cada clase, o sobre la marca de clase. En el eje horizontal se anotan los valores
de los datos y en el eje vertical las frecuencias acumuladas, las frecuencias relativas acumuladas
o las porcentuales acumuladas.
En el ejemplo de la talla de los niños es:
120
108110
100 103
95
fr acumulada
85
80
65
60
40 38
20 20
3 7
0
56-59
59-62
68-71
71-74
80-83
83-86
62-65
65-68
74-77
77-80
talla
20
Estadística para administradores Módulo 1
¿Qué información brinda el ejemplo anterior? ¿Qué conclusión se puede extraer de los
datos dados?
Se llaman parámetros característicos a todos aquellos valores que describen de manera
precisa a un conjunto de datos. Existen distintos tipos de parámetros:
1- Medidas de centralización:
En la mayoría de los casos los datos de una serie de frecuencias tienden a agruparse
alrededor de un punto central, como por ejemplo su promedio. Estos valores centrales son útiles
pues representan a todos los valores de dicha serie y por esto se los conoce también como
medidas de posición.
Ejemplo:
Si los datos son: 25 12 23 28 17 15 25 12 23 28 17 15
X 20
6
Si los datos están agrupados en una serie de frecuencias se calcula su MA de la siguiente
manera:
k xi es el valor i de la variable aleatoria
xi . fi fi es la frecuencia absoluta de dicho valor
X i 1 n es el número total de casos
n k es la cantidad de variables de su
recorrido
21
Estadística para administradores Módulo 1
0 . 8 1 .13 2 . 20 3 . 30 4 . 5
X 2,14
76
Si los datos se presentan en intervalos se debe tomar como X i a la marca de cada clase,
siendo este valor el representativo de toda la clase.
k Mi el valor i de la marca de clase
M i . fi fi la frecuencia de dicho valor
X i 1
n el número total de casos
n k es la cantidad de variables de su
recorrido
22
Estadística para administradores Módulo 1
Ejemplo:
Para los datos dados, previo ordenamiento de los mismos resulta:
17 23
12 15 17 23 25 28 Me = 20
2
Si en cambio tenemos:
12 15 17 23 25 Me = 17
La moda: la moda es el valor de un conjunto de datos que se repite con mayor frecuencia.
Esta medida es la más adecuada si se trabaja con datos cualitativos.
Para el ejemplo no existe un valor que se presente con mayor frecuencia, por lo tanto no
presenta moda. En los casos en que dos valores se repiten mayoritariamente se dice que la
distribución es bimodal y si existen más de dos valores se llama multimodal.
Si los datos se presentan en intervalos de clase la fórmula para su cálculo es:
LRI: límite real inferior de la clase modal
c. 1 c: tamaño de clase
Mo LRI
1 2 1 = diferencia entre la frecuencia absoluta de la clase
modal y la frecuencia de la clase inmediata anterior
2 = diferencia entre la frecuencia absoluta de la clase
modal y la frecuencia de la clase inmediata posterior
23
Estadística para administradores Módulo 1
2 - Medidas de dispersión:
Las medidas de dispersión completan el análisis de una serie de datos pues determinan la
mayor o menor separación de los datos con respecto a su valor central. Es decir que indican el
alejamiento de los valores de la variable con respecto a sus medidas de centralización; siendo por
lo tanto una forma de evaluar la heterogeneidad de los datos.
Medidas de dispersión absolutas:
El rango: es la diferencia entre el mayor y el menor de los valores que toma nuestra variable.
Si bien esta medida brinda una primera idea de la heterogeneidad de los valores de la VA,
presenta el inconveniente de que toma solo los valores extremos y nada dice sobre los
intermedios.
R X max X min
Los desvíos: el desvío de cada valor de la VA con respecto a la media aritmética es igual a la
diferencia entre dicho valor y la media de un conjunto de datos.
di Xi X
La desviación media: es el promedio de los valores absolutos de los desvíos antes definidos.
n
di
DM i 1
n
k
di . f i
Para datos agrupados en series de frecuencias DM i 1
n
La varianza: se define como el promedio de los cuadrados de los desvíos con respecto a la
media aritmética.
n n
di 2 xi X 2
24
Estadística para administradores Módulo 1
2
Si se trabaja con una población la varianza se denota con X , pero si se analizan datos
2
muestrales su símbolo es s .
La desviación típica o estándar: esta es la medida de uso más frecuente y se calcula mediante:
Var( X ) para población s Var( x ) para muestras
Su utilidad consiste en que nos permite comparar la dispersión o variabilidad de dos o más
grupos. Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 kilogramos) cuya
media es de 69,6 kilogramos, y su desviación típica (s) = 10,44 y la tensión arterial de los
mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación típica
de 21,3. La pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si
comparamos las desviaciones típicas observamos que la desviación típica de la tensión arterial es
mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas
diferentes, por lo que calculamos los coeficientes de variación:
10 , 44
CV 0 ,15 15% para la variable peso
69 ,6
21,30
CV 0 ,128 12 ,8% para la tensión arterial
166
Observando los resultados se puede afirmar que la variable peso tiene mayor dispersión.
3 - Medida de concentración:
Los percentiles: son los valores de la variable aleatoria que dividen al conjunto en cien
grupos iguales.
25
Estadística para administradores Módulo 1
Se define como:
X Mo X : media aritmética
As M o : moda
s
s: desviación estándar
26
Estadística para administradores Módulo 1
3 X i: valores de la variable
k Xi X . fi
X : media aritmética
n
As i 1 s: desviación estándar
3 f i : frecuencia absoluta de cada valor de la variable
s
Ejemplo:
Se muestra el histograma correspondiente a una distribución con X 4 ,044 , M o 3 , 667
y s 1,702 ; por lo que A s 0 , 22 .
18
16
14
12
10
8
6
4
2
0
1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9
27
Estadística para administradores Módulo 1
ACTIVIDAD 1
28
Estadística para administradores Módulo 1
Ciudad A Ciudad B
Salarios mensuales Nº de Salarios mensuales Nº de
(en cientos de pesos) obreros (en cientos de pesos) obreros
2-4 3 2-4 7
4-6 15 4-6 8
6-8 18 6-8 10
8-10 20 8-10 15
10-12 16 10-12 9
12-14 14 12-14 8
14-16 4 14-16 6
90 16-18 2
65
6.1* Obtenga la media, mediana y moda, en cada caso.
6.2* Encuentre sus desvíos y las desviaciones medias.
6.3* Halle las varianzas y las desviaciones estándares.
6.4* Encuentre los coeficientes de variación y extraiga conclusiones sobre la
dispersión de los grupos.
6.5* Analice la forma de las distribuciones.
Calcular el puntaje mínimo necesario para ingresar al trabajo sabiendo que solo es
admitido el 30 % de los postulantes.
29
Estadística para administradores Módulo 1
11) Las notas obtenidas por 50 alumnos de un curso en un examen son las siguientes:
6 6 2 8 9 3 6 1 7 9
10 4 4 6 3 7 3 2 6 4
7 6 6 10 3 3 9 2 1 3
7 7 4 10 10 8 4 1 4 6
1 4 9 1 2 1 2 5 4 9
11.1* Si los alumnos que obtuvieron menos de 6 puntos deben rendir un examen en
marzo, ¿cuántos alumnos tienen que rendir dicho examen?
11.2* Calcula la media aritmética.
11.3* Si se premió con un campamento de dos días al 50% de los alumnos que habían
obtenido mayor nota, ¿cuáles son las notas de los alumnos premiados?
12) Se hace un censo para saber cuántos ambientes tienen las viviendas de 20
personas que trabajan en una oficina. Se obtienen los siguientes datos:
4 3 3 2 2 4 5 4 3 3
6 1 2 1 3 5 4 3 4 2
12.1* Calcula la desviación media.
12.2* ¿Cómo justifica teóricamente la afirmación: “los empleados de la oficina, en su
mayoría, viven en viviendas de 3 ambientes”.
30
Estadística para administradores Módulo 1
12.3* Muestre los datos en un diagrama apropiado.
31
Estadística para administradores Módulo 1
SOLUCIONES
1)
2)
2.1* f ( 5 ) 3 f(6) 2
5.2* a) 3 b) 2 c) 14 d) 36
e) 42
6)
7) P70 73, 24
9)
10)
X 80,16 s 10,306 R 37 Me 79,16 Mo1 76 Mo2 88,33 P90 =93,75
32
Estadística para administradores Módulo 1
11)
12)
12.1* DM 1,04
13)
14)
14.1* 2
14.2* 2,3
14.3* mediana
15)
15.2* 9/50=0.18
16)
As 0.078 sesgo a derecha.
33