Estadistica Descriptiva Guia Completa PDF
Estadistica Descriptiva Guia Completa PDF
Estadistica Descriptiva Guia Completa PDF
Objetivos:
1. Definir qué significa estadística
2. Citar algunas aplicaciones de la estadística en administración y otras áreas.
3. Explicar lo que significa estadística descriptiva y estadística inferencial.
4. Distinguir los distintos tipos de características como objeto de estudio de la
estadística.
5. Distinguir entre los diversos niveles de medición
6. Organizar datos originales en una distribución de frecuencias
La estadística, de acuerdo con lo anterior, se podría definir como aquel método que
permite no solo describir el hecho o fenómeno, sino deducir y evaluar conclusiones acerca de
una población, utilizando resultados proporcionados por una muestra.
Finalidad de la estadística
determinar las causas que originan el fenómeno: los cambios que se observan en un
fenómeno pueden tener una o varias causas de origen. El aumento de las exportaciones de
un artículo puede ser causado por un mejoramiento del precio en el mercado externo o por
un volumen de producción superior a la demanda interna o por otras causas que producen
cambios en el comportamiento del fenómeno.
además de lo anterior, la estadística facilita una serie de instrumentos o técnicas que, al ser
utilizadas correctamente, permiten determinar el grado de validez y confiabilidad ya sea
de las predicciones o de las conclusiones obtenidas a partir de muestras.
Población y muestra
El término población se usa para denotar el conjunto de elementos del cual se extrae la
muestra (n). Los compradores a menudo prueban una porción pequeña de cualquier fiambre
antes de comprarlo, determinan a partir de un trozo el sabor de toda la horma. Una fábrica,
para validar el tiempo que dura una lámpara incandescente, prueba solamente algunas e
infiere que el resto se comportará, en términos de duración, de igual forma. Probar todo el
Al realizar cualquier estudio estadístico un factor importante a tener en cuenta son los
costos del mismo, costo que está influenciado por la cantidad de elementos a estudiar, por la
disposición inmediata o no de los mismos, por la dispersión geográfica que presenten, etc.
Cada vez es más frecuente que el tamaño de la población tienda a infinito, es decir, que
la cantidad de elementos que la componen es muy numeroso, esto hace que sea necesario en
estas ocasiones estudiar muestras para inferir como se comporta la población,
fundamentalmente por los dos aspectos mencionados anteriormente: la inutilidad de probar
todos los productos o por el valor en términos monetarios que tendría el estudio.
Muestreo
muestreo aleatorio simple: se basa en la premisa que todos y cada uno de los elementos de
la población tengan la misma probabilidad de ser elegidos, se realiza por sorteo o con la
tabla de números aleatorios.
Uno de los aspectos más importantes al trabajar con muestras es poder definir si la
misma es o no representativa de la población que pretendemos estudiar. El otro aspecto a
dilucidar es cual es el tamaño de la muestra que debemos analizar para poder aplicar los
resultados obtenidos y trasladarlos como estimadores de los parámetros poblacionales.
Con respecto al tamaño de la muestra, existen diversas formas de cálculo, y tienen que
ver con el tipo de población y con la característica que estemos estudiando. Este tema lo
analizaremos más adelante, cuando hayas adquirido mayores conocimientos estadísticos.
Elementos Características
Personas Salarios
Personas Horas trabajadas
Personas Cargos
Departamentos Ventas
Hogar Consumo
Atributos y variables
variables continuas: pueden tomar cualquier valor dentro de los números reales (edad,
temperatura, kilos, etc.)
variables discretas: solo toman valores enteros (cantidad de hijos, materias aprobadas,
etc.)
atributos dicotómicos: son aquellos que aceptan solo dos alternativas; por ejemplo:
ciudadano argentino o extranjero.
atributos policotómicos: son aquellos que aceptan mas de dos alternativas; por ejemplo:
nacionalidad de los barcos ingresados al puerto.
Las estadísticas primarias son aquellos datos obtenidos ya sea por encuestas directas,
mediante la utilización de cuestionarios o como resultado de la observación directa; esta
Estadística 18 Lic. M. Gabriela. Biondolillo
última es una técnica muy utilizada es estudios de carácter científico o en investigaciones de
mercado. Se puede decir también que son datos publicados por quien recoge directamente de
la fuente de información primaria.
Las estadísticas secundarias son aquellas en las que los datos se obtienen de
publicaciones, las cuales pueden ser reproducciones totales o parciales. Son fuentes valiosas
utilizadas en cualquier tipo de investigación.
Los parámetros son todas aquellas medidas que describen numéricamente las
características de una población. También se les denomina valor verdadero ya que una
característica poblacional tendrá un solo parámetro (media, varianza, etc.). Sin embargo, una
población puede tener varias características y, por tanto, varios parámetros.
Autoaprendizaje 1-1
Una compañía comercial de Mendoza pidió a una muestra de 1960 consumidores que
probaran un plato de pescado congelado de elaboración reciente por un fabricante,
denominado “Suspiro de Mar”. De los 1960 consumidores consultados, 1176 dijeron que
comprarían el menú si se pusiera a la venta.
1. ¿Qué informará la compañía al fabricante respecto a la aceptación del “Suspiro de Mar”?
2. ¿Es este un ejemplo de estadística descriptiva o inferencial? Justifica tu respuesta.
Escalas de medición
escala nominal: es aquella en la que no se hace ningún supuesto respecto de las relaciones
que existen entre los valores de las variables. Cada valor se asigna a una categoría diferente,
la que se define mediante un nombre. Por ejemplo: el lugar de nacimiento de una persona
es una variable medida en escala nominal, sexo, tipo de religión, establecimiento donde
cursó sus estudios, medicina que le fue administrada, etc.; la variable no tiene un orden
preestablecido.
escala ordinal: es aquella que surge al ordenar todas las categorías de la variable de
acuerdo a algún criterio. Por ejemplo: clasificar a las personas de acuerdo a su máximo
nivel de instrucción alcanzado en primario, secundario, universitario, etc. constituye un
orden de clasificación. En este caso lo único que sabemos es que el nivel de instrucción
secundario es superior al primario y que el universitario es superior al primario y
secundario; no obstante, no sabemos con certeza cuánto “mayor” es una categoría de la
variable respecto a otra porque no existe una medición de distancia.
escala de intervalo: es aquella que tiene la propiedad de asignar una medición de distancia
entre los valores de la variable. Entonces, cuando se dice que un objeto es mayor que otro,
se puede especificar cuántas unidades de diferencia hay entre ambos o por cuántas
unidades un objeto es mayor que otro. Una característica de la escala de intervalo es que el
punto de origen o punto cero en la escala de medición es un punto de acuerdo o punto
convencional. Otras variables que se pueden medir con escala de intervalo son: altura,
temperatura, tiempo, riqueza e inteligencia. En síntesis, la escala de medida de intervalo
permite estudiar diferencias entre valores de la variable, pero no respecto de sus
magnitudes proporcionales.
escala de razón: es aquella que presenta todas las propiedades de orden y distancia de una
escala de intervalo adicionando el punto 0 o punto de origen. En una escala de razón, al
igual que en una escala de intervalo, las unidades de medida son equidistantes unas de
otras con la única diferencia que, en las escalas de razón, existe un punto cero
correctamente definido. Por ejemplo: en cualquier distancia física entre objetos, medida en
metros o centímetros, existe una distancia cero definida como la total ausencia de
distancia entre ellos. La existencia de un punto cero definido implica que se pueden
efectuar comparaciones proporcionales y cualquier operación matemática apropiada para
números reales.
DATOS
caracteres caracteres
cualitativos o cuantitativos o
atributos variables
escala de escala de
escala nominal escala ordinal
intervalo razón
Autoaprendizaje 1-2
1. El INDEC informó acerca de las poblaciones en las siguientes provincias:
Provincia Número de personas
Mendoza 750.000
San Juan 530.000
San Luis 620.000
La Rioja 480.000
La calificación de un examen especial aplicado al personal reclutado por una empresa industrial para medir
sus conocimientos en el área son:
Puntuaciones Número de solicitantes
90-99 42
80-89 19
70-79 7
60-69 4
Menos de 60 3
¿De qué tipo de característica se trata?
¿Qué escala de medición reflejan estos datos? ¿por qué?
Método estadístico
Planeamiento:
Algunas veces los datos son intrínsecos a la propia actividad de la empresa que los recopila
en un momento determinado. Se dice, entonces, que el dato es interno y la fuente de datos
interna. Tal sería, por ejemplo: la información que puede proporcionar el departamento de
personal de una empresa sobre la categoría, edad o sueldo de sus empleados.
Observación directa: de la realidad que se quiere estudiar; esta es una técnica muy usada en
varias actividades, los supermercados utilizan este método para estudiar las reacciones de
los consumidores ante la ubicación de diferentes productos en distintos lugares del local;
también lo utiliza el laboratorista químico cuando mezcla diferentes sustancias para
observar las reacciones. En Francia para determinar que consumen las familias y en que
cantidades lo hacen, se estudia la basura de las mismas.
por correo: es la más barata de las tres, pero adolece del problema que sólo se
reciben pocas respuestas, todavía en nuestro país no se ha realizado campañas
para concientizar a la comunidad de la importancia de las respuestas, para que
obtener mayor cantidad de respuestas se suele sortear algún premio atractivo
entre lar respuestas recibidas.
Calendario de trabajo: atento que los resultados estadísticos varían conforme se modifica
la realidad, es importante determinar las fechas de inicio y finalización del mismo, a fin de
tener en cuenta las variables que pudieran influenciar el entorno en el lapso en que se realiza
la investigación. Si estuviéramos estudiando la opinión de la población respecto al sida, y en
medio de la investigación apareciera una vacuna para esta enfermedad, seguramente las
opiniones se modificarían sustancialmente.
Selección y preparación del personal: es importante contar con personal capacitado para
esta tarea, si bien la misma es relativamente sencilla, es necesario instruir al encuestador
sobre su rol de asentamiento de respuestas, y que bajo ningún punto de vista debe influenciar
para obtener una respuesta determinada; asimismo jamás deberá entrar en discusiones de
ninguna naturaleza con un entrevistado.
Recolección
Control de encuestas: esta tarea consiste en verificar si han sido relevadas todas las
encuestas, si las mismas presentan preguntas “trampa” observar como reaccionó el
encuestado ante esta situación; si ante una pregunta de validación respondió
equivocadamente se debe rechazar la encuesta.
Cumplimiento de los plazos prefijados: atento que este tipo de estudio muy difícilmente
pueda trasladarse en el tiempo, es muy importante que se respeten los plazos establecidos en
el calendario de trabajo, a fin de no realizar un análisis sobre variables que pudieran haberse
modificado.
Procesamiento
Existen tres formas de sistematizar los datos: datos no agrupados, datos agrupados
sólo por su frecuencia y datos agrupados por frecuencia y en intervalos de clase.
Los datos no agrupados son una serie de valores recolectados por cualquiera de los
métodos de recolección y donde figuran todos y cada uno de ellos.
Veamos ahora, paso por paso, cómo se elabora una tabla de frecuencias para la variable
discreta. Pero antes te presento la simbología que se utiliza en la elaboración de estas tablas:
N: tamaño poblacional
n: tamaño de la muestra
fri : frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el tamaño de la
muestra o el tamaño de la población.
Ri : frecuencia absoluta acumulada, se hace por medio de sumas sucesivas de manera que la
última frecuencia absoluta acumulada será igual a n.
En este proceso se requiere, en primer lugar, determinar los valores que toma la
variable (m). Con los datos anteriores correspondientes al número de figuras de porcelana
desperfectas por caja examinada, encontramos que los valores son 0, 1, 2, 3, 4, entonces m=5.
En función de esto armamos la tabla de frecuencia:
xi ri fri Ri Fri
0 3 3/30= 0,10 3 0,10
1 6 6/30= 0,20 9 0,30
2 12 12/30= 0,40 21 0,70
3 7 7/30= 0,23 28 0,93
4 2 2/30= 0,07 30 1,00
30 1,00 -- --
Se llaman límites del intervalo a los valores extremos de dicho intervalo. Por ejemplo,
dado el intervalo 160-170 cm., diremos que 160 es el límite inferior (L.I.) y que 170 es el límite o
extremo superior (L.S.). Podría pensarse que los extremos son valores que están incluidos en
dos intervalos de clase, para que esto no suceda consideraremos incluido dentro de cada
intervalo solo al extremo inferior (160 cm.) y el extremo superior (170 cm.) se considera
incluido en el intervalo siguiente 170-180 cm.
Otro criterio para dejar bien sentado a qué intervalo pertenecen los extremos es tomar
lo que se conoce como límites exactos, en nuestro ejemplo de estaturas se tomaría como sigue:
sin embargo esta notación es mas engorrosa y menos clara que la anterior.
Los criterios a seguir para elegir la amplitud y el número de intervalos de clase son:
en cuanto a la amplitud de cada clase podemos considerar como una elección acertada es
elegir clases de mayor amplitud en las regiones donde el carácter es mas raro y de menor
amplitud en el resto. Esto sucede si elegimos clases de amplitud variable; sin embargo, es
mucho mas general elegir las clases con amplitud constante, por simplicidad. Para calcular
la amplitud del intervalo (c) se realiza la siguiente operación: “c= rango / m”
Los estudios estadísticos están sujetos a una serie de factores que, según se manejen,
harán que el estudio sea suficientemente fiable o no lo sea. Además de estos factores, existe
otro tipo de error que podríamos considerar numérico, debido al redondeo de los cálculos, etc.
Dichos errores están implícitos en una buena parte de los estudios realizados.
Con respecto a la agrupación de los datos en clases o intervalos, hay que decir que
lleva implícito un cierto error en el cálculo posterior de las distintas medidas de la
distribución, y este error será mayor cuanto mayor sea la amplitud de los intervalos elegidos.
mayor número de clases implica menos claridad pero mas exactitud y precisión;
menos clases y mas amplias significa ganar en claridad de exposición y facilidad de cálculo,
pero en detrimento de la exactitud y precisión a conseguir en los cálculos.
Veamos ahora, paso por paso, cómo se elabora una tabla de frecuencias para la variable
continua. Antes te presento la simbología que se utiliza en la elaboración de estas tablas,
muchas de las cuales coinciden con las utilizadas en la elaboración de las tablas para la
variable discreta, tal como lo viste precedentemente.
N: tamaño poblacional
n: tamaño de la muestra
fri : frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el tamaño de la
muestra o el tamaño de la población.
Ri : frecuencia absoluta acumulada, se hace por medio de sumas sucesivas de manera que la
última frecuencia absoluta acumulada será igual a n.
Fri : frecuencia relativa acumulada, para calcularla se procede igual que en la frecuencia
anterior.
L.I. - L.S.: los intervalos en los que se divide la variable continua. Siendo L.I. el límite
inferior y L.S. el límite superior del intervalo.
rango: diferencia que hay entre el valor máximo y el valor mínimo de la serie estadística.
1. se determina el valor máximo y el valor mínimo que toma la variable xi, en este caso xmin=
47 y xmax= 92;
3. se hace necesario determinar el número de intervalos (m) que se utilizará para agrupar los
datos, aplicando la regla de Sturges con la cual se obtiene una aproximación aceptable
sobre el número de intervalos necesarios; m= 1 + 3,3 log 30, lo que arroja un resultado de
5,87. El número de intervalos estará entre 5 y 6, utilizaremos en nuestro ejercicio seis
intervalos (m=6).
l. C. xi ri fri Ri Fri
46 - 54 50 3 0,10 3 0,10
54 - 62 58 6 0,20 9 0,30
Autoaprendizaje 1-3
Los ingresos mensuales (en pesos) de una pequeña muestra de nuevos operadores de
computadora en el área del Gran Mendoza son: $1650, $1475, $1760,
$1540, $1495, $1590, $1625 y $1510.
1. ¿Cómo se denominan los datos precedentes?
2. Utilizando como primera clase $1400 – $1499, como segunda $1500 –
$1599, y asi sucesivamente, organiza los ingresos mensuales en una
distribución de frecuencias.
3. ¿Cómo se llaman los números en la columna derecha de la distribución de frecuencias?
4. Describe la distribución de ingresos mensuales.
Los salarios mensuales (en pesos) de una muestra de 87 empleados de una empresa fueron redondeados al peso
más cercano. Van desde $1041 hasta $2548.
1. Organiza los datos en siete clases utilizando la misma amplitud para cada clase, teniendo
en cuenta los datos precedentes.
2. ¿Con qué intervalos de clase sería más fácil trabajar?
3. La fábrica de gaseosas La Sed proyecta lanzar al mercado un nuevo sabor. Se realiza un test
de aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 10
puntos, para medir el grado de aceptación. Los puntos obtenidos en los 30 niños fueron los
siguientes: 2, 6, 8, 7, 4, 5, 10, 6, 6, 7, 6, 7, 3, 8, 7, 6, 8, 6, 5, 4, 7, 8, 5, 7, 6, 7, 2, 7, 2, 7. La muestra
estuvo compuesta por igual número de niños de ambos sexos, de 6 a 12 años,
pertenecientes a una concentración escolar del barrio El Terrón de la ciudad de Cenizas.
Responde:
¿cuál es la población?
¿cuál es la muestra?
¿la característica es cualitativa o cuantitativa?
¿cuál es la variable?
¿de qué tipo es la variable?
construir una distribución de frecuencias incluyendo todas las frecuencias conocidas
¿cuál es el valor de m?
6- El jefe de personal de una empresa encontró que el número de días que los 50 empleados
habían tomado por incapacidad médica durante el año eran:
1 20 9 7 15 9 6 10 22 2
22 10 3 2 3 10 10 3 6 25
9 10 6 5 3 22 9 1 5 10
10 9 9 25 9 25 5 3 6 9
7 16 4 15 25 5 9 10 3 6
Objetivos:
1. Presentar datos utilizando representaciones usuales como las gráficas de líneas, de
barras y de sectores.
2. Representar la distribución de frecuencia para la variable continua en un histograma,
polígono de frecuencias y ojiva.
3. Elaborar cuadros estadísticos para la presentación de información.
4.
Elaboración de un cuadro
No hay que olvidar que los cuadros o tablas corresponden a arreglos sistemáticos de
datos. La forma del cuadro depende en gran parte del propósito para el cual se ha preparado.
A pesar de que no se tienen reglas fijas para la elaboración de cuadros, si se pueden observar y
aplicar algunas de las recomendaciones, que en forma muy general, se han hecho y como tales
se han aceptado:
El cuadro debe ser lo más sencillo posible, siendo preferible la elaboración de dos o más
cuadros, en vez de uno solo que contenga demasiados detalles respecto de las
características examinadas.
Si en una publicación o informe se tienen dos o más cuadros, estos deben ser numerados.
Todo cuadro debe tener un título, el cual debe ser claro y conciso, que responda a los
interrogantes: qué, cómo, dónde y cuándo se hizo, como por ejemplo: “Encuesta sobre el
precio de artículos de primera necesidad en Luján de Cuyo - Mendoza - Marzo de 1.998”. El
título podría clarificarse aun más si se establece a quién se hizo la investigación: amas de
casa, comerciantes minoristas, etc.
El titulo debe tener una separación del cuadro, dejando por lo menos dos espacios
intermedios. Algunos consideran que el título debe ser colocado en la parte superior del
cuadro en tal forma que el lector se entere de inmediato sobre el contenido del cuadro;
otros son partidarios de colocarlo debajo.
Se debe tener cuidado con el contenido del cuadro, ya que si no se conoce la información o
cantidad, el espacio correspondiente no debe dejarse en blanco o colocar ceros y en ese
lugar se colocarán guiones. Ahora, si en lugar de no conocer la información, la situación es
que no se tiene, se debe hacer una indicación o llamada colocada en dicho espacio. Se
presentan a continuación algunas convenciones utilizadas en la confección de cuadros:
El cuadro se cerrará por encima y por debajo con líneas mas fuertes (o doble línea) que las
utilizadas en el interior del cuadro.
Pie: será utilizado un espacio debajo del cuadro para dar referencia al origen de los datos,
es decir, de dónde fueron tomados. Además, para dar explicaciones sobre las abreviaturas,
símbolos o códigos utilizados; también servirá dicho espacio para indicar si el cuadro fue
tomado de otra publicación, indicando con claridad la fuente, autor, página, etc.
CUADRO Nº
TITULO (qué, cómo, cuándo, dónde)
Título en mayúsculas
ENCABEZAMIENTO (título en Subtítulo en minúscula TOTAL
mayúsculas)
Sub -
total
TOTALES
PIE
Elaboración de gráficos
Cuando el informe se hace en forma textual, se trata de una presentación simple y limitada,
tal como sucede en los reportajes y artículos periodísticos, donde los datos aparecen
intercalados con los comentarios y con las conclusiones derivadas de las interpretaciones de
los mismos, en una forma ligera y descriptiva.
Ventajas y Desventajas
La forma de la gráfica depende en gran medida del gusto de la persona que la elabora;
sin embargo, hay ciertos principios generales que se deben tener en cuenta en el logro de una
buena gráfica:
La mejor gráfica es la mas simple. Las líneas y símbolos usados deben ser los estrictamente
indispensables para una mejor visualización de la información.
Toda gráfica debe llevar un título que aclare el contenido de la misma. Debe responder a
los interrogantes: qué, cómo, cuándo y dónde.
La posición del título en la gráfica se considera de gusto personal, de ahí que algunos
aconsejan que debe ser colocado en la parte superior y otros, que debe estar en la parte
inferior.
Las líneas que llevan escalas deben dibujarse mas gruesas que las demás coordenadas; a su
vez, las líneas que representan los datos o la variable deben ser mas gruesas que las escalas.
La lectura de la escala del eje horizontal se hace de izquierda a derecha y la lectura del eje
vertical, debe hacerse de abajo hacia arriba.
En toda gráfica se debe explicar la fuente de donde fueron obtenidos los datos; además,
aclarar las escalas, leyendas, notas y convenciones que ayuden a identificar las
características presentadas.
Los gráficos deben ser lo bastante sencillos para procurar una idea clara y ser
comprensibles sin la ayuda de las descripciones del texto.
Los datos numéricos sobre los que se basa la gráfica deben presentarse en cuadro adjunto,
si no son incluidos en la misma gráfica.
Cuando los valores representados en un gráfico son elevados y varían poco, se pierde un
gran espacio por debajo de la curva, siendo preciso entonces adoptar una escala bastante
pequeña que desdibuja las variaciones. Por ello es aconsejable interrumpir el cuadriculado
mediante un corte horizontal o vertical según el eje en cuestión.
Cuando la gráfica presenta mas de una variable, debe hacerse una muy clara
diferenciación por medio de leyendas, notas o signos convencionales.
Tipos de gráficos
Hay numerosos tipos de gráficas pero vamos a ver detenidamente aquellas que son
consideradas como las mas usuales:
15
10
0
1989 1990 1991 1992 1993 1994 1995 1996 1997
25
45 20
40 15
35
30 10
25
20 5
15
0
10
5 1 2 3 4 5 6 7 8 9
0
10-20
30-40
40-50
50-60
60-70
70-80
80-90
90-100
20-30
ojivas: para el trazado de esta gráfica, en primer lugar, se ubican los puntos en el plano
cartesiano. Dichos puntos se determinan teniendo en cuenta el límite superior de cada
intervalo y las respectivas frecuencias absolutas o relativas acumuladas; luego se unen esos
puntos, partiendo desde el límite inferior del primer intervalo ubicado en el eje horizontal.
Se utiliza para la representación de la variable continua.
200
180
160
140
120
100
80
60
40
20
0
0-10
10-20
30-40
40-50
50-60
60-70
70-80
80-90
90-100
20-30
pictogramas: es una forma de representar las cantidades estadísticas por medio de dibujos,
utilizando para ello objetos y figuras; las figuras deben explicarse por si mismas. Se
acostumbra que el tamaño sea uniforme, indicándose aparte de las figuras el valor de una
de ellas. Por otro lado, el tamaño puede variar y la altura de cada objeto estará dada por la
frecuencia absoluta o relativa; pero una inmensa mayoría considera que dicha
representación puede conducir a errores en su interpretación, especialmente cuando los
tamaños de las figuras no son proporcionales a la cantidad que se representa. Si los
tamaños de las figuras no son uniformes pero sí proporcionales, se tendrá una
representación exacta pero poco expresiva.
diagramas de barras: es uno de los gráficos mas utilizados por su sencillez y por la
facilidad que ofrece para representar las características cuantitativas y cualitativas. Pueden
ser:
Verticales
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
Horizontales
1996
1995
1994
1993
1992
1991
1990
0 5 10 15 20 25 30
Simples
10
5
0
1990 1991 1992 1993 1994 1995 1996
Subdivididas
60
50
40
30
20
10
0
1990 1991 1992 1993 1994 1995 1996
Valor 1 Valor 2
Absolutas
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
20,00%
15,00%
10,00%
5,00%
0,00%
1990 1991 1992 1993 1994 1995 1996
Bidireccionales
30
25
20
15
10
5
-30 -20 -10 0 10 20 30
0 Export. Importac.
1990 1991 1992 1993 1994 1995 1996
Valor 1 Valor 2
Apareadas
1991
16%
1995
14%
1992
12%
1994
16% 1993
13%
diagramas de líneas: es otra de las gráficas muy utilizadas pero, al mismo tiempo, la que
presenta mayores dificultades en la visualización de los datos, dando lugar, algunas veces, a
imágenes o conclusiones erróneas debido a la mala confección de las escalas de los ejes.
También se los denomina curvas de sucesión porque generalmente se refieren a variables
observadas durante un periodo. Dichas variables se denominan series de tiempo o series
cronológicas: la variable tiempo se coloca en el eje horizontal y los valores que toma la
variable en el eje vertical.
Autoaprendizaje 2-1
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
1. Elabora una gráfica adecuada para presentar la siguiente información: durante unos 5 meses
se construyeron 134 km. de carretera en la siguiente forma: el primer mes 3,60% del total, el
segundo mes 7,60% del total, el tercer mes 15,30% del total, el cuarto mes 24,50% del total y el
último mes el 49% restante.
5. Realizar el gráfico que muestre los datos obtenidos de una encuesta realizada en 1.999 en
la zona este de la provincia de Mendoza sobre la cantidad de personas que adquieren el
diario.
5. Grafica y determina el valor probable que tomará la función de acuerdo a la tendencia que
se observa en el gráfico.
6. Realiza un gráfico que permita ejercer control entre los costos presupuestados y los reales
según la tabla siguiente:
Objetivos:
1. .Calcular y aplicar adecuadamente la media aritmética, la mediana y el modo,
teniendo en cuenta sus ventajas y desventajas.
2. Identificar la posición de la media, la mediana y el modo tanto en distribuciones
simétricas como asimétricas.
3. Calcular y aplicar adecuadamente las medidas de dispersión, asimetría y
apuntamiento a un conjunto de datos organizados en una distribución de
frecuencias.
4. Calcular y comprender los usos del coeficiente de variación y de asimetría.
Introducción
Cuando realices la lectura verás que es necesario ajustar la simbología, dado que la
empleada en este material no coincide con la del libro. Por otra parte, la exposición del libro
Estadística 52 Lic. M. Gabriela. Biondolillo
es más amplia, de manera tal que deberás utilizar este material como guía para identificar los
temas relevantes para nuestros objetivos.
Media aritmética
Concepto: para datos no agrupados, la media aritmética es igual a la suma de todos los
valores de la variable dividida entre el número total de valores. La fórmula es:
X= Xi
n
Donde:
Para calcular la media aritmética para datos agrupados por su frecuencia, la fórmula
es:
X= Xi . ri
n
Donde ri es la frecuencia asociada a cada uno de los valores de la variable.
Características
mas conocido
mas utilizado
Estadística 53 Lic. M. Gabriela. Biondolillo
Ventajas
Desventajas
no puede aplicarse cuando no están definidos los valores extremos de los intervalos de
clase
Propiedades
la suma de las desviaciones del valor de la variable respecto de la media es igual a cero (0);
la media del producto de una constante por una variable es igual a multiplicar la constante
por la media de la variable;
la media de una variable mas (o menos) una constante es igual a la media de la variable mas
(o menos) la constante;
x = x1 . n1 + x2 . n2
n1 + n2
Autoaprendizaje 3-1
Mediana
La Mediana (Me) es aquel valor de la variable que supera la mitad de las observaciones
y a su vez es superado por la otra mitad de las observaciones.
Características:
Se aplica:
Cálculo:
Me de una serie con datos no agrupados, se ordenan los datos de manera creciente o
decreciente y luego se calcula el orden de la mediana. Con número impar de observaciones,
el valor de la mediana está dado por el valor de la variable cuya ubicación en el arreglo de
datos coincide con el orden de la mediana. Con número par de observaciones, el valor de la
mediana está dado por la media aritmética de los dos valores centrales del arreglo de datos.
Me de una serie con datos agrupados por frecuencia y en I.C.: en primer lugar se calcula
el orden de la mediana como n/2 y con ese valor ubicamos la clase mediana según la
columna de Ri (frecuencia absoluta acumulada) teniendo en cuenta que el valor de Ri debe
ser igual o superior al valor dado por el orden de la mediana. Luego aplicamos la siguiente
fórmula:
Donde:
Me de una serie con datos agrupados solo por la frecuencia: en primer lugar se calcula el
orden de la mediana como n/2 y con ese valor ubicamos la clase mediana según la columna
de Ri (frecuencia absoluta acumulada) teniendo en cuenta que el valor de Ri debe ser igual
o superior al valor dado por el orden de la mediana. Luego, el valor de la mediana es el valor
de la variable que corresponde a la Ri indicada.
Autoaprendizaje 3-2
El número de paros en el trabajo, en la industria automotriz para meses
seleccionados son: 6, 0, 10, 14, 8, 0.
1. ¿Cuál es la mediana del número de paros?
2. ¿Cuántas observaciones están por debajo de la mediana? ¿cuántas por
encima?
Modo
El Modo (Mo) es aquel valor de la variable que mas veces se repite, es decir, presenta
la mayor frecuencia.
Estadística 56 Lic. M. Gabriela. Biondolillo
Características
Se aplica:
Cálculo:
para datos no agrupados y para datos agrupados por la frecuencia se busca el valor de la
variable que mas veces se repite en función de la columna ri (frecuencia absoluta).
para datos agrupados por la frecuencia y en I.C. se aplica la siguiente fórmula, teniendo en
cuenta el intervalo de clase que presenta la mayor frecuencia absoluta (ri)
Mo= L.I. + ( 1 / 1 + 2) . c
Donde:
L.I. es el límite inferior del intervalo modal (el que tiene mayor frecuencia absoluta)
Producción Q de semanas
Menos de 5 6
5-7 9
7-9 15
9-11 18
Mas de 11 2
Total 50
calcular para cada variable en estudio (zona, tamaño, ventas) la medida que mejor la
represente.
5. Una empresa ha determinado para el mes de marzo de 2.002 una venta promedio de
$53.000; con posterioridad descubre que un error en el programa de la computadora ha hecho
que este disminuya en un 18% el importe de cada factura. ¿Cuál es en realidad el valor de la
venta promedio?
6. Una empresa se encuentra discutiendo los aumentos salariales con el sindicato, mientras el
representante sindical propone un aumento de $100 para cada empleado, el gerente quiere un
aumento de 25% para cada trabajador. Le solicitan su asesoramiento y Ud. debe indicar en
función de la distribución actual de salarios qué aumento le conviene económicamente aplicar
a la empresa y qué aumento le conviene a cada uno de los trabajadores.
8. De la distribución del peso de los paquetes que se entregan en la empresa “A” por día,
calcular: media, mediana y modo.
9. En una fábrica textil se hicieron observaciones en una sección de 400 telares, en tiempos al
azar, durante diez días para determinar el número de telares que estaban trabajando en
cualquier momento. Calcular media, mediana y modo.
10. Calcular la media y la mediana del sueldo semanal de los veinte empleados que se
presentan a continuación: 42, 42, 68, 69, 69, 72, 72, 72, 72, 73, 74, 74, 75, 76, 77, 77, 79, 79, 79,
80.
Ganancias Semanas
0-4 3
4-8 8
8-12 24
12-16 30
16-20 25
20-24 6
24-28 4
Tipos:
rango, oscilación o recorrido
varianza
desviación típica o estándar
coeficiente de variación
Rango
Varianza
Varianza (S2) es la media aritmética de los cuadrados de las desviaciones de los valores de la variable
respecto de la media aritmética
S2 = ( Xi - X )2 (datos no agrupados)
n
Propiedades de la varianza
la varianza de la suma (o resta) de una variable más (o menos) una constante, es igual a la
varianza de la variable S2 (x + k) = S2 (x)
Desviación Típica
se utiliza para comparar dos o más distribuciones cuando están dadas en la misma unidad
de medida para determinar cuál de ellas presenta mayor o menor variabilidad absoluta
Autoaprendizaje 3-3
Los tiempos de servicio en una muestra de taladros disponibles para su
alquiler en una empresa de herramientas se organizaron en la siguiente
tabla:
Antigüedad
(en años) Número
2-4 2
5-7 5
8-10 10
11-13 4
14-16 2
1. ¿Cómo se denomina este agrupamiento?
2. Calcula el tiempo medio de funcionamiento de los taladros.
3. Estima la desviación estandar muestral.
4. ¿Cuál es la varianza muestral?
Coeficiente de Variación
d = (s / x) . 100
Autoaprendizaje 3-4
A un gran grupo de conscriptos de la Fuerza Aérea se le aplicaron dos pruebas
experimentales: una de aptitudes mecánicas y otra de destreza manual. La media
aritmética de la calificación en la prueba de aptitudes mecánicas fue de 200, con una
desviación estándar de 10, la media y la desviación estandar para la prueba de
Medidas de Asimetría
distribución simétrica: X = Me = Mo
coeficiente de sesgo a3 = m3 / S3
donde:
es muy importante porque indica la posición del sesgo (como los coeficientes de Pearson) y
también el porcentaje de observaciones de la distribución que está sesgado.
Autoaprendizaje 3-5
Las ventas semanales en una muestra de tiendas de suministros eléctricos, se
organizaron en una distribución de frecuencias.. Se calculó la media de las ventas
semanales como $105900, la mediana como $105000 y el modo como $104500.
1. Representa las ventas en forma de un polígono de frecuencias y
observa la ubicación de la media, la mediana y el modo en el eje X.
2. ¿La distribución es simétrica, asimétrica positiva o asimétrica
negativa? Explica tu respuesta.
Estadística 65 Lic. M. Gabriela. Biondolillo
Autoaprendizaje 3-6
Una muestra de operadores de captura de datos muy experimentados, reveló que su
velocidad media al teclear es de 87 palabras por minuto, con una mediana de 73. La
desviación estandar es 16,9 palabras por minuto. ¿Cuál es el coeficiente de asimetría?
Interprétalo.
donde:
m4 = (xi – x)4 . ri
n
Simétrica: X = Me = Mo
Coeficiente de sesgo a3 = 0
Mesocúrtica: K = 3
entre la media y una vez la desviación típica por encima y por debajo, se tendrá el 68,3% de
las observaciones
entre la media y tres veces la desviación típica por encima y por debajo, se tendrá el 99,7%
de las observaciones
a partir de tres, por mas que se aumente el número de veces que se repite el valor de la
desviación típica, no se tendrá el 100% puesto que la curva se aproxima al eje horizontal
pero no lo toca (curva asintótica)
4. Hay varias medidas posibles del desempeño de ventas, entre ellas la constancia con que un
vendedor cumple con las metas establecidas. Los datos siguientes representan el porcentaje
de la meta lograda por tres vendedores en los últimos 5 años.
Patricia 88 68 89 92 103
Juan 76 88 90 86 79
Francisco 104 88 118 88 123
en función de lo expresado, ¿cuál de los vendedores tuvo el mejor desempeño?
6. Una empresa analiza los cien últimos balances mensuales y encuentra que sus ganancias
son normales a través de ellos. Calcular las medidas necesarias para comprobar esta
afirmación.
Ganancias Cantidad
55-59 2
7. Una empresa holliwodense de repartos, está escogiendo un grupo de extras para una
película, las edades de los primeros 20 varones entrevistados son: 50, 54, 56, 55, 55, 61, 49, 60,
52, 51, 57, 59, 56, 62, 57, 52, 56, 54, 59, 49. El director de la película quiere hombres cuya edad
se agrupe estrechamente alrededor de los 55 años. Como es un entusiasta aficionado de la
estadística, sugiere que una desviación estándar de 3 años sea aceptable. ¿Cumple con el
requisito este grupo de extras?
9. Con las dos siguientes muestras se describen las edades de los estudiantes que asisten al
programa diurno y al programa nocturno de la carrera de administración en la Universidad
Central. Si la homogeneidad del grupo escolar es un factor positivo del aprendizaje, aplica una
medida de variabilidad relativa que indique a cuál de los dos grupos será mas fácil enseñarle.
Programa diurno: 24, 30, 28, 23, 25, 22, 26, 27, 28, 25.
Programa nocturno: 26, 33, 29, 28, 27, 29, 33, 34, 27, 28.
10. Con el propósito de estimar la demanda futura, la Fiat efectuó un estudio en el que
preguntó a un grupo de matrimonios cuántos automóviles deberán poseer en el año 2.001 los
que deseen economizar combustible. En cada matrimonio la compañía sacó el promedio de las
respuestas de ambos cónyuges para obtener la respuesta global del matrimonio. Las
respuestas fueron después tabuladas en una distribución de frecuencias, ¿cuáles son sus
características respecto de la distribución normal?
Número de 0-0.49 0.50-0.99 1.00-1.49 1.50-1.99 2.00-2.49 2.50-2.99
autos
Frecuencia 2 14 23 7 4 2
Objetivos:
1. Conocer las características de una serie cronológica.
2. .Identificar los componentes de una serie de tiempo y las características de cada uno
de ellos
3. Analizar el objetivo de la regresión lineal simple.
4. Determinar una ecuación que pueda usarse en pronósticos.
5. Presentar las consideraciones en que se basa el análisis de regresión.
6. Determinar la fuerza de la relación entre las variables a través del uso del coeficiente
de determinación.
Dentro de estas series, merecen una atención especial aquellas que tienen el tiempo
entre sus variables, series cronológicas o series de tiempo.
Concepto
Estas series podemos expresarlas matemáticamente como una función del tiempo Y=
F(t) y estudian el comportamiento de una variable Y (producción, ventas, precios, etc.) a lo
largo del tiempo t.
En cuanto a las unidades de tiempo, algunas tienen duración constante (horas, días,
etc.), pero otras son variables (meses, años, etc.). Este carácter variable puede influir en los
resultados de algunos estudios, y debe tenerse en cuenta al elegir las unidades de tiempo.
Representación gráfica
Los valores de la variable Y son distintos en cada periodo, de forma que la gráfica de la
función evoluciona al transcurrir el tiempo. A esta evolución la llamaremos “movimiento de la
serie”.
Variaciones cíclicas: son fluctuaciones a largo plazo, mas o menos periódicas, que se
repiten cada cierto numero de años y que, a diferencia de las variaciones estacionales, es difícil
determinar el periodo o ciclo, ya que no se puede saber con exactitud cuándo comienza y
cuándo termina, tal es el caso de las fluctuaciones cíclicas originadas en la actividad
económica (expansión, recesión).
Toda estas series cronológicas deben ajustarse a través de un recta promedio que las defina, esta recta
permite, a través de su pendiente determinar si la variable va en ascenso o en descenso, y además se puede
observar el valor probable que la misma presentará en el futuro; temsa que se desarrollan a continuación.
Período Valor
1989 18 Valor Lineal (Valor)
1990 20
1991 19 30
1992 24
25
1993 22
1994 23 20
1995 24 15
1996 25
1997 24 10
1998 26 5
1999
0
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2000
2001
Es importante destacar que este tipo de ajuste, sólo es válido cuando se tienen varios
períodos y el entorno en que se encuentra inmersa la variable es similar a través de los
distintos momentos. Esta herramienta es muy usada en materia comercial y económica en
estos momentos en nuestro país porque los factores exógenos, tales como inflación,
cotización del dólar, índices de producción, se han mantenido similares en los últimos años.
Ajustes
La mejor línea es aquella que mejor representa a ese conjunto de puntos. La gráfica
ayuda mucho a determinar la línea y la dirección que toma. Sin embargo puede afirmarse, que
no es posible determinar con absoluta certeza la bondad de la adaptación de una línea, pues
solamente el juicio personal y la experiencia del estadístico, son los elementos que se pueden
poner en juego en la elección del mejor ajuste.
Ajuste rectilíneo: existen varios métodos para realizar el ajuste de una recta en una
serie cronológica, a saber: método de la mano alzada, puntos seleccionados, semipromedios y
mínimos cuadrados. El primero y el último es el que desarrollaremos a continuación.
2- método de los mínimos cuadrados: los métodos anteriores permiten obtener una
regular aproximación de la tendencia que presenta la serie. El método mas utilizado para
realizar un buen ajuste es el conocido como el de los mínimos cuadrados.
Este método no solo sirve para ajustar una línea recta, sino también para ajustar
tendencias no lineales, tales como la parabólica, exponencial, etc. Se trabaja asimismo con la
ecuación general de la recta Y= bx + c.
Para calcular el valor que tomara la variable en el futuro, es necesario resolver dos
ecuaciones normales en forma simultánea:
Yi = b . Xi + nc
Xi Yi = b . Xi2 + c . Xi
Una línea que represente una serie cronológica puede ser considerada casi recta pero
no debemos suponer que continuara en la misma dirección, salvo que las condiciones que la
originan permanezcan constantes. Por esto, al trazar una línea ya sea recta, parabólica o
exponencial, debemos analizar en primer lugar las causas y evaluar la probabilidad de que así
ocurra, antes de iniciar cualquier proceso de estimación.
Autoaprendizaje 4-1
Los datos sobre la producción anual de sillas mecedoras producidas por una empresa de Cuyo desde 1.993 se
presentan a continuación:
Año Producción
(en miles)
1.993 4
1.994 8
1.995 5
1.996 8
1.997 11
1.998 9
1.999 11
2.000 14
Estadística 77 Lic. M. Gabriela. Biondolillo
1. Grafica los datos de producción.
2. Determina la ecuación de estimación por el método de los mínimos cuadrados.
3. Con base en la ecuación de la recta ¿cuál será la producción estimada para el año 2.003?
Regresión y Correlación
Tipos de relaciones
Las relaciones también pueden ser inversas, en estos casos la variable dependiente
decrece al aumentar la variable independiente; de manera tal que la gráfica se caracteriza por
una pendiente negativa (la variable Y disminuye al aumentar la variable independiente X).
Por esta razón, es importante que se consideren las relaciones encontradas por la
regresión como relaciones de asociación pero no necesariamente de causa y efecto. A menos
que se tengan razones específicas para creer que los valores de la variable dependiente son
ocasionados por los valores de la variable independiente, no se debe inferir causalidad de las
relaciones que se encuentren mediante la regresión.
Diagramas de dispersión
También podemos trazar o ajustar una línea recta a través de nuestro diagrama de
dispersión para representar la relación, de manera análoga al procedimiento empleado en el
tema anterior (series de tiempo). Cuando los puntos de datos están relativamente cerca de la
línea de ajuste, podemos decir que existe un alto grado de asociación entre las variables.
La relación entre las variables X e Y también puede tomar la forma de una curva y la
dirección de la curva puede indicar si la relación curvilínea es directa o inversa.
La ecuación para una línea recta donde la variable dependiente Y esta determinada por
la variable independiente X es, como sabemos, la ecuación general de la recta Y= b.x+c.
Usando esta ecuación, podemos tomar un valor dado de X y calcular el valor de Y. La b es la pendiente
de la línea y representa qué tanto cada cambio de unidad da la variable independiente X cambia la variable
dependiente Y. La c se denomina la “intersección Y” u “ordenada al origen” porque su valor es el punto en el
cual la línea de regresión cruza el eje Y, es decir, el eje vertical. Tanto b como c son constantes numéricas y su
valor podemos encontrarlo empleando el método de los mínimos cuadrados de manera similar a su aplicación
para el análisis de series cronológicas.
Matemáticamente la línea obtenida tendrá un buen ajuste si minimiza el error entre los
puntos estimados en la línea y los verdaderos puntos observados que se utilizaron para
trazarla.
Análisis de correlación
Los estadísticos han desarrollado una medida para describir la correlación entre dos variables: el
coeficiente de determinación (r2), que permite medir la fuerza de la asociación que existe entre dos variables X
e Y.
·r = c . Y + b XY – nY2
Y2 - nY2
Autoaprendizaje 4-2
Un agrónomo experimentó con distintas cantidades de fertilizante líquido en una
muestra de parcelas del mismo tamaño. La cantidad de fertilizante y el rendimiento
son:
Trabajo Práctico nº 5
Tema: Análisis bivariable
Actividades:
Años Yi
1.970 12
1.978 18
1.985 20
1.992 36
4- En función de los datos de ventas (en miles de pesos) de la empresa XX durante los últimos
10 años calcular el valor de las ventas estimadas para el año 2.004 suponiendo que se
mantienen las mismas condiciones.
Años Ventas
1.992 584
1.993 573
1.994 498
1.995 552
1.996 601
1.997 683
1.998 654
1.999 740
2.000 788
2.001 800
Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38
6- Una compañía administra a sus vendedores una prueba en adiestramiento de ventas antes
de permitirles salir a trabajar. La administración de la compañía está interesada en determinar
la relación entre las calificaciones de la prueba y las ventas hechas por esos vendedores al final
de un año de trabajo. Los siguientes datos se recolectaron de 10 agentes de ventas que han
estado en el campo durante un año.
Número de Calificación de Nro de
vendedor la prueba unidades
vendidas
1 2.6 95
Estadística 82 Lic. M. Gabriela. Biondolillo
2 3.7 140
3 2.4 85
4 4.5 180
5 2.6 100
6 5.0 195
7 2.8 115
8 3.0 136
9 4.0 175
10 3.4 150
a- Encuentra la línea de regresión de mínimos cuadrados que podría usarse para predecir
ventas en función de las calificaciones de las personas en el adiestramiento.
b- ¿En cuánto se incrementa el número esperado de unidades vendidas por cada incremento
de un punto en la calificación de la prueba?
c- Utiliza la línea de regresión de mínimos cuadrados para predecir el número de unidades
que vendería una persona en adiestramiento que recibió una calificación de prueba
promedio.
d- Calcula el coeficiente de determinación e indica su significado.
Objetivos:
1. Elaborar índices ponderados y no ponderados.
2. Elaborar índices de precio y cantidad de aplicación especial.
3. Explicar cómo se elabora y utiliza un índice de precios al consumidor.
4. Citar las aplicaciones especiales del índice de precios al consumidor para determinar
el ingreso real, poder adquisitivo del dinero y demás uso de tipo económico.
Los números índices son cifras relativas, expresadas en términos porcentuales que
sirven para indicar las variaciones que presenta una serie de observaciones, cuando se
comparan respecto a una de ellas, tomada como punto de referencia y denominada periodo
base.
En una serie corta, el periodo base corresponderá al primer valor de la serie; en una
serie larga, debe seleccionarse aquel periodo que haya sido mas estable, es decir, que no
presente cambios bruscos debido a factores, ya sean internos o externos. En algunas
ocasiones, la selección del periodo que debe tomarse como base dependerá de lo que se quiera
presentar, por ejemplo si se examina una serie referente a los precios de un artículo, se tendrá
que el índice de variación será mucho mas alto, cuanto mas lejano se encuentre el periodo
base; y será mas baja la variación cuanto mas cercano esté el periodo base.
Los números índices son muy usados en el análisis de ventas, producción, precios,
costos, beneficios, aumentos de capital, comercio exterior, etc. y en especial cuando se
quieren comparar dos series, como por ejemplo, los cambios en los precios de dos o mas
artículos durante un periodo determinado de tiempo. Por lo tanto habrá necesidad de tener
cuidado con su uso, pues a diferencia de lo que la mayoría cree, el índice no mide, solo es un
indicador que pretende reflejar el comportamiento de ciertas observaciones en forma
aproximada.
Según la composición, el índice puede ser: simple o compuesto. A su vez los índices
compuestos se clasifican en agregativos o de promedios.
Índices simples
Un índice simple se obtiene dividiendo cada precio, cantidad o valor de una serie dada
ya sea en periodos anuales, mensuales, etc., por el precio, cantidad o valor de uno de esos
periodos, el cual ha sido tomado como base o punto de referencia, y el resultado de ese
cociente se multiplica por cien.
1: índice
t: periodo que se analiza
o: periodo base
Estadística 86 Lic. M. Gabriela. Biondolillo
Xt: precio, cantidad o valor del periodo que se investiga
Xo: precio, cantidad o valor del periodo considerado como base
El índice simple también se puede calcular sin tener fija la base, en este caso cada
índice se obtiene cambiando de base. Se dice, que en una serie, los índices son de base
variable, cuando a cada observación se la divide por el valor de la observación inmediatamente
anterior, multiplicándolo por 100. Los incrementos o disminuciones que se presentan para
cada periodo se dan respecto al año inmediatamente anterior.
Autoaprendizaje 5-1
De acuerdo con Fortune, las ventas anuales de algunas empresas industriales
seleccionadas fueron:
Índices eslabonados
El índice simple con base variable presenta la ventaja de indicar las variaciones para
cada periodo respecto del anterior, pero se puede transformar en un índice con base fija, el
cual se obtiene mediante sucesivas multiplicaciones de los relativos de cada eslabón.
Son los índices mas usados, especialmente cuando se tiene una serie de precios correspondientes a un
grupo de artículos dados en unidades de medida diferentes. Estos índices se calculan teniendo en cuenta la suma
1to = Xt . 100
Xo
Autoaprendizaje 5-2
Se va a elaborar un índice de precios de ropa para el 2001 con base en 1990. Los precios
de 1990 y 2001 y las cantidades consumidas en 1990, se muestran a continuación:
Índices compuestos
Para explicar los índices compuestos consideraremos como punto de partida los
índices agregativos simples, utilizados en el análisis de un grupo de artículos sin tener en
cuenta la importancia que alguno de ellos pueden presentar en relación al conjunto. Esa
importancia se denomina ponderación.
Existe gran cantidad de fórmulas para calcular índices ponderados, cuyo empleo
dependerá de la naturaleza misma del problema. En los índices que se expondrán, las
ponderaciones son las cantidades o los precios.
Índices de precios
Índice de Laspeyres: puede interpretarse como la relación existente entre los precios actuales
de un grupo de artículos con los precios de esos mismos artículos considerados en el
periodo base, manteniéndose constante como ponderación las cantidades del periodo base.
LI = Pt x Qo x 100
Po x Qo
Índice de Fisher: es un promedio geométrico que se define como la raíz cuadrada del
producto del índice de Laspeyres por el de Paasche.
FI = LI x PI
Índices de cantidad
Las fórmulas que se dan para el cálculo de los índices de cantidad de Laspeyres,
Paasche y Fisher son muy parecidas a la de los precios, con la diferencia de que en estos la
ponderación son los precios.
LJ = Po x Qt x 100
Po x Qo
PJ = Pt x Qt x 100
Pt x Qo
FJ = LJ x PJ
Autoaprendizaje 5-3
Los precios al mayoreo y los volúmenes producidos de producto agrícola son:
Artículo Precio
Producción
1995 2001 1995 2001
Trigo (bushel) 2.00 4.00 100 700
Huevos (doc.) 0.30 0.20 1000 800
Cebada (tn) 60.00 70.00 50 110
Porcentaje de desvalorización
Indica la pérdida del poder de compra para un periodo con respecto a otro
considerado como base
% de desvalorización = 100 x [ 1 - IPCo/IPCt ]
Índice de productividad: indica la relación existente entre los resultados obtenidos y los
insumos utilizados en un periodo. Puede calcularse de dos formas:
dividiendo cada índice de producción por su respectivo índice de obreros y el valor
resultante se multiplica por 100
Los números índices, tal como se ha visto, relacionan una o mas variables en un
periodo dado (colocado como numerador) con la misma variable o variables en otro periodo,
denominado base (como denominador) y sirven para indicar las variaciones que presenta una
variable en función de uno de sus valores que se toma como referencia o término de
comparación. Como cada relativo lo multiplicamos por 100, los números índices son
porcentajes de variación que presenta cada valor de la variable con respecto al tomado como
referencia. Estos números índices generalmente son aplicados en series cronológicas.
La anterior relación es una razón por el hecho que el numerador no esta contenido en
el denominador. Este resultado significa que por cada hombre va mujer y media, en otras
palabras, por cada 100 hombres van 150 mujeres a dicho lugar.
esta proporción nos indica que por cada cien personas que van a ese centro mercantil, en un
día, 40 son hombres y 60 son mujeres. Ahora si multiplicamos por 100 se tendrá:
Se observara que una proporción no puede ser menor que 0 ni mayor que 1. En
términos porcentuales se dirá que es un número comprendido entre 0 y 100.
A las razones y porcentajes en ocasiones se las denomina tasas; sin embargo al estudiar
los cambios que se operan en una población, los porcentajes y las razones no son suficientes
para analizar completamente la información disponible, siendo necesario recurrir a la
elaboración de tasas.
La palabra tasa se emplea para estudiar una variable en función de otra con la que está
relacionada. Estos cocientes se multiplican por 100, 1.000, etc. para evitar el uso de decimales.
Utilizando el mismo ejemplo, tenemos:
1. Las ventas de pescado presentan para las respectivas variedades las cifras que se indican a
continuación:
Año Besugo Caballa Corvina Bacalao Merluza
1.999 652 28 1039 536 3239
2.000 674 13 1106 496 3546
2.001 693 46 1354 401 3627
calcula los índices de precios para cada artículo, para los años 2.000 y 2.001, tomando como
base 1.9998.
6. Con los siguientes datos, obtiene el índice de producción y el índice de obreros. Calcula el
índice de productividad para cada año tomando como base 1.995.
Año Producción Obreros
1.995 450 1278
1.996 684 1390
1.997 573 1267
Estadística 94 Lic. M. Gabriela. Biondolillo
1.998 793 1350
1.999 895 1222
2.000 773 1200
2.001 800 1190