Estadistica Descriptiva Guia Completa PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 84

Módulo nº 1:

LA ESTADÍSTICA Y SUS INSTRUMENTOS

Objetivos:
1. Definir qué significa estadística
2. Citar algunas aplicaciones de la estadística en administración y otras áreas.
3. Explicar lo que significa estadística descriptiva y estadística inferencial.
4. Distinguir los distintos tipos de características como objeto de estudio de la
estadística.
5. Distinguir entre los diversos niveles de medición
6. Organizar datos originales en una distribución de frecuencias

Algunos conceptos necesarios

Antes de comenzar a conocer las principales herramientas de la estadística, es


necesario que acordemos sobre el significado de ciertos términos que son de gran importancia
para la comprensión de los temas que desarrollaremos a continuación.

Estadística, es una ciencia que trata de la recopilación, organización, presentación,


análisis e interpretación de datos numéricos (estadísticas) con el fin de realizar una toma de
decisiones más efectiva. Entonces, podemos decir que se refiere a un conjunto de métodos,
normas, reglas y principios para observar, agrupar, describir, cuantificar y analizar el
comportamiento de un grupo.

En un principio se consideraba que la función de la estadística era la descripción de


las características de un grupo. En su origen la estadística era histórica; hoy en día además de
ser descriptiva es analítica, considerándose esta última como la función más importante que
realiza, ya que permite obtener conclusiones para un grupo mayor, denominado población,
partiendo de una investigación realizada en un grupo menor, denominado muestra, cuyos
elementos se seleccionan aleatoriamente o al azar.

La estadística descriptiva es un conjunto de procedimientos estadísticos que sirven


para organizar y resumir conjuntos de datos numéricos, tiene como finalidad poner en
evidencia aspectos característicos (promedios, variabilidad de datos, etc.) que sirven para
efectuar comparaciones sin pretender sacar conclusiones de tipo más general.

La estadística inferencial es un conjunto de procedimientos estadísticos que sirven


para deducir o inferir algo acerca de un conjunto de datos numéricos (población),
seleccionando un grupo menor de ellos. Busca dar explicaciones al comportamiento de un
conjunto de observaciones, probar la validez de los resultados, intenta descubrir las causas

Estadística 13 Lic. M. Gabriela. Biondolillo


que lo originan, lográndose de está manera conclusiones que se extienden más allá de las
muestras estadísticas mismas.

La estadística descriptiva - analítica se define como un conjunto sistemático de


procedimientos para observar y describir numéricamente el fenómeno, y descubrir las leyes
que regulan la aparición, transformación y desaparición del mismo.

La estadística, de acuerdo con lo anterior, se podría definir como aquel método que
permite no solo describir el hecho o fenómeno, sino deducir y evaluar conclusiones acerca de
una población, utilizando resultados proporcionados por una muestra.

Finalidad de la estadística

En términos generales, se considera que la finalidad de la estadística es suministrar


información, y su utilidad dependerá en gran parte, del fin que se proponga y de la forma
como se obtengan los datos.

 conocer la realidad de una observación o fenómeno: al cuantificar un fenómeno estamos


conociendo su situación actual; es así como al tener la información diaria, semanal o
mensual sobre la producción de un artículo se sabrá si se está cumpliendo con lo
programado o, por el contrario, estamos por debajo o por encima de nuestra programación,
lo cual afectará los stock, las ventas, las existencias de materia prima, etc. Se podrá
determinar el total de la producción nacional de un artículo en un momento determinado;
además, sabremos si el volumen de producción satisface la demanda interna o si, por el
contrario, hay necesidad de recurrir a las importaciones para cubrir el déficit. También se
puede determinar el excedente de producción que se requiere para mantener los precios
internos de mercado.

 determinar lo típico o normal de esa observación: cuando se cuantifica la característica


de una muestra o población, se obtiene un valor denominado promedio, siendo esta la
forma de referirnos al grupo, cuantificando así su comportamiento. Si decimos que el
promedio de unidades vendidas de un artículo A, en 20 almacenes, en el mes de marzo fue
de 1.200 unidades, es una forma de determinar el comportamiento del grupo; pero con este
valor típico o normal del conjunto no se quiere decir que los 20 almacenes vendieron la
misma cantidad; posiblemente algunos mas, otros menos, pero el promedio fue de 1.200.

 determinar los cambios que presenta el fenómeno: cualquier fenómeno de carácter


estadístico presenta variaciones a través del tiempo, pero requiere una observación
continua para poder determinar la magnitud del cambio. La demanda, la producción, las
ventas, los precios, son fenómenos que constantemente registran cambios que deben ser
tenidos en cuenta por la administración de una empresa.

Estadística 14 Lic. M. Gabriela. Biondolillo


 relacionar dos o más fenómenos: desde el punto de vista de correlación, se puede
determinar si existe una relación válida entre dos o más características de una misma
observación o entre dos o más fenómenos. Tal es el caso de la relación de ingresos y gastos
para un grupo de familias o la relación entre las unidades producidas, vendidas y el precio.

 determinar las causas que originan el fenómeno: los cambios que se observan en un
fenómeno pueden tener una o varias causas de origen. El aumento de las exportaciones de
un artículo puede ser causado por un mejoramiento del precio en el mercado externo o por
un volumen de producción superior a la demanda interna o por otras causas que producen
cambios en el comportamiento del fenómeno.

 hacer estimativos sobre el comportamiento futuro del fenómeno : en numerosas


ocasiones se requiere proyectar, para estimar el comportamiento futuro de un fenómeno.
La proyección a dos o tres años de la población de una región sirve para determinar el
mercado potencial del producto, es decir, el conocimiento, aunque sea estimativo, de la
demanda en los años próximos.

 obtener conclusiones de un grupo menor (muestra) para hacerlas extensivas a un


grupo mayor (población): al realizar mediciones en una muestra cuyo tamaño debe ser el
óptimo deseado, los resultados obtenidos pueden ser considerados como el
comportamiento que se obtendría si se hubiera trabajado con todos los elementos que
constituyen la población de la cual se extrajo la muestra.

 además de lo anterior, la estadística facilita una serie de instrumentos o técnicas que, al ser
utilizadas correctamente, permiten determinar el grado de validez y confiabilidad ya sea
de las predicciones o de las conclusiones obtenidas a partir de muestras.

Población y muestra

Se le asigna dentro de la ciencia estadística el nombre de población (N) a todo el


conjunto de elementos que poseen una característica común y que son plausibles de ser
estudiados, es decir, es un conjunto de medidas o el recuento de todos los elementos que
presentan una característica común. Nótese la diferencia fundamental con la acepción de la
palabra población desde el punto de vista geográfico donde se refiere exclusivamente a
personas, en el caso estadístico una población puede estar formada por personas o cosas.

El término población se usa para denotar el conjunto de elementos del cual se extrae la
muestra (n). Los compradores a menudo prueban una porción pequeña de cualquier fiambre
antes de comprarlo, determinan a partir de un trozo el sabor de toda la horma. Una fábrica,
para validar el tiempo que dura una lámpara incandescente, prueba solamente algunas e
infiere que el resto se comportará, en términos de duración, de igual forma. Probar todo el

Estadística 15 Lic. M. Gabriela. Biondolillo


producto o todos los productos es innecesario y hasta destructivo; Si el comprador probara
todo el queso o la fábrica probara todas las lámparas no quedarían productos para vender.

Al realizar cualquier estudio estadístico un factor importante a tener en cuenta son los
costos del mismo, costo que está influenciado por la cantidad de elementos a estudiar, por la
disposición inmediata o no de los mismos, por la dispersión geográfica que presenten, etc.

Cada vez es más frecuente que el tamaño de la población tienda a infinito, es decir, que
la cantidad de elementos que la componen es muy numeroso, esto hace que sea necesario en
estas ocasiones estudiar muestras para inferir como se comporta la población,
fundamentalmente por los dos aspectos mencionados anteriormente: la inutilidad de probar
todos los productos o por el valor en términos monetarios que tendría el estudio.

Lo ideal sería que el número de elementos o unidades de observación que constituyen


la muestra, fuera igual al contenido en la población. Pero como no ocurre así, las conclusiones
que se consideran válidas para la muestra pueden ser extendidas a la población,
garantizándolas estadísticamente mediante la indicación de la validez del proceso. Pero debe
temerse en cuenta que trabajar con muestras para inferir como sería la población, trae
aparejado problemas de errores de estimación que hay que tratar de reducir a su mínima
expresión.

Entonces, se define la muestra (n) como un conjunto de medidas o el recuento de una


parte de los elementos pertenecientes a la población. Los elementos se seleccionan
aleatoriamente, es decir, todos los elementos que componen la población tienen la misma
posibilidad de ser seleccionados. Existen diversas formas de obtener una muestra, las
distintas técnicas de muestreo dependen:

 del grado de precisión requerido;


 del tamaño de la población;
 del costo y tiempo.

Muestreo

Las muestras probabilísticas pueden obtenerse a través de:

 muestreo aleatorio simple: se basa en la premisa que todos y cada uno de los elementos de
la población tengan la misma probabilidad de ser elegidos, se realiza por sorteo o con la
tabla de números aleatorios.

 muestreo aleatorio estratificado: la población se estratifica de acuerdo a alguna


característica que solo le permitirá pertenecer a la misma. Se forman de esta manera varias
muestras que pueden ser de igual tamaño o proporcional.

Estadística 16 Lic. M. Gabriela. Biondolillo


 muestreo sistemático: se enumeran los elementos de la población y se saca, por ejemplo, el
número 6, luego el 16, 26, 36 y así sucesivamente.

Una muestra no probabilística corresponde a la selección de las unidades o


elementos según el criterio o conveniencia del investigador. En estos casos, algunas unidades
tienen mayor probabilidad que otras de ser seleccionadas; por tal razón no se puede
determinar la validez, ni la confianza que merecen dichos resultados.

Uno de los aspectos más importantes al trabajar con muestras es poder definir si la
misma es o no representativa de la población que pretendemos estudiar. El otro aspecto a
dilucidar es cual es el tamaño de la muestra que debemos analizar para poder aplicar los
resultados obtenidos y trasladarlos como estimadores de los parámetros poblacionales.

Para satisfacer nuestra primera inquietud, es decir, si la muestra es o no un resumen


fidedigno de la población, se debe iterar varias veces el proceso de cálculo de las medidas más
representativas (media aritmética, modo, desviación típica, etc.), medidas que analizaremos
con profundidad mas adelante. La repetición de experimentos que arrojen el mismo resultado
da confianza al investigador.

Con respecto al tamaño de la muestra, existen diversas formas de cálculo, y tienen que
ver con el tipo de población y con la característica que estemos estudiando. Este tema lo
analizaremos más adelante, cuando hayas adquirido mayores conocimientos estadísticos.

Elementos de una población

Los elementos que integran la población o la muestra pueden corresponder a personas


u objetos; además el elemento puede ser una entidad simple (una persona) o una entidad
compleja (una familia) y se denomina unidad investigada.

Estos son ejemplos de lo que podrían denominarse elementos de una población y


características de la misma:

Elementos Características
Personas Salarios
Personas Horas trabajadas
Personas Cargos
Departamentos Ventas
Hogar Consumo

Es importante resaltar el hecho de que a pesar de encontrarse una población


constituida por un grupo de elementos, a la estadística no le interesa el elemento en sí, sino su
característica.
Estadística 17 Lic. M. Gabriela. Biondolillo
Según sea el tamaño, la población puede considerarse como finita o infinita. Es
población finita cuando el número de elementos que la componen es limitado; es población
infinita cuando el número de elementos que la componen es infinito.

Atributos y variables

Las características o caracteres (xi) corresponden a ciertos rasgos, cualidades o


propiedades que poseen los elementos que constituyen a la población o muestra. Algunos
caracteres son mensurables y se describen numéricamente, por tal motivo se denominan
caracteres cuantitativos o variables, tales como estatura, peso, ingreso, valor, producción,
ventas, etc. y pueden clasificarse en:

 variables continuas: pueden tomar cualquier valor dentro de los números reales (edad,
temperatura, kilos, etc.)

 variables discretas: solo toman valores enteros (cantidad de hijos, materias aprobadas,
etc.)

Otros se expresan mediante palabras por no ser mensurables pero si contabilizables,


tales como profesión, cargo, marcas, calidad, etc. y se denominan caracteres cualitativos o
atributos. Estos pueden ser:

 atributos dicotómicos: son aquellos que aceptan solo dos alternativas; por ejemplo:
ciudadano argentino o extranjero.

 atributos policotómicos: son aquellos que aceptan mas de dos alternativas; por ejemplo:
nacionalidad de los barcos ingresados al puerto.

La determinación del tipo de carácter que estemos estudiando es muy importante


porque de ello depende la forma de ordenar los datos, de sistematizarlos en una tabla de
frecuencias, la manera de presentar tablas resúmenes y determinar el tipo de gráfico que se
debe utilizar.

Otros conceptos importantes

Estadísticas, en plural, se refiere a un ordenamiento sistemático de datos presentados


en forma de cuadros o gráficas. En otras palabras, las estadísticas son datos agrupados
metódicamente y consignados en publicaciones, elaboradas por las diversas empresas y
entidades, buscando sean conocidos por los interesados.

Las estadísticas primarias son aquellos datos obtenidos ya sea por encuestas directas,
mediante la utilización de cuestionarios o como resultado de la observación directa; esta
Estadística 18 Lic. M. Gabriela. Biondolillo
última es una técnica muy utilizada es estudios de carácter científico o en investigaciones de
mercado. Se puede decir también que son datos publicados por quien recoge directamente de
la fuente de información primaria.

Las estadísticas secundarias son aquellas en las que los datos se obtienen de
publicaciones, las cuales pueden ser reproducciones totales o parciales. Son fuentes valiosas
utilizadas en cualquier tipo de investigación.

Las estadísticas temporales, denominadas también series de tiempo o series


cronológicas son las obtenidas y ordenadas en forma cronológica, siendo el resultado de
investigaciones u observaciones periódicas: días, meses, años. Cuando las investigaciones son
aisladas, es decir, no presentan periodicidad continuada, las estadísticas se llaman
atemporales.

Las estadísticas también pueden clasificarse como internas o externas. Las


estadísticas internas de una empresa se originan de los registros internos, tales como
producción, ventas, salarios y otros. Las estadísticas externas son registros originados fuera
de la empresa, por ejemplo: precios de la competencia, opinión de los consumidores respecto
del producto, etc.

Los parámetros son todas aquellas medidas que describen numéricamente las
características de una población. También se les denomina valor verdadero ya que una
característica poblacional tendrá un solo parámetro (media, varianza, etc.). Sin embargo, una
población puede tener varias características y, por tanto, varios parámetros.

La descripción numérica de una característica correspondiente a la muestra se


denomina estadígrafo. De una población se puede obtener T número de muestras posibles y
en cada una de ellas se puede cuantificar la característica obteniéndose, por lo general, valores
diferentes para cada muestra a pesar de ser utilizado el mismo estadígrafo o medida.

Autoaprendizaje 1-1
Una compañía comercial de Mendoza pidió a una muestra de 1960 consumidores que
probaran un plato de pescado congelado de elaboración reciente por un fabricante,
denominado “Suspiro de Mar”. De los 1960 consumidores consultados, 1176 dijeron que
comprarían el menú si se pusiera a la venta.
1. ¿Qué informará la compañía al fabricante respecto a la aceptación del “Suspiro de Mar”?
2. ¿Es este un ejemplo de estadística descriptiva o inferencial? Justifica tu respuesta.

Escalas de medición

Estadística 19 Lic. M. Gabriela. Biondolillo


Una medición consiste en el establecimiento de números o códigos a las observaciones
mediante el empleo de una escala apropiada. Una escala se puede definir como un
instrumento de medición.

Las escalas de medición se diferencian por propiedades de orden y de distancia, según


la clasificación que elaboró S. S. Stevens (1.946) podemos identificar las escalas de medición:
nominal, ordinal, de intervalo y de razón.

 escala nominal: es aquella en la que no se hace ningún supuesto respecto de las relaciones
que existen entre los valores de las variables. Cada valor se asigna a una categoría diferente,
la que se define mediante un nombre. Por ejemplo: el lugar de nacimiento de una persona
es una variable medida en escala nominal, sexo, tipo de religión, establecimiento donde
cursó sus estudios, medicina que le fue administrada, etc.; la variable no tiene un orden
preestablecido.

 escala ordinal: es aquella que surge al ordenar todas las categorías de la variable de
acuerdo a algún criterio. Por ejemplo: clasificar a las personas de acuerdo a su máximo
nivel de instrucción alcanzado en primario, secundario, universitario, etc. constituye un
orden de clasificación. En este caso lo único que sabemos es que el nivel de instrucción
secundario es superior al primario y que el universitario es superior al primario y
secundario; no obstante, no sabemos con certeza cuánto “mayor” es una categoría de la
variable respecto a otra porque no existe una medición de distancia.

 escala de intervalo: es aquella que tiene la propiedad de asignar una medición de distancia
entre los valores de la variable. Entonces, cuando se dice que un objeto es mayor que otro,
se puede especificar cuántas unidades de diferencia hay entre ambos o por cuántas
unidades un objeto es mayor que otro. Una característica de la escala de intervalo es que el
punto de origen o punto cero en la escala de medición es un punto de acuerdo o punto
convencional. Otras variables que se pueden medir con escala de intervalo son: altura,
temperatura, tiempo, riqueza e inteligencia. En síntesis, la escala de medida de intervalo
permite estudiar diferencias entre valores de la variable, pero no respecto de sus
magnitudes proporcionales.

 escala de razón: es aquella que presenta todas las propiedades de orden y distancia de una
escala de intervalo adicionando el punto 0 o punto de origen. En una escala de razón, al
igual que en una escala de intervalo, las unidades de medida son equidistantes unas de
otras con la única diferencia que, en las escalas de razón, existe un punto cero
correctamente definido. Por ejemplo: en cualquier distancia física entre objetos, medida en
metros o centímetros, existe una distancia cero definida como la total ausencia de
distancia entre ellos. La existencia de un punto cero definido implica que se pueden
efectuar comparaciones proporcionales y cualquier operación matemática apropiada para
números reales.

Estadística 20 Lic. M. Gabriela. Biondolillo


El tipo de escala de medición que se utilice al medir una variable condiciona el
tratamiento estadístico que se efectuará a los datos.

DATOS

caracteres caracteres
cualitativos o cuantitativos o
atributos variables

escala de escala de
escala nominal escala ordinal
intervalo razón

Autoaprendizaje 1-2
1. El INDEC informó acerca de las poblaciones en las siguientes provincias:
Provincia Número de personas
Mendoza 750.000
San Juan 530.000
San Luis 620.000
La Rioja 480.000

¿De qué tipo de característica se trata?


¿Qué escala de medición reflejan estos datos? ¿por qué?

La calificación de un examen especial aplicado al personal reclutado por una empresa industrial para medir
sus conocimientos en el área son:
Puntuaciones Número de solicitantes
90-99 42
80-89 19
70-79 7
60-69 4
Menos de 60 3
¿De qué tipo de característica se trata?
¿Qué escala de medición reflejan estos datos? ¿por qué?

Método estadístico

Estadística 21 Lic. M. Gabriela. Biondolillo


Toda ciencia tiene su propia metodología de estudio y aplicación, la estadística tiene
su método propio que, en definitiva, son una serie de etapas a cumplir para asegurar el éxito
de la investigación. Los pasos del método estadístico son:

 Objeto: qué, cuándo, cómo, dónde.


 Unidad de investigación: a quien va dirigida.
 Método de observación: población o muestra.
 Proceso de recolección de datos: entrevista personal, encuesta
PLANEAMIENTO telefónica o por correo, observación.
 Presupuesto.
 Calendario de trabajo.
 Preparación del cuestionario: aspectos materiales y técnicos.
 Selección y preparación del personal.
 Supervisión.
 Control de encuestas.
RECOLECCIÓN  Revisión de cuestionarios inconclusos.
 Calidad y consistencia de las preguntas.
 Cumplimiento de los plazos prefijados.
 Codificación y tabulación.
PROCESAMIENTO  Cuadros
 Gráficos
ANÁLISIS  Informe final
 Publicación

Planeamiento:

Objetivo: como en la mayoría de las actividades humanas, es imprescindible antes de


iniciar cualquier acción la definición del objetivo del estudio estadístico, pues de él depende el
resto de las etapas que componen un trabajo de esta naturaleza. Es importante reflexionar y
contestar los interrogantes anteriormente detallados; que se va a estudiar, cuándo se va a
realizar el estudio, cómo se va a efectuar el trabajo, dónde se recolectará la información, esta
lista no es taxativa, sino meramente enunciativa.

Unidad de investigación: en esta etapa se define cual es la población plausible de estudio,


es decir cuales son los elementos que reúnen los requisitos o características de nuestro
objetivo de estudio.

Estadística 22 Lic. M. Gabriela. Biondolillo


Método de observación: en función de la cantidad de elementos que compongan nuestra
unidad de investigación, en este momento se decidirá por estudiar a la población (si ésta fuera
lo suficientemente chica, en función de razones de necesidad o costo) o si estudiaremos una
muestra de esa población. Asimismo se debe decidir que tipo de muestreo se usará: aleatorio
simple, aleatorio sistemático o aleatorio

Proceso de recolección de datos: ya hemos dicho que la descripción estadística de un


fenómeno se hace mediante datos numéricos. La recogida de estos datos puede realizarse
utilizando fuentes de datos internas o externas.

 Algunas veces los datos son intrínsecos a la propia actividad de la empresa que los recopila
en un momento determinado. Se dice, entonces, que el dato es interno y la fuente de datos
interna. Tal sería, por ejemplo: la información que puede proporcionar el departamento de
personal de una empresa sobre la categoría, edad o sueldo de sus empleados.

 Otras veces interesa obtener datos ajenos al funcionamiento de la propia empresa. La


fuente de esos datos ha de ser, en consecuencia, externa y los datos son externos. Por
ejemplo: una empresa desea introducir un producto para comercializar en una cierta
población, para lo cual necesita saber el nivel adquisitivo de sus posibles compradores.
Consultará entonces diversas fuentes de datos externas: bancos, dependencias
gubernamentales, etc.

Los datos externos suelen obtenerse por medio de:

 Observación directa: de la realidad que se quiere estudiar; esta es una técnica muy usada en
varias actividades, los supermercados utilizan este método para estudiar las reacciones de
los consumidores ante la ubicación de diferentes productos en distintos lugares del local;
también lo utiliza el laboratorista químico cuando mezcla diferentes sustancias para
observar las reacciones. En Francia para determinar que consumen las familias y en que
cantidades lo hacen, se estudia la basura de las mismas.

 Entrevista personal: indicada cuando se requieren respuestas mas completas y mayor


número de respuestas por cada una de las personas seleccionadas en la muestra; es la más
rica de las formas de obtener datos, la misma puede ser estructurada (en donde la
secuencia de preguntas está preestablecida) o libre (situación donde el entrevistador va
dirigiendo la conversación en función de las reacciones del entrevistado).

 Encuestas: especialmente indicada cuando se requieren respuestas cortas y muy concretas o


cuando las muestras son muy grandes. Tiene además la ventaja de su bajo costo
económico. Las encuestas pueden ser

Estadística 23 Lic. M. Gabriela. Biondolillo


 personales: de los tres tipos de encuestas es la más apta cuando las preguntas no
hacen referencias a temas delicados (entiéndase: religión, inclinaciones sexuales, o
temas que afecten la intimidad de las personas), tiene la ventaja de poder manejar
el tiempo de duración de contacto con el encuestado y de aclarar cualquier
situación no entendida por el mismo. Suelen tener un costo bastante alto cuando
son realizados por personal capacitado.

 telefónicas: se usan para investigaciones donde la población objetivo de nuestro


estudio pertenece a un sector socioeconómico alto o medio-alto, no se puede
muestrear telefónicamente para averiguar temas de productos masivos, puesto que
no toda la población posee teléfono y no se cumpliría una premisa básica del
muestreo: todos tienen que tener la mismo probabilidad de ser elegidos.

 por correo: es la más barata de las tres, pero adolece del problema que sólo se
reciben pocas respuestas, todavía en nuestro país no se ha realizado campañas
para concientizar a la comunidad de la importancia de las respuestas, para que
obtener mayor cantidad de respuestas se suele sortear algún premio atractivo
entre lar respuestas recibidas.

 Consulta de publicaciones especializadas: dado que muchas entidades públicas y privadas


emiten periódicamente informes estadísticos de tipo general o especializados. Dichas
publicaciones son una importante fuente de datos externos a un costo muy bajo.

 Obtención de información a través de bases de datos: la mas difundida de todas es Internet, es un


lugar de consulta de información de la más diversa índole, con ventajas tales como la
comodidad de recolección, el costo de la misma y la fuente consultada.

Presupuesto: un aspecto importantísimo a tener en cuenta al realizar investigaciones


estadísticas es determinar el costo de la misma, los gastos que implica suelen ser altos;
papelería, honorarios de encuestadores, gastos en el proceso de grabación de datos y
procesamiento de los mismos. Muchas investigaciones quedan inconclusas por falta de dinero
para concluirlas, y a diferencia de otras actividades, en ésta, un trabajo inconcluso es un
trabajo inservible.

Calendario de trabajo: atento que los resultados estadísticos varían conforme se modifica
la realidad, es importante determinar las fechas de inicio y finalización del mismo, a fin de
tener en cuenta las variables que pudieran influenciar el entorno en el lapso en que se realiza
la investigación. Si estuviéramos estudiando la opinión de la población respecto al sida, y en
medio de la investigación apareciera una vacuna para esta enfermedad, seguramente las
opiniones se modificarían sustancialmente.

Estadística 24 Lic. M. Gabriela. Biondolillo


Preparación del cuestionario: debe hacerse un buen análisis de las preguntas, si las mismas
serán abiertas (donde el encuestado vierte su opinión) o cerradas (donde la persona debe
optar por una o más opciones preestablecidas), la cantidad de preguntas a incluir en función
del tiempo que los encuestados estén dispuestos a brindar, etc.

Selección y preparación del personal: es importante contar con personal capacitado para
esta tarea, si bien la misma es relativamente sencilla, es necesario instruir al encuestador
sobre su rol de asentamiento de respuestas, y que bajo ningún punto de vista debe influenciar
para obtener una respuesta determinada; asimismo jamás deberá entrar en discusiones de
ninguna naturaleza con un entrevistado.

Recolección

Supervisión: es una actividad importante a realizar, fundamentalmente cuando se


trabaja con personal con poca experiencia en el tema; el objetivo de esta tarea es controlar que
la recolección de los datos se realice de acuerdo a la planificado.

Control de encuestas: esta tarea consiste en verificar si han sido relevadas todas las
encuestas, si las mismas presentan preguntas “trampa” observar como reaccionó el
encuestado ante esta situación; si ante una pregunta de validación respondió
equivocadamente se debe rechazar la encuesta.

Revisión de cuestionarios inconclusos: en reiteradas oportunidades muchas preguntas


quedan sin responder, ante este hecho se debe verificar la importancia relativa de la pregunta
faltante, de ser primordial al efecto del estudio se deberá rechazar la misma.

Calidad y consistencia de las preguntas: esta tarea se realiza fundamentalmente cuando se


utilizan preguntas abiertas, es decir, preguntas donde el encuestado debe emitir opinión; por
supuesto no se va a rechazar una encuesta por el tipo de opinión que se emita, sino que se
eliminaría si la respuesta no corresponde a la interrogación realizada.

Cumplimiento de los plazos prefijados: atento que este tipo de estudio muy difícilmente
pueda trasladarse en el tiempo, es muy importante que se respeten los plazos establecidos en
el calendario de trabajo, a fin de no realizar un análisis sobre variables que pudieran haberse
modificado.

Procesamiento

Cuadros: el desarrollo de este tema se realiza mas adelante

Gráficos: el desarrollo de este tema se realiza mas adelante


Estadística 25 Lic. M. Gabriela. Biondolillo
Codificación y tabulación: el desarrollo de este tema se realiza en el título siguiente.

Sistematización de los datos a través de la frecuencia

Existen tres formas de sistematizar los datos: datos no agrupados, datos agrupados
sólo por su frecuencia y datos agrupados por frecuencia y en intervalos de clase.

Los datos no agrupados son una serie de valores recolectados por cualquiera de los
métodos de recolección y donde figuran todos y cada uno de ellos.

A continuación se muestra una tabla con datos sobre el número de roturas


encontradas en cajas que contienen adornos de porcelana, depositadas en el almacén de
productos terminados de la empresa XX (información que retomaremos más adelante para el
desarrollo de otros temas).

Estadística 26 Lic. M. Gabriela. Biondolillo


Nro. de caja Cantidad de Nro. de caja Cantidad de
roturas roturas
1 2 16 2
2 1 17 3
3 1 18 0
4 0 19 3
5 3 20 2
6 3 21 2
7 2 22 2
8 1 23 1
9 2 24 4
10 4 25 3
11 0 26 2
12 2 27 3
13 3 28 2
14 1 29 1
15 2 30 2

La anterior información la denominaremos datos sin agrupar . Estos datos así


presentados tienen una ventaja y un inconveniente, si los mismos son trabajados en una
planilla de cálculo es sumamente fácil obtener los estadígrafos más importantes (medidas de
tendencia central, de dispersión, de asimetría y de apuntamiento); por otra parte, si el análisis
de estos datos se hace manualmente, el proceso se torna engorroso, por lo cual se sugiere
trabajar con el concepto de frecuencia, es decir, agrupar los datos en función de la cantidad de
veces que se repiten.

Distribución de frecuencias: la tabla de frecuencias tiene como finalidad presentar en


forma ordenada los valores que toman las diferentes características, en tal forma que permitan
al lector tener una visión de conjunto. Los datos se clasifican y ordenan de acuerdo con ciertas
características cualitativas o cuantitativas, indicándose el número de veces que se repite el
valor de la variable o atributo.

En el caso de atributos o aspectos cualitativos se indica el número de veces que el


valor del atributo se repite y es lo que se denomina frecuencia de ocurrencia. En términos de
la proporción que esta frecuencia de ocurrencia representa en el número total observado, se le
conoce con el nombre de frecuencia relativa de ocurrencia.

Es importante destacar, en el caso de atributos, que la característica puede ser


analizada, en parte, mediante el cálculo de razones o porcentajes y, al igual que las variables
cuantitativas, se pueden representar gráficamente.

Estadística 27 Lic. M. Gabriela. Biondolillo


La elaboración de una tabla de frecuencia para la variable discreta, la explicaremos
mediante un ejemplo basado en los datos sin agrupar que se encuentran arriba, en donde se
supuso que se tenían 300 cajas de madera en la bodega de un almacén y cada una de ellas
contiene figuras de porcelana. Se desea examinar las cajas con el fin de saber el número de
figuras que han sufrido desperfectos en el transporte desde la fábrica hasta la bodega. Por
motivos de tiempo, espacio físico y personal disponible, se tomó la decisión de revisar un 10%
de las cajas, por tal razón se tendrá 30 cajas de un total de 300.

 N: 300 (tamaño de la población objetivo)


 n: 30 (tamaño de la muestra)

Cada caja seleccionada, en forma aleatoria, se simbolizó por xi (minúscula en la


muestra, mayúscula en la población), donde el subíndice “i” toma valores desde 1 hasta n,
siendo x1 la primera caja seleccionada, x2 la segunda caja seleccionada y así sucesivamente.
Cada xi tendrá el valor correspondiente a la característica examinada, en este caso le
corresponderá el número de figuras de porcelana desperfectas.
x1=2 x6=3 x11=0 x16=2 x21=2 x26=2
x2=1 x7=2 x12=2 x17=3 x22=2 x27=3
x3=1 x8=1 x13=3 x18=0 x23=1 x28=2
x4=0 x9=2 x14=1 x19=3 x24=4 x29=1
x5=3 x10=4 x15=2 x20=2 x25=3 x30=2

Tal como se manifestó, la anterior información se denomina datos sin agrupar.

Veamos ahora, paso por paso, cómo se elabora una tabla de frecuencias para la variable
discreta. Pero antes te presento la simbología que se utiliza en la elaboración de estas tablas:

 N: tamaño poblacional

 n: tamaño de la muestra

 xi : característica cuantitativa, discreta o continua, observada en cada unidad investigada.

 ri : frecuencia absoluta. Número de veces que se repite el valor de la variable.

 fri : frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el tamaño de la
muestra o el tamaño de la población.

 Ri : frecuencia absoluta acumulada, se hace por medio de sumas sucesivas de manera que la
última frecuencia absoluta acumulada será igual a n.

Estadística 28 Lic. M. Gabriela. Biondolillo


 Fri : frecuencia relativa acumulada, para calcularla se procede igual que en la frecuencia
anterior.

 m: número de valores que toma la variable.

En este proceso se requiere, en primer lugar, determinar los valores que toma la
variable (m). Con los datos anteriores correspondientes al número de figuras de porcelana
desperfectas por caja examinada, encontramos que los valores son 0, 1, 2, 3, 4, entonces m=5.
En función de esto armamos la tabla de frecuencia:

xi ri fri Ri Fri
0 3 3/30= 0,10 3 0,10
1 6 6/30= 0,20 9 0,30
2 12 12/30= 0,40 21 0,70
3 7 7/30= 0,23 28 0,93
4 2 2/30= 0,07 30 1,00
 30 1,00 -- --

La frecuencia relativa nos indica la distribución porcentual, en el ejemplo se tiene que


el 10% de las cajas no tienen figuras defectuosas.

Intervalos de clase: para estudiar un hecho en el que la amplitud de la población o


muestra es grande, donde la variable continua puede tomar un número elevado de valores, se
definen los intervalos de clase que son subconjuntos del conjunto de valores que puede tomar la variable
continua. Estas clases pueden tener una amplitud constante o variable; así, por ejemplo, si se
trata
de estudiar la estatura de una población de individuos, una vez elegida la muestra (que
eventualmente podría coincidir con la población, como es sabido), es conveniente dividir en
clases las posibles estaturas de los individuos investigados. Podría hacerse de la siguiente
forma:

 menos de 160 cm.


 de 160 a 170 cm.
 de 170 a 180 cm.
 igual o mas de 180 cm.

Se puede observar que la primera y la última clase tienen amplitud indeterminada,


mientras las otras dos tienen una amplitud constante de 10 cm. Los extremos son 160, 170 y
180 cm y las marcas de clase o punto medio del intervalo (xi ), 165 y 175 cm, las cuales se

Estadística 29 Lic. M. Gabriela. Biondolillo


calculan sumando el límite inferior mas el límite superior del intervalo y luego dividirlo por
dos.

Se llaman límites del intervalo a los valores extremos de dicho intervalo. Por ejemplo,
dado el intervalo 160-170 cm., diremos que 160 es el límite inferior (L.I.) y que 170 es el límite o
extremo superior (L.S.). Podría pensarse que los extremos son valores que están incluidos en
dos intervalos de clase, para que esto no suceda consideraremos incluido dentro de cada
intervalo solo al extremo inferior (160 cm.) y el extremo superior (170 cm.) se considera
incluido en el intervalo siguiente 170-180 cm.

Otro criterio para dejar bien sentado a qué intervalo pertenecen los extremos es tomar
lo que se conoce como límites exactos, en nuestro ejemplo de estaturas se tomaría como sigue:

 hasta 159,50 cm.


 159,51 - 169,50 cm
 169,51 - 179,50 cm.
 desde 179,51 cm.

sin embargo esta notación es mas engorrosa y menos clara que la anterior.

Los criterios a seguir para elegir la amplitud y el número de intervalos de clase son:

 en cuanto a la amplitud de cada clase podemos considerar como una elección acertada es
elegir clases de mayor amplitud en las regiones donde el carácter es mas raro y de menor
amplitud en el resto. Esto sucede si elegimos clases de amplitud variable; sin embargo, es
mucho mas general elegir las clases con amplitud constante, por simplicidad. Para calcular
la amplitud del intervalo (c) se realiza la siguiente operación: “c= rango / m”

 en cuanto al número de clases a adoptar dependerá de la precisión de las medidas que se


pretende alcanzar, finalidad del estudio, grado de variabilidad de los datos, necesidad de
efectuar comparaciones, etc.; en todo caso se recomienda que el valor de m, hasta donde
sea posible, no sea menor de 5 ni mayor de 16. Es común la utilización de la fórmula de
Sturges para obtener la cantidad de intervalos de clase (m), esta es “m = 1+3,3 log n”

Los estudios estadísticos están sujetos a una serie de factores que, según se manejen,
harán que el estudio sea suficientemente fiable o no lo sea. Además de estos factores, existe
otro tipo de error que podríamos considerar numérico, debido al redondeo de los cálculos, etc.
Dichos errores están implícitos en una buena parte de los estudios realizados.

Con respecto a la agrupación de los datos en clases o intervalos, hay que decir que
lleva implícito un cierto error en el cálculo posterior de las distintas medidas de la
distribución, y este error será mayor cuanto mayor sea la amplitud de los intervalos elegidos.

Estadística 30 Lic. M. Gabriela. Biondolillo


Pero si esta amplitud es muy pequeña y, por consiguiente, el número de intervalos es muy
grande, entonces la serie estadística pierde claridad y los cálculos resultan mas engorrosos.
Por lo tanto, se debe tender al máximo equilibrio entre estos dos efectos contrarios:

 mayor número de clases implica menos claridad pero mas exactitud y precisión;

 menos clases y mas amplias significa ganar en claridad de exposición y facilidad de cálculo,
pero en detrimento de la exactitud y precisión a conseguir en los cálculos.

Veamos ahora, paso por paso, cómo se elabora una tabla de frecuencias para la variable
continua. Antes te presento la simbología que se utiliza en la elaboración de estas tablas,
muchas de las cuales coinciden con las utilizadas en la elaboración de las tablas para la
variable discreta, tal como lo viste precedentemente.

 N: tamaño poblacional

 n: tamaño de la muestra

 xi : característica cuantitativa, discreta o continua, observada en cada unidad investigada.


También se utiliza para indicar la marca de clase cuando trabajamos con intervalos de
clase.

 ri : frecuencia absoluta. Número de veces que se repite el valor de la variable.

 fri : frecuencia relativa. Se obtiene dividiendo cada frecuencia absoluta por el tamaño de la
muestra o el tamaño de la población.

 Ri : frecuencia absoluta acumulada, se hace por medio de sumas sucesivas de manera que la
última frecuencia absoluta acumulada será igual a n.

 Fri : frecuencia relativa acumulada, para calcularla se procede igual que en la frecuencia
anterior.

 m: número de intervalos o número de valores que toma la variable.

 L.I. - L.S.: los intervalos en los que se divide la variable continua. Siendo L.I. el límite
inferior y L.S. el límite superior del intervalo.

 c: amplitud del intervalo entre L.I. - L.S.

 rango: diferencia que hay entre el valor máximo y el valor mínimo de la serie estadística.

Estadística 31 Lic. M. Gabriela. Biondolillo


Se desarrolla a continuación un ejemplo para la construcción de una tabla de
frecuencia para la variable continua. Consideremos nuevamente la población de 300 cajas (N=
300) y seleccionemos aleatoriamente una muestra de 30 cajas (n= 30), o sea el 10% a fin de
investigar el peso en kg. de cada caja. La información sobre el peso de cada caja se da en
números enteros con el fin de simplicar el trabajo, sin olvidar que la medida utilizada admite
valores fraccionarios, por tal motivo se la clasifica como variable continua.

x1= 48 x2= 56 x3= 60 x4= 67 x5= 47 x6= 70


x7= 70 x8= 63 x9= 72 x10= 76 x11= 74 x12= 67
x13= 92 x14= 70 x15= 69 x16= 61 x17= 71 x18= 79
x19= 85 x20= 68 x21= 82 x22= 55 x23= 65 x24= 88
x25= 52 x26= 58 x27= 76 x28= 57 x29= 72 x30= 67

En la elaboración de la tabla de frecuencias se deben observar los siguientes pasos:

1. se determina el valor máximo y el valor mínimo que toma la variable xi, en este caso xmin=
47 y xmax= 92;

2. se calcula el rango, es decir, 92 - 47 = 45.

3. se hace necesario determinar el número de intervalos (m) que se utilizará para agrupar los
datos, aplicando la regla de Sturges con la cual se obtiene una aproximación aceptable
sobre el número de intervalos necesarios; m= 1 + 3,3 log 30, lo que arroja un resultado de
5,87. El número de intervalos estará entre 5 y 6, utilizaremos en nuestro ejercicio seis
intervalos (m=6).

4. se debe decidir sobre la amplitud de cada intervalo (c). Al determinar el valor de c no es


necesario que sean todos los intervalos iguales; sin embargo, con fines de simplicidad y
funcionalidad se puede considerar el valor de c constante para todos los intervalos. Dicho
valor constante se obtiene aplicando la fórmula siguiente: c= rango/m, entonces, 45/6= 7,5.
Para facilitar los cálculos se aproxima c a 8; por lo tanto se altera el valor del rango, si
recordamos que m fue fijado y no se debe cambiar, se tendrá: 8=rango/6, entonces 8=48/6.
En este caso el rango se incrementa en tres unidades, de 45 pasó a 48, el incremento debe
ser distribuido proporcionalmente, sumando unas unidades al límite superior y restándole
otras al límite inferior.

l. C. xi ri fri Ri Fri
46 - 54 50 3 0,10 3 0,10
54 - 62 58 6 0,20 9 0,30

Estadística 32 Lic. M. Gabriela. Biondolillo


62 - 70 66 10 0,33 19 0,63
70 - 78 74 6 0,20 25 0,83
78 - 86 82 3 0,10 28 0,93
86 - 94 90 2 0,07 30 1,00
 -- 30 1,00 -- --

Propiedades de las frecuencias: estas son:

1. las frecuencias absolutas son números enteros;

2. la suma de las frecuencias absolutas es igual a tamaño de la muestra (n) o al de la población


(N);

3. las frecuencias relativas son números fraccionarios, esto es “0<fri<1”;

4. la suma de las frecuencias relativas es igual a 1;

5. el último término de las frecuencias absolutas acumuladas es igual a n;

6. el último término de las frecuencias relativas acumuladas es igual a 1.

Autoaprendizaje 1-3
Los ingresos mensuales (en pesos) de una pequeña muestra de nuevos operadores de
computadora en el área del Gran Mendoza son: $1650, $1475, $1760,
$1540, $1495, $1590, $1625 y $1510.
1. ¿Cómo se denominan los datos precedentes?
2. Utilizando como primera clase $1400 – $1499, como segunda $1500 –
$1599, y asi sucesivamente, organiza los ingresos mensuales en una
distribución de frecuencias.
3. ¿Cómo se llaman los números en la columna derecha de la distribución de frecuencias?
4. Describe la distribución de ingresos mensuales.

Los salarios mensuales (en pesos) de una muestra de 87 empleados de una empresa fueron redondeados al peso
más cercano. Van desde $1041 hasta $2548.
1. Organiza los datos en siete clases utilizando la misma amplitud para cada clase, teniendo
en cuenta los datos precedentes.
2. ¿Con qué intervalos de clase sería más fácil trabajar?

Estadística 33 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 1

Tema: La Estadística y sus instrumentos


Actividades:

1. Indica en cada una de las siguientes situaciones, si la población de referencia es finita o


infinita:
 palabras con error en un texto
 alumnos de colegios privados de Mendoza
 portadores de sida
 has. sembradas con ajo en la República Argentina
 clientes morosos de una entidad bancaria
 contribuyentes de la D.G.I.

2. Clasifica los caracteres expresados a continuación:


 peso de niños al nacer
 ingresos del jefe de hogar
 cantidad de cigarrillos fumados al día
 nivel de educación
 estado civil
 cantidad de palabras escritas por minuto
 contenido de latas de tomate
 cantidad de llamadas telefónicas por hora

3. La fábrica de gaseosas La Sed proyecta lanzar al mercado un nuevo sabor. Se realiza un test
de aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 10
puntos, para medir el grado de aceptación. Los puntos obtenidos en los 30 niños fueron los
siguientes: 2, 6, 8, 7, 4, 5, 10, 6, 6, 7, 6, 7, 3, 8, 7, 6, 8, 6, 5, 4, 7, 8, 5, 7, 6, 7, 2, 7, 2, 7. La muestra
estuvo compuesta por igual número de niños de ambos sexos, de 6 a 12 años,
pertenecientes a una concentración escolar del barrio El Terrón de la ciudad de Cenizas.
Responde:
 ¿cuál es la población?
 ¿cuál es la muestra?
 ¿la característica es cualitativa o cuantitativa?
 ¿cuál es la variable?
 ¿de qué tipo es la variable?
 construir una distribución de frecuencias incluyendo todas las frecuencias conocidas
 ¿cuál es el valor de m?

4. El puntaje obtenido por los alumnos de la cátedra de estadística en el último examen es el


siguiente: 63, 62, 65, 69, 62, 70, 45, 62, 74, 59, 68, 66, 66, 55, 60, 65, 63, 57, 66, 68, 67, 58, 74,
Estadística 34 Lic. M. Gabriela. Biondolillo
74, 61, 67, 71, 64, 52, 76, 63, 71, 76, 60, 71, 67, 60, 72, 68, 59, 69, 55, 79, 57, 51, 67, 47, 72, 71, 67,
54, 67, 65, 64, 50, 60, 64, 71, 72, 63.
 agruparlos en intervalos de clase de amplitud = 5
 agruparlos en intervalos de clase de amplitud = 3
 confeccionar el cuadro de frecuencias para los dos casos.

5. De la serie de salario mensual de 100 obreros encontrar:


 frecuencia absoluta
 frecuencia relativa
 frecuencias acumuladas.
Salario Cant. de
mensual obreros
200 - 250 4
250 - 300 7
300 - 350 12
350 - 400 15
400 - 450 22
450 - 500 14
500 - 550 10
550 - 600 8
600 - 650 5
650 - 700 3
 100

6- El jefe de personal de una empresa encontró que el número de días que los 50 empleados
habían tomado por incapacidad médica durante el año eran:
1 20 9 7 15 9 6 10 22 2
22 10 3 2 3 10 10 3 6 25
9 10 6 5 3 22 9 1 5 10
10 9 9 25 9 25 5 3 6 9
7 16 4 15 25 5 9 10 3 6

Elabora la tabla de frecuencias correspondiente.


7- El jefe de ventas investiga los precios de cierto artículo en 40 almacenes diferentes y
encuentra los siguientes datos:
76 85 80 88 74 65 91 89
76 83 71 70 86 67 68 73
77 71 75 75 68 74 72 75
84 75 75 73 87 68 79 70
72 63 77 89 60 72 83 88

Estadística 35 Lic. M. Gabriela. Biondolillo


Elabora la tabla de frecuencias que corresponda.

Autoevaluación del módulo nº 1

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta correcta.


1. Otro nombre para la estadística inferencial es estadística descriptiva.
2. Una muestra de consumidores probó una nueva galleta de queso y la clasificó de
excelente, muy buena, regular o mala. El nivel de medición para esta investigación de
mercado es ordinal.
3. Un sindicato de plomeros y colocadores de tubería tiene 5020 agremiados. Se seleccionó e
interrogó a un grupo representativo de 248 integrantes. Se considera que 248 es la
población.
4. Los métodos empleados para saber algo acerca de la población de truchas en el Parque
Nacional Lanín, con base en una muestra de 40 truchas, se denomina estadística
inferencial.
5. En general, debe elaborarse una distribución de frecuencias de manera que haya, al menos,
20 clases.
6. Las distribuciones de frecuencias relativas se obtienen dividiendo cada frecuencia
absoluta entre el número total de observaciones o tamaño de la muestra.
7. Los kilos de pan elaborados por día en una panadería son un ejemplo de variable discreta.
8. A la estadística no le interesan los elementos que conforman una población sino sus
características.

Estadística 36 Lic. M. Gabriela. Biondolillo


Módulo nº 2:
CUADROS Y GRÁFICOS

Objetivos:
1. Presentar datos utilizando representaciones usuales como las gráficas de líneas, de
barras y de sectores.
2. Representar la distribución de frecuencia para la variable continua en un histograma,
polígono de frecuencias y ojiva.
3. Elaborar cuadros estadísticos para la presentación de información.
4.
Elaboración de un cuadro

Cuando se va a hacer la agrupación de las observaciones correspondientes a las


características que interesa analizar, es necesario establecer, ante todo, algún criterio de
ordenación. Por ejemplo, la clasificación de una característica cualitativa se puede hacer de
acuerdo con un orden alfabético, cronológico o en forma de importancia. Para la clasificación
de las características cuantitativas se utilizan las escalas numéricas.

No hay que olvidar que los cuadros o tablas corresponden a arreglos sistemáticos de
datos. La forma del cuadro depende en gran parte del propósito para el cual se ha preparado.
A pesar de que no se tienen reglas fijas para la elaboración de cuadros, si se pueden observar y
aplicar algunas de las recomendaciones, que en forma muy general, se han hecho y como tales
se han aceptado:

 El cuadro debe ser lo más sencillo posible, siendo preferible la elaboración de dos o más
cuadros, en vez de uno solo que contenga demasiados detalles respecto de las
características examinadas.

 Si en una publicación o informe se tienen dos o más cuadros, estos deben ser numerados.

 Todo cuadro debe tener un título, el cual debe ser claro y conciso, que responda a los
interrogantes: qué, cómo, dónde y cuándo se hizo, como por ejemplo: “Encuesta sobre el
precio de artículos de primera necesidad en Luján de Cuyo - Mendoza - Marzo de 1.998”. El
título podría clarificarse aun más si se establece a quién se hizo la investigación: amas de
casa, comerciantes minoristas, etc.

 El titulo debe tener una separación del cuadro, dejando por lo menos dos espacios
intermedios. Algunos consideran que el título debe ser colocado en la parte superior del
cuadro en tal forma que el lector se entere de inmediato sobre el contenido del cuadro;
otros son partidarios de colocarlo debajo.

Estadística 37 Lic. M. Gabriela. Biondolillo


 El encabezamiento del cuadro contiene los títulos y subtítulos de las columnas. Los
títulos deben ser colocados en mayúscula y los subtítulos en minúscula. En el
encabezamiento del cuadro se puede colocar una columna para totales, que puede estar
ubicada al principio o al final, partiendo de izquierda a derecha. También los totales
pueden ubicarse en la parte inferior del cuadro, pero dentro del mismo. En el
encabezamiento pueden haber columnas para subtotales en el caso que sea necesario.

 El cuerpo del cuadro corresponde a la parte numérica, información o contenido. Si la


primera columna del cuadro se utiliza para describir una característica cualitativa, los
nombres que toma se ubicaran en las diferentes líneas, pudiéndose usar letras mayúsculas
o minúsculas, seguida de puntos suspensivos hasta el comienzo de la segunda columna, en
caso que el papel no tenga los renglones trazados.

 Se debe tener cuidado con el contenido del cuadro, ya que si no se conoce la información o
cantidad, el espacio correspondiente no debe dejarse en blanco o colocar ceros y en ese
lugar se colocarán guiones. Ahora, si en lugar de no conocer la información, la situación es
que no se tiene, se debe hacer una indicación o llamada colocada en dicho espacio. Se
presentan a continuación algunas convenciones utilizadas en la confección de cuadros:

 cantidad inferior a la unidad aceptada


 no hay cifras disponibles
 cifras revisadas
 estimaciones
 información suspendida
 sin movimiento
 datos provisionales

 El cuadro se cerrará por encima y por debajo con líneas mas fuertes (o doble línea) que las
utilizadas en el interior del cuadro.

 Deberán especificarse las unidades de medida utilizadas para la descripción de la


característica. En el caso que se quiera presentar cifras relativas o porcentuales, no se
excluirán del mismo las respectivas frecuencias absolutas.

 Pie: será utilizado un espacio debajo del cuadro para dar referencia al origen de los datos,
es decir, de dónde fueron tomados. Además, para dar explicaciones sobre las abreviaturas,
símbolos o códigos utilizados; también servirá dicho espacio para indicar si el cuadro fue
tomado de otra publicación, indicando con claridad la fuente, autor, página, etc.

 Además de las recomendaciones anteriores, no sobra agregar que la buena presentación de


un cuadro se conseguirá a base de experiencia, dada por una práctica constante sobre este
tipo de trabajo, sin olvidar que la finalidad de un cuadro es ordenar los valores que toman
Estadística 38 Lic. M. Gabriela. Biondolillo
las características, de tal manera que al sintetizar la información, se tenga un mayor
conocimiento sobre lo investigado.

CUADRO Nº
TITULO (qué, cómo, cuándo, dónde)
Título en mayúsculas
ENCABEZAMIENTO (título en Subtítulo en minúscula TOTAL
mayúsculas)
Sub -
total

CUERPO (líneas en mayúscula o


minúscula)

TOTALES
PIE

Elaboración de gráficos

La presentación de las informaciones obtenidas se puede realizar de varias formas:


 textual (en forma de texto);
 cuadros, tal como analizamos anteriormente;
 gráficos.

Cuando el informe se hace en forma textual, se trata de una presentación simple y limitada,
tal como sucede en los reportajes y artículos periodísticos, donde los datos aparecen
intercalados con los comentarios y con las conclusiones derivadas de las interpretaciones de
los mismos, en una forma ligera y descriptiva.

En un informe textual complementado con cuadros, estos sirven de ayuda al lector


para entender o ampliar lo que dice el texto. Sin embargo, la utilización de texto y cuadros no
es suficiente para la presentación de un buen informe, ya que la lectura del texto implicará un
tiempo precioso para entender todo el contenido; ahora, si el lector se remite a los cuadros
encontrará unas cifras, que en algunos casos no le aclaran lo suficiente y en otros, no le dicen
mucho sobre el problema estudiado, de ahí que sea necesario que el informe vaya acompañado
de gráficos, no como sustituto de las formas anteriores de presentación, sino como la mejor
manera de visualizar la información contenida en los cuadros y en el texto.

Estadística 39 Lic. M. Gabriela. Biondolillo


De todas las representaciones de datos estadísticos, los gráficos muestran en forma
extensiva y con la necesaria profundidad las características del fenómeno en estudio.

El gráfico es una representación de datos ilustrada, construida principalmente


mediante la asignación de valores a un conjunto de líneas horizontales y verticales llamadas
ejes.

Generalmente los gráficos usan como sostén un sistema de ejes cartesianos X e Y


donde se presentan dos variables asociadas. Generalmente en el eje “Y” se colocan las
frecuencias que presentan los distintos valores de la variable x que se representa sobre el eje
de abscisas o eje “X”.

Ventajas y Desventajas

Sus principales ventajas son: concisión, rapidez de percepción, vista de conjunto de


una situación y síntesis de datos. Entre las desventajas encontramos que desprecia
necesariamente ciertos detalles y resulta confuso cuando se pretende comparar varias
distribuciones.

Reglas en la elaboración de gráficas

La forma de la gráfica depende en gran medida del gusto de la persona que la elabora;
sin embargo, hay ciertos principios generales que se deben tener en cuenta en el logro de una
buena gráfica:

 La mejor gráfica es la mas simple. Las líneas y símbolos usados deben ser los estrictamente
indispensables para una mejor visualización de la información.

 Si hay mas de dos gráficas deben estar numeradas.

 Toda gráfica debe llevar un título que aclare el contenido de la misma. Debe responder a
los interrogantes: qué, cómo, cuándo y dónde.

 La posición del título en la gráfica se considera de gusto personal, de ahí que algunos
aconsejan que debe ser colocado en la parte superior y otros, que debe estar en la parte
inferior.

 Las líneas que llevan escalas deben dibujarse mas gruesas que las demás coordenadas; a su
vez, las líneas que representan los datos o la variable deben ser mas gruesas que las escalas.

 La línea vertical, denominada ordenada, se utiliza para representar la frecuencia.

Estadística 40 Lic. M. Gabriela. Biondolillo


 Las características cualitativas y cuantitativas van en la línea horizontal o abscisa.

 La lectura de la escala del eje horizontal se hace de izquierda a derecha y la lectura del eje
vertical, debe hacerse de abajo hacia arriba.

 En toda gráfica se debe explicar la fuente de donde fueron obtenidos los datos; además,
aclarar las escalas, leyendas, notas y convenciones que ayuden a identificar las
características presentadas.

 Los gráficos deben ser lo bastante sencillos para procurar una idea clara y ser
comprensibles sin la ayuda de las descripciones del texto.

 Los datos numéricos sobre los que se basa la gráfica deben presentarse en cuadro adjunto,
si no son incluidos en la misma gráfica.

 Las gráficas deben seguir, y nunca preceder la exposición del texto.

 Cuando los valores representados en un gráfico son elevados y varían poco, se pierde un
gran espacio por debajo de la curva, siendo preciso entonces adoptar una escala bastante
pequeña que desdibuja las variaciones. Por ello es aconsejable interrumpir el cuadriculado
mediante un corte horizontal o vertical según el eje en cuestión.

 Cuando la gráfica presenta mas de una variable, debe hacerse una muy clara
diferenciación por medio de leyendas, notas o signos convencionales.

Tipos de gráficos

Hay numerosos tipos de gráficas pero vamos a ver detenidamente aquellas que son
consideradas como las mas usuales:

 diagrama de puntos: se marcan simplemente los puntos de coordenadas de todos los


pares de valores (x;y). Son importantes ya que dan una primera interpretación de un
fenómeno en el cual se hipotetiza sobre la asociación de dos variables. Son
usados en series de tiempo, correlación y regresión y en gráficos de control.
20

15

10

0
1989 1990 1991 1992 1993 1994 1995 1996 1997

Estadística 41 Lic. M. Gabriela. Biondolillo


 diagrama de frecuencia: se utiliza para la representación de la variable discreta. En el eje
horizontal se colocan los valores que toma la variable xi y en el eje vertical las frecuencias
absolutas o relativas. Para cada valor de xi le corresponderá una frecuencia ri o fri,
indicándolo en el plano cartesiano mediante un punto; luego, partiendo de ese punto
tomado como referencia, trazamos una perpendicular al eje horizontal y se obtendrán las
barras con las cuales representamos la variable. También se puede hacer la representación
de la variable utilizando las frecuencias absolutas o relativas acumuladas; por tal razón se
denominan diagramas de frecuencias acumuladas. En este caso se observará que las líneas que
representan la variable van en sentido horizontal, a diferencia del caso anterior cuyas
barras son verticales. Las gráficas elaboradas con frecuencias absolutas son exactamente
iguales a aquellas elaboradas con frecuencias relativas, diferenciándose únicamente en los
valores de las escalas correspondientes a las frecuencias.
 histogramas: está formado por un conjunto de rectángulos, cada uno de ellos levantado en
cada intervalo, de tal manera que la base será igual a la amplitud del intervalo (c) y la
altura estará dada ya sea por la frecuencia absoluta o relativa. Se utiliza para la representación
de la variable continua. Si elaboramos el histograma teniendo en cuenta las frecuencias
relativas, será un gráfico de gran utilidad al comparar dos distribuciones.

25

45 20
40 15
35
30 10
25
20 5
15
0
10
5 1 2 3 4 5 6 7 8 9
0
10-20

30-40

40-50

50-60

60-70

70-80

80-90

90-100
20-30

 polígonos de frecuencia: con la misma información utilizada para la elaboración del


histograma, se puede dibujar el polígono de frecuencia. En primer lugar se establecen los
puntos medios en la parte superior de cada rectángulo, luego se unen dichos puntos
mediante una línea, prolongándose en el primer y último intervalo hasta el eje de abscisas y
al punto medio del intervalo anterior y posterior a los de la variable en estudio. Esto se
45
40
35
30
25
20
15
Estadística 10 42 Lic. M. Gabriela. Biondolillo
5
0
15 25 35 45 55 65 75 85 95
hace a efectos de que el área encerrada bajo la curva sea exacta en función del valor de los
ángulos opuestos por el vértice. Se utiliza para representar la variable continua dado que se basa
en el histograma.

 ojivas: para el trazado de esta gráfica, en primer lugar, se ubican los puntos en el plano
cartesiano. Dichos puntos se determinan teniendo en cuenta el límite superior de cada
intervalo y las respectivas frecuencias absolutas o relativas acumuladas; luego se unen esos
puntos, partiendo desde el límite inferior del primer intervalo ubicado en el eje horizontal.
Se utiliza para la representación de la variable continua.
200
180
160
140
120
100
80
60
40
20
0
0-10

10-20

30-40

40-50

50-60

60-70

70-80

80-90

90-100
20-30

 pictogramas: es una forma de representar las cantidades estadísticas por medio de dibujos,
utilizando para ello objetos y figuras; las figuras deben explicarse por si mismas. Se
acostumbra que el tamaño sea uniforme, indicándose aparte de las figuras el valor de una
de ellas. Por otro lado, el tamaño puede variar y la altura de cada objeto estará dada por la
frecuencia absoluta o relativa; pero una inmensa mayoría considera que dicha
representación puede conducir a errores en su interpretación, especialmente cuando los
tamaños de las figuras no son proporcionales a la cantidad que se representa. Si los
tamaños de las figuras no son uniformes pero sí proporcionales, se tendrá una
representación exacta pero poco expresiva.

 cartogramas: es la representación de una información estadística por medio de mapas,


dentro de los cuales se ubican símbolos y, en algunos casos, gráficas; para indicar tanto la
localización geográfica así como la importancia del valor de la variable observada en
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
Estadística 43 Lic. M. Gabriela. Biondolillo
relación con el conjunto.

 diagramas de barras: es uno de los gráficos mas utilizados por su sencillez y por la
facilidad que ofrece para representar las características cuantitativas y cualitativas. Pueden
ser:
 Verticales

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

 Horizontales

1996

1995

1994

1993

1992

1991

1990

0 5 10 15 20 25 30

 Simples

Estadística 44 Lic. M. Gabriela. Biondolillo


25
20
15

10
5
0
1990 1991 1992 1993 1994 1995 1996

 Subdivididas

60
50
40
30
20
10
0
1990 1991 1992 1993 1994 1995 1996

Valor 1 Valor 2

 Absolutas

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

Estadística 45 Lic. M. Gabriela. Biondolillo


 Relativas

20,00%

15,00%

10,00%

5,00%

0,00%
1990 1991 1992 1993 1994 1995 1996

 Bidireccionales

30
25
20
15
10
5
-30 -20 -10 0 10 20 30
0 Export. Importac.
1990 1991 1992 1993 1994 1995 1996
Valor 1 Valor 2

 Apareadas

 diagramas circulares: se utiliza con mucha frecuencia para representar características


cualitativas, y sirve para hacer notar las diferencias en las proporciones o porcentajes en que
está dada la distribución. Este tipo de comparación es relativamente efectivo, siempre que
los segmentos sean lo suficientemente grandes para permitir comparaciones. El proceso
que se sigue en la confección de la gráfica circular o pastel, consiste en subdividir los 360º
de la circunferencia, proporcionalmente al porcentaje de cada una de las clases que ha
tomado la característica.

Estadística 46 Lic. M. Gabriela. Biondolillo


1996 1990
18% 11%

1991
16%

1995
14%

1992
12%

1994
16% 1993
13%

 diagramas de líneas: es otra de las gráficas muy utilizadas pero, al mismo tiempo, la que
presenta mayores dificultades en la visualización de los datos, dando lugar, algunas veces, a
imágenes o conclusiones erróneas debido a la mala confección de las escalas de los ejes.
También se los denomina curvas de sucesión porque generalmente se refieren a variables
observadas durante un periodo. Dichas variables se denominan series de tiempo o series
cronológicas: la variable tiempo se coloca en el eje horizontal y los valores que toma la
variable en el eje vertical.

Autoaprendizaje 2-1

30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996

Las exportaciones anuales de un grupo de pequeñas empresas farmacéuticas son:


Exportaciones Número de empresas
(en millones de $)
2-4 6
5-7 13
8-10 20
11-13 10
14-16 3
1. Representa las exportaciones en un histograma.
2. ¿Cuáles son los puntos medios?
3. Representa las exportaciones en un polígono de frecuencias.
Estadística 47 Lic. M. Gabriela. Biondolillo
4. Interpreta las gráficas.

Para cerrar el desarrollo de los conceptos relacionados con la confección de cuadros y


gráficos, te recomiendo la lectura del capítulo 3 del libro complementario.

Estadística 48 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 2

Tema: Cuadros y Gráficos


Actividades:

1. Elabora una gráfica adecuada para presentar la siguiente información: durante unos 5 meses
se construyeron 134 km. de carretera en la siguiente forma: el primer mes 3,60% del total, el
segundo mes 7,60% del total, el tercer mes 15,30% del total, el cuarto mes 24,50% del total y el
último mes el 49% restante.

2. Grafica los siguientes datos referidos a una población potencial de consumidores:


EDAD Distribución porcentual (%)
(años) Hombres Mujeres
15-19 10,9 9,7
20-24 9,1 8,9
25-29 7,6 7,4
30-34 5,8 6,3
35-39 4,9 5,3
40-44 4,2 4,5
45-49 3,9 3,0
50-54 2,5 2,8
55-59 2,2 1,0

5. Realizar el gráfico que muestre los datos obtenidos de una encuesta realizada en 1.999 en
la zona este de la provincia de Mendoza sobre la cantidad de personas que adquieren el
diario.

Hombres Mujeres Total


Nunca 6 14 20
Acontecimientos 1 5 6
especiales
2 veces por 23 8 31
semana
1 vez por semana 27 19 46
Todos los días 14 10 24
Total 71 56 127

5. Grafica y determina el valor probable que tomará la función de acuerdo a la tendencia que
se observa en el gráfico.

Estadística 49 Lic. M. Gabriela. Biondolillo


Mes Ventas
Enero 600
Febrero 400
Marzo 200
Abril 100
Mayo 300
Junio 500
Julio 600
Agosto 500
Setiembre 300
Octubre 100
Noviembre 300
Diciembre

6. Realiza un gráfico que permita ejercer control entre los costos presupuestados y los reales
según la tabla siguiente:

Volumen de Importe de los costos en miles de pesos


producción
en m3 Presupuestados Reales
100 130 90
300 380 340
500 550 470
700 700 600
900 800 800
1100 930 1050
1300 1090 1190

Estadística 50 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 2

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta correcta.


1. Un histograma es una gráfica que representa la distribución de frecuencia de una variable
discreta.
2. Para trazar un polígono de frecuencias, se necesitan los puntos medios de clase y las
frecuencias de clase.
3. El gráfico de sectores es más adecuado para la representación de las características
cuantitativas.
4. Lo que distingue a una ojiva es que para su elaboración se deben utilizar las frecuencias
acumuladas.
5. La forma de un cuadro estadístico depende del objetivo que se persiga pero, en general,
debe ser sencillo.
6. La presentación de las informaciones obtenidas se puede realizar de varias formas:
textual, cuadros y gráficos.
7. Un buen gráfico reemplaza a una tabla estadística en la presentación de los datos.

Estadística 51 Lic. M. Gabriela. Biondolillo


Módulo nº 3:
MEDIDAS ESTADÍSTICAS

Objetivos:
1. .Calcular y aplicar adecuadamente la media aritmética, la mediana y el modo,
teniendo en cuenta sus ventajas y desventajas.
2. Identificar la posición de la media, la mediana y el modo tanto en distribuciones
simétricas como asimétricas.
3. Calcular y aplicar adecuadamente las medidas de dispersión, asimetría y
apuntamiento a un conjunto de datos organizados en una distribución de
frecuencias.
4. Calcular y comprender los usos del coeficiente de variación y de asimetría.

Introducción

En esta unidad se presenta una serie de métodos para estudiar o medir el


comportamiento de los elementos que constituyen una población. Si bien es cierto que los
cuadros y gráficos describen el fenómeno, no lo hacen en forma satisfactoria, y por tanto hay
necesidad de acudir a ciertas medidas denominadas parámetros de la población, cuando se
hacen sobre el total de esta, y estadígrafos cuando corresponden a una parte de la población
o muestra.

Teniendo en cuenta la clasificación anterior, los símbolos que se refieren a la población


estarán representados por letras griegas o por letras mayúsculas de nuestro alfabeto, y los que
se refieren a la muestra, por letras minúsculas de nuestro alfabeto.

Para el análisis de una variable o una distribución unidimensional se consideran


cuatro tipos de medidas:

1. medidas de posición o de tendencia central;

2. medidas de dispersión o de variabilidad;

3. medidas de asimetría o de deformación;

4. medidas de apuntamiento o curtosis.

A continuación, te presento las características fundamentales de las principales


medidas. No obstante, para el desarrollo de ejemplos y la mejor comprensión de los temas es
necesaria la lectura de los capítulos 4, 6 y 7 del libro “Estadística” de Garzó y García.

Cuando realices la lectura verás que es necesario ajustar la simbología, dado que la
empleada en este material no coincide con la del libro. Por otra parte, la exposición del libro
Estadística 52 Lic. M. Gabriela. Biondolillo
es más amplia, de manera tal que deberás utilizar este material como guía para identificar los
temas relevantes para nuestros objetivos.

Medidas de tendencia central

Finalidad: describir y sintetizar mediante un número único las características más


relevantes de un conjunto de valores.

Media aritmética

Concepto: para datos no agrupados, la media aritmética es igual a la suma de todos los
valores de la variable dividida entre el número total de valores. La fórmula es:

X=  Xi
n

Donde:

 X significa media aritmética

 Xi indica un valor específico

 n es el número total de valores en la muestra

  es la letra griega sigma mayúscula e indica la operación de sumar un conjunto de


datos (sumatoria)

Para calcular la media aritmética para datos agrupados por su frecuencia, la fórmula
es:

X=  Xi . ri
n
Donde ri es la frecuencia asociada a cada uno de los valores de la variable.

Características

 mas conocido

 mas fácil de calcular

 mas utilizado
Estadística 53 Lic. M. Gabriela. Biondolillo
Ventajas

 se presta a tratamiento algebraico

 gran estabilidad en el muestreo

 sensible a cambios en los valores de la distribución

Desventajas

 no puede aplicarse cuando no están definidos los valores extremos de los intervalos de
clase

 muy afectada por valores extremos por lo que se torna no representativa

Propiedades

 la suma de las desviaciones del valor de la variable respecto de la media es igual a cero (0);

 la media aritmética de una constante es igual a la constante;

 la media del producto de una constante por una variable es igual a multiplicar la constante
por la media de la variable;

 la media de una variable mas (o menos) una constante es igual a la media de la variable mas
(o menos) la constante;

 la media de una muestra dividida en submuestras es igual a la media ponderada de las


submuestras, tomando como ponderación el tamaño de las mismas.

x = x1 . n1 + x2 . n2
n1 + n2

Autoaprendizaje 3-1

Los ingresos netos de una muestra de grandes importadores de antigüedades se


organizaron en la tabla siguiente:

Estadística 54 Lic. M. Gabriela. Biondolillo


Ingresos Netos
(en millones de U$S) Nro. de importadores
2-4 1
5-7 4
8-10 10
11-13 3
14-16 2
1. ¿Cómo se denomina la tabla?
2. Calcula la media aritmética del ingreso neto.
3. La media calculada en el punto 2 ¿es un estadígrafo o un parámetro? ¿por qué?
4. ¿Cuál es la mejor estimación de la media poblacional?

Mediana

La Mediana (Me) es aquel valor de la variable que supera la mitad de las observaciones
y a su vez es superado por la otra mitad de las observaciones.

Características:

 menos importante que la media, de aplicación menos frecuente

 gran inestabilidad en el muestreo

 fórmulas rígidas que no admiten tratamiento algebraico

Se aplica:

 distribuciones irregulares cuyos valores extremos afectan el cálculo de la media: la mediana


no es afectada por los cambios en el valor de la variable mientras no sea en la observación central.

 distribuciones que presentan el primero y último intervalo abierto: el valor de la Me depende


del número de observaciones y no del valor de las mismas.

Cálculo:

 Me de una serie con datos no agrupados, se ordenan los datos de manera creciente o
decreciente y luego se calcula el orden de la mediana. Con número impar de observaciones,
el valor de la mediana está dado por el valor de la variable cuya ubicación en el arreglo de
datos coincide con el orden de la mediana. Con número par de observaciones, el valor de la
mediana está dado por la media aritmética de los dos valores centrales del arreglo de datos.

Estadística 55 Lic. M. Gabriela. Biondolillo


Me= n + 1
2

 Me de una serie con datos agrupados por frecuencia y en I.C.: en primer lugar se calcula
el orden de la mediana como n/2 y con ese valor ubicamos la clase mediana según la
columna de Ri (frecuencia absoluta acumulada) teniendo en cuenta que el valor de Ri debe
ser igual o superior al valor dado por el orden de la mediana. Luego aplicamos la siguiente
fórmula:

Me= L.I. + c/ri . (n / 2 - Ri -1)

Donde:

 L.I. es el límite inferior de la clase mediana

 C: amplitud de la clase mediana

 Ri: frecuencia absoluta de la clase mediana

 n/2 es el orden de la mediana

 Ri -1 es la frecuencia absoluta acumulada de la clase anterior a la clase mediana.

 Me de una serie con datos agrupados solo por la frecuencia: en primer lugar se calcula el
orden de la mediana como n/2 y con ese valor ubicamos la clase mediana según la columna
de Ri (frecuencia absoluta acumulada) teniendo en cuenta que el valor de Ri debe ser igual
o superior al valor dado por el orden de la mediana. Luego, el valor de la mediana es el valor
de la variable que corresponde a la Ri indicada.

Autoaprendizaje 3-2
El número de paros en el trabajo, en la industria automotriz para meses
seleccionados son: 6, 0, 10, 14, 8, 0.
1. ¿Cuál es la mediana del número de paros?
2. ¿Cuántas observaciones están por debajo de la mediana? ¿cuántas por
encima?

Modo

El Modo (Mo) es aquel valor de la variable que mas veces se repite, es decir, presenta
la mayor frecuencia.
Estadística 56 Lic. M. Gabriela. Biondolillo
Características

 menos importante y de uso limitado

 sus fórmulas no admiten tratamiento algebraico

 no es sensible a valores extremos

 no es afectado por cambios en el valor de la variable diferentes al valor del modo

Se aplica:

 distribuciones con I.C. abiertos

 distr ibuciones con I.C. de amplitud constante

 distribuciones con frecuencia muy grande en relación a otras

 promedios de tipo industrial (producción, ventas, etc.)

Cálculo:

 para datos no agrupados y para datos agrupados por la frecuencia se busca el valor de la
variable que mas veces se repite en función de la columna ri (frecuencia absoluta).

 para datos agrupados por la frecuencia y en I.C. se aplica la siguiente fórmula, teniendo en
cuenta el intervalo de clase que presenta la mayor frecuencia absoluta (ri)

Mo= L.I. + (  1 /  1 +  2) . c

Donde:

 L.I. es el límite inferior del intervalo modal (el que tiene mayor frecuencia absoluta)

  1 es la diferencia entre la frecuencia absoluta del intervalo modal y la frecuencia


absoluta del intervalo anterior a la clase modal

  2 es la diferencia entre la frecuencia absoluta del intervalo modal y la frecuencia


absoluta del intervalo posterior a la clase modal.

Estadística 57 Lic. M. Gabriela. Biondolillo


Relación empírica entre las medidas de tendencia central

Esta dada por la siguiente relación:

Media - Modo = 3 . (Media - Mediana)

Estadística 58 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 3

Tema: Medidas de Tendencia Central


Actividades:

1. En base a los datos siguientes:


1.1 determinar las frecuencias absolutas para cada valor
1.2 construir una tabla de frecuencia con intervalo de amplitud = 1
1.3 calcular media aritmética, mediana y modo para datos no agrupados y para
datos agrupados
10.3 15.3 7.9 14.6 15.0 14.9 15.0 7.0 12.8 12.9
11.6 8.7 9.3 13.2 11.0 6.8 7.9 8.6 10.3 8.5
10.0 10.9 12.3 11.4 8.3 10.6 11.8 9.3 10.6 10.6
12.6 12.6 13.2 10.2 9.3 9.7 10.6 11.3 11.1 9.5
6.9 11.1 14.1 12.6 11.4 11.4 9.9 6.3 7.9 11.9
12.8 13.1 13.7 9.9 6.7 8.7 10.3 8.7 11.6 6.3
8.5 7.8 7.8 10.5 10.9 9.5 8.7 8.4 9.7 10.6
10.9 14.0 11.3 6.9 9.4 9.9 10.1 11.8 10.6 13.6
7.3 10.7 10.6 10.8 10.5 11.3 10.1 8.1 8.9 11.3
7.4 8.6 9.8 7.6 6.4 6.8 7.8 7.5 10.6 9.6

2. Una industria de cemento tiene registros correspondientes a la producción semanal de este


producto. Los registros de 50 semanas consecutivas en un año en particular fueron:

Producción Q de semanas
Menos de 5 6
5-7 9
7-9 15
9-11 18
Mas de 11 2
Total 50

calcular media aritmética, mediana y modo.

3. Un supermercado tiene catalogadas a sus sucursales de acuerdo a:


 las zonas en las que están instaladas
 índice de tamaño (considerando superficie ocupada y cantidad de personal)
 volumen de ventas semanales en pesos

Sucursal Zona Índice de tamaño Ventas semanales


A 1 3 620
B 2 5 720
Estadística 59 Lic. M. Gabriela. Biondolillo
C 3 2 270
D 2 1 340
E 2 1 350
F 1 4 660
G 2 5 1120
H 3 4 720

calcular para cada variable en estudio (zona, tamaño, ventas) la medida que mejor la
represente.

4. La media aritmética de 30 acciones es de $28. Si 10 de ellas tienen un promedio de $26 ¿cuál


es el valor de las restantes?

5. Una empresa ha determinado para el mes de marzo de 2.002 una venta promedio de
$53.000; con posterioridad descubre que un error en el programa de la computadora ha hecho
que este disminuya en un 18% el importe de cada factura. ¿Cuál es en realidad el valor de la
venta promedio?

6. Una empresa se encuentra discutiendo los aumentos salariales con el sindicato, mientras el
representante sindical propone un aumento de $100 para cada empleado, el gerente quiere un
aumento de 25% para cada trabajador. Le solicitan su asesoramiento y Ud. debe indicar en
función de la distribución actual de salarios qué aumento le conviene económicamente aplicar
a la empresa y qué aumento le conviene a cada uno de los trabajadores.

Escala de sueldos Cantidad de


empleados
150-250 10
250-350 20
350-450 30
450-550 20
550-650 10

7. El área de recursos humanos de una empresa fabril ha recopilado la cantidad de infortunios


ocurridos en los últimos tres años. Calcular media, mediana y modo.

Cantidad de Cantidad de meses


accidentes
0 2
1 5
2 9
3 6
4 4
Estadística 60 Lic. M. Gabriela. Biondolillo
5 3
6 3
7 2
8 1
9 1

8. De la distribución del peso de los paquetes que se entregan en la empresa “A” por día,
calcular: media, mediana y modo.

Peso de los paquetes Cantidad de paquetes


3-6 6
6-9 9
9-12 10
12-15 8
15-18 7

9. En una fábrica textil se hicieron observaciones en una sección de 400 telares, en tiempos al
azar, durante diez días para determinar el número de telares que estaban trabajando en
cualquier momento. Calcular media, mediana y modo.

Día Nro. de telares


1 360
2 363
3 361
4 365
5 360
6 355
7 363
8 359
9 357
10 368

10. Calcular la media y la mediana del sueldo semanal de los veinte empleados que se
presentan a continuación: 42, 42, 68, 69, 69, 72, 72, 72, 72, 73, 74, 74, 75, 76, 77, 77, 79, 79, 79,
80.

Estadística 61 Lic. M. Gabriela. Biondolillo


14. De la siguiente distribución de ventas de la empresa XX durante las últimas 100 semanas,
expresada en miles de pesos, calcular la media, mediana y modo.

Ganancias Semanas
0-4 3
4-8 8
8-12 24
12-16 30
16-20 25
20-24 6
24-28 4

Estadística 62 Lic. M. Gabriela. Biondolillo


Medidas de Dispersión

Finalidad: determinar el grado de variabilidad de los datos respecto a un promedio

Tipos:
 rango, oscilación o recorrido
 varianza
 desviación típica o estándar
 coeficiente de variación

Rango

 mas fácil de calcular: r = Xmax – Xmin

 engañoso porque se eliminan los otros valores de la variable

Varianza

Varianza (S2) es la media aritmética de los cuadrados de las desviaciones de los valores de la variable
respecto de la media aritmética

 muy conocido y usado

 da origen a la medida de dispersión mas significativa (desviación estándar o típica)

S2 =  ( Xi - X )2 (datos no agrupados)
n

S2 =  ( Xi - X)2 . ri (datos agrupados)


n

Propiedades de la varianza

 la varianza es siempre un valor positivo porque la variable está elevada al cuadrado

 la varianza de una constante es igual a cero S2 (k) = 0

 la varianza de la suma (o resta) de una variable más (o menos) una constante, es igual a la
varianza de la variable S2 (x + k) = S2 (x)

Estadística 63 Lic. M. Gabriela. Biondolillo


 la varianza de una constante por una variable es igual al producto de la constante al
cuadrado por la varianza de la variable S2 (k.x) = k . S2 (x)

Desviación Típica

 es la raíz cuadrada de la varianza S = S2

 se utiliza para comparar dos o más distribuciones cuando están dadas en la misma unidad
de medida para determinar cuál de ellas presenta mayor o menor variabilidad absoluta

Autoaprendizaje 3-3
Los tiempos de servicio en una muestra de taladros disponibles para su
alquiler en una empresa de herramientas se organizaron en la siguiente
tabla:

Antigüedad
(en años) Número
2-4 2
5-7 5
8-10 10
11-13 4
14-16 2
1. ¿Cómo se denomina este agrupamiento?
2. Calcula el tiempo medio de funcionamiento de los taladros.
3. Estima la desviación estandar muestral.
4. ¿Cuál es la varianza muestral?

Coeficiente de Variación

d = (s / x) . 100

 se utiliza para comparar la variabilidad relativa entre dos o mas distribuciones


expresadas en unidades de medida diferentes

 se usa también para determinar la representatividad de la media.

Autoaprendizaje 3-4
A un gran grupo de conscriptos de la Fuerza Aérea se le aplicaron dos pruebas
experimentales: una de aptitudes mecánicas y otra de destreza manual. La media
aritmética de la calificación en la prueba de aptitudes mecánicas fue de 200, con una
desviación estándar de 10, la media y la desviación estandar para la prueba de

Estadística 64 Lic. M. Gabriela. Biondolillo


destreza manual fueron respectivamente: 30 y 6. Compara las dispersiones relativas de los dos grupos e
interpreta la respuesta.

Medidas de Asimetría

 distribución simétrica: X = Me = Mo

 distribución asimétrica positiva (derecha): Mo < Me < X

 distribución asimétrica negativa (izquierda): Mo > Me > X

 primer coeficiente de Pearson = X - Mo


S

 segundo coeficiente de Pearson = 3 (X - Me)


S

 coeficiente de sesgo a3 = m3 / S3

donde:

m3=  (xi – x)3 . ri


n

 resultado menor a 0: distribución asimétrica negativa (izquierda)

 resultado igual a 0: distribución simétrica

 resultado mayor a 0: distribución asimétrica positiva (derecha)

 es muy importante porque indica la posición del sesgo (como los coeficientes de Pearson) y
también el porcentaje de observaciones de la distribución que está sesgado.

Autoaprendizaje 3-5
Las ventas semanales en una muestra de tiendas de suministros eléctricos, se
organizaron en una distribución de frecuencias.. Se calculó la media de las ventas
semanales como $105900, la mediana como $105000 y el modo como $104500.
1. Representa las ventas en forma de un polígono de frecuencias y
observa la ubicación de la media, la mediana y el modo en el eje X.
2. ¿La distribución es simétrica, asimétrica positiva o asimétrica
negativa? Explica tu respuesta.
Estadística 65 Lic. M. Gabriela. Biondolillo
Autoaprendizaje 3-6
Una muestra de operadores de captura de datos muy experimentados, reveló que su
velocidad media al teclear es de 87 palabras por minuto, con una mediana de 73. La
desviación estandar es 16,9 palabras por minuto. ¿Cuál es el coeficiente de asimetría?
Interprétalo.

Medidas de Apuntamiento o Curtosis

 indica el grado de agudeza en la cima de la curva que representa a la distribución, es una


medida de la altura de la curva

 curtosis: K = m4 / S4 y los resultados pueden ser:

donde:

m4 =  (xi – x)4 . ri
n

 menor a 3 (tres): curva platicúrtica o achatada

 igual a 3 (tres): curva mesocúrtica o normal

 mayor a 3 (tres): curva leptocúrtica o apuntada

Características de la Curva Normal

 Simétrica: X = Me = Mo

 Homogénea: Coeficiente de Variación está entre 0 y 25%

 Coeficiente de sesgo a3 = 0

 Mesocúrtica: K = 3

 entre la media y una vez la desviación típica por encima y por debajo, se tendrá el 68,3% de
las observaciones

Estadística 66 Lic. M. Gabriela. Biondolillo


 entre la media y dos veces la desviación típica por encima y por debajo, se tendrá el 95,5%
de las observaciones

 entre la media y tres veces la desviación típica por encima y por debajo, se tendrá el 99,7%
de las observaciones

 a partir de tres, por mas que se aumente el número de veces que se repite el valor de la
desviación típica, no se tendrá el 100% puesto que la curva se aproxima al eje horizontal
pero no lo toca (curva asintótica)

Estadística 67 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 4

Tema: Medidas de dispersión, asimetría y apuntamiento


Actividades:

1. Con los datos del ejercicio nº 1 del trabajo práctico nº 3 calcular:


 rango
 varianza para datos agrupados
 desviación típica para datos agrupados
 coeficiente de variación

2. En función de lo expresado en el ejercicio nº 5 del trabajo práctico nº 3, si la varianza fuera


de $2.500. ¿Cuál sería la desviación típica después del arreglo?

3. Electrónica Moderna es una compañía que está considerando la conveniencia de implantar


dos programas de capacitación. A dos grupos se les impartió capacitación para realizar la
misma tarea. Para adiestrar al grupo 1 se requirieron en promedio 32 horas para capacitar a
cada empleado con una varianza de 64 horas. En el segundo grupo se necesitó un promedio de
19 horas con una varianza de 81 horas. ¿Cuál programa mostró la menor variabilidad relativa
en sus resultados?

4. Hay varias medidas posibles del desempeño de ventas, entre ellas la constancia con que un
vendedor cumple con las metas establecidas. Los datos siguientes representan el porcentaje
de la meta lograda por tres vendedores en los últimos 5 años.
Patricia 88 68 89 92 103
Juan 76 88 90 86 79
Francisco 104 88 118 88 123
en función de lo expresado, ¿cuál de los vendedores tuvo el mejor desempeño?

5. El consejo de administración de una corporación está estudiando la posibilidad de adquirir


una de dos compañías y con mucho detenimiento analiza la administración de cada una en
relación a su inclinación a correr riesgos. En los últimos 5 años, la primera compañía alcanzó
un promedio de rendimiento sobre la inversión del 28% con una desviación típica de 5,3%. La
segunda tuvo un rendimiento sobre la inversión promedio de 37,8% con una desviación típica
de 4,8%. Si suponemos que el riesgo se acompaña con una mayor dispersión relativa, ¿cuál de
estas dos empresas ha aplicado una estrategia mas riesgosa?

6. Una empresa analiza los cien últimos balances mensuales y encuentra que sus ganancias
son normales a través de ellos. Calcular las medidas necesarias para comprobar esta
afirmación.
Ganancias Cantidad
55-59 2

Estadística 68 Lic. M. Gabriela. Biondolillo


59-63 9
63-67 24
67-71 28
71-75 24
75-79 7
79-83 3
83-87 3

7. Una empresa holliwodense de repartos, está escogiendo un grupo de extras para una
película, las edades de los primeros 20 varones entrevistados son: 50, 54, 56, 55, 55, 61, 49, 60,
52, 51, 57, 59, 56, 62, 57, 52, 56, 54, 59, 49. El director de la película quiere hombres cuya edad
se agrupe estrechamente alrededor de los 55 años. Como es un entusiasta aficionado de la
estadística, sugiere que una desviación estándar de 3 años sea aceptable. ¿Cumple con el
requisito este grupo de extras?

8. El administrador de un hospital mendocino realizó una encuesta sobre el número de días


que 200 pacientes escogidos al azar permanecen en él después de ser sometidos a una
operación. He aquí los datos:

Estancia en el 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24


hospital (en
días)
Número de 24 83 52 22 11 5 2 1
pacientes
teniendo en cuenta los datos precedentes ¿constituye una distribución de tipo normal?

9. Con las dos siguientes muestras se describen las edades de los estudiantes que asisten al
programa diurno y al programa nocturno de la carrera de administración en la Universidad
Central. Si la homogeneidad del grupo escolar es un factor positivo del aprendizaje, aplica una
medida de variabilidad relativa que indique a cuál de los dos grupos será mas fácil enseñarle.
Programa diurno: 24, 30, 28, 23, 25, 22, 26, 27, 28, 25.
Programa nocturno: 26, 33, 29, 28, 27, 29, 33, 34, 27, 28.

10. Con el propósito de estimar la demanda futura, la Fiat efectuó un estudio en el que
preguntó a un grupo de matrimonios cuántos automóviles deberán poseer en el año 2.001 los
que deseen economizar combustible. En cada matrimonio la compañía sacó el promedio de las
respuestas de ambos cónyuges para obtener la respuesta global del matrimonio. Las
respuestas fueron después tabuladas en una distribución de frecuencias, ¿cuáles son sus
características respecto de la distribución normal?
Número de 0-0.49 0.50-0.99 1.00-1.49 1.50-1.99 2.00-2.49 2.50-2.99
autos
Frecuencia 2 14 23 7 4 2

Estadística 69 Lic. M. Gabriela. Biondolillo


Estadística 70 Lic. M. Gabriela. Biondolillo
Autoevaluación del módulo nº 3

Escribe en la línea la respuesta correcta.


1. La _________________________ se determina ordenando los datos en forma creciente o
decreciente y seleccionando el valor central.
2. La __________________________ no puede calcularse si la distribución de frecuencias tiene una
clase de extremos abiertos.
3. Si la media es mayor que la mediana, la distribución es ________________________ asimétrica.
4. Si la media, la mediana y el modo son iguales, la distribución es ________________________.
5. La ____________________________ no se recomienda si se tiene un valor de la variable
extremadamente grande en el conjunto de datos.
6. Si se suman las desviaciones de los valores de la variable respecto de la media, el resultado
es siempre ______________________________.
7. El valor que ocurre con más frecuencia en un conjunto de datos es el ____________________.

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta correcta.


1. Una medida de la agudeza de una curva de distribución es el sesgo.
2. Cuando trabajamos con datos agrupados en intervalos de clase, podemos calcular una
media aproximada si suponemos que cada valor de una clase dada es igual a su punto
medio.
3. Si la curva de una cierta distribución tiene el extremo más largo hacia la izquierda de la
escala de medición del eje horizontal, se dice que la distribución está negativamente
sesgada.
4. La dispersión de un conjunto de datos da una cierta visión de la confiabilidad de la media
aritmética.
5. La varianza, al igual que la desviación estándar, toma en cuenta cada una de las
observaciones del conjunto de datos.
6. Una desventaja de utilizar el rango para medir la dispersión es que no toma en cuenta la
naturaleza de las variaciones entre la mayoría de las observaciones.
7. La varianza indica la distancia promedio de cualquier observación del conjunto de datos
con respecto a la media.

Estadística 71 Lic. M. Gabriela. Biondolillo


Módulo nº 4:
ANALISIS BIVARIABLE

Objetivos:
1. Conocer las características de una serie cronológica.
2. .Identificar los componentes de una serie de tiempo y las características de cada uno
de ellos
3. Analizar el objetivo de la regresión lineal simple.
4. Determinar una ecuación que pueda usarse en pronósticos.
5. Presentar las consideraciones en que se basa el análisis de regresión.
6. Determinar la fuerza de la relación entre las variables a través del uso del coeficiente
de determinación.

Estadística 72 Lic. M. Gabriela. Biondolillo


Series Cronológicas

Ya hemos estudiado las series estadísticas en general y hemos detallado su


representación gráfica; pero las hemos estudiado con carácter estático (en un momento del
tiempo).

Dentro de estas series, merecen una atención especial aquellas que tienen el tiempo
entre sus variables, series cronológicas o series de tiempo.

Concepto

Llamaremos serie cronológica a aquella en la algunos de sus caracteres se mide en


unidades de tiempo.

Ya hemos visto que el tiempo es un carácter cuantitativo, el resto de los caracteres de


la serie pueden ser cualitativos o cuantitativos.

Estas series podemos expresarlas matemáticamente como una función del tiempo Y=
F(t) y estudian el comportamiento de una variable Y (producción, ventas, precios, etc.) a lo
largo del tiempo t.

En cuanto a las unidades de tiempo, algunas tienen duración constante (horas, días,
etc.), pero otras son variables (meses, años, etc.). Este carácter variable puede influir en los
resultados de algunos estudios, y debe tenerse en cuenta al elegir las unidades de tiempo.

Representación gráfica

La representación gráfica se hace en un plano cartesiano. En el eje horizontal o abscisa


se coloca el tiempo (años, meses, semanas, días); en el eje vertical u ordenada van los valores
correspondientes a la variable Y.

Para cada unidad de tiempo se tendrá un valor de Y, el cual se representa en el plano


mediante un punto, y habrá tantos puntos como periodos observados tengamos, los que al ser
unidos, darán una línea.

Factores que la afectan

Los valores de la variable Y son distintos en cada periodo, de forma que la gráfica de la
función evoluciona al transcurrir el tiempo. A esta evolución la llamaremos “movimiento de la
serie”.

Estadística 73 Lic. M. Gabriela. Biondolillo


Cualquier serie cronológica real, estará sujeta a un movimiento mas o menos complejo
que podrá descomponerse en cuatro movimientos característicos principales que llamaremos
“componentes de la serie”, estos son:
- tendencia
- variaciones estacionales
- variaciones cíclicas
- variaciones aleatorias

Tendencia: son aquellas variaciones suaves que se suceden en un periodo


relativamente largo. El periodo debe ser largo (mas de cinco) para poder establecer una línea
de tendencia que sea representativa o significativa. La línea de tendencia muestra la evolución
general de la serie y puede determinarse por varios métodos.

Variaciones estacionales: estos movimientos representan, durante años sucesivos, la


evolución de la serie a lo largo de cada periodo de tiempo dentro de cada año. Generalmente
están ligadas a las estaciones del año (verano, otoño, invierno, primavera), aunque también
corresponden a cambios periódicos que se repiten en intervalos de tiempo más cortos; por
ejemplo: consumo de energía en las 24 horas del día. Estos movimientos anuales de la serie
son debidos a sucesos recurrentes que se repiten anualmente y aunque los valores dentro de
cada año no sean los mismos, las gráficas evolucionan casi idénticamente.

Variaciones cíclicas: son fluctuaciones a largo plazo, mas o menos periódicas, que se
repiten cada cierto numero de años y que, a diferencia de las variaciones estacionales, es difícil
determinar el periodo o ciclo, ya que no se puede saber con exactitud cuándo comienza y
cuándo termina, tal es el caso de las fluctuaciones cíclicas originadas en la actividad
económica (expansión, recesión).

Variaciones aleatorias: son aquellas que se presentan en forma accidental, siendo


difícil su predicción y que alteran la serie de un modo apreciable. Por ejemplo: terremotos,
inundaciones, huelgas, etc. Aunque estos hechos producen variaciones en la serie que solo
duran un corto intervalo de tiempo, las consecuencias pueden ser tan intensas, que sean
capaces de alterar otros movimientos de la serie (originar un nuevo ciclo, variar la curva de
tendencia, etc.). No se les puede aplicar los métodos de ajuste.

Toda estas series cronológicas deben ajustarse a través de un recta promedio que las defina, esta recta
permite, a través de su pendiente determinar si la variable va en ascenso o en descenso, y además se puede
observar el valor probable que la misma presentará en el futuro; temsa que se desarrollan a continuación.

Estadística 74 Lic. M. Gabriela. Biondolillo


EJEMPLO

Período Valor
1989 18 Valor Lineal (Valor)
1990 20
1991 19 30
1992 24
25
1993 22
1994 23 20
1995 24 15
1996 25
1997 24 10
1998 26 5
1999
0
1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001
2000
2001

Es importante destacar que este tipo de ajuste, sólo es válido cuando se tienen varios
períodos y el entorno en que se encuentra inmersa la variable es similar a través de los
distintos momentos. Esta herramienta es muy usada en materia comercial y económica en
estos momentos en nuestro país porque los factores exógenos, tales como inflación,
cotización del dólar, índices de producción, se han mantenido similares en los últimos años.

Nubes de dispersión de puntos: tipos.

A través de la representación gráfica de las series cronológicas, podemos distinguir


cuatro tipos de nubes de dispersión de puntos:
- lineal
- exponencial
- parabólicas
- aleatorias

Ajustes

Realizaremos el análisis sobre la tendencia por ser el que habitualmente se presenta en


las series de tiempo. Puede tomar diferentes formas: rectilíneo, parabólico o exponencial.

La mejor línea es aquella que mejor representa a ese conjunto de puntos. La gráfica
ayuda mucho a determinar la línea y la dirección que toma. Sin embargo puede afirmarse, que
no es posible determinar con absoluta certeza la bondad de la adaptación de una línea, pues
solamente el juicio personal y la experiencia del estadístico, son los elementos que se pueden
poner en juego en la elección del mejor ajuste.

La nube de dispersión de puntos aleatoria no puede someterse a ningún tipo de ajuste.

Estadística 75 Lic. M. Gabriela. Biondolillo


Para el ajuste de la nube de puntos parabólica, se trabaja con un sistema de tres
ecuaciones con dos incógnitas donde la primera ecuación esta elevada a la tercer potencia, la
segunda ecuación al cuadrado y la tercera ecuación a la primer potencia. En el ajuste de la
nube de puntos exponencial trabajamos con el logx. Analizaremos en detalle el ajuste de la nube
de puntos lineal.

Ajuste rectilíneo: existen varios métodos para realizar el ajuste de una recta en una
serie cronológica, a saber: método de la mano alzada, puntos seleccionados, semipromedios y
mínimos cuadrados. El primero y el último es el que desarrollaremos a continuación.

1- método de la mano alzada: se lo conoce también como método gráfico. Es muy


utilizado por personas de mucha experiencia; con su aplicación se obtienen resultados muy
satisfactorios, especialmente cuando la serie presenta muy pocas variaciones o estas se
producen en forma suave. El inconveniente que presenta este método es la no existencia de un
instrumento que juzgue adecuadamente la bondad de la línea, por otra parte, por mas experta
que sea la persona, una serie puede dar origen a diferentes líneas, de ahí que se lo considere
como un método muy subjetivo.

El proceso que se sigue en la aplicación del método de mano alzada, consiste en


dibujar la línea poligonal correspondiente a los datos originales, luego se estudia su
comportamiento, para después trazar una línea recta a mano alzada a través de esos puntos.
Si se prolonga la línea hasta el año que se desea estimar, leeremos en el eje vertical el valor,
precio o cantidad de Y para ese año. Algunos consideran que una vez trazada la línea recta, se
pueden determinar dos puntos, especialmente el primero y el último y luego obtener una
ecuación para la línea de tendencia.

2- método de los mínimos cuadrados: los métodos anteriores permiten obtener una
regular aproximación de la tendencia que presenta la serie. El método mas utilizado para
realizar un buen ajuste es el conocido como el de los mínimos cuadrados.

Este método no solo sirve para ajustar una línea recta, sino también para ajustar
tendencias no lineales, tales como la parabólica, exponencial, etc. Se trabaja asimismo con la
ecuación general de la recta Y= bx + c.

Para calcular el valor que tomara la variable en el futuro, es necesario resolver dos
ecuaciones normales en forma simultánea:

Yi = b .  Xi + nc
Xi Yi = b .  Xi2 + c . Xi

Predicción del futuro

Estadística 76 Lic. M. Gabriela. Biondolillo


La línea resultante del ajuste puede extenderse al futuro y nos insinúa la tendencia que
presentara esa serie. Algunos autores critican este proceso de vaticinio, por el hecho de estar
fundamentado en cifras históricas, que reflejan una vivencia del pasado. Sin embargo, es un
hecho que cualquier proceso futurista necesita fundamentarse en el presente y en el pasado.
Así tenemos que pensar que el comportamiento futuro de la variable dependerá de que las
condiciones bajo las cuales se dieron las informaciones, sigan siendo las mismas en el futuro.
Por esa razón se recomienda que una predicción no sea mayor de cinco años ya que las
condiciones pueden variar. Por otra parte, una buena selección de la línea nos dará una mejor
aproximación entre el valor estimado y el valor real.

Su importancia en cualquier empresa no es discutible. En la vida comercial es


interesante conocer las fluctuaciones de las ventas a través del tiempo y las causas que
originan esas variaciones; todo esto hará pensar sobre una posible ampliación o reducción de
los stocks de mercancía, el volumen de producción, niveles de precios, espacio físico, etc.

Una línea que represente una serie cronológica puede ser considerada casi recta pero
no debemos suponer que continuara en la misma dirección, salvo que las condiciones que la
originan permanezcan constantes. Por esto, al trazar una línea ya sea recta, parabólica o
exponencial, debemos analizar en primer lugar las causas y evaluar la probabilidad de que así
ocurra, antes de iniciar cualquier proceso de estimación.

Autoaprendizaje 4-1
Los datos sobre la producción anual de sillas mecedoras producidas por una empresa de Cuyo desde 1.993 se
presentan a continuación:

Año Producción
(en miles)
1.993 4
1.994 8
1.995 5
1.996 8
1.997 11
1.998 9
1.999 11
2.000 14
Estadística 77 Lic. M. Gabriela. Biondolillo
1. Grafica los datos de producción.
2. Determina la ecuación de estimación por el método de los mínimos cuadrados.
3. Con base en la ecuación de la recta ¿cuál será la producción estimada para el año 2.003?

Regresión y Correlación

Todos los días, los administradores toman decisiones profesionales y personales


basadas en predicciones de hechos futuros. Para hacer estas predicciones, se basan en la
relación (intuitiva y calculada) entre lo que ya se sabe y lo que se debe estimar: Si los
responsables de la toma de decisiones pueden determinar cómo lo conocido se relaciona con
el evento futuro, pueden ayudar considerablemente al proceso de toma de decisiones. Este es
el objetivo de este tema: cómo determinar la relación entre variables.

La regresión y los análisis de correlación nos mostrarán cómo determinar tanto la


naturaleza como la fuerza de una relación entre dos variables.

En el análisis de regresión, desarrollaremos una ecuación de estimación, es decir, una


fórmula matemática que relaciona las variables conocidas con la variable desconocida. Luego,
una vez que conocemos el patrón de esta relación, podemos aplicar el análisis de correlación
para determinar el grado en el que están relacionadas las variables. El análisis de correlación,
entonces, nos dice qué tan bien la ecuación de estimación realmente describe la relación.

Tipos de relaciones

La regresión y correlación se basan en la relación, o asociación, entre dos variables. La


variable conocida se llama la variable independiente; la variable que tratamos de predecir es la
variable dependiente. Por ejemplo: los científicos saben que existe una relación entre las
ventas anuales de latas de aerosoles (variable independiente) y la cantidad de fluorocarbonos
liberados en la atmósfera cada año (variable dependiente).

El ejemplo precedente es una ilustración de asociación directa entre la variable


independiente y la variable dependiente, es decir, al incrementarse la variable independiente,
la variable dependiente también se incrementa. Podemos representar gráficamente una
relación directa al ubicar la variable independiente en el eje X y la variable dependiente en el
eje Y, de manera que la pendiente de la línea resultante es positiva porque Y se incrementa al
incrementarse X.

Las relaciones también pueden ser inversas, en estos casos la variable dependiente
decrece al aumentar la variable independiente; de manera tal que la gráfica se caracteriza por
una pendiente negativa (la variable Y disminuye al aumentar la variable independiente X).

Estadística 78 Lic. M. Gabriela. Biondolillo


A menudo encontramos una relación causal entre las variables, esto es, la variable
independiente “ocasiona” que la variable dependiente cambie. Pero en muchos casos, otros
factores ocasionan los cambios tanto en la variable dependiente como en la independiente

Por esta razón, es importante que se consideren las relaciones encontradas por la
regresión como relaciones de asociación pero no necesariamente de causa y efecto. A menos
que se tengan razones específicas para creer que los valores de la variable dependiente son
ocasionados por los valores de la variable independiente, no se debe inferir causalidad de las
relaciones que se encuentren mediante la regresión.

Diagramas de dispersión

El primer paso en la determinación de si existe relación entre dos variables es


examinar la gráfica de los datos observados o conocidos. Como ya sabemos, esta gráfica se
denomina diagrama de dispersión.

Un diagrama de dispersión nos puede dar dos tipos de información. Visualmente,


podemos buscar patrones que indiquen que las variables están relacionadas. Entonces, si esto
sucede, podemos ver qué tipo de línea, o ecuación de estimación, describe esta relación.

También podemos trazar o ajustar una línea recta a través de nuestro diagrama de
dispersión para representar la relación, de manera análoga al procedimiento empleado en el
tema anterior (series de tiempo). Cuando los puntos de datos están relativamente cerca de la
línea de ajuste, podemos decir que existe un alto grado de asociación entre las variables.

La relación entre las variables X e Y también puede tomar la forma de una curva y la
dirección de la curva puede indicar si la relación curvilínea es directa o inversa.

Estimación mediante la línea de regresión

La ecuación para una línea recta donde la variable dependiente Y esta determinada por
la variable independiente X es, como sabemos, la ecuación general de la recta Y= b.x+c.

Usando esta ecuación, podemos tomar un valor dado de X y calcular el valor de Y. La b es la pendiente
de la línea y representa qué tanto cada cambio de unidad da la variable independiente X cambia la variable
dependiente Y. La c se denomina la “intersección Y” u “ordenada al origen” porque su valor es el punto en el
cual la línea de regresión cruza el eje Y, es decir, el eje vertical. Tanto b como c son constantes numéricas y su
valor podemos encontrarlo empleando el método de los mínimos cuadrados de manera similar a su aplicación
para el análisis de series cronológicas.

Estadística 79 Lic. M. Gabriela. Biondolillo


Yi = b .  Xi + nc
Xi Yi = b .  Xi2 + c . Xi

Matemáticamente la línea obtenida tendrá un buen ajuste si minimiza el error entre los
puntos estimados en la línea y los verdaderos puntos observados que se utilizaron para
trazarla.

Análisis de correlación

El análisis de correlación es la herramienta estadística que podemos usar para


describir el grado hasta el cual una variable está linealmente relacionada con otra., es decir, se
utiliza junto con el análisis de regresión para medir qué tan bien la línea de regresión explica
los cambios de la variable dependiente Y.

Los estadísticos han desarrollado una medida para describir la correlación entre dos variables: el
coeficiente de determinación (r2), que permite medir la fuerza de la asociación que existe entre dos variables X
e Y.

·r = c .  Y + b  XY – nY2
 Y2 - nY2

Autoaprendizaje 4-2
Un agrónomo experimentó con distintas cantidades de fertilizante líquido en una
muestra de parcelas del mismo tamaño. La cantidad de fertilizante y el rendimiento
son:

Parcela Cantidad de fertilizante Rendimiento


(en toneladas) (cientos de bushels)
A 2 7
B 1 3
C 3 8
D 4 10
1. El agrónomo está interesado en predecir el rendimiento ¿Cuál es la variable dependiente?
¿Cuál es la variable independiente?
2. Traza un diagrama de dispersión.

Estadística 80 Lic. M. Gabriela. Biondolillo


Para cerrar el desarrollo de los conceptos básicos del análisis bivariable, te recomiendo
la lectura de los capítulos 9 y 10 del libro complementario.

Trabajo Práctico nº 5
Tema: Análisis bivariable
Actividades:

1. Calcula el valor que tomará la variable en el año 2004.


Años Ventas
1.988 6613
1.989 6745
1.990 6548
1.991 6487
1.992 6652
1.993 6213
1.994 6415
1.995 6111
1.996 6175
1.997 5925
1.998 6019
1.999 6258
2.000 6176
2.001 5998

2. Calcula el valor que tomará la variable en el año 2010.


Años Producción
1.960 17150
1.970 20616
1.980 23962
1.990 28237
2.000 32322
2.010

3- Consideremos los datos arbitrarios que aparecen en la siguiente tabla correspondientes al


periodo 1.970 - 1.998, de una serie no continua. Estimar el valor de Yi para el 2.005.

Años Yi
1.970 12
1.978 18
1.985 20
1.992 36

Estadística 81 Lic. M. Gabriela. Biondolillo


1.998 54

4- En función de los datos de ventas (en miles de pesos) de la empresa XX durante los últimos
10 años calcular el valor de las ventas estimadas para el año 2.004 suponiendo que se
mantienen las mismas condiciones.
Años Ventas
1.992 584
1.993 573
1.994 498
1.995 552
1.996 601
1.997 683
1.998 654
1.999 740
2.000 788
2.001 800

5- El editor en jefe de un importante periódico de la provincia ha intentado convencer al


dueño del periódico para que mejore las condiciones de trabajo en el taller de prensas. Está
convencido de que, cuando trabajan las prensas, el grado de ruido crea niveles no saludables
de ansiedad y tensión. Recientemente hizo que un psicólogo realizara una prueba durante la
cual los prensistas se situaron en cuartos con niveles variables de ruido y luego se les hizo otra
prueba para medir niveles de ansiedad. La siguiente tabla muestra el índice de su grado de
ansiedad y el nivel de ruido al que se vieron expuestos (1.0 es bajo y 10.0 es alto).

Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38

a- Representa gráficamente estos datos


b- Desarrolla la ecuación de estimación que describa los datos
c- Pronostica el grado de ansiedad que podríamos esperar cuando el nivel de ruido es 5.
d- Calcula el coeficiente de determinación y elabora su interpretación.

6- Una compañía administra a sus vendedores una prueba en adiestramiento de ventas antes
de permitirles salir a trabajar. La administración de la compañía está interesada en determinar
la relación entre las calificaciones de la prueba y las ventas hechas por esos vendedores al final
de un año de trabajo. Los siguientes datos se recolectaron de 10 agentes de ventas que han
estado en el campo durante un año.
Número de Calificación de Nro de
vendedor la prueba unidades
vendidas
1 2.6 95
Estadística 82 Lic. M. Gabriela. Biondolillo
2 3.7 140
3 2.4 85
4 4.5 180
5 2.6 100
6 5.0 195
7 2.8 115
8 3.0 136
9 4.0 175
10 3.4 150

a- Encuentra la línea de regresión de mínimos cuadrados que podría usarse para predecir
ventas en función de las calificaciones de las personas en el adiestramiento.
b- ¿En cuánto se incrementa el número esperado de unidades vendidas por cada incremento
de un punto en la calificación de la prueba?
c- Utiliza la línea de regresión de mínimos cuadrados para predecir el número de unidades
que vendería una persona en adiestramiento que recibió una calificación de prueba
promedio.
d- Calcula el coeficiente de determinación e indica su significado.

Estadística 83 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 4

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta correcta.


1. La tendencia, como componente de una serie cronológica, representa la dirección a largo
plazo de una serie temporal.
2. Las variaciones cíclicas son fluctuaciones que se presentan en forma imprevista, siendo
imposible su predicción.
3. Las series cronológicas son aquellas variaciones suaves que se suceden en un periodo
relativamente largo de tiempo.
4. La recta obtenida por el método de los semipromedios tiene su principal ventaja en la
sencillez y rapidez del cálculo con relación a los otros métodos conocidos.
5. El método de los mínimos cuadrados es el más exacto para obtener la recta de ajuste.
6. Las variaciones estacionales de una serie cronológica implican patrones de cambio en el
lapso de una año que tienden a repetirse anualmente; por lo que siempre se relaciona con
las estaciones del año.
7. El inconveniente del método de la mano alzada para realizar el ajuste rectilíneo en una
serie cronológica es la no-existencia de un instrumento que juzgue adecuadamente la
bondad de la línea, por lo que se torna un método muy subjetivo.
8. El análisis de regresión y correlación se basa en la relación o asociación entre dos
variables, la variable conocida se llama variable dependiente y la variable que tratamos de
predecir es la variable independiente.
9. El coeficiente de determinación permite medir la fuerza de la asociación que existe entre
dos variables X e Y.
10. Es importante considerar las relaciones encontradas por la regresión como relaciones de
asociación pero no necesariamente como relaciones causales.

Estadística 84 Lic. M. Gabriela. Biondolillo


Módulo nº 5:
INDICADORES ECONÓMICOS

Objetivos:
1. Elaborar índices ponderados y no ponderados.
2. Elaborar índices de precio y cantidad de aplicación especial.
3. Explicar cómo se elabora y utiliza un índice de precios al consumidor.
4. Citar las aplicaciones especiales del índice de precios al consumidor para determinar
el ingreso real, poder adquisitivo del dinero y demás uso de tipo económico.

Estadística 85 Lic. M. Gabriela. Biondolillo


Introducción

Los números índices son cifras relativas, expresadas en términos porcentuales que
sirven para indicar las variaciones que presenta una serie de observaciones, cuando se
comparan respecto a una de ellas, tomada como punto de referencia y denominada periodo
base.

Por lo general los números índices se constituyen en series cronológicas cuando se


utilizan para indicar las variaciones porcentuales de una variable a través del tiempo.

En una serie corta, el periodo base corresponderá al primer valor de la serie; en una
serie larga, debe seleccionarse aquel periodo que haya sido mas estable, es decir, que no
presente cambios bruscos debido a factores, ya sean internos o externos. En algunas
ocasiones, la selección del periodo que debe tomarse como base dependerá de lo que se quiera
presentar, por ejemplo si se examina una serie referente a los precios de un artículo, se tendrá
que el índice de variación será mucho mas alto, cuanto mas lejano se encuentre el periodo
base; y será mas baja la variación cuanto mas cercano esté el periodo base.

Los números índices son muy usados en el análisis de ventas, producción, precios,
costos, beneficios, aumentos de capital, comercio exterior, etc. y en especial cuando se
quieren comparar dos series, como por ejemplo, los cambios en los precios de dos o mas
artículos durante un periodo determinado de tiempo. Por lo tanto habrá necesidad de tener
cuidado con su uso, pues a diferencia de lo que la mayoría cree, el índice no mide, solo es un
indicador que pretende reflejar el comportamiento de ciertas observaciones en forma
aproximada.

Según la composición, el índice puede ser: simple o compuesto. A su vez los índices
compuestos se clasifican en agregativos o de promedios.

Índices simples

Un índice simple se obtiene dividiendo cada precio, cantidad o valor de una serie dada
ya sea en periodos anuales, mensuales, etc., por el precio, cantidad o valor de uno de esos
periodos, el cual ha sido tomado como base o punto de referencia, y el resultado de ese
cociente se multiplica por cien.

La fórmula general es: 1t o = Xt . 100


Xo siendo:

1: índice
t: periodo que se analiza
o: periodo base
Estadística 86 Lic. M. Gabriela. Biondolillo
Xt: precio, cantidad o valor del periodo que se investiga
Xo: precio, cantidad o valor del periodo considerado como base

El índice simple también se puede calcular sin tener fija la base, en este caso cada
índice se obtiene cambiando de base. Se dice, que en una serie, los índices son de base
variable, cuando a cada observación se la divide por el valor de la observación inmediatamente
anterior, multiplicándolo por 100. Los incrementos o disminuciones que se presentan para
cada periodo se dan respecto al año inmediatamente anterior.

Autoaprendizaje 5-1
De acuerdo con Fortune, las ventas anuales de algunas empresas industriales
seleccionadas fueron:

Rango Compañía Ventas


(en millones de U$S)
1 GM 101781,9
2 Exxon 76416,0
3 Ford 71643,4
4 IBM 54217,0
5 Chrysler 26257,7
1. Expresa las ventas anuales de General Motors en forma de índice usando las ventas de International
Business Machines como base.Interpreta el resultado.
2. Expresa las ventas anuales de Chrysler como un índice usando las ventas de IBM como base. Interpreta el
resultado.

Índices eslabonados

El índice simple con base variable presenta la ventaja de indicar las variaciones para
cada periodo respecto del anterior, pero se puede transformar en un índice con base fija, el
cual se obtiene mediante sucesivas multiplicaciones de los relativos de cada eslabón.

1t o = 100 x R 10 x R21 x R 32 x....Rt t-1

Índices agregativos simples

Son los índices mas usados, especialmente cuando se tiene una serie de precios correspondientes a un
grupo de artículos dados en unidades de medida diferentes. Estos índices se calculan teniendo en cuenta la suma

Estadística 87 Lic. M. Gabriela. Biondolillo


de precios, cantidades o valores de un grupo de artículos para un periodo, dividida por la suma de los precios,
cantidades o valores para ese grupo de artículos de otro periodo considerado como base.

1to =  Xt . 100
 Xo

Autoaprendizaje 5-2
Se va a elaborar un índice de precios de ropa para el 2001 con base en 1990. Los precios
de 1990 y 2001 y las cantidades consumidas en 1990, se muestran a continuación:

Artículo Precio (1990) Cantidades vendidas (1990) Precio (2001)


Vestidos 35 500 unidades 65
Zapatos 40 1200 pares 90
1. Suponiendo que el número vendido permanece constante, esto es, que se vendió el mismo número en 1.990 y
2001, ¿cuál es el índice ponderado de precios para 2001 usando como base 1990? Interpreta el resultado.

Índices compuestos

Para explicar los índices compuestos consideraremos como punto de partida los
índices agregativos simples, utilizados en el análisis de un grupo de artículos sin tener en
cuenta la importancia que alguno de ellos pueden presentar en relación al conjunto. Esa
importancia se denomina ponderación.

Existe gran cantidad de fórmulas para calcular índices ponderados, cuyo empleo
dependerá de la naturaleza misma del problema. En los índices que se expondrán, las
ponderaciones son las cantidades o los precios.

Índices de precios

 Índice de Laspeyres: puede interpretarse como la relación existente entre los precios actuales
de un grupo de artículos con los precios de esos mismos artículos considerados en el
periodo base, manteniéndose constante como ponderación las cantidades del periodo base.

LI =  Pt x Qo x 100
 Po x Qo

Estadística 88 Lic. M. Gabriela. Biondolillo


 Índice de Paasche: se interpreta como la relación existente entre los precios actuales de un
grupo de artículos, con los precios de esos mismos artículos en el periodo base,
manteniéndose constantes las ponderaciones que corresponden a las cantidades de dichos
artículos dadas en el periodo que se investiga.
PI =  Pt x Qt x 100
 Po x Qt

 Índice de Fisher: es un promedio geométrico que se define como la raíz cuadrada del
producto del índice de Laspeyres por el de Paasche.

FI = LI x PI

Índices de cantidad

Las fórmulas que se dan para el cálculo de los índices de cantidad de Laspeyres,
Paasche y Fisher son muy parecidas a la de los precios, con la diferencia de que en estos la
ponderación son los precios.

LJ =  Po x Qt x 100
 Po x Qo

PJ =  Pt x Qt x 100
 Pt x Qo

FJ = LJ x PJ

Autoaprendizaje 5-3
Los precios al mayoreo y los volúmenes producidos de producto agrícola son:

Artículo Precio
Producción
1995 2001 1995 2001
Trigo (bushel) 2.00 4.00 100 700
Huevos (doc.) 0.30 0.20 1000 800
Cebada (tn) 60.00 70.00 50 110

Estadística 89 Lic. M. Gabriela. Biondolillo


1. Usando el método de Laspeyres, calcula un índice para el volúmen de la producción agrícola del 2001
considerando como base 1995. Interpreta el índice.

Uso de los números índices

 Cálculo del salario o ingreso real


 proceso de conversión del salario nominal en real: deflactación
 proceso de transformación de valores expresados a precios corrientes en valores a
precios constantes.
 para el cálculo se requiere el traslado de la base del índice de precios al consumidor.

Salario real = Salario nominal x 100


IPC

 Cálculo del poder de compra


 también se denomina poder adquisitivo del dinero o valor del dinero
 relación existente entre la unidad monetaria y la cantidad de bienes que se pueden
obtener a cambio de ella.
 para el cálculo se requiere el traslado de la base del índice de precios al consumidor.

Poder adquisitivo = ___1__ x 100


IPC

IPA = IPCo x 100


IPCt

 Porcentaje de desvalorización
 Indica la pérdida del poder de compra para un periodo con respecto a otro
considerado como base
% de desvalorización = 100 x [ 1 - IPCo/IPCt ]

 Porcentaje de devaluación: indica la pérdida de valor de una moneda en relación a las


monedas extranjeras y, por lo general, se hace referencia al dólar.
 En primer lugar se obtiene el porcentaje de aumento o disminución en el tipo de
cambio
% alza = 100 x [ Tt/To - 1 ]
 el cálculo del porcentaje de devaluación para el mismo periodo se realiza:
% de devaluación = 100 x [ 1 - To/Tt ]

Estadística 90 Lic. M. Gabriela. Biondolillo


 Índice de producción: se aplica la fórmula de los índices simples
Índice de producción = Pt/Po x 100

 Índice de productividad: indica la relación existente entre los resultados obtenidos y los
insumos utilizados en un periodo. Puede calcularse de dos formas:
 dividiendo cada índice de producción por su respectivo índice de obreros y el valor
resultante se multiplica por 100

Índice de productividad = Índice de producción x 100


Índice de obreros
 dividiendo la producción de cada año por el número de obreros, obteniéndose la
productividad por obrero. Luego, cada valor resultante se divide por uno de la serie
considerado como base

Índice de productividad = Productividad del periodo t x 100


Productividad del periodo o

Proporciones, porcentajes, razones y tasas

Constantemente estamos hablando de índices o indicadores, lo que puede dar lugar a


cierta confusión acerca de términos tales como índices, proporciones, porcentajes y tasas, así
que es conveniente hacer algunas aclaraciones.

Los números índices, tal como se ha visto, relacionan una o mas variables en un
periodo dado (colocado como numerador) con la misma variable o variables en otro periodo,
denominado base (como denominador) y sirven para indicar las variaciones que presenta una
variable en función de uno de sus valores que se toma como referencia o término de
comparación. Como cada relativo lo multiplicamos por 100, los números índices son
porcentajes de variación que presenta cada valor de la variable con respecto al tomado como
referencia. Estos números índices generalmente son aplicados en series cronológicas.

La razón, la proporción y la tasa tienen en común, como los números índices, la


relación de dos valores, el uno como numerador y el otro como denominador, siendo el
cociente de dividir una cantidad por otra, pero con las siguientes diferencias:

En la razón el valor considerado como numerador no debe estar contenido en el valor


correspondiente al denominador, en consecuencia, la razón puede ser un número superior a la
unidad. En el caso de que la razón se multiplique por 100 se tiene nuevamente un porcentaje.
Por ejemplo: supongamos que el número de personas que visitan un centro comercial en un
día cualquiera es de 7.000 personas, de las cuales, 4.200 son mujeres y 2.800 son hombres.
Ahora si dividimos, se tendrá:

La relación = 4.200 mujeres = 1,5


Estadística 91 Lic. M. Gabriela. Biondolillo
2.800 hombres

La anterior relación es una razón por el hecho que el numerador no esta contenido en
el denominador. Este resultado significa que por cada hombre va mujer y media, en otras
palabras, por cada 100 hombres van 150 mujeres a dicho lugar.

La relación = 4.200 mujeres x 100 = 150


2.800 hombres nos indica que las mujeres frecuentan ese centro
comercial en un 50% mas que los hombres.

Cuando el valor del numerador está incluido en el denominador, se tiene una


proporción, es decir, el cociente de dividir un sumando cualquiera por su total. Si tal
coeficiente se multiplica por 100 se obtendrá un porcentaje. Siguiendo con el ejemplo, la
proporción de hombres que visitan el centro comercial es:
P = 2.800 / 7.000 = 0,40

esta proporción nos indica que por cada cien personas que van a ese centro mercantil, en un
día, 40 son hombres y 60 son mujeres. Ahora si multiplicamos por 100 se tendrá:

2.800 x 100 = 40% son hombres y


7.000

4.200 x 100 = 60% son mujeres.


7.000

Se observara que una proporción no puede ser menor que 0 ni mayor que 1. En
términos porcentuales se dirá que es un número comprendido entre 0 y 100.

A las razones y porcentajes en ocasiones se las denomina tasas; sin embargo al estudiar
los cambios que se operan en una población, los porcentajes y las razones no son suficientes
para analizar completamente la información disponible, siendo necesario recurrir a la
elaboración de tasas.

La palabra tasa se emplea para estudiar una variable en función de otra con la que está
relacionada. Estos cocientes se multiplican por 100, 1.000, etc. para evitar el uso de decimales.
Utilizando el mismo ejemplo, tenemos:

T= nº de visitantes al centro comercial por día x 1.000


población de la ciudad estimada para ese día

T = 7.000 x 1.000 = 1,45


4.820.000
Estadística 92 Lic. M. Gabriela. Biondolillo
con lo cual se quiere indicar que 1,45 por 1.000 de los habitantes de esta ciudad visitan el
centro comercial.

La tasa especifica es aquella que se basa en algunos subgrupos homogéneos de una


población sin tomar en cuenta la totalidad de la población.

Para cerrar el desarrollo de los conceptos básicos de indicadores económicos, te


recomiendo la lectura del capítulo 8 del libro complementario.

Estadística 93 Lic. M. Gabriela. Biondolillo


Trabajo Práctico nº 6
Tema: Indicadores económicos
Actividades:

1. Las ventas de pescado presentan para las respectivas variedades las cifras que se indican a
continuación:
Año Besugo Caballa Corvina Bacalao Merluza
1.999 652 28 1039 536 3239
2.000 674 13 1106 496 3546
2.001 693 46 1354 401 3627
calcula los índices de precios para cada artículo, para los años 2.000 y 2.001, tomando como
base 1.9998.

2. De acuerdo a informaciones del Ministerio de Economía, las ventas de subproductos


ganaderos al exterior (en miles de U$S) fueron los que se presentan en la siguiente tabla.
Calcula el índice agregativo simple por ambos métodos.
Subproductos 2.000 2.001
Vacunos 162,107 238,756
Ovinos 14,431 22,981
Porcinos 7,772 11,361
Equinos 2,489 2,802

3. Cierta comunidad ha registrado los siguientes consumos y precios de tres alimentos


básicos. Calcula índice de precio y cantidad de Laspeyres, Paashe y Fischer.
Artículo Unidad Px 1.994 Px 2.001 Q 1.994 Q 2.001
Pan Kg. 240 600 5 6
Leche Lts. 200 550 5 7
Huevos Doc. 600 1600 3 3

4. En noviembre de 1.998 un empleado ganaba un salario de $750 y en el mes de marzo de


2.002 su salario fue reajustado con un aumento de $350. Se sabe además que los índices de
precios para los mismos meses fueron de 1.258,2 y 2.836,5 respectivamente. Se quiere saber si
con el reajuste que le hicieron su salario mejoró con respecto al anterior.

5. Con los datos del ejercicio 4 calcula el poder de compra.

6. Con los siguientes datos, obtiene el índice de producción y el índice de obreros. Calcula el
índice de productividad para cada año tomando como base 1.995.
Año Producción Obreros
1.995 450 1278
1.996 684 1390
1.997 573 1267
Estadística 94 Lic. M. Gabriela. Biondolillo
1.998 793 1350
1.999 895 1222
2.000 773 1200
2.001 800 1190

Estadística 95 Lic. M. Gabriela. Biondolillo


Autoevaluación del módulo nº 5

Indica si la expresión es verdadera o falsa. Si es falsa, anota la respuesta correcta.


1. El proceso de convertir el salario real en nominal se denomina deflactación.
2. Los números índices son cifras relativas expresadas en términos porcentuales que sirven
para indicar las variaciones que presenta una serie de observaciones cuando se comparan
respecto de una de ellas, tomada como punto de referencia o período base.
3. Un índice eslabonado permite transformar un índice simple de base variable en un índice
simple de base fija.
4. Los números índices miden la variación en el valor de una variable en un periodo respecto de otro
considerado como base.
5. Un índice compuesto permite asignar una importancia mayor a los cambios que se dan en
algunas variables que a los que se presentan en otras, cuando lo calculamos.
6. El número índice para un año base es siempre igual a cero.
7. Siempre se encuentra un número índice al tomar el cociente de un valor actual entre un
valor base y multiplicándolo por 100.
8. La selección de una base no apropiada no distorsiona a los números índice
9. La medida del IPC está basada en una sola variable.

Estadística 96 Lic. M. Gabriela. Biondolillo

También podría gustarte