Estadistica Aplicada A La Administracion
Estadistica Aplicada A La Administracion
Estadistica Aplicada A La Administracion
El contenido de esta guía práctica tiene como objetivo, entre otros, ilustrar el potencial
estadístico del análisis descriptivo de datos. Se muestran solo algunas estrategias para lograr
entender el comportamiento probabilístico de datos vitales de un proceso. Otras herramientas
las puedes obtener de la bibliografía especializada en el tema.
Para desarrollar esta actividad, debes replicar los pasos aquí descritos sobre un conjunto de
datos, reales, que deberás recolectar en tú campo de interés, basados en experiencias
desarrolladas por grupos de investigación.
Etapa 1. Se analizan los datos tal y como son obtenidos, de cualquier manera, de la fuente
original. Es lo que se denomina “Información Bruta”, “Información de primera mano”,
“Información inicial”, “Datos Originales”, etc. Son diversas maneras de etiquetarlos.
Indistintamente del nombre dado a esta información, lo cierto es que la misma puede estar
contaminada, o tal vez no, por diferentes fuentes de error: Mala calibración de los instrumentos
de medición, percepción del observador, causas fortuitas o casuales, o variaciones por causas
especiales, entre otras, que de alguna manera perturban la verdadera tendencia de los datos y
pueden confundir en la identificación objetiva del comportamiento del proceso. Muchos
investigadores, ingenieros, gerentes, administradores y expertos de diversas áreas del saber
analizan la información vital de sus procesos como en esta etapa, sin percatarse que la misma
se puede encontrar viciada y presentar datos atípicos. Lo correcto es realizar, previo a cualquier
análisis estadístico, una depuración seria y responsable de la información de tal manera que se
garantice que los datos finales (etapa 2) para analizar estadísticamente presenten una tendencia
típica, inconfundible que describa el verdadero comportamiento del proceso. Existen varias
técnicas de depuración de la información, aquí se detallará una de ellas que produce resultados
adecuados y que en la práctica es muy confiable. Lo que no debe hacerse es eliminar datos por
corazonadas o al azar, supuestamente atípicos, sin un criterio objetivo, científico que produzca
alta confianza y credibilidad.
Etapa 2. A partir de aquí comienza tú trabajo práctico. Dada la información que pretendes
analizar descriptivamente, deberás primero depurarla. De esta manera obtendrás “la
ESTADÍSTICA APLICADA
Información Depurada”, es decir los datos que en realidad te permitirán describir el real
comportamiento de tus variables relevantes. Contar con los datos típicos, te garantizará alta
confiabilidad tanto en el análisis estadístico descriptivo así como del inferencial.
Una técnica efectiva, entre otras, para depurar la información se basa en restar y sumar dos
veces la desviación típica de la media aritmética de la variable en cuestión. Matemáticamente
es lo siguiente:
Con esos datos depurados comienza tú trabajo práctico, el cual consiste en replicar los análisis
aquí aplicados. Los detalles están dados durante el desarrollo de la ETAPA 2.
ESTADÍSTICA APLICADA
Etapa 1.
A continuación se evaluarán los aspectos descriptivos de interés sobre un conjunto de datos
suministrados por el Departamento de Producción de una empresa fabricante de óxido de
azufre, materia prima básica en la industria farmacéutica y otras, que permitirá tomar decisiones
trascendentales en la adquisición de nueva maquinaria, especialización de operadores,
formación de la mano de obra, etc., y que redunde en el mejoramiento continuo en el proceso
de producción de esta materia prima. Para entender el comportamiento de la variable
producción diaria de óxido de azufre, es necesario estimar algunas medidas de tendencia central
y de dispersión que permitan determinar la dinámica diaria de este producto. Solo así se
facilitará la toma de decisiones que beneficien a todo el conglomerado.
Organización de Datos.
a) Datos no agrupados.
b) Datos agrupados en clases, intervalos de clase.
a) Datos no agrupados: su análisis consiste en tomar los datos “puros”, sin ningún tipo de
orden o reacomodo.
ESTADÍSTICA APLICADA
c) Medidas de posición: cuartiles, deciles y percentiles.
¿Cómo organizar datos en intervalos de clases?
Tomando como referencia los datos adjuntos, emisión diaria de óxido de azufre:
1. Rango:
2. Número de intervalos:
ESTADÍSTICA APLICADA
*Tabla 2. OTRA TABLA de distribución de Frecuencias para el SO.
INTERVALO MARCA FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA REL.
DE CLASE (Xi) ABS. REL. (%) ACUMULADA ACUMULADA (%)
(fi) (fri) (Fi) (Fri)
6.2 - 9.2 7.7 4 5.00 4 5.00
9.2 - 12.2 10.7 7 8.75 11 13.75
12.2 - 15.2 13.7 10 12.50 21 26.25
15.2 - 18.2 16.7 15 18.75 36 45.00
18.2 - 21.2 19.7 16 20.00 52 65.00
21.2 - 24.2 22.7 13 16.25 65 81.25
24.2 - 27.2 25.7 10 12.50 75 93.75
27.2 - 30.2 28.7 4 5.00 79 98.75
30.2 - 33.2 31.7 1 1.25 80 100
80 100
Las tablas 2 y 3 solo pretenden mostrarte que elaborar una tabla de distribución de frecuencias
no obedece a un criterio único sino a una dinámica en la que cada quién desea colocar su sello
personal. Sin embargo, tú, como futuro experto, requieres de una metodología científica que
justifique la elaboración de una tabla con características de arquitectura válidas y con
credibilidad a los usuarios finales. Más adelante te explicaré detalles para su elaboración.
5. Estimar los estadísticos descriptivos de interés:
ESTADÍSTICA APLICADA
• Previamente quiero mostrarte los estadísticos calculados con los 80 datos sin ningún
arreglo:
Tabla 4. ESTADÍSTICOS DESCRIPTIVOS DE LOS DATOS SIN ARREGLO ALGUNO.
VARIABLE MEDIA MEDIANA DESVIACIÓN C.V. (%) MÍNIMO MÁXIMO
OXIDO 18.9 19.1 5.7 29.93 6.2 31.8
TON/DIA
LA MEDIA.
De donde los Xi y fi son las marcas de clase y sus respectivas frecuencias simples.
LA MEDIANA.
Luego,
Donde es el límite inferior real del intervalo o clase que contiene a la mediana; es la
frecuencia acumulada anterior al intervalo que contiene a la mediana; corresponde a la
frecuencia simple o absoluta del intervalo que contiene a la mediana y es la longitud de clase.
LA MODA.
ESTADÍSTICA APLICADA
Ubicación o posición, ¿en cuál intervalo se encuentra?: al observar la columna de frecuencias
simples (fi), el intervalo que contiene la moda, será aquel con mayor frecuencia.
De acuerdo a este criterio, la moda está ubicada dentro de los intervalos de clases 14.2 - 18.2 y
18.2 - 22.2. Esto sugiere que la distribución de la producción de óxido de azufre es bimodal.
Donde Li es el límite inferior real del intervalo o clase que contiene a la moda; d1 es la diferencia,
absoluta, de la clase modal y la premodal; d2 es la diferencia, absoluta, de la clase modal y la
postmodal y c es la longitud de clase.
Observa que una vez estimadas la media, mediana, moda y semisuma de los extremos los valores
son aproximadamente iguales a 19.0. Esto es un indicador de simetría alrededor de la media en
la información, lo que resulta favorable al momento de interpretar el comportamiento del
proceso o fenómeno.
LA VARIANZA.
Siendo los y las marcas de clase y sus respectivas frecuencias simples y la media
aritmética.
EL COEFICIENTE DE VARIACIÓN.
ESTADÍSTICA APLICADA
Esta medida de dispersión o variabilidad indica que aproximadamente el 30.26% de los datos se
alejan de la media. En términos coloquiales, el 30.26% de los datos pueden ser potenciales
valores atípicos. Para este ejemplo en cuestión, considero que la variabilidad es muy alta
tratándose de que es una empresa que debería producir de manera consistente cierta cantidad
de óxido de azufre con la menor dispersión posible. En general, cada proceso o fenómeno en
estudio presenta su propia variabilidad (causas comunes de variación), grande o pequeña, la cual
se debe estimar un gran número de veces a fin de determinar su punto de equilibrio y poder
inferir que en efecto su varianza, desviación típica, coeficiente de variación o
cualquier otra medida de dispersión es la correcta. Por supuesto, lo deseable es tener procesos
productivos simétricos y con poca variabilidad, lo que se traduce en pocas pérdidas. Para ello
deberán realizarse inversiones económicas de parte de los dueños del proceso, que logren
minimizar las variaciones por causas comunes y erradicar las variaciones por causas especiales.
GRÁFICO 1. EL HISTOGRAMA.
ESTADÍSTICA APLICADA
GRÁFICO 2. TORTA (PIE CHART).
7. Concluir respecto a los resultados obtenidos. Algunas conclusiones, entre otras, son: De
la tabla 5, puede concluirse que los estadísticos descriptivos estimados por ambos
métodos son muy similares, lo que hace presumir que la organización de la información
en una tabla de distribución de frecuencias con intervalos de clases, no solo se traduce en
una mejor presentación de la información sino que la esencia de la misma se conserva muy
a pesar que en este diseño los 80 datos están representados por apenas siete marcas de
clases con su respectiva frecuencia. Inclusive, tomando en cuenta que en esta etapa 1 aún
los datos no han sido depurados. Los gráficos 1 y 2 son indicadores de la tendencia en la
producción de óxido de azufre. La mayoría de los datos están alrededor de la media, 19
toneladas diarias, lo que sugiere que una buena proporción de la producción diaria es
fácilmente predecible con una tendencia cercana al 50% de ocurrencia. En el gráfico 2,
observa que la suma de las proporciones entre 14.2 y 26.2 toneladas diarias reúne hasta
el 68.9% lo que ratifica el comentario anterior.
ETAPA 2.
A partir de aquí comienza tú trabajo práctico con los datos recolectados directamente del
campo de aplicación. La información antes de ser analizada deberá ser documentada siguiendo
un instructivo facilitado por el docente. La redacción, distribución, herramientas
ESTADÍSTICA APLICADA
computacionales, presentación de resultados, estilo y conclusiones es libre. Lo obligatorio es
aplicar los análisis descriptivos desarrollados en este material. Puedes comparar los resultados
obtenidos en esta etapa con la etapa anterior y notarás la diferencia, a veces poca o mucha,
dependiendo de la naturaleza de la información.
22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7
26.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7
19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0
18.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5
14.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.1
8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8
25.9 10.5 15.9 27.5 18.1 17.9 9.4 24.1 20.1 28.5
ESTADÍSTICA APLICADA
15.8 26.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2
22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7
26.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7
19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0
18.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5
14.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.1
8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8
25.9 10.5 15.9 27.5 18.1 17.9 9.4 24.1 20.1 28.5
Los datos marcados en rojo son los eliminados. Un análisis, supuesto, de estos datos puede ser
el siguiente: Es posible que las bajas producciones se deban a desperfectos de equipos,
maquinarias o mantenimiento de los mismos; tal vez se produjo una operación morrocoy de
parte del personal de producción por algún problema laboral con el sindicato, etc. En tanto que
las altas producciones, 29.6 y 31.8, pudieron ocurrir por un alto pedido de algún cliente y la
compañía se vio en la necesidad de satisfacer dicha demanda. Cualesquiera sean las razones,
factores o causas que motivaron estas producciones atípicas, las mismas no representan el
comportamiento regular en la producción de óxido de azufre de esta empresa.
Nota: Se repetirán algunos aspectos teóricos ya discutidos en la etapa 1 con el fin de mantener tú
atención para mejor entendimiento.
Organización de Datos.
a) Datos no agrupados.
b) Datos agrupados en clases, intervalos de clase.
a) Datos no agrupados: su análisis consiste en tomar los datos “puros”, sin ningún tipo de
orden o reacomodo.
b) Datos Agrupados en clases: consiste en crear una arquitectura de un grupo masivo de
datos que permita la fácil comprensión de los mismos y su comportamiento en función de
estimadores muestrales.
ESTADÍSTICA APLICADA
b) Medidas de dispersión: Varianza, Desviación Típica, Amplitud (rango), Coeficiente
de Variación.
Tomando como referencia los datos depurados, emisión diaria de óxido de azufre:
1. Rango:
2. Número de intervalos:
ESTADÍSTICA APLICADA
14.5 - 17.5 16 11 14.7 27 36.0
17.5 - 20.5 19 20 26.7 47 62.7
20.5 - 23.5 22 12 16.0 59 78.7
23.5 - 26.5 25 11 14.7 70 93.3
26.5 - 29.5 28 5 6.7 75 100
75 100
ESTADÍSTICA APLICADA
donde son la frecuencia simple y la frecuencia acumulada
anterior a la frecuencia acumulada buscada, respectivamente. Se trata solo de una sencilla suma,
por ejemplo si deseas obtener la frecuencia acumulada de la clase 5 es decir
o también
. Este valor indica que hubo 59 días, datos, en que la producción
de óxido de azufre fue menor o igual a 23.5 toneladas. Por último la frecuencia relativa
• Previamente quiero mostrarte los estadísticos calculados con los 75 datos sin ningún
arreglo:
Tabla 7. ESTADÍSTICOS DESCRIPTIVOS DE LOS DATOS SIN ARREGLO ALGUNO.
VARIABLE MEDIA MEDIANA DESVIACIÓN C.V. (%) MÍNIMO MÁXIMO
OXIDO 19.0 19.1 4.99 26.23 9.0 28.6
TON/DIA
La moda no fue estimada debido a que esta medida es muy inestable en el muestreo, lo que
significa que puede cambiar drásticamente cuando se alteran algunas condiciones de muestreo.
Es la medida descriptiva más débil. La media y la mediana, particularmente la media, son
medidas más representativas en el comportamiento de la tendencia central. A medida que la
distribución de los datos tiende a la simetría, la media resulta en la mejor medida de tendencia
central
LA MEDIA.
De donde los son las marcas de clase y sus respectivas frecuencias simples.
LA MEDIANA.
ESTADÍSTICA APLICADA
Ubicación o posición, ¿en cuál intervalo se encuentra?:
El intervalo que contiene la mediana, será aquel cuya frecuencia acumulada sea la inmediata
superior o igual a su posición.
De acuerdo a este criterio, la mediana está ubicada dentro del intervalo de clase .
Luego,
Donde es el límite inferior real del intervalo o clase que contiene a la mediana; es la
frecuencia acumulada anterior al intervalo que contiene a la mediana; corresponde a la
frecuencia simple o absoluta del intervalo que contiene a la mediana y es la longitud del
intervalo de clase.
LA MODA.
Donde es el límite inferior real del intervalo o clase que contiene a la moda; es la diferencia
absoluta de la clase modal y la premodal; es la diferencia absoluta de la clase modal y la
postmodal y es la longitud de clase.
Observa que una vez estimadas la media, mediana, moda y semisuma de los extremos los valores
son aproximadamente iguales a 19.0. Esto es un indicador de simetría alrededor de la media en
la información, lo que resulta favorable al momento de interpretar el comportamiento del
proceso o fenómeno.
ESTADÍSTICA APLICADA
LA VARIANZA.
Siendo los y las marcas de clase y sus respectivas frecuencias simples y la media
aritmética.
EL COEFICIENTE DE VARIACIÓN.
Esta medida de dispersión o variabilidad indica que aproximadamente el 26.84% de los datos se
alejan de la media. En términos coloquiales, el 26.84% de los datos pueden ser potenciales
valores atípicos, aún depurados los datos. Para este ejemplo en cuestión, considero que la
variabilidad sigue siendo un tanto alta tratándose de que es una empresa que debería producir
de manera consistente cierta cantidad de óxido de azufre con la menor dispersión posible, habrá
que determinar los factores que producen esa alta variabilidad, lo que escapa a la estadística y
se convierte en un problema de ingeniería o administración del proceso. En general, cada
proceso o fenómeno en estudio presenta su propia variabilidad (causas comunes de variación),
grande o pequeña, la cual se debe estimar un gran número de veces a fin de determinar su punto
de equilibrio y poder inferir que en efecto su varianza, desviación típica, coeficiente de variación
o cualquier otra medida de dispersión es la correcta. Por supuesto, lo deseable es tener procesos
productivos simétricos y con poca variabilidad, lo que se traduce en pocas pérdidas. Para ello
deberán realizarse inversiones económicas de parte de los dueños del proceso, que logren
minimizar las variaciones por causas comunes y erradicar las variaciones por causas especiales.
ESTADÍSTICA APLICADA
Agrupados OXIDO 19.0 19.1 5.1 26.84 9.0 28.6
en clases. TON/DIA
6. Elaborar gráficas descriptivas: histograma, polígono de frecuencias u otras.
GRÁFICO 3. EL HISTOGRAMA.
7. Concluir respecto a los resultados obtenidos. Algunas conclusiones, entre otras, son:
Los estimadores de tendencia central, la media, mediana y moda resultaron muy
parecidos, lo que permite inferir que la distribución probabilística de la producción de
óxido de azufre por día es normal con media 19.0 y varianza 5.12. De la tabla 8 puede
concluirse que los estadísticos descriptivos estimados por ambos métodos son muy
similares, una vez depurados los datos, lo que hace presumir que la organización de la
información en una tabla de distribución de frecuencias con intervalos de clases, no solo
se traduce en una mejor presentación de la información sino que la esencia de la misma
se conserva muy a pesar que en este diseño los 75 datos están representados por apenas
siete marcas de clases con su respectiva frecuencia. El gráfico 3 indica una alta
proporción de datos alrededor de la media, lo que es muy importante ya que facilita la
predicción en la producción diaria del producto y te permitirá proyectar los resultados
con fines de planificación de la mano de obra, inversión económica, predicción y otras
ventajas que produce el conocer más a fondo el comportamiento de tus variables de
interés.
ESTADÍSTICA APLICADA