Estadiatica
Estadiatica
Estadiatica
Charles Darwin (1.809-1.882), bilogo, quien, despus de estudiar la obra de Lyell, formul
sus teoras; el trabajo de Darwin fue, en gran parte, de naturaleza biomtrica con la que se
renov el entusiasmo por la Biologa.
Gregorio Mendel, realiz estudios biomtricos sobre hbridos vegetales publicados en 1866,
descubridor de las leyes probabilsticas sobre la herencia.
Adolphe Quetelet (1.796- 1.874) matemtico, estadista y astrnomo belga fue el primero en
aplicar la teora de las probabilidades a los problemas polticos y sociales; es considerado
como el iniciador de la actual sociometra.
Francis Galton, (1822-1911) como su primo Charles Darwin, se dedic al estudio de la
herencia, a la cual aplic mtodos estadsticos; entre sus aportes ms importantes se cuenta
el desarrollo de mtodos bsicos como la regresin y la correlacin.
En el siglo XIX, la necesidad de una base ms slida para la estadstica se hizo manifiesta. Karl
Pearson, 1.857-1936, inicialmente fsico matemtico aplic sus conocimientos al estudio de la
evolucin, como resultado del entusiasmo que gener Galton. Pearson dedic casi medio siglo a la
investigacin estadstica rigurosa, fund la revista Biometrika y una escuela de estadstica; con ello
tom impulso el estudio de la estadstica, su obra cumbre es la creacin de la distribucin Ji
cuadrado.
Pearson se ocupaba de muestras grandes, la teora correspondiente resultaba inadecuada para los
experimentadores que trabajaban con muestras pequeas, entre ellos William S. Gosset, 1.8761.937, quien estudiaba con Pearson y era tcnico de la firma de cerveceras Guinnes, por lo tanto
procedi a calcular y compilar distribuciones de frecuencia emprica. Sus escritos sobre los
resultados aparecieron en Biometrika en 1.908 bajo el nombre de Student, seudnimo de Gosset.
Hoy, el uso de la distribucin t de Student es generalizado, y se ha convertido en instrumento
fundamental para estadsticos y experimentadores. Sin embargo es interesante anotar que el
astrnomo alemn, Helmert, ya la haba obtenido estos resultados matemticamente en 1.875.
Ronald A. Fisher, 1.890-1.962, recibi influencias de Karl Pearson y de Gosset, l y sus
estudiantes dieron considerable impulso al uso de los procedimientos estadsticos en muchos
campos, especialmente en agricultura, biologa y gentica. A Fisher se le debe el hallazgo de la
conocida distribucin F.
J. Neyman, 1894, y E.S. Pearson, 1.895, presentaron una teora sobre la verificacin o prueba de
hiptesis estadsticas en 1.936 y 1.938. La teora foment en forma considerable la investigacin y
fueron varios los resultados de uso prctico.
Abraham Wald, 1.902-1.950. Sus dos libros, Sequential Analysis y Statical Decision Functions, se
ocupan de grandes conquistas estadsticas orientadas en el campo de la gentica. Wald y Tukey
iniciaron el desarrollo de los mtodos de la inferencia estadstica, los cuales tienen una amplia
aplicacin en diversidad de campos en la actualidad. Lexis (1.873- 1.914) aplic la probabilidad a
problemas de poblacin, Kolmogoroy (1.903) realiza la fundamentacin axiomtica de la
probabilidad.
En esta breve historia slo se mencionan algunos estadsticos importantes, faltan muchos que
hicieron numerosas y trascendentales contribuciones a la estadstica; y existen otros que en siglo
XX han desarrollado mtodos estadsticos que se estn utilizando y probando actualmente.
Entre las fuentes que dieron origen a la estadstica actual se destacan las siguientes:
Investigacin Interna
Investiga fenmenos originados dentro de la misma empresa o entidad, los datos pueden ser
suministrados por ejemplo, por el departamento de contabilidad o de manejo de personal; datos
que deben ser organizados en tal forma que faciliten el anlisis y su comparacin con perodos
anteriores.
La investigacin interna puede ser a su vez exhaustiva o parcial.
Investigacin Externa
Se realiza cuando la informacin se origina fuera de la empresa o entidad. Ejemplo, opinin de los
consumidores, precios o calidad de la competencia etc, con el fin de establecer la posicin relativa
de la empresa o entidad en diversos aspectos y estudiar su comportamiento actual o futuro.
Investigacin Exhaustiva
Llamada Censo o enumeracin completa Censo y se trata cuando se hace un estudio de todos los
elementos que constituyen la poblacin.
Ejemplo
Cuando se va hacer una investigacin de la calidad de la confeccin de uniformes y se observan
todos los uniformes fabricados durante un perodo de tiempo.
Otra forma de investigar es por el mtodo de Muestreo o investigacin parcial: Se observa una
parte de los elementos o unidades que constituyen la poblacin (muestra), es decir estudia la
poblacin a travs de la muestra. Se realiza cuando no es posible una investigacin exhaustiva o
no se desea. Con la investigacin parcial se facilita la ejecucin y se reducen los costos.
Planeamiento y Preparacin
Se definen y organizan cada una de las actividades necesarias para llevar a cabo el trabajo y poder
alcanzar los objetivos propuestos. Antes de iniciar cualquier actividad, se hace indispensable
formular el problema y determinar los objetivos generales y especficos que se propone la
investigacin, la poblacin que se va investigar, el tipo de informacin que se requiere, el informante
(unidad de investigacin), los sitios donde se va a recolectar la informacin, el tiempo y el costo de
la investigacin, las dificultades para hacer la investigacin.
Objeto de la Investigacin
En esta fase se deben contestar los siguientes interrogantes, los cuales nos permiten formular el
problema, identificar los objetivos generales y especficos y, hacer una jerarquizacin de los
mismos:
a. Qu se va a investigar?
b. Cmo se va a realizar la investigacin? Se refiere a las condiciones y medios con los cuales
se debe realizar el estudio.
c. Cundo se realiza? El momento en que debe hacerse la investigacin.
d. Dnde se realiza? El lugar, zona o regin donde se har la investigacin.
Con esas respuestas se sabr cul es la poblacin objetivo que se va a investigar; qu tipo de dato
se requerir, el tipo de informante necesario, la dificultad para hacer la observacin, nmero de
cuestionarios, tiempo y costo de la investigacin, etc.
Unidad de Investigacin
La unidad es la fuente de informacin, es decir, a quien va dirigida la investigacin, la cual puede
ser una persona, una familia, una vivienda, un establecimiento comercial, industrial o de servicio
pblico, un artculo producido, una materia prima, una explotacin agrcola, avcola o ganadera, y su
seleccin depende de la investigacin.
La unidad debe ser clara, en tal forma que sea entendida por todos; adems, adecuada al tipo de
investigacin; mensurable, que permita ser medida, y comparable con los resultados obtenidos en
investigaciones similares.
Al lado de la unidad estadstica principal se presenta, con mucha frecuencia, la necesidad de
establecer otras unidades denominadas secundarias.
Mtodo de Observacin
Una vez planteado el objetivo de la investigacin, definida la unidad o unidades, y determinado que
el estudio no fue realizado, o que los datos que se tienen requieren actualizacin, se debe decidir el
mtodo que se emplear, es decir si se va a estudiar la poblacin en su totalidad o solo una parte
de ella.
El primer caso lo hemos denominado investigacin exhaustiva, enumeracin completa o censo, y,
el segundo muestreo. La eleccin de uno de los mtodos, censo o muestra, depende entre otros
factores, de:
a. Tiempo disponible
b. Recursos humanos
c. Recursos financieros
d. Finalidad de la investigacin
e. Nmero de unidades que componen la poblacin
f. Caracteres por investigar
g. Si el elemento que se toma se puede destruir o no en el proceso de medicin de la
caracterstica.
h. El grado de variabilidad.
El Muestreo
Hoy da lo ms utilizado es el muestreo, por su menor costo, mayor rapidez, y menor nmero de
personas que intervienen en la investigacin. Generalmente hay ms de un mtodo de muestreo y
para cada mtodo se podrn determinar algunos aspectos:
Grado de precisin requerida para los estimadores.
Tamao de muestra.
Costo y tiempo.
Calendario de Trabajo
Se trata de un ordenamiento de las diferentes etapas involucradas en la investigacin, con las
correspondientes fechas de iniciacin y terminacin, con el fin de controlar cada fase, procurando
que se cumpla dentro del tiempo establecido. Tambin es una forma de determinar el tiempo total
de la investigacin.
La grfica que presenta las diferentes etapas y meses requeridos en la investigacin, se denomina
grfica de Gantt y tiene la particularidad de que el rectngulo puede subdividirse por das o
semanas, en algunas ocasiones sombrendose a medida que transcurre el tiempo de ejecucin.
La forma de presentar el calendario de trabajo es diversa. Con la tabla 1 se muestra tan solo un
ejemplos de lo que es un calendario.
Aspectos tcnicos
Elegir los asuntos generales que deben reflejar eI tema de la encuesta. Incluir nicamente las
preguntas indispensables.
Las preguntas deben ser claras, concisas, y comprensibles para quien las hace y para quien
las responda.
Las preguntas deben ordenarse, comenzando con las fciles y terminando con las ms
difciles.
No se deben emplear abreviaturas.
Se deben suprimir las preguntas que, de antemano, se considera no van a ser contestadas.
La pregunta debe ser de tal calidad que, siendo formulada en lenguaje corriente, atienda a la
tcnica de investigacin.
Las preguntas deben ser cortas, para que faciliten su retencin.
En cuanto a partes que constituyen un formulario, por lo general se considera dividido en
tres:
Encabezamiento
En l se incluye: nombre o ttulo de la investigacin; en tal forma que resuelva los interrogantes:
qu, cmo, cundo, dnde; el nombre de la entidad responsable de la investigacin; el cdigo del
formulario y en algunos casos el del informante.
Cuerpo
Contiene las preguntas. En algunos formularios, cuando se quiere identificar al informante, se
comienza con preguntas generales, tales como nombre, direccin, estado civil, edad, profesin,
nombre del establecimiento ( industrial, comercial, pblico), razn social, actividad a la cual se
dedica, direccin, ubicacin regional, etc. luego se sigue con las preguntas necesarias para
alcanzar el objetivo propuesto.
Las preguntas pueden ser de diversas clases, a saber:
Preguntas cerradas
En stas el informante tendr slo dos posibilidades al responder, como por ejemplo: Conoce
usted tal producto? S o No. Esta forma de preguntar tiene la ventaja de disminuir el tiempo de la
recoleccin y los costos, adems de facilitar la tabulacin y eliminar en gran parte los errores. Este
tipo de pregunta cerrada, con solo dos posibilidades al responder, se denomina dicotmica o
alternativa.
Cuando la pregunta cerrada tiene ms de dos posibilidades de ser respondida, se denomina de
seleccin mltiple. Un ejemplo de pregunta de seleccin mltiple sera: Ha comprado usted
alguna vez una de estas marcas de cigarrillos?.
Pielroja
Parliament
President
Kent
Kool
Derby
Lucky
Imperial
Royal
Marlboro
Camel
Nacional
Mustang
Campen
Preguntas abiertas
Son aquellas denominadas de opinin o de contestacin libre. Por la variedad de respuestas
obtenidas, stas no podrn ser codificadas y su tabulacin tendr que ser manual. Por ejemplo:
Qu opinin le merece la calidad del cigarrillo Piel roja?.
Preguntas de control
Se hacen con el fin de controlar la veracidad de informacin. Por ejemplo, en el caso de la pregunta
de seleccin mltiple sobre las marcas de cigarrillos se podr incluir una o dos marcas que no
existan, en tal forma que si son sealadas se deber tener precaucin con el resto de las
respuestas dadas por el informante.
Preguntas filtro
Tiene como finalidad indicar cuando se debe suspender la entrevista o si por el contrario se
requiere pasar a otro grupo de preguntas, que son las que corresponden a ese tipo de informante.
Instrucciones
Pueden considerarse como parte del cuestionario. Para algunas personas, stas deben colocarse
despus del encabezamiento, es decir antes de las preguntas, argumentndose que para poder
responder el cuestionario se requiere haber ledo las instrucciones; otras son partidarias de colocar
las instrucciones al final de las preguntas, al respaldo del formulario o en una cartilla anexa.
Sostienen que en esta forma de colocar de colocar las instrucciones, se cuida la presentacin del
formulario.
Una vez elaborado el cuestionario, ste deber someterse a prueba con el fin de determinar, entre
otras cosas, si las preguntas y las instrucciones fueron correctamente elaboradas, conocer la
reaccin de los informantes frente a determinadas preguntas, el tiempo promedio necesario en una
entrevista y, por ltimo, familiarizar al encuestador con el formulario.
Propaganda
En algunas investigaciones es conveniente dar a conocer a los posibles informantes, directa o
indirectamente, la importancia que tiene la investigacin, solicitndoles la valiosa colaboracin para
lograr un completo xito en el trabajo propuesto.
El Pretest
Consiste en una encuesta preliminar para tener un mayor conocimiento sobre la poblacin objetivo
y facilitar la prueba del cuestionario. Puede utilizarse el pretest tambin para chequear el clculo de
costo y tiempo, as como para tener alguna idea de la variabilidad de las caractersticas bajo
estudio.
Entre ms informacin se tenga sobre el comportamiento de la poblacin, ms fcil es elaborar un
plan de investigacin, especialmente el diseo del plan del muestreo; por otra parte, las dificultades
encontradas, en cualquiera de las etapas de la investigacin, suelen ser tiles para el diseo de
futuras encuestas.
Recoleccin de la Informacin
Terminada la etapa de planeamiento, se procede a distribuir y a recoger los formularios,
controlando el nmero de formularios entregados y recogidos, al mismo tiempo, verificando la
calidad de las informaciones obtenidas.
La organizacin del trabajo de campo o de recoleccin contempla, entre otros, los siguientes
puntos:
Supervisin
Control de encuestas
Revisin de cuestionarios inconclusos
Calidad y consistencia de las respuestas
Cumplimiento de los plazos fijados
Distribucin de los entrevistadores
Algunos de los errores que se pueden presentar en la recoleccin de datos se clasifican en:
Errores de la medicin o cuantificacin de la caracterstica
Errores del entrevistador o influencia negativa del mismo
Mal diseo del cuestionario
Falta de instrucciones o instrucciones imprecisas.
Pueden presentarse algunos casos que afectan la recoleccin de los datos y que deben ser
corregidos:
El informante no quiere suministrar los datos, alegando: estar ocupado, motivos polticos,
desconfianza de la investigacin, considerar que la investigacin no vale la pena, etc.
El informante no puede responder por problemas, tales como, enfermedad, incapacidad
fsica, idioma, etc.
La direccin del informante es errnea, o la unidad existente en el lugar no es elegible.
No hubo contacto con el informante, la familia estaba paseando, hubo demolicin del edificio,
edificacin desocupada, etc.
Procesamiento de la Informacin
La informacin obtenida debe ser depurada, clasificada, resumida y analizada, aplicando para ello
adecuadas tcnicas estadsticas. Los puntos ms importantes en esta etapa son:
Codificacin
Cumplido el proceso de revisin de cada una de las respuestas obtenidas, se procede a la
codificacin de las mismas, especialmente cuando se va a utilizar la tabulacin mecnica. Aquellos
formularios en donde la mayor parte de las preguntas son cerradas, pueden ser precodificados, es
decir, cada respuesta posible tiene el cdigo impreso en el formulario.
Cdigo es un nmero que sustituye la respuesta, cuando se va a hacer el recuento. Por ejemplo si
una pregunta tiene dos respuestas se utilizan los dgitos 1 y 2. Por ejemplo a la pregunta: Usted
es un trabajador? Independiente 1 Asalariado 2.
Ahora, si nos interesa clasificar geogrficamente los establecimientos industriales, investigados por
departamentos en la regin Andina, se tendr: 01 Antioquia, 02 Atlntico,...., 22 Valle.
Crtica
El proceso de revisin del cuestionario se denomina crtica, cuya finalidad es corregir las
deficiencias en la recoleccin de la informacin, porque puede haber errores u omisiones, incluso
cuando los formularios han sido diligenciados por los encuestadores considerados como los ms
aptos o meticulosos y que el crtico puede subsanar directamente o pidiendo al entrevistador que
vuelva a la fuente de informacin o recurriendo a la memoria del mismo.
Tabulacin
Puede ser manual o mecnica y su eleccin depender:
De la cantidad de formularios que se van a utilizar.
Del nmero de preguntas que tenga el formulario.
Del tiempo y de los recursos, ya sea financiero o de equipo, disponibles.
Cuando la tabulacin se acuerda desde el principio, como parte integrante de la planeacin general
de la investigacin, es de suponer que todo el proceso sea totalmente satisfactorio, lo cual ha sido
demostrado por la experiencia.
Procesamiento
El procesamiento de la informacin se inicia una vez terminada la crtica, o despus de la
codificacin, cuando se va a hacer en forma mecnica. Para este ltimo proceso se usan las
herramientas contenidas en los diferentes programas estadsticos que contengan base de datos
dependiendo del tipo especfico de situacin.
Excel posee diversas funciones para trabajar con base de datos, realizando clculos simples como
sumas o clculos estadsticos ms complejos. Igualmente Internet ha permitido la creacin de
nuevos tipos de aplicaciones y servicios para los usuarios. Parte de estos servicios son la
implementacin de base datos que pueden accesarse a travs de pginas web, y el alcance y fcil
acceso a ellas, as como la reduccin de costos y la popularidad son sus principales atractivos.
Los diferentes programas permiten alimentar al computador, del cual se obtienen listados, los que
son revisados a fin de detectar las inconsistencias que se presenten en los procesos anteriores.
Una vez hechas las correcciones, se procede a elaborar los cuadros, con el fin de facilitar el
anlisis de la informacin, la elaboracin de grficas, las conclusiones y las recomendaciones, si
las hay.
Anlisis e Interpretacin
Esta etapa se puede considerar como la ms importante que tiene el informe, ya que el anlisis de
los datos tendr que ver con la formulacin del objetivo mismo de la investigacin y de las hiptesis
establecidas; sin embargo, este proceso de anlisis tendr menos dificultad, si el investigador tiene
pleno conocimiento de los problemas que son inherentes al planeamiento de una investigacin.
En este proceso se debe considerar la elaboracin de distribuciones o tablas de frecuencias,
obtenidas a travs de una sistematizacin de la informacin para poder ser presentada en forma
de cuadros. Con los anteriores resultados se procede luego a hacer un resumen y a la aplicacin
de las diferentes medidas, que hemos denominado estadgrafos y entre los cuales figuran las
medidas de dispersin y los promedios, incluyendo en stos los porcentajes o proporciones.
Con las cifras resultantes, se pueden hacer comparaciones con otros estudios, para poder llegar a
mejores conclusiones.
De esta ltima fase de la metodologa se puede decir que encierra dos aspectos:
Anlisis y evaluacin estadstica de los resultados
Anlisis y evaluacin tcnica de acuerdo con la naturaleza de la investigacin.
Estos dos aspectos permitirn determinar el grado de consistencia y confiabilidad de los resultados
obtenidos de la investigacin.
El profesor John W. Best en su libro Cmo investigar en educacin nos da una posible gua del
anlisis, sugiriendo los siguientes puntos:
1. TTULO
a. Es claro y conciso?
b. No promete ms de lo que el estudio puede proporcionar?
2. EL PROBLEMA
a. Se halla establecido con claridad?
b. Est bien delimitado?
c. Se reconoce su significado?
d. Las preguntas son especficas y se encuentran establecidas las hiptesis con
claridad?
e. Se establecen supuestos y limitaciones?
f. Se definen los trminos importantes?
3. REVISIN DE LA BIBLIOGRAFA RELACIONADA
a. Es de amplitud adecuada?
b. Se destacan los hallazgos importantes?
c. Est bien organizada?
d. Se procura un resumen efectivo?
4. PROCEDIMIENTOS UTILIZADOS
a. Se describe detalladamente el diseo experimental?
b. Es adecuado este diseo?
c. Se describen las muestras?
d. Se reconocen las variables relevantes?
e. Se procuran controles adecuados?
f. Son idneos los instrumentos de recogida de datos?
g. Se establecen la validez y la fiabilidad?
h. Es adecuado el tratamiento estadstico?
5. ANLISIS DE DATOS
a. Es adecuado el uso de tablas y figuras?
b. Es concisa y clara la exposicin del texto?
c. Es lgico y perceptible el anlisis de las relaciones de datos?
d. Se interpreta con precisin el anlisis estadstico?
6. RESUMEN Y CONCLUSIONES
a. Se replantea el problema?
b. Se describen con detalle los procedimientos?
c. Se presentan concisamente los hallazgos?
d. Es objetivo el anlisis?
e. Los datos presentados y analizados justifican los hallazgos y conclusiones?
La Publicacin
Corresponde a la fase final de la investigacin y con ella se propone hacer llegar a las personas
interesadas el resultado total del estudio, teniendo en cuenta todos los aspectos considerados en el
proceso, con la correspondiente validez que merezcan las conclusiones.
En trminos generales se puede decir que un informe deber contener:
a. Planteamiento del problema
b. Objetivo de la investigacin
c. Hiptesis que se quieren probar
d. Breve exposicin de la metodologa adoptada, diseo y tamao de la muestra. Proceso de
seleccin de las unidades de informacin y de recoleccin.
e. Se podr incluir en el informe copia del formulario utilizado en la recoleccin, aun relacionando
y justificando, en forma muy sucinta, las preguntas que se consideran que tienen ms
importancia dentro de la investigacin.
f. Descripcin de los resultados en forma de cuadros y grficas, acompaados del anlisis y
comparaciones obtenidas a travs de los datos.
g. Conclusiones y recomendaciones. Estas ltimas cuando as lo exija la investigacin.
h. En algunos casos el informe tiene una parte final, denominada apndice, en donde se
incluyen cuadros ms generales, que permitan aclarar o comprobar rpidamente cualquier
informacin ms detallada. Tambin se puede incluir documentacin complementaria al
informe.
DEFINICIN DE LA ESTADSTICA
La estadstica moderna proporciona conocimientos a los investigadores, es una ciencia nueva y de
rpido desarrollo; crece a medida que los estadsticos encuentran respuestas a ms y ms
problemas propuestos por los investigadores. De utilidad para todos los profesionales, quienes
requieren de formacin estadstica porque sta afecta todos los aspectos de la vida moderna,
desde el control estadstico de la produccin y la calidad para hacer confiables los servicios y
productos, hasta para determinar las preferencias del pblico en mltiples aspectos, proporciona
informacin en los estudios de impacto ambiental y ayuda en la evaluacin de las exigencias
gubernamentales y organizaciones mundiales; en el planeamiento de actividades financieras y de
mercadeo, en el manejo de personal por ejemplo control de horas laboradas, accidentes de trabajo,
etc.
H. G. Wells a quien se le conoce como el profeta del siglo XIX afirmo: "El pensamiento estadstico
ser un da tan necesario para el ciudadano eficiente como la capacidad de leer y escribir .
El contenido de la estadstica moderna incluye la recopilacin, presentacin y caracterizacin de la
informacin a fin de que auxilie tanto en el anlisis de datos como en el proceso de toma de
decisiones.
La extensin de la estadstica hace difcil su definicin. Su desarrollo obedeci a la necesidad de
tratar problemas en los cuales, para observaciones individuales, las leyes de causa y efecto no
aparecen claramente al observador y donde es necesario un enfoque objetivo. En tales problemas
siempre existe un cierto grado de incertidumbre en toda inferencia basada en un nmero limitado
de observaciones. Por lo tanto, una definicin razonable sera: La estadstica es la ciencia, pura y
aplicada, que crea, desarrolla y aplica tcnicas de modo que pueda evaluarse la incertidumbre de
inferencias inductivas.
La ciencia es un estudio que se ocupa de la observacin y clasificacin de los hechos. Los
cientficos deben, entonces, ser capaces de observar un suceso o conjunto de eventos como
resultado de un plan o diseo. El experimento es la esencia del mtodo cientfico. El diseo
experimental es un campo de la estadstica. De acuerdo a estos planteamientos la estadstica es
un instrumento aplicable en el mtodo cientfico, para el cual fue desarrollada. Su utilizacin
particular est en los muchos aspectos del diseo de un experimento, desde el plan inicial para la
recoleccin de los datos y el anlisis de los resultados a partir de los datos resumidos, hasta la
evaluacin de la incertidumbre de toda la inferencia extrada de ellos.
Otra definicin de la estadstica: conjunto de mtodos de planificacin de experimentos, obtencin
de datos, anlisis de los mismos, deduccin de conclusiones a partir de dichos anlisis. La
estadstica puede ser deductiva o descriptiva y estadstica inferencial o analtica, las cuales
desempean funciones distintas pero complementarias en el anlisis estadstico.
Ejemplo
Si un jefe de personal somete a un test de aptitud a un grupo de profesionales recientemente
contratados; hace una clasificacin de los resultados del test; calcula promedios de las
puntuaciones y reconoce algo sobre la aptitud tpica de los empleados; construye tablas y grficas
de manera que con slo dar un vistazo a los datos se puede tener una imagen general, utiliza el
promedio como punto de localizacin y describe la dispersin de los datos. Adems, si despus se
obtienen medidas sobre el rendimiento en el trabajo de estos empleados, se puede tratar de
describir la relacin entre las puntuaciones dadas por el test y dichas medidas. Entonces se puede
predecir el rendimiento de estos empleados.
Ejemplo
Cuando se hace un estudio sobre la calidad del servicio de taxis en un sector de la ciudad, se
sacan conclusiones para el servicio en el sector pero no se puede generalizar para toda la ciudad.
Mediciones Nominales
Se aplica una medicin nominal cuando se utilizan nombres para establecer categoras, en las
cuales se clasifican exclusivamente los valores de las variables. Por ejemplo, el sexo de las
personas es una variable que se puede clasificar en hombre o mujer.
Los valores se podran codificar tambin con uno (1) dos (2), pero los nmeros en este caso solo
serviran para indicar las categoras y no tendran significacin numrica: los clculos matemticos
que utilizaran estos cdigos no tendran sentido. Las bebidas refrescantes se pueden clasificar en
Coca cola, Pepsi, Colombiana, Bretaa. Cada bebida se podra recoger en una de esas categoras
con exclusin de las dems.
Es importante indicar que una medicin nominal no lleva consigo ninguna indicacin sobre el orden
de preferencia, sino que se limita a establecer una disposicin en categoras en las cuales se
puede colocar cada observacin.
Mediciones Ordinales
A diferencia de la medicin nominal, una escala ordinal da lugar a una ordenacin, es decir las
observaciones se jerarquizan a partir de algn criterio. Los sondeos de opinin utilizan a menudo
una escala ordinal como "muy de acuerdo", "de acuerdo", "sin opinin", "en desacuerdo" o "muy en
desacuerdo".
Como ocurre con los datos nominales, se pueden utilizar nmeros para ordenar las jerarquas. Y a
semejanza de los datos nominales, la magnitud de los nmeros no es importante: la jerarqua
depende solo del orden de los valores.
Mediciones de Intervalo
Las variables en una escala de intervalos se miden por los valores numricos y, como los datos
ordinales, llevan inherente una jerarqua u organizacin. Pero a diferencia de las categoras
ordinales, las diferencias entre los valores son importantes. Por consiguiente, las operaciones
aritmticas de suma y resta tienen sentido. La escala Fahrenheit de temperaturas es un ejemplo de
escala de intervalos: 70 grados no solo significa una temperatura mayor que 60 grados, sino que
existe la misma diferencia de 10 grados que entre 100 y 90 grados Fahrenheit.
El valor de cero en una escala de intervalos se elige de manera arbitraria. No hay nada concreto
que haya obligado a fijar la temperatura cero: es un mero punto de referencia arbitrario. La escala
Fahrenheit se podra haber creado de manera que el cero se colocara a una temperatura muy
superior ( o inferior). Al cero no se le vincula ningn significado especfico diferente de decir que
tiene una temperatura 10 grados inferior a la de 10 grados Fahrenheit. As pues, 80 grados no es el
doble de 40 grados y la relacin 80/40 no tiene sentido.
Mediciones de Proporciones
De los cuatro niveles de medicin, solo la escala de proporcin o de razn se basa en un sistema
numrico en el cual el cero tiene sentido. Por consiguiente, las operaciones aritmticas de
multiplicacin y divisin tambin adquieren una importancia racional. Se utiliza una escala de
proporcin para medir muchos tipos de datos que se encuentran en un anlisis contable. Variables,
como el costo, los beneficios o niveles de inventarios se expresan como medidas de proporcin. El
valor de cero pesos para medir los ingresos de un negocio, por ejemplo, se puede interpretar con
toda lgica en el sentido de que no ha habido ventas. Adems una empresa con una cuota de
mercado del 40% tiene el doble de participacin en el mercado que otra empresa con una cuota del
20%. Mediciones tales como el peso, el tiempo y la distancia tambin se miden en escala de
proporcin, puesto que el cero ocupa un lugar natural, y un elemento que pese 100 libras es la
mitad de pesado que otro que pese 200 libras.
Se observa que los cuatro niveles de medicin aumentan en grado de complejidad, y que sta
progresa desde la elemental escala nominal hasta la escala de proporcin mas refinada. Cada
nivel de medicin ofrece ms informacin sobre la variable que el nivel anterior. Esta matizacin es
importante, porque las diferencias tcnicas estadsticas exigen niveles diferentes de medicin.
Mientras que la mayora de las pruebas estadsticas exigen mediciones de intervalo o de
proporcin, hay otras, denominadas pruebas no paramtricas (que se estudiaran despus) que se
han diseado para utilizar datos nominales u ordinales.
Por lo general, las variables cualitativas se describen literalmente, pero si se codifican estas
descripciones se convierten en nmeros que representan datos nominales u ordinales. Las
operaciones aritmticas de suma, resta, multiplicacin, divisin o promedios con dichos resultados
resultan siempre absurdas. En contraste las variables cuantitativas se describen siempre
numricamente, ya sea mediante datos de intervalo que permiten algunos tipos de operaciones
aritmticas, o de razn que permiten todas las operaciones.
A continuacin se presenta una tabla
de las escalas.
ESPECIFICACIN DE PARMETROS
Toda rama de la actividad cientfica tiene su vocabulario especial y la estadstica no es la
excepcin. En las secciones anteriores se estudiaron algunos trminos corrientes utilizados en el
anlisis estadstico los cuales se precisan en forma ms puntual.
Poblaciones y Parmetros
En todo estudio estadstico el investigado est interesado en una determinada coleccin o conjunto
de observaciones, denominada poblacin ( o universo). Si los ingresos de la poblacin colombiana
asalariada son de inters para el contador en la elaboracin de un plan tributario nacional, la
poblacin est constituida por todos los asalariados: Pero si se considera un plan tributario solo
para preceptores de ingresos superiores, por ejemplo, a 5 millones de pesos, entonces
nicamente estos ltimos formarn la poblacin. La poblacin es pues, la coleccin completa de
todas las observaciones de inters para el investigador.
Si un ejecutivo de una gran empresa fabricante desea estudiar la produccin de todas sus fbricas,
la produccin de todas estas plantas ser la poblacin.
Un parmetro es cualquier medida descriptiva de una poblacin. Son ejemplos de parmetros los
ingresos medios de todos los asalariados de Colombia o la produccin media del total de las
plantas de fabricacin.
Muestras y Estadsticos
Aunque los profesionales de la estadstica suelen estar interesados en algunos aspectos de la
poblacin completa, lo normal es que sta sea demasiado grande para estudiarla en su totalidad.
Calcular los ingresos medios de todos los asalariados de Colombia sera una tares muy
dispendiosa. Por consiguiente, nos habremos de contentar con estudiar solo una pequea parte de
esa poblacin. Esta porcin menor y manejable se llama muestra. Una muestra es un subconjunto
de la poblacin seleccionada por medios cientficos.
El Departamento Administrativo Nacional de Estadstica (DANE) calcula los ingresos medios de
una muestra constituida solamente por unos centenares de asalariados, seleccionados de la
poblacin total de trabajadores asalariados de Colombia. La media de esta muestra se utiliza
despus como estimacin de los ingresos medios de toda la poblacin. Las muestra son
necesarias porque el estudio de las poblaciones enteras exigira demasiado tiempo y dinero.
Un estadstico o estimador es cualquier medida descriptiva de una muestra. Los ingresos medios
de esos centenares de trabajadores calculados por el DANE son un estadstico. Es importante
saber que el estadstico sirve como estimacin del parmetro. Aunque en realidad estamos
interesados en el valor del parmetro de la poblacin, casi siempre tendremos que resignarnos a
estimarlo con un estadstico de la muestra seleccionada.
El Error
Se refiere a la disparidad de los datos obtenidos experimentalmente respecto a la realidad de los
hechos.
Cifras Significativas
Como la precisin de los aparatos de medida es limitada, el nmero de dgitos vlidos en una
medicin tambin es limitado. Los dgitos vlidos se denominan cifras significativas. Suponga que
mide la longitud de una lmina metlica con una cinta mtrica, cuya divisin ms pequea es el
milmetro, lo que le permite leer con seguridad hasta el milmetro ms cercano, pero tendra que
aproximar la longitud sobrante a una fraccin de milmetro. Por ejemplo que la lmina metlica
mide un poco ms de 7,6 cm, si se mira ms cuidadosamente, y se observa que el extremo de la
lmina se encuentra a 4/10 de milmetro a partir de 7,6. Por consiguiente la medida queda mejor
expresada como 76,4 mm. El ltimo dgito es aproximado. Podra no ser 4 pero no es mayor que 5
ni menor que 3. La medida 76,4 mm tiene 3 cifras significativas. Hay dos dgitos seguros, el 7 y el
6, y uno aproximado, el 4.
Cifras significativas es el nmero de cifras que se utilizan para indicar un valor con un grado
determinado de exactitud. O el nmero de dgitos vlidos en una medicin. Por ejemplo 6084,32 es
un valor con seis cifras significativas. Si se escribe 6084,0 tiene 4 cifras significativas, el ltimo 0
no es significativo porque solamente se emplea para indicar el orden de magnitud.
Notacin Cientfica
Los cientficos trabajan con frecuencia con cantidades o muy grandes o muy pequeas. Por
ejemplo la masa de la tierra es aproximadamente:
6.000.000. 000.000. 000.000. 000.000 kilogramos y la masa de un electrn es 0, 000 000 000 000
000 000 000 000 000 911 kg.
Escritas en esta forma, las cantidades necesitan mucho espacio y son difciles de usar en los
clculos. Para trabajar ms fcilmente, se escriben abreviadamente as:
La masa aproximada de la tierra es
Y la masa del electrn es
.
.
La notacin cientfica es el mtodo de escribir las cifras como producto de un nmero comprendido
entre 1 y
por una potencia de 10.
Por ejemplo 2342,6 en notacin cientfica es
y 0,042 se escribe
Redondeo de Datos
Aproximacin de datos a su valor entero ms prximo o a una cifra decimal determinada
previamente.
Por ejemplo, redondear (en las dcimas):
Redondear a entero:
MTODOS DE MUESTREO
El Muestreo
Consiste en seleccionar un subconjunto representativo de toda la poblacin. El muestreo puede
ser:
Muestreo probabilstico
Muestreo no probabilstico.
poblacin en subgrupos de acuerdo con una caracterstica importante. Despus, se obtiene una
muestra aleatoria para cada estrato, es recomendable asegurar una representacin proporcional
de cada subgrupo en la muestra.
Ejemplo 3
Ejemplo 4
Muestreo Sistemtico
Este mtodo de seleccin es utilizado por algunos contadores para revisar sumas, cuentas, etc. se
eligen los elementos de la poblacin a intervalos uniformes, a partir de un listado ordenado, tal
como elegir cada doceava cuenta por cobrar para la muestra. La primera de las cuentas se elegir
al azar (o utilizando nmeros aleatorios). Otra forma consiste en determinar, en primer lugar un
intervalo igual al valor obtenido al dividir el tamao de la poblacin por el de la muestra. Luego se
toma aleatoriamente una observacin. Supongamos que entre 01 y 10 se seleccion la
observacin 6 y como el intervalo es 5 (Hay 200 cuentas por cobrar y el estudio se har con 40), la
segunda observacin ser 11, luego 16, y as sucesivamente.
Un problema especfico del muestreo sistemtico es la existencia de cualquier factor peridico o
cclico en la lista de la poblacin que pudiera conducir a un error sistemtico en los resultados
muestrales.
Ejemplo 5
Muestreo No Probalstico
En el muestreo no probabilstico se toma la muestra, de cualquier tamao y los elementos son
seleccionados de acuerdo con la opinin o juicio que tenga el investigador sobre la poblacin.
En el caso de una poblacin homognea, la representatividad de tal muestra puede considerarse
satisfactoria.
Por otra parte, en problemas comerciales diarios y en la toma de decisiones que a falta de tiempo
no permiten disear mtodos de muestreo probabilstico hay que recurrir a este tipo de muestreo,
donde el investigador conoce la poblacin.
No existe ningn mtodo de muestreo que pueda garantizar que se obtendr una muestra
representativa. Lo mejor que puede lograrse es evitar sesgos consistentes o sistemticos, el uso
del muestreo probabilstico o aleatorio garantiza que las diferencias entre la muestra y la poblacin
se deben slo al azar.
Existe una serie de trminos estadsticos bsicos, que son muy utilizados y se requiere sean
comprendidos para avanzar en otros temas o unidades, en esta seccin se tratarn los conceptos
de variables, poblacin, muestras, muestreos, frecuencia, errores. Como la estadstica emplea las
matemticas como herramienta, se recordarn algunos conceptos matemticos como: cifras
significativas, notacin cientfica, redondeo de datos.
Variables
Las observaciones constituyen la materia prima con la cual trabajan los investigadores por ejemplo;
en el mejoramiento de cultivos se puede medir numricamente el rendimiento por parcela, en la
investigacin mdica se puede medir el tiempo de recuperacin bajo dos tratamientos diferentes,
en la industria se puede examinar la cantidad de defectos en lotes de artculos producidos en serie.
stas observaciones proporcionan datos y su caracterstica comn es la variabilidad o variacin.
Proposiciones tales como " Patricia es morena", o " Carlos pesa 76,8 Kg" se refieren a
caractersticas que varan de una persona a otra y sirven para distinguir o describir.
Variables son rasgos, caractersticas o propiedades que poseen los elementos de una poblacin o
de una muestra y presentan variacin.
Para representar las variables generalmente se emplean smbolos; por ejemplo, si en un grupo 5
personas pesan 65kg, 62kg, 58kg, 60kg y 73kg. La variable peso se denota as:
X1 = 65 kg,
X2 = 62 kg,
X3 = 58 kg,
X4 = 60 kg ,
X5 = 73 kg.
En trminos ms generales se denota un conjunto de observaciones mediante X1 , X2 , X3, ..... , Xn.
Donde X1 es el primer trmino que se lee como equis subuno y Xn se refiere al ltimo trmino (se
lee termino ensimo), el subndice nos dice el nmero de observaciones y los tres puntos entre X3
y Xn se refiere al resto de observaciones. En el ejemplo n = 5.
Si se atiende a las caractersticas observadas, las variables se pueden clasificar como cualitativas
y cuantitativas.
Sexo:
femenino, masculino
Estado civil:
Color de un automvil:
Poblacin o Universo
La primera preocupacin respecto a un conjunto de datos es si se puede considerar todos los
datos posibles o slo una parte de ese conjunto. Es de gran importancia definir la poblacin que se
estudia y obtener una muestra representativa de la poblacin definida, con el fin de obtener
inferencias vlidas.
La poblacin o universo es el conjunto de todos los elementos del cual se extrae la muestra, es
decir, son todos los posibles valores de una variable. Estos valores no tienen que ser todos
diferentes o un nmero infinito. Este conjunto no necesariamente es de personas; pueden ser otros
seres vivos, objetos, hechos, ideas, entidades, etc.
Muestra
Se considera una muestra al subconjunto representativo de la poblacin:
Ejemplo
Hay inters en hacer una investigacin para determinar el porcentaje de fumadores de una
empresa. La poblacin es el conjunto de todos los empleados de la empresa y la muestra puede
ser un grupo conformado por el 30% de los empleados que pertenecen a las distintas
dependencias.
Ejemplo
Se desea conocer que clases de lecturas hacen los estudiantes de una curso. La poblacin es el
conjunto de todos los estudiantes del curso. Una muestra podra ser 25 estudiantes seleccionados
al azar.
DATO
VARIABLE
Cualitativa
Cualitativa
Cuantitativa
OPERACIONES
DESCRIPCIN DE DATOS
EJEMPLOS
ASOCIADO
PERMITIDAS
Nominal
Poner nmeros
en grupos
mutuamente
exclusivos,
contar nmeros
en cada grupo
Los cdigos
de los dgitos
del 00 al 99 en
un listado.
Nmero de
carretera o de
telfono.
Igual que el
anterior, ms
comparar
nmeros como
mayor que,
menor que o
igual a otro.
La
clasificacin
de cursos
como 5
excelente, 3
regular y 1
malo. La
clasificacin
de estudiantes
o la de
corredores en
una lnea de
meta.
Como la anterior
mas sumar y
restar.
Escalas de
temperaturas;
hora de reloj;
tiempo de
calendario.
Ordinal
Intervalo
Cuantitativa
Razn
FECHAS
ETAPAS
INICIAL
FINAL
1. Estudios preliminares
10 - VI
2 -VII
26 - VI
10 -VII
3. Encuesta experimental
15 -VII
25 - VII
4. Recoleccin
30 -VII
18 -VIII
15 - VIII
10 -IX
15 - IX
30 -IX
5. Procesamiento
graficacin
de
los
datos,
Tabulacin
6. Publicacin
Tabla 1
PAPEL DE LA ESTADSTICA
A continuacin se presenta la lectura de ALLEN L. Webster, Estadstica aplicada a la Empresa y a
la Economa, McGraw Hill, segunda edicin, 1998, captulo 1 "Papel de la Estadstica", en donde
se expone el papel de la estadstica como estudio organizado. Se seala el objetivo general del
anlisis estadstico y se muestran las numerosas maneras en que la estadstica le puede ayudar a
encontrar soluciones a problemas de su vida profesional
La estadstica demuestra que si gasta ms que gana, su nivel de vida ser su ruina.
Introduccin
A medida que aumenta la complejidad de nuestro mundo, se hace ms difcil tomar decisiones
informadas e inteligentes. Con frecuencia, estas decisiones han de tomarse con un conocimiento
imperfecto de la situacin y un grado considerable de incertidumbre. Sin embargo, las soluciones
pertinentes son esenciales para nuestro bienestar e incluso para nuestra supervivencia. Estamos
expuestos a la presin constante de problemas econmicos angustiosos, como una inflacin
galopante, un sistema fiscal engorroso y oscilaciones excesivas del ciclo econmico. Todo nuestro
tejido social y econmico est amenazado por la contaminacin ambiental por una deuda pblica
opresiva, por un ndice de delincuencia que aumenta sin cesar y por unos tipos de inters
impredecibles.
Quien piense que estas condiciones son caractersticas del estilo de vida actual hara bien en
recordar qu problemas anlogos contribuyeron a la cada de la antigua Roma ms que la invasin
de las hordas brbaras del Norte. Nuestro periodo de xito en este planeta, relativamente breve, no
es ninguna garanta de supervivencia futura. A menos que se encuentren soluciones viables a
estos apremiantes problemas, podramos acompaar en el olvido al dinosaurio y al ave dodo, como
ya hicieron los antiguos romanos.
Este captulo le ofrece una impresin general del contenido de la estadstica y de su posible utilidad.
Esta visin general se concreta en el estudio de los apartados siguientes:
Definiciones bsicas de las herramientas estadsticas.
Utilizacin del muestreo para realizar anlisis estadstico.
Funciones de la estadstica.
Forma en que la estadstica se puede aplicar en su profesin.
Comenzaremos con una breve exposicin del significativo papel de la estadstica en el proceso de
toma de decisiones delicadas.
Importancia de la Estadstica
Casi todos los campos de la investigacin cientfica seria se pueden beneficiar del anlisis
estadstico. Los responsables de la toma de decisiones sobre poltica econmica, asesores del
presidente y de otros altos cargos pblicos, tienen en la estadstica una herramienta muy valiosa.
nicamente con ayuda del anlisis estadstico pueden tomarse decisiones inteligentes en relacin
con los tipos tributarios, los programas sociales, los gastos de defensa y muchas otras cuestiones.
Es fundamental tambin para los empresarios, en su bsqueda incansable del beneficio. Las
Los analistas financieros y econmicos han de apelar a menudo a sus conocimientos cuantitativos
para idear soluciones eficaces a problemas difciles. La comprensin de los principios econmicos
y financieros le permitir aplicar tcnicas estadsticas para hallar soluciones viables y tomar
decisiones. Quienes aspiren a ocupar puestos de direccin, trabajar como autnomos o
desempear cualquier otra profesin del sector industrial advertirn que una comprensin bsica
de la estadstica no slo multiplica sus oportunidades de empleo, sino que tambin refuerza las
probabilidades de promocin debido a la mejora del rendimiento en el trabajo.
Los puestos de trabajo en los que se utilizan procedimientos estadsticos suelen disfrutar de
salarios ms altos y estn ms protegidos. Adems, desde un principio estn en contacto ms
estrecho con la alta direccin. Esta proximidad a la lite ejecutiva es inevitable, desde la necesidad
de facilitar a los altos directivos informacin y ayuda. En el mercado actual del trabajo los
empresarios se resisten a contratar o retener a analfabetos estadsticos.
Tanto si sus aspiraciones profesionales se encaminan a la industria privada como a la
Administracin o al desempeo de cualquier actividad lucrativa, se encontrar mucho mejor
respaldado por su experiencia acadmica si adquiere una base slida en los fundamentos del
anlisis estadstico.
ellas es el grfico de Pareto, que debe su nombre al economista italiano Vilfredo Pareto y que
identifica los problemas de calidad que se presentan ms a menudo o que resultan ser los ms
costosos. La figura 1-1 muestra un grfico de Pareto de los defectos que afectan a la fabricacin
de hornos de microondas comercializados por J. C. Penney.
Los diagramas de Pareto expresan por lo general la regla de 80/20: el 80% de todos los problemas
son debidos al 20% de las causas. Como indica la figura 1-1, alrededor del 75% de los problemas
se deben al dispositivo de descongelacin automtica y al de conservacin de la temperatura del
horno.
En trminos generales, el SQC trata de garantizar que los productos cumplan unas normas y
especificaciones mnimas de fabricacin. Este objetivo se persigue en muchos casos mediante el
empleo del muestreo para aceptacin, como parte integrante del SQC. Consiste en la inspeccin
de una muestra aleatoria de mercancas existentes para determinar si se debe aceptar o rechazar
la totalidad del envo o lote. Esta decisin se basa en parte en un nivel aceptable de calidad (NAC)
que es el nmero mximo o ndice de defectos que la empresa est dispuesta a tolerar.
Est cada vez ms extendida entre las empresas la necesidad de mantener a toda costa la calidad
del producto. Para conseguir el xito a pesar de la competencia hay que tomar todas las
precauciones para que los productos cumplan determinadas normas bsicas. Por lo tanto, no es
ninguna exageracin insistir en la importancia de la TQM. Los principios de la TQM son cada vez
mejor conocidos; representan la orientacin futura del anlisis estadstico aplicado al mundo
empresarial. En un captulo posterior se estudia la TQM con mayor profundidad.
Poblaciones y Parmetros
En todo estudio estadstico el investigador est interesado en una determinada coleccin o
conjunto de observaciones, denominada poblacin (o universo). Si los ingresos de los 121 millones
de asalariados de Estados Unidos son de inters para un economista que asesore al Congreso en
la elaboracin de un plan tributario nacional, la poblacin estar constituida por los 121 millones de
ingresos. Pero si se considera un plan tributario slo para los perceptores de ingresos superiores,
por ejemplo, a 100,000 dlares, entonces nicamente estos ltimos formarn la poblacin. La
poblacin es, pues, la coleccin completa de todas las observaciones de inters.
Poblacin
Coleccin completa de todas las observaciones de inters para el investigador
Si el primer ejecutivo de una gran empresa fabricante desea estudiar la produccin de todas sus
fbricas, la produccin de todas estas plantas ser la poblacin.
Un parmetro es cualquier medida descriptiva de una poblacin. Son ejemplos de parmetros los
ingresos medios de todos los asalariados de Estados Unidos o la produccin total de todas las
plantas de fabricacin. El concepto clave a recordar es que un parmetro describe una poblacin.
Parmetro
Medida descriptiva de la poblacin completa de observaciones que tienen inters para el
investigador.
Muestras y Estadsticos
Aunque los profesionales de la estadstica suelen estar interesados en algunos aspectos de la
poblacin completa, lo normal es que sta sea demasiado grande para estudiarla en su totalidad.
Calcular los ingresos medios de los 121 millones de asalariados sera una tarea abrumadora. Por
consiguiente, nos habremos de contentar con estudiar slo una pequea parte de esa poblacin.
Esta porcin ms pequea y manejable se llama muestra. Una muestra es un subconjunto de la
poblacin seleccionada por medios cientficos.
Muestra
porcin representativa de la poblacin, que se selecciona para su estudio porque la poblacin es
demasiado grande para analizarla en su totalidad
Cada mes el Departamento de Trabajo de Estados Unidos calcula los ingresos medios de una
muestra constituida solamente por varios millares de asalariados, seleccionados de la poblacin
total de 121 millones de trabajadores. La media de esta muestra se utiliza despus como
estimacin de los ingresos medios de toda la poblacin. Las muestras son necesarias porque e1
estudio de las poblaciones enteras exigira demasiado tiempo y dinero.
Un estadstico o estimador es cualquier medida descriptiva de una muestra. Los ingresos medios
de esos varios millares de trabajadores calculados por el Departamento de Trabajo son un
estadstico. El estadstico es a la muestra lo que el parmetro es a la poblacin. Es importante
saber que el estadstico sirve como estimacin del parmetro. Aunque en realidad estamos
interesados en el valor del parmetro de La poblacin, casi siempre tendremos que resignarnos a
estimarlo con un estadstico de la muestra seleccionada.
Estadstico
Elemento que describe una muestra y sirve para estimar el parmetro correspondiente de la
poblacin.
Variables
Una variable es la caracterstica de la muestra o de la poblacin que se observa. Si el asesor
estadstico del alcalde de San Francisco est interesado en a distancia que recorren quienes
acuden en su coche al trabajo cada maana, la variable es millas de conduccin. En un estudio
que afecte a los ingresos de los asalariados en Estados Unidos la variable es ingresos.
Variable: caracterstica de la poblacin que se analiza en el estudio estadstico.
Una variable puede ser:
1. Cuantitativa o
2. Cualitativa.
Si las observaciones se pueden expresar por medio de nmeros, se trata de una variable
cuantitativa. Los ingresos de todos los asalariados son un ejemplo de poblacin cuantitativa. Otros
ejemplos podran ser las estaturas de todas las personas que nos interesen, las calificaciones que
los estudiantes reciben en el examen final de estadstica o el nmero de millas que quienes acuden
en su coche a San Francisco tienen que conducir cada maana. En cada uno de estos casos las
observaciones tienen una medida numrica.
En cambio, una variable cualitativa se mide por medios no numricos. El estado civil de los
solicitantes de prstamos, el sexo de los estudiantes de esta clase de estadstica y la raza, color
del pelo y preferencia religiosa de quienes acuden a trabajar a San Francisco son ejemplos de
variables cualitativas. En cada uno de estos casos as observaciones se miden por medios no
numricos.
Adems, las variables pueden ser:
1. Continuas o
2. Discretas.
Una variable continua es la que puede tomar cualquier valor dentro de un intervalo dado. Por muy
prximas que puedan estar dos observaciones, si el instrumento de medida tiene la precisin
suficiente siempre puede haber una tercera observacin que caiga entre las dos primeras. Los
valores de una variable continua proceden en general de mediciones.
Una variable discreta tan slo puede tomar determinados valores, por lo general nmeros enteros.
Suele ser resultado de la enumeracin o del conteo. El nmero de estudiantes de esta clase o el
nmero de coches vendidos por General Motors son ejemplos de variables discretas. En ninguno
de estos casos observarn valores fraccionarios.
En este curso vern que los conceptos y trminos mencionados se repiten muchas veces.
Debern ser conscientes del papel que cada uno de ellos desempea en el proceso de anlisis
estadstico. Es muy importante que sean capaces de distinguir entre una poblacin y sus
parmetros y entre una muestra y sus estadsticos.
Funciones de la Estadstica
Hemos subrayado ya la utilidad de la estadstica y la amplia variedad de problemas que puede
resolver. Para ilustrar ms a fondo esta amplia aplicabilidad examinemos las distintas funciones de
la estadstica. La estadstica es la ciencia que se ocupa de la:
1. Recopilacin.
2. Organizacin,
3. Presentacin
4. Anlisis y
5. Interpretacin de datos.
Aunque el primer paso en cualquier estudio estadstico es la recopilacin de los datos, es prctica
comn en un curso inicial de estadstica suponer que los datos ya han sido recopilados y estn a
nuestra disposicin. Por consiguiente, nuestro trabajo comienza con la tarea de organizarlos y
presentarlos de manera significativa y descriptiva, Los datos se han de colocar en algn orden
lgico que consiga revelar con rapidez y facilidad el mensaje que contienen. Este procedimiento
constituye el proceso que hemos definido como estadstica descriptiva y que se explica en los
captulos siguientes. Una vez que los datos han sido organizados y presentados para su estudio, el
estadstico ha de analizarlos e interpretarlos. Estos procedimientos pertenecen a a estadstica
inferencial y constituyen una aportacin importante del anlisis estadstico, porque ofrecen gran
ayuda en el proceso de toma de decisiones y resolucin de problemas.
Se advertir que en a aplicacin de procedimientos estadsticos precisos es posible predecir el
futuro con cierto grado de exactitud. Cualquier empresa que se enfrente a las presiones de la
competencia puede obtener beneficios considerables de la capacidad para prever las
circunstancias futuras. Si conoce cules van a ser sus ventas en un cierto momento del futuro
prximo, podr preparar planes ms precisos y eficaces en relacin con as operaciones actuales.
Si las ventas futuras se estiman con un grado de exactitud fiable, ser fcil para a direccin tomar
decisiones importantes en relacin con los niveles de existencias, los pedidos de materias primas,
la contratacin de empleados y casi cualquier otro aspecto de la actividad empresarial.
Aplicacin Estadstica
La revista Fortune public hace poco el problema con que se enfrent Nike, fabricante de calzado
deportivo, para decidirla combinacin decolores que preferan sus clientes. La alta direccin estaba
algo confusa en relacin a cul de las dos modas competidoras atraeran ms el inters de los
usuarios.
Se seleccion con cuidado una muestra de ms de mil corredores habituales, a quienes se dio la
oportunidad de expresar sus preferencias con esta informacin, la direccin lleg a la conclusin
de que la poblacin de consumidores expresaba una preferencia abrumadora hacia un diseo
sobre el otro. A partir de esta preferencia se decidi el diseo que se haba de fabricar y
comercializar.
Niveles de Medicin
Las variables se pueden clasificar por su nivel de medicin. La clasificacin que se haga tiene gran
influencia en la manera de utilizarlas en nuestro anlisis. Las variables pueden ser:
1. Nominales,
2. Ordinales,
3. De intervalo o
4. De proporcin.
Mediciones Nominales
Se aplica una medicin nominal cuando se utilizan nombres para establecer categoras, en las
cuales se clasifican exclusivamente los va]ores de las variables, por ejemplo, el sexo de las
personas es una variable que se puede clasificar en hombre o mujer. Los valores se podran
codificar tambin con 1 o 2>,, pero los nmeros en este caso slo serviran para indicar las
categoras y no tendran significacin numrica: los clculos matemticos que utilizaran estos
cdigos no tendran sentido. Las bebidas refrescantes se pueden clasificar en Coke, Pepsi, 7-Up o
Ale 8. Cada bebida se podra recoger en una de estas categoras con exclusin de las dems.
Mediciones nominales: nombres o clase que se utilizan para organizar los datos en categoras
separadas y distintas.
Es importante recordar que una medicin nominal no lleva consigo ninguna indicacin sobre el
orden de preferencia, sino que se limita a establecer una disposicin en categoras en las cuales
se puede colocar cada observacin.
Mediciones Ordinales
A diferencia de la medicin nominal, una escala ordinal da lugar a una ordenacin o disposicin
ntida de los datos. Es decir, las observaciones se jerarquizan a partir de algn criterio. Sears
Roebuck, importantes grandes almacenes, clasifica muchos de sus productos como buenos,
mejores y ptimos. Los sondeos de opinin utilizan a menudo una escala ordinal, como muy
de acuerdo>,, de acuerdo, sin opinin, en desacuerdo y muy en desacuerdo.
Como ocurre con los datos nominales, se pueden utilizar nmeros para ordenar las jerarquas. Y a
semejanza de los datos nominales, la magnitud de los nmeros no es importante: la jerarqua
depende slo del orden de los valores.
Mediciones ordinales: mediciones que jerarquizan los datos en categoras, ordenadas en virtud de
un determinado criterio.
El mismo nmero de la revista Money antes mencionado clasificaba las inversiones a partir de los
niveles de riesgo. Obsrvese que las jerarquas de muy alto riesgo, alto riesgo y bajo riesgo podran
haberse identificado con los valores 1, 2 y 3, o bien A, 8 y C. Pero las diferencias reales en los
niveles de riesgo no se pueden medir de manera significativa. Slo sabemos que una inversin
clasificada de alto riesgo lleva consigo un riesgo mayor que otra de bajo riesgo.
Mediciones de Intervalo
Las variables en una escala de intervalos se miden por valores numricos y, como los datos
ordinales, llevan inherente una jerarqua u ordenacin. Pero, a diferencia de las categoras
ordinales, las diferencias entre valores son importantes. Por consiguiente, las operaciones
aritmticas de suma y cesta tienen sentido, La escala Fahrenheit de temperaturas es un ejemplo
de escala de intervalos: logrados no slo significa una temperatura mayor que 60 grados, sino que
existe la misma diferencia de l0O grados que entre 100 y 90 grados Fahrenheit.
El valor del cero en una escala de intervalos se elige de manera arbitraria. No hay nada concreto
que haya obligado a fijar la temperatura cero: es un mero punto de referencia arbitrario. La escala
de Fahrenheit se podra haber creado de manera que el cero se colocara a una temperatura muy
superior (o inferior). Al cero no se le vincula ningn significado especfico diferente de decir que
tiene una temperatura l0 grados inferior a la de lo grados Fahrenheit. As pues, 80 grados no es el
doble de 40 grados y la relacin 80/40 no tiene sentido.
Mediciones por intervalo: mediciones respecto de una escala en la cual el valor del cero es
arbitrario, pero la diferencia de valores es importante.
Mediciones de Proporcin
De los cuatro niveles de medicin, slo la escala de proporcin o de razn se basa en un sistema
numrico en el cual el cero tiene sentido. Por consiguiente, las operaciones aritmticas de
multiplicacin y divisin tambin adquieren una interpretacin racional. Se utiliza una escala de
proporcin para medir muchos tipos de datos que se encuentran en anlisis econmico. Variables
como el coste, los beneficios o los niveles de existencias se expresan como medidas de
proporcin. El valor de cero dlares para medir los ingresos de un negocio, por ejemplo, se puede
interpretar con toda lgica en el sentido de que no ha habido ventas. Adems, una empresa con
una cuota de mercado del 40% tiene el doble de participacin en el mercado que otra empresa con
una cuota del 20%. Mediciones tales como el peso, el tiempo y la distancia tambin se miden en
escala de proporcin, puesto que el coro ocupa un lugar natural, y un elemento que pese 100 libras
es la mitad de pesado que otro que pese 200 libras.
Mediciones de proporcin: mediciones numricas en las cuales el cero es un valor fijo es cualquier
escala y la diferencia de valores es importante.
Se observar que los cuatro niveles de medicin aumentan en grado de complejidad, y que sta
progresa desde la burda escala nominal hasta la escala de proporcin ms refinada. Cada nivel de
medicin ofrece ms informacin sobre la variable que el nivel anterior. Esta matizacin es
importante, porque las diferentes tcnicas estadsticas exigen niveles diferentes de medicin.
Mientras que la mayora de las pruebas estadsticas exigen mediciones de intervalo o de
proporcin, hay otras, denominadas pruebas no paramtricas (que se estudiarn despus en este
texto), que se han diseado para utilizar datos nominales u ordinales.
EJEMPLO 1
En un termmetro de mercurio slo es posible leer temperaturas con aproximacin de un grado.
Una temperatura de 20C se debera escribir entonces
porque realmente significa
"entre 19.5 C y 20.5 C " .
Medida
Donde:
Es la medida observada
Representa la incertidumbre = error absoluto.
EJEMPLO 2
Tres personas miden el dimetro de una esfera y obtienen los siguientes resultados: 5.61cm,
5.64cm y 5.58cm.
El valor ms probable = media aritmtica
El error relativo
Es el cociente entre el error absoluto promedio (ea) y el valor ms probable (media aritmtica) de
las medidas efectuadas por 100%.
.
Tomando los datos del 2. ejemplo de error absoluto:
y la media aritmtica = 5.61cm entonces:
EJEMPLO 3
En un estudio de las actitudes de estudiantes con respecto a las normas de hospedaje en las
residencias universitarias, es razonable pensar que pueden existir diferencias importantes entre los
estudiantes de pregrado y los de postgrado, y entre hombres y mujeres. Por lo tanto, debe
considerarse un esquema de muestreo con cuatro estratos: hombres de pregrado, mujeres de
pregrado, hombres de postgrado, mujeres de postgrado. Si hay en cada grupo un nmero
aproximadamente igual de estudiantes por ejemplo 300, y se toma una muestra total de 120
estudiantes, entonces de cada grupo se toma una muestra aleatoria simple de 30 estudiantes
(seleccionndolos por sorteo o con el uso de tablas de nmeros aleatorios).
EJEMPLO 4
Una empresa va realizar un estudio sobre la vivienda de sus empleados, quienes se distribuyen de
acuerdo con sus actividades as:
ACTIVIDAD
# DE EMPLEDADOS
Personal Operativo
1525
Personal Administrativo
195
Personal Tcnico
104
Personal Profesional
40
TOTAL
1864
Se desea conformar una muestra aleatoria de 50 empleados que pertenezcan a todas las
actividades.
Como los empleados estn clasificados en estratos segn su actividad, se saca en forma
proporcional el nmero de empleados de cada grupo (utilizando la regla de tres).
En la siguiente tabla se muestra el nmero de empleados de cada actividad que debe conformar la
muestra:
ACTIVIDAD
# DE EMPLEADOS (MUESTRA)
Personal Operativo
41
Personal Administrativo
Personal Tcnico
Personal Profesional
TOTAL
50
Luego se utiliza el sorteo, o una tabla de nmeros aleatorios o un programa de computador para
elaborar el listado de las personas de cada grupo que conformarn la muestra.
EJEMPLO 5
Si en una comunidad en la que se estudia lo apropiado de la utilizacin de gas, cada dcima casa
se encuentra en una esquina. Si se incluye en la investigacin un muestreo sistemtico cada
dcima casa, tendra un sesgo porque todas las casas investigadas se encontraran en esquina.
(Aqu se recomendara otro mtodo de muestreo por que si se toma otro valor, puede suceder que
ninguna casa quede en esquina).
EJEMPLO 6
Si un analista de la secretara de salud necesita hacer un estudio de los servicios mdicoasistenciales que reciben los trabajadores del rea metropolitana, sera difcil obtener una lista de
todos los trabajadores de la poblacin objetivo. Sin embargo podra obtenerse una lista de las
empresas y fbricas del rea. Con esta lista, el analista puede tomar una muestra aleatoria de las
empresas o fbricas, que representan conglomerados de trabajadores, y obtener la informacin de
los servicios mdicos que se les estn prestando.