Introducción Fundamentos 2022

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 85

Universidad de Antioquia

Instituto de Matemáticas

Fundamentos de Estadística
Profesora:

Luz Estela Sánchez Herrera


¿Qué es la Estadística?
Introducción

Se puede definir la estadística como la ciencia de los “datos”, que generalmente son
obtenidos mediante la observación reiterada de un experimento de interés.

En este sentido el término estadística se refiere a datos numéricos, tales como


promedios, medianas, porcentajes y números índices que ayudan a entender una
gran variedad de negocios y situaciones económicas.

El campo de la estadística es mucho más que datos numéricos. En un sentido amplio,


la estadística se define como el arte y la ciencia de reunir datos, analizarlos,
presentarlos e interpretarlos.
¿Qué es la Estadística?
Introducción

Es una colección de métodos para planear experimentos, obtener datos, y después


organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en
los datos.

La información obtenida al reunir datos, analizarlos, presentarlos e interpretarlos


proporciona herramientas para la toma mejores decisiones con base en mejor
información.
¿Qué es la Estadística?
Datos
Materia prima de la estadística. Son las observaciones recolectadas (como
mediciones, géneros, respuestas de encuesta).

Se puede decir que:


La estadística es la disciplina que se ocupa:
1) La recolección, organización, resumen y análisis de datos
2) La obtención de inferencias a partir de un volumen de datos cuando
se examina sólo una parte de estos
¿Por qué estudiar Estadística?

Algunas razones (estadísticamente significativas con un alto nivel de confianza)


para estudiar y disfrutar estudiando la Estadística:

Las estadísticas están por todos lados

La diversidad de problemas y hechos que se pueden estudiar y comprender


gracias a la Estadística

Nos da la capacidad de ser críticos y responsables

El conocimiento de Estadística y de análisis de datos es un valor en alza en el


mercado laboral. Las empresas y organismos tienen especial interés
en personas que “saben de números y de datos”.
Introducción
¿Por qué estudiar Estadística?

Nos da conocimientos para la toma de decisiones en la vida


diaria, grandes oportunidades laborales y una mayor
capacidad crítica de la compleja realidad social que nos
rodea
Breve Historia
El término estadística se deriva de la palabra latina status (que significa “estado”)

Los primeros usos de la estadística implicaron la recopilación de datos y la


elaboración de gráficas, para describir diversos aspectos de un estado o de un país.

En 1662 John Graunt publicó información estadística acerca de los nacimientos y los
decesos.

Al trabajo de Graunt siguieron estudios de tasas de mortalidad y de enfermedad,


tamaño de poblaciones, ingresos y tasas de desempleo.

Los hogares, los gobiernos y las empresas se apoyan mucho en datos estadísticos
para dirigir sus acciones.
Breve Historia
Por ejemplo, se reúnen datos de manera cuidadosa y con regularidad para
establecer las tasas de desempleo, las tasas de inflación, los índices del consumidor
y las tasas de nacimientos y muertes; en tanto que los líderes empresariales utilizan
los datos resultantes para tomar decisiones que afectan a futuras contrataciones, los
niveles de producción y la expansión hacia nuevos mercados.

Triola, Mario F., “Estadística”. México: Pearson, 2013, pag12


Breve Historia
La Estadística actual es el resultado de la unión de dos disciplinas que evolucionaron
independientemente hasta el siglo XIX:

✓ La recopilación de datos y elaboración de estadísticas es una actividad


antiquísima. Así, la Estadística o Ciencia del Estado, se remonta a la antigüedad y
surge del interés de los gobiernos por inventariar de una forma más o menos
regular la población y las riquezas existentes en su territorio.

✓ El cálculo de probabilidades constituye la segunda raíz de la Estadística


Moderna, incorporándose a partir del siglo XVII como un importante instrumento
de análisis para el estudio de fenómenos económicos y sociales y en general
para el estudio de fenómenos cuyas causas son demasiado complejas para su
posible análisis determinístico.
Breve Historia

✓ De la unión de estas disciplinas aparece la Estadística Inferencial que permite


obtener conclusiones generales (a una población) a partir de resultados
empíricos (muestra)
Estadística Descriptiva y Estadística Inferencial

La Estadística actual se compone de dos grandes ramas:

Estadística Descriptiva: son un conjunto de técnicas orientadas a extraer información


de un conjunto de datos. Para ello se utilizarán tablas, medidas estadísticas (media,
varianza,...) y procedimientos gráficos.

Estadística Inferencial: Su objetivo es obtener información sobre el modelo


probabilístico que subyace del experimento aleatorio del que se han obtenido los
datos.
Estadística Descriptiva y Estadística Inferencial

La Estadística actual se compone de dos grandes ramas:

Por ejemplo, la inferencia estadística aborda cuestiones como la que sigue:

Si al lanzar una moneda 15 veces se han obtenido solo 2 caras ¿se puede decir que
la moneda está trucada?

Esta materia se centrará en la Estadística Descriptiva también llamada


modernamente Análisis de Datos.
La Estadística como ciencia

La estadística actual es la confluencia de dos disciplinas que evolucionaron


independientemente (siglo XIX): el cálculo de probabilidades (S.XVII con la
teoría de juegos de azar) y la “estadística” o ciencia del “estado” que estudia
una serie de gráficos y cifras que contenían información del “estado” (del latín
Status) y es de raíces más antiguas

La estadística actúa como disciplina puente entre los modelos matemáticos y


fenómenos reales. Un modelo matemático es una abstracción simplificada de
una realidad más compleja, siempre existirá discrepancia entre lo observado y
lo previsto por el modelo.
La Estadística como ciencia
En nuestros días, la estadística se ha convertido en un método efectivo para
describir con exactitud los valores de los datos económicos, políticos, sociales,
psicológicos, epidemiológicos, biológicos y físicos, y sirve como herramienta para
relacionar y analizar dichos datos.

El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos,
sino sobre todo el proceso de interpretación de esa información.

El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las


aplicaciones de la estadística.
La Estadística como ciencia

Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando


determinadas distribuciones probabilísticas; los resultados de estas se pueden
utilizar para analizar datos estadísticos.

La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y


para predecir el tipo y la cantidad de datos necesarios en un determinado estudio
estadístico.
La Estadística como ciencia

Actualmente la Estadística es una rama de la Matemática Aplicada que


colecciona, clasifica y evalúa o analiza datos como base para inferencias o
conclusiones válidas, así como para tomar decisiones en base a ese análisis.
Algunos problemas que resuelve la estadística

𝐷𝑒𝑠𝑐𝑟𝑖𝑝𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Algunos
𝐴𝑛á𝑙𝑖𝑠𝑖𝑠 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
problemas que
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 𝑑𝑒 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
resuelve la
𝑀𝑒𝑑𝑖𝑑𝑎𝑠 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠
estadística
𝐸𝑠𝑡𝑎𝑏𝑙𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠
Descripción de datos
Los estudios estadísticos, para poseer una cierta fiabilidad, deben basarse en la
recogida de muchos datos, cuantos más mejor?. Por ello, la Estadística dispone
de técnicas para

• Recoger datos, lo más representativos posible


• Resumir datos en tablas ordenadas de frecuencias
• Representar gráficamente las tablas obtenidas
• Efectuar medidas representativas del conjunto recogido: Centrales, de
dispersión, asimetría y aplastamiento, correlaciones, etc.

Se suele llamar Estadística Descriptiva al estudio de estos aspectos. La


mayoría de los trabajos escolares de tipo estadístico se limitan a estos
aspectos.
Análisis de muestras
La recogida de datos no se debe efectuar sin un planteamiento previo. Las
técnicas que nos ayudan a elegir muestras representativas de las poblaciones
constituyen la Teoría del Muestreo.

A partir de lo observado en la muestra representativa hacemos inferencia de la


población

La operación fundamental del muestreo es hacer inferencia de la población


estimando los parámetros de la de ella. El conjunto de técnicas usadas es parte de
la Estadística Inferencial.

Es posible, con apoyo teórico mínimo, que los alumnos de estadística de primer
nivel puedan plantearse estimaciones elementales.
Contraste de hipótesis

En la actualidad, el Contraste de hipótesis, es la parte de la Estadística más usada


en todo tipo de investigaciones. Ningún trabajo de nivel universitario o profesional
se admite sin estar basado en un Diseño de Experimentos y en el uso de las
técnicas de Contraste de Hipótesis.

¿Ha mejorado el rendimiento de los estudiantes con el nuevo modelo de estudios?

¿Es el nuevo medicamento mejor que el anterior? ¿La duración de una bombilla es
superior a mil horas?.
Contraste de hipótesis
Consiste en plantear una hipótesis (llamada nula) frente a otra alternativa, recoger
datos representativos y comprobar si estos son consistentes con las hipótesis o no.
Requiere de una metodología

Por ejemplo, casi que ningún producto sale al entra en el mercado sin estudios
estadísticos que apoyen la hipótesis con que se promocionan.

Las técnicas usadas forman un cuerpo de teoría muy amplio llamado Estadística
Inferencial y Diseño de experimentos.
.
Medida de relaciones
En la Sociedad y la Naturaleza se pueden descubrir relaciones y paralelismos
que, en algunos casos, permiten representar mediante una fórmula una relación
entre dos o más variables.

Llamaremos Correlación al estudio de estas relaciones, por ejemplo,


(Sociedad) el nivel de estudios está correlacionado con los ingresos?
(Naturaleza) Las lluvias está correlacionadas con las cosechas?

Aunque el caso más frecuente es el de la comparación de dos variables, cada día


se emprenden más estudios en los que algunas variables se relacionan con varias
otras, llamadas explicativas.

Estos paralelismos no se deben confundir con relaciones


causa-efecto, que tienen tratamientos más profundos.
Establecimiento de predicciones

Los datos recogidos en un estudio pueden presentar tendencias o ciclos que


quizás nos permitan predecir qué va a ocurrir fuera del rango de datos obtenido.

Se puede intentar predecir qué va a ocurrir en el futuro, por ejemplo, lo que


constituiría una extrapolación, o bien en valores intermedios, y la llamaríamos
interpolación.

Esta técnica también puede servir para completar datos perdidos o erróneos.

En el establecimiento de las predicciones es fundamental conocer los márgenes


de error. Las técnicas consiguientes están recogidas en la Teoría de la
Regresión.
El Método Estadístico

Datos Información Conocimiento

Estadística Descriptiva Inferencia Estadística

El método estadístico es el procedimiento mediante el cual se sistematiza y


organiza este proceso de aprendizaje iterativo para convertir los datos en
información y esta en conocimiento
El Método Científico

Planteamiento
del problema
Observación

Experimentación

Revisión
Literatura
Formulación
Elaboración
de hipótesis
de
conclusiones

El método científico es: «un método o procedimiento que ha caracterizado a la


ciencia natural desde el siglo XVII, que consiste en la observación
sistemática, medición, experimentación, la formulación, análisis
y modificación de las hipótesis».
Etapas del Método Científico

Estadística y Método Científico


El método científico es un conjunto de principios y procedimientos para la búsqueda
sistemática del conocimiento. El método científico está compuesto por los siguientes
pasos:
1. Formula una teoría (problema).
2. Recoger datos para probar la teoría.
3. Analizar los datos.
4. Interpretar los resultados y tomar una decisión.

La ciencia está, por lo tanto, todo el tiempo revisando sus teorías. La Estadística no
es un conjunto de diferentes técnicas aisladas unas de otras, sino que la Estadística,
en conjunto con el método científico, nos entrega un procedimiento analítico para
tomar decisiones.
El Método Estadístico

Para tener éxito en una investigación estadística debemos seguir los siguientes
etapas

Formulación del problema: Especificación del problema y definición de los objetivos


de la investigación. Crear conceptos precisos, formular preguntas claras, imponer
límites teniendo en cuenta dinero y tiempo disponible.

La calidad de las conclusiones estadísticas depende de la corrección y precisión de


los datos.
El Método Estadístico

Diseño del experimento: el deseo es obtener un máximo de información con un


mínimo de error empleando un pequeñísimo dinero y tiempo.
Esto indica que debemos determinar el tamaño de la muestra o cantidad y tipos de
datos que resolverán el problema.

Es necesario saber si la investigación es controlada (ej., dosis de determinado


medicamento) u observacional (estudios de comportamiento)

Colección de datos y experimentación: o el muestreo. Se refiere al método usado


para la recolección de datos
El Método Estadístico
Presentación y análisis de resultados:
Los datos deben ser ordenados en forma legible y condesada como en diagramas
y gráficas, de manera que pueda ser publicada y entendible. Se deben calcular
medidas descriptivas básicas como promedios y desviaciones.

Inferencia y toma de decisiones:


este paso es la realización del objetivo de la investigación estadística. La
inferencia estadística se ocupa de formular y obtener conclusiones o establecer
generalizaciones acerca de la población
El Método Estadístico
En resumen se necesita:

• Definición del problema de estudio y objetivos del mismo.


• Selección de la información necesaria para realizar el estudio.
• Recogida de la información que va a depender del presupuesto con el que
contemos y de la calidad de los datos exigida.
• Ordenación y clasificación de la información en tablas y gráficos.
• Resumen de los datos mediante medidas de posición, dispersión, asimetría y
concentración.
• Análisis estadístico formal obteniendo hipótesis y contrastándolas.
• Interpretación de resultados y extracción de conclusiones.
• Extrapolación y predicción.
Método Científico vrs Método Estadístico
MÉTODO CIENTÍFICO MÉTODO ESTADÍSTICO
• Método o conjunto sistemático de • Es una adaptación del método científico a un
procesos en los que se basa la ciencia área del conocimiento, aportando un
para explicar cualquier fenómeno y las elemento muy importante que es la
layes que lo administran planificación de la investigación

• Es el conjunto de procedimientos de la • Es proceso de obtención, representación,


ciencia e instrumentos de la simplificación, análisis, interpretación y
investigación científica, que construye proyección de las características, variables o
el camino reflexivo, sistemático, valores numéricos de un estudio o de un
controlado y crítico para la adquisición proyecto de investigación para una mejor
y perfeccionamiento del conocimiento comprensión de la realidad y una
optimización en la toma de decisiones

• Sigue las interrogantes: Observación, • Es una herramienta poderosa de precisión


preguntas, hipótesis, experimentación, científica en la medida en la que se combine
conclusiones, documentación, con los métodos cualitativos y se emplee de
descubrimientos, nuevas preguntas y acuerdo a las necesidades y al sano criterio
seguir aprendiendo
Método Científico vrs Método Estadístico
MÉTODO CIENTÍFICO MÉTODO ESTADÍSTICO
• El método científico consiste en la • Proporciona las técnicas necesarias para
observación sistemática, medición y recolectar y analizar información requerida.
experimentación, y la formulación, Podríamos distinguir una fase de planificación
análisis y modificación de la hipótesis y otra de ejecución

• Ayuda a organizar adecuadamente la • El Método estadístico comprende los


información de los fenómenos y a siguientes pasos: Recuento, relevantamiento
determinar las leyes que lo rigen o compilación de datos. Tabulación y
agrupamiento de datos. Representación
gráfica. Medición de datos inferencia
estadística. Predicción

• El método científico es el estudio • El Método estadístico consiste en una


sistemático, controlado, empírico y secuencia de procedimientos para el manejo
crítico de proposiciones hipotéticas de los datos cualitativos y cuantitativos de la
acerca de presuntas relaciones de investigación
varios fenómenos
Definiciones básicos de la estadística

Datos
Son las observaciones recolectadas (como mediciones, géneros, respuestas de
encuesta), se recogen, analizan y resumen para su presentación e interpretación.

A todos los datos reunidos para un determinado estudio se les llama conjunto de
datos para el estudio
Medio de
Años de Estrato Socio
Sexo Nivel de estudio comunicación Ingresos (S.M) Edad Estatura Peso (kg)
estudio Económico
preferido
F pregrado 16 prensa 1. 23 1.64 69 3
M bachiller 13 tv 1.5 23 1.65 50 4
M bachiller 12 radio 1. 23 1.60 53 3
M pregrado 18 prensa 2.5 51 1.57 70 3
M MEDIA-BASICA 10 tv 1. 19 1.77 68 2
M basica 6 tv 1. 23 1.64 67 3
M bachiller 14 prensa 1. 18 1.75 72 2
M basica 8 radio 1.5 24 1.78 78 2
M bachiller 12 radio 1 18 1.71 60 3
M bachiller 12 tv 1 20 1.65 40 2
Definiciones básicos de la estadística

Fuentes de datos:
• Registros rutinarios: Hospitales, registros contables,…

• Encuestas: Si no hay registros almacenados

• Experimentación: Resultados de un diseño

• Fuentes Externas: Publicaciones de Instituciones

Algunas veces no se pueden obtener de las fuentes existentes

Datos obtenidos de la realización un estudio estadístico, se


clasifican como experimentales u observacionales
Definiciones básicos de la estadística

Variable
Es una característica de los elementos que es de interés. El conjunto de datos de la
tabla contiene las 10 variables

Sexo Ingresos (S.M)


Nivel de estudio Edad
Años de estudio Estatura
Medio de comunicación Peso (kg)
preferido Estrato Socio Económico
Definiciones básicos de la estadística

Elementos
son las entidades de las que se obtienen los datos. En el conjunto de datos de la tabla
los nombres de los elementos aparecen en la primera columna.
Turismo Minería Petróleo Ganadería Agricultura Textiles Flora Medic.

Colombia 4,63 19,28 2,42 5,43 8,74 15,33 10,88 11,09

Brasil 13,02 14,85 11,82 2,93 9,34 10,95 18,66 1,17

Ecuador 6,96 7,39 9,59 1,51 3,95 15,71 9,88 9,59


Paraguay 3,39 3,85 6,47 6,54 19,44 9,78 0,04 12,98

Uruguay 1,03 0,45 8,26 18,16 15,13 9,34 11,08 1,69

Argentina 8,62 16,63 12,26 9,42 15,38 5,34 12,89 0,08

Bolivia 17,31 15,42 5,63 12,94 9,91 12,83 15,58 12,15

Venezuela 4,31 18,29 7,23 0,05 13,97 1,66 3,96 12,69

Perú 3,67 7,97 10,65 17,94 11,62 14,6 17,25 2,3

Surinam 7,16 8,67 6,24 12,4 11,12 2,51 13,69 8,85

Guayana 13,5 0,49 6,58 15,23 11,82 12,19 18,61 17,99


Definiciones básicos de la estadística

En los estudios estadísticos de una cierta variable 𝑋 será necesario obtener


información de dicha variable en la población de estudio.

La información que interesa obtener de la población suele ser algún “resumen” de 𝑋 :

valor medio de 𝑋 (peso medio, salario medio,...),


proporción de unidades que poseen un cierto atributo
(proporción de fumadores, proporción de personas con acceso a internet,...)
Definiciones básicos de la estadística

Datos de sección transversal y de series de tiempo

Para los propósitos del análisis estadístico la distinción entre datos transversales y
datos de series de tiempo es importante.

Datos de sección transversal son los obtenidos en el mismo o aproximadamente el


mismo momento (punto en el tiempo).

Los datos de la tabla son datos transversales porque describen las 9 variables en los
individuos en un mismo momento.
Definiciones básicos de la estadística

Datos de sección transversal y de series de tiempo

Los datos de series de tiempo son datos obtenidos a lo largo de varios periodos.

Economistas: tendencias
Definiciones básicos de la estadística

Errores en la adquisición de datos


Usar datos erróneos es peor que no usar ningún dato.
Error: el dato obtenido no es igual al verdadero valor

Pueden ser:
error de escritura, 24 años en lugar de 42 años, en una entrevista
malinterpretar la pregunta por parte del entrevistado y dar una respuesta
incorrecta.

Hay que tener sumo cuidado tanto al recolectar los datos como al registrarlos para
garantizar que no se cometan errores.
Definiciones básicos de la estadística

Errores en la adquisición de datos

Hay que verificar la consistencia interna de los datos

Un entrevistado con 24 años no puede tener 20 años de experiencia en el


trabajo

Revisar datos que tengan valores inusualmente grande o pequeños, llamados


observaciones atípicas, que son candidatos a posibles errores en los datos.
Definiciones básicos de la estadística

Estadística
Es una colección de métodos para planear experimentos, obtener datos, y después
organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas
en los datos.

Inferencia estadística
Empleo datos de una muestra para hacer estimaciones y probar hipótesis acerca de
las características de una población

.
Definiciones básicos de la estadística

Población o Universo
Conjunto finito o infinito de personas u objetos que presentan características
comunes que es objeto de estudio y se desea obtener información.
Si es muy grande, la observación de todos los elementos se dificulte
Para solucionar este inconveniente se utiliza una muestra estadística es el conjunto
completo de todos los elementos (puntuaciones, personas, mediciones, etcétera)
que se someten a estudio.
Ejemplos de poblaciones:
✓ alumnos matriculados en una universidad.

✓ habitantes de un país.
✓ coches hechos en una fabrica.

✓ ´arboles de un bosque
Definiciones básicos de la estadística

Censo es el conjunto de datos de cada uno de los miembros de la población.

Muestra es un subconjunto de miembros seleccionados de una población


El tamaño que ha de tener la muestra depende de que tan homogénea o
heterogénea sea la población

Motivos para la realización de un muestreo


Es evidente que la inferencia siempre supone un riesgo, por lo que cabria
preguntarse las razones de la amplia utilización de las “muestras” frente a la
“seguridad” que supone un censo.

Existen causas que pueden hacer ventajoso el muestreo, como su costo reducido,
mayor rapidez y mayor exactitud. Pero, además, hay ocasiones en las que no queda
otra solución que la elección de una muestra debido principalmente a que:
Definiciones básicos de la estadística

➢ La población es tan grande que excede las posibilidades del investigador, tanto
económicas como limitaciones temporales (por ejemplo la población se destruye
antes de que se puedan investigar).

➢ La población es suficientemente homogénea como para que cualquier muestra


de una buena representación.

➢ El proceso de medida o investigación es destructivo, como ocurre al consumir un


cierto articulo para juzgar su calidad.
Conceptos básicos de la estadística

Por ejemplo, un sondeo de Gallup preguntó a 1087 adultos: “¿Consume bebidas


alcohólicas como licor, vino o cerveza o es abstemio?”. Los 1087 sujetos de la
encuesta constituyen una muestra mientras que la población consiste en el conjunto
de los 202,682,345 estadounidenses adultos.
Definiciones básicos de la estadística

Ejemplo
Se quiere conocer el porcentaje de estudiantes universitarios en Colombia que
tienen acceso a internet.
La población es de más de 2’324.760 (2018-2) millones de estudiantess, y es obvio
que obtener información de toda la población supone un gran esfuerzo en varios
sentidos:
✓ tiempo necesario, y coste económico (se necesitaría contratar a muchos
encuestadores)
✓ dificultad de llegar a todos y cada uno de los estudiantes

Por tanto, debido a los motivos anteriores, será conveniente entrevistar a una cierta
parte de la población, una muestra, elegida convenientemente para poder extraer
después conclusiones a toda la población.
Definiciones básicos de la estadística

Ejemplo
Considérese ahora un estudio en el que interesa la duración media de una
determinada marca de pilas. En este caso la problemática es diferente al caso
anterior:

Para poder estudiar la duración de una pila, se deberá usar hasta que se gaste, lo
que nos impide volver a usar la pila.

Es decir, de alguna manera se “destruye” este elemento de la población.


Si se quisiese probar todas y cada una de las pilas, nos quedaríamos sin ellas.
En este caso, de nuevo será conveniente estudiar sólo un conjunto de esas pilas y
luego extraer conclusiones más generales a partir del conjunto que hemos estudiado
Definiciones básicos de la estadística

Un objetivo importante de estadística inferenciar es demostrar cómo usar los datos


muestrales para obtener conclusiones sobre poblaciones.

Es sumamente importante obtener datos muestrales que sean representativos de la


población de la que se obtienen.

Nos enfocaremos en los siguientes conceptos clave:

Los datos muestrales deben reunirse de una forma adecuada, como a través de un
proceso de selección aleatoria.

Si los datos muestrales no se reúnen de forma adecuada, resultarán tan inútiles que
ningún grado de tortura estadística podrá salvarlos.
Pensamiento estadístico

Concepto clave
En esta sección se introducen los principios básicos del pensamiento
estadístico que se utilizarán a lo largo del curso. Ya sea que realicemos un
análisis estadístico con datos que hemos reunido, o que examinemos uno
realizado por alguien más, no debemos aceptar a ciegas los cálculos
matemáticos; es necesario tomar en cuenta los siguientes factores:

➢ Contexto de los datos


➢ Fuente de los datos
➢ Método de muestreo.
➢ Conclusiones
➢ Implicaciones prácticas
Pensamiento estadístico

Concepto clave
Para aprender a pensar en términos estadísticos, suelen ser más
importantes el sentido común y las consideraciones prácticas que la
aplicación irreflexiva de fórmulas y cálculos.
Para analizar de forma adecuada unos datos debemos contar con alguna
información adicional, cual es el contexto
Las siguientes son preguntas fundamentales
➢ ¿Cuál es el contexto de los datos?
➢ ¿De qué fuente se obtuvieron?
➢ ¿Cómo se recabaron?
➢ ¿Qué se puede concluir a partir de la información?
Con base en conclusiones estadísticas,
➢ ¿qué implicaciones prácticas resultan del análisis?
Pensamiento estadístico

Contexto
Siempre tome en cuenta el contexto de los datos, ya que este determina el
análisis estadístico que debe emplearse.

Siempre tome en cuenta el contexto de los datos, ya que este determina el análisis
estadístico que debe emplearse.

Fuente de los datos


Es necesario considerar la fuente de los datos y tomar en cuenta si esa
fuente es objetiva o si existe alguna razón para pensar que está sesgada.

No todos los estudios cuentan con fuentes sin sesgo como esta. Debemos
permanecer atentos y escépticos ante estudios que provienen de fuentes que
podrían estar sesgadas.
Pensamiento estadístico

Método de muestreo
Al reunir datos muestrales para un estudio, el método de muestreo que se
elija puede afectar de manera importante la validez de las conclusiones.

En las secciones posterioress analizaremos los métodos de muestreo con mayor


detalle.
Debemos señalar que las muestras de respuesta voluntaria (o autoseleccionadas)
a menudo están sesgadas, ya que es más probable que los individuos que tienen un
interés especial en el tema decidan participar en el estudio.
En una muestra de respuesta voluntaria, los propios sujetos deciden participar.
Es posible utilizar métodos estadísticos válidos para analizar muestras de
respuesta voluntaria, aunque los resultados no son necesariamente válidos
Pensamiento estadístico

Conclusiones
Al obtener conclusiones a partir de un análisis estadístico, es necesario
hacer afirmaciones que sean claras para las personas sin conocimientos de
estadística y de su terminología. Se debe evitar de manera cuidadosa
realizar afirmaciones que no estén justificadas por el análisis estadístico

Implicaciones prácticas
Además de plantear conclusiones claras a partir del análisis estadístico,
también se debe identificar cualquier implicación práctica de los resultados.

Significancia estadística
La significancia estadística es un concepto que se utilizará con gran
frecuencia a lo largo de este libro.
Pensamiento estadístico

La significancia estadística de un estudio difiere de su significancia práctica.


Es posible que, con base en los datos muestrales disponibles, se utilicen
métodos estadísticos para llegar a la conclusión de que algún tratamiento o
hallazgo es eficaz, aunque el sentido común sugiera que no hay una
diferencia suficiente debida al tratamiento para justificar que su uso sea
práctico.
Pensamiento estadístico

¿Qué es el pensamiento estadístico?


En general, los especialistas en estadística coinciden en que el pensamiento
estadístico es bueno, aunque existen diferentes perspectivas sobre lo que realmente
es un pensamiento estadístico.

En esta sección describimos el pensamiento estadístico en términos de la capacidad


para observar el panorama, para tomar en cuenta factores relevantes como el
contexto, la fuente de los datos y el método de muestreo, y también para obtener
conclusiones e identificar implicaciones prácticas.

El pensamiento estadístico incluye el pensamiento crítico y la capacidad de interpretar


los resultados.
Pensamiento estadístico

¿Qué es el pensamiento estadístico?

También podría implicar el hecho de determinar si los resultados son estadísticamente


significativos.

El pensamiento estadístico va mucho más allá de la simple capacidad de ejecutar


cálculos complejos.

A través de numerosos ejemplos, ejercicios y análisis, este libro le ayudará a


desarrollar las habilidades de pensamiento estadístico que son tan importantes en el
mundo actual.
Tipos de datos

Tipos de datos
Es importante distinguir entre parámetro y estadístico. Los primeros son cantidades
constantes en cada situación, los segundos dependen de la muestra extraída.

Estadístico: es cualquier función de las variables aleatorias que constituyen una


muestra extraída de la población.
Tipos de datos

Datos cuantitativos
Consisten en números que representan conteos o mediciones.

Edad, peso, estatura, gastos, kilómetros recorridos, # de hijos


Datos discretos
Resultan cuando el número de posibles valores es un número finito,
o bien, un número que puede contarse. Suelen tomar valores enteros (1, 2, 8, -
4, etc.). Existe separación o interrupción.
Datos continuos (numéricos)
Resultan de un infinito de posibles valores que pueden asociarse a puntos de
alguna escala continua, cubriendo un rango de valores
sin huecos ni interrupciones. Pueden tomar cualquier valor dentro de un
intervalo continuo
Tipos de datos

Datos cualitativos (o categóricos o de atributo)

Se dividen en diferentes categorías que se distinguen por alguna característica no


numérica, no se pueden medir numéricamente

Nivel de estudios, género, religión, raza, estrato socioeconómico, nacionalidad,


color de la piel

Otra forma común de clasificar los datos consiste en usar cuatro niveles de
medición: nominal, ordinal, de intervalo y de razón.

Cuando se aplica la estadística a problemas reales, el nivel de medición de los


datos es un factor importante para determinar el procedimiento
a utilizar
Tipos de datos

Datos cualitativos (o categóricos o de atributo)


Nivel de medición nominal son los datos consistentes exclusivamente en
nombres, etiquetas o categorías, cuyos valores solo poseen la propiedad de
identidad
𝑎 = 𝑎, 𝑎≠𝑎

Nivel de medición ordinal cuando pueden acomodarse en algún orden, aunque


no es posible determinar diferencias entre los valores de los datos o tales
diferencias carecen de significado, se puede establecer una jerarquía entre los
valores, existe transitividad entre los valores
𝑎 < 𝑏, ⋀ 𝑏<𝑐 ⇒ 𝑎<𝑐
Tipos de datos

Escala de Intervalo:
Esta escala en contraste con la ordinal tiene diferencias precisas entre unidades de
medida, establece un orden en las posiciones relativas de los objetos o individuos,
la diferencia entre dos valores de datos cualesquiera tiene un significado.

Una escala de intervalo está caracterizada por una unidad de medida común y
constante que asigna un número real a todos los pares de objetos en un conjunto
ordenado

Sin embargo, los datos en este nivel no tienen un punto de partida inherente
(natural) desde cero, es relativo. Esto quiere decir que si en la medida de la variable
da cero no hay suficientes argumentos como para garantizar la ausencia del mismo.
Tipos de datos

Escala de Intervalo
Las medidas se sitúan en una escala de manera que se manifiesten las magnitudes
de las diferencias entre los objetos.

Una temperatura de grados 0°Celsius no quiere decir que hay ausencia de


temperatura

Un coeficiente intelectual de 0 no quiere decir ausencia de inteligencia

El cero es relativo, no hay un cero absoluto o real, el cero es arbitrario; por tanto no
se puede decir que 50°𝐹 es el doble de temperatura que 25°𝐹.
Tipos de datos

Escala de Razón:
Posee todas las características de la escala de intervalo las medidas se disponen
en una escala de modo que la posición a lo largo de la escala represente la
magnitud absoluta del atributo.

Tiene la propiedad adicional de que sí tiene un punto de partida o cero inherente


(donde cero indica que nada de la cantidad está presente).

Para valores en este nivel, tanto las diferencias como las proporciones tienen
significado.
Tipos de datos

Escala de Razón:
Además de distinción, orden y distancia, ésta es una escala que permite establecer
en que proporción es mayor una categoría de una escala que otra.

El peso de un individuo 60kg es un 20% más pesado que uno que pese 50kg.

El cero absoluto o natural representa la nulidad de lo que se estudia lo tanto existen


razones verdaderas entre diferentes unidades de medida
Tipos de datos

Escala de Razón:
Además de distinción, orden y distancia, ésta es una escala que permite establecer
en que proporción es mayor una categoría de una escala que otra.

El peso de un individuo 60kg es un 20% más pesado que uno que pese 50kg.

El cero absoluto o natural representa la nulidad de lo que se estudia lo tanto existen


razones verdaderas entre diferentes unidades de medida
Tipos de datos

Niveles de medición
De razón: Hay un punto de partida cero natural y las Ejemplo: distancias
razones tienen significado.
De intervalo: Las diferencias tienen un significado, pero Ejemplo: temperaturas corporales en
no hay punto de partida cero natural, y las grados Fahrenheit o Celsius
razones no tienen significado.
Ordinal: Las categorías están ordenadas, pero no Ejemplo: las clasificaciones de las
hay diferencias o estas carecen de universidades en el U.S. News
significado
and World Report
Nominal: Solo categorías. Los datos no pueden Ejemplo: el color de los ojos
acomodarse en un esquema de orden

Sugerencia: Considere las cantidades en que una es el doble de


la otra, y pregunte si “dos veces” sirve para describirlas
correctamente. De ser así, se aplica el nivel de razón
Pensamiento crítico

En esta sección se enseña a utilizar el sentido común para pensar de forma crítica
acerca de los datos y estadísticos. Está dedicada a los usos incorrectos de la
estadística
Afirmaciones como las siguientes se utilizan con frecuencia para describir el uso
inadecuado de la estadística.

➢ “Existen tres clases de mentiras: mentiras, viles mentiras y estadísticas”. -


Benjamin Disraeli

➢ “Las cifras no mienten, los mentirosos suponen”. -Atribuida a Mark Twain

➢ “Algunas personas usan la estadística como un borracho utiliza los postes de


alumbrado: como apoyo más que como iluminación”. -Historiador Andrew Lang
Pensamiento crítico

➢ “La estadística se puede utilizar para apoyar lo que sea, sobre todo a los
especialistas en estadística”. —Franklin P. Jones

➢ Definición de un especialista en estadística: “Un especialista que reúne cifras y


luego hace que se extravíen”. -Esar’s Comic Dictionary

➢ “Existen dos tipos de datos estadísticos: los que se buscan y los que se
inventan”. -Rex Stout

➢ “El 58.6% de los datos estadísticos se inventan en el momento”. —Anónimo


Pensamiento crítico

Por lo general, existen dos situaciones en que la ciencia de la estadística se utiliza


como fuente de engaño:

1. el intento malintencionado por parte de individuos deshonestos

2. errores no intencionales por parte de personas que no saben mucho


Pensamiento crítico

Gráficas y su uso inadecuado


Pensamiento crítico

Muestras erróneas Algunas muestras son erróneas en el sentido de que el método


empleado para recabar los datos arruina la muestra, de modo que es posible que
esta se encuentre sesgada, es decir, que no sea representativa de la población de
la que se obtuvo.

Muestra de respuesta voluntaria (o muestra autoseleccionada)


es aquella a la que los propios sujetos deciden incorporarse.
Opiniones en los noticieros

Muestras pequeñas
67%, cuando se tiene 2 de 3 individuos, 200 individuos puede parecer
relativamente grande (subgrupos)
Pensamiento crítico

Correlación y causalidad
Otra forma de malinterpretar datos estadísticos consiste en encontrar una asociación
estadística entre dos variables y concluir que una de ellas causa (o afecta
directamente) a la otra variable

Resultados reportados Cuando se obtienen datos de personas, es mejor tomar las


medidas en lugar de pedir a los sujetos que reporten resultados.
Peso
Estatura
Ingresos (Las personas tienden a mentir)
Pensamiento crítico

➢ Porcentajes

➢ Porcentaje de
➢ Orden de las preguntas
➢ Fracción porcentaje:
➢ Falta de respuesta
➢ Decimal porcentaje:
➢ ➢ Datos faltantes
➢ Porcentaje decimal
➢ Estudios para el propio beneficio
➢ Preguntas que inducen respuestas
➢ Números precisos

➢ Distorsiones deliberadas
Recolección de datos muestrales

Los métodos que se analizan en esta sección son importantes, ya que el


método que se utiliza para reunir datos muestrales redunda en la calidad
del análisis estadístico.

El concepto de una muestra aleatoria simple es especialmente importante,


ya que ¿en esta sección y en el resto del libro se utiliza esa forma de
muestreo.
Recolección de datos muestrales

Los métodos que se analizan en esta sección son importantes, ya que el


método que se utiliza para reunir datos muestrales redunda en la calidad
del análisis estadístico.

El concepto de una muestra aleatoria simple es de vital importancia, ya


que es la forma de muestreo que utilizaremos.

En semestre más avanzado se verá un curso de Muetreo


Recolección de datos muestrales

Fundamentos de la recolección de datos

Los métodos estadísticos se rigen por los datos recabados. Por lo regular,
obtenemos datos de dos fuentes distintas: los estudios observacionales y
los experimentos.

En un estudio observacional, vemos y medimos características específicas,


pero no intentamos modificar a los sujetos que estamos estudiando.

En un experimento aplicamos algunos tratamientos y luego procedemos a


observar sus efectos sobrelos sujetos. (En los experimentos, los sujetos se
denominan unidades experimentales).
.
Recolección de datos muestrales

Una muestra aleatoria simple de n sujetos se selecciona de manera que


cada posible muestra del mismo tamaño n tenga la misma posibilidad de
ser elegida

Una muestra probabilística implica seleccionar a miembros de una población


de forma que cada miembro tenga una posibilidad conocida (aunque no
necesariamente la misma) de ser elegido.

En el muestreo sistemático, elegimos algún punto de partida y luego seleccionamos


cada k-ésimo (por ejemplo, cada quincuagésimo) elemento en la población.

En el muestreo de conveniencia, simplemente se utilizan resultados que sean


muy fáciles de obtener.
Recolección de datos muestrales

En el muestreo estratificado subdividimos a la población en al menos dos


subgrupos (o estratos) diferentes, de manera que los sujetos que pertenecen al
mismo subgrupo compartan las mismas características (como el género o la
categoría de edad), y luego obtenemos una muestra de cada subgrupo (o estrato).

En el muestreo por conglomerados primero dividimos el área de la población en


secciones (o conglomerados), luego elegimos al azar algunos de estos
conglomerados, y después elegimos a todos los miembros de los conglomerados
seleccionados.

Muestreo de etapas múltiples Los encuestadores profesionales y los investigadores


gubernamentales a menudo recolectan datos utilizando cierta combinación de los
métodos básicos de muestreo. Un diseño de muestreo de etapas múltiples implica
la selección de una muestra en diferentes pasos, los cuales suelen incluir distintos
procedimientos de muestreo.
Recolección de datos muestrales

En un estudio transversal, los datos se observan, miden y reúnen en un solo


momento.de muestreo.

En un estudio retrospectivo (o de control de caso), los datos se toman del pasado


(mediante el examen de registros, entrevistas y otros recursos).

En un estudio prospectivo (o longitudinal o de cohorte), los datos se reunirán


en el futuro y se toman de grupos (llamados cohortes) que comparten factores
comunes.
Conceptos básicos de la estadística

Turismo Minería Petróleo Ganadería Agricultura Textiles Flora Medic.

Colombia 4,63 19,28 2,42 5,43 8,74 15,33 10,88 11,09

Brasil 13,02 14,85 11,82 2,93 9,34 10,95 18,66 1,17

Ecuador 6,96 7,39 9,59 1,51 3,95 15,71 9,88 9,59

Paraguay 3,39 3,85 6,47 6,54 19,44 9,78 0,04 12,98

Uruguay 1,03 0,45 8,26 18,16 15,13 9,34 11,08 1,69

Argentina 8,62 16,63 12,26 9,42 15,38 5,34 12,89 0,08

Bolivia 17,31 15,42 5,63 12,94 9,91 12,83 15,58 12,15

Venezuela 4,31 18,29 7,23 0,05 13,97 1,66 3,96 12,69

Perú 3,67 7,97 10,65 17,94 11,62 14,6 17,25 2,3

Surinam 7,16 8,67 6,24 12,4 11,12 2,51 13,69 8,85

Guayana 13,5 0,49 6,58 15,23 11,82 12,19 18,61 17,99


Conceptos básicos de la estadística

Ciud Arm Barran Bogota Bucar Bnavtra Cali Cartag Cucuta


Arm 0 1098 286 725 235 194 974 935
Barran 1098 0 1302 739 1116 1212 124 926
Bogota 286 1302 0 439 519 484 1178 649
Bucar 725 739 439 0 937 923 917 210
Bnavtr 235 1116 519 937 0 129 1154 1138
a
Cali 194 1212 484 923 129 0 1088 1133
Cartag 974 124 1178 917 1154 1088 0 1050
Cucuta 935 926 649 210 1138 1133 1050 0
Conceptos básicos de la estadística

Medio de comunicación preferido

Sexo

Prensa Radio Tv

Varón 30 40 90

Mujer 25 35 75
Conceptos básicos de la estadística

Medio de
comunicación
Sexo k preferido j
Prensa Radio Tv

Nivel de Media- Varon 30 40 90


Estudios Básica
i Mujer 25 35 75

Varon 80 50 20
Superior
Mujer 65 55 35

Totales
Introducción
Bibliografia

Peña Sánchez de Rivera, Daniel. “Estadística Modelos y Métodos“. Madrid: Ed.


Alianza Eeitorial, 2000.

Velasco-Sotomayor, G. Wisniewski, P.M. “Probabilidad y Estadística para


Ingeniería y Ciencias“. México: Thomson Learning, 2001.

López-Kleine, L., “Bioestadística” Bogotá: Universidad Nacional de Colombia,


2012

Triola, Mario F., “Estadística”. México: Pearson, 2012

También podría gustarte