Introducción Fundamentos 2022
Introducción Fundamentos 2022
Introducción Fundamentos 2022
Instituto de Matemáticas
Fundamentos de Estadística
Profesora:
Se puede definir la estadística como la ciencia de los “datos”, que generalmente son
obtenidos mediante la observación reiterada de un experimento de interés.
En 1662 John Graunt publicó información estadística acerca de los nacimientos y los
decesos.
Los hogares, los gobiernos y las empresas se apoyan mucho en datos estadísticos
para dirigir sus acciones.
Breve Historia
Por ejemplo, se reúnen datos de manera cuidadosa y con regularidad para
establecer las tasas de desempleo, las tasas de inflación, los índices del consumidor
y las tasas de nacimientos y muertes; en tanto que los líderes empresariales utilizan
los datos resultantes para tomar decisiones que afectan a futuras contrataciones, los
niveles de producción y la expansión hacia nuevos mercados.
Si al lanzar una moneda 15 veces se han obtenido solo 2 caras ¿se puede decir que
la moneda está trucada?
El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos,
sino sobre todo el proceso de interpretación de esa información.
𝐷𝑒𝑠𝑐𝑟𝑖𝑝𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Algunos
𝐴𝑛á𝑙𝑖𝑠𝑖𝑠 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
problemas que
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 𝑑𝑒 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠
resuelve la
𝑀𝑒𝑑𝑖𝑑𝑎𝑠 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠
estadística
𝐸𝑠𝑡𝑎𝑏𝑙𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠
Descripción de datos
Los estudios estadísticos, para poseer una cierta fiabilidad, deben basarse en la
recogida de muchos datos, cuantos más mejor?. Por ello, la Estadística dispone
de técnicas para
Es posible, con apoyo teórico mínimo, que los alumnos de estadística de primer
nivel puedan plantearse estimaciones elementales.
Contraste de hipótesis
¿Es el nuevo medicamento mejor que el anterior? ¿La duración de una bombilla es
superior a mil horas?.
Contraste de hipótesis
Consiste en plantear una hipótesis (llamada nula) frente a otra alternativa, recoger
datos representativos y comprobar si estos son consistentes con las hipótesis o no.
Requiere de una metodología
Por ejemplo, casi que ningún producto sale al entra en el mercado sin estudios
estadísticos que apoyen la hipótesis con que se promocionan.
Las técnicas usadas forman un cuerpo de teoría muy amplio llamado Estadística
Inferencial y Diseño de experimentos.
.
Medida de relaciones
En la Sociedad y la Naturaleza se pueden descubrir relaciones y paralelismos
que, en algunos casos, permiten representar mediante una fórmula una relación
entre dos o más variables.
Esta técnica también puede servir para completar datos perdidos o erróneos.
Planteamiento
del problema
Observación
Experimentación
Revisión
Literatura
Formulación
Elaboración
de hipótesis
de
conclusiones
La ciencia está, por lo tanto, todo el tiempo revisando sus teorías. La Estadística no
es un conjunto de diferentes técnicas aisladas unas de otras, sino que la Estadística,
en conjunto con el método científico, nos entrega un procedimiento analítico para
tomar decisiones.
El Método Estadístico
Para tener éxito en una investigación estadística debemos seguir los siguientes
etapas
Datos
Son las observaciones recolectadas (como mediciones, géneros, respuestas de
encuesta), se recogen, analizan y resumen para su presentación e interpretación.
A todos los datos reunidos para un determinado estudio se les llama conjunto de
datos para el estudio
Medio de
Años de Estrato Socio
Sexo Nivel de estudio comunicación Ingresos (S.M) Edad Estatura Peso (kg)
estudio Económico
preferido
F pregrado 16 prensa 1. 23 1.64 69 3
M bachiller 13 tv 1.5 23 1.65 50 4
M bachiller 12 radio 1. 23 1.60 53 3
M pregrado 18 prensa 2.5 51 1.57 70 3
M MEDIA-BASICA 10 tv 1. 19 1.77 68 2
M basica 6 tv 1. 23 1.64 67 3
M bachiller 14 prensa 1. 18 1.75 72 2
M basica 8 radio 1.5 24 1.78 78 2
M bachiller 12 radio 1 18 1.71 60 3
M bachiller 12 tv 1 20 1.65 40 2
Definiciones básicos de la estadística
Fuentes de datos:
• Registros rutinarios: Hospitales, registros contables,…
Variable
Es una característica de los elementos que es de interés. El conjunto de datos de la
tabla contiene las 10 variables
Elementos
son las entidades de las que se obtienen los datos. En el conjunto de datos de la tabla
los nombres de los elementos aparecen en la primera columna.
Turismo Minería Petróleo Ganadería Agricultura Textiles Flora Medic.
Para los propósitos del análisis estadístico la distinción entre datos transversales y
datos de series de tiempo es importante.
Los datos de la tabla son datos transversales porque describen las 9 variables en los
individuos en un mismo momento.
Definiciones básicos de la estadística
Los datos de series de tiempo son datos obtenidos a lo largo de varios periodos.
Economistas: tendencias
Definiciones básicos de la estadística
Pueden ser:
error de escritura, 24 años en lugar de 42 años, en una entrevista
malinterpretar la pregunta por parte del entrevistado y dar una respuesta
incorrecta.
Hay que tener sumo cuidado tanto al recolectar los datos como al registrarlos para
garantizar que no se cometan errores.
Definiciones básicos de la estadística
Estadística
Es una colección de métodos para planear experimentos, obtener datos, y después
organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas
en los datos.
Inferencia estadística
Empleo datos de una muestra para hacer estimaciones y probar hipótesis acerca de
las características de una población
.
Definiciones básicos de la estadística
Población o Universo
Conjunto finito o infinito de personas u objetos que presentan características
comunes que es objeto de estudio y se desea obtener información.
Si es muy grande, la observación de todos los elementos se dificulte
Para solucionar este inconveniente se utiliza una muestra estadística es el conjunto
completo de todos los elementos (puntuaciones, personas, mediciones, etcétera)
que se someten a estudio.
Ejemplos de poblaciones:
✓ alumnos matriculados en una universidad.
✓ habitantes de un país.
✓ coches hechos en una fabrica.
✓ ´arboles de un bosque
Definiciones básicos de la estadística
Existen causas que pueden hacer ventajoso el muestreo, como su costo reducido,
mayor rapidez y mayor exactitud. Pero, además, hay ocasiones en las que no queda
otra solución que la elección de una muestra debido principalmente a que:
Definiciones básicos de la estadística
➢ La población es tan grande que excede las posibilidades del investigador, tanto
económicas como limitaciones temporales (por ejemplo la población se destruye
antes de que se puedan investigar).
Ejemplo
Se quiere conocer el porcentaje de estudiantes universitarios en Colombia que
tienen acceso a internet.
La población es de más de 2’324.760 (2018-2) millones de estudiantess, y es obvio
que obtener información de toda la población supone un gran esfuerzo en varios
sentidos:
✓ tiempo necesario, y coste económico (se necesitaría contratar a muchos
encuestadores)
✓ dificultad de llegar a todos y cada uno de los estudiantes
Por tanto, debido a los motivos anteriores, será conveniente entrevistar a una cierta
parte de la población, una muestra, elegida convenientemente para poder extraer
después conclusiones a toda la población.
Definiciones básicos de la estadística
Ejemplo
Considérese ahora un estudio en el que interesa la duración media de una
determinada marca de pilas. En este caso la problemática es diferente al caso
anterior:
Para poder estudiar la duración de una pila, se deberá usar hasta que se gaste, lo
que nos impide volver a usar la pila.
Los datos muestrales deben reunirse de una forma adecuada, como a través de un
proceso de selección aleatoria.
Si los datos muestrales no se reúnen de forma adecuada, resultarán tan inútiles que
ningún grado de tortura estadística podrá salvarlos.
Pensamiento estadístico
Concepto clave
En esta sección se introducen los principios básicos del pensamiento
estadístico que se utilizarán a lo largo del curso. Ya sea que realicemos un
análisis estadístico con datos que hemos reunido, o que examinemos uno
realizado por alguien más, no debemos aceptar a ciegas los cálculos
matemáticos; es necesario tomar en cuenta los siguientes factores:
Concepto clave
Para aprender a pensar en términos estadísticos, suelen ser más
importantes el sentido común y las consideraciones prácticas que la
aplicación irreflexiva de fórmulas y cálculos.
Para analizar de forma adecuada unos datos debemos contar con alguna
información adicional, cual es el contexto
Las siguientes son preguntas fundamentales
➢ ¿Cuál es el contexto de los datos?
➢ ¿De qué fuente se obtuvieron?
➢ ¿Cómo se recabaron?
➢ ¿Qué se puede concluir a partir de la información?
Con base en conclusiones estadísticas,
➢ ¿qué implicaciones prácticas resultan del análisis?
Pensamiento estadístico
Contexto
Siempre tome en cuenta el contexto de los datos, ya que este determina el
análisis estadístico que debe emplearse.
Siempre tome en cuenta el contexto de los datos, ya que este determina el análisis
estadístico que debe emplearse.
No todos los estudios cuentan con fuentes sin sesgo como esta. Debemos
permanecer atentos y escépticos ante estudios que provienen de fuentes que
podrían estar sesgadas.
Pensamiento estadístico
Método de muestreo
Al reunir datos muestrales para un estudio, el método de muestreo que se
elija puede afectar de manera importante la validez de las conclusiones.
Conclusiones
Al obtener conclusiones a partir de un análisis estadístico, es necesario
hacer afirmaciones que sean claras para las personas sin conocimientos de
estadística y de su terminología. Se debe evitar de manera cuidadosa
realizar afirmaciones que no estén justificadas por el análisis estadístico
Implicaciones prácticas
Además de plantear conclusiones claras a partir del análisis estadístico,
también se debe identificar cualquier implicación práctica de los resultados.
Significancia estadística
La significancia estadística es un concepto que se utilizará con gran
frecuencia a lo largo de este libro.
Pensamiento estadístico
Tipos de datos
Es importante distinguir entre parámetro y estadístico. Los primeros son cantidades
constantes en cada situación, los segundos dependen de la muestra extraída.
Datos cuantitativos
Consisten en números que representan conteos o mediciones.
Otra forma común de clasificar los datos consiste en usar cuatro niveles de
medición: nominal, ordinal, de intervalo y de razón.
Escala de Intervalo:
Esta escala en contraste con la ordinal tiene diferencias precisas entre unidades de
medida, establece un orden en las posiciones relativas de los objetos o individuos,
la diferencia entre dos valores de datos cualesquiera tiene un significado.
Una escala de intervalo está caracterizada por una unidad de medida común y
constante que asigna un número real a todos los pares de objetos en un conjunto
ordenado
Sin embargo, los datos en este nivel no tienen un punto de partida inherente
(natural) desde cero, es relativo. Esto quiere decir que si en la medida de la variable
da cero no hay suficientes argumentos como para garantizar la ausencia del mismo.
Tipos de datos
Escala de Intervalo
Las medidas se sitúan en una escala de manera que se manifiesten las magnitudes
de las diferencias entre los objetos.
El cero es relativo, no hay un cero absoluto o real, el cero es arbitrario; por tanto no
se puede decir que 50°𝐹 es el doble de temperatura que 25°𝐹.
Tipos de datos
Escala de Razón:
Posee todas las características de la escala de intervalo las medidas se disponen
en una escala de modo que la posición a lo largo de la escala represente la
magnitud absoluta del atributo.
Para valores en este nivel, tanto las diferencias como las proporciones tienen
significado.
Tipos de datos
Escala de Razón:
Además de distinción, orden y distancia, ésta es una escala que permite establecer
en que proporción es mayor una categoría de una escala que otra.
El peso de un individuo 60kg es un 20% más pesado que uno que pese 50kg.
Escala de Razón:
Además de distinción, orden y distancia, ésta es una escala que permite establecer
en que proporción es mayor una categoría de una escala que otra.
El peso de un individuo 60kg es un 20% más pesado que uno que pese 50kg.
Niveles de medición
De razón: Hay un punto de partida cero natural y las Ejemplo: distancias
razones tienen significado.
De intervalo: Las diferencias tienen un significado, pero Ejemplo: temperaturas corporales en
no hay punto de partida cero natural, y las grados Fahrenheit o Celsius
razones no tienen significado.
Ordinal: Las categorías están ordenadas, pero no Ejemplo: las clasificaciones de las
hay diferencias o estas carecen de universidades en el U.S. News
significado
and World Report
Nominal: Solo categorías. Los datos no pueden Ejemplo: el color de los ojos
acomodarse en un esquema de orden
En esta sección se enseña a utilizar el sentido común para pensar de forma crítica
acerca de los datos y estadísticos. Está dedicada a los usos incorrectos de la
estadística
Afirmaciones como las siguientes se utilizan con frecuencia para describir el uso
inadecuado de la estadística.
➢ “La estadística se puede utilizar para apoyar lo que sea, sobre todo a los
especialistas en estadística”. —Franklin P. Jones
➢ “Existen dos tipos de datos estadísticos: los que se buscan y los que se
inventan”. -Rex Stout
Muestras pequeñas
67%, cuando se tiene 2 de 3 individuos, 200 individuos puede parecer
relativamente grande (subgrupos)
Pensamiento crítico
Correlación y causalidad
Otra forma de malinterpretar datos estadísticos consiste en encontrar una asociación
estadística entre dos variables y concluir que una de ellas causa (o afecta
directamente) a la otra variable
➢ Porcentajes
➢ Porcentaje de
➢ Orden de las preguntas
➢ Fracción porcentaje:
➢ Falta de respuesta
➢ Decimal porcentaje:
➢ ➢ Datos faltantes
➢ Porcentaje decimal
➢ Estudios para el propio beneficio
➢ Preguntas que inducen respuestas
➢ Números precisos
➢ Distorsiones deliberadas
Recolección de datos muestrales
Los métodos estadísticos se rigen por los datos recabados. Por lo regular,
obtenemos datos de dos fuentes distintas: los estudios observacionales y
los experimentos.
Sexo
Prensa Radio Tv
Varón 30 40 90
Mujer 25 35 75
Conceptos básicos de la estadística
Medio de
comunicación
Sexo k preferido j
Prensa Radio Tv
Varon 80 50 20
Superior
Mujer 65 55 35
Totales
Introducción
Bibliografia