Proyecto Estadísitica

PROYECTO ESTADÍSITICA
Ana Sofia Arenas Gil, ana.arenas211@tau.usbmed.edu.co

Camila Metaute Correa, camila.metaute211@tau.usbmed.edu.co
Asignatura: Probabilidad y estadística
Asesor: Carlos Gaviria
Universidad de San Buenaventura

Facultad de ingenierías (Medellín)
Ingeniería Ambiental
Medellín, Colombia.
2022.
ÍNDICE
Tabla de contenido
No se encontraron entradas de tabla de contenido.
I. RESUMEN
Hoy en día se realizan gran cantidad de prácticas de producción agroindustrial que emiten
material particulado fino que contribuye a la formación de aerosoles atmosféricos. Para
evaluar el impacto de estas emisiones se monitorea la calidad del aire con estaciones para la
medición de material particulado 10 y 2.5. Este proyecto presenta un método para el uso de
sensores remotos, específicamente sensores terra aqua del satélite modis, el cual arroja gran
diversidad de datos de impacto ambiental, sin embargo esta investigación se enfocará en la
profundidad óptica de aerosoles. Se relacionan la emisión de partículas con las imágenes de
reflectividad. Las imágenes obtenidas se utilizan para generar series de tiempo de
concentración de PM 2.5 que son comparadas con los datos generados en las estaciones de
la red de calidad del aire. Es necesario aclara que toso estes estudio se realiza en la ciudad
de Medellín tomando la estación 12.0 de tráfico centro, por lo tanto solo se hablara de los
datos de pm2.5 que arroja esta estación de monitoreo, así mismo las imágenes que arroja el
satélite modis serán las que evalúe en esta zona. para esto se han escogido dos variables de
las cuales se hablará más adelante, con estas trabajaremos los conceptos estadísticos vistos,
como la población, el objeto, la muestra, el experimento aleatorio, tablas de frecuencias,
diagramas y muchos más conceptos importantes para el entendimiento de este.
II. INTRODUCCIÓN
Es común que cualquier persona con algún interés en los impactos ambientales haya notado
los drásticos cambios climáticos, la contaminación del aire, agua, biota, etc. Se puede
evidenciar que la contaminación atmosférica se ha constituido como una de las mayores
problemáticas ambientales, ocupando el tercer lugar en representación de costos
ambientales y sociales después de la contaminación en el agua y los desastres naturales [1].
Por esta razón surge la necesidad de implementar mecanismos para estimar la
concentración de algunos contaminantes presentes en la atmosfera. En Medellín han
implementado un mecanismo de alerta que consiste en ubicar estaciones de monitoreo en
lugares estratégicos del valle de Aburrá, monitoreando así las concentraciones de material
particulado, con un enfoque en el PM 2.5 ya que es el más nocivo para la salud. Con la
información que generan estas estaciones se podrá enriquecer la gestión de estas entidades
en materia de calidad del aire, fortaleciendo las investigaciones relacionadas al
conocimiento de las condiciones que generan episodios críticos, así como la toma de
decisiones en esa materia. [2]
Es por esto que además de tener en cuenta estas estaciones de monitoreo, es necesario
implementar mecanismos que ayuden a tener una mejor estimación de la contaminación,
por esta razón en este proyecto se tiene en cuenta la imagen satelital que entrega el satélite
modis. Este sensoramiento remoto permite obtener información de cualquier objeto sin
tener contacto directo, al aplicar modelos matemáticos a las imágenes satelitales se obtuvo
información correspondiente al material particulado disperso en la zona de interés, con lo
que se determinan las variaciones espaciales de las zonas con mayor presencia de emisión
de partículas PM 2.5 micrómetros (μm) en la zona de interés que es tráfico centro en la
ciudad de Medellín. Haciendo uso del producto MCD19A2 del sensor TERRA AQUA.
Quizás, el producto más importante que ofrece esta investigación, es resolver el problema
de espacialidad que tienen las estaciones de monitoreo de calidad del aire, ya que la
ubicación de estas estaciones, es de carácter puntual, por lo que su fuerte es la captura de
información en un radio de acción cercano, mientras que la información distante es
obtenida por métodos de interpolación que generalmente presenta errores en sus resultados
[3]. La captura de información por medio de imágenes satelitales permite llenar estos
vacíos de información con datos reales, que podría verse como una estación de calidad de
aire por cada pixel efectivo en la zona.
Es así como podemos empezar a implementar lo estadístico en la investigación, ya que

debemos saber qué tema estamos tratando para obtener resultados efectivos al momento de
aplicar las estrategias estadísticas de lo que queramos analizar, saber cómo esta
investigación puede ser un experimento aleatorio y de ahí empezar a analizar los conceptos
vistos en clase y aplicarlos a algo más complejo. Saber Interpretar el papel de cada una de
nuestras variables en una tabla de frecuencia o en un diagrama de puntos.
III. OBJETIVOS
1. OBJETIVO GENERAL
Saber interpretar cada una de las variables que se han implementado en el proyecto,
teniendo en cuenta cada uno de los conceptos definidos en la investigación, de esta
manera hacer un análisis estadístico correcto, demostrando así que los conceptos
estadísticos que se conocen son necesarios y aplicables a gran variedad de proyectos
e investigaciones de un ingeniero ambiental.
2. OBJETIVOS ESPECÍFICOS.
 Analizar correctamente la población en la cual se quiere poner el interés.

 Aprender a describir correctamente un experimento aleatorio teniendo en
cuenta los conceptos aprendidos.
 Entender correctamente los conceptos importantes definidos en el proyecto.
 Saber interpretar tablas de frecuencia, de probabilidad y los diversos
diagramas aplicados al objeto de interés de la investigación.
IV. MARCO TEÓRICO
1. ¿Qué es un experimento aleatorio?
Un experimento aleatorio es una prueba que consiste en repetir un fenómeno aleatorio con
el objetivo de analizarlo y extraer conclusiones sobre su comportamiento.
De la propia definición de experimento aleatorio, así como de la definición de fenómeno

aleatorio, deducimos que se trata del estudio de situaciones dominadas por las leyes del
azar.
Para que un experimento sea aleatorio debe satisfacer las siguiente condiciones:
 Se puede repetir bajo las mismas condiciones y de manera independiente.
 A priori se conoce el conjunto de todos los posibles resultados.
 A priori no se puede asegurar si un resultado o conjunto de resultados en particular

ocurrirá con certeza.
2. Experimentos aleatorios para cada variable:
EXPERIMENTO AOD: Se tiene un satélite de observación terrestre que tiene sensores

terra aqua, el satélite modis. Este satélite cuenta con una alta sensibilidad radiométrica en
36 bandas espectrales, en un rango de longitud de onda que va de los 0.4 μm a los 14.4 μm.
Las bandas 17 y 19 son las encargadas de las mediciones atmosféricas. El sensor modis es
un explorador de barrido: un espejo móvil que oscila perpendicularmente a la dirección de
la trayectoria con un ángulo de ± 55° permite explorar una franja de terreno a ambos lados
de la traza del satélite, cuyo ancho es de 2,330 km. Los datos son enviados al sistema de
datos y operaciones del EOS Data and operations system (EDOS), al centro espacial de
vuelo Goddard, los productos de suelo y atmosfera de más alto nivel son producidos por un
sistema de procesamiento adaptable (MODAPS) y posteriormente, son repartidos a tres
centros activos de almacenamiento para su distribución. El producto procesado que entrega
la NASA (Gratis) de Modis es el producto MCD19A2, este es un producto derivado y
procesado para la determinación de la profundidad óptica de aerosoles y es una
combinación de los sensores TERRA AQUA que están abordo del satélite Modis.
EXPERIMENTO PM 2.5: Se tiene la estación de monitoreo #12.0 de material

particulado menor a 2.5 micras , que es el crítico para la ciudad de Medellín. La estación de
monitoreo cuenta con un sistema de medición para PM 2.5, este sistema succiona cierta
cantidad medible de aire ambiente, el cual se dirige hacia una caja de muestreo a través de
un filtro y finalmente para determinar la cantidad de pm 2.5, este filtro es pesado antes y
después del proceso para determinar el peso ganado y se divide por el caudal, es decir el
flujo de aire que pasó por el filtro. A lo largo del día tiene 24 mediciones, para esto se
eligen las mediciones que el siata reporta con calidad aceptable y buena calidad, se evaluó
que para el día, mínimo se tuviera el 70% de las mediciones, lo cual corresponde a 17
mediciones mínimas de las 24 y con esto se hizo el promedio diario.
3. ¿Qué es una población?
Una población se refiere al conjunto de elementos que se desea investigar, estos elementos
pueden ser objetos, acontecimientos o grupo de personas. Dado que estos elementos
cuentan con una cantidad finita o infinita de proyecciones, se entiende una población como
una característica asociada a los objetos que pertenecen a dicha población en la que se ha
puesto el interés. [8]
A tener en cuenta:
Cuando hablamos de población no nos referimos a un concepto absoluto, ya que no existe

una sola población, existen infinitas poblaciones. Por otro lado los objetos de una población
pueden ser objetos de naturaleza física o de naturaleza extracta. Cada uno de los elementos
de la población reciben el nombre de unidades estadísticas o individuos.
Una vez entendido el concepto de población podemos dar paso a describir la población de
cada una de las variables que se han seleccionado para la realización de este proyecto.
POBLACIÓN COMO COSA AOD: satélite de observación terrestre llamado MODIS.

POBLACION COMO CARACTERÍSITCA AOD: Profundidad óptica de aerosloes.
POBLACIÓN COMO COSA MEAN_PM25: estación 12.0 de monitoreo de calidad del

aire de la ciudad de Medellín.
POBLACION COMO CARACTERÍSITCA DE MEAN_PM25: promedio de material
particulado de 2.5 micras reportados por la estación 12.0 desde el año 2014 al 2019.
Si después de definir la población se toma un subconjunto de elementos de la población

decimos que hemos tomado una muestra.
4. ¿Qué es una muestra?
Si después de definir la población se toma un subconjunto de elementos de la población

decimos que hemos tomado una muestra. Este subconjunto está aislado del resto con
fines de evaluación y estudio. Es decir, se trata de un fragmento de la totalidad de
elementos a estudiar, compuesta por un número más manejable de ellos, seleccionados
(idealmente) al azar. [9]
MUESTRA AOD: niveles de profundidad óptica de aerosoles entregados por el satélite

modis en el año 2014 hasta el año 2019 en tráfico centro de la ciudad de Medellín.
451
MUESTRA MEAN_PM25: información del SIATA de las estación de monitoreo 12.0

llamada estación tráfico centro, de material particulado menor a 2.5 micras, con la
información de las mediciones promedio de la estación desde el año 2014 hasta el año
2019.
451
Como se ha mencionado anteriormente el proyecto va enfocado en 2 variables, “aod” y
“mean_pm25” a continuación se explicará que representa cada una de ellas.
5. ¿Qué es una variable?
Las variables son las características que se le asocian a los objetos de una población,
normalmente estas características pueden medirse, pero también pueden ser adjetivos o
cualidades del objetos que hemos descrito [10]. Las variables se clasifican en:
CUALITATIVAS: es una característica que no es susceptible de medida y describe un

atributo o cualidad de los objetos de la población. Esta variable tiene como intención
clasificar dichos objetos de la población en categorías.
Las variables cualitativas se clasifican en:
Nominales: esta variables no poseen de un orden de las categorías que se han seleccionado
y atribuido a los objetos de la población
Ordinales: la variable ordinal, al contrario de la nominal si existe un orden establecido en

las categorías.
CUANTITATIVAS: es una característica que es susceptible de medida, esto quiere decir

que las características que se le atribuyen a cada objeto se pueden medir con un número.
Las variables cuantitativas se clasifican en:

Discretas: se dice que una variables es discreta cuando no puede tomar ningún valor entre
dos consecutivos, es decir el conjunto de todos los posibles resultados es un conjunto finito
o contablemente infinito.
Continua: se dice que una variable es continua si el conjunto de todos los posibles valores
que toma es un intervalo continuo de los reales R.
Una vez definido estos conceptos podemos decir que las variables seleccionadas Ambas
variables son cuantitativas ya que Es una característica que es susceptible de medida, esto
es, son características de los objetos de la población que se pueden medir con un número.
Y también son discreta porque el conjunto de todos los posibles valores que toma es un
conjunto finito o contablemente infinito.
a). Definición variable aod: la variable aod contiene todos los datos satelitales entregados
por el satélite modis para obtener datos de profundidad óptica de aerosoles.
Satélite modis: Modis es un satélite de observación terrestre que tiene sensores terra aqua,
Este sensor pasivo toma mediciones del medio ambiente de la tierra, en apoyo a los
esfuerzos de monitoreo de los cambios globales severos. Uno de ellos es el espesor óptico
de aerosoles que es un indicador de la contaminación del aire en especial por material
particulado. El producto de aerosol MODIS monitorea el espesor óptico del aerosol
ambiental sobre los océanos a nivel mundial y sobre los continentes. Además, la
distribución del tamaño del aerosol se deriva sobre los océanos y el tipo de aerosol se
deriva sobre los continentes. [4]
Una vez se hace este proceso el producto procesado que entrega la NASA (gratis) de modis
es el producto MCD19A2. Este es un producto derivado y procesado para la determinación
de la profundidad óptica de aerosoles y es una combinación de los sensores TERRA AQUA
que están abordo del satélite modis [5].
Este producto se descarga desde una plataforma llamada Google earth engine para el
procesamiento de imágenes satelitales, de allí se diseñó un geoprocesamiento que extrae el
valor del pixel de la imagen que se sobrepone con la ubicación geográfica de la estación en
tierra de pm 2.5. por lo tanto, con este algoritmo de geoprocesamientos se logró extraer el
valor de aod en la ubicación de la estación para una serie de tiempo establecido.
Sensor Terra AQUA: Este sensor pasivo toma mediciones del medio ambiente de la tierra,
en apoyo a los esfuerzos de monitoreo de los cambios globales severos. Se especializa en la
detección de humedad en los suelos y en el monitoreo del hielo, al utilizar microondas en
vez de luz visible que penetran las nubes, incluso de noche. [6]
Sensor pasivo: Los sensores pasivos miden la radiación proveniente de una fuente externa
al sensor, como la luz solar reflejada por los objetos terrestres o la radiación térmica
infrarroja emitida por la Tierra. Los sensores pasivos no pueden detectar luz durante la
noche. [7]
b). Definición variable mean_pm25: los datos que representa esta variable son los
descargados del SIATA de las estaciones de monitoreo de material particulado menor a 2.5
micras, que es el crítico para la ciudad de Medellín, con la información de las mediciones
de la estación desde el año 2014 hasta el año 2019 se calcularon los promedios diarios de
PM2.5 por estación. Cabe aclarar que la estación tiene una medición cada hora, por lo
tanto, a lo largo del día tiene 24 mediciones, para esto se extrajeron las mediciones que el
siata reporta con calidad aceptable y buena calidad, para extraer los datos más exactos y
acertados. se evaluó que, para el día, mínimo se tuviera el 70% de las mediciones, lo cual
corresponde a 17 mediciones mínimas de las 24 y con esto se hizo el promedio diario.
Este promedio se relacionó con el dato de aod del satélite del mismo día y en la ubicación
geográfica de la estación del SIATA.
Teniendo en cuenta el procedimiento descrito en el experimento de esta variable, se puede

expresar de la siguiente manera:
peso filtro con particulas de Pm 2.5−peso filtro blanco
caudal
6. ¿Qué es EOS data and operating system?
Es una compañía que brinda soluciones especiales para los problemas de la tierra,
utilizando datos geoespaciales y algoritmos personalizados, facilitan la obtención de
los datos rápidos y procesables para sectores como la agricultura, silvicultura, gases
atmosféricos, etc. E s una herramienta muy avanzada para la búsqueda de imágenes
geoespaciales y el análisis de estos mismo [11].
7. ¿Qué es MODAPS?
Es una técnica que se u liza para evaluar los movimientos empleados por el

operador al realizar una unidad de trabajo y obtener como resultado el Tiempo
estándar que requiere realizar dicha operación [12].
8. ¿Qué es una tabla de frecuencias?
Es la agrupación de los datos obtenidos que se categorizan y que son mutuamente

excluyentes que indicaran observaciones en las categorías, nos muestra de forma
ordenada el conjunto de todos los datos estadísticos, esta tabla se puede para
ordenar variables cualitativas y también cuantitativas que se les asigna una
frecuencia.
Tipos de frecuencia para variables cuantitativas:
Frecuencia absoluta: La frecuencia absoluta de una variable estadística es el

número de veces que aparece o se repite en la muestra dicho valor de la variable.
Frecuencia relativa: Es una medida estadística que se calcula como la frecuencia

absoluta de la variable entre el total de los valores que tiene la población o muestra.
Tablas de distribución de frecuencias para variables cualitativas:
Se debe considerar una variable de tipo cualitativo x que da lugar a las clases o
también llamadas categorías C1, C2, C3,… , Ck.
En donde vamos a considerar lo siguiente:
fi: Frecuencia absoluta.
Fi: Frecuencia absoluta acumulada. Es decir Fi= Fi-1 + fi
fi
hi: frecuencia relativa. Se tiene que hi =
n
Hi: frecuencia relativa acumulada. Se tiene que Hi= Hi-1 +hi.
Después de la anterior definición se puede concluir lo siguiente:
k k
0 ≤ f i ≤ n , ∑ f i=n , F k =n , 0 ≤ hi ≤1 , ∑ hi=1 y H k =1
i=1 i=1
Al ser las frecuencias relativas números decimales, al hacer ciertos recortes se

k
pueden perder cifras significativas y así ∑ hi ≈ 1 y hk ≈1.
i=1
Las frecuencias Fi y Hi es coherente usarlas cuando la variable cualitativa es ordinal,

y en ese caso las clases o categorías Ci para i=1,2,3,… , k se escriben de arriba hacia
abajo en la tabla de menor a mayor.
Tablas de distribución de frecuencias para variables cuantitativas:
Se debe considerar una variable cuantitativa discreta x y una muestra M de tamaño

n de una población de interés que da lugar a los datos x1, x2, … , xn.
En este tipo de tablas se tiene que x1, x2, … ,xk son los datos organizados de menor a
mayor y no deben estar repetidos.
fi: es la frecuencia absoluta.
Fi: es la frecuencia absoluta acumulada, es decir Fi= Fi-1 + fi
fi
hi: es la frecuencia relativa, se tiene que hi =
n
Hi: es la frecuencia relativa acumulada, es decir Hi= Hi-1 +hi.
Una vez entendida la definición se puede decir que:
k k
k ≤ n , 0 ≤ f i ≤ n , ∑ f i=n , F k =n , 0 ≤ hi ≤ 1 , ∑ hi=1 y H k =1
i=1 i=1
Al ser las frecuencias relativas números decimales, al hacer ciertos recortes se

k
pueden perder cifras significativas y así ∑ hi ≈ 1 y hk ≈1
i=1
Este tipo de tablas usualmente es utilizada cuando se tienen aproximadamente 30

datos.
Siguiendo esta definición, estas tablas pueden tener una columna en donde debe ir el
intervalo en donde los datos [L1,L2).[L2,L3),… , [Lk,Lk+1) son una partición de rango
el cual toma la variable. Además los datos x1, x2, … ,xk son llamados marcas de
clase. A su vez fi es la frecuencia absoluta y son el número de datos de la muestra
que pertenecen al intervalo [Li,Li+1).
Dada una muestra M de tamaño n de una población P, el agrupamiento de la
muestra se puede ver como la formación de nuevos datos a partir de los datos
iniciales x2 ,…, xn . Esto con el fin de simplificar los cálculos aritméticos y resumir
la información de manera que se pueda extraer información relevante de la base
inicial de datos.
El rango de la variable cuantitativa se define como R= xmax - xmin, donde xman y xmin
son el valor máximo y mínimo de la muestra, respectivamente.
La amplitud del intervalo [Li,Li+1). Está dada por Ai= Li+1 - Li
El número de intervalos m se puede calcular de la siguiente manera:
m= 1+3.3log(n) o m= √ n
La amplitud de cada intervalo es constante, de esta manera:
R
A=
m
Dado que la aritmética sobre el conjunto de todos intervalos en R no es sencilla,

puesto que dicho conjunto no es un espacio vectorial, entonces se toma un
representante de cada intervalo de manera que los cálculos asociados sean sencillos.
Comúnmente se tiene que la marca de clase xi del intervalo [Li , Li+1 ), está dada
por:
Li + Li +1
x 1=
2
Cuando se pasa de los datos x1, x2, · · · , xn al nuevo conjunto de datos [L1, L2),
[L2, L3), · · · , [Lk, Lk+1) o x1, x2, · · · , xn vistos como marcas de clase, se pierde
información en el sentido que posiblemente las marcas de clase no sean datos de la
muestra original M, sin embargo, se obtienen ventajas como:
 Cuando n es grande, la información más relevante puede resumirse en m
datos.
 Las conclusiones que se sacan de los m datos son muy cercanas a las
conclusiones que se sacan con los n datos iniciales.
 Se pueden elaborar gráficos que permiten visualizar la información de una

manera más sencilla y concreta.
9. ¿Qué es un diagrama de barras?
Se utiliza para representar los datos cualitativos o cuantitativos, un diagrama de

barras nos refleja los datos de los conteos de frecuencia de los datos para las
variables, tiene un eje horizontal donde casi siempre se ubica la variable cualitativa,
un eje vertical donde se ubican la frecuencia que nos van a determinar la altura de
las barras. Aquí se ponen lo datos ya categorizados, nos puede brindar información
de las líneas de referencia o los distintos tipos de curva que allí se forman.
Se considera una población de interés P y una muestra representativa M de tamaño

n de dicha población. Sea x una variable que da lugar a las categorías C1, C2, ···,
Ck.
Este tipo de diagrama se construye de la siguiente manera:
 Se consideran dos ejes, uno vertical y uno horizontal.
 En el eje horizontal se ubican las categorías de la variable x de manera que

las categorías Ci, Ci+1, para i = 1,2,··· ,k − 1, sean equidistantes.
 En la categoría Ci se construye un rectángulo de base estándar en cada

categoría y cuya altura es proporcional a la frecuencia absoluta o relativa de
Ci.
 Las barras deben estar separadas una de la otra.
10. ¿Qué es un diagrama de circular?
Es otro recurso estadístico que sire para mostrarnos porcentajes o proporciones, este
diagrama se divide por sectores según nuestras variables y cada sector representa
porcentajes, la unión de estos sectores nos forman el circulo completo. Usualmente
lo utilizamos para expresar los distintos varales de la frecuencia de las variables.
¿Qué es un diagrama de puntos?
Estos diagramas son útiles para mostrar datos cuantitativos de una forma
organizada. Este tipo de diagrama usa varios puntos para trazar datos a lo largo de
un eje ordinal. Un diagrama de puntos se diferencia fácilmente ya que solo muestra
los puntos de datos.
Para realizar un diagrama de puntos de debe considerar una población de interés P,

una muestra significativa M de tamaño n de la población y una variable cuantitativa
de interés x. Un gráfico de puntos es un gráfico que se utiliza para representar
variables cuantitativas y se construye de la siguiente manera.
 Se considera un eje horizontal de medición.
 Sobre el eje horizontal se ubican los puntos xi que toma la variable x.
 Sobre cada punto xi se coloca una cantidad de puntos según B fi.
¿Qué es un diagrama de tallos y hojas?
Presenta una exhibición gráfica de los datos usando los valores numéricos reales de cada
punto de datos.
Para construir esta grafica se divide cada segmento en dos partes: llamadas tallo y hoja. Se
pone en lista los tallos en una columna como una línea vertical a la derecha que será a la
hoja. Cada hoja tiene su tallo correspondiente estás son organizadas de menor a mayor en
cada tallo.
Se da una clave a su codificación de tallo y hoja para que el lector pueda recrear las
mediciones reales si es necesario.
¿Qué es un histograma?
Es una gráfica que se usa para cantidades en lugar de datos cualitativos y es una gráfica de
barras en que la altura de la barra muestra con qué frecuencia las mediciones caen en una
clase o su intervalo particular.
Siguiendo los siguientes pasos se conseguirá realizar un histograma:
1. Escoja el número de clases, por lo general entre 5 y 12. Cuantos más datos se tengan,
más clases deben usarse.
2. Calcule el ancho aproximado de clase al dividir la diferencia entre los valores máximo y
mínimo entre el número de clases.
3. Redondee el ancho aproximado de clase hasta un número cómodo.
4. Si los datos son discretos, se puede asignar una clase para cada valor entero tomado por
los datos. Para un número grande de valores enteros, puede que sea necesario agruparlos en
clases.
5. Localice las fronteras de clase. La clase más baja puede incluir la medición más pequeña.
A continuación sume las clases restantes usando el método de inclusión izquierda.
6. Construya una tabla estadística que contenga las clases, sus frecuencias y sus frecuencias
relativas.
7. Construya un histograma como una barra de gráficas, graficando intervalos de clase en el
eje horizontal y frecuencias relativas como las alturas de las barras.
¿Qué es un polígono de frecuencia?
Es un gráfico lineal que se utiliza en el caso de tener una variable cuantitativa. Para realizar
el polígono se deben unir los puntos medios de las bases superiores del diagrama de barras
o del histograma.
Otra forma de realizar un polígono de frecuencias es ubicar los puntos que representan las
frecuencias y luego trazar los segmentos que los unen.
¿Qué es función de distribución acumulada empírica?
Esta gráfica es una representación de una función cuyo dominio es el conjunto de los
números reales R, cuyo codominio es el intervalo [0, 1] y cuyo rango es un subconjunto del
intervalo [0, 1]. Además es un gráfico que tiene forma escalonada. Se mostrará que Es una
función no decreciente. También Se tiene que F→0 cuando x→−∞ y F→1 cuando x→∞.
Para esta función debemos considerar población de interés P, una muestra significativa M
de tamaño n de la población y una variable cuantitativa de interés x. Una gráfica de la
función de distribución acumulada empírica es un gráfico que se utiliza para representar
variables cuantitativas y se construye de la siguiente manera.
1. 1 Considere dos ejes de medición, uno horizontal y uno vertical.
2. 2 Sobre el eje horizontal se ubica la variable de interés x.
3. 3 Sobre el eje vertical se ubican las frecuencias relativas acumuladas.
4. 4 Se ubican los pares (xi,Hi) teniendo en cuenta que a todo elemento xj tal que xi ≤
xj < xi+1 le corresponde la imagen Hi.
¿qué es un gráfico ojiva?
Este grafico muestra la curva de una función de la distribución acumulativa. Los puntos
trazados son el límite de la clase superior y la frecuencia acumulativa correspondiente.
Para realizar un diagrama de ojiva se debe considerar una población de interés P, una
muestra significativa M de tamaño n de la población y una variable cuantitativa de interés
x. Una ojiva es un gráfico que se utiliza para representar variables cuantitativas y se
construye de la siguiente manera.
1. 1 Considere dos ejes de medición, uno horizontal y uno vertical.
2. 2 Sobre el eje horizontal se ubica la variable de interés x.
3. 3 Sobre el eje vertical se ubican las frecuencias absolutas o relativas acumuladas.
4. 4 Se ubican los pares (xi , Hi ) donde xi es la marca de clase del intervalo i.
5. 5 Se unen los puntos ubicados en el paso 4 mediante segmentos de línea recta.
REFERENCIAS.
Trabajos citados
[1] «mininambiente,» abril 2014. [En línea]. Available:

https://archivo.minambiente.gov.co/images/AsuntosMarinosCosterosyRecursosAcuatico/
Metodologia_Cobeneficios.pdf. [Último acceso: 22 septiembre 2022].
[2] «metropol,» 17 octubre 2017. [En línea]. Available:

https://www.metropol.gov.co/noticias/seis-nuevas-estaciones-miden-la-calidad-del-aire-en-
medell%C3%ADn. [Último acceso: 23 septiembre 2022].
[3] E. C. J. s. inmaculada Aguado, Comparación estadística de métodos tradicionales de

interpolación e imagenes NOAA-AVHRR para valorar el peligro de incendio, Madrid, 2000.
[4] «NASA,» 4 Febrero 2019. [En línea]. Available:

https://modis.gsfc.nasa.gov/data/dataprod/mod04.php. [Último acceso: 25 septiembre 2022].
[5] «USGS,» 3 JUNIO 2018. [En línea]. Available: https://lpdaac.usgs.gov/products/mcd19a2v006/.

[Último acceso: 25 septiembre 2022].
[6] «giis&beers,» 22 noviembre 2018. [En línea]. Available: http://www.gisandbeers.com/wms-

imagenes-modis-terra-aqua/. [Último acceso: 25 septiembre 2022].
[7] «esa,» 2 mayo 2019. [En línea]. Available:

https://eo4society.esa.int/wp-content/uploads/2019/12/what_is_RS_ES.pdf. [Último acceso:
24 septiembre 2022].
[8] «ECONOMIPEDIA,» 12 MARZO 2020. [En línea]. Available:

https://economipedia.com/definiciones/poblacion-estadistica.html. [Último acceso: 22
SEPTIEMBRE 2022].
[9] «CONCEPTO,» 5 agosto 2021. [En línea]. Available:

https://concepto.de/muestra-estadistica/#ixzz7fXU0WYf4. [Último acceso: 23 septiembre
2022].
[10 «economipeida,» 11 marzo 2022. [En línea]. Available:

] https://economipedia.com/definiciones/variable-estadistica.html. [Último acceso: 24
Septiembre 2022].
[11 «eos data,» 7 octubre 2021. [En línea]. Available: https://eos.com/es/. [Último acceso: 25
] septiembre 2022].
[12 R. B. D. J. Ybarra Dueñas Yvanna, «Aplicación de la técnica MODAPTS al ensamblar un control

] remoto de un carro de juguete,» Tijuana, 2021.

Proyecto Estadísitica

Cargado por

Copyright:

Formatos disponibles

Proyecto Estadísitica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Proyecto Estadísitica

Cargado por

Copyright:

Formatos disponibles

PROYECTO ESTADÍSITICA

Ana Sofia Arenas Gil, ana.arenas211@tau.usbmed.edu.co

Asignatura: Probabilidad y estadística

Asesor: Carlos Gaviria

Universidad de San Buenaventura

Es así como podemos empezar a implementar lo estadístico en la investigación, ya que

 Analizar correctamente la población en la cual se quiere poner el interés.

1. ¿Qué es un experimento aleatorio?

De la propia definición de experimento aleatorio, así como de la definición de fenómeno

 Se puede repetir bajo las mismas condiciones y de manera independiente.

 A priori se conoce el conjunto de todos los posibles resultados.

 A priori no se puede asegurar si un resultado o conjunto de resultados en particular

2. Experimentos aleatorios para cada variable:

EXPERIMENTO AOD: Se tiene un satélite de observación terrestre que tiene sensores

EXPERIMENTO PM 2.5: Se tiene la estación de monitoreo #12.0 de material

3. ¿Qué es una población?

Cuando hablamos de población no nos referimos a un concepto absoluto, ya que no existe

POBLACIÓN COMO COSA AOD: satélite de observación terrestre llamado MODIS.

POBLACIÓN COMO COSA MEAN_PM25: estación 12.0 de monitoreo de calidad del

Si después de definir la población se toma un subconjunto de elementos de la población

4. ¿Qué es una muestra?

Si después de definir la población se toma un subconjunto de elementos de la población

MUESTRA AOD: niveles de profundidad óptica de aerosoles entregados por el satélite

MUESTRA MEAN_PM25: información del SIATA de las estación de monitoreo 12.0

5. ¿Qué es una variable?

CUALITATIVAS: es una característica que no es susceptible de medida y describe un

Las variables cualitativas se clasifican en:

Ordinales: la variable ordinal, al contrario de la nominal si existe un orden establecido en

CUANTITATIVAS: es una característica que es susceptible de medida, esto quiere decir

Las variables cuantitativas se clasifican en:

Teniendo en cuenta el procedimiento descrito en el experimento de esta variable, se puede

6. ¿Qué es EOS data and operating system?

Es una técnica que se u liza para evaluar los movimientos empleados por el

8. ¿Qué es una tabla de frecuencias?

Es la agrupación de los datos obtenidos que se categorizan y que son mutuamente

Frecuencia absoluta: La frecuencia absoluta de una variable estadística es el

Frecuencia relativa: Es una medida estadística que se calcula como la frecuencia

Tablas de distribución de frecuencias para variables cualitativas:

En donde vamos a considerar lo siguiente:

fi: Frecuencia absoluta.

Fi: Frecuencia absoluta acumulada. Es decir Fi= Fi-1 + fi

Hi: frecuencia relativa acumulada. Se tiene que Hi= Hi-1 +hi.

Después de la anterior definición se puede concluir lo siguiente:

Al ser las frecuencias relativas números decimales, al hacer ciertos recortes se

Las frecuencias Fi y Hi es coherente usarlas cuando la variable cualitativa es ordinal,

Se debe considerar una variable cuantitativa discreta x y una muestra M de tamaño

fi: es la frecuencia absoluta.

Fi: es la frecuencia absoluta acumulada, es decir Fi= Fi-1 + fi

Hi: es la frecuencia relativa acumulada, es decir Hi= Hi-1 +hi.

Una vez entendida la definición se puede decir que:

Al ser las frecuencias relativas números decimales, al hacer ciertos recortes se

Este tipo de tablas usualmente es utilizada cuando se tienen aproximadamente 30

La amplitud del intervalo [Li,Li+1). Está dada por Ai= Li+1 - Li

El número de intervalos m se puede calcular de la siguiente manera:

La amplitud de cada intervalo es constante, de esta manera:

Dado que la aritmética sobre el conjunto de todos intervalos en R no es sencilla,

 Se pueden elaborar gráficos que permiten visualizar la información de una

9. ¿Qué es un diagrama de barras?

Se utiliza para representar los datos cualitativos o cuantitativos, un diagrama de