Proyecto Estadísitica
Proyecto Estadísitica
Proyecto Estadísitica
Tabla de contenido
No se encontraron entradas de tabla de contenido.
I. RESUMEN
Hoy en día se realizan gran cantidad de prácticas de producción agroindustrial que emiten
material particulado fino que contribuye a la formación de aerosoles atmosféricos. Para
evaluar el impacto de estas emisiones se monitorea la calidad del aire con estaciones para la
medición de material particulado 10 y 2.5. Este proyecto presenta un método para el uso de
sensores remotos, específicamente sensores terra aqua del satélite modis, el cual arroja gran
diversidad de datos de impacto ambiental, sin embargo esta investigación se enfocará en la
profundidad óptica de aerosoles. Se relacionan la emisión de partículas con las imágenes de
reflectividad. Las imágenes obtenidas se utilizan para generar series de tiempo de
concentración de PM 2.5 que son comparadas con los datos generados en las estaciones de
la red de calidad del aire. Es necesario aclara que toso estes estudio se realiza en la ciudad
de Medellín tomando la estación 12.0 de tráfico centro, por lo tanto solo se hablara de los
datos de pm2.5 que arroja esta estación de monitoreo, así mismo las imágenes que arroja el
satélite modis serán las que evalúe en esta zona. para esto se han escogido dos variables de
las cuales se hablará más adelante, con estas trabajaremos los conceptos estadísticos vistos,
como la población, el objeto, la muestra, el experimento aleatorio, tablas de frecuencias,
diagramas y muchos más conceptos importantes para el entendimiento de este.
II. INTRODUCCIÓN
Es común que cualquier persona con algún interés en los impactos ambientales haya notado
los drásticos cambios climáticos, la contaminación del aire, agua, biota, etc. Se puede
evidenciar que la contaminación atmosférica se ha constituido como una de las mayores
problemáticas ambientales, ocupando el tercer lugar en representación de costos
ambientales y sociales después de la contaminación en el agua y los desastres naturales [1].
Por esta razón surge la necesidad de implementar mecanismos para estimar la
concentración de algunos contaminantes presentes en la atmosfera. En Medellín han
implementado un mecanismo de alerta que consiste en ubicar estaciones de monitoreo en
lugares estratégicos del valle de Aburrá, monitoreando así las concentraciones de material
particulado, con un enfoque en el PM 2.5 ya que es el más nocivo para la salud. Con la
información que generan estas estaciones se podrá enriquecer la gestión de estas entidades
en materia de calidad del aire, fortaleciendo las investigaciones relacionadas al
conocimiento de las condiciones que generan episodios críticos, así como la toma de
decisiones en esa materia. [2]
Es por esto que además de tener en cuenta estas estaciones de monitoreo, es necesario
implementar mecanismos que ayuden a tener una mejor estimación de la contaminación,
por esta razón en este proyecto se tiene en cuenta la imagen satelital que entrega el satélite
modis. Este sensoramiento remoto permite obtener información de cualquier objeto sin
tener contacto directo, al aplicar modelos matemáticos a las imágenes satelitales se obtuvo
información correspondiente al material particulado disperso en la zona de interés, con lo
que se determinan las variaciones espaciales de las zonas con mayor presencia de emisión
de partículas PM 2.5 micrómetros (μm) en la zona de interés que es tráfico centro en la
ciudad de Medellín. Haciendo uso del producto MCD19A2 del sensor TERRA AQUA.
Quizás, el producto más importante que ofrece esta investigación, es resolver el problema
de espacialidad que tienen las estaciones de monitoreo de calidad del aire, ya que la
ubicación de estas estaciones, es de carácter puntual, por lo que su fuerte es la captura de
información en un radio de acción cercano, mientras que la información distante es
obtenida por métodos de interpolación que generalmente presenta errores en sus resultados
[3]. La captura de información por medio de imágenes satelitales permite llenar estos
vacíos de información con datos reales, que podría verse como una estación de calidad de
aire por cada pixel efectivo en la zona.
III. OBJETIVOS
1. OBJETIVO GENERAL
Saber interpretar cada una de las variables que se han implementado en el proyecto,
teniendo en cuenta cada uno de los conceptos definidos en la investigación, de esta
manera hacer un análisis estadístico correcto, demostrando así que los conceptos
estadísticos que se conocen son necesarios y aplicables a gran variedad de proyectos
e investigaciones de un ingeniero ambiental.
2. OBJETIVOS ESPECÍFICOS.
Un experimento aleatorio es una prueba que consiste en repetir un fenómeno aleatorio con
el objetivo de analizarlo y extraer conclusiones sobre su comportamiento.
Para que un experimento sea aleatorio debe satisfacer las siguiente condiciones:
Una población se refiere al conjunto de elementos que se desea investigar, estos elementos
pueden ser objetos, acontecimientos o grupo de personas. Dado que estos elementos
cuentan con una cantidad finita o infinita de proyecciones, se entiende una población como
una característica asociada a los objetos que pertenecen a dicha población en la que se ha
puesto el interés. [8]
A tener en cuenta:
451
451
Como se ha mencionado anteriormente el proyecto va enfocado en 2 variables, “aod” y
“mean_pm25” a continuación se explicará que representa cada una de ellas.
Las variables son las características que se le asocian a los objetos de una población,
normalmente estas características pueden medirse, pero también pueden ser adjetivos o
cualidades del objetos que hemos descrito [10]. Las variables se clasifican en:
Nominales: esta variables no poseen de un orden de las categorías que se han seleccionado
y atribuido a los objetos de la población
Continua: se dice que una variable es continua si el conjunto de todos los posibles valores
que toma es un intervalo continuo de los reales R.
Una vez definido estos conceptos podemos decir que las variables seleccionadas Ambas
variables son cuantitativas ya que Es una característica que es susceptible de medida, esto
es, son características de los objetos de la población que se pueden medir con un número.
Y también son discreta porque el conjunto de todos los posibles valores que toma es un
conjunto finito o contablemente infinito.
a). Definición variable aod: la variable aod contiene todos los datos satelitales entregados
por el satélite modis para obtener datos de profundidad óptica de aerosoles.
Satélite modis: Modis es un satélite de observación terrestre que tiene sensores terra aqua,
Este sensor pasivo toma mediciones del medio ambiente de la tierra, en apoyo a los
esfuerzos de monitoreo de los cambios globales severos. Uno de ellos es el espesor óptico
de aerosoles que es un indicador de la contaminación del aire en especial por material
particulado. El producto de aerosol MODIS monitorea el espesor óptico del aerosol
ambiental sobre los océanos a nivel mundial y sobre los continentes. Además, la
distribución del tamaño del aerosol se deriva sobre los océanos y el tipo de aerosol se
deriva sobre los continentes. [4]
Una vez se hace este proceso el producto procesado que entrega la NASA (gratis) de modis
es el producto MCD19A2. Este es un producto derivado y procesado para la determinación
de la profundidad óptica de aerosoles y es una combinación de los sensores TERRA AQUA
que están abordo del satélite modis [5].
Este producto se descarga desde una plataforma llamada Google earth engine para el
procesamiento de imágenes satelitales, de allí se diseñó un geoprocesamiento que extrae el
valor del pixel de la imagen que se sobrepone con la ubicación geográfica de la estación en
tierra de pm 2.5. por lo tanto, con este algoritmo de geoprocesamientos se logró extraer el
valor de aod en la ubicación de la estación para una serie de tiempo establecido.
Sensor Terra AQUA: Este sensor pasivo toma mediciones del medio ambiente de la tierra,
en apoyo a los esfuerzos de monitoreo de los cambios globales severos. Se especializa en la
detección de humedad en los suelos y en el monitoreo del hielo, al utilizar microondas en
vez de luz visible que penetran las nubes, incluso de noche. [6]
Sensor pasivo: Los sensores pasivos miden la radiación proveniente de una fuente externa
al sensor, como la luz solar reflejada por los objetos terrestres o la radiación térmica
infrarroja emitida por la Tierra. Los sensores pasivos no pueden detectar luz durante la
noche. [7]
b). Definición variable mean_pm25: los datos que representa esta variable son los
descargados del SIATA de las estaciones de monitoreo de material particulado menor a 2.5
micras, que es el crítico para la ciudad de Medellín, con la información de las mediciones
de la estación desde el año 2014 hasta el año 2019 se calcularon los promedios diarios de
PM2.5 por estación. Cabe aclarar que la estación tiene una medición cada hora, por lo
tanto, a lo largo del día tiene 24 mediciones, para esto se extrajeron las mediciones que el
siata reporta con calidad aceptable y buena calidad, para extraer los datos más exactos y
acertados. se evaluó que, para el día, mínimo se tuviera el 70% de las mediciones, lo cual
corresponde a 17 mediciones mínimas de las 24 y con esto se hizo el promedio diario.
Este promedio se relacionó con el dato de aod del satélite del mismo día y en la ubicación
geográfica de la estación del SIATA.
Es una compañía que brinda soluciones especiales para los problemas de la tierra,
utilizando datos geoespaciales y algoritmos personalizados, facilitan la obtención de
los datos rápidos y procesables para sectores como la agricultura, silvicultura, gases
atmosféricos, etc. E s una herramienta muy avanzada para la búsqueda de imágenes
geoespaciales y el análisis de estos mismo [11].
7. ¿Qué es MODAPS?
Se debe considerar una variable de tipo cualitativo x que da lugar a las clases o
también llamadas categorías C1, C2, C3,… , Ck.
fi
hi: frecuencia relativa. Se tiene que hi =
n
k k
0 ≤ f i ≤ n , ∑ f i=n , F k =n , 0 ≤ hi ≤1 , ∑ hi=1 y H k =1
i=1 i=1
En este tipo de tablas se tiene que x1, x2, … ,xk son los datos organizados de menor a
mayor y no deben estar repetidos.
fi
hi: es la frecuencia relativa, se tiene que hi =
n
k k
k ≤ n , 0 ≤ f i ≤ n , ∑ f i=n , F k =n , 0 ≤ hi ≤ 1 , ∑ hi=1 y H k =1
i=1 i=1
Siguiendo esta definición, estas tablas pueden tener una columna en donde debe ir el
intervalo en donde los datos [L1,L2).[L2,L3),… , [Lk,Lk+1) son una partición de rango
el cual toma la variable. Además los datos x1, x2, … ,xk son llamados marcas de
clase. A su vez fi es la frecuencia absoluta y son el número de datos de la muestra
que pertenecen al intervalo [Li,Li+1).
Dada una muestra M de tamaño n de una población P, el agrupamiento de la
muestra se puede ver como la formación de nuevos datos a partir de los datos
iniciales x2 ,…, xn . Esto con el fin de simplificar los cálculos aritméticos y resumir
la información de manera que se pueda extraer información relevante de la base
inicial de datos.
El rango de la variable cuantitativa se define como R= xmax - xmin, donde xman y xmin
son el valor máximo y mínimo de la muestra, respectivamente.
m= 1+3.3log(n) o m= √ n
R
A=
m
Li + Li +1
x 1=
2
Cuando se pasa de los datos x1, x2, · · · , xn al nuevo conjunto de datos [L1, L2),
[L2, L3), · · · , [Lk, Lk+1) o x1, x2, · · · , xn vistos como marcas de clase, se pierde
información en el sentido que posiblemente las marcas de clase no sean datos de la
muestra original M, sin embargo, se obtienen ventajas como:
Cuando n es grande, la información más relevante puede resumirse en m
datos.
Las conclusiones que se sacan de los m datos son muy cercanas a las
conclusiones que se sacan con los n datos iniciales.
Es otro recurso estadístico que sire para mostrarnos porcentajes o proporciones, este
diagrama se divide por sectores según nuestras variables y cada sector representa
porcentajes, la unión de estos sectores nos forman el circulo completo. Usualmente
lo utilizamos para expresar los distintos varales de la frecuencia de las variables.
Estos diagramas son útiles para mostrar datos cuantitativos de una forma
organizada. Este tipo de diagrama usa varios puntos para trazar datos a lo largo de
un eje ordinal. Un diagrama de puntos se diferencia fácilmente ya que solo muestra
los puntos de datos.
Presenta una exhibición gráfica de los datos usando los valores numéricos reales de cada
punto de datos.
Para construir esta grafica se divide cada segmento en dos partes: llamadas tallo y hoja. Se
pone en lista los tallos en una columna como una línea vertical a la derecha que será a la
hoja. Cada hoja tiene su tallo correspondiente estás son organizadas de menor a mayor en
cada tallo.
Se da una clave a su codificación de tallo y hoja para que el lector pueda recrear las
mediciones reales si es necesario.
¿Qué es un histograma?
Es una gráfica que se usa para cantidades en lugar de datos cualitativos y es una gráfica de
barras en que la altura de la barra muestra con qué frecuencia las mediciones caen en una
clase o su intervalo particular.
1. Escoja el número de clases, por lo general entre 5 y 12. Cuantos más datos se tengan,
más clases deben usarse.
2. Calcule el ancho aproximado de clase al dividir la diferencia entre los valores máximo y
mínimo entre el número de clases.
4. Si los datos son discretos, se puede asignar una clase para cada valor entero tomado por
los datos. Para un número grande de valores enteros, puede que sea necesario agruparlos en
clases.
5. Localice las fronteras de clase. La clase más baja puede incluir la medición más pequeña.
A continuación sume las clases restantes usando el método de inclusión izquierda.
6. Construya una tabla estadística que contenga las clases, sus frecuencias y sus frecuencias
relativas.
7. Construya un histograma como una barra de gráficas, graficando intervalos de clase en el
eje horizontal y frecuencias relativas como las alturas de las barras.
Es un gráfico lineal que se utiliza en el caso de tener una variable cuantitativa. Para realizar
el polígono se deben unir los puntos medios de las bases superiores del diagrama de barras
o del histograma.
Otra forma de realizar un polígono de frecuencias es ubicar los puntos que representan las
frecuencias y luego trazar los segmentos que los unen.
Esta gráfica es una representación de una función cuyo dominio es el conjunto de los
números reales R, cuyo codominio es el intervalo [0, 1] y cuyo rango es un subconjunto del
intervalo [0, 1]. Además es un gráfico que tiene forma escalonada. Se mostrará que Es una
función no decreciente. También Se tiene que F→0 cuando x→−∞ y F→1 cuando x→∞.
Para esta función debemos considerar población de interés P, una muestra significativa M
de tamaño n de la población y una variable cuantitativa de interés x. Una gráfica de la
función de distribución acumulada empírica es un gráfico que se utiliza para representar
variables cuantitativas y se construye de la siguiente manera.
4. 4 Se ubican los pares (xi,Hi) teniendo en cuenta que a todo elemento xj tal que xi ≤
xj < xi+1 le corresponde la imagen Hi.
¿qué es un gráfico ojiva?
Este grafico muestra la curva de una función de la distribución acumulativa. Los puntos
trazados son el límite de la clase superior y la frecuencia acumulativa correspondiente.
Para realizar un diagrama de ojiva se debe considerar una población de interés P, una
muestra significativa M de tamaño n de la población y una variable cuantitativa de interés
x. Una ojiva es un gráfico que se utiliza para representar variables cuantitativas y se
construye de la siguiente manera.
4. 4 Se ubican los pares (xi , Hi ) donde xi es la marca de clase del intervalo i.
5. 5 Se unen los puntos ubicados en el paso 4 mediante segmentos de línea recta.
REFERENCIAS.
Trabajos citados