Hidrogafia
Hidrogafia
Hidrogafia
COMPLETACION DE DATOS
Mejía (2001), menciona que, muchas estaciones de precipitación o descargas (caudal) tienen
periodos faltantes en sus registros, debido a la ausencia del observador o a fallas instrumentales. A
menudo es necesario estimar algunos valores faltantes para lo cual existen muchas formas de
suplir estas deficiencias y el grado de aceptación de uno de estos métodos va a depender de la
cantidad de observaciones faltantes en el registro de datos. Entre estos métodos podemos
mencionar los siguientes:
Si dentro del registro de datos faltan menos del 5% de información estos se pueden completar con
un simple promedio de todos los datos existentes o la semisuma de los datos del año anterior y
del siguiente.
Puede haber en los registros de los datos, días o intervalos grandes sin información, por
imposibilidad del operador o falla del instrumento registrador. En ese caso, la serie de datos de
que se dispone en una estación X, de los cuales se conoce la media en un determinado número de
años, presenta vacíos que deben ser rellenados. Un procedimiento simple de completacion parte
1
de la premisa de que la precipitación PX en la estación X, sea proporcional a las precipitaciones de
las estaciones vecinas A, B y C en un mismo período, precipitaciones que serán llamadas PA, PB, PC.
Se acepta que el coeficiente de proporcionalidad sea la relación entre la media MX y las medias
MA, MB y MC en el mismo período de tiempo; esto es, que las precipitaciones sean directamente
proporcionales a sus medias. Se adopta, entonces, como valor del dato faltante PX, la media entre
los tres valores calculados a partir de A, B y C.
( )
Este método se basa en el empleo de tres estaciones cercanas a la estación problema y que sirven
de estaciones índices. Cuando la precipitación normal anual de cualquiera de las estaciones índices
difiere más del 10% de la precipitación normal de la estación problema, se emplea la ecuación
anterior. Donde P es la precipitación en la estación indicada (X, A, B, C) y M es la precipitación
media anual. Este método es adaptable a regiones con grandes variaciones en la precipitación
debido a la orografía.
Ejemplo. Se desea determinar la precipitación en la estación X del año 1972 en el que dejo de
funcionar. Teniendo los siguientes datos en las estaciones A, B y C.
Solución
( )
Es importante indicar que en todos los casos de completacion de datos, las estaciones, a ser
correlacionadas deben tener similitud en su ubicación (altitud, latitud, longitud, distancia a la
divisoria de aguas de la cuenca) y estén cercanas.
2
Regresión exponencial: Y=a×exp(bX) con forma linealizada ln(Y)=ln(a)+bX, exp() es la función
exponencial.
Todas estas ecuaciones pueden ser analizadas como modelos de regresión lineal simple, usando su
forma linealizada.
Para completar la información mediante regresión, es importante contar al menos con una
estación cercana a la estación problema, además deben tener similitud en cuanto a los registros y
estén ubicadas en la misma cuenca o en su defecto en cuencas con parámetros geomorfológicos
similares. La estación cercana (B) deberá abarcar necesariamente un periodo de registro mayor
que la estación problema (A), de este modo se puede establecer una ecuación de regresión entre
los datos de períodos comunes y completar los datos que faltan en la estación problema (A). Es
importante para el empleo de este método que el valor del coeficiente de determinación entre las
precipitaciones de A y B sea alto R2≥0.7.
Regresión lineal
La regresión es uno de los modelos más simples y comunes en la hidrología está basado en la
suposición de que dos variables se relacionan en forma lineal. En general, el objetivo de un
modelo de esta naturaleza es poder estimar el valor de una variable, que se denomina variable
dependiente (Y), a partir del valor de la otra, que se llama variable independiente (X).
El análisis de este modelo es establecer una relación lineal entre la variable independiente ( ) y la
variable dependiente (Y), El modelo de la regresión poblacional es:
Yi X i .
En este modelo y representan valores reales, sin embargo será necesario preguntarnos
qué valores de y son los más representativos para el modelo Un criterio intuitivo nos
conduce a que y deben tener valores que minimice la desviación ei entre los valores
La ei 0 puede ser positivo o negativo, por lo que este criterio no es del todo conveniente ya
que en la ecuación:
3
Y a bX , la e i será igual a cero si la recta para por dos puntos. La e
i será
también cero cuando la recta sobreestima un punto en la misma proporción de subestima el otro
Por las consideraciones de las desviaciones mencionadas se opta por minimizar la suma del
cuadrado de las desviaciones.
= -2∑ Yi – a – b Xi)2 = 0
= -2∑ Yi – a – b Xi)2 = 0
X .Yi
X . Y i i
b
i
n
( X X )(Y Y )
i i
( X i )2 (X X ) 2
X i2
n
i
a (Yi b X i ) / n (Y b. X )
La relación entre la suma de cuadrados total respecto a la media es denotada por r 2 se llama
coeficiente de determinación.
r2
(Yˆi Y )2
b
( X X ) (Y
i
2
i Y)
( X i X ).( Yi Y )
2
(Y i Y )2 (Y Y ) i
2
(X i X ) 2 .(Yi Y ) 2
r 2 b2.
(X X ) i
2
b2.
Sx
(Y Y ) i
2
Sy
Sx
r b. Donde ⌊ 1 r 1 ⌋;
Sy
4
r
(X i X ).( Yi Y )
S xy
( X i X ) . (Yi Y )
2
2 1/ 2 S x .S y
Ejemplo: Completación de datos utilizando Excel. Se tiene dos estaciones pluviométricas cercanas:
Ayaviri y Pucará. Se requiere completar la precipitación mensual del mes de marzo de la estación
Pucará en los años 1996, 1997 y 1998.
En Excel seleccionamos las celdas con los datos, y vamos a insertar grafico tipo dispersión en
puntos.
5
Seleccionamos los puntos y agregamos lineal de tendencia
Seleccionamos el modelo de regresión que queremos probar, y marcamos que nos presente la
ecuación y el valor de R2
6
Si seleccionamos lineal, y luego hacemos lo mismo con el modelo potencial, se obtiene el siguiente
gráfico de dispersión, mostrando las ecuaciones de estos modelos. Se puede hacer el
procedimiento varias veces y probar muchos modelos de regresión disponibles para la línea de
tendencia.
7
Puesto que el valor de R2 es mayor para el modelo Potencial, se utiliza esta ecuación para
completar los datos. En general se recomienda siempre escoger el modelo de regresión que tenga
el mayor valor de R2. Así se tiene los datos completados siguientes.