Trabajo Semanal N°6 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 22

FACULTAD DE INGENIERIA CIVIL

ESTADISTICA HIDROLOGICA
Trabajo semanal # 06
Ingeniería Civil

DOCENTE:

MBA Ing. Jimmy Mendoza Montalvo

ESTUDIANTES:

Castañeda Hinostroza, Angel

Chang Poquioma, Fritz

Quispe Cubas, Junior Ali

Segura Castañeda, Jorge Luis

Lima, julio de 2020


Tabla de Contenido
INDICE:
1. RIESGO DE FALLA ADMISIBLE. ...........................................................................3
2. POBLACION Y MUESTRA. ......................................................................................5
4. ANALISIS DE REGRESION LINEAL Y CORRELACION. ..................................11
5. COEFICIENTE DE CORRELACION Y COEFICIENTE DE DETERMINACION.15
1. RIESGO DE FALLA ADMISIBLE.

El tiempo promedio, en años, en que el valor del caudal pico de una creciente
determinada es igualado o superado una vez cada “T” años, se le denomina Período de
Retorno “T”. Si se supone que los eventos anuales son independientes, es posible
calcular la probabilidad de falla para una vida útil de n años.

Para adoptar el período de retorno a utilizar en el diseño de una obra, es necesario


considerar la relación existente entre la probabilidad de excedencia de un evento, la
vida útil de la estructura y el riesgo de falla admisible, dependiendo este último, de
factores económicos, sociales, técnicos y otros.

El criterio de riesgo es la fijación, a priori, del riesgo que se desea asumir por el caso de
que la obra llegase a fallar dentro de su tiempo de vida útil, lo cual implica que no
ocurra un evento de magnitud superior a la utilizada en el diseño durante el primer año,
durante el segundo, y así sucesivamente para cada uno de los años de vida de la obra.

El riesgo de falla admisible en función del período de retorno y vida útil de la obra está
dado por:

1
𝑅 = 1 − (1 − )𝑛
𝑇

Si la obra tiene una vida útil de n años, la fórmula anterior permite calcular el período
de retorno T, fijando el riesgo de falla admisible R, el cual es la probabilidad de
ocurrencia del pico de la creciente estudiada, durante la vida útil de la obra.

En la Tabla Nº 01 se presenta el valor T para varios riesgos permisibles R y para la


vida útil n de la obra.
Figura Nº 01. Riesgo de por lo menos una excedencia del evento de diseño durante la vida útil
(Fuente: Hidrología Aplicada (Ven te Chow)).

TABLA Nº 01: Valores de Período de Retorno T (Años)

Fuente: Monsalve, 1999

De acuerdo a los valores presentados en la Tabla Nº 01 se recomienda utilizar como


máximo, los siguientes valores de riesgo admisible de obras de drenaje:
(*) -
Para

obtención de la luz y nivel de aguas máximas extraordinarias.


- Se recomienda un período de retorno T de 500 años para el cálculo de socavación.
(**) - Vida Útil considerado (n)
• Puentes y Defensas Ribereñas n= 40 años.
• Alcantarillas de quebradas importantes n= 25 años.
• Alcantarillas de quebradas menores n= 15 años.
• Drenaje de plataforma y Sub-drenes n= 15 años.
- Se tendrá en cuenta, la importancia y la vida útil de la obra a diseñarse.
- El Propietario de una Obra es el que define el riesgo admisible de falla y la vida útil de
las obras.

2. POBLACION Y MUESTRA.

Población

Es el conjunto de datos que queremos estudiar.


A veces se dispone de medidas de toda la población, pero generalmente esto sería
muy difícil de medir. En estos casos debemos conformarnos con medir una parte de la
población (una muestra). A partir de la muestra, intentamos extraer estimaciones
válidas para toda la población.

Muestra

Es una pequeña parte de la población que debería ser representativa del total de la
población.
3. DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGÍA.

El comportamiento de las variables aleatorias discretas o continuas se describe con


la ayuda de Distribuciones de Probabilidad. La variable se designa por mayúscula y
un valor específico de ella por minúscula.

Por P(x = a) se denota la probabilidad de que un evento asuma el valor a;


similarmente P(a ≤ x ≤ b) denota la probabilidad de que un evento se encuentre en
el intervalo (a, b).

Si conocemos la probabilidad P(a ≤ x ≤ b) para todos los valores de a y b, se dice


que conocemos la Distribución de Probabilidades de la variable x.
Si x es un número dado y consideramos la probabilidad P(X ≤ x):

F(x)= P(X x):

y llamamos F(x) la función de distribución acumulada.

3.1-DISTRIBUCION NORMAL

La distribución normal es una distribución simétrica en forma de campana, también


conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los
datos hidrológicos tiene amplia aplicación por ejemplo a los datos transformados
que siguen la distribución normal.
3.2-Función de densidad:
La función de densidad está dada por

Los dos parámetros de la distribución son la media m y desviación estándar s para


los cuales (media) y s (desviación estándar) son derivados de los datos.

3.3-Estimación de parámetros:

3.4- Factor de frecuencia:

Si se trabaja con los X sin transformar el K se calcula como

Este factor es el mismo de la variable normal estándar

3.5- Límites de confianza:

Donde a es el nivel de probabilidad es el cuantil de la distribución normal


estandarizada para una probabilidad acumulada de 1-a y Se es el error estándar.

3.1 DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS


Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice
que X se distribuye normalmente.
Esta distribución es muy usada para el cálculo de valores extremos por ejemplo
Qmax, Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la
ventaja que X>0 y que la transformación Log tiende a reducir la asimetría positiva ya
que al sacar logaritmos se reducen en mayor proporción los datos mayores que los
menores.

Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de las
variables estén centrados en la media.

3.1.1-Función de densidad:

y = ln x
donde, my: media de logaritmos de la población (parámetro escalar), sy :
Desviación estándar de los logaritmos de la población, estimado sy.

3.1.2-Estimación de parámetros:

3.1.3- Factor de frecuencia:

K es la variable normal estandarizada para el Tr dado, es el coeficiente


de variación, x media de los datos originales y s desviación estándar de los datos
originales.

3.1.4-Límites de confianza:
en donde, n número de datos, Se error estándar, KT variable normal
estandarizada

3.3 DISTRIBUCIÓN LOGPEARSON DE 3 PARÁMETROS


Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución
Pearson tipo I I I , se dice que la variable aleatoria X se ajusta a una distribución
Log Pearson Tipo I I I . Esta distribución es ampliamente usada en el mundo para
el análisis de frecuencia de Caudales máximos. Esta se trabaja igual que para la
Pearson Tipo I I I pero con Xy y Sy como la media y desviación estándar de los
logaritmos de la variable original X.

3.3.1-Función de densidad:

a y b son los parámetros de escala y forma, respectivamente, y y0 es el


parámetro de localización.

3.3.2-Estimación de parámetros:

Cs es el coeficiente de asimetría , son la media y la desviación


estándar de los logaritmos de la muestra respectivamente

3.3.3-Factor de frecuencia:

donde z es la variable normal estandarizada Este valor de K se encuentra tabulado


de acuerdo al valor de Cs calculado con la muestra.
3.3.4-Intervalos de confianza:

Donde Sy es la desviación estándar de los logaritmos de la muestra, n es el


número de datos y d se encuentra tabulado en función de Cs y Tr.

Distribución de probabilidades: Pearson tipo III,


4. ANALISIS DE REGRESION LINEAL Y CORRELACION.
Conceptos Generales de regresión lineal
En la mayor parte de los estudios estadísticos se presenta el problema de predecir los
valores que puede tomar una determinada variable. El planteo del método de solución
puede realizarse de varias formas.

En ocasiones se trata de completar, o de ampliar, una serie de datos de la “variable


problema” a partir de series de datos de una, o más, variables que estén relacionadas
con aquélla de alguna manera.

En otras palabras, se trata simplemente de conseguir un cierto conocimiento sobre los


factores que influyen en el valor de la “variable problema”, con el fin de poder realizar
hipótesis adecuadas sobre sus valores desconocidos.

Estos dos aspectos son tratados por la correlación y la regresión, respectivamente.

Es importante destacar el hecho de que la aplicación de ambos métodos no proporciona


por sí misma ninguna información del tipo causa-efecto, ya que los resultados expresan
únicamente relaciones numéricas entre las variables estudiadas.

Sin embargo, a partir de estas relaciones se puede llegar a conclusiones de aquel tipo,
por lo que la finalidad primordial de estos métodos es averiguar los grupos de variables
que pueden estudiarse conjuntamente y hallarse interrelacionadas.

La diferencia entre regresión y correlación puede aclararse mediante las siguientes


consideraciones:

 un problema de regresión considera la distribución de frecuencias de una variable


(dependiente), cuando ésta u otras variables (independientes) se suponen
conocidas.
 un problema de correlación, por su parte, considera la variación conjunta de dos
variables sin que se apliquen restricciones a ninguna de ellas.

Por tanto, la correlación obtiene el grado de afinidad entre dos variables, representado
numéricamente por el coeficiente de correlación “ρ”, mientras que la regresión obtiene
una ecuación “ y  fx ” que permite calcular valores de la variable dependiente “y” a partir
de la independiente “x”.

Regresión y Correlación Lineal


Es la teoría que estudia la relación lineal que existe entre dos variables, despreciando
toda posible influencia de otras variables distintas.

Planteamiento Teórico
Dado un conjunto de pares de valores correspondientes a dos variables “x” e “y”, la ley
más sencilla de regresión o correlación entre ambas es la lineal

Ejemplo:
Si disponemos de dos series de datos emparejadas, con frecuencia es útil conocer si
ambas variables están relacionadas, y, en caso afirmativo, encontrar la expresión que
refleja dicha relación. Si la ecuación que mejor relaciona dichas variables es la de una
recta, decimos que existe correlación lineal.
Un ejemplo puede ser la pluviometría registrada en dos estaciones próximas (Tabla
adjunta). Si la pluviometría es similar en ambos puntos, sería de gran utilidad

cuantificar esa relación, pues de ese modo podríamos evaluar, aunque fuera de modo
aproximado, la pluviometría de un lugar a partir de la registrada en el otro.

En este ejemplo, la correlación es: Pen B =0,807 · Pen A + 142,96


Supongamos que para un año conocemos el valor de P = 640 en el punto A, pero no lo
tenemos para el punto B. Se podrá estimar mediante la relación anterior:

Pen B = 0,807 · 640 + 14,96 = 531

La relación entre dos variables (como las dos columnas de datos anteriores) puede ser
lineal, exponencial, polinómica, etc. Es decir: que, aunque los puntos no estén alineados
puede que tengan una fuerte correlación, pero no lineal (por ejemplo: y = x2 +2,3). En
este breve apunte vamos a centrarnos en la posible relación lineal entre dos variables.

Recta de regresión
Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos.
Supongamos que medimos la distancia vertical de cada punto a la recta (líneas de trazos
en la figura adjunta). La recta buscada sería aquella para la que la suma de estas
distancias fuera mínima.
La ecuación de una recta es:
y=a.x+b

Si, por ejemplo, fuera: y =0,83 x + 12,9 la pendiente sería 0,83 y la ordenada en el origen
(altura a la que la recta corta el eje vertical) sería 12,9

Si llegamos a conocer esa ecuación, podremos llegar a estimar valores de y


desconocidos a partir de valores de x conocidos. Otro ejemplo: supongamos que x es la
altitud de cada estación pluviométrica e y es su pluviometría; si establecemos que ambas
variables están correlacionadas y obtenemos la ecuación de la recta de regresión,
conociendo la cota del punto podremos estimar su pluviometría.
Análisis de correlación.
La correlación se define como una medida de dependencia lineal entre una variable
aleatoria y otra u otras variables. Para el caso de la asociación entre dos variables se
tienen los procesos hidrológicos lluvia – escurrimiento, escurrimiento – descarga de
sedimento, lluvia – descarga de sedimento y temperatura del agua – contenido de
oxígeno. Para el caso multivariado, se puede asociar al escurrimiento las características
fisiográficas y/o meteorológicas del sitio analizado.

Coeficiente de correlación de Pearson (r)


Este coeficiente nos informa del grado de relación entre dos variables. Si la relación es
lineal perfecta, r será 1 ó -1. El coeficiente r será positivo si la relación es positiva (al
aumentar x aumenta y), y r será negativo en el caso contrario (si al aumentar x, disminuye
y).
En general, valores (absolutos) de r > 0,80 se consideran altos, aunque esto depende
del número de parejas de datos con las que hemos realizado el cálculo y del nivel de
seguridad con el que queramos extraer nuestras conclusiones.
No vamos a entrar en el estudio del nivel de significación del coeficiente r , pero como
indicación: para 11 parejas de datos, y si admitimos un 5% de posibilidades de
equivocarnos, con r>0,553 ya podemos decir que ambas series de datos no son
independientes (parece que tienen algún tipo de relación). Si tuviéramos 50 parejas de
datos, nos bastaría r>0,273 para sacar la misma conclusión (siempre considerando el
valor absoluto de r)
Si nos ponemos más estrictos, y queremos sacar la conclusión de que las dos series no
son independientes con un 99% de seguridad (sólo un 1% de posibilidad de error), con
11 parejas necesitamos que r>0,684 y con 50 parejas r>0,354

Precauciones:
El que estemos seguros de que ambas series están relacionadas, no quiere decir que la
relación sea tan estrecha como para estimar valores de y desconocidos a partir de
valores de x conocidos; eso dependerá del error de estimación que aceptemos.
La existencia de una correlación no indica relación causa-efecto.
5. COEFICIENTE DE CORRELACION Y COEFICIENTE DE
DETERMINACION.

Coeficiente de correlación:
Al efectuar el desarrollo de las regresiones lineales de “y” sobre “x” y de “x” sobre “y”, los
coeficientes de las angulares de las rectas (a los que se denomina de regresión), están
dados respectivamente por:

𝜌𝑦𝑥=𝜎𝑥𝑦 ; 𝜌𝑦𝑥=𝜎𝑥𝑦
𝜎2
𝑥 𝜎2
𝑦

A la medida geométrica de ambos coeficientes de regresión se la denomina coeficiente


de correlación de las dos variables y se lo representa por “ 𝜌” o “r”.

Su expresión es:

𝜎𝑥𝑦 𝜎𝑥𝑦 𝜎𝑥𝑦


𝑟 = 𝜌 = √𝜌𝑦𝑥∗ 𝜌𝑥𝑦 = √ 2 ∗ 2 =
𝜎𝑥 𝜎𝑦 √𝜎𝑥2 ∗ 𝜎𝑦2

Sus valores están comprendidos en el intervalo (-1, +1).

Además, cuanto más se aproxime |𝜌| a la unidad, menor será el valor de los momentos
de inercia 𝐼𝑥 e 𝐼𝑦 .En particular ,para |𝜌|=1, resulta 𝐼𝑥 = 𝐼𝑦 = 0 ,lo que significa que toda
la masa se encuentra sobre una recta , en la que se han confundido también las rectas
de regresión.

El coeficiente de correlación se utiliza para determinar el grado de dependencia lineal


que existe entre las dos variables, y mide, en cierto modo, la bondad del ajuste de los
puntos a una recta.

En la utilización practica de las rectas de regresión para generar valores no registrados


o completar series de datos históricos, si se designa por “n” al número de años (o de
datos) registrados en la sección o región a estudiar y “N” al correspondiente a la sección
o región base, la extrapolación podrá ser valedera, o no, según los valores
correspondientes de 𝜌 , de acuerdo al siguiente criterio:
n/N Coeficiente de correlación
Excelente Bueno Sin significado
20/30 0.99 0.85 <0.70
15/30 0.99 0.87 <0.77
10/30 0.99 0.90 <0.85
5/30 0.99 0.95 <0.90

En algunos casos de correlaciones entre caudales de diversas cuencas, o entre caudales


y precipitaciones, la correlación lineal no brinda suficiente precisión, resultando necesario
recurrir a alguna ley de correlación con más parámetros, tal como por ejemplo la
parabólica.

Por ejemplo, para determinar la curva de gastos de una estación de aforo(caudales-


alturas), no se podría emplear una recta. En estas circunstancias, la ley de regresión
podría expresarse en la forma:

𝑦0𝑎 + 𝑏 ∗ 𝑥 + 𝑘 ∗ 𝑥 2 + 𝑗 ∗ 𝑥 3 + ⋯

La determinación de los coeficientes “a”,” b”,”c”, etc. Se debe hacer de modo que
∑(𝑦𝑖 − 𝑦)2 sea un mínimo respecto a ellos.

Es también posible, sin aumentar el número de parámetros, buscar leyes no lineales que
se adapten mejor que las leyes de regresión lineal a la relación entre los parámetros
observados, tales como por ejemplo la logarítmica, exponencial, etc.

Es posible transformar muchas de estas leyes en lineales, mediante un cambio de


variable, y después, operar gráfica, o numéricamente, como si se tratase de una
recurrencia lineal.
6. ANÁLISIS VISUAL GRÁFICO.

En coordenadas cartesianas se plotea la información hidrológica histórica, ubicándose


en las coordenadas, los valores de la serie y en las abscisas el tiempo (años, meses,
días. Etc.).

Un ejemplo de una serie de caudales promedio anuales se muestra en la figura 1.1. Este
grafico sirve para analizar la consistencia información hidrológica en forma visual, e
indicar el periodo o los periodos en los cuales la información es dudosa, La cual se puede
reflejar como “picos” muy altos o valores muy bajos, saltos y/o tendencias, los mismos
que deberán comprobarse, si son fenómenos naturales que efectivamente han ocurrido,
o si son producto de errores sistemáticos.

Figura 6 .Serie histórica de caudales promedios anuales.

Para conocer las causas del fenómeno detectado, se puede realizar de diversas formas.

Cuando se tiene estaciones vecinas, se compran los gráficos de las series históricas, y
se observa cual periodo vario notoriamente uno con respecto al otro.

Cuando se tiene una sola estación, esta se divide en varios periodos y se compara con
la información de campo obtenida.

Cuando se tienen datos de precipitación y escorrientillas, se compran los diagramas, los


cuales deben ser similares en su comportamiento.

La interpretación de esta comparación, se efectúa conjuntamente con el análisis doble


masa.
Ejemplo 01.

Dada la serie de caudales promedios de la estación del rio bebedero, que se muestra en
la tabla 1.2, elaborar el hidrograma.

Caudales promedios anuales en m3/s del rio bebedero, periodo 12954-.1993.

Solución:

Graficando los pares de los valores se obtiene la figura 1.3, en el cual, en el eje de la
abscisa se coloca el tiempo en años, y en el eje de ordenadas el caudal en m3/s.

Realizando el análisis visual de la serie histórica, se observa que a partir del año 1979
se produce un salto, este se explica físicamente ya que en ese año existe un trasvase
de rio bebedero, al entrar un proyecto hidroeléctrico arenal- tempisque.

Figura 6.1
Análisis de doble masa.

Cuando se quiere comprobar si los registros de una estación pluviométrica, anuales o


estacionales, no han sufrido variaciones que conduzcan a valores erróneos, se utiliza la
técnica de Doble Masa. Esas variaciones pueden ser por un cambio en la ubicación del
instrumental, una variación en las condiciones periféricas del lugar de medición o un
cambio del observador que efectúa las lecturas.

El método de doble masa considera que en una zona meteorológica homogénea, los
valores de precipitación que ocurren en diferentes puntos de esa zona en períodos
anuales o estacionales, guardan una relación de proporcionalidad que puede
representarse gráficamente. Esa representación consiste en identificar la estación que
queremos controlar, tomando los valores anuales de precipitación. Luego deben
contarse con por lo menos tres (3) estaciones vecinas cuyos registros anuales sean
confiables y que llamaremos estaciones base, cuya serie de datos anuales debe coincidir
con el de la estación a controlar.

En cada año, a partir del primero con registro, se promedian los valores de las estaciones
base y se acumulan por años sucesivos, obteniéndose una precipitación media anual
acumulada.

Luego, en un sistema de ejes ortogonales, se grafica en ordenadas los valores de


precipitación anual acumulada de la estación a controlar y en abscisas los de
precipitación media anual acumulada de las estaciones base. Si los registros no han
sufrido variaciones, los puntos se alinean en una recta de pendiente única, por lo tanto
no será necesario efectuar correcciones.

Si por el contrario hay variaciones en la pendiente de la recta, significa que parte de la


serie contiene valores erróneos por lo cual el registro de datos debe ser corregido a partir
del año en el que cambia la pendiente de la recta. Se obtiene en ese caso un Factor de
Corrección que es proporcional a la variación de la pendiente de la recta (Fig. 4). El factor
de corrección se obtiene haciendo Pc/Pe que en el ejemplo del gráfico será ≥ 1, debido
a que los registros anuales medidos han sido menores a los reales y deben corregirse a
partir del año del error, tomando los valores anuales sin acumular y afectándolos a cada
uno por el factor de corrección.

Para graficar la recta del Doble Masa se construye la Tabla


Figura 6.2 Tabla de cálculo del Análisis de DOBLE MASA

1 2 3 4 5 6 7 8 9
ESTACIÓN BASE ESTACIÓN A CONTROLAR
AÑOS
A B C PROMEDIO ACUM ANUAL ACUM CORREGIDO
1948 914 857 1426 1065 1065 1168 1168 …
1949 888 532 741 720 1785 755 1923 …
… … … … … … … … …
… … … … … … … … …
Se grafican los datos de la columna (6) en abscisas contra los datos de la columna (8)
en ordenadas y se verifica la necesidad o no de efectuar una corrección. En caso
afirmativo, deben corregirse los valores erróneos de la columna (7) y presentarse en la
columna (9) de la Tabla anterior.
7.
ELPROCEDIMIENTO PARA LA COMPLETACIÓN Y EXTENSIÓ
N DE DATOS

Hidrometerologico
7.1 Regresión lineal simple.

a) Se tiene la serie
𝑌,𝑌,𝑌,…………𝑌
𝑋,𝑋,𝑋,…………𝑋 ;𝑋

Donde:
𝑌 = serie de riesgo corto
𝑋 = serie de riesgo largo
𝑛 = Tamaño de período común a ambas series o tamaño del
Registro corto.
𝑛 = Tamaño del período no común.
𝑛 = 𝑛 + 𝑛 = Tamaño del registro largo

b) Se obtiene la ecuación de regresión lineal simple


𝑌 = 𝑎 + 𝑏𝑋 (26)
Donde:
𝑌 = variable hidrológica dependiente
𝑋 = variable hidrológica independiente
𝑎 y 𝑏 = Parámetros del modelo de R.L.S

c) Criterios de confiabilidad.

La ecuación anterior solo se podrá usar cuando hay una correlación


Significativa entre las variables 𝑌 y 𝑋 vale decir si el coeficiente de
correlación “r “de la Ec. r estadísticamente significativa con un cierto nivel
de confiabilidad dado en términos de probabilidad, usando el estadístico
T, para esto se procede de la siguiente forma.
Cálculo del estadístico 𝑇 según:

(𝑛−2)
2 1/2
𝑇 = 𝑟∗

Donde:

Tc = T calculado
n = Número total de datos
r = Coeficiente de correlación

Cálculo de 𝑇

El valor crítico de T se obtiene de las tablas de T de students (T) con


95% de probabilidad, con:

𝛼 = 0.05
G. L = n-2

Comparación del 𝑇 con el 𝑇

Si |𝑇𝑐| ≤ Tt (95%) → r no es significativo, por lo tanto no hay correlación


Significativa.

Si |𝑇𝑐| > Tt (95%) → r si es significativo, por lo tanto si hay correlación


significativa las variables 𝑌 y 𝑋 ; y se puede hacer uso de la Ec. Tc
anterior para la completación y extensión de la información.

Si el coeficiente de correlación r resulta no significativa se puede aplicar el


Proceso de autocorrelación o probar con otra serie.

También podría gustarte