Trabajo Individual N2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

UNIVERSIDAD NACIONAL

MAYOR DE SAN MARCOS


(Universidad del Perú, Decana de América)

FACULTAD DE INGENIERÍA ELECTRÓNICA Y ELECTRÍCA

“Estudio estadístico comparativo entre la


Correlación estadística y el Coeficiente de
Correlación”
Curso: Comunicación Digital (Grupo: L12)
Horario: lunes 18-20pm
Profesor : Milton Ríos Julcapoma

EAP: Ing. Electrónica


Alumno: Sánchez López Felipe Antonio
Código: 16190099
Correo: felipe.sanchez2@unmsm.edu.pe
Semestre: 2021-I
RESUMEN
En este trabajo haremos uso de Excel en la cual aplicaremos los conceptos
explicadores en clase, trabajaremos en base a un archivo Excel el cual nos fue
proporcionado previamente en los cuales realizaremos su análisis estadístico
de los datos de humedad y temperatura, procederemos a hallar valor medio,
varianza, desviación estándar, covarianza, coeficiente de correlación,
relacionaremos graficas halladas correspondientemente.

BASES TEORICAS
Medidas de tendencia central
son medidas estadísticas que pretenden resumir en un solo valor a un conjunto
de valores. Representan un centro en torno al cual se encuentra ubicado el
conjunto de los datos. Las medidas de tendencia central más utilizadas son:
media, mediana y moda. Las medidas de dispersión en cambio miden el grado
de dispersión de los valores de la variable. Dicho en otros términos las medidas
de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De
esta forma, ambos tipos de medidas usadas en conjunto permiten describir un
conjunto de datos entregando información acerca de su posición y su
dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se
encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”. Según este criterio, haremos primero el estudio de las medidas
estadísticas para datos no agrupados y luego para datos agrupados.

Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética
o promedio aritmético. Se representa por la letra griega µ cuando se trata del
promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del
promedio de la muestra. Es importante destacar que µ es una cantidad fija
mientras que el promedio de la muestra es variable puesto que diferentes
muestras extraídas de la misma población tienden a tener diferentes medias.
La media se expresa en la misma unidad que los datos originales: centímetros,
horas, gramos, etc.

Varianza
Es una medida de dispersión que se utiliza para representar la variabilidad de un
conjunto de datos respecto de la media aritmética de los mismo. Así, se calcula
como la suma de los residuos elevados al cuadrado y divididos entre el total de
observaciones. No obstante, se trata de una medida que también puede calcularse
como la desviación típica al cuadrado.
Fue Ronald Fisher, un matemático, físico, biólogo y estadístico de nacionalidad
inglesa, quien, en el año 1918, introdujo el término de varianza en uno de sus
estudios sobre biometría. Al mismo también, también fue el primero en introdujo los
estudios sobre el análisis de esta medida de la dispersión.

 N representa el número total de observaciones o de datos utilizados para el


cálculo de la varianza.
 x representa los datos utilizados para el cálculo de la varianza.
 x’ representa la media aritmética calculada con los datos utilizados para el
cálculo de la varianza.

Desviación Estándar

La desviación estándar es la medida de dispersión más común, que indica qué


tan dispersos están los datos con respecto a la media. Mientras mayor sea la
desviación estándar, mayor será la dispersión de los datos.El símbolo σ
(sigma) se utiliza frecuentemente para representar la desviación estándar de
una población, mientras que s se utiliza para representar la desviación estándar
de una muestra. La variación que es aleatoria o natural de un proceso se
conoce comúnmente como ruido.La desviación estándar se puede utilizar para
establecer un valor de referencia para estimar la variación general de un
proceso.

Covarianza
La covarianza es el valor que refleja en qué cuantía dos variables aleatorias
varían de forma conjunta respecto a sus medias.

Nos permite saber cómo se comporta una variable en función de lo que


hace otra variable. Es decir, cuando X sube ¿Cómo se comporta Y? Así
pues, la covarianza puede tomar los siguientes valores:

 Covarianza (X, Y) es menor que cero cuando “X” sube e “Y” baja.
Hay una relación negativa.
 Covarianza (X, Y) es mayor que cero cuando “X” sube e “Y” sube.
Hay una relación positiva.
 Covarianza (X, Y)  es igual que cero cuando no hay relación
existente entre las variables “X” e “Y”.

Dónde la y con el acento es la media de la variable Y, y la x con el acento es la


media de la variable X. “i” es la posición de la observación y “n” el número total
de observaciones.

DESARROLLO DEL TRABAJO


Datos de humedad y temperatura proveídos en un archivo Excel en
clase

Inicialmente comenzamos hallando los valores promedios de la Humedad


y Temperatura
Luego procedemos a hallar sus valores de dispersión

Luego hallamos la dispersión conjunta entre la humedad y la temperatura

Ahora su coeficiente de correlación

Grafica del coeficiente de correlación entre humedad y temperatura


Aplicar una transformación lineal a los datos de temperatura simulando ser una
nueva escala de temperatura (nueva unidad de temperatura).
Se hace uso de una nueva escala para la temperatura, para lo cual pasamos
los centígrados a Fahrenheit con la siguiente formula de conversión.

Luego procedemos a hallar las mismas ecuaciones con la nueva temperatura


Valores promedios

valores de dispersión

Luego hallamos la dispersión conjunta entre la humedad y la temperatura


Ahora su coeficiente de correlación

Grafica del coeficiente de correlación entre humedad y temperatura

La gráfica de dispersión presenta cuna linealidad de tipo inversa

Presentar en un cuadro comparativo todos los valores estadísticos correspondientes al


caso de la temperatura en grados centígrados (calculo hecho en clase) y la “nueva
escala de temperatura”

Estadística H y T(centígrados) H y T1(Fahrenheit)


Media E(H)= E(T)= E(H)= E(T1)=
aritmética 79.53583618 23.72525597 79.5358361 77.70546075
8
Covarianza -10.2196764 -18.3954175

Desviación σ(H)= σ(T)= σ(H)= σ(T1)=


estándar 49.50468846 3.202672716 49.5046884 10.3766596
6

Coef. de -0.81162927 -0.81162927


correlación

CONCLUSIONES

 El coeficiente de correlación nos muestra el nivel de correlación y


el tipo de relación (inversa o directa).
 Obtuvimos características estadísticas diferentes, pero al final se
pudo concluir que el coeficiente de relación es el mismo.
 La transformación lineal en este caso el cambio de temperatura no
afecta al resultado del coeficiente de correlación

Bibliografía
 https://www.medwave.cl/medios/medwave/marzo2011/1/medwave.2011.03.
4934.pdf
 https://www.sdelsol.com/glosario/varianza/
 https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/statistics/basic-statistics/supporting-topics/data-concepts/what-is-the-
standard-deviation/

También podría gustarte