La Varianza Es Una

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

La varianza es una medida de dispersión que representa la variabilidad de

una serie de datos respecto a su media. Formalmente se calcula como la


suma de las residuos al cuadrado divididos entre el total de
observaciones.
También se puede calcular como la desviación típica al cuadrado. Dicho sea de
paso, entendemos como residuo a la diferencia entre el valor de una variable
en un momento y el valor medio de toda la variable.

Fórmula para calcular la varianza


La unidad de medida de la varianza será siempre la unidad de medida
correspondiente a los datos pero elevada al cuadrado. La varianza siempre es
mayor o igual que cero. Al elevarse los residuos al cuadrado es
matemáticamente imposible que la varianza salga negativa. Y de esa forma no
puede ser menor que cero.

O lo que es lo mismo:

¿Por qué se elevan al cuadrado los


residuos?
La razón por la que los residuos se elevan al cuadrado se sencilla. Si no se
elevasen al cuadrado, la suma de residuos sería cero. Es una propiedad de los
residuos. Así pues para evitarlo, tal como ocurre con la desviación típica se
elevan al cuadrado. El resultado es la unidad de medida en la que se miden los
datos pero elevada al cuadrado. Por ejemplo, si tuviésemos datos sobre los
salarios de un conjunto de personas en euros, el dato que arroja la varianza
sería en euros cuadrados. Para que tenga sentido la interpretación
calcularíamos la desviación típica y pasaríamos el dato a euros.

1
1. Desviación -> (2-3) = -1
2. Desviación -> (4-3) = 1
3. Desviación -> (2-3) = -1
4. Desviación -> (4-3) = 1
5. Desviación -> (2-3) = -1
6. Desviación -> (4-3) = 1
Si sumamos todas las desviaciones el resultado es cero.

¿Qué diferencia existe entre la varianza y


la desviación típica?
Una cuestión que se podría plantear, y con razón, sería la diferencia entre
varianza y desviación típica. En realidad, vienen a medir lo mismo. La varianza
es la desviación típica elevada al cuadrado. O al revés, la desviación típica es
la raíz cuadrada de la varianza.

La desviación típica se hace para poder trabajar en las unidades de medida


iniciales. Claro que, como es normal, uno puede preguntarse, ¿de qué sirve
tener como concepto la varianza? Bien, aunque la interpretación del valor que
arroja no nos da demasiada información, su cálculo es necesario para obtener
el valor de otros parámetros.

Para calcular la covarianza necesitamos la varianza y no la desviación típica,


para calcular algunas matrices econométricas se utiliza la varianza y no la
desviación típica. Es una cuestión de comodidad a la hora de trabajar con los
datos en según qué cálculos.

Ejemplo de cálculo de la varianza


Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas,
cada uno con un salario diferente:

Juan: 1.500 euros

Pepe: 1.200 euros

José: 1.700 euros

2
Miguel: 1.300 euros

Mateo: 1.800 euros

La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 +


1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.

Dado que la fórmula de la varianza en su forma desglosada se formula como


sigue:

Obtendremos que se debe calcular tal que:

El resultado es de 52.000 euros al cuadrado. Es importante recordar que


siempre que calculamos la varianza tenemos las unidades de medida al
cuadrado. Para pasarlo a euros, en este caso tendríamos que realizar
la desviación típica. El resultado aproximado sería de 228 euros. Esto quiere
decir que, en media, la diferencia entre los salarios de las distintas personas
será de 228 euros.

3
Desviación típica
José Francisco López
Lectura: 3 min

La desviación típica es la desviación media de una variable respecto a su


media o esperanza matemática. La desviación típica es siempre mayor o
igual que cero.
Para entender este concepto necesitamos analizar 2 conceptos fundamentales.

 Esperanza matemática, valor esperado o simplemente media: Es la


media de nuestra serie de datos.
 Desviación: La desviación es la separación que existe entre un valor
cualquiera de la serie y la media.
Ahora, entendiendo estos dos conceptos la desviación típica se calculará de
forma similar a la media. Pero tomando como valores las desviaciones. Y
aunque este razonamiento es intuitivo y lógico tiene un fallo que vamos a
comprobar con el siguiente gráfico.

En la imagen anterior tenemos 6 observaciones, es decir, N = 6. La media de


las observaciones está representa por la línea negra situada en el centro del
gráfico. Entenderemos por desviación, la diferencia que existe entre cualquiera
de las observaciones y la línea negra. Así pues, tenemos 6 desviaciones.

1. Desviación -> (2-3) = -1


2. Desviación -> (4-3) = 1
3. Desviación -> (2-3) = -1
4. Desviación -> (4-3) = 1
5. Desviación -> (2-3) = -1
6. Desviación -> (4-3) = 1
Como podemos ver si sumamos las dos desviaciones 6 desviaciones y
dividimos entre N (6 observaciones), el resultado es cero. La lógica sería que la
desviación media fuese de 1. Pero una característica matemática de la media
respecto a los valores que la forman es, precisamente, que la suma de las
desviaciones es cero.  ¿Cómo arreglamos esto? Tenemos dos alternativas
para calcular la desviación media:

4
Fórmulas para calcular la desviación
típica
La primera es elevando al cuadrado las desviaciones, dividir entre el número
total de observaciones y por último hacer la raíz cuadrada para deshacer el
elevado al cuadrado, tal que:

La segunda, más intuitiva, consiste en calcular la suma de las desviaciones en


valor absoluto y por último dividir entre el total de observaciones n, tal que:

Ejemplo de cálculo de la desviación típica


Vamos a comprobar como, con cualquiera de las dos fórmulas expuestas, el
resultado de la desviación típica o desviación media es el mismo .

Según la fórmula de la varianza (raíz cuadrada):

5
Según la fórmula del valor absoluto:

Tal como dictaba el cálculo intuitivo. La desviación media es de 1. Este ejemplo


es sencillo y gracias a él se puede comprender fácilmente el significado de la
desviación. En otros casos tendremos mayor cantidad de observaciones y
números con valores aleatorios sin relación entre sí. No obstante, la fórmula
que se aplica es la misma.

La relación de la desviación típica con la


varianza
En definitiva la varianza no es más que la desviación típica al cuadrado. O lo
que viene a ser lo mismo, la desviación típica es la raíz cuadrada de la
varianza. Se relacionan de la siguiente forma:

Tras esta imagen, queda claro que toda la fórmula que está dentro de la raíz
cuadrada es la varianza. La razón por la que es necesario entender que esa
parte se conoce como varianza es que se utiliza en otras fórmulas para calcular
otras medidas. Así pues aunque la desviación típica sea más intuitiva para
interpretar resultados, es imperativo cómo se calcula la varianza.

6
Coeficiente de variación
Francisco Javier Marco Sanjuán
Lectura: 3 min

El coeficiente de variación, también denominado como coeficiente de


variación de Spearman, es una medida estadística que nos informa acerca
de la dispersión relativa de un conjunto de datos. Su cálculo se obtiene
de dividir la desviación típica entre el valor absoluto de la media del
conjunto y por lo general se expresa en porcentaje para su mejor
comprensión.
El coeficiente de variación se puede ver expresado con las letras CV o r,
dependiendo del manual o la fuente utilizada. Su fórmula es la siguiente:

El coeficiente de variación se utiliza para comparar conjuntos de datos


pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que
este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de
variación nos permite tener una medida de dispersión que elimine las posibles
distorsiones de las medias de dos o más poblaciones.

Ejemplos de uso del coeficiente de


variación en lugar de la desviación
típica
Comparación de conjuntos de datos de diferente dimensión
Se quiere comprar la dispersión entre la altura de 50 alumnos de una clase y su
peso. Para comparar la altura podríamos utilizar como unidad de medida
metros y centímetros y para el peso el kilogramo. Comparar estas dos
distribuciones mediante la desviación estándar, no tendría sentido dado que se
pretenden medir dos variables cualitativas distintas (una medida de longitud y
una de masa).

Comparar conjuntos con gran diferencia entre medias


Imaginemos por ejemplo que queremos medir el peso de los escarabajos y el
de los hipopótamos. El peso de los escarabajos se mide en  gramos o
miligramos y el peso de los hipopótamos por lo general se mide en toneladas.
Si para nuestra medición convertimos el peso de los escarabajos a toneladas
para que ambas poblaciones estén en la misma escala, utilizar la desviación
7
estándar como medida de dispersión no sería lo adecuado. El peso medio de
los escarabajos medido en toneladas sería tan pequeño, que si utilizamos la
desviación estándar, apenas habría dispersión en los datos. Esto sería un error
dado que el peso entre las diferentes especies de escarabajos puede variar de
manera considerable.

Ejemplo de cálculo del coeficiente de


variación
Pensemos en una población de elefantes y otra de ratones. La población de
elefantes tiene un peso medio de 5.000 kilogramos y una desviación típica de
400 kilogramos. La población de ratones tiene un peso medio de 15 gramos y
una desviación típica de 5 gramos. Si comparáramos la dispersión de ambas
poblaciones mediante la desviación típica podríamos pensar que hay mayor
dispersión para la población de elefantes que para la de los ratones.

Sin embargo al calcular el cofieicnete de variación para ambas poblaciones,


nos daríamos cuenta que es justo al contrario.

Elefantes:  400/500=0,08
Hormigas:  5/15=0,33

Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación


para los elefantes es de apenas un 8%, mientras que el de las ratones es de un
33%. Como consecuencia de la diferencia entre las poblaciones y su peso
medio, vemos que la población con mayor dispersión, no es la que tiene una
mayor desviación típica.

8
Coeficiente de correlación
lineal
Alfonso Peiro Ucha
Lectura: 2 min

La correlación, también conocida como coeficiente de correlación lineal


(de Pearson), es una medida de regresión que pretende cuantificar el
grado de variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre
dos variables, es decir, si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo
bien o lo mal que el conjunto de puntos representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el
grado de intensidad y el sentido de la relación entre dos variables.

Siendo:

Cov (x;y): la covarianza entre el valor «x» e «y».


σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
Valores que puede tomar la correlación
ρ = -1          Correlación perfecta negativa
ρ = 0           No existe correlación
ρ = +1         Correlación perfecta positiva
Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y»
sube, y además con la misma intensidad (+1).

En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y
además con la misma intensidad, entonces estamos hablando de correlación
negativa (-1).

9
Es importante saber que esto no quiere decir que lo hagan en la misma
proporción (salvo que tengan la misma desviación típica).

Representación gráfica de la correlación


Correlación perfecta positiva:

No hay correlación:

Correlación perfecta negativa:

10
Consejo: en muchas ocasiones, no tenemos los medios o los datos suficientes
para utilizar esta formula. Por ello, si tenemos dos series de precios, podemos
calcular el coeficiente de correlación en excel, usando la siguiente función:
coef.de.correl(serie de precios x;serie de precios y).

Para realizar el cálculo de la varianza estadística de un conjunto de datos


podremos seguir ciertos pasos que explicaremos en este artículo. Los niños
podrán comenzar a entender para qué sirve la varianza en estadística y
emplear la calculadora de varianza online para iniciarse en el mundo de la
estadística y probabilidad.

Calcular varianza paso a paso


Partiendo de la base que para la z es una medida de dispersión, veremos
cómo calcular la varianza paso a paso partiendo de una muestra o población.

Escribir la fórmula para calcular la varianza


Escribiremos la fórmula para calcular la varianza y para ello deberemos
conocer el significado de cada una de las variables.

s2 = Varianza
Σ = Sumatoria, lo cual significa la suma de cada término de la ecuación después del signo
de la suma.
xi = Observación de la muestra. Representa cada dato en el conjunto.
x̅ = Media Aritmética. Representa el promedio de todos los números en el conjunto.
n = Tamaño de la muestra. Es el número de términos en el conjunto.

Calcular la suma de los datos


Crearemos una tabla que contenga la columna para los datos, la media
aritmética (X), la media aritmética menos cada uno de los datos (xi-x̅ )2.
Después de realizar la tabla y haber distribuido los datos de la primera columna
sumaremos los números del conjunto.

Calcular la media aritmética
11
Para realizar el cálculo de la media aritmética sumaremos el conjunto de
datos y dividiremos el resultado por el número de datos.

Restar la media aritmética de cada dato


Llenaremos la tercera columna cogiendo cada dato de la muestra y restándole
la media. Podremos comprobar si nuestro cálculo ha sido correcto sumando
todos los resultados y viendo que la suma es cero.

Elevar al cuadrado cada resultado anterior


En la cuarta columna de la tabla, escribiremos el resultado obtenido del
cuadrado de los números anteriores. Deberán ser positivos.

Calcular la suma de los números al cuadrado


Sumaremos los números del paso anterior y ese será el numerador de
la fórmula de la varianza.

Sustituir los valores en la fórmula de la varianza


Reemplazaremos cada uno de los valores en la ecuación original, siendo n el
tamaño de la muestra o número de datos y resolveremos la ecuación.

Ejemplos de varianza estadística


Un ejemplo de cálculo de varianza siguiendo los pasos anteriores será el
siguiente:
En un partido de baloncesto, se tiene la siguiente anotación en los jugadores
de un equipo: 0,2,4,5,8,10,10,15,38. Calcular la varianza de las puntuaciones
de los jugadores del equipo.

Aplicando la fórmula x=0+2+4+5+8+10+10+15+38 / 9 = 92 / 9 = 10.22


obtenemos la media

Seguidamente se aplica la fórmula de la varianza:


σ2=(0−10.22)2+(2−10.22)2+(4−10.22)2+(5−10.22)2+(8−10.22)2+(10−10.22)2+(10−
10.22)2+(15−10.22)2+(38−10.22)2/ 9 =

10.222+8.222+6.222+5.222+2.222+0.222+4.782+27.782 / 9 =

104.4484+67.5684+38.6884+27.2484+4.9284+0.0484+22.8484+771.72849 =
1037.5556 / 9 = 115.28 será la varianza estadística.

Fórmula de la varianza
La fórmula para la varianza de una muestra es:

12
Qué es la varianza?

Se conoce como varianza a la raíz cuadrada que se desprende de una


desviación estándar, la cual permite que las industrias de manufactura
encuentren precisión en el trabajo y producción y, al mismo tiempo,
reduzcan el índice de errores.
Esto sucede ya que la varianza toma los datos dispersos de la media y
luego de medirlos le da valor a las variaciones y a las desviaciones y
también contabiliza y asume los errores cometidos previniendo
posibles errores.

¿Para qué sirve la varianza?

Al proponer la utilización de la varianza,  Ronald Ficher mencionó


que serviría para saber y considerar el valor medio de una
variable. Así que, la varianza fue creada para determinar si las
diferencias que existen entre medias de muestreo exponen las
diferencias que hay entre los valores medios.
Así se identifica el valor por medio de una raíz cuadrada, la cual
permite saber cuán dificultoso es el margen de errores y realizar un

13
plan específico y exitoso. Es por eso que la varianza  es utilizada por
las empresas e industrias como método de prevención y de
visualización hacia el futuro. 

Fórmula para calcular la varianza

La fórmula utilizada para calcular la varianza es la siguiente:

Fórmula para calcular la varianza

La varianza es representada por “σ²” (una letra griega sigma y elevada


al cuadrado) y se hace el cálculo con la forma ya descrita.
El valor de Xm, es obtenido a través de la media aritmética o
promedio de los valores a analizar. Mientras que  Xn se obtiene a
través del valor a analizar.

Ejemplo de varianza

Para entender mejor este concepto, pongamos el siguiente


ejemplo: Una empresa quiere calcular la varianza de las toneladas de
alimento que ha vendido en los últimos 6 meses.

14
Mes Cantidad vendida

Enero 18

Febrero 20

Marzo 20

Abril 22

Mayo 20

Junio 20

El primer paso para calcular la varianza, es calcular la media


aritmética (promedio), esta se obtiene teniendo en cuenta que la
cantidad de valores a analizar son 6  (los últimos meses):
(18 + 20 + 20 + 22 + 20 + 20) / 6 =  20
Una vez obtenida la media aritmética, en este caso 20, procedemos a
calcular la varianza, utilizando la fórmula antes mencionada:

σ²=  [(18-20) 2   + (20-20) 2   + (20-20) 2   +  (22-20) 2   + (20-20) 2   + (20-20) 2 ] /


6  =  2,67
En conclusión, la varianza obtenida (σ²) dio como resultado 2,67.

15
16

También podría gustarte