TEORÍA
TEORÍA
TEORÍA
Curso: ESTADÍSTICA
Temas: - ¿Qué es la Estadística?
- Tipos de Variables
Ing. Carlos Alayo Ninaquispe
DEFINICIÓN
La estadística, es la ciencia que se trata de la recopilación, organización,
presentación, análisis e interpretación de datos numéricos con el fin de realizar
una toma de decisión mas efectiva.
ESTADÍSTICA
Recopilar Interpretar
Organizar Analizar
DATOS
Esta orientada a la presentación de datos mediante tablas y
gráficas que permiten resumir o describir el comportamiento
de los mismos, sin realizar inferencias sobre ellos debido a
que son obtenidos de una parte de la población.
LA MUESTRA, es un subconjunto de la
población, para que una muestra sea
representativa su error relativo de
muestreo ERM debe ser <= 5%
PARÁMETRO : Un parámetro es una constante que caracteriza a la población.
El valor de un parámetro es calculado usando todos los datos de la población.
Los parámetros son denotados usando letras griegas (µ , 𝝈𝟐 , 𝝈, 𝒆𝒕𝒄 ).
VARIABLE: EDAD
ESTADO CIVIL
PESO
VALOR: 25 AÑOS
SOLTERO
70 KG.
DATO
CUALITATIVAS CUANTITATIVAS
NOMINAL ORDINAL
NOMINAL ORDINAL
1.LIMA PRIMARIA
LUGAR DE GRADO DE SECUNDARIA
2.TACNA
NACIMIENTO INSTRUCCIÓN
3.PIURA SUPERIOR
V. CUANTITATIVAS •GASTO SEMANAL.
DISCRETAS CONTINUAS
DISCRETAS CONTINUAS
PROMEDIO/MEDIANA/MODA/DESVIACIÓN
RECUENTO / PORCENTAJE % ESTÁNDAR/VARIANZA
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela de Profesional de Ciencia de la Comunicación
Necesidad de resumir la información. Para que los datos sean útiles deben
organizarse para distinguir patrones , tendencias y llegar así conclusiones
lógicas.
Su fórmula es: hi = fi / n
Su fórmula es: Hi = Fi / n
Solución:
Se tiene “n” datos de una variable cuantitativa discreta, denotados por: X1, X2 ,
….. , Xn .
Solución:
La distribución de frecuencias por intervalos (o clases) se usan cuando la
variable estadística es continua o cuando el número de valores distintos de una
variable discreta es muy grande.
1) Determinar el rango “ R ”
C=R/K
MARCA DE CLASE “ X ”
Según Córdova ( 2003) , la marca de clase es el número Xi, que se define como
el punto medio del intervalo.
(𝑳𝒊𝒏𝒇.+𝑳 𝒔𝒖𝒑.)
Xi =
𝟐
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela de Profesional de Ciencia de la Comunicación
Los gráficos nos dan una idea mucho más sintético que los cuadros
estadísticos.
a) Barras
b) Sectores
c) Histogramas de frecuencias
d) Polígonos de frecuencias.
- Se representa mediante una serie de rectángulos separados.
- Se utiliza para representar variables cualitativas y variables
cuantitativas discreta.
SE CONSTRUYE:
SE CONSTRUYE:
SE CONSTRUYE:
SE CONSTRUYE:
Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles
Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación
Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
La estadística descriptiva en su función básica de procesar los datos y
convertirlos en información relevante a considerar en una investigación,
propone un conjunto de indicadores estadísticos que admiten tener una
percepción rápida de lo que ocurre en el objeto de estudio
Debemos tener en cuenta que podemos tener una muestra de pocos datos o un
gran volumen de datos recopilados para una investigación, e inclusive estos
datos pueden estar organizados en una tabla de distribución de frecuencias.
12 30 25
30
10 25 25 20
8 20 20
15
6 15 15
10
4 10 10
2 5 5 5
0 0 0 0
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
NOTAS Xi Fi
8 3
10 4
12 7
14 8
16 15
18 9
20 4
PESOS (KG) Xi fi
[60 – 64 > 2
[64 - 68 > 12
[68 – 72 > 8
[72 – 76 > 6
[76 – 80 ] 2
Longitud (cm) fi
8 8
10 16
12 12
15 8
17 24
20 32
6. De muestra obtenida se tiene la distribución siguiente; son las edades
de jubilados que cobran en un determinado banco. Calcule la mediana
e interprétala.
Edades de los fi
jubilados
[ 60 – 64 > 2
[64 – 68 > 12
[ 68 – 72 > 8
[ 72 – 76 > 6
[ 76 – 80 ] 2
7. Hallar la Moda en los siguientes datos:
a) 7 , 13 , 15 , 15 , 17 ,21
b) 5 , 6 , 7 , 7 , 9 ,9, 9 ,10 , 10
c) 13 , 19 , 21 , 37 , 38
8. S e tiene los siguientes datos ubicados en una tabla, hallar la moda:
X fi
17 10
21 18
25 22
29 19
33 11
9. De muestra obtenida se tiene la distribución siguiente; son las edades
de jubilados que cobran en un determinado banco. Calcule la moda
Edades de los fi
jubilados
[ 60 – 64 > 2
[64 – 68 > 12
[ 68 – 72 > 8
[ 72 – 76 > 6
[ 76 – 80 ] 2
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela Profesional de Ciencia de la comunicación
Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles
Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación
Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
Dado un conjunto de elementos que se ordenan de acuerdo con su magnitud, el
valor medio que divide al conjunto de datos en dos partes iguales o la media
aritmética de los dos valores medios de dicho conjunto dan como resultado a la
mediana.
El tercer cuartil Q3 es el valor que indica en el cual, o por debajo del cual, queda el 75% o
las tres cuartas partes de todos los datos.
Los cuartiles son los 3 valores que dividen la serie de datos en 4 partes iguales.
Corresponden a los valores que acumulan el 25%, 50%, 75 % de los datos.
Para calcular los cuartiles, en primer lugar, debemos tener ordenado el arreglo de datos
de menor a mayor.
A continuación debe utilizarse la siguiente fórmula que nos señala la ubicación del cuartil
deseado en el arreglo de datos.
K(n 1)
Qk : 4 ; K=1,2,3
Es importante señalar que se deben utilizar las mismas reglas para la búsqueda de
deciles, cuando el resultado de la formula da entero, fracción con decimal 5 o otra forma
decimal
Ejemplo:
Las edades (años) de 12 estudiantes universitarios tomados al azar fueron:
18, 22, 19, 20, 21, 22, 23, 20, 19, 24, 22, 21. Calcular el primer cuartil.
Se solicita la posición del cuartil, aplicando la fórmula de posición:
𝑘(𝑛 + 1) k= orden del cuartil
𝑄𝑘 :
4 n= número de datos
𝑘(𝑛 + 1) 1 ∗ (12 + 1)
Aplicar la fórmula 𝑄1 :
4
=
4
= 3,25
El primer cuartil se encuentra en el término o lugar 3,25. Se debe interpolar
entre las edades 19 y 20; que representan las posiciones 3 y 4.
𝑸𝟏 = 𝟏𝟗 + 𝟎, 𝟐𝟓 ∗ 𝟐𝟎 − 𝟏𝟗 = 𝟏𝟗, 𝟐𝟓 𝒂ñ𝒐𝒔
Kn
4 F i 1
Qk Li A; K 1,2,3
fi
K(n 1)
Dk 10 ; K 1,2,3,.. 9
Ahora para calcular los deciles para datos agrupados, debemos recurrir a la siguiente
fórmula, idéntica salvo por un detalle para el cálculo de la mediana para datos agrupados:
Kn
10 F i 1
Dk Li A; k 1,2,3, 9
fi
Para calcular los percentiles, en primer lugar, debemos tener ordenado el arreglo de datos de
menor a mayor.
A continuación debe utilizarse la siguiente fórmula que nos señala la ubicación del percentil
deseado en el arreglo de datos.
k (n 1)
Pk ;1,2,3...,99
100
Es importante señalar que se deben utilizar las mismas reglas para la búsqueda de cuartiles,
cuando el resultado de la formula da entero, fracción con decimal 5 o otra forma decimal
Ahora para calcular los percentiles para datos agrupados, debemos recurrir a la siguiente
fórmula:
kn
100 F i 1
Pk Li f A; k 1,2,3,.., 99
i
En los deciles, el séptimo decil, es aquel valor de la variable que supera al 70% de las
observaciones y a la vez es superado por el 30%.
Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles
Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación
Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
Las medidas de dispersión son valores que
indican la variabilidad de una distribución
respecto a una medida de tendencia central.
Dado por medio de un número.
Varianza
Desviación
Estándar
Coeficiente
de
Variación
Es la medida de dispersión más sencilla. Se determina restando , el
valor máximo del valor mínimo , de los datos.
R = 22 – 12.5 = 9.5
Para Córdova (2003, p.65) la varianza es la media aritmética
de los cuadrados de las diferencias de los datos, con respecto
a su media aritmética”
Donde:
Xi : valores de la variable X
Yi :marca de clase de cada variable o grupo.
N : tamaño de la población
.
n : tamaño de la muestra
σ² :Varianza poblacional
S² :Varianza muestral
La desviación estándar, se define como la raíz cuadrada de la
varianza.
2
S
2
s
Es el grado de desviación con respecto a la media.
S
CV 100
x
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela Profesional de Ciencia de la comunicación
Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles
Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación
Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
Las medidas de distribución nos permiten identificar la forma en que se separan o
aglomeran los valores de acuerdo a su representación gráfica.
Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la información .
Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de
generar el gráfico.
a) Coeficiente de asimetría
Las medidas de forma de las distribuciones mide si los valores de la variable están más o menos
uniformemente repartidos a lo largo de la muestra.
La asimetría de un conjunto de datos puede definirse de diversas formas, se utiliza la
desviación que tiene la distribución de un conjunto de datos con respecto a la
distribución normal para juzgar si un conjunto de datos es simétrico o no. Recuérdese
que una distribución es simétrica y unimodal, cuando promedio=mediana=moda,
luego la fórmula del coeficiente de asimetría es:
ഥ − 𝒎𝒆)
𝟑(𝑿
𝑪𝑨 =
𝑺
La fórmula de CA debe utilizarse solo en aquellos datos que son unimodales.
La interpretación del coeficiente de asimetría CA es la siguiente
ഥ )^𝟒
σ 𝑿𝒊− 𝑿
k=
𝑺𝟒
La interpretación del valor del coeficiente de
curtosis K es:
38 51 32 65 25 28 34 12 29 43
71 62 50 37 8 24 19 47 81 53
16 62 50 37 4 17 75 94 6 25
55 38 46 70 72 64 61 33 59 21
13 92 37 43 50 52 88 27 74 66
63 28 36 19 56 84 38 6 42 50
98 51 62 3 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
38 20 70 34 5 59 20 68 55 49
33 42 14 40 30 54 50 11 41 76
13 92 37 43 58 52 88 26 74 66
55 38 46 16 72 64 61 33 59 21
63 28 36 19 56 54 38 60 42 50
Elementos básicos
TOTAL
4. Completar en el recuadro.