TEORÍA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 106

Universidad Nacional Jorge Basadre Grohmann

Escuela Profesional de Ciencia de la comunicación

Curso: ESTADÍSTICA
Temas: - ¿Qué es la Estadística?
- Tipos de Variables
Ing. Carlos Alayo Ninaquispe
DEFINICIÓN
La estadística, es la ciencia que se trata de la recopilación, organización,
presentación, análisis e interpretación de datos numéricos con el fin de realizar
una toma de decisión mas efectiva.

ESTADÍSTICA

Ciencia que busca

Recopilar Interpretar
Organizar Analizar

DATOS
Esta orientada a la presentación de datos mediante tablas y
gráficas que permiten resumir o describir el comportamiento
de los mismos, sin realizar inferencias sobre ellos debido a
que son obtenidos de una parte de la población.

Estudia los resúmenes de datos con referencia a un modelo de


distribución probabilístico o una familia de modelos,
determinando márgenes de incertidumbre en las estimaciones de
los parámetros desconocidos del mismo. Se supone que el
conjunto de datos analizados es una muestra de una población y
el interés principal es predecir o estimar el comportamiento de la
población, a partir de los resultados en la muestra.
La unidad de análisis o de investigación es el elemento al cual
se investiga. Este puede ser un objeto, una persona, un grupo
de individuos o un acontecimiento. La unidad debe ser
coherente con el tipo de investigación que se está realizando y
se debe tener en cuenta que las características que posea el
elemento no sean ambiguas, sean entendibles y que permitan
mediciones y comparaciones .
LA POBLACIÓN, es la totalidad de
elementos a estudiar, los cuales
presentan determinadas características
susceptible de ser estudiada.

LA MUESTRA, es un subconjunto de la
población, para que una muestra sea
representativa su error relativo de
muestreo ERM debe ser <= 5%
PARÁMETRO : Un parámetro es una constante que caracteriza a la población.
El valor de un parámetro es calculado usando todos los datos de la población.
Los parámetros son denotados usando letras griegas (µ , 𝝈𝟐 , 𝝈, 𝒆𝒕𝒄 ).

ESTIMADOR (Valor estadístico, estadígrafo, estadística).Un estimador es una


función definida sobre la muestra y no depende de ningún parámetro
desconocido. En otras palabras, el valor del estimador es calculado a partir de
la muestra. El rol del estimador es informar al investigador acerca del posible
valor del parámetro. El estimador se caracteriza porque su valor puede
cambiar de una muestra a otra, es decir, no es constante. Los estimadores se
ഥ , 𝒔𝟐 , 𝒄𝒗, 𝒎𝒆 , 𝒎𝒐 , 𝒆𝒕𝒄).
notan por letras latinas : 𝒙
Es una cualidad o característica de un individuo que esta
propenso a adquirir diferentes valores.
ELEMENTOS DE UN DATO
¿Cuál
es su
edad? 25
AÑOS UNIDAD DE
ANALISIS

VARIABLE: EDAD
ESTADO CIVIL
PESO

VALOR: 25 AÑOS
SOLTERO
70 KG.

DATO
CUALITATIVAS CUANTITATIVAS

NOMINAL ORDINAL DISCRETAS CONTINUAS


V. CUALITATIVAS

Son aquellas que clasifican los


elementos de la muestra o población en
categorías, características, atributos o
cualidades.

Son aquellas que no pueden ser medidas


con números.
CUALITATIVAS

NOMINAL ORDINAL

- Son categorías no - Son categorías ordenada


ordenada - Siguen un orden que va de
- No tienen un criterio de la categoría más baja a la
orden más alta o viceversa.
- No siguen un orden.
CUALITATIVAS

NOMINAL ORDINAL

Ejemplos: Sexo , Colores, Ejemplos: Nivel socio económico,


Profesión, Estado civil, Religión, Nivel de educación, Calidad.
Afiliación política.

1.LIMA PRIMARIA
LUGAR DE GRADO DE SECUNDARIA
2.TACNA
NACIMIENTO INSTRUCCIÓN
3.PIURA SUPERIOR
V. CUANTITATIVAS •GASTO SEMANAL.

Son aquellas que miden de manera


S/.
numérica y cuantificable el conjunto de
observaciones de la muestra o población. $
Se expresan mediante un número, y se
pueden realizar operaciones matemáticas
con ellas. •VELOCIDAD.
CUANTITATIVAS

DISCRETAS CONTINUAS

No hay valores intermedios Hay valores intermedios entre dos


entre dos valores consecutivos valores consecutivos.
CUANTITATIVAS

DISCRETAS CONTINUAS

Ejemplos: Números de hijos, Ejemplos: Peso , Salario , Estatura,


Semestre que cruzas, número Distancia.
de empleados, Edad en años
cumplidos.

PROMEDIO/MEDIANA/MODA/DESVIACIÓN
RECUENTO / PORCENTAJE % ESTÁNDAR/VARIANZA
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela de Profesional de Ciencia de la Comunicación

TEMA: TABLAS DE FRECUENCIAS


Ing. Carlos Alayo Ninaquispe
RECOLECCIÓN DE DATOS

Es un procedimiento y/o actividad que le permite al investigador obtener la información


necesaria para dar respuesta a su pregunta de investigación. Cada técnica de
recolección de datos tiene su propio instrumento.
TÉCNICA INSTRUMENTO

1) Encuesta 1) Cuestionario, test, prueba.


2) Entrevista 2) Guía de entrevista
3) Focus Group 3) Guía de moderación
4) Análisis documental 4) Ficha de registro de datos
5) Observación no 5) Guía de observación
experimental 6) Guía de observación / ficha
6) Observación experimental de registro de datos.
BASE DE DATOS

Una base de datos o banco de datos es un conjunto de datos pertenecientes a un


mismo contexto y almacenados sistemáticamente para su posterior uso. En este
sentido; una biblioteca puede considerarse una base de datos compuesta en su
mayoría por documentos y textos impresos en papel e indexados para su consulta
de datos.
DISTRIBUCIÓN DE
FRECUENCIAS
DEFINICIÓN Y USO

 Necesidad de resumir la información. Para que los datos sean útiles deben
organizarse para distinguir patrones , tendencias y llegar así conclusiones
lógicas.

 Una forma de organizar un conjunto de datos es clasificarlos en categorías o


clases y luego contar cuántas observaciones quedan dentro de cada categoría.
FRECUENCIA ABSOLUTA SIMPLE (fi): Es el número de veces que se repite un
determinado valor , en un conjunto de datos.

PROPIEDAD : La suma de todas las frecuencias es igual al total de datos


observados n.

FRECUENCIA RELATIVA SIMPLE (hi): Es el cociente entre la frecuencia absoluta


simple y el número total de datos (n).

Su fórmula es: hi = fi / n

PROPIEDAD : La suma de todas las frecuencias relativas es igual a 1.


FRECUENCIA ABSOLUTA ACUMULADA (Fi): Es igual a la suma de las frecuencias
absolutas simples inferiores o iguales a las frecuencias acumuladas que se desea
encontrar.

PROPIEDAD : La última frecuencia acumulada absoluta es igual al total de


observaciones.

FRECUENCIA RELATIVA ACUMULADA (Hi): Es aquella que resulta de dividir cada


una de las frecuencias absolutas acumuladas entre el número total de observaciones.

Su fórmula es: Hi = Fi / n

PROPIEDAD : La última frecuencia relativa acumulada es la unidad.


Si la variables X es cualitativa observada en una muestra de “n” datos, se
observan “m” categorías o modalidades diferentes, C1 , C2 , …….., Cm .

La tabulación de estos “n” datos es la distribución de frecuencias por


categorías.
En una encuesta realizada a veinte clientes sobre la opinión
acerca del nivel de atención en un Supermercado, brindaron las
siguientes respuestas:

Solución:
Se tiene “n” datos de una variable cuantitativa discreta, denotados por: X1, X2 ,
….. , Xn .

Donde X1: Representa la i-ésima observación de la variable X.

Si algunos valores se repiten y si al terminar el ordenamiento se obtienen K


valores distintos, digamos que X1, X2, …., Xk, con frecuencias respectivas f1,
f2, … fk la distribución de frecuencias de estos “n” datos se resume en la
siguiente tabla.
PARA TOMAR EN CUENTA: Cuando el número de valores distintos de una
variables discreta es muy grande, podemos resumir los datos con el método de
organización de variable continua por intervalos.
Se tiene la siguiente observación del número de hijos por familia
en el distrito de Tacna en una muestra de treinta familias.

Solución:
La distribución de frecuencias por intervalos (o clases) se usan cuando la
variable estadística es continua o cuando el número de valores distintos de una
variable discreta es muy grande.

Esta distribución se obtiene dividiendo el rango de variación de los datos en


“m” intervalos, y determinado el número de datos que contiene cada intervalo;
como se muestra en la siguiente tabla :
Donde:

• Linf: Límite inferior del intervalo.

• Lsup: Límite superior del intervalo.

• Xj: Marca de clase.

Para construir la distribución de frecuencia de intervalos, hay varios


procedimientos, se recomienda lo siguiente:

- Elegir no más de veinte intervalos ni menos de cinco, ya que muchos


intervalos pueden complicar innecesariamente los cálculos de las medidas
descriptiva, y pocos intervalos podrían omitir características importantes de
los datos.

- Elegiremos todos los intervalos de igual amplitud “C”.


Dado “n” valores de una variable cuantitativa continua o discreta con más de
veinte valores distintos, uno de los métodos para construir la distribución de
frecuencias es:

1) Determinar el rango “ R ”

El rango de variación de los datos se define por : R = X máx – X min

2) Determinar el número de intervalos : “ K ”

Utilizando la regla de sturges: K = 1 + 3.3 log (n)


3) Determinar la amplitud del intervalo: “ C ”

Se obtiene dividiendo el rango entre el número de intervalos:

C=R/K

MARCA DE CLASE “ X ”

Según Córdova ( 2003) , la marca de clase es el número Xi, que se define como
el punto medio del intervalo.

Este valor se obtiene como la semisuma o media aritmética de los límites de


los intervalos.

(𝑳𝒊𝒏𝒇.+𝑳 𝒔𝒖𝒑.)
Xi =
𝟐
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela de Profesional de Ciencia de la Comunicación

TEMA: GRÁFICOS ESTADÍSTICOS


Ing. Carlos Alayo Ninaquispe
PRESENTACIÓN DE LA INFORMACIÓN
MEDIANTE GRÁFICOS

Los gráficos nos dan una idea mucho más sintético que los cuadros
estadísticos.

A continuación tenemos los más usados:

a) Barras

b) Sectores

c) Histogramas de frecuencias

d) Polígonos de frecuencias.
- Se representa mediante una serie de rectángulos separados.
- Se utiliza para representar variables cualitativas y variables
cuantitativas discreta.

SE CONSTRUYE:

1) Se ubica en el eje de las abscisas las categorías de la variable


cualitativa o los valores de la variable cuantitativa discreta.
2) Se levantan barras cuya altura sea proporcional a sus
frecuencias.
- Se representa mediante un círculo particionado.
- Se utiliza para representar variables cualitativa cuyo principal
interés es conocer su frecuencia relativa.

SE CONSTRUYE:

1) Se divide una circunferencia equitativamente, considerando que


esta constituye el 100%.
2) Se efectúa la partición, según la frecuencia relativa simple lo
considere y se ubican las categorías de la variable en cada
partición.
- Es una representación gráfica de una distribución de frecuencias
agrupadas en intervalos de clase, mediante una serie de
rectángulos contiguos.
- Se utiliza para representar una variable cuantitativa continua.

SE CONSTRUYE:

1) Se coloca los intervalos de clase en el eje de las abscisas.


2) Se levanta cada intervalo a la altura de la frecuencia absoluta
simple o relativa simple.
- Se utiliza para representar una variable cuantitativa continua.

SE CONSTRUYE:

1) Se ubica en el eje de las abscisas la marca de clase y se


considera el punto medio.
2) Se levanta el punto de la marca de clase a la altura de la
frecuencia absoluta simple o relativa simple.
3) Luego de marcar los puntos, unidos.
4) Finalmente unir los extremos al eje de las abscisas.
Es el código de identificación que permite relacionar
NÚMERO el gráfico al interior del documento.

TÍTULO Es la copia del título del cuadro estadístico

CUERPO Es el gráfico en sí que representa los datos


organizados.

Es la información complementaria del gráfico


LEYENDA estadístico. Algunos gráficos no llevan leyenda

FUENTE Indica el origen de los datos.


“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela Profesional de Ciencia de la comunicación

TEMA: MEDIDAS ESTADÍSTICAS

Ing. Carlos Alayo Ninaquispe


Las tablas y gráficos de distribución de frecuencia representan el resumen de una
agrupación de datos debidamente ordenados, no obstantes, el estudio resulta
incompleto, para esto se utilizan ciertos indicadores.

Los indicadores llamados estadígrafos o medidas de resumen, permiten calcular un valor


numérico, el cual representa a toda la población o muestra en estudio
Media aritmética
Medidas de
Tendencia Mediana
central:
Moda

Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles

Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación

Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
La estadística descriptiva en su función básica de procesar los datos y
convertirlos en información relevante a considerar en una investigación,
propone un conjunto de indicadores estadísticos que admiten tener una
percepción rápida de lo que ocurre en el objeto de estudio

Los indicadores estadísticos de tendencia central mas conocidos son : la


me Me
media, la mediana y la moda. Esos valores nos indican en torno a qué
valor promedio (centro) se distribuye los datos.
Es el promedio de los datos, es decir, es el resultado que se obtiene al dividir la
sumatoria de las cantidades entre el número total de las cantidades.

Debemos tener en cuenta que podemos tener una muestra de pocos datos o un
gran volumen de datos recopilados para una investigación, e inclusive estos
datos pueden estar organizados en una tabla de distribución de frecuencias.

Tendremos entonces dos procedimientos:


SE TRABAJA CON DATOS SIN AGRUPAR
Se aplica en datos agrupados, es decir, aquellos que se encuentran
organizados en una tabla de frecuencias, siendo las frecuencias
absolutas sus ponderaciones.
NOTA

- Se utiliza la media cuando se tiene variables con valores que tienden


hacia una distribución simétrica.

- Si estamos trabajando con una sola variable:

a) Si la media es mayor que la mediana, se trata de una variable con


distribución asimétrica positiva; esto sólo se cumple para distribuciones
unimodales.
b) Si la media es menor que la mediana se trata de una variables con
distribución asimétrica negativa.
c) Cuando la media es igual a la mediana se trata de una variable con
distribución simétrica; esto sólo se cumple para distribuciones
unimodales.
Se “define como el punto medio geométrico de la distribución de datos
agrupados, es decir; el dato que divide a dicha distribución en dos mitades
respecto a las frecuencias”, este valor ocupa el lugar central de todos los datos
cuando estos están ordenados de menor a mayor.
Mediana Me
50% 50%

Valor Mínimo Valor Máximo


a) MEDIANA PARA DATOS NO AGRUPADOS

Los procesos son los siguientes:

- Ordenamos los datos o cantidades en forma descendente o ascendente.

- Si la serie es impar, la mediana es el valor central

- Si la serie es par; la mediana es la semisuma de los dos valores centrales.


b) MEDIANA PARA DATOS AGRUPADOS

Cuando los datos o cantidades están agrupados en una tabla de distribución de


frecuencias, la mediana se calcula con la siguiente formula:
Está dado por el valor o características que se repite con mayor
frecuencia dentro de un conjunto de datos. Se pueden clasificar las
muestras por el número de modas en:

MONOMODAL : Si la muestra presenta una sola moda.

BIMODAL: Si la muestra tiene dos modas.

MULTIMODAL: Cuando en la muestra existen tres o más modas.

AMODAL: Si la muestra no presenta moda ( no hay datos repetidos).

12 30 25
30
10 25 25 20
8 20 20
15
6 15 15
10
4 10 10
2 5 5 5

0 0 0 0
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

Amodal Unimodal Bimodal Trimodal


MODA PARA DATOS AGRUPADOS:

Para este caso la moda se calcula mediante la fórmula siguiente:


1. Se tiene la distribución de frecuencias de las notas de 50 alumnos, del grupo de
Adelanto en Estadística

NOTAS Xi Fi
8 3
10 4
12 7
14 8
16 15
18 9
20 4

Hallar la media aritmética.


2. Se tiene los siguientes datos de los pesos de 30 pacientes diabéticos de un
hospital:

PESOS (KG) Xi fi
[60 – 64 > 2
[64 - 68 > 12
[68 – 72 > 8
[72 – 76 > 6
[76 – 80 ] 2

Hallar la media aritmética.


3. Halle la mediana de 5 , 7 , 7 , 9 , 10 ,12 , 15

4. Halle la mediana de 5 , 6 , 7 , 8 ,10 , 10 , 14 , 15

5. Conocida la distribución de frecuencias de las longitudes de tornillos,


de un lote que ha sido comprado. Hallar la mediana

Longitud (cm) fi
8 8
10 16
12 12
15 8
17 24
20 32
6. De muestra obtenida se tiene la distribución siguiente; son las edades
de jubilados que cobran en un determinado banco. Calcule la mediana
e interprétala.

Edades de los fi
jubilados
[ 60 – 64 > 2
[64 – 68 > 12
[ 68 – 72 > 8
[ 72 – 76 > 6
[ 76 – 80 ] 2
7. Hallar la Moda en los siguientes datos:

a) 7 , 13 , 15 , 15 , 17 ,21

b) 5 , 6 , 7 , 7 , 9 ,9, 9 ,10 , 10

c) 13 , 19 , 21 , 37 , 38
8. S e tiene los siguientes datos ubicados en una tabla, hallar la moda:

X fi
17 10
21 18
25 22
29 19
33 11
9. De muestra obtenida se tiene la distribución siguiente; son las edades
de jubilados que cobran en un determinado banco. Calcule la moda

Edades de los fi
jubilados
[ 60 – 64 > 2
[64 – 68 > 12
[ 68 – 72 > 8
[ 72 – 76 > 6
[ 76 – 80 ] 2
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela Profesional de Ciencia de la comunicación

TEMA: MEDIDAS DE POSICIÓN

Ing. Carlos Alayo Ninaquispe


Media aritmética
Medidas de
Tendencia Mediana
central:
Moda

Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles

Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación

Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
Dado un conjunto de elementos que se ordenan de acuerdo con su magnitud, el
valor medio que divide al conjunto de datos en dos partes iguales o la media
aritmética de los dos valores medios de dicho conjunto dan como resultado a la
mediana.

Asociadas a la definición de mediana , tenemos otras medidas que se


fundamentan en las divisiones proporcionales que pueden hacerse en datos
agrupados o sin agrupar y que se denominan cuantiles.
me
Existen
Me
diferentes tipos de
cuantiles, a saber, cuartiles , deciles y percentiles.
Se definen como los intervalos dentro de los cuales quedan proporcionalmente
repartidos los datos sin agrupar o agrupados en una distribución formada por
cuatro partes iguales.

Se tienen tres cuartiles que se simbolizan por Q1 (primer cuartil), Q2(Segundo


cuartil) y Q3(tercer cuartil), en donde cada uno contendrá el mismo número de
datos es decir , el 25% del total.
El primer cuartil Q1 es el valor que indica en el cual, o por debajo del cual, queda el 25% o
un cuarto de todos los datos.

El segundo cuartil Q2 es la medida igual a la mediana, es decir, es el valor que indica en el


cual , o por debajo del cual, queda el 50% o la mitad de todos los datos.

El tercer cuartil Q3 es el valor que indica en el cual, o por debajo del cual, queda el 75% o
las tres cuartas partes de todos los datos.
 Los cuartiles son los 3 valores que dividen la serie de datos en 4 partes iguales.
Corresponden a los valores que acumulan el 25%, 50%, 75 % de los datos.
 Para calcular los cuartiles, en primer lugar, debemos tener ordenado el arreglo de datos
de menor a mayor.
 A continuación debe utilizarse la siguiente fórmula que nos señala la ubicación del cuartil
deseado en el arreglo de datos.

K(n  1)
Qk : 4 ; K=1,2,3

 Es importante señalar que se deben utilizar las mismas reglas para la búsqueda de
deciles, cuando el resultado de la formula da entero, fracción con decimal 5 o otra forma
decimal
Ejemplo:
Las edades (años) de 12 estudiantes universitarios tomados al azar fueron:
18, 22, 19, 20, 21, 22, 23, 20, 19, 24, 22, 21. Calcular el primer cuartil.
Se solicita la posición del cuartil, aplicando la fórmula de posición:
𝑘(𝑛 + 1) k= orden del cuartil
𝑄𝑘 :
4 n= número de datos

𝑘(𝑛 + 1) 1 ∗ (12 + 1)
Aplicar la fórmula 𝑄1 :
4
=
4
= 3,25
El primer cuartil se encuentra en el término o lugar 3,25. Se debe interpolar
entre las edades 19 y 20; que representan las posiciones 3 y 4.

𝑸𝟏 = 𝟏𝟗 + 𝟎, 𝟐𝟓 ∗ 𝟐𝟎 − 𝟏𝟗 = 𝟏𝟗, 𝟐𝟓 𝒂ñ𝒐𝒔

El 25% (primer cuartil) de los estudiantes tienen 19,25 años o


menos .
Ahora para calcular los cuartiles para datos agrupados, debemos
recurrir a la siguiente fórmula, idéntica salvo por un detalle para el
cálculo de la mediana para datos agrupados:

 Kn 

 4 F i 1 
Qk  Li    A; K  1,2,3
 fi 
 

Donde 𝑳𝒊 = limite inferior de la clase cuartil.


n = nº de datos.
𝑭𝒊−𝟏 =frecuencia acumulada de la clase que antecede a la clase cuartil.
A = longitud de clase cuartil.
𝒇𝒊 = frecuencia absoluta de la clase cuartil
Ejemplo: La siguiente tabla muestra la inversión anual de 40
empresas.
Marca de Frecuencias Frecuencias
Intervalo clase acumuladas
Yi
fi hi Fi Hi
 4, 10 7 1 0,025 1 0.025
10, 16 13 3 0,075 4 0.100
16, 22 19 6 0,150 10 0.250
22, 28 25 12 0,300 22 0.550
28, 34 31 11 0,275 33 0.825
34, 40 37 5 0,125 38 0.950
40, 46 43 2 0,050 40 1.000
40 1,000

Título: “Inversión anual de empresas”


Unidades: miles de dólares.
 Los deciles son los 9 valores que dividen la serie de datos en 10 partes
iguales. Corresponden a los valores que acumulan el 10%, 20%, ... , 90 %
de los datos.
 Para calcular los deciles, en primer lugar, debemos tener ordenado el
arreglo de datos de menor a mayor.

 A continuación debe utilizarse la siguiente fórmula que nos señala la


ubicación del decil deseado en el arreglo de datos.

K(n  1)
Dk  10 ; K  1,2,3,.. 9
 Ahora para calcular los deciles para datos agrupados, debemos recurrir a la siguiente
fórmula, idéntica salvo por un detalle para el cálculo de la mediana para datos agrupados:

 Kn 
 10  F i 1 

Dk Li    A; k  1,2,3, 9
 fi 
 

 Donde 𝑳𝒊 = limite inferior de la clase decil.


n = nº de datos.
𝑭𝒊−𝟏 = frecuencia acumulada de la clase que antecede a la clase decil.
A = longitud de clase decil.
𝒇𝒊 = frecuencia absoluta de la clase decil
 Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Corresponden a los valores que acumulan el 1%, 2 %, ... , 99 % de los datos.

 Para calcular los percentiles, en primer lugar, debemos tener ordenado el arreglo de datos de
menor a mayor.

 A continuación debe utilizarse la siguiente fórmula que nos señala la ubicación del percentil
deseado en el arreglo de datos.

k (n  1)
Pk  ;1,2,3...,99
100
 Es importante señalar que se deben utilizar las mismas reglas para la búsqueda de cuartiles,
cuando el resultado de la formula da entero, fracción con decimal 5 o otra forma decimal
 Ahora para calcular los percentiles para datos agrupados, debemos recurrir a la siguiente
fórmula:

 kn 

 100 F i 1 
Pk  Li   f  A; k  1,2,3,.., 99
 i 
 

 Donde 𝑳𝒊 = limite inferior de la clase percentil.


n = nº de datos.
𝑭𝒊 = frecuencia acumulada de la clase que antecede a la clase percentil.
A = longitud de clase percentil.
𝒇𝒊 = frecuencia absoluta de la clase percentil
 El primer cuartil, es aquel valor de la variable que supera al 25% de las observaciones
y a la vez es superado por el 75%.

 El segundo cuartil, es aquel valor de la variable que supera al 50% de las


observaciones y a la vez es superado por el 50%. Es decir, corresponde a la Mediana.

 En los deciles, el séptimo decil, es aquel valor de la variable que supera al 70% de las
observaciones y a la vez es superado por el 30%.

 Y en los percentiles, el percentil cuarenta, es aquel valor de la variable que supera al


40% de las observaciones y a la vez es superado por el 60%.

 Tal como lo mencionamos, el segundo cuartil, el quinto decil y el percentil cincuenta,


es una misma distribución presenta el mismo resultado, siendo en los tres casos igual
de la mediana.
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela Profesional de Ciencia de la comunicación

TEMA: MEDIDAS DE DISPERSIÓN

Ing. Carlos Alayo Ninaquispe


Media aritmética
Medidas de
Tendencia Mediana
central:
Moda

Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles

Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación

Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
Las medidas de dispersión son valores que
indican la variabilidad de una distribución
respecto a una medida de tendencia central.
Dado por medio de un número.

Cuanto mayor sea el valor , mayor será la


variabilidad; cuanto menor sea, menor será la
variabilidad respecto en este caso a la media.

Cuanto menos sea la variabilidad se afirma


que los datos son más homogéneos.
Recorrido
(Rango)

Varianza

Desviación
Estándar

Coeficiente
de
Variación
Es la medida de dispersión más sencilla. Se determina restando , el
valor máximo del valor mínimo , de los datos.

R = valor máx. – valor mín.


Ejemplo: Se tiene el registro de una semana, acerca del tiempo en minutos, que
demora la movilidad de casa al centro de estudios . Los datos son: 15´,
14.5`, 12.5`, 22`, 20`. Encontrar el rango del tiempo de demora de esta
movilidad.

R = 22 – 12.5 = 9.5
Para Córdova (2003, p.65) la varianza es la media aritmética
de los cuadrados de las diferencias de los datos, con respecto
a su media aritmética”

Donde:
Xi : valores de la variable X
Yi :marca de clase de cada variable o grupo.
N : tamaño de la población
.
n : tamaño de la muestra
σ² :Varianza poblacional
S² :Varianza muestral
La desviación estándar, se define como la raíz cuadrada de la
varianza.

Es uno de los estadísticos de mayor uso, en el cual las


unidades de la variable ya no están elevados al cuadrado sino
están en unidades originales.

  
2

S

2
s
 
Es el grado de desviación con respecto a la media.

El coeficiente de variación, se usa para comparar las medias


aritméticas o promedios de distintas muestras. Se expresa en
porcentaje y el menor coeficiente de variación indicará una
muestra más homogénea.

S
CV  100
x
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
Universidad Nacional Jorge Basadre Grohmann
Escuela Profesional de Ciencia de la comunicación

TEMA: MEDIDAS DE DISTRIBUCIÒN


DE FORMA

Ing. Carlos Alayo Ninaquispe


Media aritmética
Medidas de
Tendencia Mediana
central:
Moda

Cuartiles
Medidas Medidas de Deciles
Estadísticas posición:
Percentiles

Rango o recorrido
Medidas de Desviación típica o estándar
dispersión: Varianza
Coeficiente de variación

Coeficiente de Kurtosis
Medidas de
forma:
Coeficiente de Asimetría
Las medidas de distribución nos permiten identificar la forma en que se separan o
aglomeran los valores de acuerdo a su representación gráfica.
Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la información .
Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de
generar el gráfico.

Las medidas de forma son:

a) Coeficiente de asimetría

b) Coeficiente de curtosis (apuntamiento)

Las medidas de forma de las distribuciones mide si los valores de la variable están más o menos
uniformemente repartidos a lo largo de la muestra.
La asimetría de un conjunto de datos puede definirse de diversas formas, se utiliza la
desviación que tiene la distribución de un conjunto de datos con respecto a la
distribución normal para juzgar si un conjunto de datos es simétrico o no. Recuérdese
que una distribución es simétrica y unimodal, cuando promedio=mediana=moda,
luego la fórmula del coeficiente de asimetría es:

ഥ − 𝒎𝒆)
𝟑(𝑿
𝑪𝑨 =
𝑺
La fórmula de CA debe utilizarse solo en aquellos datos que son unimodales.
La interpretación del coeficiente de asimetría CA es la siguiente

a) Si CA < 0 , entonces la distribución es asimétrica a la izquierda (Negativa)


b) Si CA > 0, entonces la distribución es asimétrica a la derecha (positiva).
c) Si CA = 0, entonces la distribución es simétrica.
La curtosis cuantifica la cantidad de observaciones que se agrupan alrededor de las
medidas de tendencia central de la distribución de los datos. La fórmula para calcular la
curtosis es:

ഥ )^𝟒
σ 𝑿𝒊− 𝑿
k=
𝑺𝟒
La interpretación del valor del coeficiente de
curtosis K es:

a) Si k > 3 la distribución es leptocúrtica.


b) Si K = 3 la distribución es mesocúrtica
c) Si K < 3 la distribución es platicùrtica.

En caso de que los datos estén agrupados se deben


usar las marcas de clase promedio y la desviación
estándar respectiva.
“Yo voy a ganar
porque tengo fe,
coraje y
entusiasmo”
VARIABLE TIPOS DE GRAFICA QUE APLICA

2. Se realiza un estudio de rendimiento a dos secciones de la carrera de


gestión:
SECCIÓN A SECCIÓN B
Xi fi Xi fi
13 10 14 6
14 8 15 8
15 5 16 10
16 12 17 13
17 9 18 11
18 4 19 7

Determine cuál de las dos secciones tiene rendimiento más heterogéneo.


3. En una I.E. se realizó un concurso de Matemática, obteniendo los
siguientes resultados:

38 51 32 65 25 28 34 12 29 43

71 62 50 37 8 24 19 47 81 53

16 62 50 37 4 17 75 94 6 25

55 38 46 70 72 64 61 33 59 21

13 92 37 43 50 52 88 27 74 66

63 28 36 19 56 84 38 6 42 50

98 51 62 3 17 43 47 54 58 26

12 42 34 68 77 45 60 31 72 23

38 20 70 34 5 59 20 68 55 49

33 42 14 40 30 54 50 11 41 76

13 92 37 43 58 52 88 26 74 66

55 38 46 16 72 64 61 33 59 21

63 28 36 19 56 54 38 60 42 50

Construye la tabla de frecuencias:

Elementos básicos

n Dato Max. Dato Min. Rango Sturges K Amplitud


Intervalos
mi fi Fi hi Hi pi
Li Ls

TOTAL

HALLAR TODAS LAS MEDIDAS ESTADISTICAS, EN MEDIDAS DE POSICION SOLO


CUARTILES.

4. Completar en el recuadro.

También podría gustarte