00 Guía Didáctica Estadística Mayo 2018
00 Guía Didáctica Estadística Mayo 2018
00 Guía Didáctica Estadística Mayo 2018
Estadística
ÍNDICE
PAG.
INTRODUCCIÓN……………………………………..……………….….……...…....3
FUNDAMENTOS DE ESTADÍSTICA….………………………….…………...........4
MUESTREO………………….…………………………………………………...….14
DISTRIBUCIÓN DE FRECUENCIA….………………………….…………………..19
MEDIDAS Y TENDENCIA…...…………………………………..…………….…......28
MODELOS DE REGRESIÓN….……………………………………………….........50
GRÁFICOS Y TABLAS……...……………………………………….………………...57
REFERENCIAS BIBLIOGRÁFICAS………………………….…………………….65
2
Guía Didáctica de Estadística Prof. Gabriel Castellano
INTRODUCCIÓN
General
Aplica los conceptos, técnicas y procedimientos para el procesamiento,
presentación y análisis de datos de la Estadística aplicada.
Específicas
1.- Define conceptos fundamentales de la estadística aplicada.
2.- Procesa datos recolectados por muestra, los presenta y analiza con fines de
toma de decisiones y para presentación de informes.
3.- Aplica procedimientos para la construcción y análisis de tablas de
distribución de frecuencia.
4.- Determina las medidas de tendencia central y las medidas de dispersión.
5.- Participa en la elaboración de modelos de regresión lineal y serie de tiempo.
6.- Analiza cuadros, gráficos y tablas estadísticas
3
Guía Didáctica de Estadística Prof. Gabriel Castellano
FUNDAMENTOS
ESTADÍSTICA
Ciencia rama de la Matemática que se ocupa de recolectar, organizar,
presentar, analizar e interpretar información cuantitativa para obtener
conclusiones válidas, solucionar problemas, predecir fenómenos y ayudar a
una toma de decisiones más efectivas.
APLICACIONES
Antes sólo se aplicaba a los asuntos del Estado, pero en la actualidad la
utilizan las compañías de seguros, empresarios, comerciantes, educadores,
etc. No hay campo de la actividad humana que no requiera del auxilio de esta
ciencia, así por ejemplo:
El educador, mediante la estadística, podrá conocer si un estudiante lee muy
bien o regular, si la asistencia es normal o irregular, si la estatura está en
relación con la edad, media aritmética de rendimiento escolar en un período
determinado, etc.
El hombre de negocios realiza encuestas estadísticas para determinar la
reacción de los consumidores frente a los actuales productos de la empresa
y en el lanzamiento de los nuevos.
El economista emplea una amplia gama de elementos estadísticos para
estudiar los planes de los consumidores y efectuar pronósticos sobre las
tendencias de las actividades económicas
El sociólogo trata de auscultar la opinión pública mediante encuestas, para
determinar su preferencia por un candidato presidencial, o su posición frente
a determinados problemas económicos, políticos o sociales
El geólogo utiliza métodos estadísticos para determinar las edades de las
rocas
El Genetista determina las semejanzas entre los resultados observados y
esperados en una experiencia genética, esto se determina estadísticamente
4
Guía Didáctica de Estadística Prof. Gabriel Castellano
FINES
Conocer las características de un grupo de casos de estudio.
Comparar entre los resultados actuales y los obtenidos en experiencias
pasadas para determinar las causas que han influenciado en los cambios.
Predecir lo que pude ocurrir en el futuro de un fenómeno.
OBJETIVOS
Describir numéricamente las características de los conjuntos de
observaciones. Esta etapa consiste en recopilar, organizar, tabular y
presentar gráficamente los datos, proporcionando una visión cuantitativa de
los fenómenos observados.
Analizar los datos de manera objetiva con el fin de disponer de un concepto
claro de universo o población y adoptar decisiones basadas en la
información proporcionada por los datos de la muestra.
Estimar o predecir lo que sucederá en el futuro con un fenómeno de una
manera relativamente aceptable, así por ejemplo, podemos estimar cuál será
la población del país dentro de un determinado número de años conociendo
la actual.
5
Guía Didáctica de Estadística Prof. Gabriel Castellano
CLASIFICACIÓN DE LA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA
Es la parte de la Estadística que proporciona métodos para recopilar,
organizar, presentar, resumir, analizar e interpretar la información contenida
en un conjunto de datos, los cuales han de plasmarse en gráficos, tabulares
o numéricos, así por ejemplo:
Un docente calcula la calificación promedio de sus cursos. Sólo
describe el desempeño, no hace ninguna generalización acerca de
los mismos, acá se está haciendo uso de la Estadística Descriptiva.
POBLACIÓN
Conjunto de todos los elementos que serán sometidos a un estudio estadístico,
es decir, sobre el que se realizan las observaciones.
6
Guía Didáctica de Estadística Prof. Gabriel Castellano
MUESTRA (N)
Es el subconjunto de una población, es un pequeño universo. Se la usa cuando
la población es infinita o sumamente grande y es imposible Observar todos sus
elementos.
VARIABLE
Caracteres susceptibles a cambio y pueden tener diferentes valores en cada
elemento o individuo.
Clasificación de la variable
Variable Cualitativa
Expresan distintas cualidades, características o modalidad. Cada modalidad
que se presenta se denomina atributo o categoría, y la medición consiste en
una clasificación de dichos atributos. Las variables cualitativas puede ser
dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no,
hombre y mujer o ser Politómicas cuando pueden adquirir tres o más
valores.
Variable Cuantitativa
Es toda magnitud representada por números. Como por ejemplo, peso,
estatura, número de habitantes, etc. Se divide en:
7
Guía Didáctica de Estadística Prof. Gabriel Castellano
o Variable Discreta
Está limitada a ciertos valores, generalmente números enteros (Z) o
exactos, frecuentemente resultan de la enumeración o del conteo, como
por ejemplo: número de estudiantes de la promoción, número de carros
vendidos, etc. No existen valores fraccionados.
o Variable Continua
Puede tomar cualquier valor dentro de un intervalo, representado por un
número racional (Q), por lo que su espacio muestral es infinito. Por
ejemplo: (la masa: 2,3 kg, 2,4 kg, 2,5 kg…); (la altura: 1,64 m, 1,65 m,
1,66 m…)
INDIVIDUO O ELEMENTO
Unidad mínima que compone una población, es decir, cada uno de los
integrantes
Puede ser
Una entidad simple: una persona
Una entidad compleja: una familia
Algo con existencia real: un automóvil
Algo abstracto: un voto, la temperatura, el tiempo
Unidades naturales: obreros, turistas, empleados, emigrantes, etc.
PARÁMETRO
Conjunto de características (resultados) o valores numéricos, cuando se han
obtenido a partir de una población. Ejemplo: Edad promedio de los alumnos de
la Universidad.
ESTADÍSTICO
Conjunto de características (resultados) cuando se han obtenido a partir de una
muestra.
8
Guía Didáctica de Estadística Prof. Gabriel Castellano
DATOS ESTADÍSTICOS
Son medidas, valores o características susceptibles de ser observados y
contados. Como por ejemplo, la edad de los estudiantes del IUDAG.
Los datos estadísticos pueden ser clasificados en:
Cualitativos: la diferencia entre ellos es de clase y no de cantidad.
Ejemplo: Estado civil, Sexo, Raza, Color, Nivel educativo
Cuantitativos: representan magnitudes.
Ejemplo: Edad, Estatura, precio.
Cronológicos: difieren en instantes o períodos de tiempo.
Geográficos: referidos a localidad.
Los datos estadísticos se obtienen de:
Fuentes primarias: obtenidos directamente sin intermediarios valiéndose de
observaciones, encuestas, entrevistas y sondeos de opinión.
Fuentes secundarias: obtenidos a través de intermediarios valiéndose de
textos, revistas, documentos, publicaciones de prensa, y demás trabajos
hechos por personas o entidades.
ESCALAS DE MEDICIÓN
En cuanto a las escalas de medición la estadística cuenta con las siguientes:
Nominal
Se utiliza principalmente en los datos cualitativos y nos permite manejar la
información por su nombre, como en los casos de marcas de diferentes
productos, enfermedades, preferencias, etc.
Por ejemplo:
o Sexo: las clases son masculino o femenino.
o Especialidad: las diferentes especialidades (carreras) de la UCV.
o Número de cédula de identidad personal.
o Temperatura de una persona: sanguíneo, flemático, melancólico, colérico.
Ordinal
Se utiliza cuando necesitamos establecer orden entre las diferencias de la
población y sus datos son cualitativos, por ejemplo, escalas de calidad
(mala, regular, buena, muy buena), escalas de gusto (mu y sabrosa,
sabrosa, agradable, desagradable, muy desagradable), etc.
9
Guía Didáctica de Estadística Prof. Gabriel Castellano
Por ejemplo:
o Evaluaciones en un examen: 5, 4, 3 y 2.
o Grado de satisfacción de una necesidad: alto, medio, bajo
o Conocimiento de un idioma: excelente, bien, regular, mal
Intervalo
Espacio o distancia que hay de un tiempo a otro o de un lugar a otro. Se
utiliza principalmente en datos cuantitativos y es una escala que no cuenta
con un cero absoluto o con un instrumento estandarizado, por ejemplo, la
temperatura se puede medir en grados centígrados, Fahrenheit o kelvin.
Razón
Básicamente utilizada en datos cuantitativos que pueden ser medidos con
instrumentos estandarizados o con un cero absoluto como por ejemplo una
distancia medida en kilómetros, un volumen medido en centímetros cúbicos,
ventas medidas en bolívares, etc.
CENSO
Es una técnica de recolección de datos estadísticos que se realiza a toda la
población
ENCUESTA
Es la técnica que nos permite recolectar datos estadísticos que se realiza a una
muestra de la población.
Se clasifica en:
Descriptiva.- Cuando registra datos referentes a las características de los
elementos o individuos.
Explicativa.- Cuando averigua las causas o razones que originan los
fenómenos.
Mixtas.- Cuando es descriptiva y explicativa.
Por muestreo.- Cuando recolecta información de grupos representativos de
la población.
10
Guía Didáctica de Estadística Prof. Gabriel Castellano
Su estructura es:
Nombre de la institución que auspicia la encuesta.
Tema de la encuesta.
Objetivos de la encuesta.
Datos informativos: Lugar, fecha, y otros datos que se considere necesario
según la naturaleza de la información estadística a encuestarse.
Instrucciones para el encuestado para que sepa la forma de llenar la
encuesta.
Cuestionario o listado de preguntas (cerradas, abiertas, o ambas a la vez)
sobre los diferentes aspectos motivo de estudio.
Frase de agradecimiento al encuestado, como por ejemplo, ¡Gracias por su
colaboración!
11
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejemplos:
12
Guía Didáctica de Estadística Prof. Gabriel Castellano
AUTOEVALUACIÓN
1-. Defina Estadística
2-. Mencione algunas aplicaciones de la estadística
3-. ¿Cuáles son los fines de la estadística?
4-. Diga los objetivos de la estadística
5-. Explique en secuencia las fases del método estadístico.
6-. ¿Qué es la Estadística Descriptiva o Deductiva?
7-. ¿Qué es la Estadística Inferencial o Inductiva?
8-. Defina Población
9-. ¿Cuándo una población es finita?
10-. ¿Cuándo una población es infinita?
11-. ¿Cuál es la diferencia entre población y muestra?
12-. Defina variable
13-. ¿Cuándo una Variable es cualitativa?
14-. ¿Cuándo una Variable es cuantitativa?
15-. ¿Qué es una Variable dicotómicas?
16-. ¿Qué es una Variable Politómicas?
17-. ¿Qué es una Variable Discreta?
18-. ¿Qué es una Variable Continua?
19-. ¿Qué es una Variable Ordinal?
20-. ¿Qué es una Variable Nominal?
21-. Defina Individuo
22-. ¿Qué es un parámetro?
23-. ¿Qué es un estadístico?
24-. Defina Datos estadísticos
25-. ¿Cómo se pueden clasificar los datos estadísticos?
26-. ¿En los datos estadísticos, cuándo la fuente es primaria o secundaria?
27-. Defina censo
28-. Defina encuesta
29-. ¿Cómo se clasifican las encuestas?
30-. ¿Cuándo una encuesta es explicativa?
31-. ¿Cuándo una pregunta es abierta?
32-. ¿Cuándo una pregunta es cerrada?
33-. ¿Cuándo una pregunta es de elección múltiple?
34-. ¿Cuándo una pregunta de elección múltiple permite respuesta en abanico?
35-. ¿Cuándo una pregunta de elección múltiple es de Estimación?
13
Guía Didáctica de Estadística Prof. Gabriel Castellano
MUESTREO
Muestra
Es un subconjunto de la población. Ejemplo: Estudiantes de 2do lapso del
IUDAG.
14
Guía Didáctica de Estadística Prof. Gabriel Castellano
Solución:
Se tiene N=1000, como no se tiene los demás valores se tomará:
σ = 0,5
Z = 1,96
e = 0,05.
960,4 960,4
n = -------------------------- = --------------- = 277,74 ≈ 278
2, 4975 + 0,9604 3,4579
Sólo se presentaran aquí los métodos de muestreo que permiten recoger las
informaciones necesarias para calcular las probabilidades sobre una población
con un nivel de confianza definido.
15
Guía Didáctica de Estadística Prof. Gabriel Castellano
16
Guía Didáctica de Estadística Prof. Gabriel Castellano
Una vez determinada la dimensión del sondeo que se desea efectuar, basta
con calcular el número de individuos por cada criterio elegido.
Sin embargo, este método (el menos costoso) tiene ciertas limitaciones que es
necesario precisar y que nos permite conocer uno de los errores más comunes
en las encuestas:
17
Guía Didáctica de Estadística Prof. Gabriel Castellano
AUTOEVALUACIÓN
1-. Defina Muestra
14-. Diga cómo se procede con cada uno de los siguientes métodos:
a. Muestreo aleatorio simple
b. Muestreo por conglomerados
c. Muestreo por cuotas
18
Guía Didáctica de Estadística Prof. Gabriel Castellano
DISTRIBUCIÓN DE FRECUENCIA
Frecuencias
Frecuencia Absoluta (fi )
Número de veces que aparece un determinado valor en un estudio
estadístico (veces que se repite), se representa por fi. La suma de las “fi“ es
igual al número total de datos, que se representa por N. => Σ fi = N
Límite de la clase: cada clase está delimitado por el límite inferior (Li) de la
clase y el límite superior (Ls) de la misma.
19
Guía Didáctica de Estadística Prof. Gabriel Castellano
Nota:
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece, sino que se toma
en cuenta en la siguiente clase. En la última clase sí se toma el límite superior.
20
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejemplo ilustrativo:
Elaborar la tabla de frecuencia tomando en cuenta las edades comprendidas
entre 1 y 40 años de 150 personas:
21
Guía Didáctica de Estadística Prof. Gabriel Castellano
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
22
Guía Didáctica de Estadística Prof. Gabriel Castellano
2.- Las puntuaciones obtenidas por un grupo de en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
3.- El número de estrellas de los hoteles de una ciudad viene dado por la
siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3,
2, 1, 1, 1, 2, 2, 4, 1.
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3,
6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
23
Guía Didáctica de Estadística Prof. Gabriel Castellano
5.- Los 40 alumnos de una clase han obtenido las siguientes puntuaciones,
sobre 50, en un examen de Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31,
26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
6.- Los pesos de los 65 empleados de una fábrica vienen dados por la
siguiente tabla:
24
Guía Didáctica de Estadística Prof. Gabriel Castellano
Peso fi
[50, 60) 8
[60, 70) 10
[70, 80) 16
[80,90) 14
[90, 100) 10
[100, 110) 5
[110, 120) 2
7.- Un dentista observa el número de caries en cada uno de los 100 niños de
cierto colegio. La información obtenida a parecer resumida en la siguiente
tabla:
Nº de caries fi ni
0 25 0.25
1 20 0.2
2 x z
3 15 0.15
4 y 0.05
25
Guía Didáctica de Estadística Prof. Gabriel Castellano
Nº de caries fi ni fi · n i
0 25 0.25 0
1 20 0.2 20
2 35 0.35 70
3 15 0.15 45
4 5 0.05 20
155
xi fi Fi ni xi · fi
1 4 4 0.08 4
2 4 8 0.08 8
3 8 16 0.16 24
4 7 23 0.14 28
5 5 28 0.1 25
6 10 38 0.2 60
7 7 45 0.14 49
8 5 50 0.1 40
50 238
26
Guía Didáctica de Estadística Prof. Gabriel Castellano
AUTOEVALUACIÓN
10 8 5 8 9 8 1 10
6 7 8 9 4 8 10 8
6 5 3 8 10 5 4 9
8 10 6 7 3 7 4 6
8 10 7 8 5 9 38 5
27
Guía Didáctica de Estadística Prof. Gabriel Castellano
MEDIDAS Y TENDENCIA
PARÁMETROS ESTADÍSTICOS
Un parámetro estadístico es un número que se obtiene a partir de los datos de
una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una
tabla o por una gráfica.
MEDIDAS DE CENTRALIZACIÓN
Nos indican en torno a qué valor (centro) se distribuyen los datos. Las medidas
de centralización son: Media Aritmética, Mediana y Moda
Ejemplo:
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
28
Guía Didáctica de Estadística Prof. Gabriel Castellano
xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
b.-Si los todos los datos anteriores los multiplicamos por 3, cúal será la
nueva media.
29
Guía Didáctica de Estadística Prof. Gabriel Castellano
3.- Calcular la media de una distribución estadística que viene dada por la
siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8
xi fi xi · fi
61 5 305
64 18 1152
67 42 2814
71 27 1890
73 8 584
100 6745
4.- Hallar la media de la distribución estadística que viene dada por la siguiente
tabla:
fi
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
xi fi xi · fi
[10, 15) 12.5 3 37.5
[15, 20) 17.5 5 87.5
[20, 25) 22.5 7 157.5
[25, 30) 27.5 4 110
[30, 35) 32.5 2 65
21 457.5
30
Guía Didáctica de Estadística Prof. Gabriel Castellano
LA MEDIANA.-
La mediana, es el valor que divide una distribución de datos ordenados en dos
partes iguales, es decir, el 50% de los datos se ubican sobre la mediana o
hacia los puntajes altos y el 50% restante hacia los puntajes bajos. Es el valor
que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
Descripción:
Li es el límite inferior de la clase donde se encuentra la mediana.
es la semisuma de las frecuencias absolutas.
31
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejemplo:
Calcular la mediana de una distribución estadística que viene dada por la
siguiente tabla:
fi Fi
[60, 63) 5 5 100/2 = 50
[63, 66) 18 23 Clase de la mediana: [66, 69)
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
c.- 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10,
16, 14, 8, 18
3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17,
18, 18, 20
20/2 = 10 Me = 5
32
Guía Didáctica de Estadística Prof. Gabriel Castellano
fi fi Fi
[10, 15) 3 [10, 15) 3 3
[15, 20) 5 [15, 20) 5 8
[20, 25) 7 [20, 25) 7 15
[25, 30) 4 [25, 30) 4 19
[30, 35) 2 [30, 35) 2 21
21
MODA
La moda de un conjunto de datos es el valor que aparece con mayor
frecuencia.
33
Guía Didáctica de Estadística Prof. Gabriel Castellano
Descripción:
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
Ejemplo:
Calcular la moda de una distribución estadística que viene dada por la siguiente
tabla:
fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
34
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejemplo:
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado,
notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la
moda.
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Meses 9 10 11 12 13 14 15
Niños 1 4 9 16 11 8 1
35
Guía Didáctica de Estadística Prof. Gabriel Castellano
36
Guía Didáctica de Estadística Prof. Gabriel Castellano
MEDIDAS DE POSICIÓN
Las medidas de posición dividen un conjunto de datos en grupos con el mismo
número de individuos.
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
Las medidas de posición son: Cuartiles, Deciles, Percentiles
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
37
Guía Didáctica de Estadística Prof. Gabriel Castellano
CUARTILES.-
Son cada uno de los 3 valores Q1, Q2, Q3 que dividen a la distribución de los
datos en 4 partes iguales.
Los cuartiles son un caso particular de los percentiles. Hay 3 cuartiles:
Primer cuartil: Q1 = P25
Segundo cuartil: Q2 = D5 = P50 = Mediana
Tercer cuartil: Q3 = P75
Q2 coincide con la mediana.
38
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejercicio de cuartiles
Calcular los cuartiles de la distribución de la tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
DECILES
Son cada uno de los 9 valores D1, D2, D3, D4, D5, D6, D7, D8, D9 que dividen a la
distribución de los datos en 10 partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los
datos.
39
Guía Didáctica de Estadística Prof. Gabriel Castellano
ai es la amplitud de la clase.
Ejercicio de deciles
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
40
Guía Didáctica de Estadística Prof. Gabriel Castellano
PERCENTILES O CENTILES
Son cada uno de los 99 valores P1, P2, P3,……..P99 que dividen a la distribución
de los datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos.
P50 coincide con la mediana.
P50 coincide con D5.
41
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribución de la tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentil 35
Percentil 60
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los
valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
Desviación media
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a
la media.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
42
Guía Didáctica de Estadística Prof. Gabriel Castellano
Re = Xmáx – Xmín
DESVIACIÓN MEDIA
Desviación respecto a la media
La desviación respecto a la media es la diferencia en valor absoluto entre cada
valor de la variable estadística y la media aritmética. Di = |x - x|
Desviación media
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.
Ejemplo:
Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
43
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejemplo:
Calcular la desviación media de la distribución:
xi fi xi · fi |x - x| |x - x| · fi
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.714 21.428
21 457.5 98.57
VARIANZA
La varianza es la media aritmética del cuadrado de las desviaciones respecto a
la media de una distribución estadística.
Ejercicios de varianza
Ejercicio 1:
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
44
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejercicio 2:
Calcular la varianza de la distribución de la tabla:
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
DESVIACIÓN TÍPICA
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación.
La desviación típica se representa por σ.
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
45
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejercicio 2:
Calcular la desviación típica de la distribución de la tabla:
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
46
Guía Didáctica de Estadística Prof. Gabriel Castellano
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRÍA
Asimetría se refiere a si la curva que forman los valores de la serie presenta la
misma forma a izquierda y derecha de un valor central (media aritemética)
47
Guía Didáctica de Estadística Prof. Gabriel Castellano
Luego:
(1/30) * 0,000110
g1 = ------------------------------------- = -0,1586
(1/30) * (0,030467)^(3/2)
COEFICIENTE DE CURTOSIS
El Coeficiente de Curtosis analiza el grado de concentración que presentan
los valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
48
Guía Didáctica de Estadística Prof. Gabriel Castellano
- xm)^4)*ni - xm)^2)*ni
0,00004967 0,03046667
Luego:
(1/30) * 0,00004967
g2 = ---------------------------------- - 3 = -1,39
((1/30) * (0,03046667))^2
49
Guía Didáctica de Estadística Prof. Gabriel Castellano
MODELOS DE REGRESIÓN
CORRELACIÓN Y REGRESIÓN
Cuando se estudian en forma conjunta dos características (variables
estadísticas) de una población o muestra, se dice que estamos analizando una
variable estadística bidimensional. La correlación es el grado de relación que
existe entre ambas características, y la regresión es la forma de expresar
matemáticamente dicha relación.
ANÁLISIS DE CORRELACIÓN.-
Dado dos variables, la correlación permite hacer estimaciones del valor de una
de ellas conociendo el valor de la otra variable.
COEFICIENTES DE CORRELACIÓN.-
Los coeficientes de correlación son medidas que indican la situación relativa de
los mismos sucesos respecto a las dos variables (Correlación de Karl Pearson
y por Rangos de Spearman), es decir, son la expresión numérica que nos
indica el grado de relación existente entre las 2 variables y en qué medida se
relacionan. Son números que varían entre los límites +1 y -1. Su magnitud
indica el grado de asociación entre las variables; el valor r = 0 indica que no
existe relación entre las variables; los valores ± 1 son indicadores de una
correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o
negativa (Al crecer o decrecer X, decrece o crece Y).
50
Guía Didáctica de Estadística Prof. Gabriel Castellano
Coeficiente de determinación
Revela qué porcentaje del cambio en Y se explica por un cambio en X. Se
calcula elevando al cuadrado el coeficiente de correlación.
ANÁLISIS DE REGRESIÓN.-
Los primeros y más importantes estudios al respecto se deben a los científicos
Francis Galton (1822-1911) y Karl Pearson (1857-1936). Fue Galton quien
utilizó por primera vez el término regresión para indicar que, aunque influida por
la estatura de sus padres, la estatura de los hijos “regresaba” a la media
general.
En todos los casos de regresión existe una dependencia funcional entre las
variables. En el caso de dos variables, siendo una de ellas (X) variable
independiente y la otra (Y) la dependiente, se habla de egresión de Y sobre X;
51
Guía Didáctica de Estadística Prof. Gabriel Castellano
SERIES CRONOLÓGICAS
Las series de tiempo llamadas también series cronológicas o series históricas
son un conjunto de datos numéricos que se obtienen en períodos regulares y
específicos a través del tiempo, los tiempos pueden ser en años, meses,
semanas, días u otra unidad adecuada al problema que se esté trabajando.
52
Guía Didáctica de Estadística Prof. Gabriel Castellano
número años o las temperaturas anunciadas cada hora por el meteorólogo para
un aeropuerto.
Tendencia secular.-
La tendencia secular o simplemente tendencia, son movimientos o variaciones
continuas de la variable de modo uniforme y suave, por encima o por debajo,
que se observan en el largo plazo durante un período de longitud prolongada.
53
Guía Didáctica de Estadística Prof. Gabriel Castellano
Movimientos estacionales.-
Representa un movimiento periódico que se producen en forma similar cada
año por la misma época, en correlación con los meses o con las estaciones del
año y aun con determinadas fechas. Si los sucesos no se repiten anualmente,
los datos deben recolectarse trimestral, mensual o incluso semanalmente.
Movimientos cíclicos.-
Son variaciones hacia arriba y hacia abajo de la tendencia que se presentan
cada cierto número de intervalos, en forma periódica de manera ondular a
modo de oscilaciones más o menos regulares durante un período relativamente
prolongado, que por lo general abarca tres o más años de duración. La
producción, empleo, promedio industrial, etc. son ejemplos de este tipo de
movimientos.
54
Guía Didáctica de Estadística Prof. Gabriel Castellano
Modelo multiplicativo.-
En el que Y queda definida por el producto de las variaciones.
Modelo aditivo.-
En el que Y queda definida por la suma de las variaciones.
ANÁLISIS DE TENDENCIA.-
Es necesario describir la tendencia ascendente o descendente a largo plazo de
una serie cronológica por medio de alguna línea, y la más adecuada será la
que mejor represente los datos y sea útil para desarrollar pronósticos. Para
lograr la estimación de la tendencia se utilizan con más frecuencia los
siguientes métodos: Método de los mínimos cuadrados y método de los
semipromedios
55
Guía Didáctica de Estadística Prof. Gabriel Castellano
AUTOEVALUACIÓN
Con sus propias palabras y de manera lógica, defina cada uno de los
siguientes conceptos:
56
Guía Didáctica de Estadística Prof. Gabriel Castellano
GRÁFICOS Y TABLAS
DIAGRAMAS DE BARRAS.-
Es un gráfico bidimensional en el que los objetos gráficos elementales son
rectángulos de igual base cuya altura sea proporcional a sus frecuencias. Si en
el eje horizontal se ubican las etiquetas con los nombres de las categorías, y en
el eje vertical la frecuencia absoluta, la relativa o la frecuencia porcentual, toma
el nombre de diagrama de barras vertical, y si se intercambian las ubicaciones
de las categorías y las frecuencias, toma el nombre de diagrama de barras
horizontal.
57
Guía Didáctica de Estadística Prof. Gabriel Castellano
HISTOGRAMAS.-
Se utiliza para datos agrupados en intervalos de clase, representando en el eje
horizontal los intervalos de clase o la marca de clase, y en el eje vertical se
elabora rectángulos contiguos de base el ancho del intervalo y de altura
proporcional a las frecuencias representadas.
POLÍGONO DE FRECUENCIAS
Son gráficos lineales que se realizan uniendo:
a) Los puntos medios de las bases superiores de los rectángulos en un
diagrama de barras.
58
Guía Didáctica de Estadística Prof. Gabriel Castellano
59
Guía Didáctica de Estadística Prof. Gabriel Castellano
60
Guía Didáctica de Estadística Prof. Gabriel Castellano
Ejemplo ilustrativo:
A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada (tanto en clase como fuera de ella),
obteniéndose los siguientes resultados:
30 30 32 32 35 35 35 35
36 37 38 39 39 40 45 45
47 47 47 48 48 49 50 50
50 52 54 55 55 56 56 56
58 58 58 58 58 60 60 65
Solución:
A fin de elaborar el diagrama de tallo y hojas se ordena los datos con los
dígitos iniciales de cada uno, las decenas (tallos) a la izquierda de una línea
vertical, y a la derecha de esa recta el último dígito de cada dato, en este caso
la unidad, conforme recorren los datos en el orden en que fueron anotados.
3 0022
3 555567899
4 0
4 55777889
5 00024
5 5566688888
6 00
6 5
Interpretaciones:
Hay 4 estudiantes que dedican entre 30 y 32 horas semanales a estudiar, 10
estudiantes que dedican entre 55 y 58 horas semanales a estudiar, existe un
solo estudiante que dedica 65 horas semanales a estudiar.
61
Guía Didáctica de Estadística Prof. Gabriel Castellano
DIAGRAMA DE SECTORES
Llamado también diagrama circular o de pastel. Es un gráfico en el que a cada
valor o modalidad se asigna un sector circular de área proporcional a la
frecuencia que representan.
Ejemplo ilustrativo:
Con los datos de la siguiente tabla sobre las calificaciones obtenidas por 40
estudiantes en una evaluación de Estadística, presentar la información a través
de un diagrama de sectores:
Xi fi
5 4
6 5
7 6
8 11
9 7
10 7
Total 40
Solución:
a) Se calcula la frecuencia relativa y el número de grados que representa cada
calificación. El número de grados se calcula multiplicando la frecuencia relativa
con 360°, así: número de grados = fr * 360°
Estos cálculos se muestran en la siguiente tabla:
Xi f fr °
5 4 0,100 36
6 5 0,125 45
7 6 0,150 54
8 11 0,275 99
9 7 0,175 63
10 7 0,175 63
Total 40 1 360
62
Guía Didáctica de Estadística Prof. Gabriel Castellano
PICTOGRAMAS
Son dibujos, figuras o signos llamativos alusivos al carácter que se está
estudiando cuyo tamaño es proporcional a la frecuencia que representa los
datos.
Ejemplo ilustrativo:
Un equipo de fútbol en su trayectoria tiene 120 partidos ganados, 60 perdidos y
30 empatados. Al representar estos datos mediante pictogramas se obtiene:
Partidos Perdidos 60
Partidos Empatados 30
Otra forma de representar los datos mediante pictogramas se muestra en la
siguiente figura:
63
Guía Didáctica de Estadística Prof. Gabriel Castellano
AUTOEVALUACIÓN
Defina cada uno de los siguientes gráficos y elabore ejemplos de cada uno:
1-. Diagramas de barras
3-. Histogramas
9-. Pictogramas
64
Guía Didáctica de Estadística Prof. Gabriel Castellano
REFERENCIAS BIBLIOGRÁFICAS
65