Silabo de Estadística 2022 - Eestp HN Cap. PNP Apv-Pp

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 130

POLICÍA NACIONAL DEL

PERÚ

ESCUELA DE EDUCACIÓN SUPERIOR TÉCNICO


PROFESIONAL HÉROE NACIONAL
CAP. PNP “ALIPIO PONCE VÁSQUEZ”
PUENTE PIEDRA – LIMA

SILABUS DESARROLLADO DE LA
ASIGNATURA “ESTADÍSTICA”

II PERIODO ACADÉMICO
“Promoción Protectores de la Democracia”

2022

1
SILABUS
ESTADÍSTICA

I. DATOS GENERALES

ASIGNATURA : ESTADÍSTICA
PROGRAMA DE ESTUDIO : Ciencias Administrativas y Policiales
EJE CURRICULAR : Formación Técnico Profesional Policial
AREA COGNITIVA : Formación Académica del Programa Regular
HORAS SEMESTRALES : 48 horas académicas
HORAS SEMANALES : 03 Horas
CRÉDITOS : 02
FECHA INICIO/TERMINO : 05DIC22 - MAR22
DIA Y HORA : Lunes 08:00 – 10:40 (Fagina : 09:40 – 09:50)
PERIODO ACADÉMICO : II - Promoción 2022 - I
MODALIDAD : Presencial
CATEDRÁTICOS:
1. CAP. S PNP CHUMAN PISCOYA, Jorge Luis (Coordinador)
2. CAP. S PNP OLIVERA VERA, Ricardo
3. SS PNP MONZON ZAPATA José Antonio
4. SS PNP SORIANO PALOMINO Maritza Dominga
5. SS PNP (r) ALVAREZ TORRES Elvis Máximo
6. SS PNP (r) MORAN PEREZ, Carlos Arnaldo (Sub Coordinador)
7. S1 PNP PACOTAYPE HUAMAB Rogelio Joseph
8. S1 PNP MARCHAN CELIS Ada Lourdes
9. SANCHEZ ESPINOZA Wilbert
10. MEJIA CONDE, Miguel Ángel
11. ANCO ESTRELLA DE VASQUEZ Umbelina (Sub Coordinadora)
12. RAMIREZ VICENTE Juan Carlos
13. MELGAREJO ESTREMADOYRO Tania Elvira
14. PEREZ OBREGON, Carmen Lourdes

2
15. SARMIENTO ZORRILLA Aldo Antoni
16. PEREZ GORDILLO, Oscar Antonio (Sub Coordinador)
17. PALOMINO TARAZONA Shirley Miriam
18. PAREJA PINTO Federico Antonio
19. VARGAS AVALOS, Evelyn Venecia
20. CAYCHO SALAZAR Alejandro José
21. MELGAREJO CHINCHAY Leslie Yajaira (Sub Coordinadora)
22. CASTRO AMAYA Wilmer Eduardo
23. OCAÑA FLORES, Melissa Karen
24. VILLEGAS GARCIA, Maribel
25. MENESES GARCIA Washington

II. SUMILLA

La presente asignatura aporta al perfil del Técnico Profesional PNP en el curso de


Estadística los métodos y procedimientos para realizar la recopilación, organización,
presentación, análisis e interpretación de datos para la buena toma de decisiones
ante hechos específicos.
Asimismo, presenta las técnicas para el tratamiento de la información y el cálculo de
las medidas de posición, tendencia central, dispersión, casos de probabilidades y
análisis combinatorio aplicados a la función policial.

III. OBJETIVO GENERAL:

Proporcionar los métodos, técnicas y procedimientos para el análisis de datos,


aplicados a la función Policial para la buena toma de decisiones.

IV. OBJETIVOS ESPECÍFICOS:

Al finalizar el curso los alumnos de la Promoción 2019-II, serán capaces de:


• Recopilar, organizar, analizar y presentar datos reconociendo la característica de
la variable.
• Calcular las medidas de posición, tendencia central y de dispersión para aplicarlas
a la función Policial.
• Analizar e interpretar resultados estadísticos de problemas contextualizados a la
función Policial.
• Determinar todas las posibilidades de un evento y predecir las frecuencias en que
ocurren.

3
V. METODOLOGIA:

El desarrollo del curso se basa en la participación activa de los alumnos mediante


el desarrollo de problemas aplicados a la actividad policial.
El método de enseñanza será el socrático, teniendo en cuenta la lluvia de ideas y
aplicaciones con casuística policial.
Las clases teóricas se complementarán con las prácticas y talleres dirigidos.
Se llevará a cabo el proceso enseñanza aprendizaje en la modalidad presencial.

VI. CONTENIDOS.

COMPETENCIA
I UNIDAD Comprender los conceptos básicos de la
CONCEPTO BÁSICO DE LA ESTADÍSTICA Estadística descriptiva como inferencial,
DEFINICIÓN DE VARIABLES población, muestra, definición de
variables, tanto cualitativas como
cuantitativas para proyectar soluciones.

✓ Reconocer, describir, analizar,


expresar, clasificar y formalizar los
SESIÓN 01
conceptos de la estadística tanto
▪ Presentación de la Asignatura. descriptiva como inferencial.
▪ Conceptos básicos ✓ Identificar el contenido del curso
PRIMERA
▪ Estadística Descriptiva Diferencia los conceptos y teorías
SEMANA ▪ Estadística Inferencial Estadísticas.
(03 hrs) ▪ Población y muestra ✓ Reconocer que es una población y
▪ Parámetro estadístico una muestra.
05DIC22
✓ Identificar los parámetros
estadísticos

SESIÓN 02 ✓ Clasificar los distintos tipos de


variables, así como clasifica las
▪ Variables. Definición
SEGUNDA nomenclaturas Estadísticas.
▪ Clasificación de variables
✓ Mostrar interés en conocer los tipos
SEMANA Variables Cualitativa. Nominal
y clases de variables.
y ordinal.
(03 hrs) ✓ Discriminar los distintos tipos de
Variables Cuantitativa discreta
12DIC22 variables, así como clasifica las
y continua.
nomenclaturas estadísticas
▪ Valor Estadístico.
▪ Escalas de medición
▪ Recolección, organización y
técnicas para recolectar datos

4
COMPETENCIA
II UNIDAD Preparar el cuadro de distribución de
DISTRIBUCIÓN DE FRECUENCIAS, REPRESENTACIONES frecuencias para su interpretación.
GRÁFICAS.

SESIÓN 03 ✓ Utilizar la agrupación de


frecuencias absolutas y
▪ Tabulación de datos
relativas simples.
▪ Cuadro de distribución de
✓ Preparar el cuadro de
frecuencias, elementos.
distribución de frecuencias
▪ Frecuencias. Frecuencia
TERCERA ✓ Ordenar, calificar los datos y
absoluta, frecuencia absoluta
SEMANA su periodicidad.
acumulada, frecuencia
(03 hrs) relativa, frecuencia relativa
acumulada, frecuencias
19DIC22 porcentuales.
▪ Distribución para variable
cuantitativa discreta y
continua
▪ Cuadro de frecuencias para
una variable cualitativa.

✓ Conocer y utilizar sus datos


SESIÓN 04
para su análisis.
• Cuadro de frecuencias para una ✓ Inferir datos sobre medidas
CUARTA variable cuantitativa agrupados y tendencia central para datos
no agrupados. agrupados y no agrupados
SEMANA • Distribución de frecuencias por ✓ Interpretar gráficos
(03 hrs) intervalo
• Histogramas.
26DIC22
• Gráfico de barras
• Gráfico circular
• Polígono de frecuencias
• Ojiva

• Entrega de temas de Trabajo


Aplicativo Individual (TAI) y
Colaborativo (TC)

5
COMPETENCIA
III UNIDAD Organizar los estadígrafos de tendencia
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN central y gráficos en la presentación de
diversos datos frente a la realidad del
campo policial, manifestando confianza y
perseverancia en su aprendizaje.

SESIÓN 05 ✓ Conocer, aplicar y resolver con claridad


ejercicios de tendencia central.
QUINTA
✓ Identificar las propiedades de media
SEMANA • Media aritmética propiedades.
aritmética, mediana y moda.
• Mediana propiedades.
(03 hrs) ✓ Interpretar el valor central y el de mayor
• Moda propiedades
repetición.
02ENE23 • Datos originales de aplicación al
contexto.

✓ Conocer y comprender la agrupación de


SESIÓN 06 frecuencias absolutas y relativas simples y
SEXTA acumuladas
• Prácticas dirigidas sobre Población,✓ Preparar cuadro de distribución de
SEMANA
muestra, evaluación de frecuencias.
(03 hrs) Distribución de frecuencias con ✓ Ordenar, clasificar los datos y su
09ENE23 variable cuantitativa y cualitativa, periodicidad.
y gráficas de frecuencias, y ✓ Realiza la gráfica de frecuencias para su
medidas de tendencia central. interpretación
• Repaso de las unidades didácticas ✓ Utiliza la media, mediana y moda e
anteriores. interpreta sus valores.

SÉPTIMA SESIÓN 07
SEMANA
• PRIMERA EVALUACIÓN PARCIAL
(03 hrs)
16ENE23

6
SESIÓN 08 ✓ Identificar las diferentes medidas de
OCTAVA
posición
SEMANA • Medidas de posición
✓ Proporcionar información de la variable de
• Cuartiles
(03 hrs) estudio en base a los estadígrafos de
• Deciles
posición
23ENE23 • Percentiles
✓ Relacionar los datos agrupados con los
• Datos no agrupados y agrupados porcentajes relacionados

SESIÓN 09 ✓ Identificar y contrasta las fórmulas con los


NOVENA
resultados.
SEMANA • Medidas de dispersión. Definición.
✓ Analizar e interpreta la separación de
• Tipo.
(03 hrs) datos.
• Rango.
✓ Establecer la variabilidad de la variable
30ENE23 • Rango intercuartil aleatoria.
• Desviación media ✓ Resolver con precisión en sus cálculos.
• Varianza. Formas de calcular. ✓ Resolver casos, relaciona y decide la
variación de datos.

SESIÓN 10 ✓ Conocer la forma de calcular la desviación


DECIMA
✓ Analizar que tan dispersos están los datos
SEMANA • Desviación estándar.
respecto a la media.
Definición.
(03 hrs) ✓ Demostrar la variabilidad de un conjunto
Varianza poblacional y muestral
de datos respecto de la media aritmética.
06FEB23 • Cálculo de la desviación estándar.
✓ Comparar las dispersiones de dos
• Interpretación
distribuciones distintas.
• Coeficiente de variación

SESIÓN 11 ✓ Aplicar y resolver con claridad ejercicios de


DÉCIMA PRIMERA
aplicación
SEMANA • Prácticas dirigidas sobre medidas
✓ Resolver problemas estadísticos aplicados
(03 hrs) de posición: Cuartiles, deciles,
con precisión.
percentiles de datos no agrupados
13FEB23 y agrupados
• Medidas de dispersión: Rango
intercuartil, varianza, desviación
estándar, coeficiente de variación
• Repaso de las unidades didácticas
correspondientes.

7
DÉCIMA SESIÓN 12
SEGUNDA • SEGUNDA EVALUACIÓN PARCIAL
SEMANA
(03hrs)
20FEB23

COMPETENCIA
IV UNIDAD ✓ Conocer las posibilidades que
PROBABILIDAD Y ANÁLISIS COMBINATORIO ocurra un posible resultado en
sucesos de un evento.
✓ Predecir el número de situaciones
que se pueden dar en un conjunto
finito de acciones

SESIÓN 13 ✓ Afianzar el aprendizaje


DÉCIMA
✓ Repaso
TERCERA • SUSTENTACION DE TRABAJOS
COLABORATIVOS
SEMANA
(03 hrs)
27FEB23

SESIÓN 14 ✓ Calcular la probabilidad de los


DÉCIMA
posibles resultados de los sucesos.
CUARTA • Probabilidades. Concepto
✓ Conocer el espacio muestral de los
• Teorema de probabilidad
SEMANA eventos.
• Espacio muestral
✓ Realizar el cálculo del número de
(03 hrs) • Experimentos y eventos o
posibilidades de múltiples eventos
sucesos
06MAR23 que ocurren.
• Principios fundamentales del
conteo

SESIÓN 15 ✓ Realizar el análisis combinatorio


DÉCIMA
para diferentes eventos.
QUINTA • Análisis combinatorio
✓ Realizar agrupaciones con los
• Eventos
SEMANA elementos de un conjunto,
• Variables aleatorias discretas y
formándolas y calculando su
(03 hrs) continuas.
número.
13MAR23 ✓ Resolver problemas estadísticos con
fórmulas para las Permutaciones,
Combinaciones y ordenaciones de
datos.

8
SESIÓN 16
DÉCIMA
SEXTA • EVALUACION FINAL

SEMANA
(04 hrs)
20MAR23

VII. EVALUACIÓN
La asistencia a las sesiones es obligatoria en un 100%, salvo situación de servicio, lo
que se informará al Departamento Académico (DACA).
El proceso de evaluación del aprendizaje será permanente, comprenderá:

A. Evaluación Diagnóstica o de Entrada para valorar el nivel de conocimiento de la


asignatura.
B. El trabajo aplicativo individual (TAI) se calificará solo la presentación.
C. El trabajo colaborativo (TC) se calificará tanto la presentación como la
sustentación.
D. Evaluación Formativa o de Proceso para comprobar el rendimiento académico,
pronosticar posibilidades de desarrollo de los Alumnos (a) y reorientar la
metodología, se aplicarán:
1. El TAI y TC.
2. Dos exámenes escritos parciales (7º y 12º semana), enmarcados en los
modelos de las Pruebas que son propias de la naturaleza de la Asignatura.
3. Un examen final (16º semana),

E. Evaluación Sumativa para comprobar el nivel de desarrollo cognitivo, reflexivo y


del pensamiento lógico, para lo cual se aplicará un examen final (16º semana),
de similar característica empleada en los exámenes parciales.
F. El Promedio General se calculará en concordancia con las disposiciones
establecidas en el Manual del estudiante de la Escuela de Formación de la PNP y
con la naturaleza de la asignatura, conforme se detalla a continuación:

Promedio General (PG):

𝐏𝐄𝐏(𝟑) + 𝐓𝐀𝐈(𝟏) + 𝐓𝐂(𝟐) + 𝐄𝐅(𝟒)


𝐏𝐆 =
𝟏𝟎
Donde:
PEP : Promedio de Exámenes Parciales
TAI : Trabajo aplicativo individual
TC : Trabajo colaborativo
EF : Examen Final

9
V. BIBLIOGRAFIA

▪ Barreto C. (2008). Estadística básica, aplicaciones. Ed. Gráfica Real S.A.C. Perú.
▪ Gómez M. (1977). Estadística descriptiva.
▪ Jhonson K. Estadística elemental
▪ Lipschutz, Seymour & Schiller J. (2000). Introducción a la probabilidad y
estadística. Ed. McGraw Hill.
▪ Martínez C. Estadística aplicada
▪ Quintana C. (1992). Estadística elemental. Ed. Master libro S.A.
▪ Spiegel M. Estadística
▪ Universidad Juárez autónoma de Tabasco. Análisis de datos con herramientas
estadísticas. Recuperado de https://sites.google.com/site/estadisticadm/b-
organizacion-y-presentacon-de-datos/b-3-medidas-de-tendencia-central

10
UNIDAD I

SESIÓN 1
ESTADÍSTICA DESCRIPTIVA - INTRODUCCIÓN

INTRODUCCION

La Estadística es esencial en la policía, en la investigación, la administración, la


producción, la educación y todas las ramas del saber humano. El énfasis destaca en la
recolección, presentación y análisis de datos.
A diario se está procesando información estadística para tomar decisiones, desde los
consumidores que utilizan los precios unitarios, hasta las grandes compañías nacionales
e internacionales o países que están desarrollando actividades inherentes a su
desempeño
Este primer capítulo tiene por objetivo presentar algunos conceptos básicos de
estadística, así como de sumatorias simples y dobles los cuales se van a utilizar con
frecuencia para una mejor comprensión de los capítulos siguientes.

1.1 ESTADISTICA

Es una ciencia que nos provee de un conjunto de métodos, pautas y procedimientos,


para la recolección, organización (clasificación), análisis e interpretación de datos en
forma adecuada, para en base de ellos, tomar decisiones cuando existen situaciones de
incertidumbre.

Otras definiciones son:


La Estadística es una ciencia que trata de la recolección, organización, presentación y
análisis de datos con el fin de realizar una toma de decisiones más adecuada
Es una matemática aplicada para el análisis de datos.
Es el estudio de los fenómenos aleatorios.

Ejemplos:

• Estudiar la variación mensual del precio del dólar durante los últimos 5 años, para
averiguar qué mes del año es el más favorable para comprar dólares.
• Estudiar la variación mensual de efectivos policiales contagiados y fallecidos por el
Covid-19 durante el año 2020.
• Hallar el promedio y la varianza de la comisión de los diferentes delitos y faltas
cometidos en el distrito de Puente Piedra.

1.2 CLASIFICACIÓN DE LA ESTADISTICA

La estadística se divide en dos grandes ramas de estudio que son:


a) La estadística descriptiva, la cual se encarga de la recolección, clasificación y
descripción de datos muestrales o poblacionales, para su interpretación y
análisis y

11
b) La estadística inferencial, que desarrolla modelos teóricos que se ajustan a una
determinada realidad con cierto grado de confianza con la finalidad de inferir
resultados.
Estas dos ramas no son independientes; por el contrario, son complementarias y
entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin
de que quien tenga poder de decisión, tome las medidas necesarias para
transformar ese futuro o para mantener las condiciones existentes. La estadística se
divide en dos ramas:

• ESTADISTICA DESCRIPTIVA
Es la parte de la estadística que consiste en la recolección, organización,
presentación y análisis de datos para su descripción e interpretación según lo
requerido.

• ESTADISTICA INFERENCIAL
Es la parte de la estadística que consiste en tomar decisiones sobre el
comportamiento de una variable de interés de una población estadística en
estudio; utilizando para tal objetivo una muestra al azar. Es decir, a partir de los
resultados obtenidos al procesar los datos de una muestra se generaliza el
resultado de dicha variable en la población, con un cierto riesgo que es
cuantificado por la teoría de la probabilidad. La estadística inferencial proporciona
métodos para el análisis de datos.

1.3 CONCEPTOS BASICOS

1.3.1 Población

Es la totalidad de unidades elementales (personas o cosas) sujeto a estudio y


que poseen una característica común, al tamaño de la población (número de
unidades elementales) se simboliza con la letra mayúscula “N”. Una población
en estudio puede ser finita (Se puede enumerar sus Elementos) o infinita (no
se pueden enumerar sus elementos).
Ejemplos:

➢ Todas las tiendas que se dedican a la venta de gas en el distrito de la Molina


en el año 2019 (N= 850).
➢ Todos los establos de ganado vacuno en el departamento de Cajamarca en
el I semestre del 2019 (N= 2350).
➢ Todos los alumnos matriculados en el semestre 2019 - I
➢ Todos los Cadetes de la Escuela de Oficiales de la PNP, en el proceso de
formación en el año 2015. (N= 788).
➢ Todas las multas impuestas por la PNP por infringir al Reglamento Nacional
de Transito durante el mes de setiembre del año 2019 (N= 1 679).
➢ Todos los usuarios que concurren a la Biblioteca de letras y Ciencias
Humanas de la UNMSM, un día cualquiera (N= 1742).

12
1.3.2 Muestra

Es una parte representativa de la población estadística en estudio o también se


dice que es un subconjunto de unidades elementales de la población. Al tamaño
de la muestra se le representa con la letra minúscula “n”. Se dice que una muestra
es aleatoria o al azar, cuando todos los Elementos de la población tienen la misma
probabilidad de ser parte de la muestra.

Ejemplo 1:
Para estudiar cuál es el candidato presidencial por el cual votarán los peruanos en
las próximas elecciones, se toma una muestra de 3500 personas de todo el país.
La pregunta es la siguiente, ¿por quién votará en las próximas elecciones
presidenciales? Determine la población, muestra e individuos.

En este caso, la población sería la población electoral del país, es decir, peruanos
con derecho a voto.
La muestra sería el conjunto de 3500 peruanos que forman parte de la población.
Un individuo sería cada uno de los peruanos con derecho a voto.

Ejemplo 2:
Un alumno de la escuela de Suboficiales de la Policía Nacional de Puente Piedra
quiere conocer si los profesores de la escuela, prefieren dictar clases con ropa
formal o con ropa informal. Para ello, realiza una encuesta a 60 profesores de la
escuela de Suboficiales elegidos de forma aleatoria. Identifique la población,
muestra e individuos.

Población: conjunto de todos los profesores de la escuela de Suboficiales de la


Policía Nacional.
Muestra: 60 profesores de la escuela de Suboficiales de la Policía Nacional.
Individuo: cada uno de los profesores de la escuela de Suboficiales de la Policía
Nacional.

Ejemplo 3:
Un profesor desea realizar un análisis estadístico de las notas del examen final de
matemáticas de sus alumnos de último año. Por ello, coloca todas las notas
obtenidas en Excel y usa las funciones y herramientas estadísticas. La información
obtenida, ¿pertenece a la muestra o a la población?

En este caso, la población, son todos los alumnos de último año. Se estudiarán sus
notas, pero todas las notas obtenidas. No se ha realizado ningún muestreo, por
ello, la información obtenida, pertenece a la población.

Muestreo. Es el procedimiento para obtener una muestra representativa de


la población en estudio.

13
1.3.3 Unidad Elemental

Es cada uno de los elementos que conforman la población en estudios, de la cual se


requiere información. De una unidad elemental se define muchas variables de interés
para el investigador. Ejemplo:

Una población que se dedica a la venta de gas en el distrito de la molina.

Dato u observación.
Es el valor (atributo, conteo o medición) que forma la variable de interés en la unidad
elemental. Los valores que se toma una variable en particular x, se representa con letras
minúsculas acompañadas por subíndice, es decir:

X = ( X 1 , X2 , X 3 ………………… X n )
X i = valor que toma la variable x en la i-esima observación

14
SESIÓN 2
VARIABLES CUALITATIVAS Y CUANTITATIVAS

VARIABLE

Es una característica de interés que se desea analizar de una unidad Elemental. La


variable en estudios la fija el investigador, el valor que toma la variable (dato u
Observación) cambia de unidad elemental a otra. A una variable se le simboliza
universalmente con las ultimas letras del Abecedario, tales como x, y, z, o también letras
mayúsculas acompañada con subíndice, tales como:

X1, X2, ……..X k

Ejemplo de variables en estudio:

• x = Montos (S/) por venta diaria de balones de gas


• y = Cantidad de ganado vacuno en un establo
• z = Color de ojos de los Cadetes de la EO- PNP
• w = Volumen (cm 3) del contenido de botella de gaseosa
• t = Tiempo (minutos) que permanece un usuario en un cajero automático

2.1 TIPOS DE VARIABLES:

De acuerdo a los valores que toma la variable en estudio, se clasifican en:

• VARIABLE CUALITATIVA

Cuando los valores que toma la variable en estudio provienen de una cualidad o
atributo, se divide a su vez en nominal y jerárquica (ordinal).

❖ Variable Cualitativa Nominal


Una variable se considera cualitativa nominal cuando con los valores que
Forma esta variable no es posible establecer un orden de acuerdo a su
importancia.

Ejemplos:
• x = color de los ojos de los alumnos PNP
• y= Preferencias a determinadas marcas de jabones de tocados por las
alumnas femeninas.
• z = Sexo de los alumnos PNP

❖ Variable Cualitativa Ordinal o Jerárquica


Una variable ordinal es un tipo de variable estadística de tipo cualitativo que
expresa con palabras una cualidad de naturaleza ordenable.
Es decir, una variable ordinal es una variable que puede ser ordenada. Así, si
decimos que en una carrera de 100 metros lisos Andrés quedó primero, José
segundo y Pablo tercero. Esa posición es ordenable, se puede ordenar de

15
mayor a menor o de menor a mayor. Es decir, de forma descendente o
ascendente.

De manera que, en referencia a las variables cualitativas nos encontramos con


las ordinales. Las variables ordinales, a diferencia de las nominales, sí pueden
ser ordenadas de forma jerárquica. Ejemplos:

o Calificación crediticia. Este será mejor cuanto mayor sea la solvencia según
la agencia de calificación.
o Nota de una prueba. Por ejemplo, un examen que se califica como
suspenso, aprobado, notable, sobresaliente y matrícula de honor.
o Posición en una carrera deportiva. Primero, segundo, tercero, cuarto, etc.
o Satisfacción con un servicio al cliente. Muy insatisfecho, insatisfecho,
neutro, satisfecho y muy satisfecho.
o Grados oficiales PNP: Teniente General, General, Coronel, Comandante,
Mayor, Capitán, Teniente, Alférez.
o Grados Académicos: Bachiller, magister, Doctor
o Clase social: Alta, media, baja.

• VARIABLE CUANTITATIVA
Los valores que toma la variable provienen de un conteo o de una medición
instrumento de medida, metro, balanza, cronometro, termómetro, etc). Se
divide a su vez:

❖ Variable Cuantitativa Discreta


Una variable se considera cuantitativa discreta cuando los valores que toma
la variable provienen de un conteo. También se dice que los valores que toma
esta variable están asociados a los números enteros.
Ejemplos:

o X = Numero de gusanos por hoja


o Y = Número de hijos por familia
o Z = Número de accidentes diarios de transito registrados durante un
o mes determinado.
o T= Numero de artículos de las revistas científicas.

❖ Variable Cuantitativa Continua


Una variable se considera cuantitativa continua cuando los valores que toma
la variable provienen de una medición, es decir, los valores que toma se
encuentran en un intervalo. También se dice que los valores que toma esta
variable están asociados a los números reales.
Ejemplos:

o X= Tiempo de vida (hora) de baterías para automóviles


o Y= Edad (años) de los alumnos matriculados en el presente año Académico.
o Z = Estatura (mts) de los alumnos PNP.

16
2.2 PARÁMETRO
Es un valor fijo que caracteriza a la variable de interés en la población en estudio.
Para conocer este valor se requiere tener Todos los datos de la variable en la
población por lo general este valor casi nunca se conoce el objetivo de investigador
es estimarlo a través de una muestra aleatoria. Los parámetros más usados son:
❖ La media aritmética
❖ La mediana
❖ La Moda
❖ La media Geométrica
❖ La media Armónica
❖ La varianza
❖ La Desviación Estándar
❖ Coeficiente de variación

Valor Estadístico o estimado

Es un valor calculado con los datos de la muestra aleatoria y se Supone estima al


valor del parámetro de la variable en estudio en la Población. Este valor cambia de
una muestra a otra muestra. La fórmula permite calcular el valor estadístico, recibe
el nombre de Estimador o estadística. Los valores estadísticos más utilizados son:

❖ La media aritmética
❖ La mediana
❖ La Moda
❖ La media Geométrica
❖ La media Armónica
❖ La varianza
❖ La Desviación Estándar
❖ Coeficiente de variación

Ejercicios resueltos

Ejemplo 1
En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que se dedican
a la venta de combustible de un día determinado, se obtiene en siguiente
resultado, el monto de venta diaria promedio de S/. 12 600.50 con esta
información identificar población estadística, unidad elemental, variable en
estudio, tipo de variable, un posible dato, tamaño de la muestra, parámetro y
estimado o valor estadístico.

Solución:
Población estadística : Todos los grifos de Lima Metropolitana, que se
dedican a la venta de combustible.
Unidad elemental : Un grifo de Lima Metropolitana, que se dedican
a la venta de combustible.
Variable en estudio : Monto por venta ( s / ) diaria de combustible
Tipo de variable : Variable cuantitativa continua

17
Dato u observación : S/ 12 600.50
Tamaño de la muestra : 30 grifos
Parámetro : No se conoce el monto promedio por venta
diaria en la población.
Dato estadístico : S/ 12 600.50.

Ejemplo 2

De una población de 2 042 revistas científicas de biología, el 41,63% están escritas


en idioma inglés, Una muestra aleatoria de 50 revistas arroja que el 42.12% están
escritas en inglés, el promedio de artículos por revistas es de 12,4. Con esta
información identificar, población unidad elemental, variables, en estudios, tipos
de variables, posibles datos, tamaño de la muestra, parámetro y estimado o valor
estadístico.

Solución:
Población estadística: Todas las revistas científicas de biología N=2 042
Unidad elemental : Una revista científica de biología
Tamaño de la muestra:50 revista científicas de biología

Variable en Tipos de Datos u Parámetro Estimador o


estudio variables observaciones valor
estadístico
Idioma de la Cualitativa Español Ingles 41,63% 42,12%
revista Nominal Portugués
Número de Cuantitativa 12,16, 8, 9 etc Se desconoce 12, 4
artículos Discreta artículos

Ejercicios Propuestos

En cada uno de los siguientes enunciados identificar de ser posible, la población,


unidad elemental, variables en estudio, tipos de variables, tamaño de la muestra,
valores estadísticos, parámetros, y un ejemplo de dato en cada caso:

1. De una población de 1000 alumnos PNP, se elige una Muestra aleatoria de 25


cadetes, arrojando la siguiente información: el 98.4% son varones, la estatura
promedio es de 1,69 mts, el gasto semanal promedio por cafetería es de S/ 35.8
el 30% se encuentran en el 5to año de estudio.
2. Una muestra aleatoria de 30 recién nacidos en la Maternidad de Lima Arroja un
peso promedio de 3.50 Kg.
3. Una muestra aleatoria de 550 peruanos mayores de 18 años arroja que el 30%
está de acuerdo con las medidas económicas anunciados por el gobierno hace
uno días.
4. Para analizar la posibilidad de lanzar al mercado una nueva marca de cigarrillos,
se efectuó una encuesta entre fumadores que transitan por la quinta cuadra de
la av. Canadá entre las 5 P.m. y 8 P.m. del día 14 de febrero, para ello se

18
seleccionó en forma aleatoria a 80 fumadores obteniéndose los siguientes
resultados: el 65% prefiere los cigarrillos importados que los nacionales y el
precio promedio que pagan al comprador una cajetilla es de S/ 7.40.

2.3 SUMATORIAS SIMPLES DOBLES Y NOTACION PUNTUAL

SUMATORIAS SIMPLES
Sea x, una variable en estudio que toma valores x1 x1 …….xn , la Suma de los valores x
1 + x 2 +……….+xn , se representa mediante el operador matemático ∑ x i ; que significa
sumar todos los valores x i
i=1
para “i” que toma valores enteros positivos consecutivos desde 1 hasta n, es decir:

n
X 1 + x 2+ ……. x n
∑ xi ;
i=1
Ejemplos:
1. Desarrollar las siguientes sumatorias
11
∑ x 2i + 1 = x 3 + x 5 + …… x11
i=1

6 2 2 2 2
∑ x2 = x 2 + x 4 + ……+ x12
i=1
4
∑ 2x i +1 = 2x 2 + 2x3+ ……… 2x 5
i=1 y 2i+1 y 3 y5 y9

2. Supongamos que una variable X toma los siguientes valores


X1 = 7 x 2= 9 x3 = 5 x 4 = 6

Calcular:

4
∑ 2x 2 i + 3 = 2( 7 )2 +3 + 2 (9) 2 + 3 ( 5) 2 +3 + 2 ( 6)2 +3
i=1 x i – 2 7-2 9-2 5-2 6-2

4
∑ 2x 2 i + 3 = 20.2 + 23.57 +17.67 + 18.75 = 80.19

i=1 xi–2

19
2.4 ORGANIZACIÓN DE DATOS

Tiene por objetivo presentar los datos obtenidos de una población o muestra para
una o más variables en estudio, en tablas de distribución de frecuencias y sus
correspondientes gráficos, con la finalidad de resumir la información para que sea
de fácil interpretación y análisis.

RECOLECCIÓN Y ORGANIZACIÓN DE DATOS

La recolección de datos se refiere al enfoque sistemático de reunir y medir


información de diversas fuentes a fin de obtener un panorama completo y preciso
de una zona de interés. Permite a un individuo o empresa responder a preguntas
relevantes, evaluar los resultados y anticipar mejor las probabilidades y tendencias
futuras.
La exactitud en la reunión de datos es esencial para garantizar la integridad de un
estudio, las decisiones comerciales acertadas y la garantía de calidad.
La obtención de datos para el análisis estadístico es un proceso integral que incluye
las siguientes etapas típicas:

1. Definición de los objetivos del estudio observacional o experimento. Por


ejemplo, el cálculo del ingreso promedio familiar en los estudiantes de la
preparatoria, o la comparación de la efectividad de un medicamento que se ha
utilizado normalmente frente a otro producto nuevo.

2. Definición de la variable y la población de interés. Este aspecto tiene que ver con
los alcances del estudio. Por ejemplo, el sueldo del jefe de familia del estudiante,
o el tiempo de recuperación de los pacientes de una cierta enfermedad y de un
centro hospitalario específico a los cuales se aplican los medicamentos.

3. Definición de los métodos para la obtención y medición de los datos. Por


ejemplo, un cuestionario, una indagación en los centros de trabajo, o vía
telefónica, o el seguimiento de una bitácora médica. También incluye, en su caso,
la decisión de la obtención de un censo o la determinación del tamaño de la
muestra.

4. Determinación de las técnicas descriptivas o de inferencia que sean las


apropiadas para el análisis de los datos.

La recolección de datos no surge de la nada, estos deben ser recopilados. Para ello
debe tenerse en cuenta la importancia de contar con buenas técnicas de recolección
y precisión para que el margen de error sea mínimo.
Los datos pueden tener cualquier origen, puede ser un conjunto de personas,
animales, plantas, objetos o incluso números correspondientes a mediciones,
dependiendo de dónde se centre el interés del estudio. Independientemente de la
naturaleza de los elementos (entidades) del conjunto de estudio, a la totalidad suele
llamársela población.

20
TÉCNICAS PARA LA RECOLECCIÓN DE DATOS
Existen diferentes métodos y técnicas de recolección de datos que te pueden ser de
utilidad. La elección del método depende de la estrategia, el tipo de variable, la
precisión deseada, el punto de recolección y las habilidades del encuestador.

1. La entrevista para investigación


Las entrevistas es uno de los métodos más comunes. Si te decides a hacerla, pon
especial atención en las preguntas que realizarás, que también dependen de si
harás una entrevista cara a cara, vía telefónica e incluso si es por correo
electrónico. Conoce los tipos de entrevista y selecciona la adecuada para tu
investigación. Toma en cuenta que por lo regular se necesitan más recursos,
tanto económicos, como de personal para la realización de entrevistas. Sobre
todo, si decides realizar entrevistas en campo, o vía telefónica.
Echa mano de toda la información que tengas al alcance. Quizá existan archivos
de entrevistas de años anteriores que te puedan servir de referencia para tu
investigación. Conocer el comportamiento pasado de tus consumidores es de
gran importancia al momento de analizar cómo han cambiado los hábitos de
consumo.

2. Entrevistas telefónicas
Las entrevistas telefónicas permiten que los investigadores recolectan más
información en una menor cantidad de tiempo y ahorrando en gastos como el
traslado y el material de las encuestas. Una ventaja de esta herramienta es que
los participantes se sienten más confiados al momento de contestar porque no
están siendo observados.
Entre las ventajas de esta herramienta se encuentra el gran alcance que tiene y
la fácil administración de los datos obtenidos. Sin embargo, en muchas
ocasiones, el investigador no tiene el control de la entrevista, además, debe
procurar que sea un proceso corto para que no provoque que el participante no
lo abandone.

3. El cuestionario
Los cuestionarios son una herramienta útil para la recolección de datos. Para
obtener los resultados esperados, es necesario que se realicen cuidadosamente.
Es por eso que antes de redactarlo, es importante que el investigador defina los
objetivos de su investigación.
21
Existen dos formatos de cuestionarios:
- Los cuestionarios abiertos, los cuales se aplican cuando se quiere conocer la
opinión de las personas, sus experiencias y sentimientos sobre un tema
específico.
- El cuestionario cerrado los investigadores tienen el control de lo que
preguntan y desean saber, lo que puede provocar que la respuesta de los
participantes esté forzadas y limitadas.

4. Método de observación
Si lo que prefieres es hacer observación in situ para conocer el comportamiento
de tus clientes, puedes realizarla haciendo uso otras metodologías.
Por ejemplo, en un dispositivo móvil, donde tengas acceso al cuestionario que
hayas creado con los puntos a investigar, e irlo llenando al instante con la
información obtenida durante tu observación.
Debemos tener en cuenta que la manera en que registres la información será de
gran ayuda al momento de analizarla. Poder medir y presentar informes con
datos precisos y reales es muy importante para la correcta toma de decisiones.

5. Encuestas online
Hacer recolección de datos a través de encuestas online tiene grandes ventajas.
Tienes al alcance diversos tipos de preguntas, el uso de variables personalizadas
y lógicas que te permiten obtener mejores resultados y te ayudan a conocer a
profundidad a tus clientes. Los puedes ver en tiempo real para darle seguimiento
a tu investigación; además de generar reportes en diversos formatos.
Considera también que el hacer recolección de datos a través de encuestas
online, tiene un costo menor que, por ejemplo, hacerlo a través de entrevistas
presenciales, sin olvidar que puedes tener tus resultados en menor tiempo, en
lugar de días, semanas, e incluso meses que es el tiempo que se podría llevar una
recolección de datos a través de entrevistas o el método de observación.

6. Focus group
Un focus group es una forma de estudio cualitativo que consiste en realizar una
reunión donde las personas puedan dialogar o resolver un tema establecido. Este
tipo de debate ayuda a generar ideas, opiniones y actitudes que no se pueden
observar con otro método de recolección de datos.
Con este método se puede obtener grandes cantidades de información, ya que
los participantes se sienten confianza para dar su opinión y ofrecer respuestas
honestas y exactas.
Las sesiones de grupo son la herramienta ideal para obtener retroalimentación
de los participantes. Sin embargo, tienen algunas desventajas. Entre las más
importantes se encuentra la falta de control que se tiene durante el debate, lo
que provoca que el tiempo se vaya con temas irrelevantes y complique el análisis
de la información. Esto se puede solucionar con un moderador experto en el
área.

22
7. Paneles online para la recolección de datos
Los paneles online son una herramienta que permite recolectar datos a través
de personas altamente profesionales y calificadas. Una de las ventajas de este
método es que los participantes darán respuestas específicas y claras.
Algunas de las ventajas de utilizar paneles online son su facilidad para acceder a
los canales y obtener información directa del público objetivo. Además, es un
método de investigación muy económico que permite obtener información de
calidad. Te recomiendo leer sobre las ventajas de utilizar paneles online.

PROBLEMA PROPUESTOS

Completar las siguientes encuesta y formulario

01. ¿A qué edad tuviste mayor participación en tu escuela?


7; 7; 7; 8; 8; 8; 8; 8; 8; 8; 9; 9; 9; 9; 10; 10; 10; 11; 12; 12; 12; 12; 12; 12; 13; 14; 14; 15;
17; 20

Edad 7 8 9 10 11 12 13 14 14 15 17 20

fi

02. La escuela cuenta con espacios que permiten la participación en las diversas
actividades que se desarrollan
• Masculino: S; S; N; N; S; S; N; N; N; S; S; N; N; N; S; N; N
• Femenino: N; N; N; N; N; N; N; N; N; N; N; N; S.

Sexo si no Si(%) No(%) Total %


Masculino 100%

Femenino 100%

Total 100%

03. ¿Qué medidas de bioseguridad estás tomando en cuenta para cuidar tu salud en los
espacios públicos que garantice una participación segura?
• Lavado de manos: S; S; N; N; N; S; S; N; N; N; N; N; N; N; S; S; S; N; N; N; N; N; N;
S;N; N; N; N; N; N
• Distanciamiento social: N; N; N; N; N; N; S; S; N; N; N; S; N; N; S; N; N; N; N; N; N;
N; N; N; N; S; S; N; N; N
• Uso de mascarilla: S; S; N; N; N; N; N; S; S; N; N; N; S; N; N; N; S; N; N; N; S; S; N;
N; N; N; S; S; N; N

Medidas si no Si(%) No(%) Total %


Lavado de manos 100%

Distanciamiento social 100%

Uso de mascarilla 100%

23
UNIDAD II

SESIÓN 3
FRECUENCIAS ABSOLUTAS Y RELATIVAS

CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS

Una tabla de distribución de frecuencias es un arreglo rectangular en filas y columnas


en la cual los datos de una muestra o población son resumidos.
En la primera fila de la tabla se colocan, el nombre de las variables en estudio , la
frecuencia absoluta, frecuencia relativa , la frecuencia absoluta acumulada , frecuencia
relativa acumulada y la marca de clase solo para variables cuantitativa continuas.

TITULO

Variable Frecuencia Frecuencia Frecuencia Frecuencia Marca de


en absoluta relativa absoluta relativa clase
estudio acumulada acumulada
Clas -1
Clas-2

Clas-k
Total

Leyenda:
Fuente :

3.1 ELEMENTOS DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS.

• TITULO
Se coloca en la parte superior central de la tabla, el titulo debe ser, claro
preciso, y conciso y guarde relación con la variable que se estudia.
• FUENTE
Se coloca en la parte inferior de la tabla y corresponde al nombre de la entidad o
literatura de donde se obtuvo la información, debe incluir la fecha si es posible, si
el mismo investigador es autor de dicha información, debe colocar fuente propia
• LEYENDA
Se coloca delante de la fuente y corresponde a una nota o aclaración con respecto
al contenido de la tabla.
• CLASE
Se considera clase a una cualidad, un numero o intervalo, las clases para una tabla
de distribución de frecuencia, deben ser mutuamente excluyentes, es decir . un

24
dato solo puede pertenecer a una determinada clase. Al Numero de clases de una
tabla se le representa por la letra “K”

Si existe una gran cantidad de datos discretos o continuos, el número de


Clase debe encontrarse entre 5 y 15 . Un número pequeño de clases puede ocultar
la distribución real del conjunto de datos, mientras que un
Número muy grande puede dejar sin observaciones algunas de las clases
Limitando de esta forma su uso.

3.2 DEFINICIONES DE FECUENCIAS

• FRECUENCIA ABSOLUTA
Su valor indica el número de veces que los datos de la muestra caen en una
determinada clase .se representa por fi Para una muestra de tamaño “n” y con “
k “ clase se cumple que la sumatoria de todas las frecuencias absolutas es igual a
“n” es decir :
k
∑ fi =n
i=1

Siendo
f i = valor que toma la frecuencia absoluta en la i-esima clase
n = tamaño de la muestra
k= número de clase

• FRECUENCIA RELATIVA
Su valor indica la proporción o porcentaje de la muestra contenida en la clase. Se
representa por h i y se obtiene al dividir la frecuencia absoluta por el tamaño de
la muestra, es decir :

h i = f i ( en proporción )
n

h i = f i x 100 % ( en porcentaje )
n
En ambos casos se cumple que :

Nota k
∑ f i = h i = 1 o 100%
i=1

• FRECUENCIA ABSOLUTA ACUMULADA


Se obtiene al acumular los valores de las frecuencias absolutas para cada clase. Un
valor cualquiera indica que parte de la muestra , tiene valores menores o iguales
al valor que toma la variable en estudio .Se presenta por F i y se obtiene por
k

F= ∑ f i = i = 1 ,2,…….K

25
i=1

k
Nota F= ∑ f i = n
i=1

El valor de F k nos indica la cantidad de datos menores o iguales al valor de i-esima


clase.

• FRECUENCIA RELATIVA ACUMULADA


Se obtiene al acumular los valores de las frecuencias relativas para cada clase.Su
valor indica la proporción o porcentaje de la muestra que tiene valores menores
o iguales al valor de la variable. Se representa por H i.
También se obtiene dividiendo cada valor de la frecuencia acumulada absoluta
por el tamaño de la muestra, es decir:

H = F i = 1,2,……….. k
n
Nota: H k = 1 o 100%
El valor de H K nos indica la proporción o porcentaje de datos , menores o iguales
al valor de la i- esima clase

• MARCA DE CLASE
El concepto de marca de clase solo se usa cuando se elabora una tabla de
distribución de frecuencias para una variable cuantitativa continua , y su
interpretación matemática corresponde al punto medio para una determinada
clase . Estadísticamente corresponde al valor representativo para todos los datos
que caen en esa clase .Se calcula usando la formula:

X i = Límite inferior + límite superior


2

3.2.1 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA.

Cuando los datos corresponde a una variable cualitativa (Nominal o


jerárquica) la tabla de distribución de frecuencia tiene la siguiente forma:

TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO

1 Variable fi hi
2 C1 f1 h1
3 C2 f2 h2

K C fk hk
TOTAL N 1

26
FUENTE: ENTIDAD QUE PROPORCIONA LOS DATOS
Los valores C i corresponde a los valores que toma la variable ( clase).

Si la variable es nominal no existe un orden entre sus valores, en


cambio si la variable en estudios es jerárquica debe tomarse en cuenta
el orden de sus valores, ya sea en forma ascendente y descendente.
Para esta variable se presentan algunos tipos de gráficos, pero los más
frecuentes es el grafico de barras verticales u horizontales, grafico circular
gráfico de líneas y graficas pictóricos.

Ejemplo:
Con la finalidad de estudiar la variable x= Preferencia a determinados
Marcas de jabones de tocador por las alumnas -PNP, se toma una
muestra aleatoria conformada por 30 alumnas , los resultados son :

Rexona Palmolive rexona camay Palmolive lux


Camay lux lux rexona camay lux
Camay rexona camay lux lux camay
Lux camay rexona rexona camay lux
lux camay Palmolive lux lux

FUENTE PACOCHA S.A

Solución:

Para este ejemplo la tabla de distribución de frecuencias es :

DISTRIBUCION DE FRECUENCIAS SOBRE PREFERENCIA A MARCAS


DE JABONES DE TOCADOR POR LOS 30 ALUMNAS -PNP

I Jabones de F h h%
tocador
1 Rexona 6 0.2 20%
2 Camay 9 0,3 30%
3 Lux 12 0,4 40%
4 palmolive 3 0,1 10%
Total 30 1.0 100%
FUENTE : PACOCHA S.A

Calcular e interpretar:
f 2 : 9 alumnos encuestados prefieren el jabón de tocador camay
h 2 : 30% de los alumnos encuestados prefieren el jabón de tocador Camay

27
GRAFICA DE BARRAS
PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ALUMNAS PNP

frecuencia absoluta
f

12

3
FUENTE
PACOCHA
S.A.
rexona camay lux palmolive

GRAFICA CIRCULAR
PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ALUMNAS PNP

frecuencia absoluta
3

10% 6
20%
rexona
camay
lux
12 40% 9
palmolive
30%

28
SESIÓN 4
CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS
Y NO AGRUPADOS

4.1 TABLA DE DISTRIBUCION DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA


DISCRETA.
Cuando los datos corresponden a una variable cuantitativa discreta la tabla
de distribución de frecuencias tiene la siguiente forma :

TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO

Variable F h F H
1 C1 f1 h1 F1 H1
2 C2 f2 h2 F2 H2

K
Ck fk hk Fk Hk
Total N 1
FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS

Los valores C1 corresponden a valores que toma las variables ( clase )

Ejemplo :
Los siguientes datos corresponden a una muestra aleatoria de 50 tiendas
Que se dedican a la venta de gas con la finalidad de analizar la variable
Y= Número de balones de gas vendidos en un día determinado, los
Resultados son :

21 23 24 23 24 21 24 23 24 22 22 24
21 22 24 22 24 25 26 25 24 23 23 21
23 23 22 24 26 26 22 23 22 24 21 25
22 23 25 26 24 22 25 24 25 21 26 23
25 24

Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos


DISTRIBUCION DE FRECUENCIAS DEL NUMERO DE BALONES DE GAS
VENDIDOS POR 5O TIENDAS

Variable F h F H
1 21 6 0,12 6 12
2 22 9 0,18 15 30
3 23 10 0,20 25 50
4 24 13 0,26 38 76

29
5 25 7 0,14 45 90
6 26 5 0,10 50 100
Total 50 1.00
FUENTE: SOL GAS S.A

Hallar e interpretar:
f 3 = 10 significa que 10 tiendas , tienen una venta de 23 balones de gas
h 3 = 20% significa que el 20% , de las tiendas tienen una venta de 23
balones de gas.
GRAFICA DE BASTONES

13

10
6 9 7 5

0
21 22 23 24 25 26

Fuente sol de gas

GRAFICA DE BARRAS

frecuencia
Variable f

25 26
23 24
21 22

13
9 10
6 7
5

1 2 3 4 5 6
30
4.2 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE
CUANTITATIVA CONTINUA

Cuando los datos corresponden a una variable cuantitativa continua la


tabla de distribución de frecuencias tiene la siguiente forma :
TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO
Variable F h F H
1 C1 f1 h1 F1 H1
2 C2 f2 h2 F2 H2

K Ck fk hk Fk Hk
Total N 1

FUENTE : ENTIDAD QUE PROPORCIONA LOS DATOS

Los valores C 1 corresponde a valores que toma la variable ( clases )

Ejemplo :
Una muestra aleatoria de tamaño n= 34, es tomada con la finalidad de estudiar
La variable W = peso del recién nacido en la Maternidad de Lima. Los resultados en kg.
Se presentan a continuación.

1.5 1.5 1,9 2.0 2,1 2,1 2.3 2.4 2,5 2,5 2,6
4.1 2.7 2.8 2.9 3,0 3,1 3,1 3,2 3,2 3,2 3,2
3.3 3,3 3.3 3.4 3.4 3,5 3,6 3,6 3,7 3,7 3,9
4.1
FUENTE : Maternidad de Lima

Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos


Cuando los datos pertenecen a una variable cuantitativa continua, las clases C I
Corresponde a intervalos de la forma [ a ; b > llamados intervalos de clases
siendo a y b el límite inferior y superior respectivamente del intervalo de clase

PROCEDIMIENTO PARA ELABORAR UNA TABLA DE FRECUENCIA PARA


UNA MUESTRA DE TAMAÑO “n”

a. Calculo de Rango “R”


R = dato mayor – Datos Menor
Para el cálculo de datos se tiene
R= 4.1 – 1.5 = 2,6

31
b. Calculo del número de clase
Para el cálculo del número de clase para una tabla de distribución de
frecuencias se hará usando la regla de STURGES
K = 1 +3.3 Log (n)
K= 1 +3,.3 log 34 = 6.053
como el valor que toma K debe ser un numero entero , se usa el redondeo
Simple k = 6

Observación.-
El redondeo simple significa, que si un numero tiene como primer decimal
un número mayor o igual a 5 . Entonces la cifra entera del número se
incrementa en una unidad.

Ejemplo
Si, k= 6.7 usando el redondeo simple k= 7
Si k = 6.4 usando el redondeo simple k = 6

c.-. CALCULO DEL ANCHO DEL INTERVALO DE CLASE ( C )


𝑅
𝐶=
𝐾
2,6
𝐶= = 0,43333
6

El valor que toma el (C ) debe de tener el mismo número de decimales de


los datos originales y a la vez su valor debe tener un redondeo por exceso
(incrementar en la unidad al último decimal).

Para determinar los intervalos de clase es como sigue:


• El dato menor corresponde al límite inferior de la primera clase y para obtener el
límite superior de esta primera clase se suma al límite inferior el valor del ( C )
• El límite inferior del segundo, intervalo de clase , corresponde al límite superior
del primer intervalo de clase y para obtener su límite superior , al límite inferior
de esta clase se le añade el (C) y así sucesivamente hasta completar las “k” clases

Tabla de distribución de pesos (kg) de recién nacidos registrados en la Maternidad


de Lima .

i Pesos (kg) fi hi Fi Hi Xi
1 [1,5 -2,0 > 3 0,088 3 0,08 1,75
2 [2,0 -2,5> 5 0,147 8 0,235 2,25
3 [2,5-3,0> 6 0,176 14 0,411 2,75
4 [3.0-3,5> 12 0,35 26 0,761 3,25
5 [3,5-4,0> 6 0,176 32 0,931 3,75
6 [4,0-4,5] 2 0,058 34 0,989 4,25
34 1.00

Hallar e interprete los siguientes valores:

32
f3=6 (Significa que hay 6 recién nacidos que tienen un peso igual o mayor a 1.5 kg
, pero menor a 2.0 kg)
h3=17.6% (Significa que el 17.6% de los recién nacidos tienen un peso igual o mayor
a 1.5 kg , pero menor a 2.0 kg)
F3= 14 (Significa que hay 14 recién nacidos tienen un peso igual o mayor a 1.5 kg ,
pero menor a 3.0 kg)

H3=41.10% (Significa que el 41.10% de los recién nacidos que tienen un peso igual
o mayor a 1.5 kg , pero menor a 2.0 kg)
H3 – H2= 52.9% (Significa que el 52.9% de los recién nacidos que tienen un peso
igual o mayor a 2.5 kg , pero menor a 3.5 kg)
X´2=2.25 (Significa que 2.25 kg es el peso representativo para los recién nacidos
que tienen un peso mayor o igual 2.0 kg , pero menor a 2.5 kg)

2. ¿Cuántos recién nacidos aproximadamente tienen un peso menor a 2.8 kg?


Por interpolación lineal (utilizando la columna de las frecuencias absolutas
Acumuladas)
Límite superior Frecuencias acumuladas
de los pesos absolutas (menor que)

2.5 8 (un peso menor a 2.5 kg se


encuentran 8 recién nacidos
2.8 x (un peso menor a 2.8kg se
encuentran x recién nacidos)
3.0 14 (un peso menor que 3.0 kg se
encuentran 14 recién nacidos
Utilizando la interpolación lineal (semejanza de triangulo) se tiene:

3.0 – 2.5 = 14 - 8 → x= 11.6 ≈12 (usando redondeo simple)


2.8 – 2.5 x – 8
Aproximadamente 12 recién nacidos tiene un peso menor a 2.8 kg
3. ¿Qué porcentaje de los recién nacidos tiene un peso inferior a 2.8 kg

Como 11.6 recién nacidos tienen un peso inferior a 2.8 kg, entonces

→ x = 11.6 → 11. 6 x 100% = 34.12%


34
Tiempo
(min) fi hi Fi F*i Hi

2–4 3 0,10 3 30 0,10


4–6 6 0,20 9 27 0,30
6–8 12 0,40 21 21 0,70
8 – 10 7 0,23 28 9 0,93

33
10 – 12 2 0,07 30 2 1,00

Total 30 1,00

Gráficas

GRÁFICA DE BARRAS

12
12
10
7
8 6
6 fi
3
4 2
2
0
02-Abr 4–6 6–8 8 – 10 10 – 12

GRÁFICA DE LA OJIVA
Para construir la Ojiva en el eje de la abscisa se colocan los intervalos de clase y en eje
de la ordenada las frecuencias acumuladas absolutas o frecuencias acumuladas
relativas.
Por ejemplo la gráfica de la Ojiva para los pesos de los recién nacidos se obtiene de la
siguiente manera , cero recién nacidos tiene un peso menor a 1.5 kg, 3 recién nacidos
tiene un peso menor a 2 kg, 8 recién nacidos tienen un peso menor a 2.5kg , 14 recién
nacidos tienen un peso menor a 3.0 kg, 26 recién nacidos tienen un peso menor a 3.5
kg, 32 recién nacidos tiene un peso menor a 4.0 kg. y 34 recién nacido tienen un peso
menor a 4,5 kg uniendo estos puntos se obtiene la curva creciente a la derecha
llamada la Ojiva ( “Menor que “)

34
30

25

20

15

10

0 2 4 6 8 10 12 14

GRAFICA DE LA OJIVA ( “ MENOR QUE ” )

Supongamos que la variable en estudio es el tiempo ( minutos) que utiliza un usuario en


realizar una transacción bancaria.

Tiempo
(min) fi hi Fi F*i Hi

2-4 3 0,10 3 30 0,10


4–6 6 0,20 9 27 0,30
6–8 12 0,40 21 21 0,70
8 – 10 7 0,23 28 9 0,93
10 – 12 2 0,07 30 2 1,00

Total 30 1,00

35
30

25

20

15

10

0 2 4 6 8 10 12 14
GRAFICA DE LA CURVA ( MAYOR QUE)

TABLA QUE PROPORCIONA EL NUMERO DE CLASES


PARA UN TAMAÑO DE MUESTRA DADO

Tamaño de la Numero de clases

muestra K=1+3.3 Log (n)


20 a 23 5
24 a 46 6
47 a 93 7
94 a 187 8
188 a 376 9
377 a 756 10
757 a 1519 11
1520 a 3053 12
3054 a 6135 13
6136 a 12328 14
12329 a 24770 15

36
Nota:
Otra metodología para determinar el ancho del intervalo de clase ( C ).

1. Determinación de rango R
R= dato máximo-dato mínimo
2. Determinación de numero de clases K
K= 1+ 3.3 log (n)
3. Determinación de ancho del intervalo de clase ( C )

C= R → Debe redondearse por defecto


K El mismo número de decimales de los datos

C redondearse por defecto casi siempre se comete error

i) 0 → El dato de arranque para la tabla= dato mínimo

E= ( C) k-R ii) > 0 → El dato de arranque para la tabla =Dato mínimo _ E


2
iii) < 0 →El número de clases se incrementa en 1 y se sigue (i o ii)

Ejemplo
La mayor y menor estatura de 50 personas es respectivamente 1.72 mts y 1.55 mts.
Calcular el número de clases y su ancho para construir la tabla de distribución de
frecuencias.

Solución:
1. Determinación de rango R= 1.72-1.55=0.17
2- Determinación de número de clases
K= 1+3.3 log (50)= 6.6= 7 Redondeo por simple
3.-Determinacion de ancho de clase
C= 0.17 = 0,0242 = 0.02
7
Al redondearse se comete error
E= 0.02 * 7 – 0.17 = -0.03
Agregamos una nueva clase k= 8
C= 0.17 = 0.0212 = 0.02
E= 0,02 * 8 – 0,17 = - 0 , 01
Agregamos una nueva marca de clase k= 9
C= 0,17 = 0,0188 = 0,02
9
E = 0.02 * 9 -0.17 = 0.01

Dato de arranque =1.55 – 0.01 = 1.545 = 1.55


2

37
Los intervalos de clases para esta tabla son :
Estaturas ( mts ) fi
1,55-1,57
1.57-1,59
1.59-1.61
1.61-1.63
1,63-1,65
1.65-1.67
1.67-1,69
1,69-1,71
1,71-1,73
Total 50

Si usamos la metodología anterior, los intervalos de clase para la tabla sería

Estaturas ( mts ) fi
1,55-1,57
1.57-1,59
1.59-1.61
1.61-1.63
1,63-1,65
1.65-1.67
1.67-1,69
1,69-1,71
1,71-1,73
Total 50
Se observa que las seis primeras clases contienen los datos, la 7ma clase carece de datos.

Nota:
No existe una formula única para determinar el número de clase (k) en la construcción
de una tabla de distribución de frecuencias. Un número muy pequeño de clases tiende
a ocultar la distribución real del conjunto de datos, mientras que un número muy grande
puede dejar sin observaciones algunas de
Las clases, limitando de esta forma su uso. La idea es tener un numero de clases de tal
forma que todos los datos se encuentren en las clases formadas y además nos permite
conocer la distribución empírica de los datos , Se sugiere que el número de ellos debe
variar entre 5 y 15.
Nota:
Para determinar el número de clases ( k) también se pueden usar otras fórmulas tales
como :
K= Log 2 ( n)
K=√n
Nota:
Para determinar el número de clases para la tabla el investigador puede utilizar algún
criterio sostenido
38
EJEMPLOS DE APLICACIÓN:
Ejemplo de aplicación 1.

La siguiente información corresponde al tipo de denuncias registradas en la


comisaría de
San Bartolo, en el mes de marzo del 2019.

homicidio muerte suicidio homicidio


aborto muerte suicidio homicidio
maltrato familiar muerte homicidio aborto
maltrato familiar muerte abandono muerte
muerte suicidio muerte homicidio
aborto aborto maltrato familiar muerte
muerte aborto aborto
homicidio abandono maltrato familiar

muerte muerte maltrato familiar

maltrato familiar aborto maltrato familiar

maltrato familiar maltrato familiar homicidio


maltrato familiar maltrato familiar muerte

a) Construir la tabla de distribución de frecuencia


correspondiente. b) Interpretar cada una de las frecuencias
Solución:

La variable de estudio será:


Xi : Tipo de denuncias registradas en la comisaría de San Bartolo, en el mes de
marzo del
2019.

Tabla de distribución de frecuencia, sobre los tipos de denuncias


registradas en la comisaría de San Bartolo, marzo del 2019

i Tipo de denuncias fi h i (%)


1 Abandono 2 0.048
2 Aborto 7 0.167
3 Homicidio 7 0.167
4 Maltrato familiar 11 0.262
5 Muerte 12 0.286
6 Suicidio 3 0.071
Total 42 1.000

Fuente: Comisaria de san Bartolo

39
INTERPRETACIÓN

FRECUENCIA ABSOLUTA SIMPLE

f 1: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 2 denuncias por abandono.

f 2: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 7 denuncias por aborto.

f 3: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 7 denuncias por homicidio.

f 4: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 11 denuncias por maltrato familiar.

f 5: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 12 denuncias por muerte.

f 6: según la información redactada en la comisaría del distrito de san Bartolo en el


mes de marzo del 2019, se ha registrado 3 denuncias por suicidio.

FRECUENCIA RELATIVA SIMPLE

h 1: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 4.8% de denuncias por abandono.

h 2: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 16.7% de denuncias por aborto.

h 3: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 1 6.7% de denuncias por homicidio.

h 4: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 26.2% de denuncias por maltrato
familiar.

h 5: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 28.6% de denuncias por muerte.

h 6: según la información redactada en la comisaría del distrito de san Bartolo en


el mes de marzo del 2019, se ha registrado 7.1% de denuncias por suicidio.

Ejemplo de aplicación 2.

La siguiente información corresponde a las denuncias contra la vida el cuerpo y la


s a l u d r egistradas p o r l a D I R I N C R I -PNP, en el cuarto trimestre del
año 2010.

40
r

a) Construir la tabla de distribución de frecuencia


correspondiente.
b) Interpretar cada una de las frecuencias

Solución:

La variable de estudio será: Xi : Tipo de denuncias contra la vida el cuerpo y


la salud.

Tabla de distribución de frecuencia sobre las denuncias contra la vida el


cuerpo y la salud registradas por la DIRINCRI-PNP, año
2010.
Denuncias contra la vida Frecuencia Absoluta el Frecuencia Relativa
cuerpo y la salud Simple Simple
fi hi
Homicidio 121 0.17
Muertes 114 0.16
Suicidios 23 0.03
Abortos 38 0.05
Lesiones 384 0.54
Exposición de. 26 0.04
personas a peligro
Abandono de 8 0.01
personas en peligro
TOTAL 714 1
FUENTE: Dirección de Investigación Criminal – PNP (Anuario Estadístico 2010)

41
INTERPRETACIÓN

FRECUENCIA ABSOLUTA SIMPLE

f1 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 121denuncias por homicidios.

f2 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 114 denuncias por muerte.

f3 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 23 denuncias por suicidios.

f4 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 38denuncias por abortos.
f5 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 384 denuncias por lesiones.

f6 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 26 denuncias por Exposición de
personas a peligro.

f7 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 8 denuncias por Abandono de
personas en peligro.

FRECUENCIA ABSOLUTA SIMPLE

h1 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 17% de denuncias por homicidios.

h2 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 16% de denuncias por muerte.
h3 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 3% de denuncias por suicidios.

h4 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 5% de denuncias por abortos.
h5 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 54% de denuncias por lesiones.

h6 - Según la Dirección de Investigación Criminal de la PNP en el cuarto


trimestre del año 2010 se ha registrado 4% de denuncias por Exposición de
personas a peligro.
h7 - Según la Dirección de Investigación Criminal de la PNP en el cuarto
trimestre del año 2010 se ha registrado 1% de denuncias por Abandono de
personas en peligro.

42
EJERCICIOS PROPUESTOS

1. Usando la tabla de distribución de frecuencia de los pesos de los recién nacidos


a. ¿Cuántos recién nacidos aproximadamente tienen un peso superior a 2.8 kg.
b. ¿Cuántos recién nacidos aproximadamente tienen un peso entre 2.2kg y 3.4 kg
c. ¿Cuál es el mínimo peso para que un recién nacido se encuentre
considerado dentro del 20% de los que tienen pesos altos ?
d. ¿Cuál es el máximo peso para que un recién nacido se encuentre
considerado dentro del 20% de los que tienen pesos bajos ?
e. ¿Qué porcentaje de los recién nacidos tienen un peso superior a 3.2 kg.?
f. ¿Qué pesos encierran al 80% central de los pesos de los recién nacidos ?
g. Hallar el mínimo peso, para que un recién nacido este considerado dentro del 25%
de los que tiene mayores pesos .
h. Entre que valores se encuentra el 50% central de los pesos de los recién nacidos.
i. Calcular el peso total aproximado de todos los recién nacidos
j. Después de cierto tiempo, los que tenían un peso menor a 3 kg incrementan su peso
en un 25% mas ¼ de kg. y los que tenían un peso mayor o igual a 3 kg. Se incrementan
en un 5%. más ¼ kg. Hallar el nuevo peso total aproximado de todos los recién nacidos
k. Suponiendo que los datos de la tabla presentan las siguientes transformaciones, los
datos con un peso menor a 3 kg. Incrementándose en un 12% y los datos con pesos
superiores o iguales a 3 kg. Se incrementan en un 20% ambos con respecto a los pesos
iniciales. ¿ Hallar el peso total después del incremento .
2.Una serie de 50 datos tiene como variable en estudio , los montos por venta en miles
de nuevos soles, siendo el monto mínimo 85 y el monto mayor 129. Establecer las clases
para la tabla.
3. Un conjunto de 50 datos, tiene como variable en estudios los pesos de cajas, Siendo
el peso mínimo 43.43 Kg. y el peso máximo 68.15 kg. Establecer las Clases para la tabla.
4. Los datos que a continuación se presentan, corresponden a una muestra Aleatoria de
40 frascos conteniendo mermeladas de fresa , el objetivo es Estudiar su peso (grs)

149 164 171 176 181 185 187 190


156 165 172 176 182 186 187 194
157 165 174 176 183 186 188 196
158 168 175 180 183 187 188 198
162 170 175 180 184 187 189 202

a. Elaborar la tabla de distribución de frecuencias y hacer los gráficos


Correspondiente, histograma, polígono de frecuencia, y ojiva use la regla de STURGES.
b. Hallar e interprete: H 5 – H 3
c. Usando la tabla de distribución de frecuencias, cual es el peso mínimo que debe
tener un frasco, para estar considerado dentro del 15% de los de mayor peso.

43
UNIDAD III

SESIÓN 5
MEDIDAS DE TENDENCIA CENTRAL

Introducción
En esta unidad se estudia las principales medidas de tendencia central o de posición
central, las cuales se definen como aquellos valores que representan al conjunto de
datos de una variable en estudio. Se presenta el cálculo de las medidas de tendencia
central para datos agrupados, y datos no agrupados, así como también sus propiedades.

5.1 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION CENTRAL

Son valores estadísticos calculados con los datos de la muestra o de la población y que
tienden a ubicarse en el centro de la distribución de los datos.
A estas medidas se les considera como valores representativos para el conjunto de datos
Si estos valores son calculados usando todos los datos de la muestra, se les llama valores
estadísticos, estadígrafos o estimados; en cambio sí son calculados usando todos los
datos de la población, se les llama parámetros.
Las medidas de tendencia central más usadas son:
1. La media aritmética o simplemente media o promedio
2. La mediana
3. La moda

5.2 LA MEDIA ARITMETICA


Es un valor que tiende a ubicarse en el centro de la distribución de los datos, y es
considerado un valor representativo para el conjunto de datos, cuando su
distribución es simétrica o los datos presentan poca variabilidad.
Su valor se calcula tanto para la muestra (valor estadístico) como para la población
(parámetro).

LA MEDIA ARIMÉTICA PARA LA POBLACION


Sea X una variable en estudio que toma valores x1, x2, x3,….., xN , la media aritmética
para la población se simboliza universalmente con la letra griega µ(se lee “mu”) y es
igual a la sumatoria de todos los datos de la población divididos por el total de ellos
N

x
i =1
i

µ=
N

Nota: El valor de la media aritmética para la población (parámetro) casi nunca se


conoce, el objetivo es estimar su valor, a través de la media aritmética muestral.

Ejemplo:
Supongamos que se tienen todos los pesos en kg de 3.546 varones adultos de una
empresa minera, siendo estos:
65,5 70,5 69,5 70,0 71,0 ……………68,5

44
Hallar su peso promedio e interprete
3546

x
i =1
i
65,5+70,5+69,5+70+71+...+68,5
µ= = = 68,2 kg
3546 3.546

Por lo tanto 68,2 kg, será el peso promedio para todos los trabajadores de la empresa
es decir el parámetro.

LA MEDIA ARIMÉTICA PARA LA MUESTRA


Se X una variable en estudio que toma valores x1, x2, x3,….., xn, la media aritmética
para una muestra se simboliza universalmente con la letra x ( se lee x-barra) y su valor
es igual a la sumatoria de todos los datos de la muestra divididos por el total de ellos.

∑𝑛1 𝑋𝑖
x = 𝑛
.
Es la media aritmética para datos sin agrupar. Al valor de la media aritmética, también
se le conoce como la media aritmética muestral.

Ejemplo
Los siguientes datos corresponden a los pesos (kg) , de 8 personas adultas de sexo varón:
60,5 68,5 58,5 70,5 70,0 68,5 72,0 71,0
Calcular e interpretar la media aritmética
n

x
i =1
i
60,5+68,5+58,5+70,5+70+68,5+72+71
x = = = 67,4 kg
6 6

Interpretación
La media es: 67,4 kg es el peso promedio de 8 varones adultos, por lo tanto este valor
representa a los pesos de los 8 varones; supongamos que los 8 varones adultos son
elegidos al azar de una población de varones adultos, entonces se puede concluir que el
peso promedio de los varones adultos en la población es de 67,4 kg

PROPIEDADES DE LA MEDIA ARIMÉTICA MUESTRAL


La media aritmética para la muestra, tiene las siguientes propiedades:

1. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y x , la media aritmética, definimos
a una DESVIACIÓN (di)como la diferencia entre un dato xi de la muestra y su media

aritmética x ; es decir: di = xi - x
Entonces la sumatoria de todos los valores di es igual a cero; esto es:

45
n −
d = ∑𝑛 2
2
i 𝑖=1(𝑥𝑖 − 𝑥 ) = 0
i =1

2. La suma de los cuadrados de las desviaciones con respecto a la media aritmética, es


siempre un valor mínimo; es decir
n −
d =∑𝑛 2
2
i 𝑖=1(𝑥𝑖 − 𝑥 ) es siempre un valor mínimo
i =1

3. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y x , la media aritmética, sea la
combinación lineal yi = axi ± b; entonces la media aritmética para variable Y es:
Y =a x ±b
4. Sea una muestra de tamaño “n” , dividida en “k” submuestra de tamaño n1, n2……nk ,
y 𝑥̄ 1 , 𝑥̄ 2 , 𝑥̄ 1, , …̄… … , 𝑥̄ 𝑘 , la media aritmética de cada submuestra;
entonces la media aritmética de la muestra se calcula por:
k

 x f
i =1
i i

𝑥̄ = n
A esta medida se le conoce como la media ponderada
LA MEDIA ARIMETICA PARA DATOS AGRUPADOS
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada
clase se le asigna su frecuencia correspondiente.
Cuando los datos se encuentran en una tabla de distribución de frecuencias la media
aritmética se calcula de la siguiente fórmula
∑𝑘 ′
𝑖=1 𝑥𝑖 𝑓𝑖
x=
𝑛
Donde:
K= número de clases
xi = Marca de clase i-ésima clase (corresponde a la ponderación)
fi= Frecuencia absoluta de la i-ésima clase

Otra fórmula que se puede utilizar para calcular la media aritmética para datos
agrupados, es en función de las frecuencias relativas
x =∑𝑛𝑖=1 𝑥𝑖′ ℎ𝑖
Nota:
Las propiedades de la media aritmética para datos sin agrupar, se cumplen también para
datos agrupados.

Ejemplo
Sea la tabla para los datos agrupados de los pesos (kg) de los recién nacidos. Hallar e
interpretar la media aritmética:

46
i Pesos fi hi Fi Hi xi
1 [1,5 -2,0 3 0,09 3 0,09 1.75

2 [2,0-2,5 5 0,15 8 0,24 2.25

3 [2,5-3,0 6 0,176 14 0,416 2.75


4 [3,0-3,5 12 0,35 26 0,746 3.25

5 [3,5-4,0 6 0,176 32 0,922 3.75


6 [4,0-4,5] 2 0,05 34 1 4.25
TOTAL 34

∑𝑘 ′
𝑖=1 𝑥𝑖 𝑓𝑖 1.75*3 + 2.25*5 + ... + 4.25* 2 103
x = = = = 3.029kg
𝑛 34 34
Interpretación:
La media es 3.029kg es el peso promedio representativo para los recién nacidos de la
maternidad de Lima

VENTAJAS Y DESVENTAJAS DE LA MEDIA ARIMÉTICA

VENTAJAS
a. Es fácil de calcular e interpretar su valor
b. La suma de las desviaciones es cero
c. La suma de las desviaciones al cuadrado siempre es mínima

DESVENTAJAS
a. Su valor se encuentra afectado por datos extremos (datos muy altos o datos
muy bajo de lo común); es decir estos datos tienden a alterar su valor
b. Deja de ser un valor representativo para la muestra cuando los datos
presentan mucha variabilidad.
c. No se puede calcular en tabla con extremos abiertos
d. Para datos con distribución asimétrica, no debe usarse como medida
representativa

5.3 LA MEDIANA (Me o Md)


La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor. La mediana se puede hallar solo para variables
cuantitativas.

Su aplicación se ve limitada, ya que solo considera el orden jerárquico de los datos y no


alguna propiedad propia de los datos, como en el caso de la media aritmética.

47
VENTAJAS Y DESVENTAJAS DE LA MEDIANA

VENTAJAS
1. Es fácil de calcular e interpretar su valor
2. Se realizan manipulaciones algebraicas
3. Su valor no se encuentra afectado por datos extremos
4. Se puede calcular en tablas de distribución de frecuencias con extremos abiertos

DESVENTAJAS
La suma de los cuadrados de las desviaciones con respecto a la mediana no es mínima,
en comparación con la media aritmética

5.3.1 PARA DATOS NO AGRUPADOS

PARA UN NÚMERO DE DATOS IMPAR


La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su
posición se aplica la siguiente ecuación:
Se ordenan los datos de menor a mayor.
La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su
posición se aplica la siguiente ecuación:

Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadística evaluadas
sobre diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6

Solución:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuación:

La mediana es el valor de x5 (quinto dato), es decir, Md=8

48
PARA UN NÚMERO DE DATOS PAR
La mediana es la media aritmética de los dos datos que se encuentran a la mitad de la
lista. Para calcular su posición se aplica la siguiente ecuación:

Ejemplo:
Calcular la mediana de las siguientes calificaciones del curso de Matemática evaluadas
sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solución:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuación

5.3.2 CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS

PARA DATOS AGRUPADOS EN TABLAS DE FRECUENCIA PAR O IMPAR

Para calcular la posición de la mediana se aplica la siguiente ecuación:

Ejemplo:
Dados los siguientes 20 números:
1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6, 4, 4, 4 ,4, 5, 5, 5 y 5
x fi
1) Agrupar los datos en tabla de frecuencia. 1 1
2 3
Solución:
2) Calcular la mediana. 3 2
4 4
Solución:
Calculando la posición de la mediana se obtiene: 5 8
6 2
Total 20

49
Como la posición de la mediana es 10,5, su valor es el promedio de los datos décimo y
undécimo. Para observar con claridad cuáles son los datos décimo y undécimo se
aconseja calcular la frecuencia acumulada.
x f fa
1 1 1
2 3 4
3 2 6
4 4 10
5 8 18
6 2 20
Total 20
Se observa que el décimo dato es 4 y el undécimo es 5, por lo tanto:

PARA DATOS AGRUPADOS EN INTERVALOS

a) POR INTERPOLACIÓN VARIABLE CUANTITATIVA CONTINUA


Ejemplo:
Calcular la mediana de los pesos de un grupo de 50 personas que se distribuyen de la
siguiente manera:
Intervalos f
[45,55) 6
[55, 65) 10
[65, 75) 19
[75, 85) 11
[85, 95) 4
Solución:
Primero se calcula n/2 y después se averigua el intervalo en el que está la mediana, este
intervalo recibe el nombre de intervalo o clase de la mediana. Para averiguar el intervalo
en el que está la mediana se aconseja calcular la frecuencia acumulada.

Intervalos f fa
[45,55) 6 6
[55, 65) 10 16
[65, 75) 19 35
[75, 85) 11 46
[85, 95) 4 50

50
En este ejemplo el intervalo de la media es [65,75).
Se observa que 16 valores están por debajo del valor 65.
Los 9 que faltan para llegar a 25 se interpolan en el ancho del intervalo de la mediana
que en este ejemplo es 10.

Aplicando regla de tres:


Si 19 corresponde a 10 valores del intervalo
A 9 corresponde a X

Por lo tanto, la Mediana es igual a 65 + 4,737 = 69,737

EJERCICIOS DESARROLLADOS

Hallar la mediana.
Ejercicio 1. Se tienen los valores:
3 ; 2; 9; 5; 6
Solución: Ordenando
2, 3, 5 , 6. 9
La Me = 5 (Como la cantidad de números es impar, la Mediana es el termino
central=(5+1)/2 =3 → el tercer término)

Ejercicio 2. Se tienen los valores:


5; 3; 1; 6; 7; 2; 9, 8
Solución: Ordenando , el termino será = (8+1)/2=4,5 → entonces se toman los números
5 y 6.
1, 2, 3, 5, 6, 7, 8, 9,
Me= 5 + 6 = 5.5
2
Si es par se ordena de menor a mayor y hallamos la semisuma de los datos centrales

Ejercicio 3.
La cantidad de usuarios que concurren a un centro de información durante la semana
es:
230 220 250 228 240 1200
Hallar el valor de la mediana de la concurrencia de usuarios

Solución: Ordenando
Ordenando los datos en forma ascendente
220 228 230 240 250 1200
230 + 240
𝑀𝑒 = = 235
2

51
Interpretación:

El 50% de las cantidades de usuarios que concurren al centro de información durante


los días de la semana es menor o igual a 235, y el otro 50% de las cantidades es superior
a 235 usuarios

Ejercicio 4.
Hallar e interprete el valor de la mediana para las estaturas (mts) de 7 alumnos de la
Escuela de Suboficiales:
1.71 1.69 1.72 1.69 1.68 1.70 1.73

Solución:
Ordenando las estaturas: 1,68 1,69 1,69 1,70 1,71 1,72 1,73

Como n=7, entonces: me = x( 7+1 ) = x4 = 1.70


2

Interpretación:
El 50% de los alumnos tienen estaturas menores o iguales a 1,70 mts. Y el otro 50% de
los alumnos tienen estaturas superiores a 1,70 mts

EJEMPLOS DE CÁLCULO DE LA MEDIANA PARA LOS DATOS AGRUPADOS PARA UNA


VARIABLE CUANTITATIVA DISCRETA Y CONTINUA

Ejemplo: para una VARIABLE CUANTITATIVA DISCRETA

En la siguiente tabla de distribución de frecuencias, la variable en estudio X corresponde


al número de balones de gas vendidos diariamente por 50 tiendas. Hallar el valor de la
mediana del número de balones de gas vendidos diariamente

i X fi
1 22 9
2 23 10
3 21 6
4 25 7
5 26 5
6 24 13
TOTAL 50

Ordenando los valores que toma la variable X, y obtenemos el valor de las frecuencias
absolutas acumuladas

52
i X fi Fi
1 21 6 6
2 22 9 15

3 23 10 25(X26→X38)

4 24 13 38 ( x26 → x38 )
5 25 7 45
6 26 5 50
TOTAL 50

n= 50 ( par) me = x 25 + x 26 = 23 + 24 = 23,5
2 2 2
Interpretación:
El 50% de las tiendas tienen una venta diaria menor o igual a 23,5 balones de gas, y el
otro 50% de las tiendas tienen una venta diaria mayor a 23,5 balones de gas.

b) Por fórmula: VARIABLE CUANTITATIVA CONTINUA

Cuando los datos se presentan en una tabla de distribución de frecuencias, para una
variable continua, el valor de la mediana se calcula haciendo uso de la fórmula:

N - F i-1
Me = Li + 2 x C
fi
Donde :
Li = Límite inferior de la clase que contiene al valor de la mediana
F i-1 = Frecuencia acumulada absoluta de la clase anterior a la clase que
Contiene a la mediana
f i = Frecuencia absoluta de la clase que contiene a la mediana
C = Ancho del intervalo de clase .

Para ubicar la clase que contiene el valor de la mediana se busca en la columna de la


frecuencias acumuladas absolutas o frecuencias acumuladas relativas ( F i o Hi ) el
primer valor que supera a la mitad del número de datos
0 el 50% de los mismos , es decir,

Fi≥ n ó Hi ≥ 0,5
2

53
Ejemplo:
Hallar e interprete el valor de la mediana para la tabla de datos agrupados de los pesos
de recién nacidos.

i pesos fi hi Fi Hi Xi
1 [1,5 -2,0> 3 0,088 3 0,088 1,75
2 [2,0-2,5> 5 0,147 8 0,235 2.25
3 [2,5-3,0> 6 0,176 14 0,411 2,75
4 [3,0-3,5> 12 0,352 26 0,763 3,25
5 [3,5-4,0> 6 0,176 32 0,939 3,75
6 [4,0-4,5] 2 0,058 34 0,997 4,25
34 1,00 100%

n= 34 → n = 17 ≤ F i → i = 4
2

N - F i-1
Me = Li + 2 xC
fi

Me = 3 + 17-14 x 0,5 = 3,125 Kg.


12
Interpretación:
El 50% de los recién nacidos tienen pesos menores a iguales a 3,125 kg. y el otro 50% de
los recién nacidos tienen pesos superiores a 3,125 kg

5.4 LA MODA.

Sea x una variable en estudio que toma los valores x 1 , x2 ………xn la


moda, es aquel valor de la variable que se presenta con mayor frecuencia,
se representa por ( Mo ) = es decir :

MO = valor que toma la variable para la máxima frecuencia ( f i )

El valor de la moda se interpreta, como el valor más frecuente para el conjunto de


datos de una muestra o población.
El valor de la moda puede o no existir, Si un conjunto de datos tiene una sola moda
a su distribución se le llama unimodal, si tiene dos modas se le llama bimodal y para
más modas multimodal

5.4.1 CÁLCULO DE LA MODA PARA DATOS NO AGRUPADOS

Ejemplo 1.
Hallar la moda para el conjunto de datos :

54
12 , 16, 18, 18, 18, 20, 20, 20, 20, 20 , 20 , 24

El dato que se repite con mayor frecuencia es el valor 20, luego la moda es
20 .
Ejemplo 2.
Calcular la moda para la serie de datos
1, 1, 2, 3, 3, 4, 7

Los datos que se repiten con igual frecuencia son el 1, y 3 , luego la


distribución tiene dos modas 1, y 3 bimodal

Ejemplo 3.
Calcular la moda para el conjunto de datos : 4 , 2, 3, 7, 5, 9

Como no existe ningún dato que se repite más de una vez, luego el conjunto de
datos no tiene moda (Amodal).

Ejemplo 4.

Una tienda vende durante el día tres tipos de conservas, 120 frascos con
fresa, 40 frasco con mango y 50 frasco con piña, calcular la moda. En este
ejemplo la variable en estudio es tipo de conservas vendidas, luego los
frascos con fresa registraron la mayor venta, por lo tanto, el frasco con fresa
corresponden a la moda.

5.4.2 CALCULO DE LA MODA PARA DATOS AGRUPADOS

Cuando los datos se encuentran en una tabla de distribución de frecuencias


la fórmula para calcular la moda es :

Mo = Li + d1 x C
d1 + d2
Donde :

Li = Límite inferior de la clase que contiene al valor de la moda


d 1 = f i– f i - 1 = Diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase anterior .
d 2= f i– f i + 1 = Diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase siguiente.

La clase modal corresponde a la clase de mayor frecuencia absoluta

Ejemplo.
De la tabla de distribución de frecuencia, en la cual se analiza los pesos de los recién
nacidos, Hallar e interprete el valor de la moda.

55
i pesos fi hi Fi Hi Xi
1 [1,5 2,0> 3 0,088 3 0,088 1,75
2 [2,0-2,5> 5 0,147 8 0,235 2,25
3 [2,4-3,0> 6 0,176 14 0,411 2,75
4 [3,0-3,5> 12 0,352 26 0,763 3,25
5 [3,5-4,0> 6 0,176 32 0,939 3,75
6 [4,0-4,5> 2 0,058 34 0,997 4,25
34 1,00

El valor de la moda se encuentra en la 4ta clase, por presentar la máxima frecuencia


absoluta, en este caso las distribución es unimodal para esta muestra, luego i = 4

d 1 = f i– f i - 1 = f 4– f 5 = 12 – 6 = 6

d 2= f i– f i + 1 = f4 – f 5 = 12- 6 = 6

Mo = Li + d1 x A = M 0 = 3 + 6 0,5 = 3,25 kg
d1 + d2 6+6

Interpretación : La Moda es: 3,25 kg. Es el peso más frecuente para los recién nacidos.

56
SESIÓN 6
PRACTICAS DIRIGIDAS – REPASO

SESIÓN 7
PRIMERA EVALUACIÓN PARCIAL

57
SESIÓN 8
MEDIDAS DE POSICIÓN NO CENTRAL

8.1 MEDIDAS DE POSICION NO CENTRAL


Informan de cómo se distribuye el resto de los valores de la serie.
Los Cuantiles (cuartiles, deciles, percentiles) son medidas de localización, su función es informar
del valor de la variable que ocupará la posición (en tanto por cien) que nos interese respecto de
todo el conjunto de variables. Podemos decir que los Cuantiles son unas medidas de posición
que dividen a la distribución en un cierto número de partes de manera que en cada una de ellas
hay el mismo de valores de la variable.

CUARTILES

Los Cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales (de 25% cada parte). De manera que para resolver
un problema sobre cuartiles solamente tenemos que hallar Q1; Q2 y Q3.
Los Cuartiles, dividen a la distribución en cuatro partes iguales (tres divisiones).
Q1,Q2,Q3, correspondientes a 25%, 50%,75%.


CUARTILES PARA DATOS NO AGRUPADOS:

Pasos a seguir:
1) Ordenar los datos en forma ascendente.
2) Calcular Q2 es decir hallar la Mediana:
✓ Si la cantidad de datos es impar, el valor que está en el centro será la Mediana, es
decir Q2.
✓ Si cantidad de datos es par, se suman los 2 datos centrales y se divide entre
3) Calcular Q1 y Q3.
EJEMPLO:
Cálculo de los cuartiles

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresión

58
CASO: NÚMERO IMPAR DE DATOS

CASO : NÚMERO PAR DE DATOS

CUARTILES PARA DATOS AGRUPADOS:

Para hallar los tres Cuartiles (Q) para datos agrupados se aplica la siguiente fórmula:

Donde:
Qk : Cuartil

Li: Límite inferior del intervalo seleccionado.


k: Debe ser 1 ; 2 ó 3
n: Número total de datos
f: Frecuencia absoluta del intervalo seleccionado.

Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la clase cuartil)

a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)

Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Cuartil:

Luego en la Columna "F" escoger el primer valor mayor que la clase cuartil
encontrada.
3. Aplicar la fórmula.

59
EJEMPLOS:

1. Encuentra los tres cuartiles de la siguiente Tabla de frecuencias que muestra el tiempo
de servicio de trabajadores de la empresa ABC.

Solución:
Completamos la tabla hallando F:

Encontramos las clase cuartil y la pintamos.

Cuartil 1:

Respuesta: El 25% de empleados tiene 12,7 años de servicio o menos.

Cuartil 2:

60
Respuesta: El 50% de empleados tiene 21,7 años de servicio o menos.

Cuartil 3:

Respuesta: El 75% de empleados tiene 27,8 años de servicio o menos.

DECILES

Los Deciles son los nueve valores de la variable que dividen a un conjunto de datos
ordenados en 10 partes iguales (de 10% cada parte). De manera que para resolver un
problema sobre deciles solamente tenemos que hallar D1; D2 ; D3 ; D4 ; ... D9

Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.

DECILES PARA DTOS NO AGRUPADOS

Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.

1. Ordenamos los datos de menor a mayor.


2. Se busca el lugar que ocupa cada decil mediante la expresión

K. N = 1,2,3,4,5,6,7,8,9
10

61
CASO: NÚMERO IMPAR DE DATOS
6, 8, 7, 2, 3, 5, 4, 6, 2, 6, 10, 8, 11, 1, 2, 5, 5, 1, 12

1, 1, 2, 2, 2, 3, 4, 5, 5, 5, 6, 6, 6, 7, 8, 8, 10, 11, 12

D1 D2 D3 D4 D5 D6 D7 D8 D9

CASO : NÚMERO PAR DE DATOS


6, 8, 7, 2, 3, 5, 4, 6, 2, 6, 10, 8, 11, 1, 2, 5, 5, 1, 12, 13

1, 1, 2, 2, 2, 3, 4, 5, 5, 5, 6, 6, 6, 7, 8, 8, 10, 11, 12, 13

1.5 2 3.5 5 5.5 6 7.5 9 11.5

D1 D2 D3 D4 D5 D6 D7 D8 D9

DECILES PARA DATOS AGRUPADOS

Para hallar los Deciles (D) para datos agrupados se aplica la siguiente fórmula:

Donde:
Dk : Decil
Li: Límite inferior del intervalo seleccionado.
k: Debe ser 1 ; 2 ; 3 ; 4; ... ; 9
n: Número total de datos
f: Frecuencia absoluta del intervalo seleccionado.
Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la clase decil)
a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)

Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Decil:

Luego en la Columna "F" escoger el primer valor mayor que la clase Decil encontrada.
3. Aplicar la fórmula.

62
EJEMPLOS:

1. La tabla muestra el peso (en Kg) de los estudiantes de la del “Primer año de la
Escuela Técnica de la PNP”, Calcula e interpreta los cuatro primeros Deciles:

Solución:
Completamos la tabla hallando F:

Encontramos la clase Decil y seleccionamos el intervalo del cual tomaremos los datos.

Decil 1:

Respuesta: El 10% de los estudiantes tiene 58,13 Kg de peso o menos.

Decil 2:

63
Respuesta: El 20% de los estudiantes tiene 65 Kg de peso o menos.

Decil 3:

Respuesta: El 30% de los estudiantes tiene 70,94 Kg de peso o menos.

Decil 4:

Respuesta: El 40% de los estudiantes tiene 75 Kg de peso o menos.

PERCENTILES

Los Percentiles son los 99 valores de la variable que dividen a un conjunto de datos
ordenados en 100 partes iguales (de 1% cada parte). De manera que para resolver un
problema sobre percentiles solamente tenemos que hallar P1; P2 ; P3 ; P4; ... ; P99
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso,
estatura, etc.
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante. El 60 percentil, es aquel valor de la variable
que supera al 60% de las observaciones y es superado por el 40% de las
observaciones. El percentil 99 supera 99% de los datos y es superado a su vez por el
1% restante.

NOTA: Para hallar los Percentiles se sigue el mismo procedimiento que los Cuartiles.

PERCENTILES PARA DATOS AGRUPADOS

64
Para hallar los Percentiles (P) para datos agrupados se aplica la siguiente fórmula:

Donde:
Pk : Percentil
Li: Límite inferior del intervalo seleccionado.
k : Debe ser 1 ; 2 ; 3 ; 4; 5 ; ... ; 99
n: Número total de datos
f : frecuencia absoluta del intervalo seleccionado.
Fi-1 : Frecuencia absoluta Acumulada (pero anterior a la Clase Percentil)
a : Amplitud del intervalo (Restar los 2 valores: L sup - L inf)

Pasos a seguir:
1. Completar la tabla "llenando" la Frecuencia Absoluta Acumulada "F".
2. Encontrar la Clase Percentil:

Luego en la Columna "F" escoger el primer valor mayor que la clase Percentil
encontrada.
3. Aplicar la fórmula

EJEMPLOS:
1. La tabla muestra el consumo semanal de fruta de los pacientes de un hospital,
Calcula e interpreta el Percentil 60 y 90.

Solución:
Completamos la tabla hallando F:

65
Encontramos las Clase Percentil y seleccionamos el intervalo del cual tomaremos los
datos.

Percentil 60:

Respuesta: Semanalmente el 60% de los pacientes consume como máximo 3.5 Kg de


fruta y el 40% restante consume más de 3,5 Kg de fruta.

Percentil 90:

Respuesta: Semanalmente el 90% de los pacientes consume como máximo 5,8 Kg de


fruta y el 10% restante consume más de 5,8 Kg de fruta.

EJERCICIOS PROPUESTOS DE MEDIDAS DE POSCIÓN NO CENTRAL

A. DECILES, CUARTILES Y PERCENTILES CON DATOS NO


AGRUPADOS

1. Las tardanzas de los estudiantes del “Primer año de la ETPNP” fueron de


la siguiente manera. 2, 5, 3, 6, 7, 4, 9. Hallar el cuartil 1 (Q1) , el cuartil
2 (Q2) y el cuartil 3 (Q3)
Rpta 3, 5 y 7

2. Las calificaciones de servicio a la comunidad de los alumnos del segundo

66
año de la ETPNP fueron considerados del 1 al 10, y arrojaron así: 1, 4, 9,
8, 7, 8, 2, 8 , 9. Hallar Q 3.
Rpta 8.5

3. De las calificaciones anteriores (ejercicio 2). Hallar el D 7


Rpta 8

4. Los siguientes datos corresponden a una muestra al azar de efectivos


policiales durante la tardanza del mes de noviembre del 2022.
45, 42, 32, 44, 43, 39, 40, 35, 31

Calcular e interpreta: Q2, D5 y P50

B. DECILES, CUARTILES Y PERCENTILES CON DATOS AGRUPADOS

1. Calcular el segundo decil (D2), cuartil 3 (Q3) y el percentil (P50) de los


sueldos correspondientes a los 80 practicantes de La ETPNP.

Sueldos f1
900 – 1200 11
1200 -Talla
1500 13 No de
1500 – 1800 20
participantes
1800
1.60––2100
1.65 1717
1.65––2400
2100 1.70 1520
1.70––2700
2400 1.75 33
1.75 – 1.80
2700 - 3000 110
1.80 - 1.85 5

2. La muestra las tallas de un grupo del personal de la PNP de Puente Piedra,


arrojaron de la siguiente manera:
Calcula e interpreta el cuartil 2, el decil 4 y el percentil 87

3. Los 60 alumnos de la “PROMOCION PROTECTORES DE LA DEMOCRACIA de la


EESTP PNP de Puente Piedra”, del curso de Estadística, han sacado las
siguientes notas, de los cuales se solicita el primer cuarltil, tercer decil y el
percentil 65. Además interpreta cada una de ellas.

Notas (x) fi Fi
𝐿𝑖 − 𝐿𝑠
10 - 12 14
𝐿𝑠
12 - 14 33

14 - 16 9

16 - 18 1

67
4. Hallar e Interpretar: Los Q2, D7 y P90 del siguiente estudio que se ha realizado
de
“Robo a banco y entidades financieras 2000 -2011”

Años fi
2000 - 2002 4
2002 – 2004 6
2004 – 2006 6
2006 – 2008 15
2008 – 2010 28
2010 - 2011 31

Fuente: PNP (2000-2011)


Elaboración: DINDES -SENAJU

68
SESIÓN 9
MEDIDAS DE DISPERSIÓN O VARIABILIDAD

RANGO, INTERCUARTIL, DESVIACIÓN MEDIA

Si disponemos de un conjunto de datos u observaciones recogidas para analizar un variable


determinada, así como es muy importante el estudio de indicadores de tendencia, será
conveniente también, evaluar el grado de variabilidad o de dispersión que presentan dichos
datos. Al respecto nos debemos preguntar: ¿El comportamiento de los datos muestra un alto
grado de homogeneidad o, por el contrario, son muy heterogéneos entre sí?

Si los datos son muy semejantes entre sí, podremos observar que no se encuentran muy
dispersos con respecto a la media; es decir los datos no son muy variables; sin embargo, cuando
los datos presentan diferencias importantes entre sí, apreciaremos que tienden a dispersarse, y
de este modo, la información resulta variable o heterogénea. De otro lado, si los datos fuesen
iguales, se dice que no existe variabilidad o dispersión entre ellos

El estudio del grado de variabilidad de los datos que se han recogido es muy importante en todo
análisis estadístico, porqué de éste depende el grado de confiabilidad de las estimaciones que
podamos establecer.

DEFINICIÓN

A los indicadores que se utilizan para analizar el grado de heterogeneidad o de variabilidad de


un conjunto de datos u observaciones, son llamados en general, medidas de variabilidad o
medidas de dispersión.

Las medidas de dispersión son un conjunto de valores que tienen por objeto proporcionar en un
valor único, información sobre la variabilidad que presenta la población o la muestra con
respecto a la variable de interés.

Ejemplo: Supongamos que dos estudiantes han realizado cinco exámenes cada uno. Para
evaluarlos elegimos calcular la media de las cinco notas que han obtenido. Las notas han sido:

Notas Media
Estudiante N°01: 14, 15, 15, 15, 16. 15
Estudiante N 02: 11, 12, 15, 18, 19. 15

Si observamos la media de los dos estudiantes tendrían la misma nota (15), lo que nos haría
pensar que los dos estudiantes son similares, pero si observamos sus notas hay una gran
diferencia entre ambos:

El estudiante N°01 tiene unas notas muy homogéneas, muy próximas a la media, mientras que
el estudiante N°02 tiene notas muy dispares.

Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos mida esa
variabilidad. Nos referimos a las medidas de dispersión.

69
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad
de los datos, si la distribución de los datos es más o menos homogénea y por tanto nos dan una
medida sobre la representatividad de los parámetros de centralización (moda, mediana o
media).

En otras palabras, las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de
manera resumida una característica de la variable estudiada. En este sentido, deben acompañar
a las medidas de tendencia central. Juntas ofrecen información de un sólo vistazo que luego
podremos utilizar para comparar y, si fuera preciso, tomar decisiones.

Podemos decir finalmente que las medidas de dispersión nos informan sobre cuánto se alejan
del centro los valores de la distribución; las medidas de dispersión nos permiten tener la
posibilidad de establecer comparaciones de diferentes muestras.

Las medidas de dispersión se dividen en dos grandes grupos:

A. Las medidas de Dispersión Absolutas

Estas medidas de dispersión vienen expresadas en la misma medida en que se expresa la variable
que genera la serie de datos y su valor se limita a la serie misma.

a. Rango, amplitud o recorrido.


b. Rango intercuartílico.
c. Desviación Media.
d. Desviación Estándar.
e. Varianza.
B. Las medidas de Dispersión Relativas

Estas medidas de dispersión son relaciones entre medidas de dispersión absoluta y medidas de
tendencia central, las cuales vienen expresadas en valores proporcionales o porcentuales y
tienen como función determinar entre varias distribuciones la de mayor o menor dispersión; es
decir, Heterogeneidad u homogeneidad entre dos series de datos.

a. Coeficiente de Variación.

A. Medidas de Dispersión Absolutas


a. RANGO
Se denomina rango a la diferencia entre el mayor y el menor valor de un conjunto de los datos
de una distribución estadística. Se calcula por medio de la fórmula:

Rang(X) = Máx(X) - Mín(x)

Dónde:

70
Max (X): Es el máximo valor que toma la variable X en los datos recogidos.

Mín (𝒙): Es el mínimo valor que toma la variable X en los datos recogidos.

Características:

• Solo suministra información de los extremos de las variables.


• Informa sobre la distancia entre el mínimo y máximo valor observado.
• Se limita su uso a una información inicial.
Utilidad:

• El rango representa la amplitud de la variación de un fenómeno entre su límite menor y


uno claramente mayor.
• Expresa cuantas unidades de diferencia podemos esperar, como máximo, entre dos
valores de la variable.
• Estima el campo de variación de la variable.
• Conserva datos y se puede calcular a partir de restar el valor máximo con el mínimo.
Desventaja:

• No expresa realmente la concentración de los datos, presentándose casos en los cuales se


obtienen intervalos exagerados cuando en realidad la serie tiene una gran concentración,
pero sus valores extremos difieren mucho del resto de valores de la serie.
Ejemplo 01
Se tiene la edad de un grupo de personas, las cuales son las siguientes:

17, 18, 18, 18, 23, 15, 25, 18, 20, 17, 35.

El Rango será igual a:

𝑹𝒂𝒏𝒈(𝒙) = 𝑴á𝒙(𝒙) – 𝑴í𝒏(𝒙)

Rango = 35 – 15

Rango = 20

El cual es exagerado y no da una idea real de la concentración de los datos.

Ejemplo 02

En una empresa se quiere analizar estadísticamente las ventas conseguidas de su producto


estrella durante los últimos veinte años. Para ello, le solicitan calcular varias métricas

71
estadísticas entre ellas el rango. Si las ventas del producto son las mostradas en la siguiente
tabla, ¿Cuál es el rango de este conjunto de datos?
AÑOS VENTAS
1 4239
2 6674
3 7714
4 4121
5 9391
6 6648
7 9048
8 5717
9 3623
10 3433
11 3156
12 8686
13 3805
14 6828
15 1895
16 7468
17 9947
18 8941
19 8065
20 8680

En este ejercicio tenemos 20 observaciones. En realidad, el número total de observaciones es


indiferente para sacar el rango de una muestra, porque solo nos interesa el valor más grande y
el valor más pequeño.

El Rango será igual a:


𝑹𝒂𝒏𝒈(𝒙) = 𝑴á𝒙(𝒙) – 𝑴í𝒏(𝒙)
𝑹 = 𝟗𝟗𝟒𝟕 − 𝟏𝟖𝟗𝟓 = 𝟖𝟎𝟓𝟐

Por consiguiente, se determina que la variación máxima que se ha producido de la venta durante
estos últimos años es de 8052 unidades.
Representando gráficamente todos los datos del ejercicio junto con su rango estadístico:

72
b. RANGO INTERCUARTÍLICO
El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística de la dispersión
de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico
es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya
que este estadístico es insensible a posibles irregularidades en los extremos).

Se calcula por medio de la fórmula:

IQR = Q3 – Q1
Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución normal o
campana de Gauss) es más apropiado medir la tendencia central y la dispersión mediante la
mediana y el rango intercuartil respectivamente que con la media aritmética y la desviación
típica.

Ejemplo 01
Para el cálculo de un rango intercuartílico, consideraremos el conjunto de datos:

2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9
Q1 = (3 +4)/2 Q3 = (8 +8)/2
M
Mínimo =2

Q1 = 3,5

73
Mediana =6

Q3 =8

Máximo =9

Así vemos que el rango intercuartil es:

IQR = Q3 – Q1

IQR = 8 – 3,5

➔ IQR = 4,5.

Ejemplo 02

Hallar el rango intercuartil de la siguiente muestra que está constituida por las edades de 15
personas detenidas en esta última semana, en la Comisaría Sol de Oro:

25 17 19 28 26

27 20 18 26 12

18 28 16 30 22

1° Debemos de ordenar de mayor a menor:

12 16 17 18 18

19 20 22 25 26

26 27 28 28 30

2° Debemos de determinar el Q1 y Q3:

Q1 = Percentil 25

25
i=( )(15)
100

i = (𝟎. 𝟐𝟓)(𝟏𝟓)

i = 3.75 => 4

 Q1 se encuentra en la Posición 4

74
Q1= 18

Q3 = Percentil 75

𝟕𝟓
i=( )(𝟏𝟓)
𝟏𝟎𝟎

i = (𝟎. 𝟕𝟓)(𝟏𝟓)

i = 11.25 => 12

 Q3 se encuentra en la Posición 12

Q3= 27

Por lo tanto:

IQR = Q3 – Q1

IQR = 27 – 18

IQR = 9

c. DESVIACIÓN MEDIA

Es el valor promedio de los desvíos tomados en valor absoluto, de los datos con respecto a un
término central. El término central en la práctica es la media aritmética, pero también puede
usarse la mediana, la moda o un valor arbitrario, dependiendo de los datos estudiados. Para el
cálculo de la desviación media se utilizará las siguientes fórmulas:

∑𝑁 ̅̅̅
𝑖=1 |𝑋𝑖 −𝑋|
𝐷𝑀 = Datos no agrupados.
𝑁

∑𝑘 ̅
𝑖=1|𝑋𝑖 −𝑋|𝑓𝑖
𝐷𝑀 = Datos agrupados
𝑁

Características:

− Todas las observaciones se usan en el cálculo.


− No tiene la influencia debido a los valores altos y bajos.
− Es un poco difícil trabajar con los valores absolutos.
Ventajas

− La desviación media se puede utilizar como medida de dispersión en todas aquellas


distribuciones en las que la medida de tendencia central más significativa haya sido la media.
− Utiliza en su cálculo todos los valores de la muestra.
− Fácil de comprender pues es el promedio en que los valores se desvían con respecto a la
media.

75
Desventajas

− La desviación media de una muestra no es un buen estimador de la desviación media de la


población, que finalmente es lo que nos interesa conocer.

Ejercicio 01

Calcular la desviación media de los siguientes datos: 2, 4, 6 y 8.

Empezamos calculando la media aritmética de los datos, teniendo en cuenta que tenemos 4
datos (n = 4)

El valor de la media aritmética es de 5.

Ahora aplicamos la fórmula de la desviación media:

El valor de la desviación media es 2.

Ejercicio 02

A continuación, se muestra un cuadro de calificaciones correspondientes a una sección del


curso de estadística de la EESTP-PNP-Puente Piedra; Calcular la Desviación Media.

Intervalo fi Xi fi*Xi |𝑿𝒊 − 𝑿̅| |𝑿𝒊 − 𝑿̅ |𝒇𝒊


0 - 5 1 2.5 2.5 8.7 8.7
5 - 8 8 6.5 52.0 4.7 37.6
8 - 10 10 9.0 90.0 2.2 22.0
10 - 12 20 11.0 220.0 0.2 4.0
12 - 15 15 13.5 202.5 2.3 34.5
15 - 20 6 17.5 105.0 6.3 37.8
60 672.0 144.6

Cálculo de la Media:
672
𝑋̅ = = 11.2
60

Cálculo de la Desviación Media:

∑𝒌 ̅
𝒊=𝟏|𝑿𝒊 −𝑿|𝒇𝒊
𝑫𝑴 =
𝑵

76
𝟏𝟒𝟒.𝟔
𝑫𝑴 = = 𝟐. 𝟒𝟏
𝟔𝟎

EJERCICIOS PROPUESTOS

Ejercicio 01

Se tiene los años de servicio en la PNP de los servidores administrativos; 2, 2, 4, 4,4, 5, 6, 7, 8, 8.


Calcular la desviación media de estos valores.

X x−x x−x
2

CÁLCULO DE LA MEDIA ARITMÉTICA

x=
CÁLCULO DE LA DESVIACIÓN MEDIA

DM =

Ejercicio 02

Hallar la desviación media de la siguiente tabla referida a las edades de los miembros de la PNP
en el departamento de ICA

Clase fi

16-20 2

77
20-24 8

24-28 8

28-32 18

32-36 20

36-40 18

40-44 15

44-48 8

48-52 3

Completar la siguiente tabla

Clase fi xm fi  xm x−x fi  x − x

16 - 20 2

20 - 24 8

24 - 28 8

28 - 32 18

32 - 36 20

36 - 40 18

40 - 44 15

44 - 48 8

48 - 52 3

CÁLCULO DE LA MEDIA ARITMÉTICA

x=

78
CÁLCULO DE LA DEVIACIÓN MEDIA

DM =

Ejercicio 03

Según cuadro; a los trabajadores de la PNP de la Ciudad de Satipo, le asignaron viáticos por
trabajo de campo en los pueblos cercanos, en el mes de julio del 2011.

[𝑳𝒊 𝑳𝒔〉 Xi fi Xi.fi


x−x fi  x−x

420 - 440 10

440 - 460 8

460 - 480 11

480 - 500 10

500 - 520 16

520 - 540 39

540 - 560 40

560 - 580 23

580 - 600 13

600 - 620 9

620 - 640 1

TOTAL

Calcular:

Media=

DESVIACION MEDIA =

Ejercicio 04

Los resultados siguientes representan las calificaciones del examen final del curso de
análisis estadístico en la PNP.

23 60 79 32 57 74 52 70 82 36

80 77 81 95 41 65 92 85 55 76

52 10 64 75 78 25 80 95 81 67

79
41 71 83 54 64 72 88 62 74 43

60 78 89 76 84 48 84 90 15 79

34 67 17 82 69 74 63 80 85 61

HALLAR:

a) TABLA DE DISTRIBUCIÓN DE FRECUENCIA

b) DESVIACIÓN MEDIA

80
SESIÓN 10
DESVIACIÓN ESTÁNDAR, VARIANZA COEFICIENTE DE VARIACIÓN

d. DESVIACIÓN ESTÁNDAR

Es una medida de dispersión para variables con razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

En otras palabras, es una medida del grado de dispersión de los datos respecto al valor
promedio. La Desviación Estándar es simplemente el “promedio” o variación esperada con
respecto a la media aritmética. Para el cálculo de la desviación estándar se utilizará la siguiente
fórmula:

Características:

− Es el parámetro de dispersión más utilizado.


− Es afectada por el valor de cada observación.
− Como consecuencia de considerar desviaciones cuadráticas pone mayor énfasis en las
desviaciones extremas que en las demás desviaciones.
− Al construir la tabla de frecuencia de una variable discreta y calcular a partir de ella la
desviación estándar, no hay pérdida de información por lo que la desviación para los datos
observados es igual que para los datos tabulados.

Utilidad:

Su utilidad radica en la transmisión de cuánto tienden a alejarse los valores concretos del
promedio en una distribución. De hecho, específicamente, el cuadrado de la desviación estándar
es “el promedio del cuadrado de la distancia de cada punto respecto del promedio”. Se suele
representar por una S o con la letra sigma.

Ejemplo:

Calcular la desviación estándar de las siguientes calificaciones de un estudiante de Estadística


en el último periodo académico:

Calificaciones: 18, 20, 20, 22, 20, 20

Calculamos la media aritmética (ẋ):

Número de valores: 6

Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6 ➔ 120 / 6 = 20

Calculamos la Desviación Estándar:

σ2 = *(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2] / 6

σ2 = 16 / 6 ➔ 2,67

81
Desviación estándar: σ = √ 2,67 ➔ 1,63

e. VARIANZA

La noción de varianza se suele emplear en el ámbito de la estadística. Se trata de una palabra


impulsada por el matemático y científico inglés Ronald Fisher (1890-1962) y sirve para
identificar a la media de las desviaciones cuadráticas de una Variable de carácter Aleatorio,
considerando el valor medio de ésta.

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de


una distribución estadística. Para el cálculo de la varianza se utilizarán las siguientes fórmulas:

Varianza poblacional:

1 𝑁 1 1 𝑁
𝜎2 = ∑ (𝑥 − 𝜇)2 = [∑𝑁
𝑖=1 𝑥𝑖
2 − 𝑁𝜇2 ] = ∑ 𝑥2 − 𝜇2
𝑁 𝑖=1 𝑖 𝑁 𝑁 𝑖=1 𝑖

Varianza muestral:

1 1 1 (∑𝑛
𝑖=1 𝑋𝑖 )
2
𝑆2 = ∑𝑛 (𝑥
𝑛−1 𝑖=1 𝑖
− 𝑥̅ )2 = [∑𝑛𝑖=1 𝑥𝑖2 − 𝑛(𝑥̅ )2 ] = [∑𝑛𝑖=1 𝑥𝑖2 − ]
𝑛−1 𝑛−1 𝑛

Característica:

− Es siempre un valor no negativo, que puede ser igual o distinta de 0.


− La varianza es la media de dispersión cuadrática óptima por ser la menor de todas.
− Si a todos los valores de la variable se le suma una constante la varianza no se modifica.
− Si todos los valores de la variable se multiplican por una constante la varianza queda
multiplicada por el cuadrado de dicha constante.

Utilidad:

− Se utiliza para identificar a la medida de las desviaciones cuadráticas de una variable de


carácter aleatorio, considerando el valor medio de esta.
− Esta medida es sensible a cada uno de los datos de la serie.
− La varianza revela aspectos en la dispersión que no refleja el rango.
− Cuanto mayor sea la varianza, más dispersos se encontrarán los datos con respecto a su
media aritmética y puede recurrirse a la mediana como dato representativo de la
distribución.

Ejemplo

Hallar la desviación media, la varianza y la desviación típica de las series de números


siguientes: 2, 3, 6, 8, 11.

Para la serie de números x1=2, x2=3, x3=6, x4=8, x5=11 con n=5=N tenemos los siguientes
cálculos.

82
Para la desviación media primero necesitamos calcular el valor de la media, luego la
desviación media, la varianza y por último la desviación estándar.

Media:

Desviación media:

Varianza:

Desviación estándar:

Datos no agrupados:

A la media aritmética de los cuadrados de las desviaciones se le llama varianza, se denota por
2
σ y se calcula: Varianza poblacional = Suma de los cuadrados de las desviaciones / Número de
datos
Para datos no agrupados utilizaremos la fórmula antes definida:

𝑛
1 (∑𝑛 𝑋𝑖 )2
2
𝑆 = [∑ 𝑥𝑖2 − 𝑖=1 ]
𝑛−1 𝑛
𝑖=1

Ejercicio 01

Asumamos que las utilidades netas (en millones de soles) correspondientes a 40 empresas
elegidas al azar fueron las siguientes:

3.5 4.6 8.8 3.4 -2.3 6.1 -4.6 2.6 3.8 12.6
2.1 4.1 3.2 -4.2 2.4 -6.8 5.0 -3.3 -2.2 2.4
3.7 1.8 3.6 -4.5 2.9 3.3 -0.4 4.2 -0.8 -2.5
3.1 9.1 2.6 4.3 -0.9 2.1 1.6 8.1 5.6 10.7

Determinando el Rango: R = X máx – X min

83
R = 12.6 – (-6.8) = 19.4 millones.

Para calcular la varianza muestral, primero obtendremos la suma de las observaciones y la suma
de los cuadrados de las observaciones.
40

∑ 𝑥𝑖 = 3.5 + 4.6 + 8.8 + ⋯ + (−4.2) = 98.8 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑠𝑜𝑙𝑒𝑠.


𝑖=1

40

∑ 𝑥𝑖 2 = (3.5)2 + (4.6)2 + (8.8)2 + ⋯ + (−4.2)2 = 944.66 (𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑠𝑜𝑙𝑒𝑠)2 .


𝑖=1

Aplicando la fórmula tendremos:


𝑛
2
1 2 (∑𝑛𝑖=1 𝑋𝑖 )2
𝑆 = [∑ 𝑥𝑖 − ]
𝑛−1 𝑛
𝑖=1
2
1 98.82
𝑆 = [944.66 − ] = 17.96
40 − 1 40

Datos agrupados:

La varianza de una serie de datos agrupados se calcula de la siguiente forma:


Varianza poblacional = Suma de los productos (f * (Pm - μ)2) / Número de datos

Es decir, σ2 = Ʃ f*(Pm ‒ μ)2 / n


Donde n es el número total de datos,

Σ es el símbolo de sumatoria,

f es la frecuencia de cada clase,

Pm es el punto medio de cada clase y

μ es la media aritmética de la serie de datos.

Cuanto mayor sea la varianza, más dispersos se encontrarán los datos con respecto a su
media aritmética.

Ejercicio 01

En la tabla aparecen los datos correspondientes a la cantidad de cuadernos vendidos por


Carlos durante 30 días; además, se han calculado las diferencias Pm ‒ μ, los cuadrados
(Pm ‒ μ)2 y los productos fC (Pm ‒ μ)2 como se muestra en las últimas tres columnas:

84
Cantidad de Número de Punto medio Pm ‒ μ (Pm ‒ μ)2 fC (Pm ‒ μ)2
cuadernos días (fc) (Pm)
vendidos
5 a 10 3 7.5 7.5 ‒ 17.5 = ‒10 (‒10) 2 = 100 3(100) = 300
10 a 15 7 12.5 ‒5 25 175
15 a 20 10 17.5 0 0 0
20 a 25 8 22.5 5 25 200
25 a 30 1 27.5 10 100 100
30 a 35 1 32.5 15 225 225
Total 30 1000

Media aritmética (μ) = 17.5

1000
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = = 33.33
30

EJERCICIO PROPUESTO

Ejercicio 01

Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una
comisaría, encontrando:

Policías 0 1 2 3 4 5 6 7 8
Frecuencias 5 19 29 30 22 16 14 9 6

a) Determinar la media, desviación estándar y varianza.

B. MEDIDAS DE DISPERSIÓN RELATIVAS

a. COEFICIENTE DE VARIACIÓN

La medida de dispersión relativa de mayor importancia es el Coeficiente de Variación, que se


expresa en porcentaje y se define como el cociente entre la desviación estándar y la media
aritmética de una distribución o de un conjunto de observaciones.

Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando


una mejor interpretación porcentual del grado de variabilidad que la desviación estándar.
𝜎
Coeficiente de Variabilidad poblacional: 𝐶𝑉 = (100%)
𝜇

𝑆
Coeficiente de Variabilidad muestral: 𝐶𝑉 = ̅ (100%)
𝑋

Características:

− Se calcula como cociente entre la desviación estándar y la media. Es un porcentaje que


permite comparar el nivel de dispersión de dos muestras.
− Puesto que tanto la desviación estándar como la media se miden en las unidades originales,
el coeficiente de variación es una medida independiente de las unidades de medición.

85
− El coeficiente de variación no se puede definir si la media es igual o próximo a cero.
− Si la media es un valor negativo, debe considerarse su valor absoluto para evaluar el
coeficiente de variación.
− El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas
distribuciones de probabilidad puede ser 1 o mayor que 1.
− Para su mejor interpretación se expresa como porcentaje.

Utilidad:

− El coeficiente de variación es muy usado para evaluar la precisión de un experimento,


comparando el coeficiente de variación del experimento en cuestión con los valores de este
en experiencias anteriores.
− Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades
de medida. Por ejemplo, kilogramo y centímetros.
− Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas
distintas.
− Comparar dos grupos de datos que tienen distinta media.
Para la evaluación del valor del coeficiente de variación, cuando se trabaja con datos económicos
se puede utilizar la siguiente escala:

CV Grado de variabilidad
0 ≤ 𝐶𝑉 < 10 Datos muy homogéneos
10 ≤ 𝐶𝑉 < 15 Datos regularmente homogéneos
15 ≤ 𝐶𝑉 < 20 Datos regularmente variables
20 ≤ 𝐶𝑉 < 25 Datos variables
𝐶𝑉 ≥ 25 Datos muy variables

Para comparar la variabilidad de dos o más conjuntos de observaciones, se debe tener en cuenta
lo siguiente:

✓ Si las unidades de medida de las observaciones de dos o más conjuntos de datos son las
mismas y sus promedios son iguales o semejantes, se debe utilizar la varianza o desviación
estándar.
✓ Si las unidades de medida de las observaciones de dos o más conjuntos de datos son
diferentes o si sus promedios son diferentes, se debe utilizar el coeficiente de variación.

Ejercicio 01

Una muestra de estudiantes de la EESTP-PNP, San Bartolo tiene una estatura media de 160 cm
con una desviación estándar de 16 cm. Estas mismas alumnas, tienen un peso medio de 70 kg
con una desviación estándar de 14 kg. ¿Cuál de las 2 variables presenta mayor variabilidad
relativa?

Estatura (E) Peso (P)

86
𝑋̅𝐸 = 160 𝑐𝑚. 𝑋̅𝑃 = 70 𝑘𝑔.

𝑠𝐸 = 16 𝑐𝑚. 𝑠𝑃 = 14 𝑘𝑔.

Cálculo del CVE Cálculo del CVP

𝑠𝐸 𝑠𝑃
𝐶𝑉𝐸 = ̅ 𝐶𝑉𝑃 = ̅
𝑋𝐸 𝑋𝑃

16 14
𝐶𝑉𝐸 = = 0.1 𝐶𝑉𝑃 = = 0.2
160
70
𝑪𝑽𝑬 = 𝟏𝟎%
𝑪𝑽𝑷 = 𝟐𝟎%

Podemos observar que CVP > CVE, por lo tanto, llegamos a la conclusión, que el peso de esta
muestra de estudiantes tiene mayor variabilidad relativa que la estatura

Ejercicio 02

En la siguiente tabla se muestran los pesos en kilos de un grupo de 100 estudiantes de la


EESTP-PNP, Puente Piedra. Se solicita calcular la Varianza y el Coeficiente de variabilidad.

Peso (kg.) fi
60 - 63 5
63 - 66 18
66 - 69 42
69 - 72 27
72 - 75 8
100
Paso 1: Completamos la tabla con la información requerida para calcular la varianza.

Peso ̅)𝟐 𝐟𝐢
fi Xi Xi*fi Xi2 *fi (𝐗 𝐢 − 𝐗
(kg.)
60 - 63 5 61.5 307.5 18911.25 208.0125
63 - 66 18 64.5 1161.0 74884.50 214.2450
66 - 69 42 67.5 2835.0 191362.50 8.5050
69 - 72 27 70.5 1903.5 134196.75 175.5675
72 - 75 8 73.5 588.0 43218.00 246.4200
100 6795.0 462573.00 852.7500

Cálculo de la media:
𝑛
1 6795
𝑋̅ = ∑ 𝑋𝑖 𝑓𝑖 = [ ] = 67.95
𝑛 100
𝑖=1

87
Paso 2: Utilizaremos la fórmula de la varianza para datos agrupados:

∑𝑛 2
1 1 1 𝑖=1 𝑥𝑖 𝑓𝑖
𝑠2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖 = [∑𝑛𝑖=1 𝑥𝑖 2 𝑓𝑖 − 𝑛𝑥̅ 2 ] = ∑𝑛𝑖=1 𝑥𝑖2 𝑓𝑖 − ( )
𝑛 𝑛 𝑛 𝑛

Reemplazando datos tendremos:

∑𝑛
2
1 𝑖=1 𝑥𝑖 𝑓𝑖
𝑠2 = ∑𝑛𝑖=1 𝑥2𝑖 𝑓𝑖 − ( )
𝑛 𝑛

2
1 6795
𝑠2 = (462573) − ( ) = 𝟖. 𝟓𝟐𝟕𝟓
100 100

Cálculo de la desviación estándar:

s = √8.5275 = 2.92

Cálculo del coeficiente de variación:

𝒔
𝑪𝑽 =
̅
𝒙
2.92
𝐶𝑉 = = 0.0430 = 𝟒. 𝟑%
67.95

Ejercicios propuestos

Ejercicio 01

Se efectúa un estudio para analizar los tiempos de espera en segundos, de los clientes de un
banco regional, para ello se registran dos situaciones: cuando hacen una fila única y cuando
hacen filas individuales ante las ventanillas de atención. Los resultados son los siguientes:

Fila única 390 396 402 408 426 438 444 462 462 462
Filas individuales 252 324 348 372 402 462 462 510 558 600

Compare ambos conjuntos de datos a través de su coeficiente de variación respectivo:

Ejercicio 02

Una encuesta realizada a una muestra de alumnos de la EESTP-Puente piedra para conocer el
número de horas que navegan semanalmente en internet, arrojó los datos de la tabla. Calcular
el coeficiente de variación.

Frecue
Horas ncia
fi
[ 0 - 10) 2
[10 - 20) 3
[20 - 30) 3
[30 - 40) 7
[40 - 50] 5

88
EJERCICIOS PROPUESTOS

Ejercicio 01

En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyasedades


y cantidades se especifican en el siguiente cuadro:

EDADES FRECUEN
CIA
[ 20; 25 > 2
[ 25; 30 > 5
[ 30; 35 > 2
[ 35; 40 ] 1

a) Hallar la varianza y la desviación estándar.

Ejercicio 02

En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan
anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos:

INTERVALOS FRECUENCIA
[ 20; 40 > 10
[ 40; 60 > 30
[ 60; 80 > 20
[ 80; 100 > 20
[ 100; 120 ] 20

Ejercicio 03

Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 estudiantes de la escuela


de Puente Piedra.

Cantidad de Libros Leídos


0 3 0 1 0 1 1
1 2 1 1 4 2 3
3 2 2 1 1 2 1

a) Calcular las medidas de dispersión.

Ejercicio 04

Los siguientes datos representan el peso de 4 brigadieres de la escuela de Puente Piedra


expresados en Kilogramos: 64; 70; 66 y 80.

89
a) Calcular la media, varianza, la desviación estándar y el coeficiente de variación.

Ejercicio 05

Calcular la varianza y la desviación estándar de la siguiente distribución de frecuencias:

Intervalo 0a 10 a 20 a 30 a 40 a 50 a 60 a
10 20 30 40 50 60 70
Frecuenci 8 34 76 60 31 28 13
a

Ejercicio 06

Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a
una comisaría, encontrando:

Policías 0 1 2 3 4 5 6 7 8
Frecuencia 5 19 29 30 22 16 14 9 6
s

a) Determinar la media, desviación estándar y varianza.

Ejercicio 07

La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de estudiantes:

Estatura 60 a 63 a 66 a 69 a 72 a
62 65 68 71 74
Frecuencia 5 18 42 27 8

a) Determine el rango, la media de las desviaciones absolutas, la desviación


estándar, varianza y el coeficiente de variación.

Ejercicio 08

Dada la siguiente tabla de frecuencias, para datos sin agrupar:

Valor 0 1 2 3 4 5 6 7
Frecuencia 8 14 25 13 20 12 6 2

a) Calcule su varianza, la desviación estándar, el rango, la media de las desviaciones


absolutas.

90
SOLUCION DE MEDIDAS DE DISPERSION

GUÍA DE RESPUESTAS
1.-En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y
cantidades se especifican en el siguiente cuadro:
SOLUCION
SOLUCION DE MEDIDAS
DE MEDIDAS DE DE DISPERSION
DISPERSION
Ejercicio
Hallar la N° 01: y la desviación típica.
varianza

1.-En
1.-En una una redada
redada en el en el distrito
distrito de Chorrillos
de Chorrillos se se logrócapturar
logró capturar avezados
avezados delincuentes
delincuentescuyas edades
cuyas y
edades y
cantidades
cantidades se especifican
se especifican en elen el siguiente
siguiente cuadro:
cuadro:
Frecuencia Marca de Frecuencia _ _ _
Edades fi*Xi Xi − X (X − X )2 ( X i − X )2 * fi
Hallar laHallar la varianza
varianza fi típica.
y la desviación
y la desviación clase
típica. Xi Acumulada i

[20 - 25> 2 22.5 45.00 2 -6 36 72


[25 - 30> 5 27.5 137.50 7 -1 1 5
FrecuenciaMarca
Marca de Frecuencia
35> EdadesFrecuencia 32.5 de 65.00 Frecuencia
_ _ _ _ _ _
[30 - Edades 2 fi*Xi
fi*Xi 9 X iX−i X−4 X ( X i ( −X X ) 216( X2 − X
i − X ) i (X) 2i*−f i X 32
)2 * fi
fi fi clase
clase Xi Xi Acumulada
Acumulada
[35[20
- 40] [20 - 25>
- 25> 1 2 DE
SOLUCION 37.5
2 MEDIDAS DE DISPERSION37.50
22.5
22.5 45.00
45.00 210
2 -6 -6 9 36 36 81 72 7281
[25 - 30>
[25 - 30> 105 5 27.5
27.5 285.00
137.50
137.50 77 -1 -1 1 1 5 5190
[30 - 35>
[30 - 35> 2 2 32.5
32.5 65.00
65.00 99 4 4 16 16 32 32
1.-En[35
una redada en el distrito
- 40] 1 de Chorrillos
37.5 se logró 37.50
capturar avezados
10 delincuentes
9 9 cuyas81
edades y 81
[35 - 40] 1 37.5 37.50 10 81 81
Media =
cantidades 28.5
se especifican en el siguiente cuadro:
10 10 285.00
285.00 190 190
Hallar la varianza y la desviación típica.
MediaMedia
= = 28.5
28.5
Varianza = Frecuencia
19
Marca de Frecuencia _ _ _
Edades fi*Xi Xi − X (X − X )2 ( X i − X )2 * fi
Varianza fi clase Xi Acumulada i
Varianza = [20= - 25> 2 1919
Desviación típica =
[25 - 30> 5
4.36 22.5
27.5
45.00
137.50
2
7
-6
-1
36
1
72
5
Desviación
Desviación típicatípica
=
[30 - 35>
= 2
4.36
4.36 32.5 65.00 9 4 16 32
[35 - 40] 1 37.5 37.50 10 9 81 81
10 285.00 190
2.- En un estudio
En un estadístico se analizó la cantidad dede balas
balasque
que los efectivos policiales utilizan anualmente
en el enen el
Ejercicio N° 02:
campo.
campo.
2.-estudio
2.- En un
Halla
campo.
Halla
estudio
laslas
medidas
Halla
estadístico
estadístico
de
las medidas
medidas de
Media de
se analizó
se analizó
dispersión,
= dispersión,
dispersión,
la cantidad
la cantidad
según
según los
según
de balas
siguientes
loslos
que
28.5 datos
siguientes
siguientes
los efectivos
los efectivos
enelel
datos en
datos en
policiales
elcuadro
policiales
cuadro
cuadro dado.
dado.
dado.
utilizan anualmente
utilizan anualmente el

Varianza = 19
Marca
Frecuencia Marca dede Frecuencia _ _ _
Frecuencia Frecuencia X − X _ ( X − X ) 2 (_X2 − X ) 2 * f _| 2X − X | * f _
INTERVALOS
Marca de Xi fif*X
i*Xi
_
INTERVALOS Frecuenciafi clase i Frecuencia iX i − X_ i ( X i − X ) _i 2 ( X i − i X ) *_ 2f i | X
Acumulada
i
i
i
− X | *
_
fi
Xi − X
f
INTERVALOS Desviación típica =clase Xi
i 4.36
fi*Xi Acumulada
(X i − X ) ( X i − X ) * fi | X i − X | * fi
[ 20; fi clase3030
Xi Acumulada
[ 20; 40 > 40 > 10 10 300
300 -42-42 10
10 17641764 1764017640 420 420
[ 40; 60 > 30 50 1500 40 -22 484 14520 660
[ [ 40;
20; 40
2.- 60
En > estudio 10
>un 30
estadístico 50 la cantidad
30
se analizó 1500
300 40 -22
10efectivos policiales
de balas que los 484
-42 utilizan anualmente
1764 14520
en 17640
el 660
420
campo.[ 60; 80 >las medidas
Halla 20de dispersión,70 según los1400 60 en el cuadro
siguientes datos -2 dado. 4 80 40
[ 60;
[ 40; 6080 >
[>80; 100 > 30
20
20
70
50 90
1400
1500
1800
60
40
80
-2
18 -22
4
324 484
80
6480 14520360
40
660
[ 80; 100 > 20 90 1800 80 18 324 6480 360
[ 60; 80 [>100; 120 ] 20
[ 100; 120 ] 20
20 70
110
110 1400
2200
2200
60
100
100
38 -2
38
1444
1444
4 28880
28880
80 760
760
40
[ 80; 100 > 20 100Frecuencia90 7200
1800
Marca de 80Frecuencia 18 324 _6760067600 6480 2240 360
100 7200 _ _
2240_
INTERVALOS
fi
fi*Xi Xi − X ( X i − X ) 2 ( X i − X )2 * fi | X i − X | * fi
clase Xi Acumulada
[ 100; 120 ] 20 110 2200 100 38 1444 28880 760
[ 20; 40 > 10 30 300 10 -42 1764 17640 420
Media = [ 40; 100
Media = 60 > 30 72
72 50
7200 1500 40 -22 484 67600
14520 6602240
[ 60; 80 > 20 70 1400 60 -2 4 80 40
Varianza = 676
Varianza = [ 80; 100 > 20
676 90 1800 80 18 324 6480 360
[ 100; 120 ] 20 110 2200 100 38 1444 28880 760
Media =Desviación típica = 100 72
26.00 7200 67600 2240
Desviación típica = 26.00

Media
Varianza = lasde las desviaciones medias = 22.40
Media de desviaciones
Media = medias 676
= 72 22.40

3.- Se reporta la cantidad de =


Varianza libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
3.- Se reporta la cantidad
Desviación de =libros
típica leídos en un mes, por676un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP.
0 3 0 1 0 1 26.00
0 3 0 1 0 1
1 1 2 1 1
1 Desviación
1 2 1 típica
1 = 26.00
4 2 3 3 2
Media de las 4 desviaciones
2 3 3 2 medias = 22.40
Ejercicio N° 03: 1
2 1de 1las desviaciones
2 Media 1 2
2 1
1 medias = 22.40

Calcula las medidas de dispersión.


3.- Calcula
Se reporta la3.-
cantidad
las medidas delalibros
de dispersión.
Se reporta leídos
cantidad en un
de libros mes,
leídos enpor un grupo
un mes, por un de 21 de
grupo alumnos de la
21 alumnos deEscuela
la EscueladedeSuboficiales
Suboficiales de delala PNP.
PNP.
0 3 0 101 310 021 11 01 1
Frecuencia
#1de Libros
1 Frecuencia
2 14 21 3 3 2Xi
Frecuencia _ _ _ _

f
fi*Xi Frecuencia X i − X _ ( X i − X ) 2 (_X i − X ) 2 * f i _| 2X − X | * f i i _
Acumulada Xi − X
4 2 3 f3i2 1i2 1 2 Xi 1
# de Libros fi*Xi
Acumulada ( X i − X ) 2 ( X i − X ) * fi | X − X | * i fi

0 3 0 0 3 -1.52 2.3220 6.9660 4.57


Calcula2 1 1
0 las medidas de 2 1
3 dispersión. 0 0 3 -1.52 2.3220 6.9660 4.57
1 9 1 9 12 -0.52 0.2744 2.4694 4.71
1 9 1 9 12 -0.52 0.2744 2.4694 4.71
2 5 2 10 17 0.48 0.2268 1.1338 2.38
Calcula las medidas de
2 dispersión.
3
5 2
3 Frecuencia 3
10
9
17
20 Frecuencia
0.48
1.48
0.2268
_ 2.1791 _
6.5374
1.1338_
4.43
2.38_

3 # de Libros
3 fi 3 Xi 9 fi*Xi 20
Acumulada Xi − X
1.48 2.1791 i − X ) * fi
( X i − X ) 2 ( X6.5374 2 | X i − X
4.43
| * fi
4 1 4 4 21 2.48 6.1315 6.1315 2.48
4 0 1 3 4 0 4 0 21 3 2.48-1.52 6.1315
2.3220 6.1315
6.9660 2.48
4.57
21 32 23.2381 18.57
1 21
Frecuencia 9 1 32 9 Frecuencia12 -0.52
_ 0.2744_ 2.4694
23.2381 _ 4.71
18.57 _
# de Libros 2
fi 5 Xi 2 fi*Xi 10
Acumulada
17 X i − 0.48
X (X i − X )2
0.2268 i − X ) * fi
( X1.1338 2 X i − X | * fi
| 2.38
3 3 3 9 20 1.48 2.1791 6.5374 4.43
0 Media
Media =
= 3
4 1 0 1.52
1.52 4 0 4 3 21 -1.52
2.48 2.3220
6.1315 6.9660
6.1315 2.484.57
21 32 23.2381 18.57
1 Varianza = 9 1 1.1066 9 12 -0.52 0.2744 2.4694 4.71
Varianza
2 = 5 21.1066 10 17 0.48 0.2268 1.1338 2.38
3 Desviación
Desviación
típica
Media
típica 3
=
= = 3 1.05
1.05
1.52
9 20 1.48 2.1791 6.5374 4.43
4 Media de las 1desviaciones
Varianza = 4
medias = 40.88435
1.1066 21 2.48 6.1315 6.1315 2.48
Media de las desviaciones
21 medias = 0.88435
32 23.2381 18.57
4.- Los siguientes datos representan el peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80.
4.- Los siguientes Desviación típica
datos representan =
eltípica.
peso 1.05 de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80.
de 4 capitanes
Calcular la varianza y la desviación
Calcular la varianza y la desviación típica.
Ejercicio N° 04: Media de las desviaciones medias =
Frecuencia Peso
0.88435
Frecuencia _ _ _
4.- Los siguientes datos representan el peso de 4 capitanes de la escuela deXoficiales expresados2en(_Kilogramos:
X i − X ) 2 * f i _64; 70; 66 y 80.
Media = CapitanFrecuencia 1.52 i − X _ (X i − X )
fi Peso fi*Xi Frecuencia
Calcular la varianza y la desviación
Capitan X
típica. i Acumulada fi*Xi 2
Xi − X 2
(X − X ) ( X i − X ) * fi
fi Xi Acumulada i
A 1 64 64 1 -6 36 36
A=
Varianza B 1 6470
1.1066
1 Frecuencia Peso 64
70 21Frecuencia 0 -6X − X 0 ( X36− X ) 2 ( X − X ) * f
_ _
0 36_ 2
Capitan
fi 70
fi*Xi
B 1 Xi 70 2Acumulada 0 i i i i
C 1 66 66 3 -4 16 0 16 0
C A 1 1 6680 64 66 64 1 -6 36 36
D 1 80 43 10 -4 100 16 100 16
Desviación
D
típica =B 1 1 80
1.05 70 80 70 4 2 10 0 1000 0
4 280 152 100
C 1 66 66 3 -4 16 16
4 280 152
D 1 80 80 4 10 100 100
Media de las desviaciones medias
4
= 0.88435280 152
4.- Los siguientes Media
datos =
representan 70
el peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80.
Media = 70
Calcular la varianza y la desviación típica.
Varianza =
Media = 38 70
Varianza = 38
Varianza
Desviación típica= =
Frecuencia Peso 6.16 38 Frecuencia _ _ _
Capitan
Desviación típica =
fi
6.16 fi*Xi Xi − X (X − X )2 ( X i − X )2 * fi
Desviación típica = Xi 6.16 Acumulada i

A la varianza y la
5.- Calcular 1 desviación típica
64 de la siguiente
64distribución de
1 frecuencias: -6 36 36
5.- Calcular la varianza
B y la desviación
1 típica70de la siguiente70distribución de
2 frecuencias: 0 0 0
5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:
C 1 66 66 3 -4 16 16
Frecuencia Marca de Frecuencia _ _ _

D INTERVALOS 1 80
Marca fi*Xi
de80
X i − X10_ ( X_ i − X )100
4Frecuencia
2
(_X i_ − X ) 2 * f i 100
Frecuencia clasedeMarca
fi Frecuencia Xi Frecuencia
Acumulada __
INTERVALOSINTERVALOS f *X fi*Xi X i −XX
i − X
( X (i X−i X− X) 2) 2 ( X(Xi i−−X
2
X)) 2** ffi
[ 0; 10 >
fi
4 8 clase
fi X clase Xii i
5 i 280
40 Acumulada8 Acumulada
-28.32 802.02 6416.18 152
10; 20[ >
[ 0; 10[ > 0; 10 >8 34 8 5 15 5 40
510 40 8
42 8 -28.32335.62
-28.32
-18.32 802.02
802.02 6416.18
6416.18
11411.16
[ 10; 20 > [ 10; 2034
[ 20; 30 >
>
76
34 15
25
15 510
1900
510 42
118
42 -18.32
-18.32
-8.32
335.62
335.62
69.22
11411.16
11411.16
5260.90 91
[ 20; 30 > 76 25 1900 118 -8.32 69.22 5260.90
[ 20; 30 > 40 >
[ 30; 76 60 2535 1900
2100 118
178 -8.32
1.68 2.8269.22 169.34 5260.90
Media =
[ 30; 40 >
[ 30; 40 >
60
60
3545
70 35
2100
2100
178
178
1.68
1.68 2.82
2.82
169.34
169.34
[ 40; 50 > 31 1395 209 11.68 136.42 4229.09
[ 40; 50 > 31 45 1395 209 11.68 136.42 4229.09
[ 40; 50 > 60 >
[ 50; 31 28 4555 1395
1540 209
237 11.68
21.68 136.42 13160.63
470.02 4229.09
[ 50; 60 > 28 55 1540 237 21.68 470.02 13160.63
Varianza
[ 50; 60 => 70[ ]60; 7028
[ 60; ] 13 13 556538 65 1540
845 845 237
250 250 21.68
31.68 470.02
31.681003.62 13160.63
13047.09
1003.62 13047.09
[ 60; 70 ] 13 250 250 65 845
8330 8330 250 31.68 1003.6253694.40
13047.09
53694.40

Desviación típica = 250 6.16 8330 53694.40


D 1 80 80 4 10 100 100
4 Marca de 280 152
Frecuencia Frecuencia _ _ _
Media =
INTERVALOS
fi
70 fi*Xi Xi − X (X i − X ) 2
( X i − X )2 * fi
clase Xi Acumulada
Varianza 10= > =
[ 0;Media 8 5 3870 40 8 -28.32 802.02 6416.18
[ 10; 20 > 34 15 510 42 -18.32 335.62 11411.16
Varianza = =
Desviación 38
[ 20; 30 típica
> 76 256.16 1900 118 -8.32 69.22 5260.90
[ 30; 40 >
Desviación típica60
= 35 6.16 2100 178 1.68 2.82 169.34

Ejercicio N° 05: [ 40; 50 > 31 45 1395 209


5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:
11.68 136.42 4229.09
[ 50; 60 > 28 55 1540 237 21.68 470.02 13160.63
5.- Calcular la varianza
[ 60; 70 ] y la desviación
13 típica65
de la siguiente
845distribución250
de frecuencias:
31.68 1003.62 13047.09
250
Frecuencia Marca de 8330 Frecuencia _ _ 53694.40 _ 2
INTERVALOS
fi
fi*Xi Xi − X (X − X) 2
( X i − X ) * fi
Frecuenciaclase Xide Acumulada i
Marca Frecuencia _ _ _
INTERVALOS
fi
fi*Xi Xi − X ( X i − X ) 2 ( X i − X )2 * fi
[ 0; 10 > 8 clase
5 Xi 40 Acumulada
8 -28.32 802.02 6416.18
[ 10; Media =>
20[ >0; 10 34 8 15 533.32 510
40 842 -18.32
-28.32 335.62 6416.18
802.02 11411.16
[ 20; 30[ >10; 20 > 76 34 25 15 510
1900 42
118 -18.32
-8.32 335.6269.22 11411.16
5260.90
40[ >20; 30=>
[ 30; Varianza 60 76 25
35 214.78 1900
2100 118
178 -8.32
1.68 69.22 2.82 5260.90169.34

[ 40; 50[ >30; 40 > 31 60 45 35 2100


1395 178
209 1.68
11.68 2.82136.42 169.344229.09
[ 40; 50 > 31 45 1395 209 11.68 136.42 4229.09
[ 50; Desviación
60 > 28=
típica 55 14.66 1540 237 21.68 470.02 13160.63
[ 50; 60 > 28 55 1540 237 21.68 470.02 13160.63
[ 60; 70 ] 13 65 845 250 31.68 1003.62 13047.09
[ 60; 70 ] 13 65 845 250 31.68 1003.62 13047.09
250 8330 53694.40
250 8330 53694.40

6.- Durante
Mediaun =Media
periodo
= de 150 horas, se observó
33.32el número de policías por horas que acuden a una comisaria, encontrando:
33.32
Determine la varianza, la desviación típica y la media de las desviaciones medias.
Varianza =
Varianza = 214.78
214.78

Desviación
Desviación típicatípica
= =
Frecuencia 14.66
14.66 Frecuencia _ _ _
Policias Xi fi*Xi Xi − X ( X i − X ) 2 ( X i − X )2 * fi
_

fi | X − X | * fi
Acumulada i

0 5 0 0 5 -3.53 12.48 62.42 17.67


1
6.- Durante un periodo 19horas, se observó
de 150 1 el número19 de policías por
24 horas que-2.53
acuden a una6.42 121.94
comisaria, encontrando: 48.13
Ejercicio N° 06:
6.- Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando:
Determine la varianza,
2 la desviación
29 típica y2la media de las
58desviaciones 53medias. -1.53 2.35 68.18 44.47
Determine la varianza, la desviación típica y la media de las desviaciones medias.
3 30 3 90 83 -0.53 0.28 8.53 16.00
4 22
Frecuencia 4 88 105
Frecuencia 0.47
_
0.22
_
4.79
_ 10.27
Policias Xi fi*Xi −X ( X i −2.15 ( X_ i − X ) * f i2 _

5 Frecuencia
16 fi Frecuencia X i 1.47 _ X )2 | _X − X | * fi
Xi 5 80 121
Acumulada 34.42 23.47
i
Policias f *X Xi − X − X) ( X i − X ) * fi 2 _
2
fi i i (X | X − X | * fi
6 0 14 5 60 0
84 Acumulada
5
135 -3.53
2.47 12.48
6.08
i
62.42
85.18 17.67
34.53
i

0 1 5 19 0 1 019 245 -3.53


-2.53 6.42 12.48 121.94 62.4248.13 17.67
7 9 7 63 144 3.47 12.02 108.16 31.20
1 2 19 29 1 2 19
58 24
53 -2.53
-1.53 2.35 6.42 68.18 121.9444.47 48.13
8 6 8 48 150 4.47 19.95 119.71 26.80
2 3 29 30 2 3 90
58 83
53 -0.53
-1.53 0.28 2.35 8.53 68.1816.00 44.47
3 4 30
15022 3 4
530
88
90 105
83
4.20
0.47
-0.53 0.22 0.28 613.33
4.79 252.53
8.53 10.27 16.00
4 5 22 16 4 5 80
88 121
105 1.47
0.47 2.15 0.22 34.42 4.79 23.47 10.27
6 14 6 84 135 2.47 6.08 85.18 34.53
5 16 5 80 121 1.47 2.15 34.42 23.47
Media
6 =7 14
9
6
7 3.53
84
63 144
135
3.47
2.47
12.02
6.08
108.16
85.18
31.20
34.53
8 6 8 48 150 4.47 19.95 119.71 26.80
7 9 7 63 144 3.47 12.02 108.16 31.20
150 530 4.20 613.33 252.53
Varianza
8 = 6 8 4.09 48 150 4.47 19.95 119.71 26.80
150 530 4.20 613.33 252.53
Desviación
Media = típica = 2.02
3.53

Media =Varianza
Media 3.53
de las= desviaciones medias =4.09 1.68356
Desviación
Varianza = típica = 2.02
4.09

Media
Desviación de las=desviaciones medias
típica =
2.02 1.68356

7.- La siguiente
Media de tabla
lasse refiere a las estaturas
desviaciones medias =en pulgadas, de un grupo de alumnos:
1.68356

EjercicioDetermine
N° 07:el rango, la media de las desviaciones absolutas, la varianza y la desviación típica.
7.- La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de alumnos:

Determine el rango, la media de las desviaciones absolutas, la varianza y la desviación típica.


7.- La siguiente tabla se refiereFrecuencia
a las estaturas ende
Marca pulgadas, de un grupo de alumnos:
Frecuencia _ _ _
Intervalos de _

Estatura fi
fi*Xi Xi − X ( X i − X ) 2 ( X i − X )2 * fi | X i − X | * fi
Determine el rango, la media deFrecuencia clase Xdei
Marcaabsolutas,
las desviaciones Acumulada
la varianza y la desviación
Frecuencia _ típica. _ _
Intervalos de _
fi*Xi Xi − X (X i − X )2 ( X i − X )2 * fi | X i − X | * fi
[ 60; 62 ]
Estatura 5 fi 61 Xi
clase 305 5
Acumulada -6.45 41.60 208.01 32.25
[ 63; 65 62
[ 60; ] ] 18 5 64
61 1152
305 23
5 -3.45
-6.45 11.90
41.60 214.25
208.01 62.10
32.25
[ 63;
[ 66;
Intervalos 68
de65
] ]Frecuencia
4218 Marca67
de
64 1152
2814 23
Frecuencia
65 -3.45
-0.45 _ 11.90
0.20 _ 214.25
8.51 _ 2 62.1018.90 _

Estatura[ 66; 68 ] fi 42 67 fi2814


*Xi 65 Xi −
-0.45 X 0.20 (Xi − X ) *
( X i − X ) 28.51 fi | X i
18.90
− X | * fi
[ 69; 71 ] 27 clase 70Xi 1890 Acumulada
92 2.55 6.50 175.57 68.85
[ 69; 71 ] 27 70 1890 92 2.55 6.50 175.57 68.85
[ 60; [62 ] 74 ]
72; 5 8 6173 305
584 5
100 -6.45
5.55 41.60
30.80 208.01 44.40 32.25
246.42
[ 72; 74 ] 8 73 584 100 5.55 30.80 246.42 44.40
[ 63; 65 ] 18 64 1152 23 -3.45 11.90 214.25 62.10
100
100 6745
6745 852.75
852.75 226.50
226.50
[ 66; 68 ] 42 67 2814 65 -0.45 0.20 8.51 18.90
[ 69; 71Rango
] = 27 70 14 1890 92 2.55 6.50 175.57 68.85
Rango = 14
[ 72; 74 ] 8 73 584 100 5.55 30.80 246.42 44.40
Media = 100 67.45 6745 852.75 226.50
Media = 67.45
Rango =Varianza = 8.53
14
Varianza = 8.53
Media =Desviación típica = 2.92
67.45
Desviación típica = 2.92
Media de las desviaciones absolutas = 2.27
Varianza = 8.53
Media de las desviaciones absolutas = 2.27
Desviación típica = 2.92

8.- Dada
Media de las la siguienteabsolutas
desviaciones tabla de frecuencias,
= para
2.27datos sin agrupar:
Calcule su varianza, la desviación típica, el rango, la media de las desviaciones absolutas.

8.- Dada la siguiente tabla de frecuencias, para datos sin agrupar:


Calcule su varianza, la desviación típica, el rango, la media de las desviaciones absolutas.
Frecuencia Frecuencia _ _ _ _
Valor
8.- Dada la siguiente tabla de frecuencias,
fi paraXdatos
i fi*Xi
sin agrupar: Acumulada Xi − X ( X i − X ) 2 ( X i − X )2 * fi | X i − X | * fi

Calcule su varianza,0 la desviación típica,


8 el rango,
0 la media de
0 las desviaciones
8 absolutas.
-2.93 8.58 68.68 23.44
92
1 14 1 14 22 -1.93 3.72 52.15 27.02
Frecuencia Frecuencia _ _ _ _

i − X
Xi2 fi*X X i − X )2 * fi | X i − X | * fi
i − X )
2 25 50 47 -0.93
Valor
fi i
Acumulada X ( X0.86 2
(21.62 23.25
3 13 3 39 60 0.07 0.00 0.06 0.91
Frecuencia Frecuencia _ _ _ _
Valor0 4
fi
820 Xi 04 fi*X
0i
80 8
80
Acumulada Xi −
-2.93
1.07 X ( 8.58 ( X i − X )2 *
68.68
X i − X ) 222.90
1.14 f i 23.44
21.40 | X i − X | * fi

1 5 1412 15 60
14 92
22 2.07
-1.93 4.28
3.72 51.42
52.15 24.84 27.02
0 8 0 0 8 -2.93 8.58 68.68 23.44
Media = 67.45

Varianza = 8.53

Desviación típica = 2.92

Media de las desviaciones absolutas = 2.27

Ejercicio
8.- DadaN° 08: tabla de frecuencias, para datos sin agrupar:
la siguiente
Calcule su varianza, la desviación típica, el rango, la media de las desviaciones absolutas.

Frecuencia Frecuencia _ _ _ _
Valor
fi
Xi fi*Xi
Acumulada Xi − X (X i − X )2 ( X i − X )2 * fi | X i − X | * fi

0 8 0 0 8 -2.93 8.58 68.68 23.44


1 14 1 14 22 -1.93 3.72 52.15 27.02
2 25 2 50 47 -0.93 0.86 21.62 23.25
3 13 3 39 60 0.07 0.00 0.06 0.91
4 20 4 80 80 1.07 1.14 22.90 21.40
5 12 5 60 92 2.07 4.28 51.42 24.84
6 6 6 36 98 3.07 9.42 56.55 18.42
7 2 7 14 100 4.07 16.56 33.13 8.14
100 293 306.51 147.42

Rango = 7

Media = 2.93

Varianza = 3.07

Desviación típica = 1.75

Media de las desviaciones absolutas = 1.47

93
SESIÓN 11
PRACTICAS DIRIGIDAS – REPASO

SESIÓN 12
SEGUNDA EVALUACIÓN PARCIAL

94
SESIÓN 13

• SUSTENTACION DE TRABAJOS COLABORATIVOS

SESIÓN 14

UNIDAD IV
PROBABILIDAD Y ANALISIS COMBINATORIO

INTRODUCCIÒN

La teoría de probabilidad es un modelo matemático no determinístico que analiza


fundamentalmente fenómenos que no se ciñen a una regla uniforme. El estudio de
probabilidades nos permite hacer observaciones de situaciones de las cuales no
estamos absolutamente seguros de lo que va a suceder, pero expresan ciertas
características de predicción.

EXPERIMENTO ALEATORIO (ε)

Se denomina experimento aleatorio a toda prueba o ensayo cuyos resultados no


sonpredecibles sin haberse realizado previamente la prueba.

Ejemplo:

✓ Arrojar un dado una vez


✓ Lanzar una moneda dos veces
✓ Tomar dos naipes de un mazo de 52 naipes

ESPACIO MUESTRAL ( ).

Es el conjunto de elementos de todos los resultados posibles de un experimento

aleatorio. Ejemplos:

1. ¿Cuál será el espacio muestral de un experimento de lanzar un dado?

1= {1;2;3;4;5;6} entonces 𝑛() = 6

2. ¿Cuál será el espacio muestral de un experimento de lanzar una moneda dos veces?

2 = {(c,c); (c,s); (s,c); (s,s)}

EVENTOS O SUCESOS:

95
Es un hecho que puede ocurrir o no si consideramos al espacio muestral como un
conjunto, el suceso sería un subconjunto de espacio muestral. Se denota generalmente
por las letras mayúsculas del alfabeto ( A,B,C,……)

Ejemplo

Al lanzar un dado, cuyo resultado obtenido sea mayor que 3.

 = 1;2;3;4;5;6 entonces 𝑛( ) =6A = 4;5;6 entonces 𝑛( A) = 3

Observación

Podemos expresar las posibilidades de que ocurra un suceso usando un número comprendido
entre 0 y 1. En esta escala, el 0 representa un suceso imposible y 1 representa un suceso que
ocurrirá, con certeza. Podemos escribir P(A) para representar la probabilidad de que ocurra un
suceso A.

0≤ 𝑃(𝐴) ≤ 1

LA PROBABILIDAD DE UN SUCESO

según Laplace es la razón entre el número de casos favorables y el número total de casos
posibles.

𝑃(𝐴) = n(A)
n(𝑈)
Donde (𝐴):número de casos favorables

(𝑈): número total de casos posiblesPropiedad : 0≤ 𝑃(𝐴) ≤ 1

𝑃(𝐴𝑐) = 1 − 𝑃(𝐴)

Observación

Si la probabilidad de un suceso es 𝑃, 𝑒𝑛 "𝑛" experimentos se espera que el suceso ocurra

𝑛𝑥𝑃 veces

Ejemplo 1:

Se arroja un dado equilibrado con 20 caras numeradas del 1 al 20. El suceso A se define como
“el número obtenido es un múltiplo de 4”.

96
a. Determine P(A). El dado se arroja 100 veces.
b. ¿Cuántas veces espera obtener un múltiplo de 4?
Solución

a) (𝐴) = 5 𝑦 𝑛(𝑈) = 20

𝑃(𝐴) = n(A) = 5 = 1
𝑛(𝑈) 20 4
b) 1 𝑥100 = 25
4
4

Ejemplo 2.

Encontrar la probabilidad que al lanzar un dado se obtiene un valor par.

Solución

= 𝑛(𝑈) == 1;2;3;4;5;6

𝑛(A) = 3

𝑛 (𝑈) = 6

P(A) = 3 = 1 = 50%
6 2

Ejemplo propuesto.

Se lanza una moneda 3 veces. Calcular la probabilidad que ocurran

a) Dos caras
b) Al menos dos caras
c) A lo más dos caras

97
TEOREMA DE PROBABILIDAD

OPERACIONES CON SUCESOS

INTERSECCIÓN DE SUCESOS

P(A B) = P(A) + P(B) − P(A B)

Ejemplo:

De los 100 estudiantes, 30 juegan básquetbol. De ellos, 16 practican ambos; futbol y


básquetbol. 48 estudiantes no practican futbol ni básquetbol.

A=BasquetbolB= Futbol

a) Mostrar toda esta información en el diagrama de VennSolución

100

14 16 22

48

a) Halle la probabilidad de que un estudiante elegido al azar practique futbol y


básquetbol.
16 4
𝑃(𝐴 ∩ 𝐵) = =
100 25

b) Halle la probabilidad de que un estudiante elegido al azar no practique básquetbol,


pero si futbol.

22 11
𝑃(𝐵 ∩ 𝐴𝑐 ) = =
100 50

c) Halle la probabilidad de que un estudiante elegido al azar no practica ni futbol ni


básquetbol.
48 12
𝑃(𝐴𝑐 ∩ 𝐵𝑐 ) = =
100 25

98
UNIÓN DE SUCESOS

P(A B) = P(A) + P(B) − P(A B)

Ejemplo

De los 100 estudiantes, 30 juegan bádminton. De ellos, 16 practican ambos: tiro con arco y
bádminton.

A = tiro con arco = 38 B= juegan bádminton =30

a) ¿Cuál es la probabilidad de que un estudiante elegido al azar practique bádminton o tiro con
arco?

Solución

P(A𝖴B)= ?

P(A B) = P(A) + P(B) − P(A B)

n(A𝖴B) = 38 +30 -16 =52

𝑛(𝐴 ∪ 𝐵) 52 13
𝑃(𝐴 ∪ 𝐵) = = =
𝑛(𝑈) 100 25

a) ¿Cuántos estudiantes practican tiro con arco o no practican bádminton?


Solución

n(A∪𝐵𝑐 ) = 22+16+48 =86

n(A ∪ 𝐵𝑐 ) 86 43
𝑃(𝐴 ∩ 𝐵𝑐 ) = = =
𝑛(𝑈) 100 50

99
TEOREMA DE LA MULTIPLICACION

Sean A y B dos sucesos incluidos en el espacio muestral , entonces:

- Si A y B son sucesos no independientes

P(A  B) = P(A) x P(B/A)

Ejemplo

1. Una urna contiene 6 bolitas azules y 4 blancas. Se extraen dos bolitas sucesivamente y sin
reposición. Calcular la probabilidad que la primera sea blanca y la segunda azul.

Solución

P(b a) = P(b) x P(a/b)

4 6 4
= x =
10 9 15

- Si A y B son independientes P(A  B) = P(A) x P(B)

PRINCIPIOS DE CONTEO

PRIMER PRINCIPIO DE CONTEO


Si un evento A ocurre de m maneras y un evento B ocurre de n maneras; el evento A o
B ocurrirá de m + n maneras, siempre que los eventos sean mutuamente excluyentes.
Analogía Matemática: si un conjunto A tiene m elementos y un conjunto B tiene n
elementos entonces el conjunto a A U B tendrá m +n elementos, sí A  B = .

A B
#(A) = m
 #(A  B) = m + n, si A  B = 
#(B) = n

Generalización: Si los eventos Ai ocurren de ni maneras, i = 1, 2, ……k, , respectivamente,


entonces el evento ⋃𝑘𝑖=1 𝐴𝑖 ocurrirá de n1 + n2 + ……..+ nk maneras, siempre que estos
eventos sean mutuamente excluyentes.
100
Ejemplo 10:
Sea  = { 1, 2,3, 4, 5, 6} un Espacio Muestral que resulta del experimento aleatorio de
lanzar un dado sobre una mesa. Y sean los eventos A = { 1, 3 } y B = { 2, 4, 6 }.
El evento A ocurre de dos maneras (ocurre cuando sale 1 ó 3 ) y el evento B ocurre de
tres maneras (ocurre cuando sale 2, 4 ó 6); entonces, como los eventos son mutuamente
excluyentes, el evento A ó B ocurrirá de 2 + 3 = 5 maneras (ocurrirá si sale 1, 3, 2, 4 ó 6).
Analogía Matemática: El conjunto A tiene 2 elementos y el conjunto B tiene 3 elementos
 como A  B = , el conjunto A  B tendrá 2 + 3 = 5 elementos; en efecto, A  B =
{1,2,3,4,6} tiene 5 elementos.

SEGUNDO PRINCIPIO DE CONTEO


“Si una operación A puede efectuarse de m maneras y (cuando ha sido efectuada de
cualquiera de esas maneras) una segunda operación B puede efectuarse de n maneras;
entonces, las dos operaciones A y B (en ese orden) se efectuarán de m x n maneras”.
O también se puede considerar como una selección (o elección) de opciones (u
ocurrencias): “Si existen m opciones (u ocurrencias) posibles en la primera selección (o
elección) y n opciones (u ocurrencias) posibles en la segunda selección (o elección);
entonces habrá m x n resultados diferentes en la selección (o elección) sucesiva de las
dos opciones (u ocurrencias)”.
Analogía Matemática: Si un conjunto A tiene m elementos y un conjunto B tiene n
elementos, entonces el conjunto A x B (Producto Cartesiano) tendrá m x n elementos.

Ejemplo 11:
Existen 3 caminos (u opciones) diferentes para ir de la ciudad P a la ciudad Q y existen 4
caminos (u opciones) diferentes para ir de Q a R. ¿De cuantas rutas diferentes se dispone
para ir de P a R?

101
Observando la figura y por el segundo Principio de Conteo, disponemos de 3 x 4 = 12

rutas diferentes para ir de P a R.

La operación A puede efectuarse de 3 maneras (rutas para ir de P a Q, la operación B

puede efectuarse de 4 maneras (4 rutas para ir de Q a R), entonces las dos operaciones

A y B se efectuaran de 12 maneras (existen 12 rutas diferentes para ir de P a R).

Ejemplo 12
Un experimento Aleatorio consiste en lanzar un dado dos veces y que los eventos sean:
A = {En el primer lanzamiento resulte impar}
B = {En el segundo lanzamiento resulte par}
C = {Que en el primer lanzamiento resulte impar y en el segundo resulta par}
¿De cuantas maneras ocurrirá el evento C?
Solución:
A = {1, 3, 5}, B = {2, 4, 6}  El evento C ocurrirá de 3 x 3 = 9 maneras (segundo principio
de conteo).
Por la Analogía Matemática: A x B = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6), (5, 2), (5, 4),
(5, 6)}. Tiene 9 elementos. Son las nueve maneras de ocurrencia del evento C.

102
EJERCICIOS DESARROLLADOS

1. Determinar la probabilidad de que al lanzar un dado, el resultado sea un número primo.

Solución

 = 1,2,3,4,5,6

A = 2,3,5

→ P(A) = 3/6 = 1/2

2. ¿Cuál es la probabilidad que al lanzar dos dados, su suma sea un múltiplo de 3?

Solución:

Para que sea múltiplo de 3, la suma debe ser 3,6,9 o 12, siendo los casos favorables de 2,5,4 y 1
respectivamente, que en total hacen 2+5+4+1, igual a 12 casos favorables, con respecto a 36
casos en total.

Por lo tanto, la probabilidad será:

12 1
=
36 3

3. De un mazo de 52 cartas, al extraer una de ellas ¿Cuál es la probabilidad de que sea un


as?

Solución:

Para el caso de NAIPES:

Debemos saber que el mazo consta de 52 cartas:

- palo de 13 cartas de corazones()

- palo e 13 cartas de diamantes ()

- palo de 13 cartas de Tréboles ()

- palo de 13 cartas de Espadas ()

Como en un mazo de 52 cartas hay 4 ases, entonces la probabilidad será:

4 1
=
52 13

4. Una urna contiene 6 bolitas azules y 4 blancas. Se extraen dos bolitas sucesivamente,
con reposición. Calcular la probabilidad que la primera sea azul y la segunda blanca.

Solución:

103
P(a y b) = P(a) x P(b)

6 4 6
= x =
10 10 25

5. De una caja que contiene 5 bolas rojas y 3 negras, se extrae uno de ellos al azar.
Determinar la probabilidad que sea negra.

Solución

n () = 8

n (N) = 3 => P(N) = 3/8

6. De un mazo, se extraen 2 cartas ¿Cuál es la probabilidad que sean espadas?

Solución:

Como en un mazo de 52 cartas hay 13 espadas, por el método de las combinaciones, tenemos
que:

La probabilidad será:

1
C13 52
2 / C2 =
17

7. En una urna se tiene 4 bolas negras, 5 blancas y 7 verdes. Al extraer tres de ellas, ¿Cuál
es la probabilidad que sean negras?

Solución:

La probabilidad será de

4.3.2 1
C34 / C16
3 = =
16.15.14 140

8. Se tienen 10 objetos buenos, 4 dañados y otros 2 con daños importantes. ¿Cuál es la


probabilidad que, al sacar 2 objetos al azar, éstos sean buenos?

Solución:

En total son: 10+4+2 = 16 objetos en total

Por el método de las fracciones, será:

10 9 3
x =
16 15 8

Por el método de las combinaciones:

C10 10 . 9 3
2
16
= =
C 2 16 . 15 8

104
9. Determina la probabilidad de realizar el siguiente suceso: “Obtener cara por lo menos 2
veces al lanzar al aire 3 veces una moneda”

Solución:

Trabajar con un diagrama del árbol.

Como nos piden hallar la probabilidad de sacar por lo menos 2 caras, esto es 2 o más caras,
entonces las caras favorables que observamos en la tercera columna son: ccc, ccs, csc y scc,
siendo 4 posibilidades de un total de 8, luego:

4 1
P(por lo menos 2 caras) = =
8 2

10. En una caja hay 5 bolas rojas y 3 negras. Sin mirar se saca una bola y no se devuelve a la
caja, luego se saca otra bola. ¿Cuál es la probabilidad de que las dos bolas que se sacaron
sean rojas?

Solución:

5 5
La probabilidad de sacar una bola roja la primera vez es de: = , y la probabilidad de
5+3 8
5 −1 4
sacar una bola roja la segunda vez es de: = .
8 −1 7

Como la ocurrencia de los sucesos están ligadas mutuamente, aplicamos el teorema dado:

5 4 20 5
P(R y R) = P(R) + P(R) = x = =
8 7 56 14

11. Se escogen al azar 4 naranjas entre 10 naranjas que habían en una caja, de las cuales 6
estaban malogradas, ¿Cuál es la probabilidad de que 2 exactamente sean malogrados?

Solución:

Según los datos se tiene:

4 sanos

Total de naranjas: 10 6 malogrados

a) Si se extraen 4 naranjas del total de naranjas (10), entonces el número de maneras se


obtendrá:

10x9x8x 7
4 =
C10 = 210 maneras
1x 2x3x 4

b) Si se extraen 4 naranjas, donde dos naranjas deben ser malogradas entonces los otros
dos serán sanas.

105
12. El conjunto de casos posibles de extraer dos naranjas malogradas de los 6 y 2 sanas de
los 4 será.

6x5 4x3
C62 x C42 = x = 90 maneras
2 2

 la probabilidad es de:

90 3
P(A) = =
210 7

13. Un profesor de aula ha seleccionado a 10 niños y 4 niñas para recitar 3 poesías para
actuación central del aniversario del plante. ¿Cuál es la probabilidad de que los dos
primeros sean niños y la última sea niña?

Solución:

Según los datos el total de alumnos seleccionados son:

10 niños 14 alumnos

4 niños

Determinando las probabilidades tenemos:

10 5
Que el primero sea niño: =
14 7

9
Que el segundo sea niño:
13

4 1
Que el tercero sea niña: =
12 3

Como los tres eventos son independientes uno del otro, la probabilidad final será:

5 9 1 15
P(F) = x x =
7 13 3 91

14. Nueve personas se sientan al azar en una mesa redonda. ¿Cuál es la probabilidad de que
3 personas queden contiguas?

Solución:

Sean A, B y C las personas que van a sentarse siempre juntas o contiguas, entonces:

Calculamos el número total de formas en que se puedan sentar las 9 personas: (9-1)!= 8!

106
Si las 3 personas (A, B y C), siempre están juntos, entonces las formas que se pueden ubicar es:

3 x 2 x 1 = 6 formas

Las 6 personas restantes se podrán ubicar de:

6! formas

Finalmente la probabilidad (P(A)) de que las tres personas queden contiguas es:

6 x 6! 6 x 6! 3
(P(A)) = = =
8! 8x 7 x 6! 28

107
SEMANA 15

ANALISIS COMBINATORIO

DEFINICION
Es la parte de la matemática que estudia el número de ordenamientos o grupos que se puede
formar con las cosas o elementos.
Por ejemplo, podemos averiguar cuantos números diferentes de teléfonos, placas o loterías se
pueden formar con un conjunto de letras y dígitos. El estudio y comprensión de análisis
combinatorio sirve para comprender problemas de probabilidades.
El análisis combinatorio también se define como una manera practica de contar, las
operaciones o actividades que se designan como eventos o sucesos.

Ejemplo

Las diferentes maneras de vestir de una persona, utilizando un número determinado de


prendas de vestir
Ordenar 5 artículos en 7 casilleros
Contestar 7 preguntas de un examen de 10 preguntas
Designar 5 personas de un total de 50 para integrar una comisión

PRINCIPIOS DEL ANALISIS COMBINATORIO

PRINCIPIO DE LA MULTIPLICACION
Si el suceso “A” se puede realizar de “m” maneras y el suceso “B” se puede realizar de “n”
maneras, entonces los sucesos “A” y “B” se pueden realizar en forma conjunta de: m x n
maneras siempre que se efectúe uno después del otro.

Ejemplo.
De una ciudad “A” a otra ciudad “B” hay 4 caminos diferentes y de la ciudad “B” a la ciudad “C”
hay 3 caminos diferentes. ¿De cuántas maneras se podrá ir de “A” a “C”?

Hay 4 maneras Hay 3 maneras


de ir de “A” a “B” de ir de “B” a “C”

Luego el número de maneras de ir de “A” a “C” son:


# de maneras = 4 x 3 = 12 Rpta.= 12

108
PRINCIPIO DE ADICION

Si el suceso “A” puede realizarse de “m” maneras distintas y el suceso “B” de “n” maneras
distintas, entonces suceso “A” o el suceso “B” se puede realizar (m + n) maneras.

Ejemplo.

Se tiene a una alumna de la PNP que tiene que ir a un evento oficial, observa en su closet que
dispone de 3 vestidos y 4 conjuntos. ¿ de cuantas maneras puede vestirse?

Solucion: es evidente que la alumna tiene que elegir una prenda para vestirse, pues es
imposible que use las 2 prendas a la vez. O se pone el vestido o se pone el conjunto.
Por lo tanto por el principio de adicion la alumna puede vestirse
3+4= 7 formas distintas.

PRINCIPIO DE PERMUTACION

LA PERMUTACION
Es un arreglo u ordenación que se puede formar con todos los elementos disponibles de un
conjunto. En toda permutación lo que interesa es el ORDEN, característica fundamental. En
una permutación sí interesa el orden de sus elementos.

109
TIPOS:
Permutación Lineal
Permutación Circular
Permutación con Repetición

LA FUNCION FACTORIAL
La función factorial se representa con un signo de exclamación “!” detrás de un número. Esta
exclamación quiere decir que hay que multiplicar todos los números enteros positivos que hay
entre ese número y el 1.
Ejemplo.

6!=6*5*4*3*2*1
A este número, ¡6! le llamamos generalmente “6 factorial”, aunque también es correcto decir
“factorial de 6”.
4!=4*3*2*1=24
10!=10*9*8*7*………2*1=3628800

PERMUTACION LINEAL
Cuando se toman todos los elementos del conjunto para ordenarlos o permutarlos. También
resulta cunado los “n” objetos considerados son distintos y se ordena linealmente, de los
cuales se toman “r” objetos a la vez.

El número de permutaciones de “n” elementos se lee

Pn= n! el número de permutaciones es igual a factorial de n

Los arreglos se representan por la siguiente formula

También

Ejemplo 1.

Dado el conjunto {a,b,c,d}. ¿de cuantas formas pueden ordenarse 2 de las letras sin repetirse

En este ejercicio importa el orden por lo tanto es una permutación.

SOLUCION

110
Ejemplo 2

Dado el conjunto {a,b,c,d} ¿de cuantas formas se pueden ordenar la 4 letras, sin repetirse?

SOLUCION

PERMUTACION CIRCULAR
Es un arreglo u ordenación de elementos diferentes alrededor de un objeto; en estas
ordenaciones no hay primer ni último elemento por hallarse todos en línea cerrada.
Resulta cuando los “n” objetos considerados son distintos y se ordenan circularmente
alrededor de una mesa, rondas etc.
Para determinar el número de permutaciones circulares de “n” elementos distintos, se utiliza
La formula:

Ejemplo.
Los alumnos de la PNP, Renzo, Raúl, Alfredo, José y Nilton se van de campamento a Lurín, a la
hora del almuerzo se ubican alrededor de una mesa. ¿de cuantas formas pueden sentarse
alrededor de la mesa?
SOLUCION
Tomando como referencia a Renzo, los 4 alumnos restantes se pueden ordenar de 4! Formas
distintas

Pc (n)= (n-1)! Pc (5)= (4)! = 24 formas


PERMUTACION POR REPETICION
Es un arreglo u ordenación de elementos donde algunos de ellos se repiten. Resulta cuando los
“n” objetos considerados n1 son similares de alguna manera, n2 son similares de alguna
manera………nr. entonces el total de permutaciones de los “n” elementos esta dado por

111
Ejemplo
¿Cuántas palabras diferentes sin importar su significado se puede formar con las letras de la
palabra AMABA

SOLUCION
Es una permutación con repetición, pues la letra A se repite 3 veces y la M y B una vez

AMABA, MABAA, BAAAM………………………………20 GRUPOS

COMBINACIONES
Se denomina combinación a cada uno de los subconjuntos formados por “r” elementos
seleccionados de un conjunto de elementos donde r ≤ n sin tomar en cuenta el orden en el que
se hallan los elementos.
El total de combinaciones de “r” elementos que se puede formar de un conjunto de “n”
elementos se denota:

Leemos número de combinaciones de n elementos tomados de r en r

Ejemplo.
1.Dado el conjunto {a,b,c,d,e} de cuantas formas distintas se pueden seleccionar 2 letras, sin
repetirse

Solucion:
5! 5×4×3×2×1
𝐶25 = = = 10
3! 2! 3 × 2 × 1 × 2 × 1

𝑎𝑏, 𝑑𝑐, … … . . 10 𝑔𝑟𝑢𝑝𝑜𝑠

2.¿Cuántos grupos de 4 personas se pueden formar con un total de 7 personas?

Solucion:
7! 7×6×5
𝐶47 = = = 35
3! 4! 3!

∴ 𝑆𝑒 𝑝𝑜𝑑𝑟á𝑛 𝑓𝑜𝑟𝑚𝑎𝑟 35 𝑔𝑟𝑢𝑝𝑜𝑠.

112
3. 3.Un club tiene 10 jugadoras hábiles para poder jugar vóley. Si el entrenador desea
formar un equipo con 6 jugadoras, ¿Cuántos equipos diferentes se podrán formar?
4. Solución:

10! 10 × 9 × 8 × 7
𝐶610 = = = 210
4! 6! 4×3×2
∴Se podrá formar 210 equipos diferentes.

4.Un estudiante tiene que resolver 10 preguntas de 13 en un examen. ¿Cuántas


maneras de escoger las preguntas?

Solución:

13
13! 13 × 12 × 11
𝐶10 = = = 286
3! 10! 6
∴tiene 286 maneras diferentes de escoger las preguntas.

5.

6.

113
EJERCICIOS PROPUESTOS

1.Felipe desea viajar de Lima a Cuzco y tiene A su disposición 4 líneas aéreas y 6 líneas
terrestres. ¿De cuántas maneras diferentes podrá viajar?

a) 6 líneas b) 4 c) 24

d) 10 e) N.A.

2.De una ciudad “A” a otra ciudad “B” hay 2 caminos diferentes y de la ciudad “B” a “C”, 3
caminos diferentes ¿Por cuántos caminos distintos se podría viajar de “A” a “C” pasando por
“B” y sin retroceder?

a) 5 b) 6 c) 8

d) 12 e) N.A.

3.Esther tiene 4 blusas y 3 faldas. ¿De cuántas maneras se puede vestir, si la blusa azul se la
debe poner siempre con la falda celeste?

a) 12 b) 8 c) 7

d) 11 e) N.A.

4.De una urna hay 5 fichas numeradas del 1 al 5 y en otra urna 4 fichas numeradas del 6 al 9,
se saca una ficha de la primera y otra de la segunda urna con estos se forma un numeral.
¿Cuántos son los valores posibles de este numeral?

a) 9 b) 18 c) 20

d) 40 e) 36

5.¿Cuántas palabras diferentes (con sentido o no) se pueden formar con las letras de la palabra
Banana?

a) 30 b) 60 c) 90

d) 120 e) N.A.

6.Diana con sus cuatro amiguitas se sientan en círculo para jugar jazz ¿De cuántas podrían
ordenarse?

a) 48 b) 120 c) 240

d) 24 e) N.A.

7.Cinco parejas de esposos se ubican alrededor de una fogata ¿De cuántas maneras podrían
ordenarse? ¿Si cada pareja debe estar junta?

a) 4! b) 32 c) 512

d) 4! x 25 e) N.A.

114
8.En el transcurso de sus vacaciones Carlos debe realizar 5 viajes a Ica y 3 viajes al Cuzco ¿De
cuántas maneras diferentes en cuanto al orden hay para realizar estos viajes?

a) 28 b) 8 c) 56

d) 15 e) 25

9.KiKo tiene 4 pelotas blancas (B), 5 negras (N) y 3 amarillas (A). un día vendió sus pelotas en el
siguiente orden: BBAANBBANNNN, ¿En cuántas otros órdenes podría haber vendido sus 12
pelotas?

a) 60249 b) 36419 c) 14329

d) 27719 e) 15314

10.Un mozo tiene 8 copas; 5 de las cuales deben ser llenados con vino y las cuales deben ser
llenados con vino y las 3 restantes con coctail ¿De cuántas maneras diferentes puede realizar
el llenado?

a) 28 b) 32 c) 48

d) 56 e) 40

115
SESIÓN 16

EVALUACIÓN FINAL

116
ANEXO

EJERCICIOS Y PROBLEMAS DESARROLLADOS

1. Elaborar una tabla de frecuencias con los datos a continuación señalados

Sol.

clase Xi fi Fi hi Hi
Narrativa 23 23 0.33 0.33
Biografía 15 38 0.21 0.54
Poesía 20 58 0.29 0.83
Cuento 5 63 0.07 0.90
Teatro 7 70 0.10 1.00
70 1.00

2. Completar la tabla de frecuencias con los resultados de las notas finales de un


curso de ESTADÍSTICA

Sol.
clase Xi fi Fi hi Hi
No presente 17 17 0.19 0.19
Suspenso 16 33 0.18 0.38
Aprobado 29 62 0.33 0.70
Notable 24 86 0.27 0.98
Sobresaliente 2 88 0.02 1.00
88 1.00

117
3. Ejemplo: Las calificaciones de un examen de Matemáticas de 18 alumnos son
las siguientes:
Sobresaliente, Notable, Notable,
Insuficiente, Sobresaliente, Suficiente,
Suficiente, Insuficiente, Notable,
Notable, Suficiente, Suficiente,
Suficiente, Notable, Suficiente,
Sobresaliente, Notable, Notable
Sabemos el orden que mantiene, la nota más baja es el Insuficiente, le siguen
el Suficiente y Notable y la más alta es Sobresaliente, construir la tabla de
frecuencias
Sol.

clase Xi fi Fi hi Hi
Sobresaliente 3 3 0.17 0.17
Notable 7 10 0.39 0.56
Suficiente 6 16 0.33 0.89
Insuficiente 2 18 0.11 1.00
18 1.00

4. Ejercicio: Con la escena anterior contesta a las siguientes preguntas.


a) ¿Cuántos alumnos sacaron una nota inferior a Notable? R. 8 alumnos
b) ¿Qué porcentaje de alumnos aprueba el examen? R. 11%
c) ¿Cuántos alumnos aprobados no sacaron la nota más alta? R. 13 alumnos

5. Ejercicio El color de lo coches que circulan por una calle céntrica es el


siguiente:
NEGRO NEGRO ROJO AZUL ROJO VERDE VERDE BLANCO BLANCO
BLANCO NEGRO NEGRO BLANCO NEGRO ROJO ROJO BLANCO BLA
NCO NEGRO BLANCO AZUL ROJO NEGRO AZUL
NEGRO BLANCO BLANCO VERDE VERDE ROJO
Construye, una tabla con estos datos.
Sol.

clase Xi fi Fi hi Hi
Negro 8 8 0.27 0.27
Rojo 6 14 0.20 0.47
Azul 3 17 0.10 0.57
Verde 4 21 0.13 0.70
Blanco 9 30 0.30 1.00
30 1.00

118
6. Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo
los siguientes resultados: Considerando los siguientes datos elaborar la tabla
correspondiente

negro azul amarillo rojo azul


azul rojo negro amarillo rojo
rojo amarillo amarillo azul rojo
negro azul rojo negro amarillo

7. Indica que variables son cualitativas y cuales cuantitativas


1. Comida Favorita. Var. Cualitativa
2. Profesión que te gusta. Var. Cualitativa
3. Número de goles marcados por la U. Var. Cuantitativa
4. Número de alumnos de tu Instituto. Var. Cuantitativa
5. El color de los ojos de tus compañeros de clase. Var. Cualitativa
6. Coeficiente intelectual de tus compañeros de clase. Var. Cuantitativa

8. Después de verificar en el cuaderno de denuncias de la comisaria de una


localidad de Huancavelica, se verificó que las violaciones durante el año están
registradas como sigue:

clase Xi fi
Enero 8
Febrero 6
Marzo 3
Abril 4
Mayo 9
Junio 5
Julio 7
Agosto 2
Septiembre 5
Octubre 4
Noviembre 3
Diciembre 8

Elabore la tabla de frecuencias correspondiente


Sol.

clase Xi fi Fi hi Hi
Enero 8 8 0.13 0.13
Febrero 6 14 0.09 0.22
Marzo 3 17 0.05 0.27
Abril 4 21 0.06 0.33
Mayo 9 30 0.14 0.47
Junio 5 35 0.08 0.55

119
Julio 7 42 0.11 0.66
Agosto 2 44 0.03 0.69
Septiembre 5 49 0.08 0.77
Octubre 4 53 0.06 0.83
Noviembre 3 56 0.05 0.88
Diciembre 8 64 0.13 1.00
64 1.00

9. La siguiente información corresponde a una tabla de frecuencias sobre la


preferencia de 80 fanáticos del cine, deteriorada por un accidente en el
trabajo, se pide completar los datos de la tabla con os datos recuperados.

Clase Xi fi Fi hi Hi
Drama 12
Terror 48 60
Comedia 0.125
Aventura 0.075
Guerra
80

Sol.

Clase Xi fi Fi hi Hi
Drama 12 12 0.15 0.15
Terror 48 60 0.6 0.75
Comedia 10 70 0.125 0.875
Aventura 6 76 0.075 0.95
Guerra 4 80 0.05 1
80 1

120
EJERCICIOS SOBRE VARIABLES CUANTITATIVAS DISCRETAS

Este tipo de variables cumple una cantidad de números exacta. Son valores
enteros.
1. Número de alumnos de las aulas de un colegio de la región Ucayali

22 – 22 – 24 – 21 – 28 – 30 – 26 – 31 – 22 – 26 – 32 – 28 – 30 – 24 – 30 – 32 – 20 – 24 –
35 – 22 – 24 – 24 – 26 – 24 – 26 – 30 – 24 – 28 – 27 – 23 – 35 – 24

Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 35
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 20
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 35 − 20 = 15
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 15: 5 = 3

Clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[20 − 23[ 6 6 0,19 0,19 21,5 19 % 19 %
[23 − 26[ 9 15 0,28 0,47 24,5 28 % 47 %
[26 − 29[ 8 23 0,25 0,72 27,5 25 % 72 %
[29 − 32[ 5 28 0,16 0,88 30,5 16 % 88 %
[32 − 35] 4 32 0,12 1 33,5 12 % 100 %
32 --- 1 --- 100 % ---

2. Número de Uvas de un racimo

18 - 16 - 20 – 22 - 25 – 24 – 30 – 28 – 27 – 42 – 28 – 20 – 22 – 33 – 32 – 26 – 25 - 20 –
24 – 38 – 35 – 16 – 16 – 30 – 30 – 26 – 27 – 28 – 30 – 16 – 24 - 32 –
38 – 40 – 24 – 25 – 40 – 42 - 35 - 40 – 29 – 34 – 32 - 35

Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 40
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 16
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 42 − 16 = 26
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 26: 5 = 5,2 ≈ 5

121
clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[16 − 21[ 8 8 0,18 0,18 18,5 18 % 18 %
[21 − 26[ 10 18 0,22 0,40 23,5 22 % 40 %
[26 − 31[ 11 29 0,25 0,65 28,5 25 % 65 %
[31 − 36[ 8 37 0,18 0,83 33,5 18% 83 %
[36 − 42] 7 44 0,17 1 38,5 17 % 100 %
44 --- 1 --- --- 100 % ---

3. Número de hijos por familia en un vecindario del Distrito de Villa el salvador

5–4–3–0–1–7–6–4–3–2–5–4–8–6–5–4–3–6–6–4–2–1
1–4–5–6–4–3–5–6–4–3–8–6–2–2–1–1–2–4–6–4–4–5
5 – 4 – 2 – 1 -7 - 2
Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 8
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 0
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 8 − 0 = 8
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 8: 5 = 1,6 ≈ 2

clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[0 − 2[ 7 7 0,14 0,14 1 14 % 14 %
[2 − 4[ 12 19 0,24 0,38 3 24 % 38 %
[4 − 6[ 19 38 0,38 0,76 5 38 % 76 %
[6 − 8[ 10 48 0,20 0,96 7 20 % 96 %
[8 − 10] 2 50 0,04 1 9 4 % 100 %
50 --- 1 --- --- 100 % ---

4. Edades de los postulantes a la escuela de SOPNP en el primer día.

20 - 24 – 18 – 23 – 22 – 18 – 20 – 22 – 22 – 20 – 19 – 24 – 20 – 21 – 19 – 24
18 – 21 – 22 – 17 – 22 – 24 – 18 – 20 – 20 – 20 – 21 – 21 – 20 – 20 – 24 – 24
24 – 22 – 18 – 20 – 20 – 20 – 22 – 21 – 20 – 17 – 24 – 20 – 20 – 21 – 22 – 23
18 – 19 – 20 – 17 – 20 – 16 – 21 – 24 – 24 – 23 – 22 – 23 – 20 – 21 - 22 – 24
20 – 20 – 21 – 20 - 20 – 22 – 23 – 19 – 19 – 20 – 23 – 24 – 24 – 22 – 23 – 22
21 – 22 – 23 – 24 – 20 - 24 – 20 – 22 – 21 – 22 – 23 – 24 – 23 – 19 – 18 – 20
20 – 22 – 24 - 23

122
Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 24
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 16
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 24 − 16 = 8
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 8: 5 = 1,6 ≈ 2

clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[16 − 18[ 4 4 0,04 0,04 17 4 % 4%
[18 − 20[ 13 17 0,13 0,17 19 13 % 17 %
[20 − 22[ 39 56 0,39 0,56 21 39 % 56 %
[22 − 24[ 27 83 0,27 0,83 23 27 % 83 %
[24 − 26] 17 100 0,17 1 25 17 % 100 %
100 --- 1 --- --- 100 % ---

5. Calificaciones exactas de los parciales de Estadística en las aulas 01 y 02


ESOPNP

08 – 12 – 14 – 10 – 12 – 11 – 10 – 12 – 09 – 12 – 13 – 14 – 16 – 17 – 11 – 12 – 14 – 15 –
12 – 11 – 14 – 10 – 12 – 14 – 16 – 18 – 12 – 14 – 05 – 12 – 15 – 10 – 12 – 10 – 11 – 13 –
15 – 17 – 17 – 13 – 18 – 09 – 12 – 11 – 07 – 06 – 14 – 12
05 – 15 – 13 – 11 – 10 – 10 – 09 – 07 – 16 – 14 – 12 – 10 – 08 – 07 – 12 – 09
17 – 15 – 08 – 06 – 14 - 15

Desarrollo:
𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 18
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 05
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 18 − 05 = 13
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 13: 5 = 2,6 ≈ 3

clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[04 − 07[ 4 4 0,06 0,06 5,5 6% 6%
[07 − 10[ 10 14 0,14 0,20 8,5 14 % 20 %
[10 − 13[ 28 42 0,40 0,60 11,5 40 % 60 %
[13 − 16[ 19 61 0,27 0,87 14,5 27 % 87 %
[16 − 19] 9 70 0,13 1 17,5 13 % 100 %
70 --- 1 --- --- 100 % ---

123
EJERCICIOS SOBRE VARIABLES CUANTITATIVAS CONTINUAS

Estas pueden ser expresadas con decimales, toman cualquier valor dentro de
un intervalo.

1. Peso del primer grupo de los postulantes a la ESOPNP.

62 – 62,3 – 70,2 – 63- 68,4 – 72 – 72,5 – 74 – 68,8 – 66,8 – 72 – 72, 4 – 82,4


78,4 - 64,6 – 82,4 – 68,8 - 72,2 – 74,6 – 68,8 – 65,8 – 64,8 – 78,6 – 82,6 – 78
68,8 – 68,2 – 78,4 – 86,6 – 70 – 72 – 72,6, 78, 8 – 65 – 65,4 – 65,8 – 84
67 – 62,8 -74,4 – 74 – 72,4 – 72,8 – 68,8 – 64,8 - 72,4 – 74 – 72,8 – 74,4 – 76,8

Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 84
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 62
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 84 − 62 = 22
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 22: 5 = 4,5 ≈ 5

clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[61 − 66[ 10 10 0,2 0,2 63,5 20 % 20 %
[66 − 71[ 12 22 0,24 0,44 68,5 24 % 44 %
[71 − 76[ 17 39 0,34 0,78 73,5 34 % 78 %
[76 − 81[ 6 45 0,12 0,90 78,5 12 % 90 %
[81 − 86] 5 50 0,1 1 83,5 10 % 100 %
50 --- 1 --- --- 100 % --

2. Velocidad que llevan las combis que circulan en la panamericana norte en una
determinada hora
82 – 84,4 – 90,4 -96,8 – 79,6 – 84,4 – 88,2 – 78 – 86,4 – 94,2 – 96,2 – 98,2 – 100 – 96,8
– 86,4 – 87,1 – 88,2 – 86,4 – 82,4 – 88,8 – 79,8 – 78,8 – 86,8 – 94 – 96,4 – 87,6 – 84,8 –
98,8 – 84,6 – 88,7 – 80 – 82,8- 102 – 100,4 – 98,8 – 96,6 – 82 – 82,6 – 92,5 – 96

Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 102


𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 78
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 102 − 78 = 24
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 24: 5 = 4,8 ≈ 5

124
clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[78 − 83[ 9 9 0,22 0,22 80,5 22 % 22 %
[83 − 88[ 11 20 0,28 0,50 85,5 28 % 50 %
[88 − 93[ 6 26 0,15 0,65 90,5 15 % 65 %
[93 − 98[ 8 34 0,2 0,85 95,5 20 % 85 %
[98 − 103] 6 40 0,15 1 100,5 15 % 100 %
40 --- 1 --- --- 100 % ---

3. Estatura (en cm) de los postulantes a la ESOPNP 2019


165 – 166 – 168 – 176 – 168 – 166 – 173 – 173 – 174 – 173 – 175 – 172 – 180 – 171 –
171 – 166 – 165 – 167 – 165 – 177 – 176 – 170 – 172 – 172 – 174 – 178 – 165 – 169 –
166 – 167 – 165 – 175 – 174 – 174 – 168 – 173 – 174 – 173 – 170 – 165 – 167 – 168 –
170 – 174 – 178 – 172 – 174 – 168 – 169 - 171 – 173 – 172-
169 – 170 – 169 – 169 – 168 – 168 - 170 - 169

Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 180


𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 165
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 180 − 165 = 15
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 15: 5 = 3

clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[165 − 168[ 15 15 0,25 0,25 166,5 25 % 25 %
[168 − 171[ 16 31 0,27 0,52 169,5 27 % 52 %
[171 − 174[ 14 45 0,23 0,75 172,5 23 % 75 %
[174 − 177[ 11 56 0,18 0,93 175,5 18 % 93 %
[177 − 180] 4 60 0,07 1 178,5 7 % 100 %
60 --- 1 --- --- 100 % ---

4. Tiempo (en segundos) que demoran en recorrer los 100 metros planos los
postulantes a la ESOPNP

67 – 70 - 72 – 74 – 68 – 69 – 73 – 70 – 74 – 72 – 74 – 71 – 66 – 64 – 66 – 70 – 69- 65 – 66
– 68 – 69 – 65 – 69 – 65 – 64 – 72 – 74 – 69 – 68 – 69 – 71 – 70 – 72 – 69 – 64 – 66 – 65
– 66 – 67 – 68 – 69 – 70 – 68 – 64 – 65 – 71 – 73 – 66 – 64 – 68

Desarrollo:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 74
125
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 64
𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 74 − 64 = 10
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒)
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 10: 5 = 2

clases 𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 %
[64 − 66[ 10 10 0,20 0,20 65 20 % 20 %
[66 − 68[ 8 18 0,16 0,36 67 16 % 36 %
[68 − 70[ 14 32 0,28 0,64 69 28 % 64 %
[70 − 72[ 7 39 0,14 0,78 71 14 % 78 %
[72 − 74] 11 50 0,22 1 73 22 % 100 %
50 --- 1 --- --- 100 % ---

5. Un club de básquet realizo una convocatoria para niños de 12 años. Se sabe que
el primer día se presentaron 200 niños cuyas estaturas se agrupan en intervalos
y se registra en una tabla. ¿Cuántos miden menos de 165 cm?

clases 𝑓𝑖 𝐹𝑖
[150 − 155[ 40 40
[155 − 160[ 80 120
[160 − 165[ 50 170
[165 − 170[ 20 190
[170 − 175] 10 200
200 ---

Rpta: Se necesitan 170 niños

126
EVENTOS PROBABILÍSTICOS

Experimentos (o fenómenos) aleatorios. - Son aquellos en los que no se puede predecir


el resultado.
Experimento determinista.- Aquellos experimentos que si se puede predecir el
resultado

Ejemplos:
a) Lanzar una moneda es un experimento aleatorio ya que no sabemos si
obtendremos cara o cruz.
b) Calentar agua a altas temperaturas es un experimento determinista ya que
sabemos, con toda seguridad, que el agua hervirá a partir de determinada
temperatura.
c) Lanzar un dado es un experimento aleatorio ya que no podemos predecir el
número que obtendremos.
d) Extraer una bola de una urna que sólo contiene bolas rojas es un
experimento determinista ya que podemos predecir que la bola extraída será
roja.

El espacio muestral .- Es el conjunto de los resultados posibles de un


experimento aleatorio. Denotaremos el espacio muestral de un experimento con E o Ω.

Ejemplo:
a). El espacio muestral del lanzamiento de una moneda es;
E={cara, cruz}E={cara, cruz} ya que éstas son las dos únicas posibilidades.
b). El espacio muestral del lanzamiento de un dado es; E={1,2,3,4,5,6} pero también
puede ser. E={par, impar}
Un suceso aleatorio.- Es un elemento del espacio muestral. Es decir, cada uno de los
posibles resultados de un experimento aleatorio es un suceso aleatorio.

Ejemplo 1:
En el lanzamiento de una moneda, los sucesos aleatorios son: sale cara, sale cruz
Decimos que un suceso aleatorio es un suceso imposible si nunca puede ocurrir.

Ejemplo 2:
En el lanzamiento de un dado, los siguientes sucesos son imposibles: sacar un 8, sacar
un número mayor que 6.
En contraposición, Decimos que un suceso aleatorio es un suceso
seguro si siempre ocurre.

Ejemplo 3:
En el lanzamiento de un dado, los siguientes sucesos son seguros: sacar un número
mayor que 0, sacar un número menor que 7.

127
EJERCICIOS DE PERCENTILES

1. Dadas las series estadísticas:


• 3, 5, 2, 7, 6, 4, 9.
• 3, 5, 2, 7, 6, 4, 9, 1.

Calcular para la primera serie los percentiles 32 y 85.


Para la segunda, hallar los percentiles 20 y 70.

Solución
• 3, 5, 2, 7, 6, 4, 9.
La serie en orden es: 2, 3, 4, 5, 6, 7, 9.
Al calcular los percentiles tenemos:

P32 = 4

P85 = 7
• 3, 5, 2, 7, 6, 4, 9, 1.

La serie en orden es: 1, 2, 3, 4, 5, 6, 7, 9.


Al calcular los percentiles obtenemos:

P20 = 2

P70 = 6

2. Una distribución estadística viene dada por la siguiente tabla:

fi
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2

Hallar el percentil 70.


Solución:
-Completamos la tabla con la frecuencia acumulada:

128
xi fi Fi

[10, 15) 12.5 3 3

[15, 20) 17.5 5 8

[20, 25) 22.5 7 15

[25, 30) 27.5 4 19

[30, 35) 32.5 2 21

21

-Buscamos el intervalo donde se encuentra el percentil 70


Multiplicamos 70 por N, en este caso 21, y dividimos por 100

En la columna de las frecuencias acumuladas , identificamos el intervalo que


contiene a 14.7
La clase de P70 es: [20, 25)
-Aplicamos la fórmula para el cálculo de percentiles de datos agrupados
Extrayendo los siguientes datos:

Concluimos que:

3. Calcular el percentil 35 y 60 de la distribución de la tabla:


fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Solución:
Cálculo del percentil 35
-Buscamos el intervalo donde se encuentra el percentil 35
Multiplicamos 35 por N, en este caso 65, y dividimos por 100

129
En la columna de las frecuencias acumuladas identificamos el intervalo que
contiene a 22.75
La clase de P35 es: [70, 80)
-Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados
Extraemos los siguientes datos:

Concluimos que:

Cálculo del percentil 60


-Buscamos el intervalo donde se encuentra el percentil 60

Multiplicamos 60 por N, en este caso 65, y dividimos por 100

Buscamos en la columna de las frecuencias acumuladas el intervalo que contiene


a 39
La clase de P60 es: [80, 90)

-Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados

Extraemos los siguientes datos:

Concluímos que:

130

También podría gustarte