La Estadística Aplicada Al Análisis Economico PDF

UNIVERSIDAD NACIONAL
AUTÓNOMA DE MÉXICO
FACULTAD DE ECONOMÍA
DIVISIÓN DE ESTUDIOS PROFESIONALES

ÁREA D E MÉTODOS CUANTITATIVOS
LA ESTADÍSTICA APLICADA AL ANÁLISIS

ECONÓMICO
Ph. D. y PROFESOR GENARO SÁNCHEZ BARAJAS
Abril 2007
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓM ICO
ÍNDICE
CONCEPTO Página
Introducción 1
I Generalidades ................................................................... 3
I.1 Definiciones de Estadística ................................................ 4
I.2 Diferentes clases de Estadística ....................................... 8
II La Estadística como Método de Análisis Económico........... 8
II.1 Aplicación del Método Estadístico a la Economía................ 10
Serie Estadística ................................................................... 11
II.2 Distribución de Frecuencias ................................................ 11
Ordenamiento de los datos en:
a) Serie Simple .................................................................... 12
b) Serie de Frecuencias ....................................................... 12
c) Serie de Clases y Frecuencias ........................................ 13
Presentación Gráfica: Histograma, ...................................... 14
Ojiva y .............................................................................
19
Polígono de Frecuencias ................................................. 21
II.3 Análisis de las Distribuciones de Frecuencias...................... 22
II.3.1 Medidas de Tendencia Central ....................................... 22
II.3.1.1 La Media Aritmética ................................................ 23
II.3.1.2 Mediana ................................................................... 28
II.3.1.3 Moda ................................................................... 31
II.3.1.4 Media Geométrica ................................................ 34
II.3.1.5 Media Armónica ........................................................ 37
II.3.1.6 Relación entre las Medidas de Tendencia Central ...... 40
II.3.1.7 Practicas I, II y III ................................................ 43
II.3.2 Medidas de Dispersión ................................................ 47
II.3.2.1 Rango ................................................................... 47
II.3.2.2 Desviación Media ................................................ 47
II.3.2.3 Desviación Estándar ................................................ 50
i PROFR. GENARO SÁNCHEZ BARAJAS

II.3.2.4 Varianza ................................................................... 53

II.3.2.5 Coeficiente de Variabilidad ......................................... 53
II.3.3 Medidas de Posición .................................................. 54
II.3.3.1 Cuartiles ..................................................................... 54
II.3.3.2 Desviación Cuartil .................................................. 58
II.3.3.3 Práctica IV ................................................................. 59
II.3.4 Medidas de Asimetría y Kurtosis ............................... 61
II.3.4.1 Asimetría con Respecto a Mo y Md ..................... 61
II.3.4.2 El Tercer Momento como Medida de Asimetría .......... 61
II.3.4.3 Kurtosis .................................................................... 64
II.3.5 Medidas de Concentración ........................................ 69
II.3.5.1 Curva de Lorenz como Elemento del Análisis
Económico .................................................................. 69
II.3.5.2 Índice de Concentración de Corrado Gini ................... 71
II.3.5.3 México Distribución del Ingreso Personal:
1950 a 1965 .......................................................... 73
III Números Índice ........... ............................................... 79
III.1 Definición ................................................................... 79
III.2 Método de Cálculo de Índices ....................................... 79
Relativos
Media Aritmética
Media Geométrica
Media Armónica
Ponderados o Compuestos
Laspeyres o del año base
Paasche o del año de estudio
Fisher o Ideal
III.3 Cambio de Base ............................................................ 82
III.3.1 Aplicaciones para Deflactar e Inflactar ....................... 84
III.4 Cálculo de la Inflación Mensual Acumulada ...................... 86
III.5 Ejemplos Adicionales .................................................. 87
III.6 Pruebas Matemáticas .......................................................
91
III.6.1 Prueba de Revisión de Factores ............................... 92
III.6.2 Prueba de Revisión Cronológica ............................... 93
ii PROFR. GENARO SÁNCHEZ BARAJAS

III.7 Indices Eslabonados y en Cadena ............................... 94

III.8 Diferentes Indices usados en México
.................................................................... 94
III.9 Práctica V
....................................................................................97
IV Introducción a la Probabilidad ....................................... 99
IV.1 Definición de Probabilidad ........................................ 99
Probabilidad Objetiva
Probabilidad Subjetiva
Axiomas de Probabilidad
IV.2 Resultados de un Experimento ....................................... 103
IV.2.1 Resultados Posibles ................................................. 103
IV.2.2 Eventos Independientes ....................................... 103
IV.2.3 Eventos Mutuamente Excluyentes .............................. 103
IV.2.4 Diagrama de Venn ................................................. 103
IV.2.5 Espacio Muestral .......................................................... 103
IV.2.6 Función .................................................................... 103
IV.2.7 Variable .................................................................... 103
IV.2.8 Variable Aleatoria ................................................. 103
IV.2.9 Variable Numérica ................................................. 103
IV.2.10 Variable Aleatoria ................................................. 103
IV.2.11 Experimento .......................................................... 104
IV.3 Análisis Combinatorio ................................................. 104
IV.3.1 Permutaciones ........................................................... 105
IV.3.2 Combinaciones ........................................................... 106
IV.3.3 Análisis Combinatorio Ampliado ............................... 107
IV.3.4 Diagrama de Árbol ................................................. 110
IV.3.5 Eventos Dependientes o no Excluyentes .................... 114
Inferencia Bayesiana ................................................. 114
IV.3.6 Práctica VI ...................................................................
120
V Distribuciones Probabilísticas ............................................ 122
iii PROFR. GENARO SÁNCHEZ BARAJAS

V.1 Distribución Binomial ................................................. 123

V.1.1 La Media Aritmética y la Desviación Estándar ........... 126
V.1.1.2 La Distribución Normal como Límite de la Binomial 128
V.2 Distribución Hipergeométrica ....................................... 130
V.2.1 Su Media Aritmética y su Desviación Estándar............. 132
V.3 Distribución de Poisson ................................................ 133
V.4 Distribución Normal .......................................................... 134
V.5 Práctica VII ..................................................................
137
VI Muestreo ............................................................................. 139

VI.1 Concepto de Universo y Muestra .............................. 139
VI.2 Métodos de Muestreo ................................................ 140
VI.2.1 Errores de Muestreo y no Muestreo .................... 141
VI.2.2 Selección de la unidad de Muestreo ..................... 142
Con y Sin Reemplazo
VI.2.3 Tablas de Números Aleatorios .............................. 143
VI.2.4 Muestreo Simple Aleatorio ....................................... 144
VI.2.5 Muestreo Estratificado ................................................ 145
VI.2.6 Muestreo Polietápico ................................................ 147
VI.2.7 Muestreo por Áreas ................................................ 147
VI.3 Aplicaciones ................................................................... 148
VI.3.1 Aplicación del Muestreo Simple Aleatorio ................. 148
VI.3.2 Aplicación del Muestreo por Áreas Combinado
con el Simple Aleatorio y el Estratificado .................. 150
VI.3.3 Muestreo por Racimos o Conglomerados ................... 153
VI.3.4 Muestreo Replicado ................................................ 153
VI.4 Definiciones Básicas ................................................ 155
VI.4.1 Límites de Confianza ................................................ 155
VI.4.2 Distribución de Muestreo ....................................... 156
VI.4.3 Error Permitido y Error de Muestreo .................... 162
VI.5 Determinación del Tamaño de la Muestra ....................... 164
VI.5.1 Evaluación del Tamaño de la Muestra .................... 165
VI.6 Precisión: Errores de Muestreo ....................................... 168
iv PROFR. GENARO SÁNCHEZ BARAJAS

VI.6.1 Muestreo Simple Aleatorio ......................................

169
VI.6.2 Muestreo Estratificado ................................................ 169
VI.6.3 Muestreo Replicado ................................................ 170
VI.6.4 Tamaño de la Muestra ................................................ 170
VI.6.5 Red General de Actividades en una Encuesta
de Muestreo .......................................................... 171
i) Diseño del cuestionario
ii) Trabajo de Campo
iii) Crítica de Cuestionarios
iv) Codificación y Procesamiento de Datos
v) Clasificación
vi) Tabulación
vii) Evaluación Estadística de los Resultados
viii) Diseño de los Formatos de tabulación
ix) Diseño del Cuestionario e Instructivo
x) Investigación Sobre Fuentes de Información
xi) Prueba del Cuestionario y ajustes Finales
xii Formulación del guión de información
xiii) Obtención de información complementaria
xiv) Levantamiento de la encuesta
xv) Supervisión del levantamiento
xi) Administración del levantamiento de la encuesta
xii) Crítica de los cuestionarios y determinación del tamaño
efectivo de la muestra.
xiii) Análisis y determinación de los estándares de trabajo
xix) Determinación detallada de todos los controles
administrativos y de trabajo.
xx) Entrenamiento de supervisores
xxi) Procedimiento para el viaje de supervisores
xxii) Aprovisionamiento de materiales para trabajo
xxiii) Organización de los materiales de trabajo
xxiv) Análisis estadístico de los resultados
xxv) Archivo de documentos
VI.6.6 Práctica VIII .......................................................... 181
VI.6.7 Práctica IX ................................................................... 188
v PROFR. GENARO SÁNCHEZ BARAJAS

VII Estimación de Parámetros ................................................ 194

VII.1 Definición ................................................................... 194
Estimación de Punto
Estimación de Intervalo
VII.2 Desigualdad de Tchebycheff ........................................ 197
VII.3 Estimadores Insesgados ................................................. 199
VII.3.1 Cálculo de las Proporciones Muestrales ...................... 202
VII.4 Estimador Eficiente ................................................. 203
VII.5 Estimador Suficiente ................................................. 203
VII.6 Estimador Consistente ................................................. 203
VII.7 Práctica X .......................................................... 204
VIII Teoría de la Decisión Estadística o Prueba de

Hipótesis ................................................................... 205
VIII.1 Definición ................................................................... 205
Hipótesis Nula
Hipótesis Alternativa
Error Tipo I
Error Tipo II
Prueba de Una Cola y Dos Colas o Extremos
VIII.2 Prueba de Hipótesis con Z ......................................... 206
VIII.3 Distribución t de Student ......................................... 208
2
VIII.4 Prueba de Hipótesis con X : Chi Cuadrada.................... 213
VIII.4.1 Prueba de Bondad de Ajuste ........................................
213
VIII.4.2 Prueba de Independencia de Principios o
de Clasificación en las Tablas de Contingencia............ 214
VIII.5 Evaluación Estadística de Encuestas Mensuales
o Periódicas ........................................................... 218
VIII.6 Prueba de Hipótesis con F: Análisis de Varianza......... 233
VIII.6.1 Método Largo ..........................................................
233
VIII.6.2 Método Abreviado ..................................................
237
vi PROFR. GENARO SÁNCHEZ BARAJAS

VIII.6.3 Práctica XI
................................................................ 239
BIBLIOGRAFÍA ..........................................................................
245
TABLAS ESTADÍSTICAS ..........................................................

247
vii PROFR. GENARO SÁNCHEZ BARAJAS

IN TRO D UC C IÓ N
La demostración de las matemáticas como una de las ciencias exactas

permitió la identificación de la estadística como la metodología de esa importante
ciencia, de tal manera que en la actualidad se le considera como el método
cuantitativo aplicable prácticamente a todas las ramas del saber científico.
Como una consecuencia de la generalización anterior, la ciencia económica

se ha beneficiado con la aplicación de este valioso método numérico que facilitó
la prueba de hipótesis a partir de las cuales se formularon algunas teorías, que una
vez demostradas, permitieron arribar a la determinación de ciertas leyes que le
dieron categoría de ciencia a la economía.
En efecto, la estadística como brazo operativo de las matemáticas se

revela como una disciplina de gran ayuda para la configuración, análisis e
interpretación de cualquiera de los fenómenos económicos conocidos o por
identificar.
La importancia de esta disciplina en el análisis económico determinó la

conveniencia de escribir esta obra. Se estima que resultara de gran ayuda al poder
aplicar los principales métodos numéricos en el análisis de la economía y los
negocios.
Aun cuando existe una amplia bibliografía sobre el tema, dentro de la cual,
se deduce, que existen libros de excelente calidad en el país, creo que esta obra
tiene cualidades que le dan originalidad y la ubican como un libro de texto de
introducción a la estadística que ya hacia falta para llenar el hueco surgido por la
inexistencia del análisis estadístico aplicado a la economía mexicana. En otras
palabras, esta obra es original porque la presentación de su contenido se
caracteriza por; primero, la exposición del método, sus características y alcance,
fenómenos factibles de analizar y, finalmente, se aplica con el análisis e
interpretación correspondientes. Con ello se hace una aportación en la nueva
presentación del conocimiento, cuya transmisión resulta rápida y atractiva; en
ocasiones se ratifican o rectifican algunas interpretaciones superficiales o
radicales en cuanto a la bondad del método estadístico aplicado a la empresa y la
economía en general.
PROFESOR: GENARO SÁNCHEZ BARAJAS 1

Con base en lo anterior, la presentación de la obra se caracteriza por el

desarrollo siguiente:
En el capitulo I se establece la relación entre la Estadística y la Economía,
así como la función especifica que tiene la primera como instrumento de análisis
de la segunda.
En el capitulo II se define y caracteriza a la ESTADÍSTICA

DESCRIPTIVA al igual que se identifica la importancia que tiene en la
tipificación de los fenómenos bajo estudio por el investigador.
Aquí se presentan los métodos necesarios para identificar, obtener,

clasificar, procesar, analizar e interpretar la información de un fenómeno de
interés para el investigador, hombre de negocios, estudiante o analista.
En los capítulos III a VIII se establece la relación que existe entre la

información posible y la información probable de una variable, en el ámbito de la
predicción que muchas veces es necesario hacer aún cuando halla riesgo e
incertidumbre. Se hace una introducción a la teoría de la probabilidad, la
identificación de los resultados posibles que genera un experimento realizado en
determinadas condiciones, el tipo y la caracterización de esos resultados, mismos
que se analizan en el marco de una distribución probabilística que sienta las bases
para introducirnos al muestreo, que a su vez es el fundamento para realizar
investigaciones de campo, con muestras probabilísticas, asi como para la
estimación de parámetros y pruebas de hipótesis.
Finalmente, deseo expresar mi agradecimiento a los profesores J.

Ekatherina Peregrina Guerreroy J. Alberto Reyes de la Rosa, sin cuya ayuda
habría sido difìcil actualizar los contenidos temàticos, mejorar sustancialmente
los diseños gráficos, incorporar los anexos bibliografico y estadístico, así como su
grabación electrónica para que las autoridades de la Facultad de Economía, con el
apoyo que tradicionalmente me han brindado para la modernización de la cátedra
y la difusión del conocimiento, promuevan estos materiales en discos compactos
como libros electrónicos al igual que su inserción en la red de Intranet, pàgina
web de la Facultad de Economía.
2 PROFESOR: GENARO SÁNCHEZ BARAJAS

I. GENERALIDADES
Desde que el hombre tuvo conocimiento de su existencia, buscó expresar

sus pensamientos, sus actos en forma tal que éstos le permitieran valorarse en su
interrelación con el grupo social a que pertenecía.
La matemática surgió como una experiencia en la mente humana, ella

refleja la voluntad activa, su objeto es precisar en forma sistematizada el mundo
interno y externo en que se desenvuelve el individuo.
Observan los estudiosos de esta ciencia que sus elementos básicos son:
Lógica e intuición, análisis y construcción, generalidad y particularidad.
Advierten que diversas actividades han destacado sus enfoques diferentes, y que
es únicamente el juego de estas fuerzas opuestas y la lucha por su síntesis lo que
constituye su teoría, su utilidad y el supremo valor de la ciencia matemática.
Sin duda, todo el desarrollo matemático ha tenido sus raíces psicológicas

en necesidades más o menos prácticas. Pero una vez en marcha, bajo la presión
de las aplicaciones necesarias, dicho desarrollo gana impulso por sí mismo y
trasciende los confines de una utilidad inmediata. Esta tendencia de la ciencia
aplicada dio origen a la Estadística.
Con base en lo aquí dicho, podremos decir que la Teoría de la Estadística

es una rama de las matemática pura, conocida con el nombre de Probabilidad.
La Economía es una ciencia cuyos límites rayan en la familiaridad con

otras (Historia, Estadística, Sociología, etc.), por lo regular se encuentran
interrelacionadas y se complementan unas con otras, para el enfoque teórico
práctico, y las soluciones que se obtienen son resultado de sus acciones
conjuntas.

Sigificado de estadística
Su significado(21) emana del vocablo “estado” y en general es sinónimo de datos.
Lo anterior se debe basicamente a que cuando el hombre se organiza en sociedad

y aparece el Estado, entonces es cuando el gobernante se empieza a preocupar
por la recabación de datos relativos a la población y a la riqueza, para fines
guerreros y de administración pública. Con el transcurso del tiempo la sociedad
se fué desarrollando y con ella se fueron obteniendo datos de carácter más variado
para uso general de los gobiernos, datos que vinieron a constituir lo que hoy
conocemos como ESTADÍSTICA DESCRIPTIVA, en virtud de que sirven para
describir las características de una variable determinada.
El origen de la teoría estadística inferencial, basada en muestras, puede
atribuirse a las personas que estudiaron los juegos de azar, los seguros de vida y
principalmente ciertas zonas de la experimentación biológica, llegando a un punto
en su desarrollo, que a fin de continuar profundizando se hizo necesaria la
aplicación de los métodos estadísticos. Consideran algunos autores que fueron
precisamente los biólogos los que desarrollaron la teoría de esta ciencia.
A fin de dar una mayor referencia de la estadística, como preámbulo diré

que los señores F. E. Croxton y D. J. Cowden la consideran no como ciencia
sino como un método científico, es en esto último donde está de acuerdo el
Profesor Gilberto Loyo quien en cierta ocasión me indicó que precisamente la
estadística es un conjunto de métodos.
¿Pero ha existido siempre un criterio uniforme a través del tiempo sobre el
concepto de estadística?
Es obvio que no, ya que lo que es ahora estadística, es completamente
distinto a lo que se creía hace medio siglo, y aún hace un siglo.
Como se indicó previamente, es sinónimo de “dato”, ya que por ejemplo cuando

hacemos mención a las estadísticas de alumnos, de su matrícula, de su número,
de sus calificaciones, el semestre que cursan.etcc, nos referimos a sus datos.
Sin embargo dicha acepción no corresponde, no es congruente con la función que

desempeña como disciplina dentro del método científico, ni con las actividades
que desempeñan en la actrualidad los expertos en estadística, puesto que no son
meros “recolectores y tabuladores de datos numéricos(20) .

Pensando que es conveniente desglosar y explicar los diferentes criterios

que han existido, expondré varias definiciones sobre la materia y se observará
como han variado a travéz del tiempo.
1.1 DEFINICIONES DE ES TADÍS TICA(1)
Como todas las ciencias la Estadística ha sido considerada, por los

teóricos dedicados a ella, según el grado de desarrollo en que se encuentra su
teoría y su aplicación.
Al dar a conocer las definiciones que sobre ella existen, las estaremos
interpretando como la expresión de lo que se consideró en una fecha dada; lo que
era y para qué servía.
Enumerándolas conforme al tiempo en que fueron elaboradas,

obtendremos el orden siguiente:
Achenwall (1748).- "La Estadística tiene por objeto el conocimiento de

las cosas públicas, y enseña los medios para percibir las relaciones que hay entre
ellas, siempre que sean dignas de notarse en cada República".
Achenwall (1749).-"La Estadística es la ciencia del Estado que se ocupa de

la riqueza y contiene el conocimiento básico de las verdaderas posibilidades de
una sociedad burguesa".
Achenwall (1749).-"La Estadística es la ciencia del Estado que se ocupa de

determinar la riqueza individual".
Bielfield (1770).- "La Estadística es aquella rama del conocimiento

político cuyo objeto de estudio es el poder real y relativo de los diversos estados
modernos, el poder emanado de sus ventajas naturales, la industria y la
civilización de sus habitantes y la sabiduría de sus gobiernos".
A. F. Luder (1792).- "La Estadística describe la situación de un estado en

la actualidad o como era en una época determinada.
Meusel (1794).- "La Estadística es una exposición científica ordenada de la

constitución y actual organización política de los Estados".

Sociedad Estadística de Londres (1838).- "La Estadística es la

investigación y coordinación de aquellos hechos que son calculados para ilustrar
las condiciones y posibilidades de una Sociedad".
D. E. Worl (1840).- "La finalidad de la Estadística consiste en la

legitimidad de las diversas relaciones, en la detección de lo más posiblemente
absoluto de los fenómenos relativos, de lo constante obtenido de la variable y en
sacar de lo nuevo las leyes relativas".
Joe Fallati (1843).- "La noción de lo real es el punto medio de la

Estadística, la realidad se encuentra, en parte, en los hechos, en parte en las leyes
de los fenómenos".
Noreau de Jonneis (1847).- "La Estadística es la ciencia de los hechos

sociales, expresados en términos numéricos".
Romelín (1863).-"La Estadística describe las características de la sociedad

humana a base de observaciones metodológicas y de enumeraciones de fenómenos
similares".
Levasser (1889).- "La Estadística es el estudio numérico de los hechos

Sociales".
Arturo Bowley (1901).- "La Estadística es la ciencia de los promedios, la
ciencia de los grandes números".
W. F. Willcox (1934).- "La Estadística es el estudio numérico de grupos

o masas a través del estudio de las unidades que las componen, ya sea que estas
unidades sean humanas o subhumanas, animadas o inanimadas".
McFarlane Mood (4) (1950).-"Estadística es la tecnología del método
científico; proporciona instrumentos y técnicas para los investigadores, y estos
instrumentos pueden ser de aplicación complementaria general y útiles en
cualquier campo de la ciencia".
Significado profano de la Estadística.- Algunos la consideran como dato,

otros dicen que comprende la recolección de grandes masas de datos y la
presentación de éstos en tablas o gráficas; suele incluir también el cálculo de
totales, promedios, porcentajes, etc. Este significado, según M ood tiene 30 años

de retraso, porque estas operaciones más o menos rutinarias constituyen

solamente parte inicial de la estadística de hoy.
Claudio Napoleoni (5) (1960).-La Estadística económica es aquella rama

de la estadística aplicada que utiliza los métodos estadísticos para el estudio de
los fenómenos económicos, en cuanto sean susceptibles de expresión numérica".
Wilburg Jimenez Castro.-(6) (1963).-La define como "método científico

o ciencia de previsión de hechos futuros con base en el conocimiento de datos
pasados y presentes."
Croxton y Cowden (7)(1965).-"Estadística es la recopilación,

presentación, análisis e interpretación de los datos numéricos".
Ana María Flores (1983).-"La Estadística es la ciencia de medir

variaciones".
Para obtener un resumen de las definiciones anteriores, puede decidirse

que cada una de ellas refleja lo que se entendía por dicha ciencia, esto es, son viva
expresión del campo en que se le aplicaba y expresan la tendencia a que se quería
llegar una vez obtenidas sus conclusiones. En otras palabras, estas definiciones
indican para quien se investigaba y qué es lo que interesaba saber (alimentación,
riqueza, número de hombres disponibles para el trabajo, producción y otros).
Así vemos que las definiciones que abarcan toda la segunda mitad del siglo XVIII
están enfocados a hacer de la Estadística una ciencia de información acorde con el
industrialismo que ya se gestaba en Inglaterra, y a la consolidación de los
Estados Europeos.
Con base en la doctrina del liberalismo y el surgimiento de nacionalismo
en la Europa continental, se fortalece el Estado cuyo poder se encuentra en
manos de esa clase social dinámica en sus orígenes llamada BURGUESIA, la que
diera impulso en general al estudio de las ciencias entre las cuales contamos la
Estadística.
Así pues el siglo XlX, es un período en que se fortalece la idea de aplicar

los métodos estadísticos al análisis general de las ciencias sociales (Véase
definiciones de Ravaseer y Romelin).

Nuevas definiciones (Véase definiciones de Arturo Bowley y

W.F.Willcox) habían de formularse en torno al inicio de un siglo cuya primera
mitad se caracteriza por cambios profundos e imprevistos. -Estos hechos
hicieron una necesidad la existencia de datos estadísticos que sirvieron para la
formulación de planes bélicos o científicos. Esto fue un primer paso hacia la
programación adecuada porque se basaba en datos estadísticos.
Una vez terminadas las dos guerras mundiales, viene una paz que hace
posible que se logre un gran avance en la técnica de producción, en donde una vez
más surge la competencia entre las grandes corporaciones (monopolios), la que da
lugar a la búsqueda de nuevos métodos estadísticos que garanticen la producción
en masa y con el mínimo de defectivos (control estadístico de calidad). Hay otra
característica importante en esta segunda mitad del siglo XX; la liberación de una
gran cantidad de países que antes de la segunda guerra mundial eran "colonias",
y que, ahora como países independientes elaboran sus planes de desarrollo con
un conocimiento aceptable de la realidad en que se desenvuelven, gracias a la
aplicación de los métodos estadísticos en el estudio de sus economías.
Considero que las definiciones de los señores Claudio Napoleoni, M ood y

los autores que les siguen conforme al orden establecido, corresponden al
significado que tiene actualmente la estadística. Por su permanencia en el tiempo,
la definición de la maestra Ana M aría Flores es la más conveniente para el
concepto general de la Estadística.
Como mi objetivo es presentar y exponer el uso de los M étodos

Estadísticos, aplicados a la economía he considerado convenientemente ajustarme
a la definición dada por el señor Claudio Napoleoni ya que ésta es la más idónea
para los propósitos del economista.
1.2. DIFERENTES CLAS ES DE ES TADÍS TICAS
1. Estadística Inductiva o Inferencia Estadística. Incluye los métodos para

obtener inferencias a partir de datos muestrales. Para ser específicos,
inducción estadística incluye los métodos de generalización, estimación ó

predicción de las características de una población ó universo basados en una

muestra.
2. Estadística M oderna. Se conoce como una gama de conocimientos y métodos
de muestreo. Tiene una identificación con la estadística inductiva, al usar
métodos probabilísticos. El uso de la probabilidad matemática de evaluar la
confiabilidad de las conclusiones e inferencias basadas en los datos, es la
contribución de la estadística al problema de la inferencia inductiva_ el
problema de pasar de datos específicos a conclusiones generales _ . Por esta
razón la teoría de la probabilidad desempeña un papel fubdamental en la teoría
y aplicación de la estadística moderna (20).
3. Estadística Tradicional. Es la ciencia de los grandes números y de los grandes
promedios.
4. Estadística de Variables. Es aquella cuyo universo de datos se expresa en
magnitudes, ó sea que se puede medir.
5. Estadísticas de Atributos. Es la que se relaciona con fenómenos cuyo
universo de datos está expresado de manera cualitativa ejemplo sexo, religión,
filiación política, etc.
6. Estadística Descriptiva. Incluye los métodos de recopilación, organización
presentación, análisis e interpretación de un grupo de datos, ya sean datos de
muestreo o información completa sin ningún intento por hacer una predicción
basada sobre los datos.
7. Estadística Paramétrica. Se sustenta en el supuesto de la normalidad de un
fenómeno.
8. Estadística no Paramétrica. Es aquella que no se basa en el comportamiento
normal del fenómeno bajo estudio.
II. LA ES TADÍS TICA COMO MÉTODO DE ANÁLIS IS ECONÓMICO
Como se ha explicado en párrafos anteriores, la Economía es una ciencia

compleja y amplia; para poder penetrar y caracterizar a los fenómenos que en
ella se experimentan se vale de sus propios métodos y a la vez recurre a los
pertenecientes a otras disciplinas.
La estadística es un conjunto de métodos que usamos para análisis de las
variables económicas medibles directa e indirectamente. Conscientes de que la
intuición no es una base general aceptable para estructurar el criterio sobre
asuntos económicos, los investigadores de esta rama siguiendo el camino de los de
las ciencias físicas, trabajan denodadamente con métodos de estudio que se basan
en la observación y análisis de hechos, cuando las observaciones son de carácter
cuantitativo, se requieren métodos apropiados para organizarlas e interpretarlas;

después la estadística nos dá los instrumentos necesarios para efectuar la

combinación y análisis de tales observaciones.
Cabe mencionar que aunque los métodos estadísticos en general son
prácticamente universales en su aplicación, siempre aparecen problemas
especiales en cualquier campo de la investigación, esto es valioso para la
economía, donde surgen dificultades peculiares y problemas característicos.
Los métodos que en cierto modo están dedicados a responder a estos
requisitos, han experimentado amplio desarrollo, siendo confiable su aplicación a
la ciencia económica; ya que como afirma J. M . Keynes "este método se basa en
la observación cuantitativa de agregados, en el estudio de ellos y encaminado a
descubrir uniformidades y constancias entre los elementos que los constituyen.
Se funda en la observación porque considera directamente los hechos, y los reúne,
selecciona y clasifica; se asienta en la observación cuantitativa porque sólo opera
con hechos que son medibles: Y se ocupa en la observación de agregados, porque
aún cuando para llegar al análisis de ellos hayan de pasar antes por el de los
individuos o cosas que los forman, su verdadero campo de aplicación es el
estudio de los conjuntos, no el de los elementos que lo forman".
Si recordamos que las leyes económicas son la expresión de sucesos que
se repiten uniformemente en fenómenos globales. entonces la estadística es un
buen instrumento para su análisis.
El Profesor Alonso Aguilar M onteverde afirma "las leyes económicas son
estadísticas en virtud de que requieren de la repetición para poder configurarse".
Con base a ello se puede afirmar que son hechos repetidos en sucesos masivos
dentro del sistema económico.
Por consiguiente el método científico, que es la estadística, nos sirve para
el análisis de los fenómenos económicos dentro de sus múltiples manifestaciones.
Nos permite evaluar, hasta donde es posible la magnitud y el impacto que tiene el
acto del hecho económico dentro de la sociedad, si se puede preveer o proyectar;
en otras palabras, nos permite cuantificar las diferentes actividades que ejecutan
los individuos dentro del sistema económico en que se desarrollan.
Así, si queremos saber la producción de bienes y servicios en un período
determinado; si deseamos conocer las características de la población
económicamente activa, su aportación al Producto Interno Bruto; de que manera
contribuye a su formación, con tendencias al fortalecimiento del mercado interno,
de consumo y de capitales; si nuestro interés es saber cuántos empleos deben
crearse cada fin de año a fin de que el nivel de ingresos vaya acorde con el
crecimiento demográfico, entonces la estadística es el método que ayuda a
contestar estas interrogantes.

En conclusión si deseamos verificar cuál es la fuerza de trabajo en un

momento dado, cuánta de ella es activa, cómo está distribuída y cuál es su
posición con respecto a la tasa de desarrollo de un país, y muchas cosas más, no
nos queda otro camino que recurrir a la ciencia estadística.
Este breve análisis nos permite observar la estrecha relación que hay
entre ambas disciplinas y a la vez la importancia que tiene la estadística dentro de
la economía. Esto no debe llevarnos al extremo de pensar que la economía vale
por la estadística, o que trabaja a expensas de ella; hubo algunos estudios de la
economía como el profesor M oore, quien dijera, "nada se sabe en tanto que no
pueda medirse ".
Esta concepción es un error derivado posiblemente de la falta de
profundidad en el conocimiento de la ciencia económica, ya que como afirma
M arshall "semejante opinión es exagerada e inexacta".
Se acepta como complementaria más no como sustituto de la economía;
para fundamentar su razonamiento establece que:
a) Todo estudio cuantitativo exige una selección y organización de los datos
numéricos, o sea, la existencia previa de una teoría. Antes de cuantificar el
consumo es necesario definirlo como una categoría económica particular.
b) Una serie de datos numéricos, un cuadro estadístico, con un estudio sólo
cuantitativo, carece en sí de interés, si no se le somete a un trabajo cualitativo
de interpretación.
A esta fundamentación debemos sumar la de Samuelson: "el razonamiento
lógico es la clave del éxito para dominar los principios fundamentales (teoría
económica), mientras que la ponderación sagaz de los datos empíricos es la llave
para dominar las aplicaciones económicas".
Resumiendo diremos que la aplicación de la estadística en los fenómenos
económicos es conveniente dentro de ciertos límites y tomando en cuenta las
características del fenómeno en estudio, esto es, ver si es posible aplicarle
determinado método que favorezca la obtención de resultados deseados, a la vez
tomar en cuenta si es de interés social la realización del trabajo que con ella se
logre.
II.1. APLICACIÓN DEL MÉTODO ES TADÍS TICO A LA ECONOMÍA

Con el objeto de describir los métodos estadísticos que se aplican con
máxima frecuencia al análisis del sistema económico, se ha considerado necesario
hacer una exposición en forma detallada de los mismos a fin de demostrar su uso,
y con ello tratar de hacer clara su aplicación en el desarrollo del curso que se
pretende dar al alumnado.

Para iniciar dicha exposición se ha juzgado conveniente comenzar a tratar

sobre el significado de la terminología del mencionado método científico.
Empezaremos por definir lo que se entiende "población" en su acepción
estadística.
Llamamos población o Universo a todo grupo o conjunto de elementos
con ciertos atributos que lo caracterizan, como por ejemplo: tenemos los
habitantes de la República M exicana con un determinado grado de enseñanza
primaria para el año 2002. Como se ve, este es un grupo con una
característica, que es la instrucción primaria para el año 2002.
Las poblaciones pueden ser finitas o infinitas. Decimos que una
población es finita cuando está compuesta por un número finito de elementos.
Ejemplo de ellos puede ser los habitantes de una localidad que tienen agua
potable en sus hogares; será infinita una población, aquella cuyos términos sean
inconmensurables, por ejemplo, la población de moscas en todo el mundo.
S ERIE ES TADIS TICA.- Es la descripción de la relación que se gesta

entre dos variables, donde una de ellas es el tiempo, en función del cual se
observa la evolución de la otra variable.
AÑO PRODUCCIÓN KILOS
1 10.334 "
2 9.756 "
3 9.339 "
4 8.357 "
5 7.364 "
6 7.401 "
7 6.531 "
Fuente: Investigación directa
Como puede observarse, la producción de oro del año 1 al 5 constituye

una serie, ya que su volumen se modifica al variar el tiempo.
II.2. DIS TRIBUCIÓN DE FRECUENCIAS

Sabemos que en la práctica los datos de un fenómeno bajo estudio se

encuetran dispersos y es necesario organizarlos y distribuirlos a fin de que tengan
utilidad y podamos analizarlos e interpretarlos.
Cuando hacemos esta operación de agrupamiento, decimos que estamos

elaborando una distribución de frecuencias. Sea la edad en años de 30
instituciones bancarias establecidas en el país: 10, 7, 6, 5, 8, 9, 10, 11, 6, 7, 7, 12,
9, 6, 5, 9, 8, 13, 11, 12, 10, 9, 6, 7, 6, 6, 6, 6, 7, 8.
Cada número expresa la edad de cada banco. Cuando los datos están
presentados en esta forma es difícil hacer observaciones; y se dice que estos
datos no están agrupados, que son simples o que pertenecen a una serie simple.
Sin embargo nosotros podemos proceder a ordenarlos en forma

ascendente o descendente conforme a sus respectivos valores y obtenemos la
siguiente tabla:
13 10 9 7 6 6
12 10 9 7 6 6
12 10 8 7 6 6
11 9 8 7 6 5
11 9 8 7 6 5
Una vez ordenados los datos en forma decreciente, podemos hacer

análisis y conocer los límites entre los cuales varían las edades de los bancos,
ellas son: de 5 años son 2; de 6 años son 8; de 7 años son 5; etc.; lo que nos da la
siguiente tabla:
EDADES NÚMERO DE BANCOS
13 años 1
12 años 2
11 años 2
10 años 3
9 años 4

8 años 3
7 años 5
6 años 8
5 años 2
TOTAL 30
En virtud de que la suma nos da treinta, significa que fueron concentrados

en forma correcta las edades de los bancos, ya que efectivamente son treinta los
que tienen edad entre 5 y 13 años.
La columna cuyo encabezado dice "número de bancos", suele llamarse

"Columna de frecuencia", por lo que una frecuencia se define como el número
de veces que un términos se repite o existe en una serie; así podemos decir que
los bancos cuya edad es de siete años, tiene una frecuencia de cinco, o lo que
equivale a decir que hay cinco bancos cuya edad es de siete años.
Pero si estos datos deseamos clasificarlos en grupos o clases, (también se

conocen como intervalos de clases), hacemos el siguiente procedimiento:
1. Buscamos el valor más pequeño (mínimo) y el más grande

(máximo), que son respectivamente el 5 y el 13.
2. Procedemos a calcular la amplitud.
Amplitud = valor máximo - valor mínimo
Substituyendo: amplitud = 13 - 5 = 8
3. Calculamos la amplitud de la clase o grupo
Amplitud 8
Amplitud de la clase = = =2
4
Número de clases que se desean
El número cuatro indica que se agruparon los datos en cuatro clases o grupos, y el
número dos expresa que cada clase tendrá una amplitud de dos unidades.
Con estos resultados procedemos a elaborar la siguiente tabla:

CLASES
(Grupos de edades)
F
De 5 a 7 15
De más de 7 a 9 7
De más de 9 a 11 5
De más de 11 a 13 3
Total 30
F=Frecuencia
A esta forma de agrupar los datos le llamamos serie de clases y

frecuencias, en donde cada clase tiene su límite inferior y superior.
Si queremos ver gráficamente cómo están distribuidas las edades de los

bancos; basta hacer uso de los ejes cartesianos, usando el primer cuadrante y
poniendo en el eje de las "Y" las frecuencias, en el de las " X " los grupos de
edades, tendremos:
Histograma
F
15
r
e 15
c
u 10 7
e 5
n 5 3
c
i 0
a 5 7 9 11 13
Clases (grupos de edades)

A esta representación gráfica suele llamársele "histograma". Si calculamos

los puntos medios de los intervalos de clase, obtenemos una nueva tabla∗ .
Intervalos de clase F Xi
De 5 a 7 15 6
De más de 7 a 9 7 8
De más de 9 a 11 5 10
De más de 11 a 13 3 12
Total 30
i= 1, 2, 3...n
Xi = marca de clase o punto medio.
Gráficamente tendremos
Histograma y Polígono de Frecuencias
16
15
14
Frecuencias
12
10
8 7
6
5
4
3
2
0
5 61 7 82 9 10
3 11 12
4 13
Clases (grupos de edades)
M arca de clases o puntos medios (Xi )
A esta segunda curva se le llama "polígono de frecuencia".
Es interesante decir que autores como el Dr. Raúl Rojas Soriano(19), Croxton &
Cowden(2), entre otros, no cierran el Polígono de Frecuencias. Sin embargo, Yu
∗
Obsérvese que un punto medio es la suma de los límites inferior y superior de cada clase, la
cual se divide entre dos. También se le llama”punto medio de la clase o marca de clase”, que en
esencia es el valor representativo de cada clase.

Lun Chou(21) comenta que: “ Aunque el histograma es una presentación gráfica
eficaz y vívida de distribuciones de frecuencias, el polígono no representa muy

bien los datos básicos. La diferencia más notable del polígono es que las áreas
situadas debajo de él generalmente no son proporcionales a las frecuencias. Un
remedio es cerrar el polígono en la base prolongando ambos extremos de la curva
hasta los puntos medios de dos clases hipotéticas situadas en los extremos de las
distribuciones que tienen cero frecuencias.”
Resumiendo podemos decir, en función de la forma en que están ordenados los

datos, que hay tres tipos de series:
1. Serie simple
2. Serie de frecuencia
3. Serie de clases y frecuencias
Por lo que respecta a la representación gráfica de los datos, se puede

afirmar que es más útil usar el polígono de frecuencias, porque se presta más para
que puedan trazarse dos o más curvas en los mismos ejes para fines de
comparación.
Con objeto de reafirmar la forma como se constituye una serie de clases y

frecuencias, a continuación se presenta:
EJEM PLO # 2 CÁLCULO DE UNA SERIE DE CLASES Y FRECUENCIAS
Sean los datos:

96,500; 93,590; 93,268; 92,807; 90,196;
88,500; 87,500; 85,453; 84;925; 82,579;
80,813; 79,947; 79,504; 77,867; 74,635;
69,800; 69,145; 66,500; 66,317; 66,260;
60,310; 59,500; 57,486; 55,861; 53,500;
51,580; 46,963; 45,509; 44,148; 42,000;
41,558; 40,648; 39,729; 39,499; 39,000;

38,498; 37,719; 34,333; 33,055; 31,635;

80,852; 89,690; 28,710; 24,948; 20,500;
18,819; 14,500; 14,004; 13,681; 11,169.
PASOS A SEGUIR
1. Se identifican el valor más grande y el más pequeño, que son: 96,500 - 11,169
2. Se calcula la amplitud: AM PLITUD = VALOR M AXIM O - VALOR
M INIM O
A = 96,500 - 11,169 = 85,331
3. Calculamos la amplitud de la clase o grupo.

85,331
Amplitud de la clase = = 17,066
5
PUNTOS MEDIOS
Intervalos de clase F PM
de 11,169 a 28,235 12 19.702

de más de 28,235 a 45,301 15 36.768
de más de 45,301 a 62,367 8 53.834
de más de 62,367 a 79,433 8 70.900
de más de 79,433 a 96,500 7 87.966
Total 50
En la práctica el procedimiento anterior de agrupar los datos resulta ser el

más usual; de hecho es el más conveniente porque parte del conocimiento del
fenómeno y de los objetivos que se persiguen con la investigación. Con ello se
evita el manejo de tablas extensas que hacen más complejo el análisis del
fenómeno en estudio, o por el contrario tablas con unas cuantas clases que
ocultan las características o detalles relevantes de la distribución.
Particularidades de una distribución de datos continuos

Como estos datos, a diferencia de los discretos o discontinuos, son fraccionables

o divisibles, surge en problema del redondeo que se resuelve calculando las
fronteras de clase, mismas que se definen como el punto preciso que separa una
clase de otra, cuyo valor no está incluido en ninguna de las dos clases. Una
frontera de clase es un punto medio entre el límite superior de una clase y el
límite inferior de la que le sigue en la distribución de datos. Así en el siguiente
ejemplo correspondientes a becas que reciben 50 estudiantes expresadas en
pesos, tenemos:
Límites de Fronteras de Frecuencia Punto medio Amplitud de la

clase en $ clase en $ de clase clase
160- 162 159.5- 162.5 1 161 3
163- 165 162.5- 165.5 2 164 3
166- 168 165.5-168.5 13 167 3
169-171 168.5-171.5 20 170 3
172-174 171.5-174.5 11 173 3
175-177 174.5-177.5 3 176 3
50
Observamos que a).- a diferencia de una frontera de clase, el límite superior de

una clase no es el límite inferior de la siguiente clase; b).- la frecuencia o
agrupamiento de datos se hace con base en los límites y no de las fronteras de
clase. Así, digamos el valor 165.5, que es el valor de una frontera de clase, por el
criterio de redondeo, se registra en 166, límite inferior de la siguiente clase; c).-
la amplitud del intervalo de una clase se determina sustrayendo el valor de la
frontera inferior del superior. En la clase 166-168, su amplitud = 168.5-165.5= 3.
También se puede obtener sustrayendo el valor de su frontera inferior de la
frontera inferior de la clase siguiente; o el límite inferior de la clase del límite
inferior de la clase siguiente; también, el límite superior de la clase del límite
superior de la clase que le sigue.
Es incorrecto obtener la amplitud del intervalo de la clase sustrayendo el límite

inferior del límite superior.
Sin embargo, con el propósito de partir de una base matemática y no
empírica en la construcción de las tablas de frecuencias, H.A.S turges sugirió un
procedimiento basado en la siguiente fórmula.

Oscilación
Donde: i = i : Intervalo de clase
1 + 3.32 log(n )
n: Número de términos de la distribución
Esto supone que una vez conocida la amplitud de la clase o intervalo de

clase denotado por (i), la tabla de clases y frecuencias puede calcularse de
inmediato. Como podrá intuirse una vez conocido su valor se determina
automáticamente el número de grupos o clases de la distribución.
Aplicación del Método de S turges al ejemplo # 2, redondeando cifras:
Oscilación
i=
1 + 3.32 log(n )
OSCILACIÓN: Es la diferencia absoluta que existe entre el dato de menor valor

y el de valor más elevado
85,331
i= Oscilación = 96,500 - 11,169 = 85,331
1 + 3.32 log(50)
85,331 85,331
i= = = 12,929 ≈ 13, redondeando a miles
6.6
1 + 3.32 log(50)
Serie de clases y PUNTOS

frecuencias MEDIOS
xi F PM
de 11 a 24 6 17.5
de más de 24 a 37 7 30.5
de más de 37 a 50 11 43.5
de más de 50 a 63 6 56.5
de más de 63 a 76 6 69.5
de más de 76 a 89 8 82.5
de más de 89 a 102 6 95.5
Total 50
Acumulación de frecuencias u ojiva

Frecuencia
Xi Acumulada
(fa)
menos de 24 6
menos de 37 13
menos de 50 24
menos de 63 30
menos de 76 36
menos de 89 44
menos de 102 50
Al graficar esta serie se observa a través del histograma o del polígono de

frecuencias la distribución que tienen los datos; algunas veces hay más de ellos a
la izquierda, otras veces a la derecha.
Derivado de lo anterior puede decirse que gráficamente la forma de las

curvas o representaciones de una distribución de frecuencias, puede describirse
de dos maneras: en términos de asimetría que se conoce como dispersión y en
términos de su picudez que se conoce como Kurtosis.
En capítulos posteriores se ilustrará la metodología usada para medir
tanto la asimetría como la Kurtosis de las curvas de frecuencias.
Resumiendo puede decirse que los datos pueden agruparse o clasificarse
en:
1.Series simples
2.Series de frecuencias
3.Series de clases y frecuencias
En lo que se refiere a su representación gráfica, éstos pueden
representarse a través del histograma, del polígono de frecuencias ó de la ojiva.

OJIVA
60
50
F Acumulada
40
30
20
10
0
0 20 40 60 80 100 120
Clases
Hasta el momento hemos estudiado y usado clases cerradas para

constituir series de clases y frecuencias; sin embargo esto no siempre es así, ya
que el investigador puede decidir trabajar clases abiertas, es decir, que alguna clase
no tenga un límite inferior o el superior; ejemplo:
SERIE DE CLASES ABIERTA

Clases F PM
1 a 2 5 1.5
3 a 4 0 3.5
5 a 6 2 5.5
7 a 9 5 8.0
más de 9 2 no tiene
S ERIE DE CLAS ES ABIERTAS Y AMPLITUD VARIABLE
La Secretaría de hacienda y Crédito Público para calcular el impuesto del año

2001, elaboró y dio a conocer a los contribuyentes la siguiente tabla:
Tarifa actualizada del impuesto correspondiente al ejercicio de 2001

Límite inferior Límite superior Cuota fija % para aplicarse
$ $ $ sobre el excedente
del límite inferior.
0.01 5,153.22 0.00 3.00
5,153.23 43,739.22 154.56 10.00
43,739.23 76,867.80 4,013.10 17.00
76,867.81 106,982.82 12,767.04 32.00
106,982.83 215,769.06 18,407.70 33.00
215,769.07 629,030.10 54,307.20 34.00
629,030.11 1,887, 090.18 194,815.74 35.00

1,887,090.19 2,516,120.46 635, 136.96 37.50

2,516,120.47 en adelante 871,023.24 40.00
En general, en la práctica se acostumbra ordenar o agrupar los datos en la

forma anterior.
Ejemplos adicionales de Distribuciones o Series Estadísticas de Datos
Serie Simple
3 13 8 5 14 10 5 6 14 18 6
1 10 13 14 2 10 11 6 19 9 3
10 9 2 9 6 14 10 10 6 5 11
17 6 17 13 8 18 19 9 8 17 5
11 9 11 13 9 8
Estos datos como aparecen en desorden no pueden analizarse ni

interpretarse, para ello es recomendable ordenarlos en forma creciente, dando
origen a una serie de frecuencias.
La series es de frecuencias como aparece en las dos primeras columnas,

que puede convertirse en una serie de clases y frecuencias, con:
X f(X)
1 1
2 2 5 Ls - Li = 19 - 1
3 2 19 - 1 = 18
18/5 = 3.6
5 4 10
6 6
8 4
9 6 20
10 6
11 4
13 4 8

14 4
17 3
18 2 7
19 2
50
∑ fx = 50
Con ello se puede construir una:
SERIE DE CLASES Y FRECUENCIAS RELAT IVAS

(GRUPOS PEQUEÑOS)
Clases F F Relativa (%) PM
de 1 a 4.6 5 5/50*100 = 10 2.8

de más de 4.6 a 8.2 14 14/50*100 = 28 6.4
de más de 8.2 a 11.8 16 16/50*100 = 32 10.0
de más de 11.8 a 15.4 8 8/50*100 = 16 13.6
de más de 15.4 a 19 7 7/50*100 = 14 17.2
50 50/50*100 = 100
Las frecuencias relativas son muy importantes en economía por que

permiten conocer la ponderación o importancia de los datos comprendidos en
cada clase, además de que constituye la base o introducción de la probabilidad
en el análisis económico.

Polígono de Frecuencias Relativas Cuya Área

Bajo la Curva es 100%
20
Frecuencias Relativas
15
10
0
1 2 3 4 5
1 2.8 4.6 6.4 8.2 10 11.8 13.6 15.4 17.2 19
Observación: La curva tiende a ser simétrica o normal aún con pocos datos. La
identificación de esta característica es muy importante, ya que permite aplicar
más métodos estadísticos al análisis de un mismo fenómeno económico, como se
verá posteriormente, haciendo o corroborando que la estadística es un apoyo
significativo para estudiar el comportamiento y caracterización de los fenómenos
económicos.
II.3 ANÁLIS IS DE LAS DIS TRIBUCIONES DE FRECUENCIAS (2)
El ordenamiento o clasificación de las edades de los niños en una tabla de

frecuencias así como su correspondiente representación gráfica permiten deducir
ciertas características de la distribución, dentro de las cuales destacan las
siguientes: Los términos (en este caso las edades) difieren, esto es, son
diferentes y su grado de dispersión o variación quedó de manifiesto cuando se
calculó la amplitud de la distribución. Por otra parte, al elaborar la serie de clases
y frecuencias se conoció la clase con mayor número de frecuencias, es decir la que
comprende el mayor número de edades de los niños.
Estas características son comunes a todas las distribuciones, no importa el

área de investigación de donde provengan, siempre habrá una concentración
máxima de términos, y éstas habrán de mostrar variaciones, algunas veces
pequeñas y otras veces variaciones significativas.
Para la cuantificación de estas características y distinguir unas

distribuciones de otras, existen ciertos métodos estadísticos que permiten

analizar con una base científica el comportamiento de los términos en la

distribución.
Los principales métodos usados para tal propósito son: Las de tendencia
central para medir la acumulación o concentración alrededor de cierto valor, y las
medidas de dispersión que sirven para medir la variación de los términos con
respecto a una medida de la tenencia central.
II.3.1 MEDIDAS DE TENDENCIA CENTRAL
Sabiendo que un cuadro estadístico nos representa cómo están clasificados

los elementos de una población y que a su representación gráfica le llamamos
polígono de frecuencias, comprobamos que hay valores que se presentan más
seguido y otros que ocurren con menos frecuencia, entonces los valores más
característicos o de máxima frecuencia están por lo general en la parte central de
las distribuciones. Es por ello que se dicen medidas de tendencia central, para
identificar estos valores que pueden calcularse, con el fin de caracterizar la
distribución de frecuencias.
Entre las medidas de tendencia central encontramos que las más usadas
son la media aritmética, la media armónica, la media geométrica, la mediana y la
moda.
II.3.1.1 LA MEDIA ARITMÉTICA ( X )(3)
Se define como un valor medio tal, que si a cada término se le da ese valor,
resulta una suma igual a la de los valores de los términos de la sucesión dada.
Ejemplo (13) Sean los términos 1,5,2,9,7,8,5,3; como puede observarse
son términos no agrupados.
Por definición, la media o promedio aritmético, es igual a 5 comprobando

podemos obtener las siguientes expresiones:
1+5+2+9+7+8+5+3 = 40
5+5+5+5+5+5+5+5 = 40
M ás generalmente:

Sea la sucesión cuyos términos son:

x1,x2,x3......xn.
Designando con X a la media aritmética obtenemos:
x + x + x + x + x + ... + x = x1 + x 2 + x3 + ...xn
Por lo tanto: para una serie simple:
nx = x1 + x2 + ... + xn
n
∑ xi
Despejando la x , queda de la siguiente forma: x= i =1
x1 + x2 + x3 + ... + xn
x= donde i= 1,2,3,...,n
n
Conforme a esto podemos definir también a la media aritmética de una

sucesión como el valor medio que resulta sumando los términos de la sucesión y
dividiéndolos entre el número de ellos. Con base a esta definición podemos
obtener las medias aritméticas de una sucesión de frecuencias clasificadas.
Para una sucesión de frecuencias la media aritmética está dada por:
∑ xiF
x= i =1
N
Para una serie de clases y frecuencias:
∑ ( P . M.)F
i =1
x=
N
donde P. M . nos indica el punto medio del intervalo de la clase.
PROPIEDADES DE LA MEDIA ARITMÉTICA.

1. La suma algebraica de las desviaciones de un conjunto de términos con

respecto a su media aritmética es igual a cero.
Demostración
∑ (xi − x ) = ∑ xi − ∑ x = ∑ xi − nx = nx − nx = 0
sean los términos 8, 3, 5, 10, 12.
Calculando su media X =
∑ xi = 38 = 7.6
n 5
Desviaciones = (8-7.6) + (3-7.6) + (5-7.6) + (10-7.6) + (12-7.6)= 0

= 0.4-4.6-2.6+2.4+4.4= 0
2. La suma de los cuadrados de las desviaciones de un conjunto de términos xi de

cualquier número A, es un mínimo si y sólo si
_
A = x.
Demostración.
∑ (xi − A) 2
= Q( X 1 , X 2 ,... X n ; A )
Tomando la derivada parcial de Q respecto a A se tiene:
∂Q
= −2∑ [( xi − A)] = − 2[∑ xi − nA];
∂A
1
∑ xi − nA = 0 → A = n ∑ xi = x
Esta expresión tiene un mínimo ⇔ A = x

Ejemplo: sean los términos 3, 4, 6, 8, 7.
28
x= ∴ x = 56
.
5
Cuando A < x A=5

Tenemos (3-5) + (4-5)2 + (6-5)2 + (8-5)2 + (7-5)2
2

= 4 + 1 + 1 + 9 + 4 = 19
Cuando A > x A = 6
Tenemos (3 - 6)2 + (4 - 6)2 + (6 - 6)2 + (7 - 6)2
= 9 + 4 + 0+ 1 = 18
Cuando A = x A = 5.6
(3-5.6)2 + (4-5.6)2 + (6-5.6)2 + (8-5.6)2 + (7-5.6)2 =
(-2.6)2+ (-1.6)2 + (0.4)2 + (2.4)2 + (1.4)2 =
6.76 + 2.56 + 0.16 + 5.76 + 1.96 = 17.20 l.q.q.d.
3. El promedio aritmético por el número de términos es igual a la suma de los

valores de los términos.
Demostración.
1
n∑
Como x = xi → nx = ∑ xi
nx = x1 + x 2 + ...+ x n
Si los términos de la serie son: 3, 5, 6, 4, 2.
20
x= =4 n=5
5
Tendremos: 4(5) = 3 + 5 +6 + 4 + 2
20 = 20 1.q.q.d.
Ventajas de la media aritmética.
1. Su cálculo es sencillo.
2. Con su valor y el número de términos se puede calcular la suma de los valores
de los términos.
3. Puede calcularse conociendo solamente la suma y el número de los términos de
la serie.
Desventajas de la media aritmética.
1. Hay ocasiones en que un término que mide una modalidad anormal del
fenómeno influye en el promedio y puede ser que este no refleje la realidad.

2. Puede darse el caso de que el valor de la media para dos más series distintas
sea el mismo.
Comparación de los métodos de calculo abreviado y largo de la media.
S erie S imple
Con el método abreviado Con el método largo
x = A+
∑ ( xi − A ) x=
∑ xi
N N
Donde: A = media supuesta arbitrariamente

xi-A = desviación de cada término respecto a A
N = número de términos
xi = término i-ésimo
Ejemplo numérico de una serie simple
xi xi-A Si A=4 entonces x = A +

∑ ( xi − A )
N
5
3 -1 = 4+
4
5 1 = 4 + 1.25
6 2 = 5.25
7 5
21 5
M étodo directo o largo: x =

∑ xi = 21 = 5.25 = x
N 4
S erie de Frecuencias
Xi Fi Xi-A Fi(Xi-A) Xifi
3 8 0 0 24
5 6 2 12 30
6 2 3 6 12
7 3 4 12 21
19 9 30 87

M étodo abreviado M étodo directo o largo
X =A+
∑ Fi ( Xi − A ) x=
∑ Xifi
∑ fi ∑ fi
Con A = 3
30 87
X =3+ = 4.8 X= = 4.57
19 19
S erie de Clases y Frecuencias
Clases Fi PMi PMi-A Fi (PMi-A) FiPMi
0 y menos de 2 1 1 -4 -4 1
2 y menos de 4 3 3 -2 -6 9
4 y menos de 6 5 5 0 0 25
6 y menos de 8 7 7 2 14 49
16 16 -4 4 84
M étodo directo ó largo
X =A+
∑ Fi ( P * Mi − A ) x=
∑ ( fi * PMi )
∑ fi ∑ fi
Con A = 5
84
4 X= = 5.25
X =5+ = 5.25 16
16

II.3.1.2 MEDIANA (Md)
Se define como el valor central que divide una distribución de modo que
quede de cada lado de ella un número igual de términos ordenados, éstos en
orden creciente ó decreciente.
Para obtener la M d. a partir de una serie de clases y frecuencias se usa la

fórmula:
N
−C
Md = Li + 2 ( i)
Fi
donde:
M d.=M ediana
Li = Límite inferior de la clase que contiene a la mediana;

N = Número de términos ó suma de las frecuencias
C = Frecuencia acumulada de la clase anterior a la que contiene la mediana.
Fi = Frecuencia de la clase que tiene a la mediana.
i = Amplitud del intervalo de la clase que contiene la M d.
En el caso de una serie simple, si los datos son:

1, 2, 3, 4, 5
M d. = 3
En el caso de una serie de frecuencias
Xi Fi Fi

Acumulada
2 5 5
3 6 11
4 3 14
5 3 17
Total 17
∑ fi + 1
No. de orden o terminos =
2
17 + 1 18
No= = =9
2 2
Indicando que el termino noveno es el que contiene a la mediana. Para

conocer el valor de la mediana se acumularán las frecuencias hasta encontrar el
número 9 que corresponde al término 3, por consiguiente la M d = 3
Lo anterior se puede comprobar abriendo la serie de frecuencias en una

serie simple, esto es:
2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5
Por definición M d. = 3, puesto que es el término que parte o divide a una
serie o distribución en dos partes iguales.
EJEM PLO SERIE DE CLASES Y FRECUENCIAS
CLASES Pm F Pm*F F-Media Fac.
1 y menos 2 5 10 0.07 5
3
3 y menos 4 2 8 -3.93 7
5
5 y menos 6 4 24 -1.93 11
7
7 y menos 8 4 32 -1.93 15
9

Total 15 74
74
x = = 4.93
15
Así, No= ∑
F + 1 15 + 1
= =8
2 2
Acumulado Fi se observa que M d. por consiguiente será

15
−7
Md . = 5 + 2 ( 2)
4
7.5 − 7
Md . = 5 + ( 2)
4
M d = 5 + 0.25(2) = 5 + .25 = 5.25

M d = 5.25

Obtención de la Md. por el método gráfico.

Se obtiene a partir de la ojiva, ordenando los datos en base a "menor de"
"mayor de" o "más de". Si ordenamos los datos con base a "menor de"
obtenemos lo siguiente:
Clase F Acumulado
Menos de 1 0
Menos de 3 5
Menos de 5 7
Menos de 7 11
Menos de 9 15
Ojiva
16
15
(9,15)
14
13
F
A 12 (7,11)
r
e c 11
u 10
c
m 9 (5.25,8)
u
u 8
e
l 7
n
a 6
c (5,7)
d 5
i
a 4
a
3 (3,5)
2
1
(1,0)
1 2 3 4 5 Md 6 7 8 9 10 11
Clases
M d = 5.25

8 es el término que contiene a la mediana, en torno al cual bajamos una

línea que cruza el eje de las abscisas en el punto M d = 5.25.
II.3.1.3 MODA (Mo)
Se define como el valor de máxima frecuencia o dicho en otras palabras, la

moda es el término que más aparece o se repite en una distribución.
Ejemplo:
En una serie Simple :
Datos: 1, 2, 2, 2, 3, 4.
M o = 2 porque es el término que más se repite.
Serie de frecuencias
X F
10 6
11 40
12 2
13 1
M o=11 porque es el término que más aparece, en este caso 40 veces.
Serie de Clase y Frecuencias :
CLASES F
1 y menos de 3 5
3 y menos de 5 2
5 y menos de 7 4
7 y menos de 9 4

Total 15
Partiendo de la definición de M o, se observa que M o está contenida en la

clase "1 y menos de 3". Su valor exacto se determina con la fórmula de
interpolación.
d1
Mo. = Li + ( i)
d1 + d 2
donde:
Li = Límite inferior de la clase que contiene a M o.
d1= fm - f1
d2= fm - f2
fm= frecuencia de la clase que contiene a M o.
f1= frecuencia de la clase anterior que contiene a la M o.
f2= frecuencia de la clase posterior que contiene a la M o.
i= Amplitud del intervalo.
Luego:
5
Mo. = 1 + ( 2) d1=5-0=5
5+3
10
Mo. = 1 + = 2. 25 d2=5-2=3
8
M o.=2.25
Uno de los procedimientos alternos ó métodos para sacar las M odas es

ver que la frecuencia que le anteceden sea menor y la que le siga también. Este
procedimiento se aplica cuando el investigador desea identificar los valores más
representativos de un arreglo numérico.
Ejemplo:
Xi Fi
2 1
3 10

4 3
5 4
6 7
7 2
8 3
9 1
M o. = 3 M o. = 6 M o. = 8
En este caso se obtiene una situación multimodal, que, se reitera, en algunas
situaciones es útil conocerla.
RELACIÓN ENTRE LA MEDIA ARITMÉTICA,LA MODA Y LA MEDIANA
(7)
Expresaremos esta relación en función de su calidad como estimadores de los

datos, observaciones o mediciones de una distribución determinada, la cual se
gesta y expresa deacuerdo con los criterios matemático y empírico que
utilicemos. Primero describiremos el criterio matemáticoy la forma en que es
satisfecho por cada una de estas tres medidas de tendencia central y,
posteriormente,veremos cómo sus valores difieren sistemáticamente entre si
debido a varios tipos de distribuciones de mediciones.
Así, decimos que el criterio matemático de un “buen promedio “ que satisface la
moda se expresa como Ne= mín, el que podemos interpretar así: cuando
usamos la moda como el mejor estimador del valor de cada medición en una
distribución de mediciones, el número (N) de errores (e) es un mínimo. En otras
palabras, se dice que la medida de tendencia central que produce el menor número
de errores, cuando se usa como el mejor estimador de cada medición en un grupo
o distribución de mediciones u observaciones, es la moda.
Por otra parte, si tomamos en cuenta la magnitud de cada error dentro del
criterio matemático, si denominamos a “e” como la cantidad del error sin
considerar su dirección o signo aritmético, y si deseamos minimizar la suma de
errores en que se incurre al estimar el valor de cada medición u observación, el
criterio matemático se expresa como Σe= mín, que solo la mediana lo
satisface. Lo anteror significa que si usaramos otra medida de tendencia central
para estimar cada estimación, la suma aritmética de los valores absolutos de los
errores sería mayor que la suma de los errores obtenidos cuando usamos la
mediana como estimador.

Ahora bien el tercer gran criterio que deben satisfacer los estimadores al
utilizarlos, es que la suma de errores al cuadrado sea un mínimo, que por
cierto, como ya vimos en páginas anteriores, solo lo satisface la media
aritmética; se representa por Σe 2 = mínimo, que es muy importante en el
análisis estadístico, en especial en el análisis de regresión ( relación de asociación
o de causalidad ), campo en el que se le conoce como el criterio de “mínimos
cuadrados” .
Al utilizar el criterio empírico, se observa que la media aritmética es la más

afectada por la adición de datos en cualquier extremo de la distribución, que ya
describimos como una desventaja en páginas anteriores. Le sigue la mediana pero
en menor cuantía y, como también vimos, la moda no es afactada por la
incorporación de mas datos a la serie o distribución estadística.
Derivado de lo anterior podemos decir que habrà distribuciones simétricas de

datos, de sesgo positivo y de sesgo negativo, según hacia donde se distribuyan la
mayoría de los datos, que se verà màs adelante con las medidas de asimetría y
kúrtosis. Por el momento digamos que en una distribución simétrica se obtiene
x = Md . = Mo .
Demostración: sea la siguiente distribución de datos:
CLASES Fi PM PM-A F(PM-A)
2 y menos de 4 2 3 -4 -8
4 y menos de 6 3 5 -2 -6
6 y menos de 8 5 7 0 0
8 y menos de 10 3 9 2 6
10 y menos de 12 2 11 4 8
Total 15 0
Verificación:
Si A = 7
∑ fi * ( P . M .− A)
X = A+
∑ fi
0
X = A+ = 7; X = 7
15

N
−C
Md . = L + 2 (i )
fi
15
−5
Md . = 6 + 2 (2 ) = 7
5
M d.=7
d1
Mo. = Li + ( i)
d1 + d 2
2
Mo.= 6 + ( 2) = 7
2+ 2
Mo. = Md . = x

Histograma y Poligono de frecuencias de una distribución simétrica

donde: X = Md . = Mo.
histograma
X = Md. = Mo. = 7
Podemos concluir diciendo que la relación entre estas tres medidas de tendencia
central es indicativa de la dirección y extensión del alejamiento de los datos de la
distribución, de la simetría.
Con base en lo anterior podemos preguntarnos, entonces ¿ cúal de las tres

representa el mejor promedio? La respuesta dependerá de si, o no, la distribución
está sesgada, así como del uso que pretendamos darle al promedio.
II.3.1.4 MEDIA GEOMETRICA ( Mg )
Definición: Es un valor tal, que multiplicado ese valor tantas veces como
el número de términos, resulta un producto igual al producto de los valores de los
términos de la serie dada.
Si los términos de la serie dada son: x1 , x 2 ,... x n , aplicando la propiedad
apuntada antes, resulta la expresión:
Mg. Mg. Mg. Mg.... Mg = x1 , x 2 ,..., xn
Luego Mgn = x1 , x 2 ,... , x n

Despejando Mg = n x1 * x 2 * x3 *...*xn
Igualdad que nos dice: el promedio geométrico de una serie simple es igual
a la raíz que tiene como índice el número de términos, del producto de los valores
de los términos de la serie.
Sea el ejemplo: 3 * 6 * 12 * 24 * 48 =248,832

como Mg = 5 248832.
M g = 12
Por definición : 12 * 12 * 12* 12 * 12 = 248,832
También 3 * 6 *12 * 24 * 48 = 248.832 = 125 = M gn.
Ahora bien, si sabemos que:
Mg = n x1 * x 2 * x3 *...*xn
elevando a la potencia " n " ambos miembros
Mgn = x1 , x 2 ,... , x n
Tomando logaritmo n *log( Mg ) = log x1 + log x2 + ...+ log x n
luego: log( Mg) = ∑

log xi
,fórmula usual para el cálculo del promedio geométrico.
n
Ejemplo de su cálculo en una serie simple
log( Mg) =
∑ log xi
n
SERIE SIM PLE
Xi LogXi
1 0.00000
20 1.30103
7 0.84510
30 1.47712
18 1.25527
4.87852

Sustituyendo
Log M g = 4.87852/5 = 0.975704
Log M g = 0.975704
Antilog de 0.975704 = 9.0303
Luego M g. = 9.0303
Generalizando podemos decir que su cálculo es el siguiente:
Para una serie de frecuencias.
log Mg =
∑ fi * log xi
∑ fi
Para una serie de clases y frecuencias :
log Mg =
∑ fi * log P .M .
∑ fi
Para fines prácticos es preferible calcular el logaritmo de la
media geométrica y luego el antilogaritmo de ésta.
Cálculo de M g
En una SERIE DE FRECUENCIAS.
Xi Fi Log Xi Fi LogXi
12 3 1.0792 3.2375
10 6 1.0000 6.0000
15 9 1.1761 10.5848
20 12 1.3010 15.6124
22 7 1.3424 9.3970
37 44.8317
log Mg =
∑ fi * log xi
∑ fi
448313
.
log Mg = = 12116567
.
37

Antilog.de1.2116567=16.28
M g =16.28
En una serie de clases y frecuencias
CLASES Fi PM Log PM Fi LogPM
de 10 a menos de 20 5 15 1.1761 5.8805

de 20 a menos de 30 6 25 1.3979 8.3876
de 30 a menos de 40 7 35 1.5441 10.8085
de 40 a menos de 50 8 45 1.6532 13.2257
Total 26 38.3023
log Mg =
∑ fi * log P .M .
∑ fi
383022
.
log Mg = = 14731615
.
26
Antilogaritmo de 1.4731615 = 29.72
M g.= 29.72
Nota : M g. es conveniente utilizarla cuando se manejan grandes números.
II.3.1.5 MEDIA ARMONICA (Ma).
Se define como el recíproco de la media aritmética de los valores

recíprocos de la variable.
Es un número tal que la suma de las relaciones entre él y cada término es

igual al número de términos de la serie.*

La M edia Armónica es igual al número de sus términos divididos entre la

sumas de los recíprocos de ellos.
n
Ma =
1
∑ xi
donde:
n = número de observaciones
xi = Observaciones i-ésima .
Por consiguiente su cálculo se efectúa de la siguiente manera:
SERIE SIM PLE
Sean los cinco términos de la serie : 1, 2, 3, 4, 5

n 5
Ma = = = 2.192
1
∑ xi
2.28
1
Xi Xi
1 1.0
2 0.5
3 0.3
4 0.3
5 0.2
15 2.28
* Aplicando la propiedad tenemos :

2192
.
= 219
.
1
2192
.
= 1092
.
2
2192
.
= 0730
.
3
2192
.
= 0548
.
4
2192
.
= 0434
.
5
5=5 términos
SERIE DE FRECUENCIAS
Xi Fi 1/Xi Fi*(1/Xi)
3 1 0.33 0.33
4 2 0.25 0.50
2 3 0.50 1.50
5 4 0.20 0.80
Total 10 3.13
Ma =
∑ fi = ∑ fi
1 fi
∑ xi f ∑ xi
10
Ma = = 31948
.
313
.
SERIE DE CLASES Y FRECUENCIAS
CLASES Fi PM Fi/Pm

1a2 2 1.5 1.33

de más de 2 a 4 3 3 1.00
de más de 4 a 6 4 5 0.80
de más de 6 a 8 1 7 0.14
10 3.27
Ma =
∑ fi o ∑ fi
fi 1
∑ P .M . ∑ P .M . fi
10
Ma = = 3.08
3.24
NOTA: M a. es conveniente aplicarlo en tasas de crecimiento, cuando manejamos

fenómenos como la velocidad, es decir con un crecimiento gradual.
II.3.1.6. RELACIÓN ENTRE LAS MEDIDAS DE TENDENCIA

CENTRAL(4)
Representan valores centrales que se les designa como promedios y son

de extraordinaria utilidad tanto en el análisis de una distribución como en la
comparación entre distribuciones.
Una vez conseguida la clasificación de los datos originales cuyas
características más esenciales se destacan, será preciso calcular en conjunto de
indicadores que caractericen en forma algo más precisa la distribución que se está
efectuando.
Se necesita disponer de medidas que representen valores centrales en

torno de los cuales se agrupan las observaciones, en general se les designa como
promedios.
1.- Distribución Simétrica

X = Mo = Md

0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
0
2
X = Mo = Md
2.- Distribución Asimétrica

Mo < Md < X
SESGO POSITIVO
X < Md < Mo

SESGO NEGATIVO
3.-Otra relación muy importante es:

X > M g > M a.

II.3.I.7 PRACTICAS NÚMERO I,II y III
PRÁCTICA I
Nombre:__________________________________________Grupo:_________
Problema 1. Construya usted una serie simple con los siguientes datos,
que representan la estatura de 20 estudiantes de la Facultad de Economía.
1.67, 1.72, 1.54, 1.57, 1.61, 1.61, 1.67, 1.54, 1.57, 1.72
1.85, 1.81, 1.54, 1.61, 1.81, 1.67, 1.81, 1.67, 1.61, 1.67
Problema 2. Con los datos siguientes que representan el número de hijos

de 60 familias campesinas, construya una serie de frecuencias.

4 5 8 7 6 7 8 9 14 15
7 9 10 8 6 11 0 10 1 3
12 16 12 1 15 15 4 13 0 6
2 3 4 5 16 5 11 6 9 12
9 13 6 10 18 4 14 8 9 13
11 6 8 12 4 20 17 10 7 6
a) En base a estos datos, diga usted cuál es el número de hijos que se presentan
con mayor frecuencia en las familias campesinas y emita su opinión al respecto.
b) Si uno de los objetivos del pasado régimen era el control de la natalidad, y se

pensaba que como resultado de esa campaña, el promedio de hijos entre las
familias sería menos de 5, en base a los datos anteriores que, porcentaje de ellas
no cumplieron con el objetivo y explique a qué conclusiones les lleva este
análisis.
PRÁCTICA II
Problema 1. Los accidentes de trabajo ocurridos en 60 fábricas de la zona
industrial de Tlalnepantla en 1998, están dados en el siguiente cuadro.
No. de Accidentes No. Fabricas
0 a 4 3
5 a 9 6
10 a 14 15

15 a 19 12
20 a 24 10
25 a 29 9
30 a 34 5
60
a) Calcule usted la media aritmética, la media geométrica y la media armónica e
interprete cada uno de estos resultados, asimismo explique la relación que existe
entre ellas.
b) Si en la zona industrial de Tlalnepantla existen 1350 fábricas cuantos

accidentes ocurrieron allí durante 1998.
c) Si tomamos esta distribución como un fiel reflejo de la situación que impera

en el país en la actualidad, en la gran mayoría de las industrias, ¿cual debería de
ser la política del Estado en este renglón y porqué?
Problema 2.- Para poder garantizar la duración de una determinada marca

de llantas, se realizó una investigación en 100 llantas, con los kilómetros
recorridos y se obtuvieron los siguientes datos.
Miles de No. de
kilómetros llantas
de + 25 a 30 18
de + 30 a 35 12
de + 35 a 40 35
de + 40 a 45 20
de + 45 a 50 15
100
a) Determine gráficamente la mediana, por medio de método gráfico de la ojiva

b) Calcule el valor de la mediana y la moda y explique sus resultados.
c) Si el lema de la marca llantera era garantizarlas por mas de 40,000 km, que
porcentaje de la producción no cumple ese requisito.

PRÁCTICA III.
Problema 1.- Las estaturas de un grupo de 40 estudiantes de una escuela

secundaria fueron las siguientes.
1.38 1.64 1.50 1.32 1.44 1.25 1.49 1.57
1.46 1.58 1.40 1.47 1.36 1.48 1.52 1.44
1.68 1.26 1.38 1.76 1.63 1.19 1.54 1.65
1.46 1.73 1.42 1.47 1.35 1.53 1.40 1.35
1.61 1.45 1.35 1.42 1.50 1.56 1.45 1.28
PREGUNTAS
a) Ordene los datos anteriores en una serie de clases y frecuencias, de acuerdo al
método de Sturges.
b) Construya usted el histograma y el polígono de frecuencias correspondientes.
c) Calcule la media aritmética, la mediana y la moda, explicando la relación

que existe entre estos valores.
PROBLEM A 2 .- De un estudio realizado por la Secretaría de la Reforma

Agraria, se obtuvieron los siguientes datos, relacionados con el número de
hectáreas que concentra cada agricultor en una zona del país.
Hectáreas No. de Agricultores
'0-2 6
3-5 10
6-8 14
9-11 6
12-14 4
15-17 2
18-20 8
50

PREGUNTAS.
a) En base a estos datos, explique y compruebe la primera y la segunda

propiedad de la media aritmética.
b) Determine gráficamente y numéricamente si esta es una distribución

simétrica, calculando su media aritmética y trazando el polígono de
frecuencias.

II.3.2 MEDIDAS DE DIS PERS IÓN(4)
Varias distribuciones pueden tener iguales medidas de posición pero con

diferentes grados de dispersión.
Como por ejemplo: en las distribuciones siguientes todas tienen la media
y la mediana igual a 5, pero con diferentes composiciones.
A: 0, 0, 1, 2, 5, 8, 9, 10, 10
B: 2, 3, 3, 4, 5, 5, 5, 6, 7, 7,
8
C: 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
5, 5
Como se ve la distribución A presenta un grado más alto de variaciones,

mientras la C es la más homogénea por no haber variabilidad de los datos. Para
medir esta dispersión de los términos con respecto a una medida de tendencia
central (que generalmente es x ) se aplican las medidas de dispersión que son las
siguientes:
II.3.2.1 RANGO: La medida de dispersión más sencilla es el campo de variación

del Rango, definida como la diferencia entre el mayor y el menor de los valores
observados
El Rango también lo podemos encontrar con el nombre de Recorrido u
otro nombre, según el autor.
El Rango o Recorrido no refleja en modo alguno la forma de la
distribución.
Ejemplo: datos: 2, 3, 4, 5, 6, 7, 8, 9
Rango = Valor máximo - valor mínimo de la serie.
Rango = 9 - 2 = 7
II.3.2.2 DES VIACION MEDIA: Se define como la suma de las desviaciones en

términos absolutos de los datos que integran la serie, respecto a la media, entre
el número de términos de la serie.
D. M .=
∑ xi − x Serie simple
n

D. M .=
∑ fi xi − x Serie de frecuencias
∑ fi
D. M . =
∑ fi P .M .−x Serie de clases y frecuencias
∑ fi
Ejemplo: la temperatura en ciertos días del mes de mayo, expresada en
grados centígrados fué:
_
X1 | X1 - X |
22 2
23 1
23 1
24 0
25 1
26 2
27 3
170 10
i = 22, 23, ..., 27
170
x = = 24 o
7
D. M .=
∑ x1 − x
n
10
D. M . = = 142
. o
7
Primero se calcula X para después desviar con respecto a ella el valor de los
términos de la serie, en este caso las temperaturas observadas durante el mes de
mayo.
Interpretación: de conformidad con el rango, la temperatura fluctúo entre

22 y 27 grados centígrados; con base en la desviación media, la temperatura
media fué de 24 grados centígrados y tuvo una variación media de 1.42 grados
durante el mes.
Serie de frecuencias
_
Fi | Xi - X |

15
6
4
7
2
2
4
40
_ _
| X1 - X | Fi XiFi Fi | X1 - X |
3 5 120 15
2 4 102 6
2 2 46 4
1 7 168 7
0 8 200 2
1 2 52 2
2 2 54 4
30 742 40
x =
∑ x i fi D. M .=
∑ fi x − x
1
∑ fi ∑ fi
742 40
x = = 25 D. M . = = 133
. o
30 30
S erie de clases y frecuencias
Cuando los datos aparecen ya ordenados o agrupados en una serie de

clases y frecuencias, las fórmulas que se deben aplicar serán:
x =
∑ P . M. * f i
∑ fi
D. M . =
∑ fi P .M .−x
∑ fi

Temperatura en _
Intervalos Fi PM Fi PM | PM - X |
22 y menos de 24 5 23 115 -3
24 y menos de 26 9 25 225 -1
26 y menos de 28 10 27 270 1
28 y menos de 30 6 29 174 3
30 784 0
_
Fi | PM - X |
15
9
10
18
52
784 52
x = = 26o D. M . = = 173
. o
30 30
Interpretación: independientemente de que la información aparezca

ordenada en una serie simple, de frecuencias o de clases y frecuencias, como los
datos son los mismos, la desviación media nos permite verificar que la
temperatura no varió mucho en el mes de mayo, ya que en promedio fué de 26
grados, cuando los datos provenían de una serie de clases y frecuencias y sin
embargo, durante los 30 días del mes, en promedio se observo una variación o
dispersión de 1.73 grados con respecto a los 26 grados centígrados.
Es muy importante recordar que la serie de clases y frecuencias da

resultados de menor exactitud que la simple y la de frecuencias, ya que maneja

los puntos medios como valores sustitutos de los valores originales de la

serie.
II.3.2.3 DES VIACIÓN ES TÁNDAR (σ)
Es la raíz cuadrada positiva de las desviaciones al cuadrado de los valores

observados, respecto a la media aritmética; indica el grado de desviación que
tienen los términos de la serie con respecto a su media aritmética. Para una serie
simple se calcula así:
Xi δ a = Xi - X δa 2
1 -9 81
2 -8 64
5 -5 25
9 -1 1
11 1 1
13 3 9
14 4 16
25 15 225
80 0 422
X =
∑ x = 80 = 10
n 8
si δ: desviación con respecto ó x, tenemos

δ a2 422
σ= = = 52.75, σ = 7.26
n 8

M ÉTODO DIRECTO PARA UNA SERIE DE FRECUENCIAS.
Xi Fi Xf δa δa 2 δa 2Fi
1 9 9 -1.87 3.50 31.50

2 15 30 -0.87 0.76 11.40
3 29 87 0.13 0.02 0.58
4 10 40 1.13 1.28 12.80
5 7 35 2.13 4.54 31.78
70 201 88.06
X =
∑ xifi = 201 = 287
.
∑ fi 70
σ=
∑ δ fi2
a
∑ fi
88.06
σ= = 11
.
70
SERIE DE CLASES Y FRECUENCIAS

M ETODO ABREVIADO
Definiendo δa como desviación arbitraria xi como amplitud del intervalo
Intervalos de clase Fi δa δaf δa2 δa2Fi
De 1.0 a 1.5 inclusive 2 -3 -6 9 18

de más de 1.5 a 2.0 5 -2 -10 4 20
de más de 2.0 a 2.5 12 -1 -12 1 12
de más de 2.5 a 3.0 28 0 0 0 0
de más de 3.0 a 3.5 20 1 20 1 20
de más de 3.5 a 4.0 14 2 28 4 56
de más de 4.0 a 4.5 3 3 9 9 27
de más de 4.5 a 5.0 1 4 4 16 16
85 33 169

σ =i
n(∑ δa F ) − ( ∑δaf )
2 2
= 0.5
85(169) − (33) 2
= 05
.
14365 − 1089
= 05
.
13276
= 05 . = 0.680
. * 136
n( n − 1) 85(85 − 1) 85(84) 7140
CON EL M ÉTODO DIRECTO σ SE CALCULA ASÍ

_ _ _
(PM-X) (PM-X)2F
2
Intervalos de Clase F PM PMF PM-X
De 1.0 a 1.5 2 1.25 2.5 -1.69 2.86 5.71

inclusive
de más de 1.5 a 2.0 5 1.75 8.75 -1.19 1.42 7.08
de más de 2.0 a 2.5 12 2.25 27 -0.69 0.48 5.71
de más de 2.5 a 3.0 28 2.75 77 -0.19 0.04 1.01
de más de 3.0 a 3.5 20 3.25 65 0.31 0.10 1.92
de más de 3.5 a 4.0 14 3.75 52.5 0.81 0.66 9.19
de más de 4.0 a 4.5 3 4.25 12.75 1.31 1.72 5.15
de más de 4.5 a 5.0 1 4.75 4.75 1.81 3.28 3.28
85 250.25 39.05
Teniendo los datos agrupados en clases y frecuencias, se procede a

obtener la medida aritmética de ellos.
Como se recordar, la fórmula de la media aritmética viene dada por
X =
∑ P . M. f
∑f
250.25
X =
85
X = 2.94
Después se procede a desviar el punto medio con respecto a la media

( PM − X ) .
Se eleva al cuadrado y multiplicamos por su frecuencia respectiva,

llegando a la fórmula de la desviación estándar:
σ=
∑ ( P.M . − X ) fi = 39.38
2
∑ fi GENARO85SÁNCHEZ BARAJAS
PROFESOR: 61
El resultado es el mismo que el obtenido con el método abreviado:
II.3.2.4 VARIANZA
Se define como el cuadrado de la desviación estándar
σ 2
=
∑ ( Xi − X ) = ∑ xi
2 2
− X2 para una serie simple.

N N
σ2=
∑ fi( Xi − X )
2
para una serie de frecuencias.

∑ fi
σ 2
=
∑ fi( P .M .−X ) 2
para una serie de clases y de frecuencias.

∑ fi
II.3.2.5 COEFICIENTE DE VARIABILIDAD (C.V.).
Se define como la razón porcentual entre la desviación estándar y la

media aritmética, es decir.
σ
C .V . = * 100
X
La razón es conveniente multiplicarla por 100 para expresarla en términos
de % .
Se dice que cuando C.V. toma valores alrededor del 10% se acepta X
como medida central representativa de los datos de un fenómeno bajo estudio;
cuando C.V. es mayor a 10%, se debe optar por otra medida de tendencia central
para representar el promedio de los datos del fenómeno bajo estudio.
Ejercicios
Con los siguientes datos:
15,11, 10,18, 17, 14, 14,15, 16,13

12,12, 9,11,14,16,15,14,13, 10
13,12,10,12,14,16,15,17,13,10
14,11,11,13,14,16,15,17,13,10
15,11,14,14,14,16,15,17,13,10
obtenga:
1.- Una serie de clases y frecuencias con el métodode Sturges;

2.- la relación de la media aritmética con la media geométrica y la moda;

3.- Las dos propiedades de la media aritmética, es decir, “suma cero y mínimo “.
4.- la varianza y desviación estándar;
5.- El coeficiente de variación con su interpretación correspondiente.
Respuestas
1.- La fórmula de Sturges:
i = oscilación / 1+3.32 log n ; donde n = 50 y oscilación es la diferencia en

valores absolutos que existe entre el dato de mayor valor y el dato de menos
valor.
Así:
I = 18-9/1 + 3.32( 1.6990 ) = 9/ 1+ 5.64 = 9/ 6.64 = 1.36 redondeando a 1.4
Clases fi P Mi fiP Mi logP Mi logP Mifi

De 9 a 10.4 7 9.7 67.9 0.9542 6.6794
De + de 10.4 a 5 11.1 55.5 1.0453 5.2265
11.8
De + de 11.8 a 11 12.5 137.5 1.0969 12.0659
13.2
De + de 13.2 a 10 13.9 139.0 1.1430 11.4300
14.6
De + de 14.6 a 12 15.3 183.6 1.1847 14.2164
16.0
De + de 16.0 a 4 16.7 66.8 1.2227 4.8908
17.4
De + de 17.4 a 1 18.1 18.1 1.2577 1.2577
18.8
Total 50 668.4 55.7667
Respuesta 2
−
X = Σ fi(PM i) / Σ fi = 668.4/50 = 13.368, redondeado a 13.36
logM g = Σ (logPM i)fi/ Σ fi = 55.7667/50 = 1.115334; su antilogaritmo = 13.04

luego Mg = 13.04
Moda = Li + [d1 / d1 + d 2] (i)= 14.6 + [12 − 10 / 2 + (12 − 4)] (1.4) =14.6+
[2 / 2 + 8](1.4) = 14.6 + 2.8/10 = 14.88
−
Luego M oda = 14.88 mayor que X = 13.36 mayor que M g = 13.04

Respuesta 3
−
3a. Primera propiedad: Σ ( PM i- x )fi = 0
− − − −
( PMi - x ) ( PMi - x )fi ( PMI − x )2 ( PMi − x )2 fi
9.7-13.36=-3.66 -3.66(7)= -25.62 13.3956 93.7692
11.1-13.36=-2.26 -2.26(5)=-11.30 5.1076 25.5380
12.5-13.36=-0.86 -0.86(11)=-9.46 0.7396 8.1323
13.9-13.36=0.54 0.54(10)= 5.40 0.2916 2.9160
15.3-13.36=1.94 1.94(12)=23.28 3.7636 45.1632
16.7-13.36=3.34 3.34(4)=13.36 11.1556 44.6224
18.1-13.36=4.74 4.74(1)=4.74 22.4676 22.4676
Total 0.00 242.6087
−
3b.- Segunda propiedad: Σ (PM i- x )2fi= M INIM O=242.6087
Respuesta 4a: la varianza y desviación estándar

−
σ 2
= Σ (PMi- x )2fi / Σ fi= 242.6087/50= 4.852174
σ = 4.852174 = 2.20
Respuesta 5a: Coeficiente de variación,CV.
−
CV= σ / x *100 = 2.20/13.36*100 = 16.5%
Interpetación:hay una variación significativa que supera el 10% recomendable,

entre los valores de los términos Xi, que se expresa en la alta proporción de la
desviación estándar con respecto a la media aritmética; se recomienda cambiar de
medida de tendencia central a otra, digamos, la mediana, la moda, etc.

II.3.3 MEDIDAS DE POS ICIÓN(1)
II.3.3.1 CUARTILES
.
Los cuartiles son medidas estadísticas de posición que tienen la
propiedad de dividir la serie estadística en cuatro grupos de números iguales de
términos.
De manera similar los deciles dividen a la serie en diez partes iguales y los
percentiles dividen a los términos de la serie en cien grupos iguales.
Así como la mediana divide la serie o distribución en dos partes iguales,

existen tres cuartiles, nueve deciles y noventa y nueve percentiles que dividen
en cuatro, diez y cien partes iguales a la distribución.
De estas tres últimas medidas de posición los cuartiles son las de

mayor aplicación.
Se emplean generalmente en la determinación de estratos o grupos

correspondientes a fenómenos socio-económicos, monetarios o teóricos.
Los tres cuartiles suelen designarse con los símbolos:
Q1 = primer cuartil
Q2 = segundo cuartil
Q3 = tercer cuartil
los deciles por D1, D2, D3,......, D9 y los percentiles con P1, P2, P3, .....,P99.
En cualquiera de los tres casos, la medida de posición seleccionada toma
el valor de uno de los términos o del punto medio entre dos términos.
Para el cálculo de estas tres medidas de posición es necesario arreglar

los términos en forma creciente o decreciente. Así, en el caso de un
ordenamiento simple, el siguiente paso es determinar el "número de orden" de
los cuartiles, deciles o porcentiles, el cual indicará el lugar que ocupen en la
distribución.
En lo que se refiere a los cuartiles, el número de orden del primer cuartil

es igual al número de términos de la distribución más uno, sobre cuatro. Para el
segundo cuartil el número de orden se calculará sumando uno al total de términos
y dividiendolo entre dos.

Así mismo el número de orden del tercer cuartil ser igual a tres cuartos del
número de términos de la distribución más uno.
a) Si se adopta el símbolo No Q para denotar el número de orden, donde: No es el
número de términos y Q el cuartil a calcular, entonces en el ejemplo cuyos
términos son: 3, 4, 5, 7, 8, 10, 11, que es número de términos impar, el número
de orden se calcula así:
N +1 7 +1
NoQ1 = = = 2, el cual indica que el valor del segundo término (4) es el
4 4
valor de Q1, luego Q1 =4
N +1 7 +1
NoQ2 = = = 4, el cual indica que el valor del cuarto término (7) es el
2 2
valor de Q2 , y Q2=7
3( N + 1) 3(7 + 1)
NoQ3 = = = 6, que indica que el valor del sexto término (10) es el
4 4
valor de Q3 , y Q3 = 10
Cuando el número de términos es par como la distribución constituida

por: 3, 4, 5, 7, 9, 10, 11, 14
No + 1 8 + 1
NoQ1 = = = 2.25∴ Q1 = 4.25
4 4
No + 1 8 + 1
NoQ2 = = = 4.5∴ Q1 = 80.
2 2
3(No + 1) 27
NoQ3 = = = 6.75∴ Q 3 = 1075
.
4 4
Como puede observarse el procedimiento empleado en el cálculo del

segundo cuartil es el mismo que se utilizó para calcular la mediana en una serie o
distribución simple, por lo que el valor del segundo cuartil siempre es igual al de
la mediana. Por otra parte, como lo hace notar el Ing. A. García Pérez (15), una
vez obtenido el número de orden del primer cuartil, se puede calcular
inmediatamente los del segundo y tercer cuartil sin recurrir al procedimiento
arriba sugerido, multiplicandolo por dos y tres respectivamente.
b)Cuando los datos estan agrupados en una serie de frecuencias como la siguiente:
EDADES NÚMEROS DE f Acumulada

PERSONAS
(años) (f) millones

1 6 6
4 15 21
8 14 35
14 4 39
39
39 + 1
NoQ1 = = 10∴ Q1 = 4
4
39 + 1
NoQ2 = = 20∴ Q2 = 4
2
3(39 + 1)
NoQ3 = = 30 ∴ Q3 = 8
4
En este ejemplo se observa que el valor de Q1 y Q2 coinciden. Lo cual se

debe a que ambas toman el valor del término (edad) que les señalan sus
respectivos números de orden, que es cuatro para los términos número diez y
veinte.
Por otra parte se verifica que los tres cuartiles dividen a la distribución en
cuatro grupos iguales, en virtud de que a la izquierda del primer cuartil existe el
25% de términos de la distribución; de la misma forma a la izquierda del
segundo cuartil existe el 50% de la distribución y el tercer cuartil revela que a
su izquierda se localiza el 75% de los términos.
c) Por último si los datos se agrupan en clases y frecuencias los cuartiles

se obtienen a través de un proceso un tanto laborioso.
Sea la distribución siguiente:
Tiempo en frecuencia frecuencia

minutos acumulada
de 10 a 20 6 6
De + de 20 a 30 25 31
De + de 30 a 40 32 63
De + de 40 a 50 23 86
De + de 50 a 60 7 93

De + de 60 a 70 4 97
De + de 70 a 80 2 99
99
Gráficamente tendremos:
F Histograma
r
e
40 32
c
u 30 25 23
e
20
n 7
6 4
c 10 2
i 0
a Tiempo en Minutos
99 + 1
NoQ1 = = 25 ,significa que el 25 % de las observaciones se hallan a la
4
izquierda de Q1.
(30 − 20)
Luego Q1 = 20 + * 19 = 27.6 minutos.
25
Donde 19 = 25 - 6 = número de observaciones en la segunda clase pero a

la izquierda del primer cuartil.
Similarmente :
99 + 1 (40 − 30)
NoQ2 = = 50 ∴ Q2 = 30 + * 19 = 3594
. minutos
2 32

Donde 19 = 50 - 31 = número de observaciones en la tercer clase pero a la

izquierda del segundo cuartil.
Igualmente:
3(99 + 1)
NoQ3 = = 75 significa que el 75 % de las observaciones se hallan a la
4
izquierda de Q3.
(50 − 40)
Q3 = 40 + * 12 = 4516
. minutos.
23
Donde 12 = 75 - 63 = número de observaciones en la cuarta clase pero a la

izquierda del tercer cuartil.
II.3.3.2 DES VIACIÓN CUARTIL.
Conocidos los cuartiles se puede calcular la desviación cuartil, la cual mide

la amplitud ó rango existente entre los 50 términos centrales de la distribución.
Es una medida de variación como el rango referida al 50% de las observaciones
contra las demás series.
La desviación cuartil es igual a la mitad del rango comprendido entre el

50% de los términos centrales de la distribución. Numéricamente es la mitad de
la distancia entre el primer y tercer cuartil, que eso también se conoce como
rango semi-cuartil.
Q3 − Q1
Desviación cuartil =
2
Utilizando los datos del último ejemplo:
. − 27.60 1756
4516 .
Desviación cuartil = = = 8.78 minutos.
2 2

II.3.3 PRÁCTICA IV
Nombre______________________________________________Grupo ______
PROBLEM A 1.- La variación de los valores incluídos en una serie de datos es

la llamada dispersión. Los tipos más comunes de dispersión son:
________________________________________________________________
________________________________________________________________
La medida de dispersión que se utiliza para mostrar la variación de los valores

entre el 50% de los elementos centrales se denomina:
_________________________________________________________________
_______________________________________________________________
y las que se usan para medir la variación de los valores alrededor de un

promedio se denominan:
_________________________________________________________________
_________________________________________________________________
________________________ y ____________________________________

_________________________________________________________________
_______________________________________________________________
Al describir una distribución estadística, comúnmente se emplea una

medida de tendencia central para
_________________________________________________________________
_________________________________________________________________
_________ y una medida de dispersión para __________________________
________________________________________________________________
________________________________________________________________
________________________________________________________________
PROBLEM A 2.- Los siguiente valores son los rendimientos por hectárea de
un determinado producto agrícola (en toneladas) en 8 ejidos colectivos de
diferentes regiones del país:
1, 2, 3, 4, 5, 11, 11, 30.
a) Calcule el recorrido o rango

b) Calcule la desviación cuartilica
c) Calcule la desviación media
d) Calcule la desviación estándar y la varianza
e) Calcule el coeficiente de variación
f) Interprete brevemente los resultados obtenidos.
PROBLEM A 3.- Las calificaciones de 80 estudiantes de una clase de

estadística, están dadas en la siguiente tabla:
Calificaciones No. de
estudiantes
20 - 29 3
30 - 39 6
40 - 49 5
50 - 59 7
60 - 69 10
70 - 79 29
80 - 89 12

90 - 99 8
80
a)Calcular la desviación cuartílica

b)Calcular la desviación media
c)Calcular la desviación estándar.

II.3.4 MEDIDAS DE AS IMETRÍA Y KURTOS IS (6)
A las medidas de asimetría como el coeficiente de variación, se les llama

"medidas relativas", las cuales son porcentajes que sólo expresan el grado en que
la distribución se aleja de la media aritmética; las medidas de asimetría, más
comunes son:
II.3.4.1 AS IMETRÍA CON RES PECTO A LA MODA Y LA MEDIANA.

1) Las basadas en el grado de alejamiento que tiene los términos con respecto a
diversas medidas centrales a medida que la distribución se hace asimétrica.
2) Las basadas en el sistema de momentos (A3 ).

En lo que se refiere a las primeras, estas medidas nos indican no sólo el
grado de asimetría de la curva sino también la dirección de la misma. Si su valor
es negativo, la asimetría es hacia la izquierda y si es positiva la asimetría será
hacia la derecha. De (1) usaremos el coeficiente Pearson, como se recordará en
una distribución simétrica la media, moda y mediana, se encuentran en el
mismo punto. Si la distribución es asimétrica, el valor de cada uno de ellos se
localizan en diferentes puntos de la distribución.
Puesto que en una distribución asimétrica el valor de la moda

permanece en lo alto de la curva y el de la media se mueve hacia los extremos
de la distribución, usando el coeficente Pearson tendremos que:
Asimetría = X − M o
σ
Cuando no se conoce la moda o es difícil localizarla, pero se conoce la

mediana, el coeficiente de Pearson será:
Asimetría = 3( X − M d )
σ
II.3.4.2. EL TERCER MOMENTO COMO MEDIDA DE AS IMETRÍA(4)
La medición de la asimetría en este caso se hace a través del sistema

de momentos.
La palabra momentos significa en mecánica la medida de una fuerza en

relación con su tendencia a producir rotación. En estadística se usa dicha

expresión en sentido análogo, considerando los grupos de frecuencias como las

fuerzas en cuestión.
Los momentos pueden ser calculados con respecto al origen y con
respecto a la media aritmética. De acuerdo con esta última y
considerando datos agrupados:
M 1 primer momento = ∑
fx
=0
∑f
Donde:
x' = Xi − X
Es decir x' expresa la diferencia entre los términos de la serie y su media

aritmética correspondiente.
M 2 segundo momento = ∑
fx 2
=σ2
∑f
tercer momento = ∑
3
fx
M3 =0
∑f
cuando es simétrica, y M 3 es diferente de cero cuando no es simétrica.
M k, k ésimo momento = ∑
k
fx
∑f
Para medir la asimetría se usa el tercer momento que se iguala a cero en
una distribución simétrica.
Ejemplo:
DISTRIBUCIONES
Simétrica Asimétrica
Xi X1 X2 X3 Xi X1 X2 X3 X4
2 -3 9 -27 4 -1 1 -1 1
4 -1 1 -1 4 -1 1 -1 1
5 0 0 0 4 -1 1 -1 1
5 0 0 0 4 -1 1 -1 1
6 1 1 1 5 0 0 0 0
8 3 9 27 9 4 16 64 256
30 0 20 0 30 0 20 60 260

30 30
X = =5 X = =5
6 6
M 3 en una distribución simétrica =

∑ xi3
=0 y en una asimétrica = 60 = 10
N 6
Si calculamos σ porque la vamos a necesitar, tenemos que: como

20
σ2= = 3.33 luego σ =1.82
6
M 3 en una distribución asimétrica =

∑ xi3
=
60
= 10
N 6
Sustituyendo estos valores en A3 encontramos que:
M3 10
A3 = 3
= = 16
.
σ . )3
(182
luego la asimetría o dirección de la curva de la distribución es a la derecha,

indicando que la mayor parte de los datos están a la derecha de x .
Curva A Curva B
Sesgada a la Derecha Sesgada a la izquierda

II.3.4.3. KURTOS IS
M4
Se refiere a la forma de la curva, que se obtiene con: A4 =
σ4
La medida de picudéz o kurtosis es alta cuando la curva es picuda o
alargada y es baja cuando es aplanada.
Tomando como referencia el ejemplo numérico anterior, podemos
obtener:
260
M4 = . ; También
= 433 como (σ 2 ) 2 = σ 4 = 1097
.
6
M4 4333
.
Así tenemos que A4 = 4
= = 394
.
σ 10.97
Es conveniente mencionar que estadísticamente el valor de A4 para una curva --

normal o simétrica es 3, ello significa que podemos hacer la siguiente relación.
Una curva será normal o mesocúrtica cuando A4 - 3 = 0

Una curva es platocúrtica cuando A4 - 3 < 0
Una curva es leptocúrtica cuando A4 - 3 > 0

Por consiguiente en el ejemplo hipotético manejado tenemos que A4 =

3.94 luego 3.94 - 3 = 0.94
Interpretación.- Puesto que el resultado es mayor que cero decimos que

la curva tiene una forma alargada o espigada, es decir leptocúrtica.
¿Lo anterior para que sirve en economía, como se interpreta
económicamente?
Para contestar lo anterior pongamos otro ejemplo, digamos que la SHCP
desea revisar las bases y tasas impositivas actuales, para ello utiliza el padrón
de personas constituido por cinco contribuyentes, cuyos ingresos por hora son:
$1, 2, 3,4, 5.
15
Por consiguiente: X = =3
5
Aplicando el (coeficiente de Pearson) 3( X − M d )
=
σ
empezamos calculando
σ=
∑ [ (1 − 3) 2
+ (2 − 3) 2 + ( 3 − 3) 2 + ( 4 − 3) 2 + (5 − 3) 2 ]
5
Para obtenerlo primero calculamos:

4 + 1+ 0 + 1 + 4 10
σ= = = 2 = 141
.
5 5
Luego como M d =3 podemos ya sustituir y obtener.
3( 3 − 3)
Asimetría = =0
141
.

Gráficamente:
Contribuyentes
fi 1
x =Md.Mo
1 2 3 4 5 Xi
¿Esto económicamente que significa ?

Significa que los ingresos de los contribuyentes están distribuidas enigual
número a la izquierda como a la derecha de x Luego no se puede instrumentar
una política fiscal diferencial, debe ser igual para todos.
Si hubiera resultado sesgada la serie a la izquierda ó a la derecha, ello

significaría, que habría más contribuyentes, a la izquierda (bajos ingresos) ó a la
derecha (altos ingresos), respectivamente. Esta situación permite deducir que
la política fiscal si debe de ser diferencial, con bases y tasas impositivas
diferentes.
Ejercicio adicional sobre la aplicación de las medidas de asimetría y

Kurtosis.
_ _ _
PMi PMifi (PMi-Y) (PMi-Y) (PMi-Y)2fi
2
Salario No. de Fia
promedio personas
por hora en Millones
pesos de
pesos
De 1 a 2 4 1.5 6 -2.15 4.62 18.49 4
de + de 2 a 5 3 3.5 10.5 -0.15 0.02 0.0675 7
de + de 5 a 7 2 6 12 2.35 5.52 11.045 9
de + de 7 a 9 1 8 8 4.35 18.92 18.9225 10

Total 10 36.5 29.09 48.525
σ
1.- Obtenga el coeficiente de variación = *100
X
Como: Y =
∑ P . M. fi
=
36.5
= 365
.
∑ fi 10
σ=
∑ fi( P .M .−Y ) 2
=
485250
.
= 485250
. = 2.2
∑ fi 10
2.2
Sustituyendo CV . = (100) = 6027%
.
365
.
2.-Obtenga estadísticamente la forma y dirección de la distribución.

Dirección:
Con asimetría = 3 (Y − M d ) = 3( 3.65 − 3 .50 ) = 3 ( 0.15) = 0 .45 = 0.2045
σ 2 .2 2 .2 2 .2
Como es positiva la asimetría, la dirección es hacia la derecha.
La mediana se obtuvo así:
Md = Lim +
∑ fi + 1) / 2 − C i = 2 + 55. − 4 ( 3) = 2 + 15. ( 3) = 2 + 45. = 35.
(
∑ fi 3 3 3
Como No. orden = ∑

fi + 1
= (10 + 1) / 2 = 55
.
2
Ahora trabajando con momentos desviados con respecto a la Yi se usa:
M3 685
. M 5053
.
A3 = 3
= = 0. 6432; A4 = 44 = = 2.16
σ 105. σ 2342
.
Como A3 = 0.6432 la dirección es hacia la derecha como también lo
indica el coeficiente de Pearson.
Ahora bien haciendo la relación A4 - 3, tenemos 2.16 - 3 = -0.84, lo cual

indica que es una curva de forma achatada: platocúrtica.
Así se hicieron los cálculos anteriores:

M3 =
∑ fi( P .M. i − Y ) 3
=
685
.
= 685
.
∑ fi 10
685
.
Como σ 3 = 1065
. tenemos A3 = = 0.6432
1065
.
505. 3507
M4 = . ; σ 4 = 23.42
= 5053
10
_ _ _ _
(PMi - Y) (PMi - Y) fi (PMi - Y) fi (PMi - Y)4
3 3 4
9.9383 -39.7532 21.3673 85.4692

0.0034 -0.0102 0.0005 0.0015
12.9779 25.9558 30.4981 60.9962
82.3128 82.3128 358.8838 358.8838
68.5052 505.3507
II.3.5 MEDIDAS DE CONCENTRACIÓN
Sirve para determinar la concentración (o relación) de una variable con

respecto a otra; destacan la curva de Lorenz y el coeficiente de Corrado Gini.
II.3.5.1. CURVA DE LORENZ COMO ELEMENTO DEL ANÁLIS IS

ECONÓMICO.

Desde su aparición en 1905, la curva de Lorenz ha servido como

instrumento para describir la forma en que se distribuye el ingreso. Su principal
utilidad radica en que permite hacer comparaciones visuales y cuantitativas
de la relación entre dos variables acumulados con la media aritmética. Lo
anterior se ilustra en el siguiente esquema:
Espejo de la curva de Lorenz
Y Z
Curva
de
Lorenz
45°
0 Xm Xa X
En su aplicación usual, X representa el número de personas que reciben

ingresos en orden ascendente, Y represente su ingreso acumulado.
Como Y es igual al ingreso total y X el total de personas, la pendiente de

la diagonal, Y/X, denota ingreso medio. Si el ingreso se distribuyera
equitativamente cada persona recibiría Y/X. La línea de referencia también
representa "equidad perfecta" para propósitos de igualdad.

Como lo indica el diagrama, la curva de Lorenz muestra que el ingreso no

se distribuye equitativamente, por ejemplo, la décima parte más baja de X recibe
menos del 10 % de Y. El 10 % más alto de X recibe sustantivamente más
del 10 % de Y. Las personas en Xa reciben una cantidad de Y igual a la
media general, resultado ésta último del hecho de que la curva de Lorenz tiene la
misma pendiente que la línea de referencia en ese punto.
La mediana en Xm tiene un ingreso menor que el promedio como sucede

con todas las personas por abajo de Xa, y todas las que están por encima de Xa
tiene ingresos superiores al promedio.
En la mayoría de los casos los ejes de los diagramas de Lorenz son

medidos en porcentajes para facilitar el resumen descriptivo y la
comparación con distribuciones de otros períodos de tiempo o con otros grupos
cuyo ingreso esta medido en otro tipo de moneda. Esta convención sin embargo
es innecesaria cuando se describe una función en particular, tal que los ejes
pueden medirse en cualquier unidad de acuerdo a las escalas que parezcan
apropiadas.
Para graficar la curva de Lorenz se ha hecho costumbre ordenar las

observaciones de manera ascendente, este procedimiento también podría operar
a la inversa cambiando las personas y el ingreso acumulado hacia los ejes
opuestos, dando lugar a lo que se conoce como espejo o imagen de la curva de
Lorenz.
100
I 90
N 80
G A 70
R C 60
E U 50
S M 40
O U
L 30
A
D 20 45°
O
10
0 10 20 30 40 50 60 70 80 90 100
POBLACIÓN ACUMULADA
II.3.5.2 ÍNDICE DE CONCENTRACION DE CORRADO GINI.

I .G .=
∑ X (Y
1 1 + 1) − ∑Y ( X
1 1 + 1)
10,000
Su valor va de 0 a 1. Es 0 cuando el ingreso se distribuye

equitativamente y 1 cuando se concentra de manera alarmante en pocas
personas. La curva toma la forma de la gráfica cuando X crece más rápidamente
que Y, en tal caso la curva se haya por debajo de la diagonal. Si Y crece más
rápidamente que X entonces la curva se sitúa sobre la diagonal y el limite del
I.G., sería menos 1.
Ejemplo. Las dos siguientes distribuciones muestran el ingreso mensual

percibido por las familias de los alumnos inscritos en las facultades de Derecho y
Economía en 1998.
Facultad de Derecho
Ingreso Número Ingreso Total Porcentajes Porcentajes

de Acumulados
Medio Familias del Grupo Familias Ingreso Familias Ingreso
Miles de
pesos
750 361 271 6.7 1.2 6.7 1.2
1,250 486 608 9 2.8 15.7 4
2,000 1,131 2,262 20.9 10.3 36.6 14.3
3,000 1,093 3,279 20.2 14.9 56.8 29.2
4,500 1,361 6,126 25.1 27.8 81.9 57
6,500 442 2,873 8.2 13 90.1 70
8,750 220 1,925 4 8.7 94.1 78.7
12,500 239 2,988 4.4 13.6 98.5 92.3
17,500 59 1,033 1 4.7 99.6 97
25,000 27 675 0.5 3 100 100
Total 5,419 22,040 100 100

Facultad de Economía
Ingreso Número Ingreso Porcentajes Porcentajes

de Total Acumulados
Medio Familias del Grupo Familias Ingreso Familia Ingreso
s
Miles de
pesos
750 212 159 26.2 9.8 26.2 9.8
1,250 176 220 21.8 13.6 48 23.4
2,000 273 546 33.8 33.1 81.8 57.1
3,000 75 225 9.3 13.9 91.1 71
4,500 47 211.5 5.8 13.1 96.9 54.1
6,500 11 71.6 1.4 4.4 98.3 88.5
8,750 5 43.7 0.6 2.7 98.9 91.2
12,500 4 50 0.5 3.1 99.4 94.3
17,500 1 17.5 0.1 1.1 99.5 95.4
25,000 3 75 0.5 4.6 100 100
Total 807 1,619.2 100 100
Cálculo para obtener el coeficiente de Gini, con los datos de la Facultad de

Economía.
X1 Y1 + 1 X1 (Y1 + 1) Y1 X1 + 1 Y1 (X1 + 1)
9.8 26.2
26.2 23.4 613.08 9.8 48 470.4
48 57.1 2,740.8 23.4 81.8 1,914.12
81.8 71 5,807.8 57.1 91.1 5,201.81
91.1 84.1 7,661.51 71 96.5 6851.5
96.5 88.5 8,540.25 84.1 98.3 8,267.03
98.3 91.2 8,964.96 88.5 98.9 8,752.65
98.9 94.3 9,326.27 91.2 99.4 9,065.28
99.4 95.4 9,482.76 94.3 99.5 9,382.85

99.5 100 9,950 95.4 100 9,540

63,087.43 59,445.64
I . G. = ∑ X (Y + 1) − ∑ Y ( X
1 1 1 1 + 1)
=
63,087.43 − 59,44564
.
=
364179
.
10,000 10,000 10,000
I.G.=0.3641 ó 36.41%
II.3.5.3 MÉXICO.DIS TRIBUCIÓN DEL INGRES O PERS ONAL REAL
MENS UAL POR CONCEPTO DE S ALARIO Y S UELDOS . 1950-1956 Y
1964- 1965.(5)
Ingreso Mensual Porcentaje de Trabajadores

Pesos (1950) 1950 1956 1964-65
Menos de 75 12 14 19
75 - 149 29 23 18
150 - 199 23 16 11
200 - 299 17 17 22
300 - 399 10 10 11
400 - 499 4 7 6
500 - 599 2 5 5
600 - 799 2 2 3
800 - 999 1 2 1
1000 - 1499 1 3 2
1500 - ó más 1 2 2
M éxico. Distribución de ingreso monetario. Familiar real mensual. 1950-1956

y 1964-65.
Ingreso Mensual Porcentaje de Trabajadores

Pesos (1950) 1950 1956 1958 1964-65
Menos de 75 4 8 5 11
75 - 149 29 20 17 13
150 - 199 22 14 21 12
200 - 299 16 15 14 23
300 - 399 10 12 10 11

400 - 499 6 9 4 7
500 - 599 3 6 5 6
600 - 799 5 4 5 6
800 - 999 2 4 4 3
1000 - 1499 2 5 3 4
1500 - 2999 1 3 3
3000 - ó 0 2
más

Distribución Decílica del Ingreso.
Porcentaje de Porcentaje de Ingreso

Personas
1950 1956 1964-1965
10% más bajo 3 1 2
Segundo 10% 5 3 2
Tercero 10% 5 4 2
Cuarto 10% 5 5 7
Quinto 10% 7 6 8
Sexto 10% 8 7 8
Séptimo 10% 9 9 8
Octavo 10% 11 12 12
Noveno 10% 16 16 17
Superior 5% 31 37 36
Superior 1% 21 23 26
Superior 9 8 10
Ingreso familiar total disponible monetario y en especie como porcentaje de

los gastos familiares 1963.
Magnitud de Ingreso Ingreso como Porcentaje de los gastos

(en pesos) Todas las Sector Sectores
Familias Agrícola No Agrícolas
Total 100 91 102

175 ó menos 25 94 27
176 á 225 44 42 47
226 á 300 59 50 69
301 á 400 65 61 73
401 á 530 68 72 63
531 á 700 77 78 77
701 á 950 88 98 83
951 á 1250 87 100 83
1251 á 1700 93 97 93
1701 á 2200 98 106 95
2201 á 3000 110 106 111
3001 á 4000 110 106 111
4901 á 5200 116 127 114
5201 á 7000 119 113 120
7001 á 9200 121 170 117

9201 y más 148 180 142
Rama de actividad del Jefe de la familia %

Ingreso Porcentaje Agro Minería y Industria Construc Electri Comer Transpo Servi
Mensual de pecuaria ción cidad cio rte cios
Total Familias (b) Canteras Manufacture
ra
Hasta 175 4.7 7.9 - 1.8 0.2 0.5 4.4 - 2.6
176 - 225 4.6 7.8 - 0.8 3.2 - 1.4 - 3.7
226 - 300 9.1 18.2 1.3 1.3 16.4 - 6 2.6 7.5
301 - 400 10.8 17.5 4.9 5.1 9.8 0.4 5.6 0.9 6.1
401 - 530 9 11.7 13.3 7.9 7.2 2.4 10.5 10.4 4.4
531 - 700 12.3 11 9.8 14.6 21.7 21 11.2 10.9 12
701 -950 12.5 11 9.4 17.2 16.1 6.2 10.2 15.1 12.4
951 - 1250 8.2 5 11.1 12.6 8.4 18.4 11.7 17.1 8
1251 - 1700 8.3 3.2 23.4 14 7.6 13.6 10.6 16.6 11.8
1701 - 2200 6.1 4.3 5 6.4 3.3 20.4 6.1 10.4 8.7
2201 - 3000 5.4 3.5 - 5.9 2.5 4.9 8.9 10.5 7.1
3001 - 4000 5.3 1.6 4.3 4.6 1.4 9.4 4.5 2.6 5.6
4001 - 5200 2.2 1 8 3.8 0.6 - 2.5 1.1 3.7
5201 - 7000 1.7 0.9 9.4 1.2 0.4 - 3.8 0.7 2.7
7001 - 9200 0.6 0.1 - 0.6 0.3 - 0.5 0.7 1.7
9201 ó más 1.2 0.5 - 2 1 2.3 2 0.3 1.8
Banco de M éxico. Encuesta sobre ingresos y gastos familiares de

M éxico, 1968. Incluye las entradas de dinero más los bienes recibidos por la
familia bajo distintos títulos o motivos, ó producidos por ella misma y
destinados a su consumo después de descontar los impuestos a la renta y a la
propiedad las cuotas del seguro social.
(b) Incluye ganadería, silvicultura, caza y pesca.
Distribución porcentual de la población económicamente activa según el

nivel de ingreso nacional y por rama de actividad 1964 - 65.
Ingreso Porcentaje Serv Agricultur Vendedor Transporte Industria Trab. no Gerentes y Of icinas Prof esiona
icios a es s les
Nacional de la PEA Extractiv a Ocup. Adminis y
Direc. Técnicos
en la tradores
Prod.
Hasta 299 34.1 56.3 49.1 21.7 18.1 14.5 14.3 4.4 4.3 2.8
300 - 749 41.1 35.6 41.2 48.2 49 46.9 60 16.6 37 12.9
750 - 999 8.7 4.2 3.9 10.2 15.4 16.2 11.4 10 20.3 14.5
1000 - 1500 9.4 2.4 3.5 10.8 12.9 13.5 10.4 23 25.2 31.5
1501 - 2000 2.5 0.9 0.9 3.4 2.1 5.7 3 10.5 7.1 7.5

2001 - 3000 2 0.1 0.8 3.4 1.8 1.1 0.8 7.9 4.7 11.2
3001 - 5000 1.2 0.3 0.4 1.6 0.5 2.1 - 11.6 1 10
5001 - 10000 0.7 - 0.1 0.7 - - 0.1 10.7 0.4 6.3
10001 ó más 0.3 0.1 0 0.1 - - - 5.2 0 3.1
Promedio de ingreso mensual total por familia y por habitante

monetario o en especie para localidades de diferente tamaño 1963.
Tamaño de Localidad Por Familia Por

Habitante
Menos de 2500 7338,30 125.6

2501 a 10,000 1003,75 182.5
10,001 a 150,000 1449,50 252.1
150,001 a 500,000 1883,90 328.4
5,000,001 ó más 2805,75 484.3
Distrito Federal 2598,30 454.8
RELACIÓN PORCENTUAL
Años Industria Energía Construcció Minería Transporte Comercio Serv icios

n
Manuf acturera Eléctrica
1950 16.9 20.2 25.8 25.4 35.8 - -

1955 16.2 33 30.4 18.5 47.4 9.9 21.2
1960 17.3 37.5 25.9 16.7 29.1 8.2 18
1965 15.7 - - - - - -


REPÚBLICA M EXICANA
Estratos de Ingreso Número de Ingresos

Familiar Mensual Familias Miles de
en Pesos (a) Pesos (1)
Total 7,329,642 9,367,426

Hasta 175 345,786 42,185
De 176 a 225 337,229 69,279
De 226 a 300 663,160 178,754
De 301 a 400 795,255 277,846
De 401 a 530 662,659 308,636
De 531 a 700 903,778 555,223
De 701 a 950 913,740 745,636
De 951 a 1250 598,874 656,488
De 1251 a 1700 610,683 900,408
De 1701 a 2200 444,765 866,275
De 2201 a 3000 395,115 1,025,714
De 3001 a 4000 243,936 841,232
De 4001 a 5200 161,252 724,357
De 5201 a 7000 121,610 723,828
De 7001 a 9200 45,622 364,615
De 9201 y más 86,223 1,086,941
SECTOR P RIMARIO
en Pesos (b) Pesos (2)
T otal 3,130,833 2,561,652
Hasta 175 246,396 30,973
De 176 a 225 244,191 49,773
De 226 a 300 413,890 110,204
De 301 a 400 547,152 189,554

De 401 a 530 366,524 169,726
De 531 a 700 343,743 208,226
De 701 a 950 343,616 277,177
De 951 a 1250 156,349 169,102
De 1251 a 1700 99,861 150,956
De 1701 a 2200 136,254 269,844
De 2201 a 3000 108,491 275,095
De 3001 a 4000 48,379 173,370
De 4001 a 5200 31,391 138,655
De 5201 a 7000 18,867 155,665

De 7001 a 9200 3,246 26,782

De 9201 y más 14,358 166,542
SECTOR SECUNDARIO
en Pesos (c) Pesos (3)
T otal 1,525,825 2,260,406
Hasta 175 20,275 2,286
De 176 a 225 19,917 3,919
De 226 a 300 71,320 19,888
De 301 a 400 92,647 32,299

De 401 a 530 118,011 55,485
De 531 a 700 248,219 152,271
De 701 a 950 251,041 205,026
De 951 a 1250 179,702 200,203
De 1251 a 1700 195,384 284,611
De 1701 a 2200 92,536 177,646
De 2201 a 3000 75,751 200,011
De 3001 a 4000 61,314 210,098
De 4001 a 5200 46,913 210,285
De 5201 a 7000 18,867 109,036

De 7001 a 9200 8,217 65,494
De 9201 y más 25,711 331,848
SECTOR TERCIARIO
en Pesos (d) Pesos (4)
T otal 2,672,984 4,545,324
Hasta 175 79,115 8,924
De 176 a 225 73,121 15,587
De 226 a 300 177,950 48,659
De 301 a 400 155,456 55,989

De 401 a 530 178,124 83,422
De 531 a 700 311,816 194,724
De 701 a 950 319,083 263,431
De 951 a 1250 262,823 287,179
De 1251 a 1700 315,393 464,838
De 1701 a 2200 215,975 418,782
De 2201 a 3000 210,873 550,606
De 3001 a 4000 134,243 457,761
De 4001 a 5200 82,948 375,414
De 5201 a 7000 75,751 459,124

De 7001 a 9200 34,159 272,337
De 9201 y más 46,154 588,547
III. NÚMEROS ÍNDICE.

III. 1 DEFINICIÓN
Un índice mide la variación de un fenómeno generalmente a través del
tiempo. En Economía se usan mucho y en particular para medir las
variaciones de los precios y cantidades de los bienes y servicios que existen en
el mercado en un momento dado.
El índice es una medición hecha en términos relativos, ya que solo así es

como pueden compararse artículos disímbolos por completo por ejemplo:
calcetines con naranjas y con el salón de belleza. Por convención se toma una
base para medir esa variación tomando como referencia 100%; de tal manera que
cuando el índice por ejemplo es 83%, ello significa que hubo una disminución del
17%, de igual manera cuando es digamos, 325%, ello indica que hubo un aumento
de 225%.
Los índices tienen una gran aplicación, en la actualidad constituyen la

columna vertebral para la toma de decisiones en el combate a la inflación,
para medir la productividad de los factores de la producción y para medir la
rentabilidad de las inversiones.
Los índices son de diferente naturaleza, y sin embargo su calculo se basa
en el muestreo estadístico debido a la amplia gama de bienes y servicios
existentes en el universo económico, por lo que se opta para calcularlo
utilizando un reducido número de ellos.
III.2 MÉTODO DE CÁLCULO

Para medir una variación se utilizan índices relativos y compuestos o
ponderados. Nosotros vamos a calcular unos y otros para los precios y
cantidades.
Los números relativos son los porcentajes que expresan precio o cantidad
de un producto X (en comparación con su precio o cantidad de un año base).
En cambio, los números índices son porcentajes que expresan variaciones
medias., o bien un número relativo es la variación en el valor de un solo artículo
y número índice expresa la variación en el precio o la cantidad de un conjunto de
artículos.

Para calcular números índices de precios se requiere: seleccionar los

artículos, selección del período base (debe ser después de un censo), de los
precios de los artículos y selección de la fórmula.
Puesto que una variación se mide en el tiempo, llamaremos Po y Qo a los

precios y cantidades, del año, (día o mes) de referencia, y P1, Q1 a los precios y
cantidades del año (día o mes) de comparación. Así, una variación en
términos relativos será:
P1 Q
Ip = * 100; Iq = 1 *100
P0 Qo
variación
______________________
0 1
Ip é Iq indican el índice de precios y cantidades, respectivamente.
Un índice relativo se puede calcular para una mercancía o servicio, como el
caso anterior o para varios, como sucede en la realidad.
Su fórmula es Ip =
∑P 1
* 100; I q =
∑q 1
* 100
∑P 0 ∑q 0
Estadísticamente estas fórmulas expresan promedios, en este caso de las

variaciones. Por consiguiente las limitaciones que tiene la media aritmética
hacen de estos índices (relativos) que no miden objetivamente las variaciones,
por lo que su uso es limitado (cuando los datos son homogéneos).
Para superar este limitante se usan factores de ponderación. En el índice
de precios el factor de ponderación es la cantidad y en el índice de cantidades el
factor de ponderación es el precio.
Luego Ip =
∑ P Q ; Iq = ∑ q P
1 1
∑P Q 0 ∑q P 0
Al respecto el factor de ponderación puede ser el del año base o el del

año de comparación. Cuando es el año base, la fórmula es:
Ip =
∑P Q1 0
*100; Iq =
∑Q P 1 0
*100
∑P Q0 0 ∑Q P 0 0
que elaboró Laspeyres. Cuando es el año de comparación se usan las fórmulas

elaboradas por Paasche:

Ip =
∑PQ 1 1
* 100; Iq =
∑q P 1 1
*100
∑P Q 0 1 ∑q P 0 1
En este sentido el Profesor Fisher; formula una ponderación de las dos

anteriores y la llamo:
"Fórmula ideal de Fisher"
Ip = ∑PQ 1 0
*
∑ P Q *100
1 1
∑P Q 0 0 ∑P Q 0 1
Iq ∑q P 1 0
*
∑ q P * 100
1 1
∑q P 0 0 ∑q P 0 1
Derivado de los desarrollos anteriores podemos decir que el índice del

valor se calcula con la siguiente formula:
Iv =
∑P q 1 1
* 100
∑P q 0 0
Igualmente, los índices simples ó relativos como promedios que pretenden

ser representativos, de las variaciones de los fenómenos suelen calcularse con las
siguientes fórmulas, según la naturaleza y características de los fenómenos.
P1 q1
∑P ∑q
M edia aritmética I p = 0
* 100; I q = 0
* 100
n n
P1
∑ log P
M edia geométrica Log I p = 0
+ log 100 - log n
n
q1
∑ log q
M edia geométrica Log I q = 0
+ log 100 - log n
n
M edia armónica :
n
Ip = *100
Pi
∑ Po
n
Iq = * 100
q1
∑ qo
Puesto que hay diferentes métodos para calcular índices (M arshall,
Keynes, Ellsworth, etc.) el Prof. Iwing Fisher trata de homogeneizar su cálculo

introduciendo una serie de criterios matemáticos para seleccionar el más

apropiado. Dentro de esos criterios destacan los de:
• Reversión cronológicas
• Reversión de factores
De tal suerte que el índice que pase "esas" pruebas matemáticas es el que
debe usarse en opinión de Fisher. Como se verá más adelante con un ejemplo
numérico, sólo el índice de Fisher pasa estas pruebas, por eso lo llamó “ideal”
III.3 CAMBIO DE BAS E

Es algo que fácilmente y de manera rutinaria el investigador suele hacer, en
particular cuando la serie es ya demasiado larga.
Ello significa que el cambio de base se hace por comodidad, ergo; por
ello expresa las variaciones en función de un año reciente, pero que de ninguna
manera mejora la serie o valores del fenómeno bajo estudio.
DEFLACTACIÓN
El índice de deflactación sirve para expresar en términos reales, es decir, a

precios constantes de un año base seleccionando previamente, las variaciones de
un fenómeno económico; ergo; ingreso, salario, ventas, es decir, por medio del
proceso de deflactación se quita el efecto de los precios en el análisis de un
fenómeno económico (salario, ingreso, ventas) para que este quede expresado en
forma real y la medición de sus variaciones sea real.
Para deflactar los datos de un fenómeno económico, lo que se hace

primero seleccionar el deflactor o índice correspondiente a la naturaleza de ese
fenómeno. Al respecto es conveniente señalar que en M éxico se calculan
diversos índices de precios de los cuales destacan: el índice de precios al
consumidor, al productor, la vivienda, PIB, etc.
Una vez seleccionado el deflactor, para convertir valores nominales (o

precios de mercado) en valores reales (a precios constantes de un año base

seleccionado previamente) se divide cada uno de los datos, entre el valor del
deflactor en ese año.
Así se hace para todos los datos del fenómeno bajo estudio durante un
período de tiempo dado. El cociente resultante es el valor real, en cada año, del
fenómeno de interés.
Por analogía, conservando el espíritu de eliminar el efecto de los precios,

también se puede inflactar a precios reales los valores del fenómenos de interés.
El profesor Alberto Reyes de la Rosa homogenizó la información al deflactar de

1970 al año 2002, como se expone a continuación.

1 2 3 4 5 6 7
Inflación
Base Base Base Base
1968=100 INPC 1978=100 INPC 1994=100 INPC 2002=100
1968 100 30.2 30.2 0.08 0.08
1969 103.5 31.3 31.3 0.08 0.08 3.5
1970 108.7 32.9 32.30 0.09 0.09 3.2
1971 114.6 34.6 34.00 0.09 0.09 5.3
1972 120.3 36.4 35.70 0.10 0.10 5.0
1973 134.8 40.7 40.00 0.11 0.11 12.0
1974 166.8 50.4 49.50 0.13 0.13 23.8
1975 191.8 58.0 57.00 0.15 0.15 15.2
1976 222.1 67.1 66.00 0.18 0.18 15.8
1977 286.7 86.7 85.10 0.23 0.23 28.9
1978 330.8 100.0 100.00 0.27 0.27 17.5
1979 117.8 35.6 118.20 0.32 0.32 18.2
1980 149.0 45.0 149.30 0.40 0.40 26.3
1981 191.9 58.0 191.10 0.51 0.51 28.0
1982 302.4 91.4 303.60 0.81 0.81 58.9
1983 612.90 1.64 1.64 101.9
1984 1,014.10 2.71 2.71 65.5
1985 1,599.70 4.28 4.27 57.7
1986 2,979.20 7.97 7.95 86.2
1987 6,906.60 18.47 18.43 131.8
1988 14,791.20 39.55 39.47 114.2
1989 17,705.60 47.35 47.25 19.7
1990 22,481.50 60.12 60.00 27.0
1991 27,576.30 73.75 73.59 22.7
1992 31,852.80 85.18 85.01 15.5
1993 34,959.00 93.49 93.29 9.8
1994 37,394.10 100.00 99.79 7.0
1995 50,478.30 134.99 134.71 35.0
1996 67,836.64 181.41 181.04 34.4
1997 81,828.39 218.83 218.37 20.6
1998 94,890.15 253.76 253.23 16.0
1999 110,595.67 295.76 295.15 16.6
2000 121,092.62 323.83 323.16 9.5
2001 128,187.35 342.80 342.09 5.9
2002 100.21 100.21 5.7
Se parte inicialmente de los datos que se obtenienen de la fuente de información

que es la columna número 2, base 1968 = 100, para pasar de la base 1968 a
1978=100 es necesario realizar una simple operación aritmética que es la división
100
de *100 = 30.2 , el dato de 330.8 se usa por ser el año al que se va a
330.8
“arrastrar la información”, para el siguiente año la operación es

103.5
*100 = 31.3 y asi sucesivamente hasta donde se desea hacer el cambio de
330.8
base.
En la columna 4 es solamente el INPC con base 1978, para cambiar la base a

1994 los resultados aparecen en la columna 5, los calculos son los siguientes para
30.2
el año 1968 *100 = 0.0807 , para el año 1975
37,394.10
CONS TRUCCIÓN DE ÍNDICES
1.- ÍNDICES RELATIVOS PARA UN SOLO ARTICULO

Un vendedor de refrigeradores tiene las siguientes ventas:
Año Precio No. de Ingresos

en
Prom. c/u Unidades Miles
1 2 3 3*4
1996 3,000 60 180
1997 3,300 63 207.9
1998 3,900 60 234
1999 4,500 66 297
2000 4,500 72 324
2001 4,800 75 360
2002 4,950 66 326
Considerando 1996 = 100, es decir, año base.
Año Precio Cantidad Ingresos

$ Índice Unidade Índice $· Índice
s
1996 3,000 100 60 100 180 100
1997 3,300 110 63 105 207.9 116
1998 3,900 130 60 100 234 130
1999 4,500 150 66 110 297 165
2000 4,500 150 72 120 324 180
2001 4,800 160 75 125 360 200
2002 4,950 165 66 110 326 182

Si ahora cambiamos de base digamos 2000 = 100, haciendo los cálculos

para los precios tendremos.
Año Índice Índice con Números Nuevo con

Anterior Originales Índices
1996 100 3,000 ÷ 4500 = 67 100 ÷ 150 = 67
1997 110 3,300 ÷ 4500 = 73 110 ÷ 150 = 73
1998 130 3,900 ÷ 4500 = 87 130 ÷ 150 = 87
1999 150 4,500 ÷ 4500 = 100 150 ÷ 150 = 100
2000 150 4,500 ÷ 4500 = 100 150 ÷ 150 = 100
2001 160 4,800 ÷ 4500 = 107 160 ÷ 150 = 107
2002 165 4,950 ÷ 4500 = 110 165 ÷ 150 = 110
Lo mismo puede hacerse para las CANTIDADES y los INGRESOS.

III.3.1 APLICACIONES PARA DEFLACTAR E INFLACTAR.
La deflactación se hace lo mismo para una serie cronológica como para el

análisis comparativa en dos años de un fenómeno en términos reales.
Así por ejemplo, si deseamos conocer el ingreso real de una persona
digamos de 2001 a 2002, tomando en cuenta que el primer año su ingreso
nominal fue de $10 millones y en el segundo fue de $12.6 millones. El
procedimiento es el siguiente.
Con 2001 = 100%
Año Salario Nominal Ip Ingreso Real en miles
2001 $10 millones 100 Ingreso Nominal = 10 =10
Ip 1
2002 $12.6 millones 110 Ingreso Nominal = 12.6 = 11.45
Ip 1.10
En ocasiones es necesario INFLACTAR los valores de un fenómeno económico,

ergo, las ventas anuales de una empresa.
Deflactar = Quitarle el efecto de los precios.
Inflactar = Aumentar el efecto de los precios.
Coeficiente = Valor real.
Por ejemplo, en 2002 se deseaba inflactar las ventas hechas por las
empresas durante 1999, 2000, 2001 y 2002.
Para ello se cuenta con el índice de precios al consumidor para esos años
el cual nos permite mediante el cambio de base, hacer la inflactación
correspondiente: 2002 = 100
Nuevo Índice
Año Índice Para dividir Para multiplicar
2002 153.63 153.6 ÷ 153.63 = 100 153.6 ÷ 153.63 = 100
3 3
2001 118.18 118.1 ÷ 153.63 =0.77 153.6 ÷ 118.18 = 1.3
8 3
2000 99.95 99.95 ÷ 153.63 =0.65 153.6 ÷ 99.95 = 1.54
3
1999 85.1 85.1 ÷ 153.63 =0.55 153.6 ÷ 85.1 = 1.82
3


Ejemplo $100 millones de ventas de 1999, 2000 y 2001 equivalen a precios de

2002 a:
Año Ventas ( Millones de pesos de cada

empresa)
1999 $100 ÷ 0.55 = $ 182 mil = $100 * 1.82
2000 $100 ÷ 0.65 = $ 154 mil = $100 * 1.54
2001 $100 ÷ 0.77 = $ 130 mil = $100 * 1.3
Ahora bien para deflactar.- Si fijamos 1999 = 100 año base, es decir,
llevamos el valor de las ventas a precios de 1999, en este caso se hace lo
contrario, es decir, hacemos un cambio de base al revés.
Año Índice Anterior Nuevo Índice

Dividir Multiplicar Para dividir Para Multiplicar
1999 0.55 1.82 0.55 ÷ 55 = 1 1.82 ÷ 1.82 = 1
2000 0.65 1.54 0.65 ÷ 55 = 1.18 1.54 ÷ 1.82 = 0.85
2001 0.77 1.3 0.77 ÷ 55 = 1.4 1.3 ÷ 1.82 = 0.71
2002 1.00 1 1 ÷ 55 = 1.81 1 ÷ 1.82 = 0.55
Así $100 millones de 1999, 2000, 2001, y 2002 equivalen a precios de

1999 a:
Año Millones de $ en ventas de cada empresa
1999 100 ÷ 1 = 100 = 100 * 1
2000 100 ÷ 1.18 = 85 = 100 * 0.85
2001 100 ÷ 1.4 = 71 = 100 * 0.71
2002 100 ÷ 1.81 = 55 = 100 * 0.55
PODER ADQUISITIVO = I/ IP


III.4 CÁLCULO DE LA INFLACIÓN MENS UAL ACUMULADA.
Cálculo de la tasa de inflación acumulada a partir de las tasas mensuales

de inflación. Para ello se toma como referencia el I.N.P.C. Índice Nacional de
Precios al Consumidor con 1978 = 100 así para 1990:
I II III IV
Índice Variación Base inicial Importe Inflación
Nacional de Mensual para aplicar la de la Acumulada
Precios al del inflación del Inflación %
mes
Mes Consumido INPC (100+col. IV del del mes
r
renglón %
anterior)
A Enero 20,260.7 4.8 100 4.8 4.8
B Febrero 20,719.5 2.3 104.8 2.4104 7.2104
C Marzo 21,084.8 1.8 107.2104 1.92978 9.14018
D Abril 21,405.7 1.5 109.141187 1.63712 10.7773
E Mayo 21,779.2 1.7 110.778305 1.88323 12.66053
F Junio 22,258.9 2.2 112.661536 2.47855 15.13908
G Julio 22,664.8 1.8 115.14009 2.072522 17.211602
H Agosto 23,051.0 1.7 117.212612 1.992614 19.204216
H Septiembre 23,379.6 1.4 119.205226 1.668873 20.873089
J Octubre 23,715.7 1.4 120.874099 1.692237 22.565326
20.6 22.565326
Para obtener la tasa mensual acumulada, no se debe sumar las tasas de

inflación de cada mes, se debe multiplicar y después sumar; para así acumular
correctamente las tasas de inflación de cada mes.
Así al empezar el mes de enero de 1990, se parte de la base 100 (columna

I renglón A ). La tasa de inflación del mes de enero fue de 4.8% luego la tasa de
inflación acumulada al final del mes fue del 4.8 (columna IV renglón A)
La tasa de inflación del mes de febrero fue de 2.3 %. Sin embargo la tasa
de inflación acumulada durante estos dos meses de 1990 no fue la simple suma
de 4.8 + 2.3 = 7.1. El cálculo de la inflación acumulada al 29 de febrero es :
104.8 x 0.023 = 2.4104 + 4.8 = 7.21 % (columna IV renglón B ).


GENERALIZANDO PARA :
Marzo 107.2104 * 0.018 = 1.92978 + 9.14018 = 9.14018

Abril 109.14118 * 0.015 = 1.63712 + 10.7773 = 10.7773
7
Mayo 110.77830 * 0.017 = 1.88323 + 12.66053 = 12.66053
5
Junio 112.66153 * 0.022 = 2.47855 + 15.13908 = 15.13908
6
Julio 115.14009 * 0.018 = 2.072522 + 17.211602 = 17.211602
Agosto 117.21261 * 0.017 = 1.992614 + 19.204216 = 19.204216
2
Septiembre 119.20522 * 0.014 = 1.668873 + 20.873089 = 20.873089
6
Octubre 120.87409 * 0.014 = 1.692237 + 22.565326 = 22.565326
9
Puede observarse que al finalizar el mes de octubre de 1990, la tasa de
inflación fue del 22.565326 ( columna III y columna IV )y no del 20.6
(columna I ) como lo indicaría simplemente la suma de las tasa de inflación
mensual.
Ejemplos: del cálculo del índice para varios productos:
III.5 EJEMPLOS ADICIONALES
PARA NÚMEROS RELATIVOS :
M edia de relativos M g de relativos

P1 P1
∑P 0
* 100 ∑P 0
Ip = Ip =
n n
 P1 
 ∑P * 100
P1
log Ip= log

0
n
 = log I p =
 ∑p0
+ log 100 − log n
 
 
 P1 
 ∑P 
log Ip= log 0 
+ log 100
 n 
 
 

n
M a de los relativos I p = P0
∑ P1
* 100

PARA NÚMEROS ÍNDICES :

Si designamos con Qo y Q1 las cantidades de cada articulo del año base y
del año de estudio y designamos IP el índice de precios tenemos que: ΣPoQo
representa el valor total o costo total de bienes y servicios o artículos en el año
base. La cantidad ΣP1Q0 representa el valor total del mismo conjunto de
artículos en año de comparación; entonces el índice de Laspeyres nos sirve para
medir el costo total en cualquier año de comparación de un conjunto fijo de
artículos comprados en el año base.
En el cálculo del índice Paasche ΣP0Q1 es el valor total o costo total de

artículos comprados en el año de comparación considerando los precios del año
base y; ΣP1Q1 es el valor total de artículos comprados en el año de comparación
a los precios de ese mismo año. Entonces el índice de Paasche nos sirve para
medir el costo total de los artículos en el año de comparación relativos al costo
que podrán haber sido comprados si se hubiera adquirido en el año base.
Laspeyres.
M étodo del año base I p = ∑

P1Q0
* 100
∑P Q
0 0
Paasche
M étodo del año de comparación I p = I p = ∑

P1Q1
* 100
∑P Q
0 1
M arshall
Ip =
∑ P (Q + Q ) * 100
1 0 1
∑ P (Q + Q )
0 0 1
I =
∑ P Q * ∑ Q P *100
1 0 1 1
∑P Q ∑Q P
p
0 0 0 1
I =
∑ P Q * ∑ Q P * 100
1 0 1 1
∑P Q ∑Q P
q
0 0 0 1
Iv = ∑
PQ 1 1
* 100 donde Iq = índice de cantidad
∑ PQ 0 0
Iv = índice de valor

Cálculo de los números índice
2001 2002
Artículo Unidad Po Qo P1 Q1 P1Qo PoQo P1Q1 PoQ1
Maíz Kgs. 2 3 3 1 9 6 3 2
Arroz Kgs. 4 3 6 2 18 12 12 8
Papa Kgs. 6 4 9 3 36 24 27 18
Trigo Kgs. 8 5 12 4 60 40 48 32
Sal Kgs. 10 6 15 5 90 60 75 50
30 21 45 15 213 142 165 110
Laspeyres.
Ip =
∑ P1Q0 * 100 = 213 * 100 = 15. *100 = 150%
∑ P0Q0 142
Paasche
Ip =
∑PQ 1 1
* 100 =
165
* 100 = 15
. * 100 = 150%
∑P Q 0 1
110
M arshall
Ip =
∑ P (Q + Q ) * 100 = 45( 21 + 15) * 100 = 1620 * 100 = 15. * 100 = 150%
1 0 1)
∑ P (Q + Q )
0 0
30( 21 + 15)
1
1080
Fórmula ideal de Fisher.
Ip = ∑ PQ * ∑ PQ
1 0 1 1
* 100 =
213 165
* * 100 = 15 . * 100 = 2.25 *100 = 15
. *15 . *100 = 150%
∑ PQ ∑ PQ 0 0 0 1 142 110
Iq = ∑ q P * ∑ q P *100 = .79*.79 * 100 = .6241 *100 =.79 * 100 = 79%

1 0 1 1
∑q P ∑ q P 0 0 0 1
Iv = ∑ PQ * 100 = 165 * 100 = 116

1 1
. * 100 = 116%
∑ PQ 0 0142
M . relativos

P1
∑P 0 75
.
Ip = * 100 = * 100 = 15
. * 100 = 150%
n 5
M g de relativos
 P1 
 ∑P  P1
log I p = log 
 n
0
* 100 = log
 ∑P 2
− log n + log 100
 
 
Por lo tanto log Ip = 2.1761
Su antilogaritmo = 150.0 %
M a de relativos
n 5
Ip = * 100 = * 100 = 149
. * 100 = 149% ≅ 150%
P0
∑ P1
335
.
2001 = 100 Log de Recíproco

Del precio Relativos
P1/Po P1/Po Po/P1 Qo + Q1 P1(Qo + Q1) Po(Qo + Q1)
1.5 0.1761 0.67 4 12 8
1.5 0.1761 0.67 5 30 20
1.5 0.1761 0.67 7 63 42
1.5 0.1761 0.67 9 108 72
1.5 0.1761 0.67 11 165 110
7.5 0.8805 3.35 36 378 252
M ARSHALL
Ip =
∑ P (Q 1 0 + Q1 )
* 100 =
378
* 100 = 150%
∑ P (Q 0 0 + Q1 ) 252
También existe el índice Flores-Panse. Fue calculado por la Srita.

M atemática Ana M aría Flores y V.G. Panse. Contiene una elaboración
matemática rigurosa en el cálculo de los Qs, lo que hace posible que el indicador
(índice) resulte más apegado a la realidad económica y tenga aplicación en
Paasche, Laspeyres y Fisher.
Ejemplo: para el calculo de Q0 (consumo) su fórmula es:

n
µ i Ni
Q0 = ∑c
i =1
i =
µi
= Estimación del consumo por día.
Donde:

ci = Consumo total por día en el estrato i-ésimo.

µ i = Promedio de unidades de consumo en el estrato i-ésimo, o sea convertirá
total la población según su edad y sexo en unidades de consumo.
µ i N i = Total de unidades de consumo en estrato i-ésimo.
La población se calcula tomando el sexo y la edad en unidades de consumo según

la tabla de la FAO.
III.6 PRUEBAS MATEMÁTICAS . (2)
2001 2002
Artículo Unidad Po Qo Pi Qi
Maíz Bushel 2,343.00 2,679.00 0.66 3,071.00
Algodon Libra 5,356.00 5,705.00 0.14 6,715.00
Heno Tonelada 20,150.00 76.59 17.78 76.16
Trigo Bushel 2.13 52.10 1.43 843.30
Avena Bushel 0.70 1,107.00 0.46 1,444.00
Papa Bushel 1.58 297.30 1.13 368.90
Azúcar Libra 0.10 4,371.00 0.05 4,817.00
Cabada Bushel 1.22 131.10 0.72 171.00
Tabaco Libra 0.39 1,444.00 0.21 1,509.00
Linaza Bushel 4.38 6.77 1.77 10.90
Centeno Bushel 1.33 78.70 1.26 61.90
Arroz Bushel 2.67 42.69 1.19 51.56
PoQo P1Qo PoQ1 P1Q1
3,597.897 1757.424 4,124.353 2,014.576

2,030.9800 792.995 2,390.540 933.385
1,543.2885 1361.7702 1,534.624 1,354.1248
2,018.9251 1364.3593 1,797.0723 1,208.4489
777.1140 504.792 1,013.688 658.464
469.7340 335.3544 582.862 416.1192
445.8420 231.663 491.334 255.301
159.2865 93.8676 207.765 122.436
563.1600 306.128 588.510 319.908
29.67291 11.9829 47.7747 19.293
104.7497 98.8472 82.3889 77.7464
113.81154 50.84379 137.6989 61.51515

11,854.4613 6,910.0274 12,998.6108 7,441.3175
III.6.1 LA PRUEBA DE REVERS IÓN DE FACTORES DICE:

Si se intercambian los factores P y Q en una fórmula de índice de precios
(o de cantidad) de manera que se obtenga una fórmula de índices de cantidad (o de
precios), el producto de los índices deberá dar el valor exacto del índice de valor:
P1Q1
P0Q0
Si tomamos la fórmula de Laspeyres: ∑ PQ

1 0
se transforma ∑Q P 1 0
.
∑ P0 Q0 ∑Q P 0 0
esto es en un índice de cantidad, pero
∑ PQ
1 0 ∑Q P1 0
es diferente de ∑Q P1 1
∑ P0 Q0 ∑Q P0 0 ∑Q P0 0
Igualmente si tenemos la formula de Paasche :

∑ P1Q1 se transforma en ∑Q P 1 1
; pero
∑ P0Q1 ∑Q P 0 1
∑ PQ1 1
*
∑Q P1 1
es diferente de ∑Q P1 1
∑ PQ0 1 ∑Q P0 1 ∑Q P0 0
En cambio la formula ideal de Fisher :
∑ PQ * ∑ PQ al transformarse en ∑ Q P * ∑ Q P y multiplicarse por

1 0 1 1 1 0 1 1
∑ PQ ∑ PQ
0 0 0 1 ∑Q P ∑Q P 0 0 0 1
la anterior ∑ PQ * ∑ PQ * ∑ Q P * ∑ Q P = ∑ P Q
1 0 1 1 1 0 1 1 1 1
∑ PQ ∑ PQ 0 0 ∑Q P ∑Q P ∑ P Q
0 1 0 0 0 1 0 0
Ejemplo:

∑ PQ 1 0
= 05824
. ;
∑P Q 0 1
=
12, 9686108
. .
= 10956
.
∑ PQ 0 0 ∑P Q 0 0
11,864.46125
.
El índice del valor: ∑ PQ 1 1

=
7 ,4416108
. .
= 06272
.
∑ PQ 0 0
11,864.46125
.
Luego en los casos de Laspeyres:

(1.0965)(0.5824) ≠ 0.6272; o sea que 0.6381 ≠ 0.6272
Con Paasche:
∑ PQ 1 1
=
7 ,441317
. .45
= 05725
.
∑ PQ 0 1
12, 9986108
. .
∑ QP 1 1
=
7,441317
. .45
= 10769
. = 1078868
.
∑QP 0 1 6,910.027.39
tal que: (1.0769)(0.5725) ≠ 0.6272
Trabajando con el índice ideal de Fisher:

∑ PQ * ∑ PQ
1 0 1 1
*
∑ Q P * ∑Q P = ∑
1 0 1 1 P1 Q1
∑ PQ ∑ PQ
0 0 0 1 ∑Q P ∑Q P ∑
0 0 0 1 P0 Q0
Esto es: (0.5824) * (0.5725) * (10956
. ) * (10769
. ) = 06272
.
(0.5775)(1.0862) = 0.6272 ; por lo tanto 0.6272 = 0.6272
III.6.2 LA PRUEBA DE REVERS IÓN CRONOLÓGICA S E EXPRES A

COMO S IGUE:
Si se intercambian los subíndices de tiempo de una fórmula de precios (o
de cantidad), la fórmula resultante de precios (o de cantidad) deberá ser reciproca
de la fórmula original.
Si tomamos la fórmula de Laspeyres: ∑ PQ 1 0
∑ PQ 0 0
pero ∑ PQ1 0
se transforma ∑ PQ . 0 1
∑ PQ0 0 ∑ PQ 1 1
∑ P Q * ∑P Q
1 0 0 1
≠ 1.0
∑ P Q ∑ PQ
0 0 1 1
Luego no satisface la prueba; de la misma manera en el caso de Paasche:

∑ PQ
1 1
se transforma ∑ PQ 0 0
.
∑ P0 Q1 ∑ PQ 1 0
pero
∑ PQ
1 1
*∑
Q0 P0
±1.0
∑ P0 Q1 ∑ Q0 P1
En cambio si aplicamos la prueba al Índice Ideal de Fisher:

∑ Q P * ∑Q P
0 1 1 1
se cambia ∑Q P * ∑Q P
1 0 0 0
tal que
∑Q P ∑ Q P
0 0 1 0 ∑Q P ∑Q P
1 1 0 1
∑ Q P * ∑Q P
0 1 1 1
* ∑Q P * ∑Q P
1 0 0 0
= 1.0
∑Q P ∑ Q P
0 0 1 0 ∑Q P ∑Q P
1 1 0 1
Ejemplo en el caso de Laspeyres:

∑ PQ 1 0
se transforma en ∑ PQ 0 1
∑ PQ 0 0 ∑ PQ 1 1
Recordando que :
∑ PQ 0 1
=
12,998.6108
.
= 17468157
.
∑ PQ 1 1 7,441317
. .45
luego (0.5824)(1.7468157) ≠ 1.0 porque 1.01734 ≠ 1.0
Con Paasche:
∑ PQ 1 1
se transforma en ∑Q P 0 0
∑ PQ 0 1 ∑Q P 0 1
donde ∑Q P 0 0
=
11864
, .46125.
= 17169919
.
∑Q P 0 1
6, 9100239
. .
(0.5725)(1.79919) ≠ 1.0 es decir 0.9829778 ≠ 1.0
En el caso del Índice ideal de Fisher:

∑ Q P * ∑Q P
0 1 1 1
* ∑Q P * ∑ Q P
1 0 0 0
= 1.0
∑Q P ∑ Q P
0 0 1 0 ∑Q P ∑Q P
1 1 0 1
Esto es: (0.5824) * (0.5725) * (1.7468157) * (1.71169919) = 10.

(0.5774)(1.7318)=1.0 o sea que 0.99999413=1.0 por lo tanto 1.0 = 1.0

III.7 ÍNDICES ES LABONADOS Y EN CADENA.
Los procesos de eslabonamientos o encadenamiento permiten hacer

cambios en la muestra de bienes usados para calcular el índice ponderado
compuesto.
El proceso de eslabonamiento se caracteriza por el cambio constante del
año base. Por ejemplo el índice de 2000 usa como base 1999 y el de 2002 toma
como base 2001.
Visto numéricamente:
Año Ventas en Eslabón Índice en

Millones de $ Relativo Cadena
1998 1.5 - 136.3
1999 1.3 86.7 118.2
2000 1.1 84.6 100
2001 1.7 154.5 154.5
2002 1.9 121.1 209.1
Las limitaciones de este índice es que no se puede hacer comparaciones

sobre un número determinado de años, para ello es necesario unir o
encadenar los eslabones en términos de un sólo año base.
Para el año escogido como base el valor del índice es automáticamente
fijado en 100, en nuestro ejemplo el año de 2000 es igual a 100. Los índices para
los años siguiente a 2000 fueron determinados multiplicando el eslabón relativo
de cada año por el índice en cadena del año precedente. Así, si N se refiere a
un año determinado en la serie:
Lu * Cu − 1
Cu =
100
donde:
Cu = Índice de cadena del año de estudio.

Lu = Eslabón relativo.
Cu - 1 = Índice en cadena del año anterior.
Para 2002
(1211. ) *(154.5)
Cu 2002 =
100
Cu 2002 = 187.09
Para ir hacia atrás en el tiempo a partir de un año base la ecuación se
resuelve para Cu - 1 en lugar de Cu. Así, el índice en cadena para 1998 será:
Cu 118.2
Cu − 1 = *100; Cu1998 = * 100
Lu 86.7
Por tanto Cu 1998 = 136.3.
Para 1995 tendremos
100
Cu 1999 = = 118.2
84.6

CÁLCULOS DE LOS NÚMEROS ÍNDICE∗ US ADOS PARA

"INFLACTAR LA INFORMACIÓN DE 1998 A 2000.
1.- Se obtuvo el índice mensual para los años de 1998 y 1999, por ser los años a
que corresponden la mayoría de las empresas.
1,418.20 1,199.40
I 1999 = = 118.18%; I 1998 = = 99.95%
12 12
2.- Al año de 1999 o sea 118.8 se le incorporó el 30% de la inflación estimada
para 2000, a fin de hacer este último igual a 100% o año base:
I2000 = 118.18 * 1.30 = 153.63 = 100.0%
3.- Con esta información se calcularon los números índice.
Año Cálculo Índice

Para dividir Para multiplicar
2000 153.63 ÷ 153.63 = 1 1
1999 118.18 ÷ 153.63 = 0.77 1.3
1998 99.95 ÷ 153.63 = 0.65 1.54
1997 85.1 ÷ 153.63 = 0.55 1.82
III.8. DIFERENTES TIPOS DE INDICES US ADOS EN MEXICO
Destacan :a).- Indice Nacional de Precios al Consumidor, INPC; b).- Indice

Nacional de Precios al Preoductor, INPP y el de la Vivienda.
Las principales diferencias ( Banxico, 2002) entre el INPC y el INPP son:
INPC INPP
Es un indicador ( estimador porque Es un indicador de la evolución de los
viene de una muestra) del precios de los bienes y servicios que
comportamiento de los precios de los forman la producción de la economía en
bienes y servicios que consumen las un lapso dado.
familias en un lapso dado.
Incuye únicamente los bienes y Incluye: además del consumo familiar, a
servicios que adquieren las familias para los bienes y servicios intermedios, de
su consumo en un lapso dado. cconsumo del gobierno, de inversión y
∗
Indice de Precios al Consumidor, BANXICO.

de exportación.
Las ponderaciones están basadas en los Las ponderaciones se estiman con base
reportes que el INEGI levanta en los en el Sistema de Cuentas Nacionales de
hogares, los cuales al agregarse, M éxico, SCNM .
constituyen la Encuesta Nacional de
Ingreso gasto de los Hogares, ENIGH.
Incluye las importaciones como una No incluye a las importaciones.
fracción de los bienes que consumen las
familias.
Los precios son recabados en los Los precios se obtienen directamente de
establecimientos o fuentes de las empresas productoras de bienes o
información donde las familias acuden suministradoras de servicios.
a realizar las compras de los bienes y
servicios que consumen.
Peridicidad quincenal: Los resultados se Periodicidad mensual. Se publica a más
publican los días 10 y 25 de cada mes tardar el día 9 de cada mes en un bolitín
en el Diario Oficial de la Federación, en de prensa y en la hoja electrónica del
un boletín de prensa ( que se emite el Banco de M éxico.
día anterior a su publicación en el
Diario Oficial ) y en la hoja electrónica
del Banco de M éxico
Se elabora con base en precios al Los precios que se cotizan son
consumidor final que incluyen principalmente Libre a Bordo (LAB)
impuestos al consumo, costos de planta de producción. Por tanto, no
transporte y márgenes de incluyen impuestos al consumo, costos
comercialización. Las cotizaciones son de transporte ni márgenes de
proporcionadas de manera voluntaria y comercialización; se proporcionan de
se publican cada mes en el Diario manera voluntaria y son confidenciales.
Oficial de la Federación, manteniendo la
confidencialidad respecto a la fuentes
de información.
Se calcula para 46 ciudades y a nivel Presenta resultados a nivel nacional.
nacional.


III.8 PRÁCTICA V
ALUM NO__________________________________________GRUPO_____
Problema 1.- Un número índice es un valor relativo con una base igual al 100% y
se usa como indicador para el cambio relativo de una cosa o de un grupo de
cosas. Los números índices más importantes en el análisis económicos
pueden clasificarse en tres tipos 1)________________________________
2)________________________3)__________________________
Los números índices que se construyen para un sólo artículo se denominan
______________________________ y los que se construyen para un grupo de
artículos se llaman
______________________________________________________
Problema 2.- Los precios por unidad y las cantidades vendidas de un artículo
para los años de 2001 y 2002, están dados más abajo. Calcular los índices de
a) precios
b) cantidades
c) valores para 2002 con 2001 como base.
Año Precio por Unidad Unidades Vendidas

2001 $ 1.10 150
2002 $ 1.32 120
Problema 3.- Los siguientes datos corresponden a la producción de ajonjolí (en

miles de toneladas), en un determinado país. Calcule
a) los relativos de base fija con 1998 como base,
b) los relativos en eslabón y
c) los relativos en cadena.
Los datos corresponden al período de 1998 a 2002 y las cantidades
producidas respectivamente son: 50, 75, 100, 120 y 140.
Problema 4.- Suponga que los precios y las cantidades de 4 artículos vendidos
durante los años de 2001 y 2002 en una ciudad son como sigue:
Artículo Precio por Unidad Cantidad

(pesos) (en 1,000 unidades)
2001 2002 2001 2002

A 0.6 lb. 0.65 lb. 45 138

B 1.45 lb. 0.48 lb. 180 120
C 80 ton. 85 ton. 14 10
D 1.5 ton. 1.42 ton. 20 15
Utilice los métodos de agregados ponderados para construir los números
índices de
a) precios
b) cantidades y
c) valor, para 2002 con 2001 como base.
Problema 5.- Utilice la información del problema No. 4. Emplee los métodos de
promedios relativos para construir los números índices compuestos de
a) precios no ponderados
b) cantidades no ponderadas
c) precios ponderados y
d) cantidades ponderadas.
Problema 6.- Utilice nuevamente la información del problema No. 4 y:

a) Calcule el Índice de precios ponderados para 2001 con base en 2002.
b) Demuestre que el método utilizado satisface la prueba de la reversidad
temporal.
c) Demuestre que los índices de precios compuestos calculados satisfacen la
prueba de reversidad de los factores.
d) Calcule el índice ideal de precios.
e) Calcule el índice ideal de cantidad.

IV INTRODUCCIÓN A LA PROBABILIDAD (7)
Contexto e importancia
Como señala el Profesor L. Kazmier, la teoría de la probabilidad se ha convertido

en la base del desarrollo de los métodos que utilizamos en la inferencia
estadística, misma que tiene su origen en el método inductivo, el cual indica que a
partir del análisis de una porción de eventos o información particular podemos
generalizar, es decir, se pasa de lo particular ( muestra ) a lo general ( población o
universo ); en otras palabras, seleccionamos una muestra ( porción ) del universo,
detectamos sus características y decimos que esas mismas características las
tiene la población. o sea que la Inferencia Estadística es aquella disciplina
que basada en el análisis de la muestra por medio de métodos y técnicas
científicas, hace posible el conocimiento de las características de la población.
Ahora bien, es importante mencionar que cuando describimos las características

de la población, N, a partir de la información de una muestra, n, no estamos
seguros de que dicha descripción sea correcta o válida para todos los elementos
de la población, por lo que siempre existirá el riesgo de aceptar la descripción
cuantitativa de las características de la población a partir de una muestra. Dicho
riesgo lo medimos aplicando la teoría de la probabilidad. O sea que en el proceso
de información estadística nunca podremos evitar el riesgo o error de aceptar o
rechazar a partir de la muestra, características que pueden o no ser ciertas para la
población.
Si bien es cierto que no podemos evitar el riesgo, también es cierto que lo

podemos controlar y cuantificar por medio de la teoría probabilística.
Idealmente quisiéramos tener a nuestra disposición un procedimiento de

selección de la muestra que nos garantizara que es representativa de la población

para reducir o eliminar el riesgo en la toma de decisiones sobre las características

de la población a partir de la información muestral. Desafortunadamente no se ha
descubierto tal procedimiento, por lo que nunca estaremos seguros de que una
muestra específica sea representativa de una población específica.
Así, en lugar de garantizar que la muestra es representativa. Lo mejor que puede

hacer el procedimiento de selección es darnos certeza de que no son introducidas
fuentes distorsionadoras conocidas durante la selección de la muestra, que en este
caso llamamos muestra probabilística, que, debe quedar claro, no es
necesariamente representativa de la población.
Al respecto, es conveniente decir que uno de los requisitos de una muestra

probabilística es que cada elemento de la población estadística tenga una
oportunidad conocida, generalmente igual, de ser incluido en la muestra.
IV.1 S ignificado de probabilidad
Dicha oportunidad se llama probabilidad, la cual podemos definir como la

posibilidad expresada con un número positivo, de que ocurra un evento o
resultado de interés para el investigador . De lo anterior se observa que una
expresión probabilística siempre constituye una ES TIMACIÓN de un valor
desconocido que regirá un evento que todavía no ocurre.
Derivado de lo anterior, cabe mencionar que la teoría de la probabilidad se ha

convertida en la base del desarrollo de las técnicas de inferencia Estadística, las
cuales son utilizadas en todos los campos de la investigación básica y aplicada
incluyendo el análisis económico y las decisiones empresariales.
Existen dos procedimientos para el cálculo de la probabilidad:

El 1º se refiere al enfoque objetivo y el 2º se refiere al enfoque subjetivo.
La probabilidad objetiva se calcula por dos métodos:

El clásico ó teórico y el de frecuencias relativas.
El enfoque subjetivo referente a la interpretación de un valor
probabilístico, se basa en la confianza o seguridad que una persona tenga sobre la
ocurrencia de un evento.
Un ejemplo de éste sería la fuerte creencia, de 0.95, de que se firmará un
contrato de la STUNAM y la UNAM . El 31 de octubre del 2002.

Este evento es único, no puede ser repetido muchas veces, sencillamente

el 0.95 refleja la confianza que hay sobre la firma del contrato-laboral. De
manera general diremos que cuando existe un evento con un sólo resultado
posible, el concepto de probabilidad subjetiva es aplicable.
Por otra parte, en lo que respecta a la probabilidad objetiva, su cálculo
por cualquiera de los dos métodos antes mencionados no difiere sustancialmente;
su diferencia radica en el tiempo en que se calcula determinado valor
probabilístico. Esto es, el procedimiento clásico se caracteriza por la
determinación apriorística de los valores antes de haber observado los
eventos;: en otras palabras, no es necesario hacer el experimento para observar y
registrar su resultado, es decir, la probabilidad se calcula teóricamente.
EJEM PLO:
1
Cuando se dice que un medio ( ) es la probabilidad de obtener águilas en
2
el lanzamiento de una moneda, esto se dice sin haber lanzado la moneda al aire (el
experimento es el lanzamiento de la moneda). Por eso se dice que la probabilidad
así calculada es un valor esperado con el al método clásico o teórico, el cual
supone en el ejemplo que utilizamos de la moneda, una simetría básica en los
posibles resultados de un evento, por ello la moneda o el dado que se utilizará, no
deben estar deformada o en el caso del dado, no debe estar “cargado “, para poder
calcular la probabilidad a priori.
También debemos decir que el cálculo anterior se basa en el supuesto de que los
resultados posibles son mutuamente excluyentes e igualmente probables de
ocurrir. Al respecto, es conveniente decir que en el mundo de la economía y los
negocios los resultados posibles no son igualmente probables y no conocemos de
antemano su probabilidad de ocurrencia, situación que limita el uso del método
clásico para calcular las probabilidades. La mayor crítica es que el término
“igualmente probable” presupone el conocimiento previo de la teoría de la
probabilidad, situación que no siempre es cierta, además de que en el mundo real
no siempre podemos suponer que los resultados serán “igualmente probables”,de
ahí que sea interesante, muchas veces, recurrir al método de las frecuencias
relativas.

Al respecto, de acuerdo con el método de frecuencias relativas, en que la

probabilidad de un evento se basa en un resultado observado o verificado, en
otras palabras, las probabilidades se calculan después de haber realizado el
experimento y una vez que se han registrado los resultados del mismo. Así la
probabilidad de un resultado cualquiera es la frecuencia relativa de ese producto
o resultado en un gran número de eventos repetitivos.
Es importante señalar que con este método para calcular la probabilidad, que a
medida que aumenta el número de observaciones de los eventos y de sus
resultados, aumenta la exactitud en el cálculo de la probabilidad, inclusive tiende
a estabilizarse en cierto valor, por ejemplo, si realizamos el experimento de lanzar
al aire, digamos 500 veces una moneda y registramos el número de veces que cae
“aguila “, la frecuencia relativa, es decir la probabilidad, tiende a estabilizarse
alrededor del valor 0.5. Derivado de lo anterior, decimos que la probabilidad asì
calculada es un valor estimado, cuya exactitud será mayor a medida que
aumentemos el experimento.
Una vez establecida la diferencia entre uno y otro de los dos métodos del
enfoque objetivo, a continuación podemos profundizar señalando lo siguiente:
DEFINICIÓN CLÁS ICA DE LA PROBABILIDAD.

Laplace definió la probabilidad como una razón matemática entre un
grupo de eventos con características especiales y la totalidad de eventos
posibles. Explícitamente diremos: "si un experimento da lugar a (n) eventos
mutuamente excluyentes, todos igualmente probables y (r) se consideran
favorables, entonces la probabilidad de un evento favorable es r/n ".
De lo anterior observamos que un valor probabilìstico es indicativo de la

frecuencia esperada de un resultado posible en particular, dentro del total de
resultados posibles que arroje un experimento.
Un evento será una muestra cuyos puntos o elementos son resultados

posibles de un experimento. Lo anterior, en el caso de una baraja americana,
gráficamente se verá así:
)))))))))) ))))))))))
♣♣♣♣♣♣ ♣♣♣♣♣♣♣♣ ♣♣♣♣♣♣♣♣ ♣♣♣♣♣♣♣♣

♠♠♠♠♠♠♠ ♠♠♠♠♠♠♠♠ ♠♠♠♠♠♠♠♠ ♠♠♠♠♠♠♠♠

•••••••••••• ••••••••••••• •••••••••••• •••••••••••••
Ooooooooooo ooooooooooo ooooooooooo ooooooooooo
Como se observa, un evento puede estar representado por un punto o un

agregado de puntos.
Gráficamente:
Evento A Evento C
.... ;;;;
Evento B Evento D
. . .
Serán eventos o resultados verificables A, B, C, D; donde cada uno de ellos

está formado por un punto como D, ó agregado de puntos como A,B,C.
AXIOMAS DE LA PROBABILIDAD
1º.- A cada punto se le asigna un número positivo, llamado probabilidad.

2º.- Todos los puntos tienen la misma probabilidad de ocurrencia.
3º.- La suma de las probabilidades del espacio muestral es igual a 1.
4º.- La probabilidad de un punto oscila entre 0 y1, es decir 0 ≤ p (x ) ≤ 1
Conforme a los anterior podemos establecer que la probabilidad de cada
resultado de un experimento es 1/n.
Al respecto el espacio muestral puede definirse como la suma de todos

los puntos de una muestra, o de resultados posibles que produce un
experimento. En opinión de Yu Lun Chou(21) realmente debería llamarse
“espacio de resultados”, por que eso son.

EJEM PLO.- El experimento "lanzamiento de dos monedas" genera un espacio

muestral, conteniendo cuatro puntos o resultados posibles (AA, AS, SA, SS):
donde A = ÁGUILA
S = SOL
El evento "caras iguales", esta compuesto de dos puntos (AA y SS). Si
queremos saber cual es la probabilidad de que caigan caras iguales (águilas o soles)
en un lanzamiento de dos monedas, con el método clásico, ésta será:
Nº de casos favorables
P(A,A ó S,S)= Nº de casos posibles
2 1
= =
4 2
Aplicaciones:
La probabilidad fue 1.- Inferencia estadística:
desarrollada por M uestreo Estadístico, estimación de parámetros y
Pascal prueba de hipótesis
2.- Econometría:
M odelos Econométricos
3.- Teoría de las Decisiones:
Teorema de Bayes
Para desarrollar la teoría probabilística fue necesario identificar y

cuantificar el número de resultados posibles, marco de referencia, espacio
muestral que genera un experimento, puesto que sólo así se puede cuantificar la
probabilidad de éxito o fracaso en la obtención de un resultado de interés
particular.
Al respecto la probabilidad se desarrolló en gran parte en los juegos de

azar, que constituyen uno de los principales marcos de referencia, la cual
posteriormente se utilizó en biología para seleccionar y utilizar muestras
probabilísticas que dieran confianza o seguridad a los resultados de sus
experimentos. Así, en el caso de la moneda, el marco de referencia son las dos
caras de la misma. En el caso de un dado son las seis caras. Cuando son dos
dados el espacio muestral está constituido por 36 resultados posibles.
Gráficamente :
D 6 o o o o o o Marco

muestral
A 5 o o o o o o constituido
por
D 4 o o o o o o 36
resultados
O 3 o o o o o o posibles
# 2 o o o o o o
1 1 o o o o o o
1 2 3 4 5 6
D A D O # 2
En el caso de una baraja española el marco muestral esta constituido por

40 cartas o resultados posibles.
En el caso de una baraja americana esta constituida por 52 cartas o
resultados posibles. Estos resultados se clasifican en 4 grandes grupos:
Diamantes, Corazones, Tréboles, Picas, que a su vez se agrupan en dos colores,
negro (26 resultados) y rojo (26 resultados).
1 1 1 1
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
J J J J
Q Q Q Q
K K K K
Una vez que se conoce el marco de referencia se puede decir qué es

posible calcular la probabilidad de ocurrencia de cualquiera de los resultados
comprendidos en el marco de referencia. En otras palabras la probabilidad
representa la cuantificación de éxito o fracaso de un resultado posible.

IV.2 RES ULTADOS POS IBLES DE UN EXPERIMENTO

Pueden ser:
.IV.2.1 EVENTOS MUTUAMENTE EXCLUYENTES : A y B lo son cuando en
un experimento sólo ocurre uno de ellos. La probabilidad de que ocurra uno o el
otro es igual a la suma de sus probabilidades de ocurrencia.
P(A ò B) = P(A) +P(B)
El siguiente diagrama se llama de diagrama de Venn y comprende todos los
resultados posibles de un experimento, con uno o mas resultados identificados
especìficamente, cuyo conjuntose llama espacio muestral; cualquier resultado se
identifica como un punto en ese espacio y el àrea relativa asignada a ese punto no
necesita ser indicativa de su probabilidad.
A B
Cuando hay intersección entre ellos es decir, que tienen puntos en común,
decimos que no son eventos mutuamente excluyentes. Gráficamente se ven así:
A A,B B
En ese caso el cálculo de su probabilidad es:

P (A ó B)= P(A) + P(B) - P(A,B)
De lo anterior, cuando A y B son mutuamente excluyentes, P(A,B)= 0
En el siguiente diagrama se representa la P( A) y P(no A), ésta última indica la

probabilidad de que no ocurra A, tal que P(A) + P(no A) = 1, que ocupan todo el
espacio muestral

A noA
Los eventos mutuamente excluyentes pueden ser más de dos; ejemplo:

Sabemos que la probabilidad de que los estudiantes de posgrado obtengan 10 de
calificación es 0.12; P(9)= 0.13 ; P(8)= 0.12; P(7)= 0.18; P(6)= 0.20 y P(5)=
0.25, cuya suma es 1.0, decimos que la suma de todos los resultados mutuamente
excluyentes es igual a 1.0, lo cual cumple con uno de los axiomas de la
probabilidad. Podemos hacer cálculos como los siguientes:
P(5 o`6)= 0.25 + 0.20 = 0.45;

P( 5 o`6 ò 7) = 0.25+0.20+0.18 = 0.63;
P( 8 `0 9) = 0.12+ 0.13 = 0.25,
P ( 8 ò 9 ò 10 ) = 0.12+.013+0.12 = 0.37
IV.2.2 EVENTOS INDEPENDIENTES : A y B son independientes cuando

ocurren separadamente en el tiempo o en el espacio; cuando la ocurrencia de uno
no afecta la del otro. La probabilidad de que ambos ocurran es:
P (A y B) = P (A) * P (B)
Aquí tambièn es conveniente advertir que a diferencia de los resultados posibles

que pueden surgir en los juegos de azar, en el mundo de los negocios los eventos
y sus resultados raras veces son independientes, sin embargo, con ese
señalamiento, no deja de ser útil para la toma de dicisiones.
IV.2.3 EVENTOS DEPENDIENTES Y PROBABILIDAD CONDICIONADA

Cuando A y B no son independientes surge el concepto de probabilidad
condicional y para determinar la probabilidad de una secuencia de eventos
ponemos P(B∖ A), significa la probabilidad de que ocurra B dado que A
ocurrió previamente.
Ejemplo: Suponga que un cargamento de diez motores contiene uno defectuoso,
D, y nueve no defectuosos, ND. Al inspeccionarlos, obtenga la probabilidad de
uno defectuoso, D, y los otros nueve no defectuosos, ND.

revisión de uno de dos motores

sabemos que para el primero:
P( ND)= 9/10 y que P( D )= 1/10
La revisión de un segundo motor, dado que ya se revisó uno antes puede generar:
1).- P(ND\ND) = 8/9 *9/10 = 72/90= 4/5 =8
2).- P( D\ND) =1/9* 9/10= 9/10=9/90=1/9 =.1
3.- (ND\D)= 9/9*1/10 = 9/90= 1/9= .1
4.- (D\D)= 0
suma = 1.0
Con estas referencias, a continuación recordemos algunos conceptos que
9
necesitaremos para relacionarlos con lo que hemos visto hasta el momento y en
su oportunidad dar continuidad al análisis de la relación que tiene la probabilidad
con la inferencia estadística.
V.2.4 FUNCIÓN.- Es una relación de dependencia unívoca.

Si y = f(x), decimos que los valores de y, variable dependiente, están en función
de los valores que tome x, variable independiente.
IV.2.5 VARIABLE.- Es aquella literal (x,y,z, etc.) que toma los valores dados en
un espacio muestral dado.
IV.2.6 VARIABLE NUMÉRICA.- (no se considera la probabilidad).
Ahora relacionando lo que conocemos hasta el momento, definamos,

calculemos y veamos el alcance de la:
IV.2.7 VARIABLE ALEATORIA, X,.- Es una función real valorada y definida

en un espacio muestral, con su probabilidad de ocurrencia asociada. Así, en el
caso de un dado toma los valores: 1,2,3,4,5,6, con su probabilidad asociada de
ocurrencia y permite calcular sus valores esperados: E(Xi)
E(Xi)= 1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)+6(1/6) = 21/6= 3.5, que es un valor
engañoso, ya que 3.5 no es un valor esperado de Xi puesto que los únicos
posibles valores son 1,2,3,4,5,6. Pero E(Xi) es lo que debe esperarse en un
sentido de promedio, también conocida como la media de Xi = E(Xi)=. µ x , que
también se conoce como media aritmética ponderada en términos de probabilidad,
expectativa matemática o media de una variable aleatoria X.
Ejemplo 1:Sabemos que :
Xi P(Xi) Xi- µ x (Xi- µ x )2 P( Xi)* (Xi- µ x )2
1 1/6 -2.5 6.25 1/6*6.25

2 1/6 -1.5 2.25 1/6*2.25

3 1/6 -0.5 0.25 1/6*0.25
4 1/6 +0.5 0.25 1/6*0.25
5 1/6 +1.5 2.25 1/6*2.25
6 1/6 +2.5 6.25 1/6*6.25
suma 17.50 17.50/6
efectivamente µ x = 1+2+3+4+5+6+/ 6= 21/6= 3.5
Ejemplo 2:Ahora bien, si el experimento se repite varias veces, el valor esperado
no es necesario que sea un valor posible de la variable aleatoria, como lo muestra
el ejemplo anterior de E(Xi)= 3.5. Como concepto, como medida de tendencia
central, es un concepto básico que se usa mucho en la economía y los negocios,
cuya aplicación en estos campos se ilustra de la manera siguiente:
La probabilidad de que se incendie una casa en la colonia Juárez del Distrito

Federal en cualquier día del año 2002, es 0.005. La Compañía de Seguros
M onterrey le ofrece al dueño de la casa un seguro contra incendios con una póliza
por $ 20,000. por un año; cuyo costo es $ 150.00 .En este caso ¿ cuál es la
utilidad esperada de Seguros M onterrey ?
La utilidad definida por, U, es una variable aleatoria que puede tomar los valores
de $150.00 si no se incendia la casa y, de $ 19,850.00 si es que se incencia
durante el año 2002, periodo que cubre la póliza contratada. Así, la función de
probabilidad de U es :
Valor de U: ui + $ 150.00 - $ 19,850.00

Probabilidad: P(ui) 0.995 0.005
Su E(Ui) = (150)( 0.995) + ( -19,850)( 0.005)= $ 50.00
La esperanza matemática o utilidad esperada por la póliza vendida siempre debe

ser positiva, como es el caso, para permitir a Seguros M onterrey el pago de
gastos de administración y acumular reservas para pagar los siniestros a los
beneficiarios y tenedores de pólizas.
Ejemplo 3:
Lo anterior, desde el punto de vista del comprador, el seguro como cualquier

juego de azar que se hace para obtener una utilidad, tiene un valor esperado
negativo.

Valor de U:ui + 19,850.00 - $ 150.00

Probabilidad:P(ui) 0.005 0.995
Su E(Ui)= 19850( 0.005) + (-150)(0.995)= 99.25-149.25= $ -50
la cantidad de menos $50.00 es lo que espera ganar en promedio, en caso de que

se incendie la casa y cobre el seguro por $ 20,000.00.
La varianza de la variable aleatoria se define como σ 2 = Var(Xi)= E(Xi- µ x )2
tanto para variables discretas como continuas. Así, Var(Xi)= 17.50/6=2.91 y la
desviación estándar, σ = σ 2 = 1.70.
Con esos antecedentes, como se indicó, "LAPLACE" pudo cuantificar la
probabilidad al decir que "es una razón" matemática que surge de relacionar
un resultado de interés con el total de resultados posibles.
Con literales podemos decir que: (Cr) representa uno o varios resultados
de interés y (Cn) representa el total de resultados posibles, entonces si (P)
denota probabilidad, por consiguiente la P(Cr) = r/n.
Así cuando r = 1 diremos que la P(Cr) = 1/n.

Lo anterior significa que una vez conocido el marco muestral, la
probabilidad de cada uno de los resultados posibles tiene la misma
probabilidad de ocurrencia, ergo, en el experimento que consiste en lanzar un
dado una vez, observamos que la probabilidad de obtener 1, es 1/6, también que
la probabilidad de obtener dos es 1/6, y en general la probabilidad de
cualesquiera de los 6 resultados posibles es 1/6.
Al respecto es conveniente indicar que para el desarrollo de la teoría

probabilística fue válido señalar que todos los resultados posibles en un
experimento dado, tienen la misma probabilidad de ocurrencia. No obstante en la
vida real esto no es del todo cierto.
IV.3 ANÁLIS IS COMBINATORIO

En la aplicación de la probabilidad con frecuencia se necesita o es conveniente
contar un gran número de objetos o resultados posibles de un
experimento; en cuyo caso es difícil enumerar o contar el número total de
puntos de muestras posibles ( subconjuntos ) en el espacio muestral, también
llamado espacio de resultados. Para resolver esta situación se utilizan las técnicas

de permutación y combinación, que a su vez, se basan en el principio de

multiplicación, el cual establece(21) : “ si una operación puede efectuarse en n1
formas y enseguida, después de realizarse en cualquiera de esas formas, se puede
efectuar una segunda operación en n2 formas, y después de ser ejecutada en
cualquiera de estas formas, se puede realizar una tercera operación en n3 formas,
y así sucesivamente hasta k operaciones, entonces las k operaciones pueden
ejecutarse en las siguientes formas:
(n1)(n2)(n3)..........(nk-1)(nk) formas´
Agreguemos a lo anterior, como referencia adicional, que ya aprendimos a

calcular la probabilidad de ocurrencia de los resultados posibles de un
experimento, y estuvimos en condiciones de definir y obtener la variable
aleatoria, así como su valor esperado o promedio en un espacio muestral
determinado.
Ahora vamos a utilizar los conceptos anteriores en el contexto del análisis

combinatorio, que a su vez nos permitirá profundizar en la demostración de la
relación que tiene la probabilidad con la inferencia estadística, ahora, en el
contexto de analizar de cuantas maneras diferentes podemos clasificar o arreglar
dichos resultados posibles que, dicho en otras palabras, podremos saber cuantas
muestras podemos obtener y de cuantas maneras distintas podemos constituirlas
u ordenarlas con las unidades de muestreo que las componen.
IV.3.1 Permutaciones
Así, empezaremos diciendo que una permutación es un arreglo de todos o parte

de los objetos dentro de un conjunto de objetos en un orden definido. El número
total de permutaciones de un conjunto de objetos depende del número de
objetos tomados a la vez para cada permutación. El número de objetos tomados
a la vez para cada permutación puede ser:
a) Todos los objetos ó

b) Parte de los objetos.
ejemplo del primer caso:
Encontrar el número total de permutaciones del conjunto de letras (a, b,

c) tomadas todas a la vez.

Usando el diagrama de árbol, vemos que serían los siguientes:

PERM UTACIONES
(Arreglos ordenados posibles)
b c abc
a
c b acb
O
r a c bac
i b
g c a bca
e
n a b cab
c
b a cba
A B C
Cálculo numérico: * * = 6 permutaciones
3 2 1
Hay 6 permutaciones. Nótese que el arreglo A,B,C, es diferente de

B,A,C aun cuando cada uno de los 2 arreglos consiste de las mismas letras, luego
en este caso decimos que el orden en que aparece cada letra es muy
importante. El número de permutaciones también se puede obtener con la
formula :
nP n=n!=n(n-1)(n-2)(n-3)...3x2x1= 3P 3 = 3x2x1 = 6 porque n=3.
Ahora bien cuando n=4 tendremos 4P4 = 4! = 4x3x2x1 =24 permutaciones.
EJEM PLO DEL SEGUNDO CASO: SOLAM ENTE PARTE DE DOS

OBJETOS Si definimos r = el número de objetos, tomados a la vez para
cada permutación, entonces la formula es nPr.
nP r = el número total de permutaciones de n objetos, tomados r a la vez. Con

n=4 y tomando r a la vez, calculemos :
a) Tres a la vez; n= 4; r= 3 nP r =4P3

4 P 3 = 4 * 3 * 2 = 24

b) Dos a la vez n= 4 , r= 2 ; nP r
= 4P2 = 4*3=12
n! 4 * 3 * 2 *1 24
también se puede obtener con = = = 12
(n − r )! 2*1 2
Lo anterior gráficamente se ve así

b
a c permutaciones ab, ac, ad.
d
a
b c permutaciones ba, bc, bd.
d
Origen
b
c d permutaciones cb, cd, ca.
a
a
d b permutaciones da, db, dc.
c
IV.3.2 COMBINACIONES
Una combinación es un subconjunto o un arreglo de todos o parte de los

objetos de un conjunto sin considerar el orden de los objetos.
Ejemplo: Encontrar el número total de combinaciones tomando dos a la vez del

conjunto (a, b, c).
3 C2 3* 2 6
= = =3 combinaciones tomando 2 letras a la vez.
2! 2 *1 2
Lo anterior se corrobora usando el diagrama de árbol.
b
a Permutaciones Combinaciones
c ab ba ca ab bc ac
ac bc cb

a
Origen b
c
a
c
b
IV.3.3 EJERCICIOS
IV.3.3.1.-DE ANÁLIS IS COMBINATORIO AMPLIADO.(9)

Para afianzar el conocimiento, ahora diremos que se utilizan las fórmulas
anteriores para obtener numéricamente el número de arreglos diferentes que se
pueden obtener cuando ya no es visible el espacio muestral. Supongamos que
se tiene (n) objetos diferentes y se quiera conocer el número de maneras de
ordenar estos objetos. Se puede pensar que hay (n) espacios ó lugares donde se
puede colocar los (n) objetos a fin de dar forma a cada uno de los
ordenamientos.
Así habrá (n) posibilidades para el primer objeto, n-1 para el segundo,
n-2 para el tercero y así sucesivamente hasta llenar el último lugar con el último
objeto.
Este desarrollo no es otra cosa que el producto de nPn :

nP r = n (n-1)(n-2)...1 = n!; que sería la fórmula para obtener el número total de
ordenaciones que también se llaman permutaciones para (n) objetos.
En un esfuerzo adicional por consolidar la familiaridad con el manejo de los

conceptos que integran el conocimiento del análisis combinatorio, dada la
importancia que tiene para la inferencia estadística, decidí complementar mi
exposición con la del PROFESOR S. SHAO, quien dice:
“Una permutación es un arreglo de todos o parte de los elementos dentro

de un conjunto de objetos en un orden definido. El número total de
permutaciones de un conjunto de objetos depende del número de los mismos,
tomados a la vez para cada permutación puede ser :
a) Todos los objetos ó

b) Parte de los objetos

Ejemplo del primer caso:
Encontrar el número total de permutaciones del conjunto de letras {a, b,

c,} tomadas todas a la vez.
PERM UTACIONES
(Arreglos ordenados posibles)
b c abc
a
c b acb
a c bac
Origen b
c a bca
a b cab
c
b a cba
Hay seis permutaciones. Nótese que el arreglo a, b, c, es diferente de a,

c, b, aunque cada uno de los dos arreglos consista de las mismas letras.
El orden de cada arreglo de letras es importante en una permutación. El
número de permutaciones se puede obtener con la formula Nº 1.
FORM ULA Nº 1.. nPr = n! = n (n-1)(n-2)(n-3)...3 * 2* 1

A B c
Gráficamente será =6 permutaciones .
3* 2 * 1
También se puede obtener así 3P3 = 3!= 3*2*1 = 6 permutaciones.

Otro ejemplo: encontrar el número total de permutaciones del conjunto
de dígitos (1, 3, 5, 7,) tomados todos a la vez.
13 57
Aquí n = 4 luego 4 P4 = = 4! = 24 permutaciones, que usando el
432 1
diagrama de árbol se observa que están ordenadas o integradas de la siguiente
forma:
5 ---- 7 -------- 1, 3, 5, 7.
1, 3
7 ---- 5 -------- 1, 3, 7, 5.
3 ---- 7 -------- 1, 5, 3, 7.
1, 5

7 ---- 3 -------- 1, 5, 7, 3.
3 ---- 5 -------- 1, 7, 3, 5.
1, 7
5 ---- 3 -------- 1, 7, 5, 3.
5 ---- 7 -------- 3, 1, 5, 7.
3, 1
7 ---- 5 -------- 3, 1, 7, 5.
1 ---- 7 -------- 3, 5, 1, 7.
3, 5
7 ---- 1 -------- 3, 5, 7, 1.
1 ---- 5 -------- 3, 7, 1, 5.
3, 7
5 ---- 1 -------- 3, 7, 5, 1.
3 ---- 7 -------- 5, 1, 3, 7.
5, 1
Origen 7 ---- 3 -------- 5, 1, 7, 3.
1 ---- 7 -------- 5, 3, 1, 7.
5, 3
7 ---- 1 -------- 5, 3, 7, 1.
1 ---- 3 -------- 5, 7, 1, 3.
5, 7
3 ---- 1 -------- 5, 7, 3, 1.
3 ---- 5 -------- 7, 1, 3, 5.
7, 1
5 ---- 3 -------- 7, 1, 5, 3.
1 ---- 5 -------- 7, 3, 1, 5.
7, 3
5 ---- 1 -------- 7, 3, 5, 1.
1 ---- 3 -------- 7, 5, 1, 3.
7, 5
3 ---- 1 -------- 7, 5, 3, 1.

AHORA PERMUTACIONES DE OBJETOS DIFERENTES TOMADOS

PARTE A LA VEZ.
También se puede obtener por medio del diagrama de árbol o con las
siguientes fórmulas. El diagrama de árbol es similar a los dos casos anteriores
excepto que el número de columnas en este caso es igual al número de objetos
tomados para cada permutación. En general sea:
r = El número de objetos, tomados a la vez para cada permutación.

nPr = El número total de permutaciones de n objetos, tomados r a la vez.
Entonces:
Fórmula Nº 2
nP r = n(n-1)(n-2)(n-3)...(n-r+1) para r factores. Nótese que el último factor (n-
r+1) es simplificado de [n-r (-1), También cuando r = n, el último factor se
vuelve (n-n+1) = 1. Luego cuando r = n, está última fórmula es idéntica a la del
número 1.
Ahora bien la fórmula 2 también se puede escribir así:

n!
Fórmula Nº 3: nPr =
( n − r )!
Esta fórmula es conveniente para cálculos cuando se tiene disponibles

tablas de n! y (n-r)!
Ejemplo. Encontrar el número total de permutaciones del conjunto de letras (A,

B, C, D) tomados a) tres a la vez y b) dos a la vez.
a) Aqui: n = 4 (Número de letras en el conjunto dado)

r = 3 (Número de letras tomadas a la vez para cada permutación).
nP r = 4P 3 = 4*3*2=24
n! 4 *3 *2 *1
También: nPr= = = 24 permutaciones
( n − r )! 1
b)Aquí, n = 4; r = 2; nPr = 4P2 = 4*3 = 12
n! 4 *3 *2 *1
También: nPr= = = 12 permutaciones
( n − r )! 2 *1

El diagrama de árbol correspondiente se obtiene de la siguiente manera,

para las 12 permutaciones:
Resultados posibles
b ab
a c ac
d ad
a ba
b c bc
d bd
Origen
a ca
c b cb
d cd
a da
d b db
c dc
Igualmente, en el caso del inciso a) tendremos:

Cuando nPr= 4P3= 24 permutaciones.
b c a b c 1
a c d a c d 2
d b a d b 3
a c b a c 4
b c d b c d 5
d a b d a 6
. . .
Origen . . .
. . .

a b c a b 19
c b d c b d 20
d a c d a 21
a c d a c 22
d b a d b a 23
c b d c b 24
Otro ejemplo: Tres oficiales: Presidente, Vicepresidente y Secretario, van a ser
elegidos de 20 miembros de un club. ¿De cuántas maneras pueden ser elegidos
los tres oficiales?.
Aquí :n = 20; r=3; nPr= 20P3 = 20*19*18 = 6840 maneras
n! 20 * 19 * 18 * 17*...3 * 2 * 1
ó nPr= = = 6840maneras
( n − r )! 17 * 16 * 15*...3 * 2 * 1
COMBINACIONES .- Es un subconjunto o un arreglo de todos o parte de los

objetos de un conjunto sin considerar el orden de los objetos.
El número total de combinaciones posibles de un conjunto de objetos
tomados todos a la vez es 1.
Por ejemplo:
Los arreglos posibles del conjunto de letras (A, B) son AB y BA. Puesto
que el orden del arreglo no es considerado, el arreglo AB es el mismo que BA.
Por lo tanto hay solamente una combinación (A y B) posible para el
conjunto. Gráficamente :
a ________ b ab
 dos 
ORIGEN  permutaciones y una combinación
 
b ________ a ba
El número total de combinaciones posibles de un conjunto de objetos

diferentes tomados parte a la vez puede ser obtenido encontrando primero el
número total de permutaciones contando después las permutaciones con los
mismos objetos como una combinación. Ejemplo: Encontrar el número total de
combinaciones del conjunto de letras (A, B, C) tomados dos a la vez.
El número total de permutaciones de tres letras, tomadas dos letras a la

vez es:

3P 2
= 3*2 = 6; cada arreglo consiste de dos letras.
Las seis permutaciones consistentes en las mismas letras son
consideradas como tres combinaciones. Por lo tanto el número total de
combinaciones es:
3 P2 6
= =3
2! 2
USANDO EL DIAGRAM A DE ÁRBOL SE OBTIENE DE LA SIGUIENTE

M ANERA:
Permutaciones Combinaciones
b …………ab …………………………….a y b
a
c ………… ……….ac ……………………a y c
a …………ba
Origen b
c ………… ……………….bc …………b y c
a …………………. ca
c
b …………………………….cb
En general, sea:
n = El número total de objetos de un conjunto dado.
r = El número de objetos tomados a la vez para cada combinación.
nCr = El número total de combinaciones de n objetos, tomados r a la vez.
nPr n! n Pr n!
n Cr = = como nP r = entonces nCr = =
r! ( n − r)! r! r!(n − r)!
Así el ejemplo anterior también puede ser calculado con estas fórmulas:
3* 2 n! 3 *2 *1
nCr =3C2 = =3= = =3 combinaciones.
2 *1 r!( n − r)! 2!(3 − 2)!

Con ello se puede plantear el siguiente problema: Tres de 20 miembros

van a ser seleccionados para formar un comité ¿de cuantas maneras puede ser
formado el comité?.
Respuesta: El comité formado por los miembros A, B, C, es el mismo que el
comité formado por B, C, A u otro arreglo consistente de los tres miembros
por lo tanto este es un tipo de problema de combinación, puesto que no
consideramos el orden del arreglo.
Aquí: n =20; r = 3
20 P3 20 * 19 * 18
n Cr = 20 C 3 = = = 1140
,
3! 3* 2 *1
Generalizando entonces tenemos:
COM BINACIONES.
Si hay n objetos diferentes y si deseamos tomar r a la vez, su fórmula
será:
n Pr n!
n Cr = =
r! r!( n − r )!
De tal forma que si n = 52 y deseamos tomar r = 5 a la vez;
52 n! 52!
P  = = = 2 ,598.960 maneras o combinaciones.
  r !( n − r)! 5!(52 − 5)!
5
Si dentro de las 5 cartas, deseamos que 3 sean ases, entonces.

P(3 ases + 2 cartas ) = 4(1,128) = 4,512 casos favorables, puesto que
4 48
3 = 4 casos favorables y   = 1128
, casos favorables, luego
  2 
Casos favorables = 4,512 = 0.00174

Casos posibles 2,598,960
IV.3..3.2 EJERCICIOS S OBRE EVENTOS MUTUAMENTE

(3)
EXCLUYENTES
Hemos dicho que dos o más eventos son mutuamente excluyentes si no
puede ocurrir en un cierto experimento más de uno de ellos. La probabilidad de
que ocurra uno o el otro dentro de un conjunto de eventos mutuamente
excluyentes, es igual a la suma de sus probabilidades de ocurrencia.
Si A = AS ; B = REY

Entonces del ejemplo anterior :

4 1 4 1
P ( B) = = ; también P ( A) = = ;
52 13 52 13
Si deseamos conocer la probabilidad de obtener AS o REY, esto es A o B,

entonces :
P (A o B) = P (A) + P (B)
P (A o B) = 1/13 + 1/13 = 2/13
IV.3.3.3 DIAGRAMA DE VENN

Recordemos que un diagrama que comprende todos los resultados
posibles de un evento con uno o más resultados específicamente identificados se
llama Diagrama de Venn.
El conjunto de todos los resultados posibles se llama espacio muestral y

cada resultado se identifica como un punto en el espacio.
Utilizando el DIAGRAM A DE VENN: ilustremos la probabilidad de A en un
espacio muestral.
.A
Podemos decir que si P (A) es la probabilidad de ocurrencia de A. P (~ A) es la

probabilidad de que no ocurra A.
P (A) + P ( ~ A) =1
En el lanzamiento de un dado la P (AS) es 1/6.
Esto es:
A: P (AS) =1/6
B: P (~ AS) = 5/6
luego la P (A) + P (B) = 1
Esto es, la suma de las probabilidades de todos los resultados posibles de
eventos mutuamente excluyentes es.

1/6+5/6=1
A B
Ejemplos adicionales de eventos mutuamente excluyentes.

1º.- En el lanzamiento de una moneda la ocurrencia de un águila y la de un sol
son eventos mutuamente excluyentes.
2º.- El lanzamiento de una moneda dos veces genera eventos mutuamente
excluyentes en cada lanzamiento.
3º.- Al sacar una carta de una baraja americana ¿puede salir un as y un rey?
No, luego entonces estos dos resultados posibles son mutuamente
excluyentes.
4º.- Al sacar una carta de una baraja americana ¿puede salir un as y una espada?
Si, luego no son eventos mutuamente excluyentes.
El cálculo de los eventos mutuamente excluyentes puede generalizarse
para situaciones en los cuales se manejen 2 ó más eventos mutuamente
excluyentes.
Ejemplo:
No. de hijos por familia 0 1 2 3 4 5 ó más
Proporción 0.10 0.10 0.20 0.25 0.20 0.15
¿Cuál es la probabilidad de que una familia escogida aleatoriamente dentro de un
grupo tenga 5 o más hijos?.
Respuesta: 0.15, la proporción representa la probabilidad de acuerdo con el
cálculo de la probabilidad por el método de las frecuencias relativas.
¿Cuál es la probabilidad de que una familia tenga tres o más hijos?
A: P (3 hijos) = 0.25
B: P (4 hijos) = 0.20
C: P (5 o más) = 0.15
luego: P (A ó B ó C) = 0.25 + 0.20 + 0.15 = 0.60
Si A y B no son mutuamente excluyentes entonces la probabilidad de

ocurrencia de A ó B es la probabilidad de que ocurra A más la

probabilidad de que ocurra B menos la probabilidad de que ambos ocurran

conjuntamente, simbólicamente:
P(A ó B) = P (A) + P (B) - P (AB)
A B A A,B B
(1)DIAGRAM A DE VENN (2)DIAGRAM A DE VENN

ILUSTRANDO 2 EVENTOS PARA DOS EVENTOS QUE NO
M UTUAM ENTE EXCLUYENTES SON M UTUAM ENTE
EXCLUYENTES.
La sustracción de (A,B) es para corregir el traslape o intersección que se

presenta de A y B cuando no son eventos mutuamente excluyentes. Cuando son
excluyentes los eventos, A,B = 0, significando que no existe el área (A,B) (en el
diagrama 1).
IV.3.3.4 EJERCICIOS S OBRE EVENTOS INDEPENDIENTES

Ejemplo 1:Cuando dos o más eventos ocurren en forma secuenciada o
separados en el tiempo ó espacio, tales como el lanzamiento de 2 monedas 2
veces, se habla de eventos independientes.
A y B son eventos independientes dentro de un conjunto de eventos si la
ocurrencia de uno no afecta la del otro. La probabilidad de que ocurran ambos es
P (A y B) = P (A) * P (B).
Ejemplo:
¿Cuál es la probabilidad de obtener dos ases en dos dados en una sola
tirada? digamos que A: P (de as en el primer dado = 1/6) y que B: sea la P ( de as
en el segundo dado) = 1/6)
P (A y B) = 1/6 * 1/6 = 1/36
Son independientes porque un resultado no afecta la ocurrencia del otro.
Ejemplo 2:Dos lanzamientos de una moneda son eventos independientes,

luego la probabilidad de dos águilas en dos lanzamientos sucesivos de una
moneda es 1/4; porque la probabilidad P (A y B) = 1/2 * 1/2 = 1/4; ya que como
se recordará P (A y B) = P (A) * P (B).

Por otra parte, es interesante recordar que así como el diagrama de Venn sirve
para ilustrar los eventos posibles de un experimento, los diagramas de árbol
sirven para ilustrar los resultados posibles de eventos sucesivos o múltiples.
En el caso del lanzamiento de una moneda dos veces el diagrama de árbol
será:
a = ÁGUILA b = SOL
Primer lanzamiento Segundo lanzamiento Resultados
½ a ………………..a a
½ a
Origen ½ b ………………..a b
½ a ………………..b a
½ b
½ b ……………….b b
¿Cuál es la probabilidad de obtener a y luego b ?

P(A y B) = 1/2 * 1/2 = 1/4
Ejemplo 3: EVENTOS DEPENDIENTES

En la vida real la mayoría de los eventos no son independientes, sino que existen
interacciones entre ellos. Si son dependientes, el concepto de probabilidad
condicionada se usa para determinar la probabilidad de una secuencia particular
de eventos, el símbolo P (B\A) significa la probabilidad de B dado que A
ocurrió previamentes, esto es:
P (A y B) = P (A) * P (B\A)
Ejemplo:
Una caja tiene 3 bolas rojas (R) y 2 negras (N) luego la probabilidad de R
= 3/5; P (N) = 2/5 porque son cinco bolas en total.
Si queremos usar el diagrama de árbol este será:
Resultados
2/4 R ………………..R, R
3/5 R
Origen 2/4 N ………………..R, N
3/4 R ………………..N, R

2/5 N
1/4 N ………………..N, N
Si en la primera selección obtenemos una bola roja. Obtenga la

probabilidad de que en una segunda selección la bola sea negra, sin
reemplazo.
P (N\R) = 2/4
3 2 6
P (R y N) = P(R) P(N\R) = * =
5 4 20
Por lo tanto
6 3
P(RyN)= =
20 10
Ejemplo 4:
Si la verificación de un evento afecta la probabilidad de ocurrencia de
otro, el segundo es un evento dependiente del primero.
Ejemplo:
¿Cuál es la probabilidad de obtener un as en una segunda selección de cartas de
una baraja americana?. Ello dependerá de que hayamos escogido un as en la
primera selección.
4 1
A : P (As en la primera selección es) = =
52 13
3
B : P (As en la segunda selección es) =
51
4 3 12
P (A y B) = * = = 0.0045
52 51 2652
Ejemplo 5:Aplicación de eventos dependientes en economía

El cálculo de la probabilidad de un evento dependiente, con un ejemplo
económico aplicando el teorema de Bayes o Inferencia Bayesiana, tomado del
libro del Prof. J. Kazmier e intitulado "STATISTICAL ANALYSIS FOR
BUSINESS AND ECONOM ICS de M C Graw Hill, 1967".
Suponga que la probabilidad de que nuestro principal competidor decida
diversificar su producto es 0.60, y si lo hace hay una probabilidad de 0.80 que
construirá una nueva planta.
Así mismo si decide no diversificarse (0.40), hay la probabilidad de 0.40
de que construirá una nueva planta.

Si D = Probabilidad de diversificarse
Si ~D = Probabilidad de no diversificarse
Si B = Probabilidad de construir una nueva planta
Si ~B = Probabilidad de no construir una nueva planta.
B P(D) P(B\D) = 0.48

0.80
0.60 D
0.20
~B P(D) P(~ B\D) = 0.12
B P(~ D) P(B\~D) = 0.16
0.40
0.40 ~D
0.60
~B P(~D) P(~B\~D) = 0.24
Como puede verse B y ~ B dependen de D y son dependientes, su

probabilidad esta condicionada a la ocurrencia de D. Así, la probabilidad total de
B:
P (B) = P (D) P (B\D) + P (~ D) P (B\~ D)
P= (.6)(.8) + (.4)(.4) = .48 + 0.16 = 0.64
SIM ILARM ENTE

P (~ B) = P (D) P( ~ B\D) + P (~ B) P (~ B\~ D)
P= (.60)(.20) +(.4)(.6) = .12 + .24 = .36
Así P(B ó ~ B) = (0.64) + (0.36) = 1.0
Ahora bien, si vemos que esta construyendo una nueva planta.
¿Esto indica que ha decidido diversificarse?. No, porque la decisión de
construir también pudo haberse tomado con la decisión de no diversificarse.
Así, si deseamos determinar la probabilidad de que nuestro competidor
se diversifique dado que esta construyendo una nueva planta, usamos el
teorema de Bayes, que representa el análisis de la probabilidad condicional
cuando se hace una inferencia hacia atrás, es decir se usa en eventos dependientes
y de probabilidad condicional, para calcular la probabilidad condicional que
permiten hacer inferencias hacia atrás.
De acuerdo con los símbolos usados, para obtener D, se parte de B,
llamada probabilidad posterior que sirve para obtener la probabilidad anterior de
D, expresada así.

P(D \ B) = P(D) P(B\D)

P(B)
P (B) se determina considerando D y ~ D, es decir, cuando se diversifica y
cuando no se diversifica. Del diagrama de árbol vemos que:
P(B) = P(D) P(B\D) + P(~ D) P(B\~D) = (0.6)(0.8) + (0.4)(0.4) = 0.64
P ( D) P ( B \ D) ( 06
. )( 08
. ) 0.48
Luego P ( D \ B) = = = = 0.75
P ( D) P (B \ D) + P ( ~ D) P ( B \ ~ D) ( 0.64) 0.64
Comentarios: Antes de tener la información adicional sobre la
construcción de la planta, la probabilidad de diversificarse era de 0.6, que en el
lenguaje de la inferencia Bayesiana, se denomina probabilidad apriori.
Considerando la información adicional: que nuestro competidor construirá la
nueva planta, la probabilidad de que se diversifique ahora es 0.75 y se
denomina probabilidad posterior.
La probabilidad posterior puede ser mayor o menor que la apriori. V.gr.,
si el competidor decidió no construir la nueva planta, la nueva
probabilidad posterior de diversificarse seria menor que 0.60.
Demostración :
P ( D) P ( B \ D ) (0.6)( 02
. ) 012
.
P ( D \ ~ B) = = = = 0.33
P (D )P (~ B \ ~ D) + P ( ~ D )P (~ B \ ~ D) (0.6)( 02
. ) + (0.4)( 06
. ) 0.36
Igualmente
P ( ~ D) P ( B \ ~ D ) (016
. )
P ( ~ D \ B) = = = 025
P ( ~ D) P ( B \ ~ D) + P ( D) P (B \ D) ( 0. 64)
0.16+0.48=0.64
P( ~ D) P( ~ B \ ~ D) ( 0.24)
P( ~ D\ ~ B ) = = = 067
P ( D) P ( ~ B \ D) + P ( ~ D) P ( ~ B \ ~ D) (0.36)
0.24+0.12=0.36

IV.3.6 PRÁCTICA VI
NOM BRE__________________________________________ GRUPO_____

PROBLEM A 1.- Al mercado concurren tres empresas con los productos A, B,
C,. El número de unidades de A es de 20, el de B es de 35 y el de C es de 45.
Una unidad será elegida al azar entre todas ellas.
1. ¿Cuál es el conjunto de eventos elementales o espacio muestral?
2. ¿Cuál es la probabilidad asociada a cada evento elemental?
3. ¿Cuál es la probabilidad de elegir una unidad del producto A?
4. ¿Cuál es la probabilidad de elegir una unidad del producto B?
5. ¿Cuál es la probabilidad de elegir una unidad del producto C?
6. ¿Cuál es la probabilidad de elegir una unidad sea del producto A o B?
7. ¿Cuál es la probabilidad de elegir una unidad sea del producto B o C?
8. ¿Cuál es la probabilidad de elegir una unidad sea del producto A o C?
PROBELM A II.- En una localidad de 10,000 compradores las opiniones

respecto a dos productos X y Z se manifiestan de la siguiente manera:
1,000 son favorables a ambos.
2,000 a favor de X y en contra de Z.
1,000 en contra de ambos.
4,000 a favor de X y no tienen opinión sobre Z.
1,000 en contra de Z y no tiene opinión respecto a X.
1,000 no tienen opinión respecto a ambos.
Si se elige al azar un comprador, ¿Cuál es la probabilidad de que?:
1. Opinen a favor de X.
2. Opinen en contra de X.
3. No tiene opinión respecto a X.
PROBLEM A III.- Dentro de una rama industrial se encuentran 15 empresas

divididas en tres grupos: grupo M éxico con 6, grupo Puebla con 4 y grupo
Querétaro con cinco. Si denotamos por M , N, y Q como los eventos de
exportar una misma mercancía, determinar las probabilidades siguientes:
1. Sea una empresa del grupo M éxico la que exporte.

2. Sea una del grupo Puebla la que exporte.

3. Sea una del grupo Querétaro la que exporte.
4. Que no sea del grupo M éxico.
5. Que sea del grupo M éxico o Puebla.
PROBLEM A IV.- En una Facultad de Ciudad Universitaria asisten 2,500

estudiantes con las siguientes características:
1,000 son del sexo femenino.
1,200 pesan 58 kilos o más.
De las mujeres 700 miden sobre 1.58.
De los hombres 1,300 miden sobre 1.65.
De los 2,500 uno se elige al azar:
1. Determinar el conjunto de eventos elementales.
2. Cuál es la probabilidad de elegir un estudiante varón.
3. Cuál es la probabilidad de elegir un estudiante que pese menos de 58 kilos.
4. Cuál es la probabilidad de que habiendo elegido a un estudiante varón, este
mida sobre 1.65 metros.

V. DIS TRIBUCIONES PROBABILÍS TICAS (6 y 7)

Este tipo de distribuciones son muy importantes por que una vez
conocido el alcance de cada una de ellas, ampliamos nuestra capacidad de análisis,
ya que a partir del conocimiento de sus supuestos teóricos y de la destreza que
desarrollemos para saber aplicarlos o adaptarlos a fenómenos económicos
específicos, podemos hacer estimaciones de parámetros, probar hipótesis de
trabajo, calcular y utilizar tamaños de muestras para inferir las características de
la población de donde las sacamos, sin tener que estudiarla toda, como sería a
través de un censo.
Par saber como se generan, empezaremos haciendo el símil con una distribución
o arreglo de datos en lo que hemos dado en llamar una distribución de
frecuencias, que es una lista de todos los resultados posibles con la asociación
de una frecuencia observada por cada resultado.
Similarmente, una distribución probabilística también es una lista de
todos los resultados posibles, pero en lugar de la frecuencia observada, se indica
la probabilidad asociada con cada uno de los resultados.
Así, si tres monedas se lanzan al aire y se registran los resultados,
el número posible de águilas en un lanzamiento puede ser: 0, 1, 2, 3.
Aún cuando hay cuatro resultados posibles sólo uno ocurre en el
lanzamiento de tres monedas.
Suponiendo que realizamos o repetimos el experimento de lanzar diez
veces las tres monedas y se registra el número de veces que cae 0, 1, 2, 3. la
tabla que resulta es una distribución de frecuencias.
No de Frecuencia
águilas
Observada
0 2
1 4
2 4
3 0
Si el experimento se repite, en cada ocasión se obtienen resultados

diferentes. Para evitar lo anterior y no conducirnos casuísticamente, es decir,
estar tabulando las frecuencias de ocurrencia de cada resultado posible, en forma
aislada para luego llegar a conclusiones circunstanciales o coyunturales en el
estudio de un fenómeno económico, es preferible tratar de generalizar aplicando
procedimientos estándar de aceptación general en el análisis de los mismos, cuyos
resultados sean creíbles puesto que se maneja una metodología aceptada por la

mayoría. Para ello qué mejor referencia que el enfoque clásico o teórico, con el
que podemos determinar e indicar la probabilidad de cada producto: 0.1.2.3, , ya
que en su lugar determinamos o indicamos la probabilidad de cada producto,
situación que nos evita que cambie la distribución, es decir, siempre será 1/8
para cero aguilas o tres soles; 3/8 para un águila y dos soles; 3/8 para dos águilas
y un sol y 1/8 para tres águilas.
Reiterando, mientras que una distribución de frecuencias lista todos

los resultados posibles con su frecuencia asociada indicando el número de veces
que ocurre cada resultado, la distribución probabilística también lista todos los
resultados posibles con su probabilidad asociada de ocurrencia, así: partiendo
de la definición clásica la cual establece que p = 1/2 = q; donde p =
Probabilidad que caiga "águila" y q = Probabilidad de que no sea "águila"; si
lanzamos tres monedas a la vez y registramos el número de águilas,
generamos una distribución probabilística con ocho resultados posibles, que
agrupados dan:
No de Probabilidad
águilas
0 1 ÷ 8
1 3 ÷ 8
2 3 ÷ 8
3 1 ÷ 8
Uno de los primeros beneficios de estos cálculos es que dada una
distribución probabilística, se puede desarrollar una distribución de
frecuencias esperadas multiplicando el valor de cada una de las probabilidades
por el número total de veces que se repita el experimento.
Frecuencia esperada en el
No de lanzamiento de 3 monedas
águilas
24 veces
0 24 * 1 ÷ 8 = 3
1 24 * 3 ÷ 8 = 9
2 24 * 3 ÷ 8 = 9
3 24 * 1 ÷ 8 = 3
Raras veces la distribución de frecuencias observadas coinciden con la de
las esperadas, que se convierten en la mejor estimación de las primeras si el
experimento se realiza muchas veces. Luego una distribución de frecuencias
esperadas es una distribución probabilística.

S U NATURALEZA Y FORMA DE GENERARLAS
Pueden ser discretas y continuas. Aún cuando existen diferentes maneras

de generar una distribución de frecuencias esperadas, dos son usadas
extensamente en la inferencia estadística: binomial y normal, partiendo
de la definición clásica de probabilidad.
V.1 DIS TRIBUCIÓN BINOMIAL(12)

Es una familia de distribuciones con ciertas características en común.
Una de sus principales características es que maneja datos discretos y no
continuos. Se llama binomial porque se genera de la expansión binomial de q+p.
Puede obtenerse por medio de:
a) Diagrama de árbol.
b) La expansión binomial q + p.
Partiendo del Diagrama de árbol, la distribución binomial gráficamente será
:
Probabilidad de resultados posibles
½ A 1/8
½ A
½ A ½ S 1/8
½ A 1/8
½ S
Origen ½ S 1/8
½ A 1/8
½ A
½ S 1/8
½ A 1/8
½ S
½ S
½ S 1/8
Agrupando los resultados anteriores en torno a una distribución
probabilistica tendremos :
No de Probabilidad
águilas
0 1 ÷ 8
1 3 ÷ 8

2 3 ÷ 8
3 1 ÷ 8
Para construir el diagrama de árbol se supone que los eventos son

mutuamente excluyentes e independientes, lo cual quedo demostrado en la
introducción a la probabilidad.
Como queda indicado la distribución binomial también puede obtenerse de
la expansión de (q + p).
Para ello supongamos que una moneda se lanza al aire dos veces y nos
interesa obtener la probabilidad de que caigan "águilas". Los resultados posibles
son 0, 1, 2 "águilas"; así mismo en el caso de una moneda no deforme, en cada
lanzamiento la probabilidad de obtener águila (p) es 0.5 y la de sol es también
0.5 = q ; tal que q + p = 0.5 + 0.5 = 1. Luego la distribución binomial se
obtiene de (q + p)n donde n = 2 lanzamientos de la moneda. Así, con x
representando águilas.
X P(X)
0 0.25
1 0.50
2 0.25
1.00
(0.5+0.5)2 = (0.5)2 + 2(0.5)(0.5) + (0.5)2

= 0.25 + 0.50 + 0.25 = 1.00
P (0) = 0.25
P (1) = 0.50
P (2) = 0.25
Esto es una distribución binomial. Es probabilística porque muestra cada

resultado posible con su probabilidad de ocurrencia asociada.
Gráficamente.
A ¼
½
P(x) A
½
½ S ¼
Origen
140 A BARAJAS
PROFESOR: GENARO SÁNCHEZ ¼
½ ½
S
1.00
0.75
0.50
0.25
0 1 2 x
Recordando que la probabilidad en su acepción objetiva se refiere a un

proceso repetitivo, el cual genera productos que no son idénticos ni predecibles
individualmente, pero que pueden describirse en términos de frecuencias
relativas, estos procesos son llamados estadísticos ó aleatorios, y los
resultados individuales se llaman eventos.
Un proceso estocásticos puede ser el lanzamiento de una moneda, el

proceso de fabricación de ladrillos o la selección al azar de personas y el
registro de su peso, estatura, ingreso o sexo.
En estos caso el proceso estocástico es el lanzamiento de la moneda, la
fabricación de ladrillos ó el registro de las características de las personas, y lo
que se observa (cara de la moneda, el peso de los ladrillos, el ingreso de las
personas, etc.) es llamado variables estocástica, aleatoria o al azar.
De esta manera una distribución de probabilidad es una lista de todos

los eventos (o valores de la variable aleatoria) que resulta de un proceso
estocástico, y la probabilidad asociada de ocurrencia de cada uno de ellos.
Ahora bien, si p: probabilidad de éxito de x y q: probabilidad de fracaso
de x, los valores de p y q pueden variar pero su suma será q + p = 1.
El número de eventos en la secuencia o número de repeticiones se indica
con el exponente del binomio. Así (q + p) es la expansión binomial que genera
una distribución de probabilidad cuando se lanza una moneda.
Así (q + p)3 es la expansión binomial que genera una distribución de
probabilidad cuando se lanzan tres monedas, el término binomial a expandir será:
(q + p)3 =q3+3pq2+3p2q+p3
Sustituyendo los valores de q y p, donde q = 1/2 = p; tendremos:
(q + p) = (1/2)3 + 3 (1/2) (1/2)2 + 3 (1/2)2 (1/2) + (1/2)3 =
3
= 1/8+3/8+3/8+1/8
Estos resultados son iguales a los obtenidos con el diagrama de árbol y
corresponden a la probabilidad de obtener 0, 1, 2 ó 3 águilas en el lanzamiento de
3 monedas.

El primer término de la expansión indica la probabilidad de obtener cero

águilas y tres soles, el segundo expresa la probabilidad de obtener una águila y
dos soles y así sucesivamente. Luego los exponentes incluidos en cada término
de la expansión binomial son útiles en la interpretación del significado de
cada uno de los términos.
Por otro lado los coeficientes de cada término indican el número de
formas en que se pueden obtener los resultados.
En resumen, la distribución binomial puede generarse de dos maneras:

1º.- Por el diagrama del árbol.
2º.- Por la expansión del binomio (q + p)n
V.1.1 LA MEDIA ARITMÉTICA Y DES VIACIÓN ES TÁNDAR DE LA

DIS TRIBUCIÓN BINOMIAL
Se calculan con el procedimiento usual, solo que se usan probabilidades

en lugar de frecuencias. En el caso de la media:
µ=
∑ Xp( X ) en lugar de X = ∑
xf
∑ p( X ) ∑f
σ=
∑ (x − µ ) p( x ) en lugar de
2
σ=
∑ (x − x ) 2
f
∑ p( x ) ∑f
Como la suma de las probabilidades es igual a 1 los denominadores de las
fórmulas se eliminan y queda :
µ= ∑ xp( x )
σ = ∑ (x − µ ) 2
p( x )
La distribución binomial es simétrica cuando p = q = 1/2; y asimétrica

cuando p es diferente de q.
Gráficamente:
P(X) p=q P(X) p≠q

0 1 2 3 x 0 1 2 3 x
Ejemplo 1
Si el 50% de los hombres empleados en la Cía. Nestle son casados y si
tomamos una muestra aleatoria de dos hombres, ¿Cuál es la probabilidad de
que la muestra contenga 2, 1 ó 0 hombres casados?
p = 1/2 = q
p : probabilidad de que los hombres sean casados.
q : probabilidad de que no lo sean.
c = casado.
s = soltero.
Resultados Probabilidad
posibles de cada resultado
½ c ………………..c c ¼ = 0.25
½ c
Origen ½ s ………………..c s ¼ =
0.25
½ c ………………..s c ¼ = 0.25
½ s
½ s ………………..s s ¼ = 0.25
1.00
Agrupando los resultados en una tabla de frecuencias
(probabilidades) relativas, tenemos:
X P(X)
0 0.25
1 0.50
2 0.25
1.00
Este mismo resultado puede obtenerse con la expansión del binomio

2
(q + p)
(q + p)2 = q2+2pq+p2
= (1/2)2+2(1/2)(1/2)+(1/2)2
= 1/4+2(1/4)+1/4
= .25+.50+.25=1

CALCULO DE LA M EDIA ARITM ÉTICA Y DESVIACIÓN ESTÁNDAR

DE LA DISTRIBUCIÓN BINOM IAL .
X P(X) XP(X) x-µ (x-µ)2

(x-µ)2P(X)
0 0.25 0.00 -1.00 1.00 0.25
1 0.50 0.50 0.00 0.00 0.00
2 0.25 0.50 1.00 1.00 0.25
1.00 1.00 0.00 0.50
Se calcula con el procedimiento usual, solo que se usan
probabilidades en lugar de frecuencias. En el caso de la media, µ:
µ=
∑ xp( x ) en lugar de X = ∑
xf
∑ p( x ) ∑f
µ=1
σ=
∑ (x − µ ) p( x ) =
2
. = 071
050 . en lugar de σ = ∑ (x − x ) 2
f
∑ p( x ) ∑f
Estos resultados µ y σ se obtiene más fácilmente con:
µ = n p ; y σ = npq
donde n = número de veces que se realiza el experimento o tamaño de la muestra:
Si p = 1/2 y n = 2 ; µ = 2(1/2) = 1
σ = 2(1 / 2)(1 / 2) = 0.71
V.1.1.2 LA DIS TRIBUCIÓN NORMAL COMO LIMITE DE LA BINOMIAL

Hemos visto que la distribución binomial es discreta porque sus
términos son enteros. El polígono de frecuencias no tiene otro significado
que el de ilustrar su simetría o asimetría por lo que no se pueden interpolar sus
puntos al no ser fraccionables sus valores.
Sin embargo cuando n crece también lo hace el número de resultados
posibles, tal que el polígono de frecuencias se aproxima a una curva suave y
acampanada que corresponde a la distribución normal. La distribución normal
fue derivada de la estandarización de la binomial usando:
(x − µ ) ( x − np )
la variable Z = que es igual a Z = y con n creciendo sin límite.
σ npq
X P(X) x-µ x−µ Área bajo (y)
Z =
σ la curva Ordenada
0 0.25 -1.00 -1.40 -0.41924 0.14973

1 0.50 0.00 0.00 0 0.39894

2 0.25 1.00 1.40 0.41924 0.14973

µ = n p = 1 ; σ = 0.71
0
0.40
0
(Y)
0
0.15
0
-1.40 -1 µ 1 1.40 z
La normal es simétrica aún cuando p es diferente de q tal que la

binomial con p diferente de q pero con n creciendo tiende a ser normal o
simétrica.
Ejemplo :
n=2 n=20
0 1 2 x
x
P(X)
n=200
x
La distribución binomial también se le llama de Bernoulli, porque fue
quien la desarrolló.

V.2 DIS TRIBUCIÓN HIPERGEOMÉTRICA
A la distribución de probabilidad determinada a partir de una

distribución finita se le llama distribución hipergeómetrica‚.
Para su cálculo se parte de las fórmulas de la binomial obtenida con la
formula de las combinaciones:
n  n!
r  = r!(n − r )! = n C r
 
En este caso tenemos que:
N −n
σ = npq *
N −1
N −n
Conociéndose con el nombre del multiplicador ó corrector finito,
N −1
el cual es útil porque ayuda a mejorar el valor de σ.
Ejemplo 1.-
N = Universo = 200 automóviles
n1 = Automóviles americanos = 120
n2 = Automóviles europeos = 80
r = Tamaño de la muestra = 20
¿Cuál es la probabilidad de que x = 8 sean americanos?. Recordando que
n 
habrá  1  maneras diferentes de obtener 8 automóviles americanos, entonces r -
x 
n 
x: será el número de automóviles europeos tal que  2  maneras diferentes de
r − x 
obtener 12 automóviles europeos.
Luego la probabilidad de obtener 8 automóviles americanos y 12
europeos será:
n1  n2  120 80
 x   r − x 8  12
   =   
N  200
r  20 
   
La distribución hipergeométrica se genera para todos los éxitos (X).
X P(X)
Autos Americanos

12080
0 20
0 . P ( x = 0) =   
200
20 
 
1 .
2 .
3 .
. .
. .
. .
120 80
8  12
8 . P ( x = 8) =    
200
20 
 
. .
. .
12080
20 0 
20 . P ( x = 20) =   
200
20 
 
Suma 1.00
Ejemplo 2
N = 10 personas
n1 = 6 hombres
n2 = 4 mujeres
r=5
¿Cuál es la probabilidad de obtener hombres en una muestra de 5?
Número de hombres Combinaciones P(X)

(X)
6 4
0 4
0    = 1 = 0.0000
10 252
5 
 

6 4
1  4 6(1)
   = 6
1 = = 0.0238
10 252 252
5 
 
6 4
2 3 15( 4)
   = 60
2 = = 0.2380
 
10 252 252
5 
 
6 4
3 2 20( 6) 120
   =
3 = = 0.4761
10 252 252
5 
 
6 4
4 1  15(4 ) 60
   =
4 = = 0.2380
10 252 252
5 
 
6 4
5 0 6(1)
   = 6
5 = = 0.0238
10 252 252
5 
 
.9757 ≅ 1.000
V.2.1 S U MEDIA ARITMÉTICA Y DES VIACIÓN ES TÁNDAR

Calcular la µ y la σ de la hipergeométrica con µ = np = Σ XP(X) y
N −n
σ = npq *
N −1
= ∑ (x − µ )
2
p( x)
2
X P(X) XP(X) x-µ (x-µ) (x-µ)2P(X)
0 0.0000 0.000 -3 9 0.000
1 0.0238 0.024 -2 4 0.096
2 0.2380 0.476 -1 1 0.238
3 0.4761 1.428 0 0 0.000
4 0.2380 0.952 1 1 0.238
5 0.0238 0.120 2 4 0.096
3.000 0.668
µ = Σ X P(X)
µ=3
También se obtiene el mismo resultado con :
µ=np

µ = 5(0.6) = 3
ya que p = 0.6 = probabilidad de obtener "hombre" en una selección simple o
proporción de hombres en la población.
σ= ∑ (x − µ ) 2
p( x ) = 0.668 = 0.81
Como en el caso de la media σ también se obtiene de :

N −n
σ = npq *
N −1
10 − 5
σ = 5(0.6)( 04
. )* = 120
. * 0.55 = 081
.
10 − 1
V.3 DIS TRIBUCIÓN DE POIS S ON

La distribución de Poisson también es discreta y forma parte de la
familia Bernoulli.
La distribución binomial se aproxima a la normal cuando n crece aunque
q diferente de p. Sin embargo cuando p es pequeña la aproximación de la
binomial a la normal no es satisfactoria, por lo que la distribución de Poisson
deberá usarse como una aproximación.
En este caso la probabilidad de x eventos en n pruebas, cuando p es la
probabilidad de que suceda en una prueba simple viene dada por:
( np )x
P ( X ) = e − np *
X!
( m) x
Si np=m entonces P ( X ) = e − m *
X!
e es la base de los logaritmos naturales = 2.71828
Como la binomial, la media de la distribución de Poisson es np = m,
pero su varianza es m por que si:
σ2 = n p q y si q ≅ 1, entonces σ2, = n p = m
Ejemplo:
El gimnasio Gumesindo Brown del D.F. pide un aparato de ejercicios a
M onterrey; este es enviado con 200 tuercas para ser armado aún cuando sólo
requiere 198. Las dos tuercas adicionales son incluidas como reserva para que en
caso de que salieran defectuosas algunas se pudieran substituir con las dos de
repuesto. Las tuercas son hechas por una máquina automática que produce
tuercas defectuosas con una probabilidad de 0.01.
¿Cuál es la probabilidad de que el comprador no tenga suficientes
tuercas para armar el aparato?
p = 0.01
m = n p = 200 (0.01) = 2

n = número total de tuercas = 200

( m) x
P ( X ) = e− m *
X!
1
e −2 = 2
= 0.13534 por lo tanto e-m = 0.13534
(2.71828)
X P(X)
0 0.1353 P(0)= 0.13534*(2)0/0! = 0.13534
1 0.2707 P(1)= 0.13534*(2)1/1! = 0.2707
2 0.2767 P(2)= 0.13534*(2)2/2! = 0.2707
0.6767
P( x > 2 ) = 1.000 - 0.6767

p( x > 2 ) = 0.3232

V.4 DIS TRIBUCIÓN NORMAL(9)
La ecuación para obtener sus ordenadas, dados ciertos valores de X expresados

en las abscisas en unidades de desviación estándar, es:
 −1 / 2σ 2 ( x − µ )2 
 
F(x)= 1/ 2πσ 2 * e
donde:
x = cualquier valor de la variable aleatoria continua;
µ = media de la variable aleatoria normal

σ = desviación estándar de la variable aleatoria normal;
e = 2.71828 ...base del logaritmo natural
π = 3.1416 ,
dándole valores podemos construir la curva normal
Características:
Tiene
forma de campana; es simétrica respecto a su media; es asíntota al eje de
las x o sea que nunca atraviesa el eje de las x.
El área bajo la curva normal es igual a 1 dado que representa la suma de
las probabilidades de todos los resultados posibles de un experimento.
En la vida real hay distribuciones de datos con medias iguales y desviaciones

estándar diferentes o con medias diferentes y desviaciones estándar iguales.
Para uniformarlas o reducirlas a un patrón único(18)., hacemos un cambio de variable ,
x−µ
que designamos con Z = y llamamos variable normal estándar, que tiene
σ
µ = 0 y σ =1 , demostración:
x−µ
∑ σ
su promedio será Z = , como σ es una constante la podemos
N

1∑ ( x − µ )
sacar de la sumatoria Z = σ
N
la suma de la diferencia x − µ = 0 , luego
1[0]
0
Z = σ así tenemos Z = = 0 , lo que queda demostrado
N N
Ahora bien, demostrar que σ z = 1
2 2
 x−µ  x−µ 
∑  σ − z  ∑  σ − 0 
σz = =
N N
( x − µ )2
2
 x−µ 1
∑  σ  ∑ σ 2 ∑ σ (x − µ)
2
2
σz = = =
N N N
Al ser σ 2 una constante la podemos sacar de la sumatoria
 1  ∑(x − µ) ∑(x − µ)
2 2
1
σz =  2 =
σ  N σ N
∑(x − µ) 2
Sabemos que σ =
N
1 σ
Luego σ z = * σ = = 1
σ σ
Con ello ya podemos utilizar los valores de z que están el apéndice A, z es una
distribución teórica como la binomial, poisson e hipergeométrica, pero con datos
continuos que nos ayuda a hacer análisis, como los siguientes, una vez que la
hemos trazado.

µ
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
2
-2σ -1σ µ 1σ 2σ Z
Ejemplo 1 que ilustra como se construye la curva normal(9)
Supongamos que el salario promedio de 15 000 obreros es de 900

pesos con una desviación estándar de 150 pesos. Construya usted la curva
normal con intervalos de 1/2 σ, a partir de µ hasta tres veces sigma.
N = 15,000
µ =$ 900.00
σ =$ 150.00
a) Construya la curva normal.
Comentarios: Los valores de las coordenadas para trazarla vienen en la primera (
valores de Z ) y tercera columna ( valores de las ordenadas para una población
infinita, que fueron calculadas con la ecuación descrita al inicio del
tema)del Apéndice A; basta darle valores a z y encontrar sus ordenadas
correspondientes para graficar en los cuadrantes I y II ( ya que la curva es
simétrica ) del sistema de ejes cartesianos, un número suficiente de puntos, que
al unirlos verificaremos que obtenemos una figura idéntica a una campana.
Sin embargo, cuando la población es finita, como es el caso de este ejemplo,

porque conocemos N, y sabiendo que Z es la abscisa de cada uno de los puntos

que nos van a permitir construir la curva, se debe calcular o acotar, su

ordenada correspondiente a partir de los valores presentados en la tercera
columna del Apéndice A, con la siguiente fórmula:
Yx = N / σ * f(Z)
Xi − µ
Donde Z = del Apéndice A.
σ
Z ; es el valor de la abscisa o dicho en otras palabras, es el valor expresado en
unidades de desviación estándar, de cada uno de los valores originales denotados
con los símbolos Xi
Inicio de la Obtención Ordenadas Determinación

Valores conversión de Z para cada de las
originales a unidades valor de Z en ordenadas
Z una para esta
población población
infinita finita
Xi Xi-µ X − µ f(Z) Yx
Z= i
σ
900 0 0.00 0.39894 39.89
975 75 0.50 0.35207 35.2
1050 150 1.00 0.24197 24.19
1125 225 1.50 0.12952 12.95
1200 300 2.00 0.054 5.4
1275 375 2.50 0.175 1.75
1350 450 3.00 0.0044 0.44
Tabulaciones:
Yx = 15,000 /150 * f(Z)

Yx = 100 ( f(Z) )
La columna f(Z) se encuentra en las tablas del apéndices A, buscando
Xi − µ
primero Z = que lo tenemos ya en las columnas arriba.
σ

Por ejemplo si Z = 0 lo buscamos en la primera columna de las tablas

apéndice A, una vez encontrado nos pasamos a buscar f(Z), que estará en la
columna tres de las tablas.
EJEM PLO 2
El tiempo de duración de 5 000 pilas para tomar fotografías producidas
por una compañía están normalmente distribuidas con media igual a 800 minutos
y σ = 40 minutos.
a) Construya gráficamente la curva normal correspondiente con intervalos de 1/2
de σ hasta 3 veces.
b) ¿Cuántas pilas duran entre 780 y 820 minutos?
c) ¿Cuál es la probabilidad de que al seleccionar una pila esta dure cuando menos
750 minutos?
N = 5 000; µ = 800; σ = 40
a)
Xi Xi-µ Xi − µ f(Z) Yx
Z=
σ
800 0 0.00 0.39894 49.86
820 20 0.50 0.35207 44
840 40 1.00 0.24197 30.24
860 60 1.50 0.12952 16.19
880 80 2.00 0.05399 6.74
900 100 2.50 0.01753 2.19
920 120 3.00 0.00443 0.55
Yx = N / σ * f(Z)
Yx = 5000 / 40 = 125
Yx = 125 * f(Z)
Ahora bien, para contestar el inciso b) tenemos que determinar Z 1 y Z 2 con
Z = Xi - µ / σ
Z 1 = 780 - 800 / 40 = -0.5 unidades de desviación estándar, cuya área es 0.1915
Z 2 = 820 - 800 / 40 = 0.5 unidades de desviación estándar, cuya área es 0.1915
Luego entonces,
P{(X)} = El área de Z 1 = -0.5 a Z 0 + el área de Z 0 a Z 2 = 0.5

P(X) = 0.1915 + 0.1915 =0.383

Para saber cuantas pilas son: 5000(0.383) = 1915 pilas
Aprovechamos para reiterar que la Esperanza matemática E(X) = n p = 100
(0.383) = 38.3%
Para contestar la siguiente pregunta, hacemos:

Xi − µ
c) Partiendo de Z =
σ
Sabemos que Z = Xi - µ / σ
Z 1 = 750 - 800 / 40 = -1.25 unidades de desviación estándar
P{(X)}: el área de Z 1= -1.25 luego el área correspondiente será:
de 0.39435.
P(X ≥ 750 ) = 0.39435 + 0.5000 = 0.89435 ó 89.435 %.
0
750 800
V.5 PRÁCTICA VII
Nombre _______________________________________________________ No
de Cta.______________________ Grupo____________
INSTRUCCIONES: Resuelve los problemas siguientes, anotando el desarrollo de

las principales operaciones y fórmulas empleadas e interpreta los resultados de
cada uno de ellos según su naturaleza.
1.- En una fábrica el 50% de los trabajadores son casados, con una muestra de
tres empleados, ¿cuál es la probabilidad de que:
a) Los tres son casados
b) Uno de ellos sea casado
c) Ninguno sea casado

2.- En una localidad el porcentaje de votantes por el candidato A es de 60% se

toma una muestra al azar de 5 personas, ¿cuáles son las probabilidades de que
en dicha muestra, voten por el candidato mencionado?
a) Ninguna persona
b) M ás de 3 personas
c) Cuando menos 3 personas
3.- El 3% de los tornillos que produce una máquina son defectuosos, ¿cuál es la
probabilidad que de 100 tornillos escogidos al azar cuando mucho haya dos
defectuosos?
4.- Se ha comprobado que el 2% de una caja que contiene 200 pilas, son
defectuosas ¿cuál es la probabilidad que exactamente 3 de ellas sean
defectuosas?
5.- La media de los diámetros interiores de una muestra de 200 rondanas,

producidas por una máquina es de 0.502 pulgadas y su desviación estándar
de 0.008 pulgadas, el propósito para que se destinan estas rondanas permite
una tolerancia máxima en el diámetro de 0.496 a 0.508 pulgadas.
De otra manera las rondanas se consideran defectuosas.
a) Si los diámetros se distribuyen normalmente construye la gráfica
representativa con intervalos de 1/2 de desviación estándar hasta tres
desviaciones estándar.
b) Determinar el tanto porciento de rondanas defectuosas producidas por la
máquina.
c) Cuál es la probabilidad de que al seleccionar una arandela, su diámetro sea
mayor que 0.510 pulgadas.
6.- El tiempo de duración de 5,000 pilas secas para focos fotográficos producidos
por una compañía esta normalmente distribuidos con media igual a 800 minutos
y desviación estándar igual a 40 minutos.
a) Construya gráficamente la curva normal correspondiente con
intervalos de 1/2 de desviación estándar hasta tres desviaciones estándar.
b) Cuántas pilas duran entre 780 y 820 minutos.
c) Cuál es la probabilidad de que al seleccionar una pila esta dure cuando
menos 750 minutos.


VI. MUES TREO
Importancia: Una vez que definimos, explicamos e ilustramos el concepto de

probabilidad, vimos que constituía el eje rector para hacer análisis económico
ampliado, sobre la base de la estadística descriptiva, a partir de la inferencia
estadística ( que se basa en el análisis de una muestra para inferir las
características de la población de la que proviene). Lo anterior fue muy valioso
porque a partir de la naturaleza y número de resultados posibles que se generan
en un experimento, pudimos describir cómo se forman y que características
tienen las distribuciones probabilísticas discretas y continuas.
Así, continuando con su aplicación, ahora veremos como se usa para la obtención
de muestras probabilísticas, que obtendremos de poblaciones finitas e infinitas.
M otivo por el cual es conveniente introducir de manera formal la definición de los
siguientes conceptos:
VI.1 CONCEPTO DE UNIVERS O Y MUES TRA:
UNIVERSO O POBLACIÓN: Se define como la suma de las unidades

elementales.
Si el número de unidades elementales es igual al número de observaciones;
se dice que la población es la suma de las observaciones.
Por ejemplo: Si hay 600 personas e interesa la variable X y el peso en

Kgs. de los personas, cada persona es una unidad elemental y por lo tanto la
población son las 600 personas.
El tamaño de una población se representa generalmente por N. Luego,

una población en sentido estadístico es un conjunto de elementos -generalmente
definida- que puede conocerse por medio de un análisis completo y
exhaustivo.
La población puede ser: FINITA o INFINITA.

El ejemplo de las 600 personas ilustra una población FINITA, una
población INFINITA podrá referirse por ejemplo al número de moscos que hay
en el mundo entero. Cada una de las unidades elementales, tiene varias
características identificables y numerables; es decir que cada característica puede
representarse por un número.

Ejemplo: Si la población es de animales, sus características pueden ser:

-Su peso;
-La dieta a que están sujetos;
-Su producción (según su clase: vacas, gallinas, etc.).
En la teoría de la probabilidad moderna, una población se representa
gráficamente en la siguiente forma:
* * * * * *
* * * * * *
* * * * * *
(R, Q, P)
Donde R representa el conjunto-Universo o población;

Q es una σ álgebra de Boole;
P es la medida de la probabilidad dentro de la población.
Una muestra es un conjunto de n observaciones-unidades elementales-extraídas
de la población. Esta n es el tamaño de la muestra.
Si en el ejemplo anterior se seleccionan 20 personas de la población de
600, se ha tomado una muestra de tamaño: n = 20.
El tipo de muestra y representatividad que se obtiene con ella depende de
la forma en que haya sido extraída la muestra de la población. Así se habla de
procedimients o métodos como el muestreo simple aleatorio, de muestreo
sistemático, de muestreo estratificado, por conglomerados, etcétera. Todos ellos
tienen en común el hecho de que seleccionan la muestra al azar, que se conoce
como muestra probabilística y tiene características importantes que más adelante
describiremos.
METODOLOGIA DEL MUES TREO ES TADÍS TICO. (11)
VI.2 MÉTODOS DE MUES TREO:

Existen: el muestreo empírico y el probabilista. El primero, suele usarse
cuando se tiene un amplio conocimiento del fenómeno que se investigará y
cuando existen estudios previos al respecto; tal que el estadístico tiene
antecedentes y el costo para la investigación es reducido. Este tipo de muestreo
se recomienda cuando no se desea un análisis profundo y preciso sobre las
características del universo que se estudia. Este método resulta en ocasiones

bueno, ya que capta con relativa facilidad las características de la población en

estudio. Como podrá notarse, no es del todo científico y no permite por sí
mismo llegar a estimaciones precisas, resultando difícil realizar inferencias en la
estimación.
El método científico -por lo contrario- proporciona una medida de la
magnitud del error y de la confianza con que se puede tomar los resultados.
Generalmente suele ser más costoso y quizás tome un poco más de tiempo el
realizarlo, en especial cuando hay problema de información sobre el número de
unidades que integran el universo y algunas otras características que permiten el
cálculo rápido del tamaño de la muestra, teniendo además que gastarse cierto
número de horas-hombre en la recavación de la información requerida.
Es recomendable, sin embargo, usar siempre el método científico para
dotar a los estudios de seguridad matemática, aún cuando se tengan que hacer
esfuerzos extraordinarios para conseguir los recursos monetarios necesarios.
En otras palabras, estos términos no son otra cosa más que sinónimos de
una selección aleatoria y una selección arbitraria respectivamente.
Un muestreo probabilístico es aquel cuyo error de muestreo es calculado,
condición que existe solo cuando se usa la selección aleatoria.
La palabra "aleatoria" se refiere al método de seleccionar una muestra,
más bien que a la muestra particular elegida. Cualquier muestra posible puede
ser al azar o aleatoria, por muy poco representativa que pueda ser de la
población, con tal que haya sido obtenida siguiendo la regla de dar una
probabilidad igual a cada una de las muestras posibles.
Por otra parte, una muestra arbitraria o a criterio, es aquella cuyo error
no es determinado ni asignada ninguna probabilidad de selección a los elementos
o unidades que la componen.
VI.2.1 ERRORES DE MUES TREO Y DE NO MUES TREO.
La exactitud o confiabilidad de una muestra, depende de dos tipos básicos

de errores: errores de muestreo, que se reflejan en estimaciones matemáticas
de la precisión de estimadores provenientes de muestras particulares, y se
manifiestan en diferentes formas clasificadas bajo la notación de sesgos o
distorsiones.
Los errores de muestreo se miden a través de las llamadas fórmulas de
error estándar. De acuerdo con estas fórmulas, se hacen estimaciones de la
precisión de estimadores muéstrales particulares y siguiendo el procedimiento
apropiado; estas mismas fórmulas sirven de base para determinar el tamaño
de la muestra requerida, de acuerdo con una precisión especificada

previamente. Las fórmulas del error estándar han sido desarrolladas para una
gran variedad de diseños muéstrales y en la actualidad es una cuestión rutinaria
su aplicación a cada uno de los casos.
Los errores de muestreo surgen de la variación en los estimadores

provenientes de distintas muestras del mismo tamaño.
El valor de los errores determina la precisión con que los valores
muéstrales estiman a los parámetros poblacionales.
La probabilidad de que cualquier estimador caiga dentro de un cierto
rango del parámetro poblacional, se obtiene por medio de la teoría de la
probabilidad para distintos diseños muéstrales.
Así, en base a esta teoría, el margen de error -o error de muestreo- que se
puede esperar con un diseño de muestreo y tamaño de muestra determinados, se
puede calcular a diferentes niveles de precisión bajo el supuesto de una selección
aleatoria, la cual requiere que cada miembro de la población tenga la misma
probabilidad de ser seleccionado. Luego, una vez que se conocen el error
estándar y la precisión buscada, se pueden calcular: el tamaño de la muestra
y los recursos necesarios para la investigación.
Contrariamente, el tema de los errores de no muestreo es a la fecha un
tema que requiere una vasta experiencia y la cual es ajena a la disciplina
matemática.
Incluidas en el concepto de errores no de muestreo, están las

innumerables influencias que tienden a distorsionar o sesgar los estimadores
provenientes de la muestra, la selección arbitraria de los miembros de la
muestra, fraseo perjudicial en las preguntas, actitudes preconcebidas por el
entrevistador y muchos otros factores pueden producir valores muestrales que
no representaran a los valores de los parámetros de la población, no importa
que tan grande sea la muestra.
Distintos a los errores de muestreo, éste tipo de sesgo es independiente
del tamaño de la muestra.
VI.2.2 S ELECCIÓN DE LA UNIDAD DE MUES TREO.
La aplicación de los métodos de muestreo estadístico tiene por objeto,

seleccionar algunos elementos del universo que se trata de estudiar, para
poder hacer inferencias sobre sus características. La selección de estas unidades
se hace a partir de una lista, mapas, croquis, directorios-o una combinación de

estos elementos informativos-, los que deben contener todas las unidades de
interés y permitir determinar la probabilidad de su inclusión; así mismo, que
en el momento de levantar la encuesta, la identificación de cada unidad en la
muestra sea hecha sin ninguna ambigüedad.
Al conjunto de todos los elementos se le llama: MARCO MUES TRAL.
De acuerdo a la forma de seleccionar estas unidades se pueden dar las
siguientes maneras de hacerla:
Reemplazo:
Las selecciones sucesivas de una muestra probabilística pueden hacerse
con o sin reemplazo de las unidades obtenidas en las selecciones previas; por ello
al primer procedimiento se le llama muestreo con reemplazo y al segundo sin
reemplazo.
En el muestreo con reemplazo, al hacer las estimaciones, cada unidad de

la muestra debe considerarse en un número igual al de veces que haya salido en
la muestra.
Etapas:
Las unidades que tengan que investigarse a través del cuestionario,
posiblemente convenga agruparlas y estos grupos a su vez se vuelvan a agrupar y
así sucesivamente. Dependiendo del número de agrupamientos de las unidades
de interés -o últimas unidades de muestreo-, es el nombre que se le da. Si el
marco muestral no presentó agrupamientos, el muestreo se llamará monoetápico
-selección directa de las unidades de interés-; si el marco muestral presenta
agrupamientos de un sólo orden se llamará bietápico, o lo que es lo mismo se
seleccionarán primero los grupos de unidades-de primera etapa-y finalmente
se seleccionarán los de interés o de segunda etapa, y así sucesivamente se tendrá
el muestreo trietápico, tetraetápico, etc.
Probabilidad:
Si las unidades de muestreo en cada etapa son seleccionadas con la misma
probabilidad, el muestreo se llamará equiprobable; en el caso contrario se dice que
es de probabilidades variables de selección en la ó las etapas que correspondan.
Estratos:
La precisión al hacerse las estimaciones básicamente dependen de dos
factores:

a) Del tamaño de la muestra; y

b) De la variabilidad o heterogeneidad de la población.
Es evidente que mientras más grande sea la muestra, representara más
fielmente a la población, tal que se pueden mejorar las estimaciones
aumentando el tamaño de la muestra.
En cuanto al segundo factor para aumentar la precisión, puede dividirse
el marco muestral, -si es que se dispone de los medios necesarios-en clases
homogéneas llamados estratos y seleccionar separadamente en cada estrato una
muestra, garantizando con esta forma cualquier representación deseada de todos
los estratos de la población. La denominación de un modelo de muestreo se
forma indicando estos conceptos-etapa, probabilidad y con ó sin reemplazo.
VI.2.3 MANEJO DE LAS TABLAS DE NÚMEROS ALEATORIOS
La selección de las unidades de muestreo debe hacerse basándose en las

leyes del azar; esto es, debe asignarse a cada unidad del marco muestral una
probabilidad de inclusión en la muestra. Con este método la muestra se obtiene
en selecciones sucesivas de una unidad, cada una con una probabilidad asignada
de antemano, según sea el modelo de muestreo que se utilice, hasta completar el
número de unidades que deben incluirse en la muestra para cada etapa. Un
procedimiento práctico para seleccionar las unidades, es utilizando una tabla de
números aleatorios como la que aparece en el apéndice N de la sección de tablas
estadísticas.
CONS TRUCCIÓN DE LAS TABLAS DE NÚMEROS ALEATORIOS
Estas tablas consisten de dígitos puestos de manera tal que cada uno de
ellos reciba igual probabilidad de ser seleccionados. Estas tablas se construyen
de diferentes maneras:
- Usando la computadora de manera similar al proceso de la ruleta.
- Usando ciertas funciones matemáticas; ó
- Usando instrumentos mecánicos basados esencialmente en el principio de la
ruleta.
El uso de las tablas de números aleatorios puede ilustrarse con el siguiente
ejemplo, relativo a la selección aleatoria de la muestra.
Supóngase que se van a seleccionar tres Escuelas: de M edicina, Veterinaria
y Zootecnia para ser consideradas como muestra de las 18 escuelas de
M edicina Veterinaria y Zootecnia existentes en el país:

Si n = 3 y N = 18. Decimos que el universo está constituido por dos

dígitos; si N fuera 4327, diriamos que está constituido por cuatro dígitos; El
número de dígitos del universo es el límite máximo para trabajar dichas tablas.
Así, en nuestro ejemplo, se hace la relación o numeración de las escuelas que
integrel universo: a cada uno de las 18 Escuelas se le asigna un número de dos
dígitos: 01, 02, 03, ..., 18.
En seguida se seleccionan pares de números de la tabla de manera
consistente.
Por ejemplo: la selección podría empezar en la parte superior de la
tabla, - primera columna -, la siguiente columna, etc.. Esto produce los siguientes
pares de dígitos: 01, 04, 06.
Estos dígitos identifican la escuela en la población que será considerada

como elemento de la muestra.
Si el número par al azar excede el número de unidades posibles de

muestreo (N = 18) como el número 31, el número es ignorado y se selecciona
el siguiente número, 16 -por ejemplo- y al seguir seleccionando para completar
el tamaño de la muestra y ésta vuelve a aparecer, en este caso también se ignora
y se continúa buscando un número distinto a 16 y no mayor que 18.
De esta manera se obtienen las tres escuelas que formarán la muestra.

Esta no es la única manera para seleccionar pares de dígitos en la tabla de manera
horizontal, diagonal, en zig-zag, etc. Lo importante es que el
procedimiento sea consistente.
El segundo medio de selección probabilística, el sistemático, es en

esencia una simple variante del procedimiento anterior. Implica la selección de
las unidades de la muestra de manera sistemática empezando con uno de los
dígitos.
Esto es, si hay N unidades muestrales en la población, y se desean n para
la muestra, cada N/n unidad es seleccionada, empezando con un número
aleatorio.
Así usando el ejemplo anterior cada sexta unidad será seleccionada: (N/n
= 18 / 3 = 6) empezando con un número aleatorio entre 01 y 06 inclusive.
Este número aleatorio se puede obtener también de la tabla de números
aleatorios.
MODELOS DE MUES TREO

Los modelos de muestreo tienen por objeto indicar el número de

unidades que deben incluirse en la muestra, dependiendo de la forma que estas
se seleccionan, de la confianza que se requiera al hacer las inferencias del error de
muestreo que se pueda permitir y del fondo disponible para la realización de la
encuesta.
VI.2.4 MUES TREO S IMPLE ALEATORIO
Recordando que por muestreo probabilista se entiende un método de

muestreo en el que cada miembro de la población tiene una probabilidad conocida
de ser incluida en la muestra. Cuando todos los miembros de la
población tienen la misma probabilidad de ser seleccionados se denomina
muestreo simple aleatorio.
Si una caja contiene seis pedacitos de papel numerados del 1 al 6; si se

desea elegir una muestra de la caja de tamaño 3, sin reemplazo, el muestreo
simple aleatorio indica que la probabilidad de cada uno de los 6 papelitos es 1/6.
Al extraer el segundo, la probabilidad de cada uno es 1/5 y así sucesivamente.
En este caso cada número dentro de la caja tiene la misma probabilidad de ser
seleccionado.
Esto es, la probabilidad del número 4 es igual a:
P (A o B o C) = 1/6 + 5/6 x 1/5 + 5/5 x 4/5 x 1/4 = 3/6.
En general, se puede decir que si el tamaño de la muestra es n y el de la

población N, en el muestreo simple aleatorio, cada miembro de la población
tiene una probabilidad de encontrarse en la muestra de n/N .
Por ejemplo: Si de entre 120 estudiantes se seleccionan 10 al azar y
todos tienen la misma probabilidad de ser elegidos, cada uno de los 120
estudiantes, tiene una probabilidad de 10/120 de estar en la muestra.
Ahora ¿cuál es la probabilidad de seleccionar una muestra de tamaño n a
partir de una población de tamaño N?
Suponiendo de N = 6 y n = 3:
N  6 6! 6!
n  = 3 = 3!( 6 − 3)! = 3!* 3! = 20 muestras posibles
   
Cuando se adopta el muestreo aleatorio simple cada muestra tiene igual

probabilidad de ser seleccionada y es de 1/20.

En general, se dice que cuando se selecciona una muestra de tamaño n, a

partir de una población de tamaño N por muestreo simple aleatorio la
N 
probabilidad de que se seleccione una cualquiera de las   muestras
n 
1
posibles será:
N 
n 
 
Lo anterior se refiere a los casos en que el muestreo se realizo sin
reemplazo. Lo mismo sucede cuando se realiza con reemplazo, aunque en la
práctica se utiliza generalmente el muestreo sin reemplazo.
(11)
VI.2.5 MUES TREO ES TRATIFICADO
De acuerdo con este método, la población se divide en estratos basados en

características consideradas relevantes para el sujeto bajo estudio, y se
seleccionan las unidades de muestreo de cada uno de los estratos.
Por ejemplo: investigando tiendas al menudeo en la ciudad de Cuernavaca;
las tiendas en la ciudad podrán clasificarse primero por tipo de tienda
(abarrotes, farmacias, etc.) y luego por tamaño de tienda. Para cada estrato,
tipo o tamaño de tienda, se puede estimar el número de tiendas y calcularse
cuántas de estas tiendas -unidades de muestreo- deben incluirse en la muestra.
Es común en tales casos, seleccionar la mayoría de las unidades de muestreo de
los estratos conteniendo las tiendas grandes y sólo una pequeña proporción de
unidades de muestreo de los estratos que contienen relativamente pocas
tiendas.
Para que sea útil el muestreo estratificado se deben reunir las
siguientes tres condiciones:
1) Deben conocerse ciertas características relevantes que influencian
fuertemente el fenómeno bajo estudio:
2) Que la población sea susceptible de dividirse de acuerdo con las
características relevantes:
3) La división relativa de la población debe conocerse con cierto grado de
precisión.
Una muestra estratificada puede obtenerse aún cuando no se pudieran
identificar los elementos del estrato, siempre y cuando se conozca después
de haberse seleccionado la muestra. El problema sin embargo, es que los errores
de muestreo de las estimaciones resultan mayores que si se hubiera estratificado
antes.

Si el número de unidades de muestreo seleccionadas de cada estrato es

proporcional al tamaño relativo del estrato en la población, el resultado es una
muestra estratificada proporcional, lo contrario es una muestra estratificada no
proporcional. Esto último es preferible si los diversos estratos no son
homogéneos con respecto a la característica bajo estudio.
El error de muestreo de una muestra estratificada puede considerase

menor que el de una muestra simple aleatoria del mismo tamaño. Lo anterior se
debe a que el diseño de estratificaciones hace uso de información adicional,
considerando la división de la población de acuerdo con las características
relevantes y sirve para reducir el margen de error de muestreo.
El problema con este método, es que aún cuando se conocen las

características relevantes y en base a ellas se estratifica, el tamaño relativo de los
estratos en la población no siempre se conoce con gran exactitud.
Debido a esta escasez de información, las ventajas obtenidas con la

estratificación se pierden con las variaciones introducidas por la información
incorrecta referente al tamaño de los estratos en la población, elemento que
desafortunadamente se subestima frecuentemente.
Los diseños de estratificación se pueden combinar con otras como por

ejemplo:
- M uestreo por área; y
- Los esquemas de muestreo por conglomerados.
Ejemplo de la situación anterior podría ser el siguiente: digamos que M éxico
podría subdividirse en estratos regionales, tales como:
• Norte;
• Sur;
• Este: y
• Oeste.
Con áreas seleccionadas dentro de cada uno de estos estratos o regiones y con
miembros de la muestra seleccionados al interior de cada una de estas áreas, en
grupos o “racimos”. Similarmente, la selección de los miembros de una
muestra estratificada podría realizarse, ya sea usando procedimientos aleatorios
o arbitrarios.
VI.2.6 MUES TREO POLIETAPICO

Este método requiere la selección de las unidades de muestreo en

diferentes etapas, existiendo unidades de primera, segunda, etc.., etapa en un
diseño muestral.
Por ejemplo: si el interés es conocer la opinión de los médicos
veterinarios zootecnistas sobre los programas de estudio de las diferentes
escuelas y facultades de M edicina Veterinaria y Zootecnia y si para ello se
decide realizar la investigación en la ciudad de M éxico, entonces la clasificación de
la ciudad en distritos permite obtener la unidad de primera etapa; la
clasificación en colonias es la unidad de la segunda etapa; la selección de las
manzanas a muestrear es la unidad de tercera etapa; y la selección aleatoria de
los médicos residentes en las manzanas previamente seleccionadas, constituyen la
unidad de cuarta etapa.
VI.2.7 MUES TREO POR ÁREAS
Cuando la población se distribuye sobre un área muy grande, la selección

de los elementos de la muestra de toda el área puede resultar un
procedimiento ineficiente y costoso. Estos es particularmente cierto, si a las
personas que entrevistan se les paga por hora y la mayor parte del tiempo se va
en viajar. El muestreo por áreas fue diseñado para resolver este problema.
Se basa en una subdivisión apriori de la población en áreas; la selección de
algunas de estas áreas con la ayuda de los métodos de muestreo aleatorio y la
restricción a la selección de las unidades que integrarán la muestra, solamente en
esas áreas.
La restricción geográfica sirve para concentrar los esfuerzos de trabajo en

ciertas regiones, provocando reducciones sustanciales en el costo del trabajo de
campo en comparación a una muestra del mismo tamaño proveniente de un
diseño distinto al de áreas.
Esta técnica de muestreo puede usarse para trabajar con muestras
irrestrictas y estratificadas. De hecho en investigaciones de gran escala la
técnica de estratificar áreas es generalmente la regla, porque asegura la
representatividad de todos los segmentos relevantes de la población a costos
bajos.
En cada investigación el diseño de áreas se realiza en varias etapas;
cada etapa sirve para restringir el área geográfica de la cual se seleccionarán las
unidades de la muestra.

VI.3 APLICACIONES
VI.3.1 APLICACIÓN DEL MUES TREO S IMPLE ALEATORIO
Aún cuando este método es el más simple de los clasificados como

probabilisticos, su sencillez no deja de ser útil para ilustrar las ventajas que se
derivan de la aplicación de esta metodología al análisis de fenómenos económicos,
al igual que los demás métodos de muestreo estadístico, se caracteriza por
proporcionar estimación de los caracteres de la población.
Se asigna igual probabilidad de selección a cada unidad perteneciente a la
población. Si N es el número de unidades, la probabilidad de selección de
cualesquiera de ellas es: 1/N .
El número de muestras distintas de tamaño n, sacadas de las N unidades

de la población está dado por:
N  N!
n  = n!(N − n)!
 
Los estimadores obtenidos serán insesgados cuando su esperanza
matemática sea igual al parámetro poblacional:
E( y ) = Y
1
Demostración : y = ∑
n
yi
E( y ) =
∑ ( y1 + y 2 + ...+ y n ) E ( y ) + E ( y ) + ...+ E ( y )
= 1 2 n
= E( y ) =
nY
por lo tanto
n n n
E( y ) = Y
El estimador del total de la población definido por Y$ = Ny es insesgado porque:

E (Y$ ) = E ( Ny ) = NE ( y ) = NY = Y
Aplicaciones: Para ello se supone que se conoce el tamaño de la muestra
requerida, el cual se estudiará posteriormente en detalle.
Objetivo: Se desea estimar el total de familias en la localidad "γ" con una muestra
simple aleatoria cuyo tamaño está dado por cuatro manzanas.
Notación:

F = n/N= Fracción de muestreo.

N = Número de manzanas en la localidad.
Y$ = Población total estimada
y = Promedio de familias por manzana en la muestra
m = Promedio de personas por familia.
El mapa de la localidad revela la siguiente distribución de la manzanas.
1 4 7 12 13
2 5 8 11 14
3 6 9 10 15 16
Las manzanas se numeran siguiendo un orden determinado: ascendente o

descendente en este caso, resultaron ser 16 en total.
Conociendo N = 16 y n = 4 se seleccionará la muestra con la tabla de

"números aleatorios". Suponiendo que las manzanas seleccionadas son:
los número 16, 3, 9 y 11.
En seguida, se hace un listado de las manzanas seleccionadas registrando el
número de familias que existen en cada una de ellas. Los resultados son:
La manzana 16 tiene 4 familias

“ 3 “ 9 “
“ 9 “ 9 “
“ 11 “ 10 “
Recordando que el total de familias se estima por:
1 1 32
Y$ = Ny ; si N=16 y y=
n ∑y i =
4
(4 + 9 + 9 + 10) =
4
=8
Tendremos que Y$ =16(8); Y$ =128 familias en la localidad.

Se puede verificar que el cálculo del total de las familias en la

localidad tenga un 95% de probabilidad de haber caído en el intervalo de
confianza con la siguiente fórmula:
tNs tNs
Ny − * 1 − F ≤ Y$ ≤ Ny + * 1− F
n n
Donde t es el valor de la normal desviada correspondiente a la confianza

de probabilidad deseada cuando n es menor que 30 y s es la varianza muestral.
Como se recordará:
Con α = 5% y un número infinito de grados de libertad se halla en tablas tα =

1.96; sabemos que:
S2 =
∑ (y i − y )2
=
∑y 2
i
− (y)2 =
278
− 8 = 55
.
n n 4
como S = s 2 = 55. = 2.3 y t α = ±1.96, tendremos que

16( 32) (196
. )(16)( 2. 3) 4
Limites de confianza = ± * 1− = 125 a 131
4 4 16
El total estimado de familias (128) se halla entre 125 y 131 con una
seguridad o confianza del 95%.
El número total de habitantes se puede saber multiplicando el total

estimado (Y$ ) por el promedio de personas por familia (m)
Si m= 5.4; Y$ = 128
m Y$ = 5.4(128) = 691 habitantes en la localidad “gama”
VI.3.2 MUES TREO POR ÁREAS , COMBINADO CON EL S IMPLE

ALEATORIO Y EL ES TRATIFICADO.

Por ejemplo: Considérese el siguiente diseño muestral hecho para captar

las características del gasto familiar en consumo en 2002 y 2003.
Se diseñó una muestra probabílistica multietápica del país que fue

dividido en áreas. En un muestreo multietápico, cada persona ( y familia) en el
universo bajo estudio, tiene una probabilidad de ser incluida en la muestra, la
cual esta asociada con las probabilidades de selección de la unidad de muestreo
en la cual se localiza la persona, en cada una de las etapas.
Lo primero que se hizo fue seleccionar con números aleatorios a las

unidades de muestreo de la primera etapa que eran de dos tipos; áreas urbanas
y áreas rurales. En la segunda etapa, con números aleatorios se seleccionaron
áreas más pequeñas o manzanas dentro de las unidades de la primera etapa,
seleccionadas previamente. La tercera etapa consistió en la división de las
manzanas en áreas más pequeñas llamadas segmentos; con números aleatorios
se seleccionaron los segmentos donde el entrevistador debía tener la
información de cada una de las familias que lo integraban. Finalmente dentro de
cada familia todos los adultos más uno de cada tres adolescentes seleccionados
aleatoriamente, contestaron el cuestionario.
En este caso particular el modelo muestral comprendió tres etapas. La

estratificación en el muestreo por áreas se hace generalmente en la primera
etapa ( es decir, laas áreas se integran en estratos), ya que a partir de ella la
población debe dividirse en forma tal, que se asegure la representatividad de los
estratos. En el ejemplo que se ilustra, todas las unidades de muestreo de la
primera etapa, áreas urbanas y rurales, fueron agrupadas en estratos de acuerdo
con ciertos criterios para minimizar la variabilidad dentro de los estratos.
Los criterios usados fueron flexibles ya que el propósito principal era obtener
hasta donde fuera posible homogeneidad en las unidades de muestreo en la
primera etapa de cada una de los estratos, así como la integración de estos
últimos con un número aproximadamente igual de familias. Se seleccionaron
automáticamente 14 áreas urbanas, porque contenían un número de familias
mayor que el establecido por estrato.
Del resto de las áreas urbanas, se seleccionó una de cada estrato, con
probabilidad proporcional a su tamaño. Similarmente en los estratos rurales, un
pueblo o área fue seleccionado con probabilidad proporcional a su tamaño.

En total, se seleccionaron 103 unidades de la primera etapa, conteniendo

191 poblaciones. De las 103 unidades de la primera etapa; 49 eran urbanas y 54
rurales.
Una vez que se han diseñado las áreas y agrupado en estratos, en cada
estrato se seleccionan ciertas áreas usando algún criterio, generalmente se
aplica el llamado “probabilidad proporcional al tamaño", con el cual cada área
tiene una probabilidad ( proporcional ) de ser seleccionada de acuerdo a su
tamaño o significación dentro del estrato. Por ejemplo: Supongamos que
deseamos seleccionar con probabilidad proporcional a su tamaño una de las
siguientes cinco ciudades que integran un estrato:
Población Dígitos
Ciudad Población Acumulada Aleatorios Probabilidad
(en miles)
A 100,000 100 01 - 10 10 ÷ 35
B 40,000 140 11 - 14 4 ÷ 35
C 60,000 200 15 - 20 6 ÷ 35
D 70,000 270 21 - 27 7 ÷ 35
E 80,000 350 28 - 35 8 ÷ 35
Total estrato 350,000 35 ÷ 35
Un procedimiento es la selección de un número aleatorio formado por dos

dígitos de cualquier tabla de números aleatorios, y luego seleccionar la ciudad
cuyo rango de dígitos incluye los números aleatorio. Si el número aleatorio es
mayor que 35, nuevamente se seleccionan otros números hasta obtener uno que
sea igual a 35 o menos.
Por ejemplo: Si el número aleatorio es el número 22 se selecciona la
ciudad D como la muestra del estrato, por que de acuerdo con la penúltima
columna del cuadro anterior, el 22 es uno de los siete dígito que representan
la ciudad D: Si fuera 06, la muestra contendría la ciudad A.
En esencia, se sigue el mismo procedimiento para seleccionar las

manzanas de la segunda y las familias de la tercera etapa del muestreo por
áreas, ya que por lo general no se requieren estratificaciones adicionales. Así,
si la ciudad A es seleccionada en la muestra podría dividirse en manzanas y
seleccionarse con probabilidad proporcional unas cuantas de estas con la ayuda
de la tabla de los números aleatorios.

Una vez seleccionadas las manzanas, las familias se listarán en cada manzana y
el número requerido de ellas se obtendría usando una vez más la tabla de
números aleatorios.
Obsérvese que en poblaciones grandes y dispersas este procedimiento

resulta ventajoso no sólo en la fase de la entrevista, sino también en la fase de
preparación del marco muestral, ya que las definiciones y listados de las
familias solo se hacen para las unidades de la primera etapa que caen en la
muestra y los listados de familias se requieren solamente de aquéllas manzanas
consideradas en la muestra.
VI.3.3 MUES TREO POR RACIMOS O CONGLOMERADOS
Este método, que es en esencia una extensión del muestreo por áreas,
consiste en la aplicación de las últimas unidades del muestreo en localidades
adyacentes en lugar de permitir su dispersión en todas las áreas que
comprenden la muestra.
Por ejemplo: Una muestra de 300 familias podría obtenerse

seleccionando 60 grupos de 5 manzanas en lugar de seleccionar individualmente
a 300 familias.
Esta concentración de las unidades de muestreo reduce considerablemente

el tiempo y dinero estimados para el llenado del cuestionario, por lo que se
aconseja cuando el entrevistador tenga que cubrir una gran área como en el caso
del muestreo en áreas rurales. Sin embargo con este se pierde cierta eficiencia en
la muestra.
Esta pérdida se deriva de la tendencia que tienen por vivir como vecinos
las personas con iguales características, actitudes o aún hábitos de consumo.
Así, una persona de altos ingresos es más probable que este al lado de otra de
igual nivel; y no de una de bajos ingresos, lo que ocasiona que las unidades de
muestreo en lugar de ser independientes estén correlacionadas. M ientras más
alta sea la correlación positiva, menor será la eficiencia del modelo por racimos;
en donde la ineficiencia resulta de la reducción en la precisión de los estimadores
muestrales.

VI.3.4 MUES TREO REPLICADO
Hasta el momento, se han ilustrado métodos que requieren la selección de

una sola muestra de la población. Un procedimiento alternativo es dividir la
muestra en un número igual de sub-muestras y seleccionar cada una de las sub-
muestras de la población como si cada una de ellas fuera la única muestra a
seleccionar.
La muestra total, consiste en un número de sub-muestras replicadas, cada

una de ellas tratando de proporcionar en su área de influencia una imagen
completa del universo. Si se desean entrevistar 400 personas en un área de 10
000 personas, cada: 25, ... (10 000 entre 400) sería entrevistado comenzando
con un número aleatorio entre 01 y 25.
Si se decide seleccionar 5 en lugar de una muestra cuyo tamaño total sea

de 400 personas, cada una de las cinco sub-muestras deberá contener 80
unidades de muestreo. Para ello se puede dividir a la población en 125, (10 000
entre 80 = 125). Son así iguales cada una conteniendo 80 unidades de muestreo;
luego se seleccionan 5 números aleatorios entre 01 y 125 que se consideran, cada
uno como punto de arranque o primer unidad de muestreo que faltan en cada
sub-muestra, se seleccionan progresivamente cada 125 familias. El resultado,
son 5 sub-muestras replicadas o interpenetrantes con 80 unidades cada una,
que agregadas suman una muestra con 400 unidades de muestreo.
VI.4 DEFINICIONES BÁS ICAS (14)

Error de muestreo:
Sea µ el valor de un parámetro de la población que se estudia mediante
el muestreo, y x una función definida mediante la muestra, que estima el
valor de µ.

Error de muestreo = µ − x que debe ser menor o igual al máximo error de

variación permitido ε| µ |; es decir ε| µ | ≥ | µ - x | .; como no conocemos µ
decimos: ε| x | ≥ | µ - x |
VI.4.1 LÍMITES DE CONFIANZA:

Lo antes dicho se basa en el hecho de que cuando no se conocen los
parámetros ( µ y σ ) de la población se pueden estimar recurriendo a
muestras que permiten calcular intervalos dentro de los cuales puede estar
contenido el valor de los parámetros. Estos intervalos se llaman intervalos de
confianza y sus extremos se llaman límites de confianza.
El grado de confianza de que el parámetro está contenido en el
intervalo se determina por el número de errores estándar a los cuales les
corresponde un área bajo la curva que se denomina "coeficiente de confianza"
(ε épsilon ). Al riesgo de que el valor estimado de µ no se encuentre dentro
del intervalo de confianza construido alrededor de la media de la muestra, se le
llama nivel de significación ( α ) y es el área o probabilidad complementaria del
coeficiente de confianza.
Así ε = 1 - α ó ε + α = 1 = área bajo la curva..
De esta manera el intervalo de confianza se determina con:

Límites de confianza = x ± Zασ x
donde: x = M edia muestral;

Zα = Valor especifico de Z en la tabla, asociado con determinado
valor de α y ε;
σ
σX =
n
Error estándar para una población infinita.
n = Tamaño de la muestra;
σ = Desviación estándar de la población.
VI.4.2 DIS TRIBUCIÓN DE MUES TREO (10)

Distribución de Muestras (de medias y proporciones )

Por analogía, la distribución de muestreo que se deriva del universo,
con determinado tamaño de muestra n y σ x , tendrá
σ2
µX = E ( X ) y una varianza ( X ) = para una población infinita y Var
n
σ2 N −n
(X ) = para una población finita donde
n N −1
σ 2 = Varianza del universo. La varianza de X se representa con σ 2X , cuya
raíz cuadrada σ x se denomina ERROR ESTÁNDAR para distinguirla de σ =
Desviación estándar del universo o raíz cuadrada de σ2. Luego en una
distribución de muestreo
σ
µX = E ( X ) y σx =
n
Ejemplo: Supóngase la población N =3 con los términos
(xi) : 1, 2 y 3.
Su; µ =
1+ 2 + 3
=
∑x i
=2
3 N
Su; σ =
(1 − 2) 2 + (2 − 2) 2 + (3 − 2) 2
=
∑ ( xi − µ ) 2
=
2
= 0.81
3 N 3
CUYOS VALORES SON FIJOS
Si tomamos muestras de tamaño 2, esto es n = 2 de N = 3 sin

reemplazo, habrá
N  N! 3* 2 * 1 3* 2 *1 6
n  = ( N − n )! n! = ( 3 − 2)! 2 ! = 1!( 2 * 1) = 2 = 3
 
Interpretación: Hay tres muestras de tamaño 2, cuya composición de

cada una es: 1, 2; 1, 3; y 3,2.
Estandarizando la nueva variable aleatoria X , tendremos:

Ordenada Área bajo

Muestra Xi X i− − µ Xi − µ Yi la curva
Zi =
σX
1, 2 1.5 -0.5 -1.25 0.18265 0.394
1, 3 2.0 0.0 0.0 0.39894 0
2,3 2.5 0.5 +1.25 0.18265 0.394
0 0
σ N − n 0.81 3 − 2 0.81 1
σX = = =
n N −1 2 3 − 1 1.41 2
σ X =0.56(0.7) = 0.4
De lo anterior puede decir que:

No. Desviaciones -0.125 (0.4) ó +0.125(0.4)
o errores estándar -0.05 ó +0.05
que nos sirve para graficar los valores estandarizados de las tres X 15: 1.5, 2.0 y
2.5, obteniéndose:
Observese que aún cuando N = 3, es demasiado pequeña, esta distribución tiende

a la normal por el teorema del límite central. Donde:
Xi : valores originales.
Zi : valores originales ahora expresados en unidades de desviación estándar
µ : M edia del universo.
E ( X ) : Esperanza matemática de las X
Luego usando la distribución de muestreo vemos que hay tres medias
muéstrales (1.5, 2.0 y 2.5) llamadas "ESTADÍSTICAS", que cada una de ellas
puede estimar el valor verdadero del parámetro µx que generalmente se
desconoce su valor en la vida real, el cual podemos estimar que está en el rango
µ − X = error de muestreo, con cierto grado de confianza.
El error de muestreo o precisión en la estimación se mide y se calcula
con las fórmulas del error estándar ( en términos de probabilidad) de la media o
de la proporción según sea el caso.

Así supongamos que deseamos estimar el valor de µx , para ello

supongamos que seleccionamos aleatoriamente la muestra A, que está compuesta
por las unidades de muestreo 1 y 2 y por consiguiente tiene una media
aritmética ( x ) = 1.5 y una desviación estándar de (s) = 0.5.
M uestra Composición M edia de la Desviación estándar

M uestra X y de la muestra (s)
(1 − 15
. )2 + (2 − 15
. )2 0.5
A 1, 2 1.5 = = 0.5
2 2
(1 − 2 )2 + (3 − 2 )2 2
B 1, 3 2.0 = = 1.0
2 2
( 2 − 2.5)2 + (3 − 2.5) 2 0.5
C 2,3 2.5 = = 0.5
2 2
La media ( X ) y desviación estándar (S ) de las muestras difieren según
la muestra elegida, pero;
E ( X i ) = = 2 = µx = µx = ∑ i
6 X
3 N
Se pueden generar distintas distribuciones a partir del cálculo de la
muestra con o sin reemplazo.
Cuando la selección es con reemplazo se usa la fórmula Nn= 32 = 9
Interpretación: hay 9 muestras de tamaño 2, cuya composición es:
Media de la _
Muestra Composició muestra (xi) P (xi)
n
A 1,1 1.0 1 ÷ 9
B 1,2 1.5 1 ÷ 9
C 1,3 2.0 1 ÷ 9
D 2,1 1.5 1 ÷ 9
E 2,2 2.0 1 ÷ 9
F 2,3 2.5 1 ÷ 9
G 3,1 2.0 1 ÷ 9
H 3,2 2.5 1 ÷ 9
I 3,3 3.0 1 ÷ 9
18.0 9 ÷ 9
µx = ∑x i
=
18
= 2 = E( x)
N 9

1/ 9 + 1.5 / 9 + ... + 2.5 / 9 + 3 / 9 18

µx = E ( x ) P( x ) = = =2
9 9
Las distribuciones de muestras más importantes son:
a) De muestreo: M edias, que se obtienen con: Teorema de Límite Central y
Ley de los Grandes Números.
b) De proporciones. que también se obtienen con el Teorema de Límite Central y
la Ley de los Grandes Números.
Por otra parte cuando el tamaño de la muestra (n) y la población (N) son
grandes, el número de muestras es muy grande; por lo que se recomienda
simplificar el procedimiento de obtención de muestras probabilisticas.
Con este objeto, se usa el teorema del Límite Central para demostrar que
se puede utilizar la media de la muestra para representar la media de la población.
El teorema del Límite Central, establece que si una población es
normal, con media y desviación estándar, µx y σx, entonces si tomamos
muestras de tamaño n y a estas les calculamos sus medias aritméticas, la
nueva distribución constituida por las medias de las muestras, es una
distribución muestral, normal con:
σx
µ x = E (x ) y σ x = para una población infinita
n
La ley de los Grandes Números establece que si una población tiene µx y
σx independientemente de que sea o no normal; si el tamaño de la muestra n
crece, entonces la distribución que resulta de las medias muestrales se
aproximan a la normal con µx y σ x . Luego:
Medias de las muestras P( X )

(X )
1.5 1 ÷ 3
2.0 1 ÷ 3
2.5 1 ÷ 3
1.5 2.0 2.5 6

Ε( x ) = + + = = 2 = µx = µ
3 3 3 3
. − 2) + (2 − 2 )2 + (2.5 − 2) 2
(15 2
0.50
σx = = = 017. = 0.4
3 3
σx
también σx se obtiene con σx = cuando n es muy grande
n
σx N − n 081 . 3 − 2 0.81 1 0.81
σx = = = = (0.7 ) = (057
. )(0.7 ) = 0.4
n N −1 2 3 − 1 141 . 2 141.
σx = 0.4

Gráfica de la nueva distribución de muestreo con µx = 2 y σx =0.4

P (X )
1/3
0 1.5 2.0 2.5 Xi

valores originales, sin estandarizaciòn
Si se desea calcular el intervalo de confianza dentro del cual se halle contenido el
valor de µ, para calcular el intervalo de confianza el investigador determina el
grado de confianza, (ξ ) deseado en la estimación. El grado de confianza lo
determina el número de errores estándar deseado, que en términos de
probabilida, a su vez determina el error de muestreo.
Sabemos que n =2
x = 1.5
s = 0.5
con ξ = 95% probabilidad (área bajo la curva) de que µx se halle en el intervalo

X ± Zασx ; donde α = 5% = probabilidad de que no sea así, se denomina nivel de
significación.
Derivado de lo anterior diremos que a un ξ = 95% le corresponden 1.96
errores estándar = 1.96 σx = Zασx .
s 05
. 05
.
Así X ± Zασx y como; σx = = = = 0.35
n 2 1.41
por lo tanto 1.5 ± 1.96 (0.35)

1.5 ± 0.70
luego el límite inferior del intervalo es 0.80 = 1.50 - 70 y el límite superior del
intervalo es 2.20 = 1.50 + 0.70.
Interpretación: Hay una probabilidad del 95% que el valor µx se halle
en el intervalo de 0.80 a 2.20.
Generalizando, si la muestra seleccionado hubiera sido la B o la C,
tendríamos:
B C
X =2 X = 2.5
s = 1.0 s = 0.5

n=2 n=2
s 1 1 s 0.5 0.5
Para B σ x = = = 0.70; para C, σ x = = = 0.35
n 2 141
. n 2 141
.
X ± ZασX X ± ZασX
2 ± 196
. ( 0.70) 2.5 ± 1.96( 0.35)
2 ± 137
. 2.5 ± 0.70
Intervalo: De 0.63 a 3.37 Intervalo: De 1.80 a 3.20

Conclusión: En los tres casos el valor de µx = 2 se halla contenido con una
seguridad, probabilidad o confianza del 95% y con un riesgo de α = 5% de que no
sea así, en los intervalos antes calculados.
Gráficamente.:
0
− −
x − Ζα
σ x
µ x x + Ζα σ x
A: 0.80=1.5-0.70 1.5 1.5+0.70=2.20

B: 0.63=2.0-1.37 2.0 2.0+1.37=3.35
C: 1.80=2.5-0.70 2.5 2.5+0.70=3.25
Si conectamos estos resultados con la definición básica de que el error de

muestreo (x − µ ) se determina con el error estándar de la media , en términos
de probabilidad, σ x , y con la situación ideal de que siempre esperamos que el
error de muestreo sea igual o menor al error permitido (e), observamos que:
1.- con la muestra 1: e µ x ≥ x − µ ya que e=0.70 ≥ 1.5 − 2.0
2.- con la muestra 2: tenemos e= 1.37 ≥ 2 − 2 y
3.- con la muestra 3: vemos que e= 0.70 ≥ 2.5 − 2.0 ,

en los tres casos es satisfactorio ver que el error de muestreo es inferior al error
permitido.
Nuevo ejemplo; ahora supongamos que ε = 50% y Zα = 0.68.
luego α = 50%
Limites Contiene a
Muestr X s σX Zα Zασ X Inferior Superior µx
a
A 1.5 0.5 0.35 0.68 0.238 1.262 1.738 No
B 2.0 1.0 0.70 0.68 0.476 1.524 2.476 Si
C 2.5 0.5 0.35 0.68 0.238 2.262 2.738 No
La muestra A y C no contienen a µx porque el grado de confianza ξ es
muy bajo; es decir hay menos área sobre la curva que ocasiona una Zα muy baja
que al ser combinada en Zασ X originan un intervalo más pequeño en torno a X ,
en la fórmula X ± Zασ X , con lo que aumentan la probabilidad α, de que X
no represente a µx.Estos resultados se corroboran con el suguiente análisis:
Con la muestra 1: e=0.238 ≤ 1.5 − 2.0 , por eso el intervalo de confianza no

contiene a la media poblacional;
Con la muestra 2: e= 0.476 ≥ 2.0 − 2.0 , por eso contiene a la media poblacional y
con la muestra 3: e= 0.238 ≤ 2.5 − 2.0 , por eso no contiene a la media
poblacional.
VI.4.3 ERROR PERMITIDO Y ERROR DE MUES TREO.

De lo anterior podemos decir que e = error permitido = Zασ X .
Se dice que es el error permitido; α y n condicionan los valores de Zα y
de σ X .
x − µx σx x − µx
Así, como: e = Zα σx = * = σx = x − µx
σx n σx
e = x − µx = error de muestreo; también: e µx = error permitido.
Idealmente siempre queremos que e µx ≥ x − µx . Observe que

ambos requieren del error estándar (σx ) para su cálculo.
Por otra parte mostrando los valores de mayor uso de Zα, ξ y α, de la
ecuación (1) tenemos: (σx ) para su cálculo.
X - Zα σx ; límite inferior del intervalo

X + Zα σx ; límite superior del intervalo
Zα 1.00 1.96 2.00 3.00

ξ 0.68 0.95 0.955 0.997
α 0.32 0.05 0.045 0.003
Ejemplo: Se desea conocer el ingreso medio de los trabajadores de la Cía. PEPSI
COLA con el fin de estudiar las condiciones de trabajo y en su caso pedir
mejorías en la revisión del Contrato Colectivo de Trabajo. Para ello
seleccionamos una muestra aleatoria de 49 trabajadores cuyo ingreso medio es de
$ 5,500 /mes.
Estudios previos realizados por la Facultad de Contaduría y

Administración revelan que la σ del universo es de $ 700/ mes. Con α = 5%,
estimar el ingreso medio de los trabajadores.
n = 49 X ± Zασ X
sustituyendo
σ = 700/mes 5500 ± 1.96(100)
X = 5500/mes 5500 ± 196
α =5%
Zα = ± 1.96
σx 700
σx = = ; ; por lo tanto σx = 100
n 49
Limites de confianza = 5,500 ± 196

Intervalo de confianza : 5,304 a 5,696
donde el límite inferior = 5,304
el límite superior = 5,696
INTERPRETACIÓN: El ingreso medio µx de los trabajadores de la PEPSI se
halla entre los $5,304 y $ 5,696 con una probabilidad o seguridad del 95%.
0.95
0.025
0.025
5,304 5,500 5,696

x − Zα σ x x x + Zα σ x
En este caso se estima µx con la variable aleatoria asociada x mediante X

proveniente de n = 49 con α = 5% y un ξ = 95% que les corresponde una Zα
= 1.96 = Número de desviaciones estándar y σx = 100,
tal que:
P( x − Zασx ≤ µx ≤ x + Zασx ) = 1 − α = 95%; en otras palabras digamos que
e µx = 6% con µx tenemos:
P µx − x ≥ e µx = 0.06 µ x = 1 − ξ = 1 − 0.95 = 5% = α
Ello significa que el error en la estimación del valor de µx en valores
absolutos es:
| error en la estimación de µx | = Zx σx , por lo que
error máximo permitido = error en la estimación de e µ x
Derivado de lo anterior se puede escribir e = Zα σx
Gráficamente dichas relaciones se ven así:

0
µ x = E( x )
x − 1σ x x +1σ x
x − 2σ x x + 2σ x
x − 3σ x x + 3σ x
σ
donde σx = para una población infinita
n
σ N−n
σx = para una población finita
n N −1
VI.5 DETERMINACIÓN DEL TAMAÑO DE LA MUES TRA (n)

Sabemos que:

σx
e = Zασx como σx = para una población infinita
n
σx
e = Zα
n
σx
n = Zα
e
2
 σx  Zα 2σ 2 x
n =  Zα  = para una población infinita.
e  e2
Z 2ασ x2 N
n= 2 para una población finita.
e N − e 2 + Zα 2 σ x2
Ejemplo: En una población infinita ¿qué‚ tamaño de muestra será necesario para
producir un intervalo de confianza del 90% en que está la media de la población
verdadera, con un error permitido de 1.0 en cualquier sentido si la desviación
estándar de la población es 10.00?
Solución: Sabemos que σ x = 10.0

e = 1.0
Zα = ± 1.65
para α = 10 %
2 2
 σx   100 . 
n =  Zα  = 165
.  = (1.65) 2 = 272.2
 e   10
. 
Con este tamaño de muestra de 272.25 aseguramos que el error de muestreo =

x − µ x ≤ error permitido = Ζα σ x donde σ x = σ x
n
Así, con Ζ α = 1.65 y σ 10

x =
272. 25
16.5
e = 1.65( 10 / 272.25 ) = = 1 =error permitido = errordemuestreo , lo cual
16.5
es muy aceptable.
También, si sabemos que el error estándar = 10/16.5= 0.606
Luego aplicandolo al error permitido (e) en términos probabilisticos tendremos
que e = 1.65(0.606)= 1, se comprueba que el error de muestreo se mide con el
error estándar en términos probabilisticos.

CONSIDERACIONES:
N
1. Hay ocasiones en que conocemos N, en ese caso n =
Ne 2 + 1
Ejemplo: Con N= 603 y e= 5%
603 603
Tenemos n = = = 24047
.
1 + 603( 005
. ) 2
2.5075
1
2. Cuando no conocemos nada n = 2 digamos si e = 5 %
e
1 1
n= = = 400
(0.05)2 00025
.
3. Trabajando con proporciones o atributos diremos que en el muestreo simple
aleatorio: cada elemento tiene la misma probabilidad de ser seleccionado y,
por ejemplo con n = 300 y α = 5%, ξ = 95% Zα = 1.96, el error permitido (e) o
margen de error permitido para p = 0.5 = q será igual a:
pq ( 05
. )(05
. )
e= * Zα = *1.96
n 300
e = σp * Zα = 5%
VI.5.1 EVALUACIÓN DEL TAMAÑO DE LA MUES TRA 1

Z 2σ 2
Partiendo de n = donde e: es el error mínimo permitido, que lo
e2
determina el investigador, ya que sólo él está en condiciones de fijarlo para
aceptar su resultado muestral. Por ejemplo puede especificar que si la media
obtenida de la muestra es $ 6 mayor o menor que la media verdadera
(poblacional), considerará que el estimador x obtenido mediante la muestra es
satisfactorio. Por lo tanto e = $6, y el intervalo de confianza es x ± $ 6.
Zα se establece mediante el nivel de confianza del intervalo; por
ejemplo si el investigador desea que el resultado de la estimación sea
ξ = 99.73% prácticamente seguro, ξ= 99.73%, de que la media estimada de la
población con base en la muestra esté dentro del recorrido de la verdadera media
de la población ± $ 6 ó µx ± $6, el valor de Zα es 3.
Así, una vez que tenemos el tamaño de la muestra, el resultado de la
muestra debe ser evaluado. Esto puede ser hecho encontrando el ERROR
1
Tomado del Profesor Stephen P. Shao.

ESTÁNDAR DE LA M EDIA Sx , de acuerdo con la desviación estándar de la

muestra s$ .
45
Si el producto de Zα Sx es menor que el error de muestreo

especificado, la estimación de la muestra es considerada satisfactoria. Si el
producto es mayor, el tamaño de la muestra deberá ser revisado e
incrementado.
Ejemplo: El Gerente de una estación de servicio desea muestrear las notas de
venta a fin de encontrar la cantidad (media) promedia por venta durante un
período dado.
Para ello indica que 1) el máximo error muestral no deberá ser mayor que
20 ¢ por arriba o por abajo de la verdadera media; 2) el nivel de confianza deberá
ser ξ 99.73%; y 3) la desviación estándar de la población basada en su
experiencia, es estimado en 80 %. Encontrar el tamaño de la muestra adecuada
con estas especificaciones.
SOLUCION:
1.-El intervalo de confianza es µx ± $ 0.20 luego e = $ 0.20
2.-Para ξ= 99.73 tenemos Zα = 3
 Zασ x 
2 2
 3(0.80) 
3.- n =   =   = 12 2 = 144 tamaño de la muestra
 e   0 .20 
Ahora suponga que trabajando con esa muestra seleccionada
aleatoriamente se aplica y encontramos:
x = $ 2.70
s$ = $ 0.72
S$ 0.72
luego Sx = = = $0.06
n 144
Construimos el intervalo de confianza :

x ± ZαSx = 2.70 ± 3(0.06) = 2.70 ± 0.18 = 2.52 a 2.88
Puesto que Zα S x = 0.18 = error de muestreo es menor que el error permitido

e = 0.20, se acepta el tamaño de la muestra.
Sin embargo ahora supóngase que con; n = 144 s$ = $ 0.84, entonces
S$ 084
.
Sx = = = 0.07 luego:
n 144
x ± ZαSx = 2.70 ± 3(0.07) = 2.70 ± 0.21

Como el error de muestreo calculado 0.21 es mayor que el error permitido (e =

0.20), el tamaño de la muestra se revisa como sigue, partiendo de una población
infinita:
 ZαSx 
2
. ) 2
 3(084
n= =  0.20  = 158.76 = 159
 e 
Por lo tanto el tamaño de la muestra aumenta a 159.

Ahora bien; con Sx = 0.80
¿Cuál es el tamaño de la muestra si ξ = 95.45 % y Zα = 2 ?.
2 2
 ZαSx   2(0.80) 
n=  =   = 82 = 64
 e   0.20 
De este ejemplo numérico se deduce que el tamaño de la muestra depende

significativamente de los valores que tomen e, Zα, σ x . En poblaciones finitas, N,
es determinante.
Una vez establecida las "definiciones básicas" a continuación empezamos
a aplicarlas en temas fundamentales que constituye la ESTADISTICA
INDUCTIVA moderna.
Aún cuando la exposición y composición de estos temas no es fácil, yo

espero que el esfuerzo didáctico que adopte le permita al lector su fácil
entendimiento y manejo continuo en la solución de problemas de su empresa,
principalmente, en las áreas de ventas, compras, producción, organización y
finanzas.

VI.6 PRECIS IÓN - ERRORES DE MUES TREO
Como se indicó, la confiabilidad en las estimaciones se mide por medio de

los errores de muestreo, que a su vez, se determinan con las fórmulas de los
errores estándar, en términos de probabilidad, es decir: Ζ α . Con ese propósito
σx
a continuación ilustramos las fórmulas de los ERRORES ESTÁNDARES de
los principales diseños muestrales, las cuales son muy importantes ya que a
partir de ellas se calculan:
a) Tamaño de la muestra,
b) Límites de confianza,
c) Errores de muestreo y
d) Se prueban hipótesis.
Muestreo simple aleatorio

σ N −n N −n
σx = ; con proporciones: σ p = p * q
n N *n N *n
Muestreo estratificado.
k
N − ni k
Ni − n
σ x = ∑ wi2 si2 i
N i * ni
; con proporciones: σp = ∑w i
2
pq
Ni *n
i=1 i =1
2 = pq
Si
donde:
i: estratos: 1,2,3,4,5,.....,K.
Ni
Wi : Proporción del estrato en la población =
∑N i
ni
Pi = ; n= tamaño de la muestra; ni= muestra en el estrato i-ésimo, Ni = estrato
n
i-ésimo.
Muestreo replicado
Xmax − Xmin K (Z − K )
σx =
K Z ( K − 1)
donde:
X max: La media mayor en la muestra replicada.
X min: La media menor en la muestra replicada.
Z : Tamaño de cada zona
K : Número de replicaciones.

Ejemplos aplicando los errores estándar en la determinación de la

precisión.
Se desea estimar con un 95 % de confianza, la proporción verdadera de
familias que tienen encendida su T.V. entre las 7 y 10 de la noche. En otras
palabras, se busca el intervalo alrededor de la proporción muestral.
Con N = 10,000 familias
Con n = 400 familias con televisión.
VI.6.1 MUES TREO S IMPLE ALEATORIO (11)

Se selecciona una muestra aleatoria y se encuentra que 280 de las 400
televisores están encendidos una o más veces en el tiempo señalado, luego el
porcentaje muestral es igual a:
ni / n = 70% = 280/400
N −n
σ p = p*q =
N *n
10, 000 − 400

σ p = 070
. ( 030
. ) = 2.3%
10,000( 400)
Por motivos prácticos decimos que en una muestra grande, dos errores estándar
proporcionan el intervalo de confianza del 95.45 %, para la proporción
verdadera de TV encendidas entre los 7 y 10 de la noche; la estimación del
intervalo será:
70 % ± 2 ( 2.3 ) ó entre 65.4 % y 74.6 %.
VI.6.2 ES TRATIFICADO:
Nº de T.V.
encendidas
Estrat Ni Nº de entre 7 y 10 hrs. Pi =ni / n
o entrevistas
n ni
1 7,000 200 160 160 ÷ 200 = 80 %

2 1,000 100 40 40 ÷ 100 = 40 %

3 2,000 100 60 60 ÷ 100 = 60 %
10,000 400 260
7 ,000 − 200 1,000 − 100 2 ,000 − 100

σ p = (0.70) 2 (0.8)(0.2) + ( 010
. ) 2 ( 04
. )( 06
. ) + ( 0.20)2 ( 0.6)( 04
. ) =
7 ,000 * 200 1,000 * 100 2 ,000 * 100
00003807
. + 0.0000216 + 0.0000912 = 0.0004935 ; σ p = 0022
. ó 2.2%
En este caso, el intervalo es 65 % ± 2(2.2 % ) ó entre 60.6% y 69.4%.

VI.6.3 REPLICADO:
Aquí suponga que se usaron los 5 diseños replicado: 5 muestras de 80

personas fueron seleccionadas de la población; de cada una de las 125
zonas registradas
Replica Nº T.V. P
entrevistas encendidas
1 80 59 74 %
2 80 57 71 %
3 80 61 76 %
4 80 53 66 %
5 80 62 78 %
Total 400 292 73 %
0.78 − 0.66 5(125 − 5)

σx= = 0026
. ó 2.6%
5 125 * 4
El intervalo es 73 % ± 2 (2.6 %) ó entre 67.8 % y 78.2 %.
Vemos que el menor error estándar se obtiene en el muestreo

estratificado, razón por la que siempre se recomienda usarlo.
VI.6.4 TAMAÑO DE LA MUES TRA
Por su importancia derivada de los ejemplos anteriores, veamos de

nuevo como se obtiene el tamaño de la muestra (n) a partir de las fórmulas del
error estándar, en este caso de una proporción.
Se toma una muestra para estimar entre otras cosas, la proporción de
familias viendo T.V. en la tarde entre semana.
Se desea que ese estimador esté entre el 5 % del porcentaje actual con
95% de seguridad.
N = 10,000
S2= para un porcentaje = p*q
p = .5 por seguridad, es decir, trabajando con variancia máxima.

σ p debe ser tal que 2 σ p incluyan el 95% de los estimadores de p, luego 2 σ p =

0.05 de aquí qué σ p =0.025
N −n pqN − npq
De σ p = p * q ; σ 2p = tenemos n ( Nσ 2p + pq) = Npq
N *n Nn
Npq
n= entonces
pq + Nσ 2p
( 025
. )(10,000)
n= = 385 familias
( 0.25) + 10, 000(0.025)2
Vemos que el tamaño apropiado seria de 385 familias y no 400 para
hacer la investigación.
De manera similar, se puede obtener los tamaños de muestra para cada

uno de los modelos muestrales bajo estudio.
Resumiendo: en forma didáctica y sencilla hemos expuesto las

características de los principales diseños de muestreo de mayor uso en economía.
En este sentido, como una de sus aplicaciones es en la elaboración de
ENCUESTAS, a continuación presentamos la relación de actividades que deben
de efectuarse para hacer una encuesta.
Para afianzar el conocimiento decidí explicar algunas de las

actividades, como son las siguientes:
i) DIS EÑO DEL CUES TIONARIO

El diseño de un cuestionario, involucra la consideración de un sin
número de aspectos diferentes, de los cuales quizá los más importantes son:
- Los objetivos del estudio;
- La forma que debe tener;
- Si contendrá preguntas abiertas - codificación previa o posterior de las
preguntas;
- La forma como se harán las preguntas;
- La organización e instrucción del cuestionario; etc.
Lo que también indudablemente determina su diseño es el tipo de datos
que se desean obtener; el método usado para obtenerlos y en última instancia el
uso de los resultados. Adicionalmente, podría señalarse que el diseño depende

fuertemente de los antecedentes y experiencias del investigador, el tipo de

entrevistadores disponibles, costo y tiempo.
Así, basándose en los formatos de la tabulación del guión de
información, los rangos probables de variación tomados de las experiencias
anteriores - si las hay - y las posibles respuestas, el cuestionario debe diseñarse
en forma simple, fácil de seguir y si es posible atractiva.
Lo último es particularmente importante en el caso de los cuestionarios

que se envían por correo, donde la decisión de los miembros de la muestra,
sobre llenarlo o no, depende de la impresión que tengan sobre la apariencia
del cuestionario. Al respecto, se aconseja recabar la información a través de
entrevistas directas, ya que el enumerador puede inmediatamente captar los
datos en forma precisa o corregirlos cuando el caso lo amerite.
El formato del cuestionario puede tener entradas múltiples o una sola;
puede ser de preguntas cerradas o abiertas; las respuestas pueden estar
precodificadas o no; cuando las preguntas son abiertas, las respuestas se
codificarán con base en un INSTRUCTIVO DE CODIFICACIÓN.
ii) TRABAJO DE CAMPO

Es conveniente mencionar que existen diversos métodos para la
recolección de datos, de los cuales los principales son:
a) La selección de la muestra a partir de la información de los archivos de la
empresa. Así, una muestra puede ser escogida sin mayor problema y al
mismo tiempo los datos pueden ser obtenidos con alto grado de confianza a
un costo relativamente bajo. Además de que la muestra puede mantenerse
continuamente sin representar mayores cargos o esfuerzos extraordinarios;
b) M étodos de observación: La recolección de los datos por observación,
es otro instrumento que indirectamente capta la información. Como la
información interna, este método no requiere contacto directo con los
elementos de la muestra. Estos métodos se utilizan observadores humanos
y/o mecánicos, prefiriendo los primeros en casos donde haya que distinguir;
por ejemplo: los adultos de los niños, o las personas por sexo.
c) Entrevistas telefónicas: cuando se puede aplicar este método resulta

altamente eficiente en la recolección directa de la información. Lo anterior,
se debe a que la población virtualmente esta contenida en un directorio y la
selección de la muestra, se convierte en una actividad de rutina. Las
entrevistas son de lo más económico -excepto cuando hayan que hacerse
bastante llamadas de larga distancia- y los datos se obtienes

rápidamente. Sin embargo, como los demás métodos, también tiene sus
limitaciones. Obviamente no es aplicable si las entrevistas comprenden
cuestiones visuales - publicidad, pruebas de interpretación, etc. - . A la
vez, información altamente personal se obtiene con menos éxito por teléfono
que -por ejemplo.- a través de una entrevista personal.
d) Entrevistas personales: dentro de las formas directa de obtener los datos, este
método es sin lugar a dudas el más popular, por referirse a una conversación
directa " frente a frente " entre un miembro de la muestra y el entrevistador.
Como resultado, se puede obtener una gran variedad de información con
este método, el cual es flexible en varios sentidos. Por ejemplo, los datos
pueden ser registrados en grabadora o en cuestionarios.
La construcción de los cuestionario es un arte en si; requiere

numerosas precauciones para evitar respuestas sesgadas.
Desde el punto de vista de la obtención de los datos, puede decirse que
existen dos formas de entrevistar: En un extremo se haya la entrevista
altamente estructurada, en la cual se prepara un cuestionario formal y las
preguntas se hacen bajo instrucciones precisas y el entrevistador mantiene
un orden estricto para su contestación.
Esta forma, se usa generalmente para obtener una variedad de
información diferente acerca de una materia, siguiendo algún orden particular.
Esta forma en cierto modo, evita que la información recabada refleje sesgos
debidos a juicios personales de los enumeradores.
En el otro extremo esta la entrevista carente de formalidad para la cual no
se requiere un cuestionario, basta una lista de preguntas generales o temas
relacionados con la información que se busca.
Dentro de estos extremos, existen varias combinaciones. El
enumerador puede usar un cuestionario estructurado, pero se le permite hacer las
preguntas como el quiera.
Como podrá intuirse, el enumerador es la piedra angular de una
entrevista, indistintamente de la forma que adopten para entrevistar o cual sea la
unidad de muestreo. Si está debidamente entrenado (a), no solamente
entrevistará a un mayor número de personas, sino que los datos serán más
confiables.
Parece que los mejores enumeradores son personas entre los 25 y 50
años, que tienen una evidente disposición, son inteligentes, poseen cierta
cultura, son flexibles y precisos en sus hábitos de trabajo.

Indudablemente que la experiencia es útil, pero si se proporciona un buen

entrenamiento puede no ser necesaria. En ciertos tipos de nuevas encuestas, la
experiencia puede ser una limitante, ya que se requiere que el enumerador siga
procedimientos contrarios a los acostumbrados en el pasado.
Por lo que se refiere a la organización y control del trabajo de campo,
como las demás etapas requiere una programación de tiempos y actividades
para asignar al personal correspondiente. Dentro de los aspectos básicos esta la
fijación de las rutas de trabajo, el plan de trabajo o forma de entrevistar y la
supervisión -sobre todo- cuando el grupo de trabajo es numeroso o la captación
de los datos presentan dificultades.
iii) CRITICA DE CUES TIONARIOS

Los cuestionarios, codificados o no previamente, llegan a la oficina con el
orden y presentación de las respuestas dadas por los enumeradores. En
algunas ocasiones el trabajo se realiza de acuerdo a las instrucciones establecidas
y enseguida pasa al departamento de captura, para ser procesado
inmediatamente. Sin embargo, en la mayoría de los casos se requiere una crítica o
revisión cuidadosa ya que:
a) Pueden traer las respuestas ilegibles;
b) El orden en que aparecen las respuestas no es el indicado;
c) Se contradicen unas respuestas con otras al compararse entre si;
d) Existen preguntas que vienen en blanco y debían haberse contestado en
alguna u otra forma etc.
e) Se requiere preparar los cuestionarios para la codificación de las respuestas; y
f) Se desea verificar la autenticidad de los datos y preliminarmente comprobar
ciertas hipótesis establecidas en la programación inicial de actividades, etc.
Tal que en esta etapa la información debe quedar depurada y ordenada

hasta donde sea posible para su posterior transformación y vaciada en formatos
previamente diseñados. En algunos casos se acostumbra usar la computadora -
filtrado electrónico- para realizar esta etapa.
iv) CODIFICACIÓN Y PROCES AMIENTO DE DATOS

Una vez que los datos han sido obtenidos y revisados, deben ser
procesados para hacer posible un análisis del fenómeno estudiado. Es
generalmente aceptado que esta actividad es un tanto tediosa, pero también que
es crítica para asegurar exactitud en los resultados.

Una tabulación hecha sin cuidado puede viciar una buena planeación y el
método de obtención de los datos. Así mismo, los peligros de los sesgos a un se
presentan en los procesos de preparación, clasificación y tabulación.
Esta etapa esta fuertemente ligada a la anterior, ya que, por ejemplo,

la preparación consiste en la inspección de cuestionarios o cualquier otra forma
usada para captar los datos, su exactitud, si están completos o no, la inspección
de trabajo de campo, arreglos o eliminación de respuestas por su
inconsistencia o desconfianza la clasificación o estandarización de los datos en
base comunes y sobre todo su preparación para ser tabulados.
v) CLAS IFICACIÓN.
Es el arreglo de los datos en clases o categorías para ser
manipulados de acuerdo con la verificación de la hipótesis de trabajo.
vi) TABULACIÓN.
La tabulación es la etapa que sucede inmediatamente después a la crítica
de cuestionarios y es un conjunto de procedimientos que se adoptan para la
recopilación o vaciado de los datos en cuadros. Estos últimos comprenden las
diferentes relaciones que se establecen entre las variables comprendidas en el
estudio, así, habrá cuadros de una sola entrada, doble entrada, etc.
Los datos pueden ser tabulados manualmente o mecánicamente. La
tabulación manual se aconseja cuando las encuestas son pequeñas, existen
problemas de presupuesto o no hay ninguna posibilidad de procesar los datos
electrónicamente. Por el contrario, cuando la encuesta es grande, la tabulación
manual, además de tardada acarrea el riesgo de cálculos erróneos por lo
voluminoso de la información, aconsejándose el uso de las computadoras. Por
ello, será necesario que la información sea capturada y se diseñan los programas
que calcularán los datos de acuerdo con instrucciones específicas.
vii) EVALUACIÓN ES TADÍS TICA DE RES ULTADOS

El análisis de los datos recabados con la muestra, incluye
indicaciones del valor hasta el cual las estimaciones derivadas de la muestra
pueden desviarse de los valores verdaderos de la población. Esta evaluación
debe comprender datos sobre la precisión de los estimadores, sobre todo si la
selección ha sido probabilística, así como consideraciones sobre algunos
sesgos en la operación de reconocimiento que tienda a distorsionar el valor de
los estimadores.

Dentro de los sesgos puede considerarse las "no respuestas", cobertura,

influencia de los enumeradores sobre la unidad de muestre entrevistado y lo que
anoten en el cuestionario, una codificación de respuestas inadecuada, etc.
Por lo que se refiere a la precisión esta se refiere al error de muestreo de

un estimador: mientras más pequeño sea el error, mejor será la precisión. El
error de muestreo se mide con la fórmula del error estándar, la cual varía de
acuerdo con el tipo de estimador - media, mediana, razón, etc. y con el diseño
muestral.
La exposición de las fórmulas de los errores estándar se presentan en la
sección de los métodos de muestreo, donde se deducen de las varianzas de los
estimadores - media, total, etc.
viii) DIS EÑO DE LOS FORMATOS DE TABULACIÓN :

Los requerimientos de información y las relaciones significativamente
importantes, deben exhibirse en estos formatos con claridad y sencillez, dado
que con el éxito que esto se logre, la solución del problema será más
convincente y fácil. Deben definirse aquí los títulos de todos los cuadros.
ix) DIS EÑO DEL CUES TIONARIO E INS TRUCTIVO :

Basándose en los formatos de tabulación, del guión de información, de los
rangos probables de variación, de las experiencias anteriores y de las posibles
respuestas de las preguntas, hágase el diseño de un cuestionario precodificado,
procurando y verificando que no se omita ningún concepto, que el llenado del
cuestionario, sea lo más sencillo y rápido posible, que el encadenamiento de las
preguntas sea el más adecuado, que algunas preguntas sirvan para comprobar
las respuestas de otras, etc. Un cuestionario precidificado asigna en cada
pregunta un conjunto de claves numéricas, correspondiendo en forma biunívoca,
en el conjunto de las posibles respuestas, esta claves se anotan cifra por cifra, en
las posiciones -en cuadrícula- que se hayan designado para el caso.
x) INVES TIGACIÓN S OBRE FUENTES DE INFORMACIÓN

Un marco muestral es un conjunto de listas o de mapas, o una
combinación de estos elementos, de tal manera, que todas las unidades de interés
estén contenidas y que al seleccionar las muestra se pueda determinar la
probabilidad de su inclusión, asimismo en el momento de levantar la encuesta, la
identificación de cada unidad en la muestra sea posible hacerla sin ninguna
ambigüedad.

Para obtener un marco muestral puede recurrirse a ciertas instituciones

y recopilar además , datos para: calcular el tamaño de la muestra , confrontar y
complementar los resultados de la encuesta, determinar aproximadamente
algunos rangos de variación, etc., si es que en los antecedentes -archivos
propios- no se tienen.
xi) PRUEBA DEL CUES TIONARIO Y AJUS TES FINALES .

Con objeto de determinar cuáles ajustes deben hacerse al
cuestionario para poder lograr los objetivos en forma satisfactoria, es necesario
realizar algunas entrevistas en el campo de estudio, llenar los cuestionarios
correspondientes y evaluar los resultados a este nivel.
xii) FORMULACIÓN DEL GUIÓN DE INFORMACIÓN

Partiendo de un examen del problema, se recomienda hacer una relación
de todas las variables, cuyos valores puedan ser significativamente relevantes,
en la resolución del problema.
xiii) OBTENCIÓN DE INFORMACIÓN COMPLEMENTARIA

Prepárese todo el material que sea necesario, como oficios debidamente
dirigidos y firmados, formas para captar información, etc. Los métodos de
muestreo tienen por objeto indicar el número de unidades que deben incluirse
en la muestra, dependiendo de la forma como éstas se seleccionen, del nivel de
confianza que se requiera, del error de muestreo permisible y del fondo
disponible para la realización de la encuesta.
xiv) LEVANTAMIENTO DE LA ENCUES TA

El trabajo de los enumeradores debe hacerse exactamente con las
unidades de última etapa, determinadas en la selección de la muestra y si ello no
fuera posible por deficiencias en el marco muestral, resuélvase el problema
con apego a las instrucciones precisas que se hayan hecho para estos pasos.
Al hacerse las preguntas, téngase cuidado de que las respuestas sean correctas
y veraces, considerando los rangos aproximados para los valores que puedan
tomar las variables involucradas en el estudio.
xv) S UPERVIS IÓN DEL LEVANTAMIENTO DE LA ENCUES TA

Es conveniente utilizar una forma de reporte, en la cual el supervisor
anote cómo se desarrolla el levantamiento de la encuesta, esto es, registrar el
material recibido y entregado, folio de los cuestionarios entregados a su
grupo, casos de no respuesta y especificación de la resolución tomada, folio

de los cuestionarios que fue necesario aclarar, número diario de cuestionarios

entregados y de errores por enumerador, porcentaje del avance total del trabajo
-llenado de cuestionarios-, día y hora para cada reporte a oficinas centrales,
números de cuestionarios efectivamente llenados al terminar la encuesta y
registro de los demás documentos recogidos, calificación final de los
enumeradores, etc.
xvi) ADMINIS TRACIÓN DEL LEVANTAMIENTO DE LA ENCUES TA:

Se refiere a todas las actividades, como:
-Autorización de gastos y obtención de fondos junto con las directrices
administrativas para su uso;
-Acuse de lo recibido a oficinas centrales;
-Pago del trabajo de campo;
-Observación del sistema de envíos;
-Tiempos transcurridos entre envío y recepción;
-Condición de llegada del material;
-Retroalimentación de las experiencias de la fase inicial y ajuste en donde ello
sea necesario;
-Registro de aquéllos procedimientos -o personas- que no funcionaron para
referencias futuras y para obtener de ello una experiencia;
-Terminación de obligaciones con el personal eventual; etc.
xvii) CRÍTICA DE LOS CUES TIONARIOS Y DETERMINACIÓN DEL

TAMAÑO EFECTIVO DE LA MUES TRA:
Esto es, hacer un filtrado de todos los errores que no hayan sido
detectados por los supervisores, así como también verificar y concentrar el
número total de cuestionarios encomendados a cada supervisor, para obtener el
tamaño efectivo de la muestra.
xviii) ANÁLIS IS Y DETERMINACIÓN DE LOS ES TÁNDARES DE

TRABAJO:
Basandose en el trabajo realizado, al probar el cuestionario y en
experiencias anteriores, determínese el número de cuestionarios por individuos
y por día como: cargo de trabajo, número de visitas antes de declarar la no
respuesta, mínimo de los rangos de variación para algunas variables, etc.

xix) DETERMINACIÓN DETALLADA DE TODOS LOS CONTROLES

ADMINIS TRATIVOS Y DE TRABAJO
Elaboración de todos los mecanismos relativos al procedimiento de
pago, métodos de retiro de fondos, de adquisición de materiales, de órdenes de
trabajo, autorizaciones necesarias, procedimientos para pago de impuestos,
definición de obligaciones por ambas partes, procedimientos de envíos, etc.
Redacción de formas para: para reportes del avance del trabajo, registro
de personal - con número de clave del registro federal de causantes -,
credenciales de identificación, contratos, etc.
Establecimiento de los requisitos del personal de campo:
escolaridad, disponibilidad de tiempo, sexo, número de ello en las diversas
plazas y zonas de la encuesta, preferencia de contratar maestros,
trabajadores sociales, enfermeras, etc.
xx) ENTRENAMIENTO DE S UPERVIS ORES :

En todas las actividades, tanto administrativas, como de trabajo de
campo.
xxi) PROCEDIMIENTOS PARA EL VIAJE DE S UPERVIS ORES :

Habilitación de supervisores de campo con visticos, vehículos,
boletos, credenciales, cartas de presentación debidamente dirigidas y firmadas
etc.
xxii) APROVIS IONAMIENTO DE MATERIALES PARA TRABAJO:

Como cuestionarios, instructivos, fotografías, planos, cintas métricas,
etiquetas, ligas, requisiciones para vehículos, gasolina, papelería, tabletas para
escribir en el campo, lápices, gomas, plumones, tarjetas con direcciones
importantes y teléfonos, instrucciones para casos de emergencias, formas
para control y registro del material, para el avance del trabajo, etc.
xxiii) ORGANIZACIÓN DE LOS MATERIALES DE TRABAJO:

En paquetes para las diversas zonas y unidades; ¿a quién van
dirigidos? controles de entradas y salida de documentos.
xxiv) ANÁLIS IS ES TADÍS TICO DE LOS RES ULTADOS :
Partiendo de una evaluación de la no respuesta y la no cobertura, los
intervalos de confianza y los coeficientes de variación se puede obtener un
criterio, acerca de la validez de las estimaciones hechas a partir de la muestra, de
tal manera que el confrontar algunos resultados de la encuesta, con cifras de
otras fuentes, se podrá determinar el origen de las posibles discrepancias

significativas, como coberturas distintas, error por no respuesta, error de

muestreo, etc.
Este análisis debe de tenerse en cuenta para el reporte final.
xxv) ARCHIVO DE DOCUMENTOS

Envío del reporte a la biblioteca para su conservación y
clasificación. Destrucción de cuestionarios y otros materiales no utilizables.
Control sobre estas operaciones. Felicitaciones al personal involucrado. Cierre
de libros y disposición final de fondos. Terminación final de la encuesta.
Por otra parte y considerando que la economía y los negocios son
diversos y complejos, decidí incluir para los especialistas una relación
adicional de 10 modelos de muestreo, que complementan los anteriores y
brindan al lector una gama de alternativas para seleccionar el método
apropiado para la investigación especifica que pretenda hacer.

VI.6.5 RED GENERAL DE ACTIVIDADES EN UNA ENCUES TA DE

MUES TREO


VI.6.6 PRÁCTICA VIII
Una población consta de los dígitos: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, a partir de

la cual obtenga:
a) El número y composición de las muestras de tamaño n = 2 que pueda surgir

de esa población, con reemplazo y sin reemplazo.
b) Considerando el número de muestras obtenidas sin reemplazo,
Obtenga µx y σ x ; y para la población obtenga µ y σ.
c) Analice, compare interprete la relación que hay entre µ, µx , σ, σ x tanto para
“variables” como para proporciones (atributos).
d) Obtenga X i y Si para cada muestra obtenida sin reemplazo.
e) Compare e interprete los valores de los parámetros µ y σ y de los
estadísticos X i y Si, si es que existe.
f) Usando la tabla de números aleatorios seleccione aleatoria y
sistemáticamente una muestra. Para la muestra seleccionada, calcule su x , Si
correspondiente. Con α = 0.05, determine e interprete los limites de confianza
dentro de las cuales se halla µx .
g) Con e = 0.05 (error permitido) y α = 0.05 determine el tamaño de la muestra
adecuada, aplicando la fórmula del muestreo simple aleatorio.
h) Relación entre σ x , e.
SOLUCIÓN DE LA PRACTICA VIII
A) Con Xi : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
tenemos N = 10, luego con n = 2 se obtiene, sin reemplazo
N  N! 10
 n  = ( N − n)! n! = (10 − 2)!2! = 45 muestras de tamaño dos y que constituyen
 
la nueva distribución de muestreo, que son:

∑( xi − x )
2
Muestra Composición de P(muestra) Media Si =

n
la muestra Muestral
1 0 , 1 1 ÷ 45 0.5 0.5
2 0 , 2 1 ÷ 45 1.0 1.0
3 0 , 3 1 ÷ 45 1.5 1.5
4 0 , 4 1 ÷ 45 2.0 2.0
5 0 , 5 1 ÷ 45 2.5 2.5
6 0 , 6 1 ÷ 45 3.0 3.0
7 0 , 7 1 ÷ 45 3.5 3.5
8 0 , 8 1 ÷ 45 4.0 4.0
9 0 , 9 1 ÷ 45 4.5 4.5
10 1 , 2 1 ÷ 45 1.5 0.5
11 1 , 3 1 ÷ 45 2.0 1.0
12 1 , 4 1 ÷ 45 2.5 1.5
13 1 , 5 1 ÷ 45 3.0 2.0
14 1 , 6 1 ÷ 45 3.5 2.5
15 1 , 7 1 ÷ 45 4.0 3.0
16 1 , 8 1 ÷ 45 4.5 3.5
17 1 , 9 1 ÷ 45 5.0 4.0
18 2 , 3 1 ÷ 45 2.5 0.5
19 2 , 4 1 ÷ 45 3.0 1.0
20 2 , 5 1 ÷ 45 3.5 1.5
21 2 , 6 1 ÷ 45 4.0 2.0
22 2 , 7 1 ÷ 45 2.5 2.5
23 2 , 8 1 ÷ 45 5.0 .
24 2 , 9 1 ÷ 45 5.5 .
25 3 , 4 1 ÷ 45 3.5 .
26 3 , 5 1 ÷ 45 4.0 .
27 3 , 6 1 ÷ 45 4.5 .
28 3 , 7 1 ÷ 45 5.0 .
29 3 , 8 1 ÷ 45 5.5 .
30 3 , 9 1 ÷ 45 6.0 .
31 4 , 5 1 ÷ 45 4.5 .
32 4 , 6 1 ÷ 45 5.0 .
33 4 , 7 1 ÷ 45 5.5 .
34 4 , 8 1 ÷ 45 6.0 .
35 4 , 9 1 ÷ 45 6.5 .
36 5 , 6 1 ÷ 45 5.5 .
37 5 , 7 1 ÷ 45 6.0 .
38 5 , 8 1 ÷ 45 6.5 .

39 5 , 9 1 ÷ 45 7.0 .
40 6 , 7 1 ÷ 45 6.5 .
41 6 , 8 1 ÷ 45 7.0 .
42 6 , 9 1 ÷ 45 7.5 .
43 7 , 8 1 ÷ 45 7.5 .
44 7 , 9 1 ÷ 45 8.0 .
45 8 , 9 1 ÷ 45 8.5 .
45 ÷ 45 202.5
Generación de la distribución de muestras, con reemplazo; Nn = 102 = 100
ni Composici ni Composició ni Composición ni Composición

ón n
1 0 , 0 26 2 , 5 51 5 , 0 76 7 , 5
2 0 , 1 27 2 , 6 52 5 , 1 77 7 , 6
3 0 , 2 28 2 , 7 53 5 , 2 78 7 , 7
4 0 , 3 29 2 , 8 54 5 , 3 79 7 , 8
5 0 , 4 30 2 , 9 55 5 , 4 80 7 , 9
6 0 , 5 31 3 , 0 56 5 , 5 81 8 , 0
7 0 , 6 32 3 , 1 57 5 , 6 82 8 , 1
8 0 , 7 33 3 , 2 58 5 , 7 83 8 , 2
9 0 , 8 34 3 , 3 59 5 , 8 84 8 , 3
10 0 , 9 35 3 , 4 60 5 , 9 85 8 , 4
11 1 , 0 36 3 , 5 61 6 , 0 86 8 , 5
12 1 , 1 37 3 , 6 62 6 , 1 87 8 , 6
13 1 , 2 38 3 , 7 63 6 , 2 88 8 , 7
14 1 , 3 39 3 , 8 64 6 , 3 89 8 , 8
15 1 , 4 40 3 , 9 65 6 , 4 90 8 , 9
16 1 , 5 41 4 , 0 66 6 , 5 91 9 , 0
17 1 , 6 42 4 , 1 67 6 , 6 92 9 , 1
18 1 , 7 43 4 , 2 68 6 , 7 93 9 , 2
19 1 , 8 44 4 , 3 69 6 , 8 94 9 , 3
20 1 , 9 45 4 , 4 70 6 , 9 95 9 , 4
21 2 , 0 46 4 , 5 71 7 , 0 96 9 , 5
22 2 , 1 47 4 , 6 72 7 , 1 97 9 , 6
23 2 , 2 48 4 , 7 73 7 , 2 98 9 , 7
24 2 , 3 49 4 , 8 74 7 , 3 99 9 , 8
25 2 , 4 50 4 , 9 75 7 , 4 100 9 , 9
B) Cálculo de los parámetros de la población.

Valores fijos.

µ = 45/10 = 4.5 .
σ= ∑(x − µ)
i
2
=
82.50
= σ = 2.87
N 10
Calculo de σ:
Xi Xi-µ (Xi-µ)2
0 -4.5 20.25
1 -3.5 12.25
2 -2.5 6.25
3 -1.5 2.25
4 -0.5 0.25
5 0.5 0.25
6 1.5 2.25
7 2.5 6.25
8 3.5 12.25
9 4.5 20.25
0 82.5
Ahora, calculando.
µx = E ( X i ) = ∑ i =
X 202.5
= 4.5 = µx
n 45
NOTA :número de muestras = 45.
σ N − n 2.87 10 − 2 2.87
σx = * = * = 089
.
n N −1 2 10 − 1 141 .
σx = 2.03( 0.94) = 192
.
C) Vemos que µx = µ = 4.5 mientras que σ x = 1.92 y que σ = 2.87

En el caso de "VARIABLES", lo mismo sucede en el caso de las
"PROPORCIONES", es decir, P = Π donde :
P: Proporción de la distribución de muestras.
Π: Parámetro poblacional.
Sp: Error estándar de la distribución de proporciones.
σp: Parámetro denominado desviación estándar de la población.

Sp diferente de σp.
D) Obtenga X i y si para cada muestra obtenida sin reemplazo.

Solución:
i = 1, 2,...,44, 45.
Calculando como ilustración S1 y S45, porque el método de calculo es el mismo,
tenemos:
S1 =
∑ (x i − x )2
S 45 = ∑ (x i − x) 2
n n
S1 =
∑ [( 0 − 05. ) 2
+ (1 − 05
. )2 ] S 45 =
∑ [(8 − 8.5) 2
+ (9 − 8.5) 2 ]
2 2
S1 =
∑ [0.25 + 0.25] S 45 =
∑ [0.25 + 0.25]
2 2
0.50 0.50
S1 = S 45 =
2 2
S1 = 0.25 = 0.5 S 45 = 0.25 = 0.5
E) Al comparar los valores de µ, σ con X i , Si, vemos que el valor de los

parámetros es FIJO, mientras que el de las "estadísticas" es variable puesto
que esta en función de la composición de cada muestra.
F) La selección aleatoria determinó la obtención de la muestra compuesta por los
dígitos 0 y 8, puesto que la tabla de números aleatorios, trabajando
horizontalmente, determinó que se tomara la muestra número 08 del marco
muestral que está compuesto por 45 muestras disponibles y obtenidas en un
muestreo sin remplazo.
MARCO MUESTRAL
Número Composición de la
de
muestra muestra
1 0 , 1
2 0 , 2
3 0 , 3
4 0 , 4
5 0 , 5
6 0 , 6
7 0 , 7

8 0 , 8
. .
. .
. .
. .
. .
45 8, 9
Así, a partir de la selección aleatoria que determinó la muestra

compuesta por los dígitos 8 y 0 vamos a determinar los límites de confianza
con: α = 0.05; Z α = ± 1.96.
X =8+0/2=4
S=
∑[ (8 − 4 ) 2
+ (0 − 4 )2 ]= 16 = 4 = 4
2
Sabemos que los límites de confianza se determinan con :
σN −n
X ± Zα σx donde σx = = 192
. del inciso B).
n N −1
Luego sustituyendo tendremos:
4 - (1.96) (1.92) límite inferior del intervalo de confianza = 0.2368
4 + (1.96)(1.92) límite superior del intervalo de confianza = 7.7632.
Interpretación: hay una probabilidad del 95% de que el valor de µ se halle

en el intervalo de 0.2368 a 7.7632, lo cual es cierto puesto que µx = 4.5.
G) Con e = 0.05; α = 0.05 tenemos Z α = ± 1.96; σ = 2.87 luego:
Zα2σ x2 N (3.84)(3.68)(10) 141.7

n= 2 = = = 10
e N − e + Z α σ x (0.25) − (0.0025) + (14.15) 14.17
2 2 2
N 10 10
Ahora bien usando n = = =
1 + Ne 2
1 + 10(0.05) 2
1 + 0025
.
10
n= = 9.7 ≅ 10
1025
.
Observaciones:

Con las dos fórmulas se obtiene el mismos resultado. Ello indica que el
tamaño de la muestra debe ser el del universo. Esto es así, no debe
sorprendernos porque el universo es tan pequeño que la muestra debe ser igual
a 10 para que sea representativa.
h) La relación entre σ x y e.
σ N − n 2.87 10 − 2
σx = * = * = 192
.
n N −1 2 10 − 1
e = Zα σx = 1.96 (1.92) = 3.7632
i).- La determinación de e se hace a partir de los límites de confianza.

Así, de X ± Zα σx tenemos que e = Zα σx = 1.96 (1.92) = 3.7632
comparación σ x = 1.92 y e = 3.7632, luego el error estándar, es menor que el
error de muestreo o error permitido.
Pero si el error estándar ( 1.92 ) lo usamos en términos de probabilidad para
cuantificar el error de muestreo x − µ x , entonces recordemos que idealmente
èste último debe ser menor o igual que e = error permitido= Ζ α σ x
Del inciso b), sabemos que µ x = 4.5 y del inciso f) sabemos que
x = 4.0 luego el error de muestreo = 4 − 4.5 = 0.5 ≤ 3.7637 = error
permitido. Es bueno el resultado.
VI.6.7 PRÁCTICA IX
1.- APLICACIONES DEL MUES TREO S IMPLE ALEATORIO.

Referencias:
El plano de la colonia del Valle del Distrito Federal es el siguiente:
8
1 2
3 7
5
9 10
4 6

Con : n = 2
tα = 2
Obtenga:
a) El número de manzanas en la colonia del Valle.
hay N = 10 manzanas.
b) La fracción del muestreo.

Fracción de muestreo = F = n / N = 2 / 10 = 0.2
c) Seleccione con la tabla de números aleatorios las dos manzanas

que integren la muestra, indica como son y como le hizo.
Digamos que fueron las manzanas 2 y 7, que cayeron en la muestra mediante el
manejo ya conocido de la tabla de números aleatorios.
d) Suponiendo que:
La primer manzana tiene 40 familias.
La segunda manzana tiene 36 familias.
Cálcule la media y desviación estándar de la muestra.
Puesto que:
M anzana 2 tiene 40 familias.
M anzana 7 tiene 36 familias.
_
X = 40 + 36 / 2 = 76 /2 = 38 familias.
(40 − 38) 2 + (36 − 38) 2 (2 ) 2 + (− 2) 2 8
S= = = =2
2 2 2
e) Determine el total de familias en la colonia del Valle.

El total de familias se estima por :
Y$ = NX ; Y$ = 10( 38);
Y$ = 380 familias.
f) Determine e interprete los límites de confianza del total de familias.

Sabemos que:
tNS tNS
Nx − 1 − F ≤ Y$ ≤ Nx + 1 − 0.2
n n

Sustituyendo
2 (10) 2 2 (10)2
380 − 1 − 0.2 ≤ Y$ ≤ 380 + 1 − 0.2
141
. 141
.
2 (10) 2 2(10) 2
380 − . ) ≤ Y$ ≤ 380 +
( 089 (089
. )
141
. 141
.
380 - 28.37 (0.89)  Y$  380 + 28.37 (0.89)

380 - 25.2  Y$  380 + 25.2
354.8  Y$  405.2
Interpretación:
El total estimado de familias Y, se halla entre 355 y 405 familias
con una probabilidad o seguridad del 95.45%
g) Determine el número de habitantes en la colonia del Valle tomando en cuenta

que 5 es el promedio de personas por familia.
El total de habitantes en la colonia del Valle es:
Total de habitantes = 380 (5) = 1900 personas.
2.- APLICACIÓN DEL MUES TREO ALEATORIO ES TRATIFICADO:
Referencias: El canal 22 de televisión ha sido puesto en venta y la empresa

"escorpión" que esta interesado en adquirirlo disidió hacer una encuesta para
conocer el número de horas que el público ve televisión y de ahí saber
cuántos hogares (mediante entrevistas) ven el canal 22.
La empresa escorpión puede producir estimaciones por separado es decir,

puede estratificar para estimar el número promedio de horas que se ve televisión
en cada estrato, ya que, la información disponible revela que hay tres estratos
que componen el universo o población con:
POBLACIÓN MUESTRA ESTRATO

HOGARES

N n
N1= 180 n1= 15 hogares 1
hogares
N2= 70 n2= 4 hogares 2
hogares
N3= 100 n3= 5 hogares 3
hogares
Total 350 Total 24
M ediante la cual se realizan las entrevistas, con los siguientes

resultados:
Tiempo que se ve televisión, en horas por semana.
Estrato 1 Estrato 2 Estrato 3

30, 27, 40 4, 49 9, 20
45, 26, 35 25, 30 11, 34
33, 29, 37 24,
34, 25, 41
43, 32, 31
Con esos datos sustituya y obtenga:

a) X i , Si con i=1, 2, 3.
Estrato 1 Estrato 2 Estrato 3
n1 = 15 n2 = 4 n3 = 5
x1 = 34 x2 = 27 x3 = 20
S1 = 6 S2 = 16 S3 =9.1
N1 = 180 N2 = 70 N3 = 100
ESTRATO 1
30 + 27 + 40 + 45 + 26 + 35 + 33 + 29 + 37 + 34 + 25 + 41 + 43 + 32 + 31
X1 =
15
508
X1 = = 3387
.
15
33.87 equivalente a 34
S1 =
∑(x i − x )2
=
546
= 36.4 = 6
n 15

Xi Xi − X1
( X i − X1 ) 2
30 30 - 34 = -4 16
27 27 - 34 = -7 49
40 40 - 34 = 6 36
45 45 - 34 = 11 121
26 26 - 34 = -8 64
35 35 - 34 = 1 1
33 33 - 34 = -1 1
29 29 - 34 = -5 25
37 37 - 34 = 3 9
34 34 - 34 = 0 0
25 25 - 34 = -9 81
41 41 - 34 = 7 49
43 43 - 34 = 9 81
32 32 - 34 = -2 4
31 31 - 34 = -3 9
546
ESTRATO 2
4 + 49 + 25 + 30 108
X2 = = = 27
4 4
S2 =
∑ (x i − x ) 2
=
1026
= 256.5 = 16.0
n 4
Xi Xi − X 1
( X i − X 2 )2
4 4 - 27 = -23 529
49 49 - 27 = -22 484
25 25 - 27 = -2 4
30 30 - 27 = 3 9
1026
ESTRATO 3
9 + 20 + 11 + 34 + 24 98
X3 = = = 19.6 equivale a 20
5 5

S3 =
∑ (x i − x) 2
=
414
= 82.8 = 91
.
n 5
( X1 − X 3 )
2
X1 X 1 − X3
9 9 - 20 = - 121
11
20 20 - 20 = 0 0
11 11 - 20 = -9 81
34 34 - 20 = 14 196
24 24 - 20 = 4 16
414
b) Usando la información anterior, estime el tiempo promedio que se ve

televisión en horas por semana, para todos los hogares, en la población
constituida por todos, sabiendo que esta medida poblacional, que no es muestral,
se calcula con la fórmula:
1 3 1
X De todos los estratos = ∑ N i X i = [ N 1 X 1 + N 2 X 2 + N 3 X 3 ]
N i =1 N
1 1
X=
350
[180(34 ) + 70(27 ) + 100( 20)]; X =
350
[ 6120 + 1890 + 2000]
10,010
X= = 28.6 equivalente a 29 horas
350
c) Obtenga la varianza de X con la fórmula:

1   N 1 − n1   S 2   N 2 − n2   S22   N 3 − n 3   S33  
V ( X ) = 2  N 1    + N2     + N3   
N   N 1   n1   N 2   n2   N 3   n3  
1   180 − 15  36.4   70 − 4  256.5  100 − 5  82.8 
V(X) = 180 180   15  + 70 70   4  + 100 100   5  
( 350) 2  
1
V(X) =
122500
[402.41 + 4219.75 + 15.732]
6195.36
V (X ) = = 0.0506
122500
d) Obtenga los limites de confianza con:

X ± 2 V ( X ) ; Interprete conociendo que.

2 V ( X ) = e = error de estimación permitido
X ± 2 V (X ) 29 ± 2 0.0506
29 ± 2 (0.22) ; 29 ± 0.44; luego e = 0.44
Limite inferior = 28.56

Limite superior = 29.44
Interpretación:
Usando el muestreo aleatorio estratificado hemos estimado que el
número promedio de horas por semana que se ve televisión en todos los hogares
es de 29 horas, el error de estimación permitido es de 0.44 horas, con una
probabilidad de 95.45% .
Calificación:
Solución del caso No.1 ; 34 puntos
Solución del caso No.2 ; 66 puntos
total: 100 puntos

VII. ES TIMACIÓN DE PARÁMETROS (9)
VII.1 DEFINICIÓN
Estimación, es el proceso de usar un "estadístico muestral" para estimar el
parámetro desconocido.
Un parámetro se puede estimar de dos maneras:
1.- Estimación de un punto: Es la selección de un número único que se utiliza
para representar o estimar al parámetro.
Ejemplo: el precio de la leche es de $30.00 por litro en el D.F.
2.- Estimación de un intervalo: Es la estimación de un recorrido o rango dentro del
cual se espera que está‚ contenido el parámetro.
Ejemplo: El precio de la leche está entre los $28.00 y los $35.00 por litro.
En otras palabras, cuando no se conocen los parámetros de la población,
se pueden estimar recurriendo a muestras que permitan calcular intervalos dentro
de los cuáles pueden estar contenido el valor de los parámetros.
Estos intervalos se llaman intervalos de confianza y sus extremos se
llaman limites de confianza.
El grado de confianza, de el parámetro que‚ esté‚ contenido en el intervalo,
se determina por el número de errores estándar a los cuales les corresponde un
área bajo la curva que se denomina "coeficiente de confianza" (ξ épsilon ). Al
riesgo que el valor estimado de µ no se encuentra dentro del intervalo de
confianza construido alrededor de la media de la muestra, se le llama nivel de
significación (α alfa ) y es el área o probabilidad complementaria del coeficiente
de confianza, sí, numéricamente ξ = 1 - α ó E + α = 1 = ÁREA bajo la curva.
De esta manera, el intervalo de confianza se determina con:
Limite de confianza X ± Zασ x . . . . . . . . . (1).
Donde Z α = Valor especifico de Z en la tabla, asociado con determinado
coeficiente de confianza.
α = nivel de significación.
X = M edia muestral.
σx =σ / n
Luego, para calcular el intervalo de confianza que contenga a µ, es necesario

conocer X , n y σ .
De (1) tenemos X − Zα σ x límite inferior del intervalo.

X + Zα σ x límite superior del intervalo
Zα 1.0 1.96 2.0 3.0

ξ 0.68 0.95 0.955 0.997

α 0.32 0.05 0.045 0.003
Ejemplo 1:
Se desea estimar el ingreso medio de los trabajadores de la compañía
NESTLE, con el fin de estudiar las condiciones de trabajo de los trabajadores y en
su caso pedir la revisión del contrato. Para ello, se selecciona una muestra
aleatoria de 49 trabajadores cuyo ingreso medio resultó ser de $ 5 500.00/mes.
Estudios previos, realizados por la Facultad de Economía -UNAM - en
esta empresa señala que la σ del universo es de $ 700.00/mes.
Con un nivel de significación de 5%, estimar: el ingreso medio de los
trabajadores;
n = 49
σ = 700
X = $ 5 500.00
α = 5%
Zα = ±196 .
ξ = 95%
X ± Zα σ x
5 500 ± 1.96 (100)
5 500 ± 196
Limite de confianza = 5 500 ± 196
Intervalo de confianza = 5 304 a 5 696
donde el limite inferior = $ 5,304.00
donde el limite superior = $ 5,696.00
INTERPRETACIÓN : El ingreso medio de los trabajadores de la Cía. NESTLE,

se halla entre los $ 5,304.00 y los $ 5,696.00 con una probabilidad del 95%.
ξ=95% c/u
0.95
α=0.025
α=0.025
5,304 5,504 5,696

x − Zα σ x x x + Zα σ x
Ejemplo 2.
Se desea estimar el gasto medio mensual en libros, del universo de estudiantes de
la Universidad de Aguascalientes, con un nivel de significación del 5% y una
muestra de 100 estudiantes seleccionados al azar, cuyo gasto medio mensual es
de $288.000. La experiencia señala que la población tiene una desviación estándar
de $ 20.000.
Como los limites de confianza = X ± Zα σ x

X = $ 288.00
n = 100 estudiantes
σ = $ 20.00
α = 5%
σ 20 20
. ; y; σ x =
Luego Zα = ± 196 = = =2
n 100 10
Por lo tanto limites de confianza = X ± Zα σ x

= $288 ± (1.96)(2)
= $288 ± 3.93
Intervalo de confianza = $284.08 a $ 291.92
Limite superior = $291.92
Limite inferior = $284.08
INTERPRETACIÓN :
Se estima que el gasto medio mensual en libros del universo
constituidos por estudiantes, se halla entre $284.08 y los $291.92.
0.95 = ξ

α=0.025
α=0.025
x − 1.96σ x x x + 1.96σ x
VII.2 DES IGUALDAD DE TCHEBYCHEFF
Antecedentes: Hemos visto en las distribuciones teóricas que con Z = x-µ/σ es

posible conocer cierta porción o área de una distribución en el rango o
intervalo x - µ.
Ejemplo, si los precios son:
µ = $15.00 / Kg.
x = $14.00 / Kg.
σ = $1.00
Z = x - µ / σ = 14 -15 / 1 = -1 por lo tanto Z = -1
Gráficamente:
0.34
x x Laterales Z
14 Valores originales
-1 Valores Z
Donde Z = Número de desviaciones estándar de µ y cuya interpretación es: el

34% de los precios está entre los $14 y $15 (x -µ), o 0.34 es la probabilidad de

que los precios estén entre $14 y $15. Para ello, se supone que los precios se
distribuyen normalmente.
Cuando no se conoce la forma o características de la distribución, pero se
conocen µ y σ , entonces con la desigualdad de TCHEBYCHEFF, cuya fórmula
es:
1
P( x − µ ≥ Kσ ) ≤ 2
K
Se puede calcular la masa o porción de la distribución la interpretación es:
la probabilidad de que un valor aleatorio ( xi ) de la distribución esté a un distancia
1
igual o mayor de K desviaciones estándar de la media, cuando mucho es: 2
K
En otra palabras, si K = 2, la probabilidad de que cualquier xi se encuentre
a una distancia de 2 o más desviaciones estándar de la media, cuando más es:
1 1 1
2
= 2 = = 0.25
K 2 4
De acuerdo con lo anterior en todos los casos la porción de la distribución
situada a dos o más desviaciones estándar, nunca podrá exceder al 25% del total,
independientemente de la forma de la distribución.
Otra interpretación sería que el 75% es la porción mínima de la
distribución que se halla en la distancia comprendida dentro de 2σ de la media.
1
En este caso, la fórmula sería: 1 − 2 = Kσ de µ.
K
Comparando lo anterior con la distribución normal, se recordará que en la
distancia de 2 σ de µ, se halla el 95.5% de la distribución, porción mucho mayor
que los limites minimos dados por la desigualdad de TCHEBYCHEFF, situación
atribuible a que dispone de menos información que la normal.
Sin embargo, la utilidad de TCHEBYCHEFF radica en que es aplicable a
cualquier tipo de distribución.
Porcentaje del área de la ddistribución dentro de kσ de µ
x − µ Distribución 1 Porcentaje
Z =K=
σ
Normal 1 − K
2
mínimo
dentro de Kσ
1 68.27 % 0.00
2 95.45 % 75.00
3 99.73 % 88.89
4 99.99 % 93.75
Ejemplo:
Si conocemos la distribución del ingreso familiar en Pochutla, Oaxaca, tal
que el ingreso medio mensual por familia es de $10,000.00 con una desviación

estándar de $3,000.00 y deseamos conocer el rango que incluya cuando mucho al

50% de los ingresos familiares. Con la desigualdad de TCHEBYCHEFF
podemos calcular el rango solicitado:
1
1 − 2 = 05 .
K
K2 = 2
K = 1.41
Luego el rango será: $10,000.00 ± 1.41σ
$10,000.00 ± 1.41(3,000.00)
$10,000.00 ± 4,330.00
Rango: de $5,770.00 a $14,330.00
si supiéramos que la distribución es normal, el rango se calculara así:
Luego: $10,000.00 ± 0.67σ

$10,000.00 ± 0.67(3,000)
$10,000.00 ± $2,010.00
Rango de: $7,990.00 a $12,010.00
Gráficamente:
0.25 0.25
-0.67 0 + 0.67
VII.3 ES TIMADORES INS ES GADOS :
Son aquéllos cuya esperanza matemática es igual al parámetro

poblacional.
E ( X ) = µ pero E ( S 2 ) ≠ σ 2
Demostrar si la varianza muestral es estimador insesgado de σ2;
con x i = x − x
M uestras M edia Varianza Varianza
M uestral Sesgada Insesgada

Xi Xi S 2
=
∑ xi 2
S$ 2 =
∑ xi
2
n n−1
1 , 2 , 3 , 3 , 2.25 2.75 ÷ 4 2.75 ÷ 3
1 , 2 , 3 , 4 , 2.50 5.00 ÷ 4 5.00 ÷ 3
1 , 2 , 3 , 5 , 2.75 8.75 ÷ 4 8.75 ÷ 3
1 , 2 , 3 , 4 , 2.50 5.00 ÷ 4 5.00 ÷ 3
1 , 2 , 3 , 5 , 2.75 8.75 ÷ 4 8.75 ÷ 3
1 , 2 , 4 , 5 , 3.00 10.00 ÷ 4 10.00 ÷ 3
1 , 3 , 3 , 4 , 2.75 4.75 ÷ 4 4.75 ÷ 3
1 , 3 , 3 , 5 , 3.00 8.00 ÷ 4 8.00 ÷ 3
1 , 3 , 4 , 5 , 3.25 8.75 ÷ 4 8.75 ÷ 3
1 , 3 , 4 , 5 , 3.25 8.75 ÷ 4 8.75 ÷ 3
2 , 3 , 3 , 4 , 3.00 2.00 ÷ 4 2.00 ÷ 3
2 , 3 , 3 , 5 , 3.25 4.75 ÷ 4 4.75 ÷ 3
2 , 3 , 4 , 5 , 3.50 5.00 ÷ 4 5.00 ÷ 3
2 , 3 , 4 , 5 , 3.50 5.00 ÷ 4 5.00 ÷ 3
3 , 3 , 4 , 5 , 3.75 2.75 ÷ 4 2.75 ÷ 3
Total 15 45.00 90/4=22.5 90/3=30
E( X ) 45/45=3 22.5/15=1.5 30/15=2

Parámetro µ=3 σ2=1.67 σ$ 2 = 10 / 5 = 2
Calculo de las variancias de cada una de las muestras (primera muestra).

_ _
Xi (Xi - X) (Xi - X)2
1 -1.25 1.5625
2 -0.25 0.0625
3 0.75 0.5625
3 0.75 0.5625
9 0 2.75
x i = 9/4 = 2.25
σ2 = 2.750/4 = 0.6825
1ª CONCLUSIÓN
Se dice que X es un estimador insesgado de µ porque su esperanza

matemática es igual al valor del parámetro, cuyo universo es:
E(X) = µ

2
Trabajador Salario/hrs X = X - µ X = (X - µ)
(x)
A 1 -2 4
B 2 -1 1
C 3 0 0
D 3 0 0
E 4 1 1
F 5 2 4
18 0 10
Así: µ=18/6=3; σ2=10/6=1.67 y σ$ 2 = 10 / 5 = 2.
2ª CONCLUSIÓN
S2 no es un estimador insesgado de σ2 porque su esperanza matemática es
diferente del valor del parámetro poblacional.
E (S2 ) ≠ σ 2
S 2
=
∑ ( xi − x )
;σ
2
2
=
∑ ( x i − µ) 2
n N
Ε( S ) = 15
2
. pero σ =1.67; luego Ε( S 2 ) ≠ σ 2
2
3a. CONCLUSIÓN
S$ 2 es un estimador insesgado de σ$ 2 porque E ( S$ 2 ) = σ$ 2 donde
S$ 2 =
∑ ( xi − x)
; σ$
2
2
=
∑ ( xi − µ ) 2
n−1 N −1
$ 2
Ahora bien S también se puede obtener de:
$S 2 = S 2 n ; σ$ 2 = σ 2 N = σ$ 2 ; ∑ i
( x − x) 2 n ( xi − x) 2
* = $
S 2
=
n −1 N −1 n n−1 n−1
EJEM PLO # 2 :
Con N = 1,2,3 ; µ = 2; σ = 0.67

 3
Si tomamos   = 3 muestras de tamaño 2.
 2

Media Varianza
Muestra Muestral Sesgada Insesgada
1,2 1.50 0.50 ÷ 2 0.50 ÷ 1
1,3 2.00 2.00 ÷ 2 2.00 ÷ 1
2,3 2.50 0.50 ÷ 2 0.50 ÷ 1
3 6 3/2 3/1
E( X ) 6/3 = 2 ; E(S2)=1.5/3 = 0.50 3/3 =1
Como σ 2 = 067 . ≠ E ( S 2 ) = 0.50
En cambio, si σ$ = 2 ∑ ( x i − µ) 2 2
= =1
N −1 2
Luego E ( S$ 2 ) = 1 = σ$ 2
P COMO ES TIMADOR INS ES GADO DE P:
p es un estimador insesgado de P ya que E (p) = P
Ejemplo : Partiendo de una población binaria donde tenemos A, B, C, personas

que fuman con valor 1 y X, Y, Z personas que no fuman con valor cero.
Personas X
A 1
B 1
C 1
X 0
Y 0
Z 0
µ= P = 3/6 = 0.5 = 50%; σ = PQ = 0.5 Donde µ y σ son los parámetros de la
población.

Si ahora deseamos conocer la proporción de fumadores en muestras de n =

4; la media de las proporciones y su error estándar, tendremos en primer lugar
que hay:
 6
  = 15 muestras de cuatro personas en un muestreo sin reemplazo.
 4
VII.3.1 CALCULO DE LAS PROPORCIONES MUES TRALES
Personas en la muestra, Proporción de Probabilidad de

fumadores c/u
n=4 en la muestra de las 15
muestras
1 .- A , X , Y , Z , 1 ÷ 4 = 0.25 1 ÷ 15
2 .- B , X , Y , Z , 1 ÷ 4 = 0.25 1 ÷ 15
3 .- C , X , Y , Z , 1 ÷ 4 = 0.25 1 ÷ 15
4 .- A , B , X , Y , 2 ÷ 4 = 0.50 1 ÷ 15
5 .- A , B , X , Z , 2 ÷ 4 = 0.50 1 ÷ 15
6 .- A , B , Y , Z , 2 ÷ 4 = 0.50 1 ÷ 15
7 .- A , C , X , Z , 2 ÷ 4 = 0.50 1 ÷ 15
8 .- A , C , Y , Z , 2 ÷ 4 = 0.50 1 ÷ 15
9 .- B , C , X , Y , 2 ÷ 4 = 0.50 1 ÷ 15
10 .- B , C , Y , Z , 2 ÷ 4 = 0.50 1 ÷ 15
11 .- A , B , C , X , 3 ÷ 4 = 0.75 1 ÷ 15
12 .- A , B , C , Y , 3 ÷ 4 = 0.75 1 ÷ 15
13 .- A , B , C , Z , 3 ÷ 4 = 0.75 1 ÷ 15
14 .- A , C , X , Y , 2 ÷ 4 = 0.50 1 ÷ 15
15 .- B , C , Y , Z , 2 ÷ 4 = 0.50 1 ÷ 15
15 7.5 15/15
7.50
luego, la media de las proporciones denotada por p= = 050
. =Ρ
15
que significa que p = E(p) = P.
El error estándar de la proporción es :
PQ N − n 05 . ) 6−4
. (05
σp= = = 0025
. = 0158
.
n N−1 4 6−1
σp = 0.158
Ahora bien :
1.- S 2 no es un estimador insesgado de σ2, ya que E( ◊ 2 ) ≠ σ2 donde
S =
2 ∑ ( xi − x ) 2
;σ =
2 ∑ ( xi − µ ) 2
n N

2.- En cambio, si tomamos S$ 2 =

∑ ( xi − x) 2
; tendremos:
n−1
E( S$ 2 )= σ$ 2 =
∑ ( x i − µ) 2
N −1
3.- Cuando N → ∞ y no conocemos a σ2, entonces S$ 2 se hace un estimador
insesgado de σ2 porque si:
S$ =
2 ∑ ( xi − x) 2
; y σ$ =
2 ∑ ( x i − µ) 2
cuando N → ∞, tenemos:
n−1 N −1
N
S$ 2 = σ2 porque =1
N −1
o sea, que S$ 2 estima σ2 cuando N → ∞ y σ$x estima Sx $ ; es decir, cuando no se
S$ σ
conozca σ usaremos S$x = en lugar de: σx = en x ± Zα σ x ; por lo que la
n n
expresión de los limites de confianza se convierte en x ± Zα S$ x .
S
4.- También podemos decir que cuando N > 100, S$ 2 = S 2 , tal que Sx =
n
Estimadores eficientes, suficientes y consistentes.(13)
VII.4 ES TIMADOR EFICIENTE: Es aquel que tiene la variancia mínima.
VII.5 ES TIMADOR S UFICIENTE ( X ): Es el que utiliza toda la información

que posee la muestra sobre el parámetro que se estima.
VII.6 ES TIMADOR CONS IS TENTE ( X ): Es el que se aproxima al

parámetro (µ) que se va a estimar, al aumentar la muestra. Con literales X →
µ, cuando n → N .

VII.7 PRÁCTICA X
ESTIM ACIÓN DE PARÁM ETROS
Problema No.1.- Suponga que µ = $ 100 ; Z α = ± 2.58 y σ x = 10, encontrar:

a) El intervalo de confianza
b) Los límites de confianza
c) El coeficiente de confianza
Problema No. 2 Con los datos del problema 1, suponga que µ es desconocida
y X = $105, encontrar:
a) La estimación de punto
b) La estimación de intervalo
c) Interprete los resultados de los dos tipos de estimaciones. Si µ es conocida e
igual a $ 100, ¿está la verdadera media poblacional dentro del intervalo de
estimación?
Problema No. 3. Suponga que Π = 45%, Z α = ± 1.645 y σ p = 6%, encontrar:

a) El intervalo de confianza
b) Los limites de confianza
c) El coeficiente de confianza
Problema No. 4. Con los datos del problema 3, suponga que Π es desconocida
y p = 48%, encontrar:
a) La estimación de punto
b) La estimación del intervalo
c) Interprete los resultados de las dos estimaciones. Si Π es conocida e igual a
45%, ¿Esta la verdadera proporción de la población dentro del intervalo de
estimación?
Problema No. 5 Poner un ejemplo numérico de estimadores:

a) Insesgados ; b) Eficientes ; c) Suficientes ; d) Consistentes

VIII. TEORÍA DE LA DECIS IÓN ES TADÍS TICA O PRUEBA DE

HIPÓTES IS (9)
Conexión entre pruebas y estimaciones de de intervalo
Antes de de iniciar el tema he creído conveniente señalar que existe dicha relación,
ya que en una prueba de hipótesis , dado un nivel de significación α , se
construye un intervalo de confianza para ξ o nivel de confianza para no rechazar
la hipótesis nula.
Así, por ejemplo, si en una prueba de dos extremos utilizamos Z, con un cierto
nivel de α de que la Ho: µ x = µo , la condición o intervalo para no
rechazar Ho es que la z crítica o valor teórico que se obtiene de tablas sea igual o
mayor que la Z real u observada, que es lo mismo, en el caso del intervalo de
confianza, ya que: la media muestral, más menos, el producto de z teórica por el
error estándar de la media, sea superior a la media hipotética. Ambas
desigualdades son lo mismo y cada una tiene una probabilidad 1- α = ξ si es que
µ x es µ o ; la primera garantiza que la prueba tiene nivel de significación α y
la segunda, garantiza que el intervalo de confianza tiene probabilidad 1- α de
contener µ x
Con este enlace ahora procederemos a desarrollar el tema de la prueba de

hipótesis
VIII.1 DEFINICIÓN
Podríamos decir que esta es una de las principales aportaciones de la teoría de la

probabilidad a la inferencia estadística, ya que al verificar una hipótesis de trabajo
con una muestra probabilística, si dicha hipótesis es aceptada, ello es una gran

contribución a la investigación que ahora ya dispone de un método estadístico

para la toma de decisiones con certidumbre pero, además, contribuye al aumento
del acervo de conocimientos en el área que se esté efectuado la verificación de la
hipótesis, en virtud de que muchas hipótesis al corroborarse que son ciertas,
pasan a formar parte de la ciencia en que se desenvuelve el investigador.
Al respecto, como señala el Profesor L. Kazmier(7) , en la prueba de hipótesis

empezamos suponiendo que un parámetro poblacional tienen un determinado
valor, tal como la media de la población; enseguida seleccionamos aleatoriamente
una muestra, y calculamos su media aritmética para probar con ella que el
supuesto valor poblacional es en efecto correcto, sobre la base de los elementos
que componen la muestra, es decir, comparando el supuesto valor del parámetro
con el valor equivalente de media muestral.
Es importante decir que en cualquier situación de prueba de hipótesis, la

exactitud del supuesto valor del parámetro poblacional, es decir, la validez de la
hipótesis, no se puede probar directamente. En su lugar, lo que se prueba es la
magnitud de la diferencia entre el supuesto valor del parámetro poblaciona y el
valor obtenido de una estadística muestral.
La evidencia ideal en apoyo de una hipótesis sería la observación que la

diferencia entre los dos valores fuera igual a cero. Esta hipótesis se conoce
como hipótesis nula. Así por ejemplo, si en la producción de anillos
industriales se requiere que el diámetro medio de cada uno sea 0.575 centimetros
y si tomamos una muestra aleatoriamente para verificarlo, si su media es 0.565,
se prueba la hipótesis nula en el sentido de verificar la diferencia entre los valores
0.565 y 0.575 centimetros y nos preguntamos ¿ la diferencia de 0.010
centimentros es sifnificativamente diferente de cero ?
Dicha diferencia se juzga considerando su valor absoluto estandarizado, es

decir, considerando el error estándar de la media de la muestra.
Al respecto, al generar las distribuciones de muestras, nosotros recordamos que

usando el muestreo con o sin reemplazo, se producen distribuciones de muestras,
de cuyas medias podemos seleccionar una de ellas aleatoriamente para comparar
su valor con el del supuesto valor del parámetro poblacional. Esperamos que si
éste último es cierto, los valores de muchas medias muestrales se agruparàn o
situarán simétricamente alrededor de su valor. Si hubieramos seleccionado
aleatoriamente otra muestra de todas las que están disponibles, otro sería el valor

de su media muestral y otra seía la diferencia con el valor del parámetro

poblacional.
Por otra parte es importante mencionar que aun cuando no hay un número
universal definido para aceptar o rechazar una hipótesis nula, generalmente se usa
α = 5%, conocida α como nivel de significación, cuya interpretación es :
cuando es grande la diferencia entre el valor de la estadística muestral y el
supuesto valor del parámetro poblacional, una diferencia de esa magnitud
ocurrirá al azar con una probabilidad de 5% o menos cuando el supuesto valor es
en realidad correcto; en esa situación rechazamos la hipótesis nula y se considera
que la diferencia observada es significativa, en otras palabras, que la gra diferencia
no se debe a la selección aleatoria de la muestra, sino que se debe a otras razones.
Con ese razonamiento, si definimos a µ o ± Ζα σ x , como límites críticos
para aceptar o rechazar la hipótesis nula; en este caso decimos que 0.95 es la
proporción de medias muestrales comprendidas dentro de los límites crítcos
establecidos para rpbar la hipótesis nula, con un nivel de significación del 5%.
También es importante decir que cuando no se específica la dirección en que se

desea probar la diferencia entre µ o y x , la prueba se denomina de “ dos
lados, colas o extremos “. Por el contrario, cuando si se específica la dirección

para probar dicha diferencia haci auno u otro lado de la curva, la prueba se llama “
de un extremo “ y α no se divide entre dos colas o extremos, por lo que Ζα
toma otro valor ( 1.64 y no 1.96 , cuando es de dos colas).
Conviene señalar que una hipótesis nula se prueba con unidades originales (
medias muestrales ) y con unidades Z ( número de unidades del error estándar de
la media ); este último procedimiento es el más usual.
Con estas referencias y trabajando con más literales, diremos que :

Hipótesis estadística es una suposición o conjetura concerniente a una
característica de la población.
Por ejemplo: X = µ
Hipótesis nula Ho: X = µ
Hipótesis alternativa Hi: X ≠ µ.
Reiteramos, cuando se formula una hipótesis, no podemos probarla directamente
por que no conocemos µ, lo que se prueba es la diferencia entre µ y X tal que:

X -µ=0
Ello indica que se prueba que no hay diferencia entre µ y X , lo cual es llamado
HIPÓTES IS NULA, ( Ho ).
Cualquier hipótesis diferente de la nula es llamada HIPÓTESIS
ALTERNATIVA, ( Hi ).
Cuando se hace el planteamiento para tomar una decisión estadística, es
factible cometer 2 tipos de errores:
Error 1: Rechazar una hipótesis nula cuando realmente es verdadera; y
Error 2: Es aceptar una hipótesis nula cuando realmente ésta es falsa.
La probabilidad de cometer un error del tipo 1, es usualmente denotada
por α (alfa); y la probabilidad de cometer un error del tipo 2, es denotada por β
(beta).
Veamos gráficamente La prueba de hipótesiscuando se hace con dos
"colas" o extremos:
0 Zona de Zona de Zona de

0
rechazo aceptación rechazo
0
α α
0
µο
Dos colas
µo = media hipotética
VIII.2 PRUEBA DE HIPÓTES IS CON Z

Asimismo, la prueba de hipótesis se hace con :
x − µo
Z= cuando se conoce σ y n > 30
σx
σ
σx = para una población infinita
n

x − µo x − µo
y se hace con: t = = cuando se desconoce σ y n < 30
sx s
n−1
Ahora también, cuando Z ó t ≤ Zα ó tα se acepta Ho; y

“ Z ó t > Zα ó tα se rechaza Ho.
TABLA Zα PARA PRUEBA DE HIPÓTESIS :
Nivel de significación 0.10 0.05 0.01 0.005 0.00

(α)
Valores críticos para -1.28 -1.645 -2.33 -2.58 -2.88
ensayos de un 1.28 1.645 2.33 2.58 2.88
extremo
Valores críticos para -1.645 -1.96 -2.58 -2.81 -3.00
y y y y y
ensayos de dos 1.645 1.96 2.58 2.81 3.00
extremo
1.- Diferencia de una media muestral y una poblacional conocido σ, tal que:
x − µo σ
Z= ; σx = para una población infinita
σx n
Para una diferencia de proporciones:
p−P PQ
Z= ; σp= para una población infinita
σp n
EJEM PLO 1:
Retomando el ejemplo planteado al principio del tema, cuando lo usamos
para enfatizar el significado de “ las diferencias “, ahora digamos que en la
producción de cierto tipo de anillos se requiere que exista una calidad estándar de
tal manera que su diámetro medio sea de 0.575 centimetros. Se toma una
muestra de 50 anillos, y arrojan un diámetro medio de 0.565 pulgadas. Pruebe la
hipótesis de que la media poblacional es igual ala media muestral, si el nivel de
significación es de 5%, y se hace un ensayo de dos extremos. La desviación
estándar es de 0.50 centimetros.
µ o= 0.575 centimetros
n = 50 anillos industriales

X = 0.565 centimetros
σ = 0.50 centimetros
α=5%
Zα = ± 1.96 = valor critico para aceptar o rechazar Ho.
Ho: X = µ ; Hi: X ≠ µ
0
Zona de aceptación
0
Área de
0
Área de
0
rechazo
0
rechazo
0
0.025 0.025
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
2
X = 0.565 µo = 0.575
Z α=-1.96 Z= - .1414 Z α=1.96
En donde:
− 0.010
Z= = −.1414
0.0707
x − µo 0.565 − 0.575 σ 0.050
Z= = ; y σx = = = 0.00707
σx 0.0707 n 50
Z= -.1414 esta dentro de la zona de aceptación y se acepta Hι.
2.- Diferencia de dos medias muestrales, cuando se conoce σ .

H o : µ1 - µ2 = 0
µ1 = µ2
H i : µ1 ≠ µ2
x1 − x 2
En ese caso Z =
σ ( x1 − x 2 )
σ1 σ2
σ ( x1 − x 2 ) = +
n1 n2

En el caso de una proporción :

p1 − p2 p1 q1 p2 q 2
Z= ; σ ( p1 − p2 ) = +
σ ( p1 − p2 ) n1 n2
Cuando N y n son grandes, se pueden usar las desviaciones estándar de las

muestras en el error estándar.
S1 S 2 x1 − x 2
S ( x1 − x 2 ) = + tal que Z =
n1 n 2 S ( x1 − x2 )
VIII.3 DIS TRIBUCIÓN t DE S TUDENT: (12)
Esta distribución fue elaborada por William S. Gosset, que usaba el nombre de
"Student".
Se utiliza para manejar muestras pequeñas, generalmente menores de 30 y cuando
no se conoce σ .
t - tiende a la normal igual que Z, de tal manera que:
x−µ
t=
Sx
Tiene media 0 y desviación estándar 1, es decir, adopta la forma de la distribución
normal estándar.
S x es el error estándar calculado a partir de la muestra, de tal manera que:

S
Sx =
n −1
donde S es la desviación estándar de la muestra;
S=
∑ (x i − x) 2
n
Así, en el caso de la prueba de hipótesis cuando no se conoce σ, ésta se estima a
partir de S. De esta manera al igual que Z; si: Z ó t son menores o iguales que Z α
ó t α se acepta la hipótesis nula.
Ejemplo : Se desea probar que el ingreso mensual de la ciudad gama es de

$2,500.00 al mes por trabajador, con alfa α = 5%. Para ello se selecciona una
muestra al azar de 26 trabajadores cuyo ingreso medio mensual es de $3,000.00
mes con una desviación estándar de $ 100.00.

Hο: µο = $ 2,500.00 µο = media hipotética.
tal que X - µ =0.

Hι : µ ≠ $ 2,500.00
n = 26 trbajadores
X = $3,000.00
S = $100.00
α = 5%
t α = ± 2.06
Como n -1 indica el número de grados de libertad (G.L.), en este caso G.L.
= n - 1 = 25.
Con ello, buscamos en el apéndice D, el valor critico de t con α =5% y
G.L. = 25, para determinar el área de aceptación y rechazo de la hipótesis, en la
cual t = ± 2.06.
tα=-2.06 tα=2.06
0
Region de
0
Región de aceptación Región de
0
rechazo rechazo
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
µ0 − tα sx 0 µ0 + tα sx
$2,458.80 µo=$2,500 $2,541.20
x − µ0 S 100
t= ; donde S x = = = 20
Sx n −1 25
S x = 20
3,000 − 2,500 500
t= = = 25
20 20
Como t = 25 > t α = 2.06 se rechaza la hipótesis de que el ingreso medio de

los trabajadores sea de $2,500.00 en la ciudad γ. Ello se fundamenta en que la
diferencia entre X y µο es significativa y no puede atribuírsele a la selección
aleatoria de la muestra.

De igual manera se puede probar la hipótesis nula de la diferencia de dos

medias usando t, es decir cuando no se conoce σ y se trabaja con muestras
pequeñas menores de 30.
Si n es grande se puede usar S en lugar de σ en Z, es decir:
x − µ0 S
Z= donde S x =
Sx n −1
Hο: µ1 = µ2 ó µ1 - µ2 = 0 ; tal que x 1 − x2 es al azar
Es decir se desea probar que x 1 − x2 provienen de la misma población

por ello:
µ1 = µ2
La hipótesis alternativa será todo lo contrario:
Hι : µ1 ≠ µ2 ó µ1 - µ2 ≠ 0 tal que x 1 − x2 no proviene de la misma población.
Cuando se conoce σ :
x1 − x 2 σ 12 σ 22
Z= ; donde σ ( x1 − x 2 ) = +
σ ( x1 − x 2 ) n1 n2
Sin embargo, cuando no se conoce, se utilizara t dado:

x − x2 n + n2
t= 1 donde S ( x1 − x 2 ) = S$ 1
S ( x1 − x2 ) n1 n 2
n S 2 + n2 S 22
y S$ = 1 1 con n1 +n2 -2 = G.L.
n 1 + n2 − 2
EJEM PLO 1:
Se desea estimar la diferencia de medias cuando no se conoce σ y son muestras
pequeñas.
Se desea probar la hipótesis con α= 5%, de que el ingreso medio por trabajador
es el mismo en las colonias Arenal y Tlacotal. Para ello se seleccionan dos
muestras al azar, y se obtienen los siguientes datos:
n1 = 10 familias n2 = 17 familias
x 1 = $6,200.00/mes x 2 = $5,600.00/mes
S1 = 690 S 2 = 600
luego, con n1 +n2 -2 = 10 + 17 - 2 = 25 G.L.
y α = 5% t α = ± 2.06

0 tα=-2.06 tα=2.06
0
0.025 0.025
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
2
(X 1 − X 2 )
10(476,100) + 17(360,000) 4 ,761,000 + 6,120,000 10,881,600

S$ = = = = $600.00
10 + 7 − 2 25 25
S$ = 660
n1 + n2 10 + 17 27
S ( x1 − x 2 ) = S$ = 660 = 660 = 660(0.399) = $263.00
n1 n 2 10(17 ) 170
x1 − x 2 6,200 − 5,600 600
t= = = = 2.28
S ( x1 − x2 ) 263 263
t=2.28
Como t = 2.28 > tα = 2.06, tomamos la decisión de rechazar la hipótesis

nula, porque x 1 y x 2 difieren significativamente y no se puede atribuir esa
diferencia a la selección aleatoria de las dos muestras.
De tal manera que decidimos con una probabilidad de 5% de cometer error
tipo I, que el ingreso medio por familia es diferente en las colonias Arenal y
Tlacotal.
Por otra parte, cuando n - 1 es grande, casi es n, tal que Z puede usarse en
lugar de t. En general cuando n > 30 se usará Z; y cuando n < 30 se usará t.
Dado lo anterior, la estimación del intervalo de confianza con t sería:

Limite de confianza = x ± t αSx .

EJEM PLO 3:
Si deseamos estimar el gasto mensual promedio por familia en ropa en una
región con población homogénea‚ para ello seleccionamos al azar una muestra de
10 familias cuya media aritmética es igual a $838.00 con S = $105.00.
n = 10
X = $ 838.00
S = $ 105.00
luego:
S 105
Sx = = = 105 / 3 = $35.00
n −1 9
Así mismo, con α = 5% y 9 G.L. tα = ± 2.262

Limites de confianza = 838 ± 2.262 (35) = 838 ±79.2
Intervalo de confianza = $ 758.8 a $ 917.2
INTERPRETACIÓN: Indica que existe una probabilidad o seguridad del 95% de

que el gasto medio mensual de las familias en ropa sea entre $758.8 y $917.2.
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
758.8 838 917.2
De manera similar se puede estimar el intervalo de confianza para la

diferencia de medias.
Si D = x 1 − x2 entonces :
Limites de confianza = D ± tα S x

Tomando los datos del ejemplo de la prueba de hipótesis

D = 6,200 - 5,600 = $600.00
Con α = 5% y G.L. = 25; tα = ± 2.06 y S x = $35.00
luego limites de confianza = D ± tα S x = 600.00 ± 2.06 (263) = 600 ± 541.7;

intervalo de confianza = 58.3 a 1,141.7.
VIII.4 X CUADRADA (X 2)
Con ella podemos comparar frecuencias observadas y esperadas y dos o

más conjuntos de frecuencias para ver si difieren significativamente, fórmula.:
( fo − fe) 2
χ =∑
2
fe
Nunca es regular.
Grados de libertad : n - n0 restricciones.
VIII.4.1 PRUEBA DE BONDAD DE AJUS TE
Ejemplo.
En la venta de un producto, el gerente dividió al país en 6 regiones de
venta para obtener pedidos por correo. El gerente espera igual número de
pedidos en cada una de las 6 áreas. Después de un breve período, decide probar
la eficacia de su campaña; en ese momento ha recibido 60 solicitudes. El
establece la hipótesis de que no hay diferencia, que las 6 áreas son iguales,
espera 10 solicitudes de cada área. Los resultados son los siguientes :
Nº de (fo-fe)2
pedidos
Área fo fe fo-fe (fo-fe)2 fe
A 6 10 -4 16 1.6
B 15 10 5 25 2.5
C 7 10 -3 9 0.9
D 4 10 -6 36 3.6
E 17 10 7 49 4.9
F 11 10 1 1 0.1
60 13.6

fo: frecuencia observada; fe : frecuencia esperada.

( fo − fe) 2
χ =∑
2
= 13.6
fe
Grados de libertad = n - 1 = 5; α = 5%; χ 2α = 11.07
AREA DE
ACEPTACIÓN
0.05
χ α2 = 11.07
Se rechaza la hipótesis porque χ 2 = 13.6 > χ α2 = 1107

. .
Esto es : χ 2 = 13.6 se halla en la zona de rechazo, ya que la zona de aceptación
llega hasta χ 2α = 11.07
VIII.4.2 PRUEBA DE INDEPENDENCIA DE PRINCIPIOS O DE

CLAS IFICACIÓN EN LAS TABLAS DE CONTINGENCIA.
Cuando tres grupos se puedan clasificar en tres formas, se obtiene una

tabla de contingencia.
Clase A1 A2 A3
B1 n 11 n 21 n 31
B2 n 12 n 22 n 32
B3 n 13 n 23 n 33

Ejemplo de cómo se prueba la hipótesis nula:

Si se envían dos cuestionarios para ser contestados por correo por los
subscriptores de una revista: 100 con una moneda en agradecimiento y 200 sin la
moneda, la hipótesis es que no influye la moneda, por lo que la clasificación es
independiente :
OBSERVADOS ESPERADOS
CUESTIONARIO Respondiero No Total Respondieron No Total
n respondiero respondieron
n
Moneda 77 23 100 65.7 34.3 100
incluida
Moneda no 120 80 200 131.3 68.7 200
incluida
TOTAL 197 103 300 197 103 300
Se esperan 197 normalmente distribuidos entre con y sin moneda.

197
Cuestionarios esperados : * 100 = 65.7 se esperan normalmente distribuidos
300
con moneda.
197
* 200 = 1313. cuestionarios sin moneda
300
103 103
* 100 = 34.3 y * 200 = 68.7
300 300
Así podremos calcular χ 2 .
2
(Fo-Fe)
Celda Fo Fe Fo-Fe (Fo-Fe)2 Fe
1 - 1 77 65.7 11.3 127.7 1.9437
1 - 2 23 34.3 -11.3 127.7 3.7230
2 - 1 120 131.3 -11.3 127.7 0.9726
2 - 2 80 68.7 11.3 127.7 1.8588
8.4981
χ 2 = 8.49 > χ α2 = 384

.
χ 2α = 3.841 con α=5% y G.L. = 1 por lo tanto se rechaza la hipótesis.
Hay R.C. = (2)2 = 4 celdas y (R - 1)(C - 1) = 1 grados de libertad.

Ejemplo adicional a resolver:
Se tomó una muestra de 200 tornillos producidos por 4 diferentes

máquinas para ver la eficacia de los operadores. Para ver si ellos tienden a
producir la misma distribución de la calidad del producto de acuerdo con las
clasificaciones de calidad previamente definidas.
FRECUENCIAS OBSERVADAS
OPERADOR
1 2 3 4 Total
CALIDAD
Excelente 40 44 32 24 140
Marginal 7 5 12 16 40
No aceptable 3 11 6 - 20
Totales 50 60 50 40 200
Probar la hipótesis de que no hay diferencia entre los cuatro

operadores que producirán la misma calidad, con α = 5 %.
Como el numerador es siempre positivo: χ 2 > 0 , tal que la prueba de

hipótesis es de una sola cola o extremo. Con α y (C-1) (R-1) grados de libertad.
Ejemplo de prueba de hipótesis, sobre la independencia de principios:
H o : fo = f e
TABLA DE CONTINGENCIA
Clase A1 A2 A3
B1 n 11 n 21 n 31
B2 n 12 n 22 n 32
B3 n 13 n 23 n 33

FRECUENCIA OBSERVADA FRECUENCIA ESPERADA

H1 H2 H3 H4 Total X1 X2 X3 X4 Total
CALIDAD
Excelente 40 44 32 24 140 35 42 35 28 140
Marginal 7 5 12 16 40 10 12 10 8 40
No 3 11 6 - 20 5 6 5 4 20
aceptable
Totales 50 60 50 40 200 50 60 50 40 200
CALCULO DE LAS FRECUENCIAS ESPERADAS
X1 X2 X3 X4
5 ÷ 200 * 140 = 35 ; 60 ÷ 200 * 140 = 4 ; 5 ÷ 200 * 140 = 35 ; 40 ÷ 200 * 140 = 28
0 2 0
5 ÷ 200 * 40 = 10 ; 60 ÷ 200 * 40 = 1 ; 5 ÷ 200 * 40 = 10 ; 40 ÷ 200 * 40 = 8
0 2 0
5 ÷ 200 * 20 = 5; 60 ÷ 200 * 20 = 6 ; 5 ÷ 200 * 20 = 5 ; 40 ÷ 200 * 20 = 4
0 0
Con α = 0.05 y (C - 1)(R - 1) = (4 -1)(3 - 1) = 3(2) = 6 G.L

χ 2 = 12.592
Región de
rechazo
Área de
aceptación
0.05
χ2=12.595
(Fo-Fe)2
Celda Fo Fe Fo-Fe (Fo-Fe)2 Fe

1 - 1 40 35 5 25 0.7143
1 - 2 44 42 2 4 0.0952
1 - 3 32 35 -3 9 0.2571
1 - 4 24 28 -4 16 0.5714
2 - 1 7 10 -3 9 0.9000
2 - 2 5 12 -7 49 4.0833
2 - 3 12 10 2 4 0.4000
2 - 4 16 8 8 64 8.0000
3 - 1 3 5 -2 4 0.8000
3 - 2 11 6 5 25 4.1667
3 - 3 6 5 1 1 0.2000
3 - 4 0 4 -4 16 4.0000
24.1881
( fo − fe) 2
χ2 = ∑ = 24.17
fe
Como χ 2 = 24.17 > χ α2 = 12.592 , rechazamos la hipótesis de que los cuatro
operadores no difieran en habilidad para producir tornillos.
VIII.5 EVALUACIÓN ES TADÍS TICA DE ENCUES TAS MENS UALES O

PERIODICAS
1.- Introducción
El levantamiento mensual de encuestas requiere de una supervisión
estadística que permanentemente favorezca la confiabilidad de la información.
Para ello es necesaria la aplicación de ciertas técnicas que detecten si existe o no
relación entre el tamaño de la muestra y el valor de los indicadores.
Para ilustrar lo anterior se tomó como referencia una encuesta mensual que
hace el Instituto de la Pequeña y M ediana Empresa.
La periodicidad de la encuesta requiere la aplicación de técnicas fuertes
que permitan eliminar rápidamente los factores irrelevantes y retener los de gran
significación en los resultados. A las medidas estadísticas que permitan
cumplir con estos objetivos se les denominará
COEFICIENTES DE AS OCIACIÓN.
Puesto que el método de muestreo utilizado es el de proporciones
correspondientes a indicadores con distribuciones fuera de cualquier curva
definida por funciones matemáticas, se optó por la aplicación de pruebas de

asociación no paramétrica de las variables en la pequeña y mediana empresa en

conjunto.
2.- Prueba de asociación.

La escasez de recursos humanos y el limitado acceso a la
computadora, en esta etapa determinaron el manejo de solo tres medidas de
asociación; en la medida que se resuelvan estos problemas y que el personal se
familiarice con el análisis estadístico, se aplicarán diseños muestrales y
coeficientes de asociación más sofisticados.
Por otra parte, mientras el análisis estadístico no se instrumente en la
computadora, mensualmente se evaluará una de las siguientes variables. Para
iniciar los trabajos de julio, de la encuesta de junio se analizó:
-Personal ocupado promedio respecto al mes anterior
-Inventario de productos finales
-Fuentes de financiamiento para resolver problemas de liquidez, total industria
pequeña y mediana.
PERS ONAL OCUPADO PROMEDIO

Se recurre a la χ2 : Ji Cuadrada basada en las tablas de contingencia
para probar la hipótesis de independencia entre el tamaño de la muestra y la
opinión de los empresarios. Para ello se comparan las respuestas "reales" de la
muestra con las respuestas "esperadas".
Personal Ocupado
Respuesta Real
Muestra Aumento No Disminuyó Total
Aumentó
Alimentos
.
.
.
.
Otros
Total 419
% 100

Cuando se acepta la hipótesis no es necesario modificar el tamaño de la

muestra. En cambio si se rechaza la hipótesis, se identifica que si hay una
relación entre el tamaño de la muestra y la opinión de los empresarios; por lo
que es necesario hacer un análisis como el que se describe a continuación:
Así por ejemplo: partiendo del rechazo de la hipótesis nula basado en la

χ , se utilizará la estadística φ para cuantificar la relación entre la muestra y las
2
opiniones ; ya que si es baja quizá no valga la pena hacer las revisiones

correspondientes; en cambio si es alta de inmediato se hace un análisis de
sesgo y cobertura.
Phi (φ )
Es una medida de la fuerza de la relación que existe entre las variables
descriptivas, la cuantitativa (muestra) y la cualitativa (opinión de los
empresarios). Phi toma el valor de 0 cuando no hay relación y + 1 cuando las
variables se relacionan a la perfección. Phi hace la corrección en el valor de χ 2
porque éste es directamente proporcional al tamaño de la muestra (n) y por ello
su fórmula es :
1/ 2
χ 2 
φ= 
 n 
V de Cramer
Cuando φ se obtiene de tablas de contingencia más grande a la de 2 x 2,

como es el caso concreto de la encuesta, su valor no tiene límite superior, por lo
que se usa V de Cramer para ajustar φ en términos de las columnas o de las
hileras, dependiendo cual de ellas es más pequeña.
El valor de la estadística V también oscila entre 0 y +1. Así, un valor alto

de V significa que hay un alto grado de asociación.
Su fórmula es:
1/ 2
 φ2 
V= 
 min(r − 1, c − 1) 
En resumen, si una vez aplicadas las estadísticas χ 2 , φ y V, se

encuentra que el valor de V es alto, entonces se toma la decisión de hacer el
análisis de sesgo y cobertura, para lo cual se analiza la información a fin de

validarla y determinar si los resultados pueden atribuirse a relaciones o

asociaciones legítimas o a la selección aleatoria de la muestra.
Si es ésta última habrá que hacer lo siguiente:

1) recalcular el tamaño de la muestra (cobertura) en los grupos industriales
afectados y,
2) mantener el porciento dentro de ciertos limites de control (sesgo).
PROCEDIMIENTO
A continuación se expone un ejemplo completo con datos del mes de

junio, empezando por la χ 2 , φ y V , hasta el análisis de cobertura para el caso
extremo en que tuviéramos que recalcular toda la muestra, aplicando el muestreo
simple aleatorio; así como para el cálculo especifico para algunos grupos
industriales, usando el muestreo estratificado proporcional.
TABLA DE CONTINGENCIA
GRUPO
INDUSTRI A1 A2 A3 TOTAL
AL
B1 R11 S21 T31 V1 = R11 + S21 + T13
B2 R12 S22 T32 V2 = R12 + S22 + T32
B3 R13 S23 T33 V3 =
B4 R14 V4 =
B5 R15 V5 =
B6 R16 V6 =
B7 R17 V7 =
B8 R18 S28 V8 =
B9 R19 V9 = R19 + S29 + T39

B10 R110 T310 V10 =

B11 R111 S211 V11 =
B12 R112 V12 =
B13 R113 V13 =
B14 R114 T314 V14 =
B15 R115 S215 T315 V15 =
B16 R116 S216 T316 V16 = R116 + S216 + T316
TOTAL R S T V = R + S +T
Construyendo la tabla de contingencia con los resultados observados

para el Personal Ocupado en junio, se obtiene la tabla 3X16 que aparece a
continuación para las dos variables descriptivas Bi (cuantitativa y A :
Cualitativa: opinión de los empresarios ).
Donde:
B1: grupo industrial
A1 : Aumentó
A2 : No aumentó
A3 : Disminuyó
R = Σ Ri
S = Σ Si
T = Σ Ti
V = Σ Vi = R + S +T
Vi = Σ (Ri + Si + T i)
i = 1, 2, 3, ...., 16
Personal Ocupado Promedio

Respuesta Real
Muestra Aumento No vario Disminuyo Total
Fab. de alimentos 10 61 13 84
Industria Textil 3 22 3 28
Fab. de Prendas de Vestir 4 27 9 40
Fab. de Calzado e Ind. del Cuero 5 25 7 37
Ind. y Prod. de Madera y Corcho 0
Excepto Muebles 1 9 5 15

Fab. y Rep. de Muebles de Madera 1 11 9 21

Ind. Editorial de Impresión y 6 13 1 20
Conexas
Industria Química 3 11 2 16
Fab. de Prod. de Hule y Plástico 4 19 2 25
Fab. de Productos Minerales no 3 24 9 36
Metalicos
Industrias Metalicas Básicas - 4 1 5
Fab. de Prod. Metalicos 2 27 12 41
Fab. de Maq. y Equipo Excepto los 9 13 2 24
Electricos
Fab. de Maq. y Equipo y Aparatos - 4 3 7
Electricos
Construcción de Equipo de 3 6 5 14
Transporte
Otras Industrias Menufactureras 2 3 1 6
TOTAL 56 279 84 419
R S T V
Cálculo de las frecuencias esperadas
GRUPO

INDUSTRIAL X1 X2 X3 TOTAL
B1 V1 ( R/V ) = 11 V1 ( S/V ) = 56 V1 ( T/V ) = 17 V1 = 84
B2 V2 ( R/V ) = 4 V2 ( S/V ) = 17 V2 ( T/V ) = 6 V2 = 28
B3 V3 ( R/V ) = 5 V3 ( S/V ) = 27 V3 ( T/V ) = 9 V3 = 40
B4 V4 ( R/V ) = 5 V4 ( S/V ) = 25 V4 ( T/V ) = 7 V4 = 37
B5 V5 ( R/V ) = 2 V5 ( S/V ) = 10 V5 ( T/V ) = 3 V5 = 15
B6 V6 ( R/V ) = 3 V6 ( S/V ) = 14 V6 ( T/V ) = 4 V6 = 21
B7 V7 ( R/V ) = 3 V7 ( S/V ) = 13 V7 ( T/V ) = 4 V7 = 20
B8 V8 ( R/V ) = 2 V8 ( S/V ) = 11 V8 ( T/V ) = 3 V8 = 16
B9 V9 ( R/V ) = 3 V9 ( S/V ) = 17 V9 ( T/V ) = 5 V9 = 25
B10 V10 ( R/V ) = 5 V10 ( S/V ) = 24 V10 ( T/V ) = 7 V10 = 36
B11 V11 ( R/V ) = 1 V11 ( S/V ) = 3 V11 ( T/V ) = 1 V11 = 5
B12 V12 ( R/V ) = 5 V12 ( S/V ) = 28 V12 ( T/V ) = 8 V12 = 41
B13 V13 ( R/V ) = 3 V13 ( S/V ) = 16 V13 ( T/V ) = 5 V13 = 24
B14 V14 ( R/V ) = 1 V14 ( S/V ) = 5 V14 ( T/V ) = 1 V14 = 7
B15 V15 ( R/V ) = 2 V15 ( S/V ) = 9 V15 ( T/V ) = 3 V15 = 14
B16 V16 ( R/V ) = 1 V16 ( S/V ) = 4 V16 ( T/V ) = 1 V16 = 6
TOTAL R=56 S=279 T=84 V=419
Agrupándolos por celda, tendremos:

Celda fr Fe fr-fe Celda fr fe fr-fe

1 - 1 10 11 -1 13 - 1 9 3 6
1 - 2 61 56 5 13 - 2 13 16 -3
1 - 3 13 17 -4 13 - 3 2 5 -3
2 - 1 3 5 -2 14 - 1 0 1 -1
2 - 2 22 17 5 14 - 2 4 5 -1
2 - 3 3 6 -3 14 - 3 3 1 2
3 - 1 4 4 0 15 - 1 3 2 1
3 - 2 27 27 0 15 - 2 6 9 -3
3 - 3 9 9 0 15 - 3 5 3 2
4 - 1 5 5 0 16 - 1 2 1 1
4 - 2 25 25 0 16 - 2 3 4 -1
4 - 3 7 7 0 16 - 3 1 1 0
5 - 1 1 2 -1
5 - 2 9 10 -1
5 - 3 5 3 2
6 - 1 1 3 -2
6 - 2 11 14 -3
6 - 3 9 4 5
7 - 1 6 3 3
7 - 2 13 13 0
7 - 3 1 4 -3
8 - 1 3 2 1
8 - 2 11 11 0
8 - 3 2 3 -1
9 - 1 4 3 1
9 - 2 19 17 2
9 - 3 2 5 -3
10 - 1 3 5 -2
10 - 2 24 24 0
10 - 3 9 7 2
11 - 1 0 1 -1
11 - 2 4 3 1
11 - 3 1 1 0
12 - 1 2 5 -3
12 - 2 27 28 -1
12 - 3 12 8 4
Donde: fr = frecuencia real

fe = frecuencia esperada
Haciendo las comparaciones, entre fr, fe para sustituirlas en la fórmula, se
obtiene:
(fr-fe)2 (fr-fe)2
2 2
(fr-fe) fe (fr-fe) fe
1 0.0909 2 0.1176
25 0.4464 9 1.8000
16 0.9412 4 0.8000
4 0.8000 0 0.0000
25 1.4706 4 0.5714
9 1.5000 1 1.0000
0 0.0000 1 0.3333
0 0.0000 0 0.0000
0 0.0000 9 1.8000
0 0.0000 1 0.0357
0 0.0000 16 2.0000
0 0.0000 36 12.0000
1 0.5000 9 0.5625
1 0.1000 9 1.8000
4 1.3333 1 1.0000
4 1.3333 1 0.2000
9 0.6429 4 4.0000
29 7.2500 1 0.5000
9 3.0000 9 1.0000
0 0.0000 4 1.3333
9 2.2500 1 1.0000
1 0.5000 1 0.2500
0 0.0000 0 0.0000
1 0.3333 Total 53.90
1 0.3333
( fr − fe ) 2
χ =
2
χ 2 = 5390
.
fe
con α = 0.05 y (c-1)(R-1) = (3-1)(16-1) = 30 grados de libertad.
el valor critico de χ α2 = 43.773 tenemos que

Zona de
Zona de rechazo
aceptación
α=0.05
χ α2 =43.773
Como χ 2 = 5390
. > χ α2 = 43.773 se rechaza la hipótesis nula de que no
hay diferencia entre el tamaño de la muestra y la opinión de los empresarios.
Luego se inicia la prueba Phi ( φ ) para cuantificar el grado de
asociación entre las dos variables descriptivas.
1/ 2 1/ 2
χ 2   53.90
φ=  =  = (012864
. )1 /2 = 0.358
 n   419 
La interpretación es que hay una relación sensiblemente significativa.
Como la tabla de contingencia es más grande que una de dos por dos, se
aplica la V Cramer para corregir el valor de φ .
1 /2 1/ 2 1/ 2
 φ2   ( 0.358) 2   0128164
. 
V=  =   = 
 C − 1  2   2
1/2
V = (0.064082)
V = 0.25
Puesto que el valor de V oscila entre cero y más uno, no se modifica el

tamaño de la muestra para el mes de junio porque la asociación no es fuerte.
Si se hubiera tomado la decisión de hacer el análisis de cobertura y sesgo,
el procedimiento seria:

Cobertura: Nuevo Tamaño de la Muestra
A) Muestreo simple aleatorio
Antecedentes
Obtener el tamaño de la muestra adecuado para asegurar con una

probabilidad igual a 95%, que el error en la estimación del número medio de
empresas necesarias no sea mayor del 6%.
Para ella se tomó la muestra aleatoria del mes de junio, la cual fue de 419
empresas distribuidas en 16 grupos industriales de la siguiente manera:
Nº de
Empresas
Concepto (Xi)
Total 419
1 .- Fab. de alimentos 84
2 .- Industria Textil 28
3 .- Fab. de Prendas de Vestir 40
4 .- Fab. de Calzado e Ind. del Cuero 37
5 .- Ind. y Prod. de Madera y Corcho Excepto 15
Muebles
6 .- Fab. y Rep. de Muebles de Madera 21
7 .- Ind. Editorial de Impresión y Conexas 20
8 .- Industria Química 16
9 .- Fab. de Prod. de Hule y Plástico 25
10 .- Fab. de Productos Minerales no 36
Metalicos
11 .- Industrias Metalicas Básicas 5
12 .- Fab. de Prod. Metalicos 41
13 .- Fab. de Maq. y Equipo Excepto los 24
Electricos
14 .- Fab. de Maq. y Equipo y Aparatos 7
Electricos
15 .- Construcción de Equipo de Transporte 14
16 .- Otras Industrias Menufactureras 6

2 Cálculo
Como no se conocen los valores de los parámetros poblacionales µ y σ 2 ,
es necesario estimarlos a partir de las estadísticas x y S 2 de la muestra. Así;
Grupo
Industrial Xi % Xi 2
1 84 20 7,056
2 28 7 784
3 40 10 1,600
4 37 9 1,369
5 15 4 225
6 21 5 441
7 20 5 400
8 16 4 256
9 25 6 625
10 36 9 1,296
11 5 1 25
12 41 10 1,681
13 24 6 576
14 7 2 49
15 14 3 196
16 6 1 36
Suma 419 102 16,615
1 n 1
X= ∑
n i= 1
x i = ( 419) = 26 empresas
16
1 1
S 2 = ∑ xi2 − x 2 = (16,615) − (26) 2 = 1038 − 676 = 362 empresas
n 16
Considerando que el error en la estimación (e) del promedio de empresas

no debe ser superior al 6%, y recordando que el estimador de µ = x = 26
empresas, se observa que e = 26 (0.06) = 1.56 empresas.

Igualmente, como se desconoce el valor de σ 2 y tomando en cuenta que

su estimador proviene de una muestra mayor de 30 empresas, la distribución
teórica a la cual se aproxima la distribución de muestreo es a la normal.
En este caso se estima µ de la población con variable aleatoria asociada
X mediante el empleo de x , proveniente de n = 419 con e = 6 % y un nivel de
confianza ξ = 95 %, donde Z= desviación correspondiente al nivel de
confianza de ξ en la distribución normal; en este caso la probabilidad ξ le
corresponde Ζα = ± 1.96.
Considerando a K σ x x
como = Ζα (σ x ) este razonamiento para obtener el
tamaño de la muestra se basa en el hecho de que:
P( x − k σ ≤ µ ≤ x + kσ ) = Pk = 1 − α = 95%
α = nivel de significación = 5%
En otras palabras P[ p$ − p ≥ 0.06 p] = 1 − 0.95 = 5%

Ello significa que el error en la estimación del valor de µ en valores absolutos es:
|error en la estimación de µ| = kσ , por lo que
|error máximo admisible| = |error en la estimación de µ| = e
Derivado de lo anterior se puede escribir.
e = kσ x = Zα σ x donde Z α = variable estandarizada.
σ
donde σx = ,para una población infinita.
n
Sabiendo que K= Z
σ2 N −n
Cuando la población es finita e = k
n N −1
Como no se conoce σ , la estima S y sabiendo que K=Z
2 2
S2 N −n
e = Zσ x = Z
n N −1
Para obtener el tamaño de la muestra (n), se despeja de la ecuación
anterior elevando al cuadrado ambos miembros.
S2 N −n
e2 = Z 2
n N −1
Z2*S2 *N
Así: n = 2
e N − e2 + Z 2 S 2

Con e = 6% ; en absolutos e = 26(0.06) = 1.56 empresas;

α=5%
ξ = 95 %
Z = ± 1.96
S2 = 362
N = 8,966
Z2 *S2 * N . ) 2 ( 362)(8,966)
(196 12,468,650 12,468,650
n= 2 2 2 = 2 = =
2
e N−e +Z S 2
. ) (8,966) + (362)(196
(156 . ) − (156
. ) 21,820 + 1,391 − 2 23,209
n = 537 empresas.
Comprobación del valor de ( e )
S2 N −n
e2 = Z 2 = (3.84)(0.6741)(0.94)
n N −1
e2 = 2.43 luego e = 1.56 empresas= error permitido= error de muestreo.
Si deseamos distribuir la muestra de 537 empresas por grupo industrial, se hace

con el procedimiento llamado de afijación proporcional de la muestra, de
conformidad con la importancia que tenga cada estrato (Ni) dentro del
universo (N).
Grupo Ni/N
Industrial % n= 537 ni
1
2
3
4
5
Donde i = 1, 2, 3, 4, 5, ......, 16
por lo que n1 + n2 + n3 + ....+n16 = n = 537
B. muestreo estratificado
Tomando como referencia los datos de este diseño muestral que aplicamos en el
inciso en que hablamos de la precisión, donde indicamos que el error de muestreo
se mide con el error estándar, entonces digamos ahora que si el error estándar de

la proporción proveniente de una distribución de muestreo estratificada finita

es:
k
N i − ni
σp= ∑W i
2
S i2
N i * ni
1
k k
k
N i − ni
∑ Wi 2 Si2 N i − ni ∑ Wi2 S i2
σ 2p = ∑ Wi 2 S i2 =
1 N i * ni N i * ni
k k
σ 2p (N i * ni ) = N i ∑Wi 2 Si2 − ni ∑Wi 2 Si2
1 1
k k
σ 2p (N i * ni ) + ni ∑Wi2 Si2 = Ni ∑Wi 2 Si2
1 1
Entonces :
k k
ni (σ N i + ∑ Wi Si ) = N i ∑ Wi 2 S i2
2 2 2
p
1 1
k
N i ∑ Wi 2 Si2
ni = k ; comoS 2 = pq
σ 2p N i + ∑ Wi 2 Si2
1
k
N i ∑ Wi 2 pq
ni = k
σ 2p N i + ∑ Wi 2 pq
1
Ejemplo:
Empresas
de
Estratos Ni Wi ni la muestra Pi
muestra que
contestaron
1 7,000 0.7 200 160 160 ÷ 200 = 0.8
2 1,000 0.1 100 40 40 ÷ 100 = 0.4
3 2,000 0.2 100 60 60 ÷ 100 = 0.6
10,000 1 400 260

Con σp = 0.025
k
Como ∑W i
2
S12 =(0.49)(0.16)+(0.01)(0.24)+(0.04)(0.24)=0.0784 + 0.0024 +
1
0.0096 = 0.904
La muestra para cada estrato se va obteniendo así:
7,000(0.0904)
n1 =
(0.025) 2 7,000 + 0.0904
633
n1 = = 142;
4,465
1,000( 0.0904) 90.4
n2 = = = 126
( 0.000625)1,000 + 0.0904 0.715
2,000(0.0904)
n3 = = 135
(0.000625)2,000 + 0.09041
n1 + n2 + n3 = n = 402
Sesgo : Limites de Central
Para el análisis de sesgo se definen limites de control ( o de confianza ) donde

con cierta probabilidad se mantendrá el valor del porciento con un tamaño dado
de muestra.
Así limites de control = p ± Z σp

Cuando se salga de esos limites de control nuevamente se hará la
prueba de X2 ; si se rechaza la hipótesis nula, nuevamente se revisará la muestra
en el grupo y se determinará si el porciento es legitimo o se debe a errores de
muestreo, de tal manera que el proceso se vuelve interactivo, en el sentido de
que se harán ajustes cuantas veces sea necesario hasta llegar a muestras
satisfactorias.

VIII.6 PRUEBA DE HIPÓTES IS CON F: ANÁLIS IS DE VARIANCIA(12)

VIII.6.1 MÉTODO LARGO
Con el uso de este instrumental se pueden manejar o comparar las

diferencias de más de dos medias muestrales, es decir, cuya homogeneidad puede
probarse analizando la variabilidad o variancia entre ellos.
Variancia entre grupos
F=
Variancia dentro de grupos
Ejemplo.- La compañía NESTLE desea probar si sus 3 agentes de ventas :

Rodríguez, Salinas y Pacheco tienden a vender el mismo volumen de
mercancía o si difieren en su habilidad para vender.
Lo anterior lo verifican tomando el promedio de ventas hechas por cada
uno.
La semana pasada hicieron 14 llamadas:

◊ Rodríguez hizo 5 llamadas
◊ Salinas hizo 4 "
◊ Pacheco hizo 5 "
y sus ventas fueron como sigue en miles de pesos:
Rodriguez Salinas Pacheco

$ 300.00 $ 600.00 $ 700.00
$ 400.00 $ 300.00 $ 300.00
$ 300.00 $ 300.00 $ 400.00
$ 500.00 $ 400.00 $ 600.00
$ 500.00
$ 1500.00 $ 1600.00 $ 2500.00
X 1 = $300.00 X 2 = $400.00 X 3 = $500.00

La gran media muestral X = 400.00
La pregunta a contestar es: si las tres medias difieren más de lo
esperado por la selección aleatoria de la muestra :Ho
Para ello se analiza la relación entre sus variancias.
La idea básica es que la variancia poblacional se puede estimar de la

muestra en diversas formas.

A continuación se ilustran tres maneras de calcularla:
i) Se podría estimar calculando las desviaciones de las medias muéstrales con

respecto a la gran media, a lo cual llamamos: variación entre grupos (medias X )
que son:
X 1 = $300.00 X 2 = $400.00 X 3 = $500.00, X = 400.00
ii) También se puede estimar de la muestra comparando cada una de las ventas
individuales con la media de su grupo, lo cual llamaremos: variación dentro
de los grupos.
El total de observaciones (T) es 14; con ni en cada grupo,esto es:

n1 = 5 ; n2 = 4 ; n3 = 5
iii) La otra manera de estimarla será comparando cada una de las 14

observaciones con la gran media de las observaciones en los tres grupos a lo cual
llamaremos : variación total.
Para realizar la prueba se establece la hipótesis nula de que no hay
diferencias entre los vendedores, y las diferencias observadas se deben a la
selección de la muestra.
Esta prueba, se realiza con la distribución F, por medio de la cual se
determina si dos varianzas difieren más de lo esperado, examinando la razón o
cociente entre ellas.
Los grados de libertad G.L.1, y G.L.2 , determinan la forma de la curva;
GL1 = n1 - 1; GL2 = n2 - 2; F(n1 -1, n2 - 2), donde el primer número en el
paréntesis son los G.L. del numerador y el segundo los G.L. del denominador.
La mayoría de las pruebas que se realizan con F son de una cola, donde
la región de rechazo se halla en la cola derecha.
En general tiene la forma :

Distribución F
Zona de
Zona de rechazo
aceptación
0.05
Por ello, generalmente la prueba de hipótesis se hace utilizando el

extremo o cola derecha.
Debe quedar claro, que las pruebas de análisis de varianza no
pretenden probar la significación de las diferencias entre dos varianzas
muestrales, su propósito es probar la significación de las diferencias entre
medias muestrales con el mecanismo de distribución F.
Ahora procederemos a desarrollar las ecuaciones necesarias para
realizar la prueba de análisis de varianza usando los siguientes símbolos :
i : designción de grupo
K : número de grupos ( K - 3 )
ni: número de observaciones en el i-ésimo grupo
T : total de observaciones
k
T = ∑ ni = 5 + 4 + 5 = 14
i= 1
X i M edia de i-ésimo grupo

j : numeración seriada de las observaciones dentro de los grupos xij : una
observación. La j-ésima observación en el grupo i-ésimo
X : gran media de las T observaciones
Así :
1o.-El número de grados de libertad es aditivo, esto es: K - 1
2o.-Para la varianza proveniente de dentro de los grupos, los G.L.= ( T - K )
3o.-Los G.L. de la varianza de las variaciones totales serán =(T-1)

Por ello es que el número de grados de libertad es aditivo, esto es

(K - 1 ) + ( T - K ) = T - 1
Así, primero calculamos las variaciones entre grupos con la fórmula:

k
∑ n (x
L= 1
i i − x )2
K=3 ; X 1 = $300; n1=5

X =$400 ; X 2 = $400; n2=4
T = 14 ; X 3 = $500; n3=5
n1 = (x i − x ) = 5(300-400)2=50,000
2
n2 = ( x 2 − x ) 2 = 4(400-400)2 =0
n3 = (x 3 − x ) 2 = 5(500-400)2 =50,000
k
∑ n (x
L= 1
i i − x ) 2 = 50,000 + 0 + 50,000 = 100,000
2o.-La variación dentro de los grupos, con la fórmula:

k ni
∑ ∑ (x
i =1 j =1
ij − x j )2 .
Para Rodriguez ( i=1 ) : Σ (x1j - 300)2 = 140,000

Para Salinas ( i=2 ) : Σ (x2j - 400)2 = 60,000
Para Pacheco ( i=3 ) : Σ (x3j - 500)2 = 100,000
k ni
∑ ∑ (x
i =1 j =1
ij − x j ) 2 . = 140,000 + 60,000 + 100,000 = 300,000
Rodriguez (i=1) Salinas (i=2) Pacheco (i=3)

X 1 = $300.00 X 2 = $400.00 X 3 = $500.00,
_ _ _ _ _ _
2 2
j xij-x (x1j-x) (x2j-x2) (x2j-x) (x3j-x3) (x3j-x3)2
1 0 0 200 40,000 200 40,000
2 100 10,000 -100 10,000 -200 40,000
3 0 0 -100 10,000 -100 10,000
4 200 40,000 0 0 100 10,000
5 -300 90,000 0 0 0 0

140000 60,000 100,000
3o.-La variación se calcula con :

k ni
∑ ∑( x
i =1 j =1
ij − x )2 = ∑ ( X ij − X ) 2 .
T
Cálculo de la variación total :
RODRIGUEZ SALINAS PACHECO
j X ij − X ( X ij − X )2 X2 j − X ( X 2 j − X )2 X3 j − X 2
( X3j − X )
1 -100 10,000 200 40,000 300 90,000

2 0 0 -100 10,000 -100 10,000
3 -100 10,000 -100 10,000 0 0
4 100 10,000 0 0 200 40,000
5 400 160,000 0 0 100 10,000
190000 60,000 150,000
Luego ∑T ( X IJ − X ) 2 = 190,000 + 60,000 + 150,000 = 400,000
Resumen del análisis de la varianza :
Variación Grados de Suma de Varianza

libertad cuadrados
Entre grupos K-1= 3-1=2 100,000 50,000
Dentro de T - K = 14 - 3 = 11 300,000 27,273
grupos
Total T - 1 = 14 - 1 = 13 400,000
50,000
F ( 2, 11 ) = = 183
.
27,273
Con α = 0.05 y ( 2 y 11) G.L. Fα= 3.98
Como F = 1.83 < Fα = 3.98 : concluimos con esta evidencia que hay
homogeneidad entre las medias; no es una evidencia de la cual podemos inferir
que los vendedores difieren en habilidad para hacerlo.

VIII.6.2 MÉTODO ABREVIADO PARA CALCULAR F
1.-La variación entre los grupos se calcula ahora con :

K
∑
I=
nI xi 2
− Tx 2
1
2.-La variación dentro de los grupos :

k
∑ x ij2 − ∑ ni x i2
T i =1
La variación total:
∑ x ij2 − Tx i2
T
Luego, sólo se calculan 3 términos:

K
∑ x ij2 ;
T
∑
I=
nI xi 2
Tx 2
1
X ij xij2 x ij xij2 x ij xij2
300 90,000 600 360,000 700 490,000

400 160,000 300 90,000 300 90,000
300 90,000 300 90,000 400 160,000
500 250,000 400 160,000 600 360,000
0 0 500 250,000
590,000 700,000 1,350,000
Así ∑ x ij 2
= 590,000 +700,000 + 1,350,000 = 2,640,000
T
K
∑= nI x i 2
= n1 x12 + n2 x 22 + n 3 x 32 = 5(300)2 + 4(400)2 + 5(500)2 =
I 1
=450,000 + 640,000 + 1,340,000 = 2,340,000

Finalmente = Tx 2 = 14(400)2 = 14(160,000) = 2,240,000
K
Luego : 1.- Variación entre grupos: ∑= nI x i
2
− Tx 2 = 2,340,000 - 2,240,000 =
I 1
100,000
2.- Variación dentro de los grupos:

k
∑ xij2 − ∑ ni xi2 = 2,640,000 - 2,340,000 = 300,000.

T i =1

3.- Variación total:
∑T xij − Tx
2 2
= 2,640,000 - 2,240,000 = 400,000
Con estos datos se prueba la hipótesis nula y se llega a los mismos resultados
que con el método directo.
COMENTARIOS FINALES :
Después de haber expuesto la forma en que se verifica estadísticamente una

hipótesis de trabajo, podemos concluir diciendo que este instrumental es muy
importante cuando se hacen investigaciones aplicando el método científico, ya
que son fundamentales para el desarrollo de los estudios que hagamos; la
aceptación o rechazo de la hipótesis nula influye en el cumplimiento de los
objetivos establecidos para la solución de un determinado problema.
Si el método científico guía la investigación, dice el Dr. Raúl Rojas Soriano(19),, la
hipótesis, como estudio especñifico para verificar conjeturas sobre la

naturaleza y solución del problema, coadyuva a la obtención de
resultados que enriquecen y aceleran el cumplimiento de los objetivos
planteados.
Por ello recomienda que debe plantearse con claridad y precisión; sus
conceptos deben contar con referencias empíricas y siempre formularse
en términos afirmativos para garantizar que sus hallazgos coadyuven a la
solución de los problemas.
Se espera que los métodos correspondientes a la estadística descriptiva y

a la estadística inductiva, por la manera en que se expuso eilustró su aplicación,
corroboren su importancia en el análisis de fenómenos económicos, tanto micro (a
nivel de empresa) como macro (a nivel de país) y despierten en el lector el interés
por profundizar en su manejo ampliado hacia otros campos del conocimiento.

VIII. PRÁCTICA XI
PRUEBA DE HIPÓTESIS
1.- Establezca la diferencia entre: a) Una hipótesis nula y una hipótesis

alternativa; b) Un error tipo I y un error tipo II.

2.- Explique lo siguiente: a) Nivel de significación; b) Valor critico; c) Región

de rechazo; Región de aceptación.
3.- Indique la diferencia entre: a) Una prueba de dos extremos y una prueba de un
extremo; b) Una prueba de extremo izquierdo y una de extremo derecho.
4.- Describa el procedimiento básico para hacer una prueba de hipótesis,

haciendo énfasis cuando el tamaño de la muestra es grande y cuando es pequeña,
así como cuando la desviación estándar de la población, σ, es conocida, y
cuando σ es desconocida y el error estándar del estadístico, Sx , se estima a
partir de una muestra.
Problema 1.- La media y la desviación estándar de la resistencia de cuerdas

producidas por una compañía A, fueron 600 libras y 40 libras respectivamente.
Se acaba de aplicar una nueva técnica en el proceso de fabricación. Se piensa que
la resistencia de las cuerdas puede aumentar con este proceso. Para ello el
gerente de producción tomo una muestra de 64 cuerdas cuya media es de 609
libras. ¿Se puede concluir que hay un incremento de la resistencia media con α
= 5%?
Problema 2 Los laboratorios de medicina "Anahuac" sostienen que su producto,

"Vuelve a la vida" fue 95% efectivo en mitigar los sufrimientos de la fiebre en
un período de 5 horas. Una muestra de 150 personas que usaron el producto
indica que produjo alivio para 138 personas. ¿Cree que la afirmación hecha por
"Anahuac" es valida al nivel de significación de 0.10?
Problema 3 Una muestra de calificaciones de 80 estudiantes en una clase de

estadística está dada en las columnas (1 y 2) de la siguiente tabla. El número
teórico de estudiantes para cada clase que figura en la columna 3 se obtuvo
mediante la curva normal. Determine si hay una diferencia significativa, usando la
X2 entre las calificaciones esperadas o teóricas y las observadas en la clase de
estadística con α = 0.05.
1 2 3
CALIFICACIONES NÚMERO DE

ESTUDIANTES
(Intervalo de clase) Real Teorico
20 - 29 3 1
30 - 39 6 3
40 - 49 5 8
50 - 59 7 13
60 - 69 10 17
70 - 79 29 16
80 - 89 12 12
90 - 99 8 6
99.5 y más 0 4
Total 80 80
Problema 4.- Se tomo una muestra de los salarios de 13 trabajadores clasificados

en electricistas, carpinteros y pintores. Probar si los salarios medios de estas
tres categorías de trabajadores difieren significativamente con α = 5% y α =
1%.
Número de Salarios de los trabajadores

trabajadores
en cada muestra Electricista Carpintero Pintores
s s
$ $ $
1 74 75 56
2 65 78 55
3 72 74 53
4 69 76 52
5 72
Total 280 375 216
S OLUCIÓN PRÁCTICA XI
Solución del problema 1
Datos:
µ = 600 libras de resistencia
σ = 40 libras
n = 64 cuerdas
x = 609 libras
α = 5%
Ho: µ > 600 libras de resistencia

Hi: µ < 600 libras

luego Z α = ± 1.645
x −µ σ
La prueba se hace con: Z = donde σ x = porque n >30
σx n
Sustituyendo
609 − 600 9 40 40
luego Z = = = 18. así σ x = = =5
5 5 64 8
σx = 5
Como Z=1.8 > Z α=1.645 se toma la decisión de rechazar la hipótesis nula de que
hay un incremento de la resistencia de las cuerdas en la nueva técnica de
fabricación es decir, no mejoro su resistencia.
Solución del problema No. 2

Datos:
Π = 95% en un período de 5 horas
P = 92% = 138/150
n = 150
α = 0.10
luego Z α = ± 1.280
con Ho: Π = 95% en menos de cinco horas
La prueba es de una cola o extremo, puesto que el alivio fue en un

período de cinco horas; la hipótesis alternativa es:
Hi: Π = 95% en más de cinco horas: El alivio fue para un período mayor de cinco
horas.
Zona de
0
rechazo
Zona de aceptación
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
Zα=-1.28 Π=95%

p−Π p*q
La prueba se hace con Z = donde σ p =
σp n
(0.92)( 008
. )
porque n>30 luego σ p = = 00004906
. = 0.022
150
. − 0.95
092
Así tenemos que Z = por lo tanto Z = -1.36
0.022
Decisión: Se toma la decisión de rechazar la hipótesis de que la medicina es

efectiva en un 95% en un periodo de 5 horas.
Solución al problema No. 3, de X2, usando dos métodos.

Antecedentes: Se acostumbra como una regla de seguridad para aplicar la
distribución X2, que la frecuencia esperada o en este caso el número teórico de
estudiantes, en cada clase deberá ser cuando menos cinco. Así, cuando hay
frecuencias pequeñas en cada clase, éstas deberán ser combinadas para llenar los
requisitos.
M ÉTODO DEL PROFESOR S. SHAO.
CALIFICACIONES NÚMERO DE (Real-

ESTUDIANTES Teórico)2
(Intervalo de clase) Real Teórico Real- (Real- Teórico
Teórico Teórico)2
20 - 49 14 12 2 4 0.33333333
3
= 50 - 59 7 13 -6 36 2.76923076
9
60 - 69 10 17 -7 49 2.88235294
1
70 - 79 29 16 13 169 10.5625

80 - 89 12 12 0 0 0
90 y más 8 10 -2 4 0.4
Total 80 80 0 X2= 16.9474170
4
Grados de libertad= n-1= 6-1= 5; con α = 5%, la X2TEÓRICA = 11.070
Luego se rechaza la Ho porque es mrenor que la real u observada.

M ÉTODO DEL PROFESOR GENARO SÁNCHEZ BARAJAS
(R-T)2
Clases R-T= (R-T)2 T
20 - 29 3 - 1 = 2 4 4
30 - 39 6 - 3 = 3 9 3
40 - 49 5 - 8 = -3 9 1.125
50 - 59 7 - 13 = -6 36 2.7692
60 - 69 10 - 17 = -7 49 2.8824
70 - 79 29 - 16 = 13 169 10.5625
80 - 89 12 - 12 = 0 0 0.0000
90 - 99 8 - 6 = 2 4 0.6667
99.5 y más 0 - 4 = -4 16 4.0000
Total (R-T) = 0
∑ X2= 29.0058
Grados de libertad =n-1= 9-1= 8
Luego con α = 5%
X2α =15.507
Decisión : se toma la decisión de rechazar la hipótesis nula porque X2α < X2.
Como G.L. = n - 1 = 9 - 1 = 8
Y α= 5% tenemos X2α = 15.507
Decisión: se toma la decisión de rechazar la hipótesis nula de que las
calificaciones reales y las esperadas o teóricos no difieren significativamente,
puesto que X2α = 15.507 < X2 = 29.005
CONCLUSIÓN: CON LOS DOS M ÉTODOS SE TOM A LA M ISM A

DECISIÓN

Solución del problema No.4, calculando F con el método abreviado.

1. Calculamos ∑ X 2 IJ ,
t
X ij X 12j X2 j X22 j X3 j X32j
74 5,476 75 5,625 56 3,136

65 4,225 78 6,084 55 3,025
72 5,184 74 5,476 53 2,809
69 4,761 76 5,776 52 2,704
72 5,184
19,646 28,145 11,674
X 1 = 280 / 5 = 70; X 2 = 375 / 5 = 75; X 3 = 216 / 4 = 54; X = 871 / 13 = 67
Así ∑ X 2 IJ = 19,646 + 28,145 + 11,674 = 59,465.
t
2.- Calculamos:
K
∑ ni x i 2
= n1 x 12 + n2 x22 + n 3 x 32 = 4(70) 2 + 5(75) 2 + 4 (54) 2 = 19,600 + 28,125 +
t
11,664 = 59,389.
3.- Tx 2 = 13(67) 2 = 13(4,489) = 58,357.

luego: variación entre grupos:
K
∑ ni x i 2
− Tx = 59,389 − 58,357 = 1032
.
t
Variación dentro de los grupos:

k
∑ X 2 IJ − ∑ ni x i2 = 59,465 - 59,389 = 76
t i =1
Variación total:
∑ X 2 IJ − Tx 2 = 59,465 - 58,357 = 1,108
t
Así
Variación Grados de Suma de Varianza
libertad cuadrados
entre grupos K-1=3-2=2 1,032 516

Dentro de
Grupos T - K = 13 - 3 = 10 76 7.6
Total T - 1 = 13 - 1 = 12 1,108 92.3
F(2,10) = 516/7.6 = 67.9
a) En el apéndice F vemos que con α=5% y G.L. (2 y 10) tenemos Fα=4.10,

luego se rechaza la hipótesis nula.
b) En el apéndice F vemos que con α = 1% y G.L. (2 y 10) Fα=7.56 también se

rechaza la hipótesis nula, porque en ambos casos con Fα(2,10) = 67.9>4.10 y
>7.56.

La Estadística Aplicada Al Análisis Economico PDF

Cargado por

Copyright:

Formatos disponibles

La Estadística Aplicada Al Análisis Economico PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Estadística Aplicada Al Análisis Economico PDF

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL

DIVISIÓN DE ESTUDIOS PROFESIONALES

LA ESTADÍSTICA APLICADA AL ANÁLISIS

Ph. D. y PROFESOR GENARO SÁNCHEZ BARAJAS

LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓM ICO

i PROFR. GENARO SÁNCHEZ BARAJAS

II.3.2.4 Varianza ................................................................... 53

ii PROFR. GENARO SÁNCHEZ BARAJAS

III.7 Indices Eslabonados y en Cadena ............................... 94

iii PROFR. GENARO SÁNCHEZ BARAJAS

V.1 Distribución Binomial ................................................. 123

VI Muestreo ............................................................................. 139

iv PROFR. GENARO SÁNCHEZ BARAJAS

VI.6.1 Muestreo Simple Aleatorio ......................................

v PROFR. GENARO SÁNCHEZ BARAJAS

VII Estimación de Parámetros ................................................ 194

VIII Teoría de la Decisión Estadística o Prueba de

vi PROFR. GENARO SÁNCHEZ BARAJAS

TABLAS ESTADÍSTICAS ..........................................................

vii PROFR. GENARO SÁNCHEZ BARAJAS

La demostración de las matemáticas como una de las ciencias exactas

Como una consecuencia de la generalización anterior, la ciencia económica

En efecto, la estadística como brazo operativo de las matemáticas se

La importancia de esta disciplina en el análisis económico determinó la

PROFESOR: GENARO SÁNCHEZ BARAJAS 1

Con base en lo anterior, la presentación de la obra se caracteriza por el

En el capitulo II se define y caracteriza a la ESTADÍSTICA

Aquí se presentan los métodos necesarios para identificar, obtener,

En los capítulos III a VIII se establece la relación que existe entre la

Finalmente, deseo expresar mi agradecimiento a los profesores J.

2 PROFESOR: GENARO SÁNCHEZ BARAJAS

Desde que el hombre tuvo conocimiento de su existencia, buscó expresar

La matemática surgió como una experiencia en la mente humana, ella

Sin duda, todo el desarrollo matemático ha tenido sus raíces psicológicas

Con base en lo aquí dicho, podremos decir que la Teoría de la Estadística

La Economía es una ciencia cuyos límites rayan en la familiaridad con

PROFESOR: GENARO SÁNCHEZ BARAJAS 3

Su significado(21) emana del vocablo “estado” y en general es sinónimo de datos.

Lo anterior se debe basicamente a que cuando el hombre se organiza en sociedad

A fin de dar una mayor referencia de la estadística, como preámbulo diré

Como se indicó previamente, es sinónimo de “dato”, ya que por ejemplo cuando

Sin embargo dicha acepción no corresponde, no es congruente con la función que

4 PROFESOR: GENARO SÁNCHEZ BARAJAS

Pensando que es conveniente desglosar y explicar los diferentes criterios

1.1 DEFINICIONES DE ES TADÍS TICA(1)

Como todas las ciencias la Estadística ha sido considerada, por los

Enumerándolas conforme al tiempo en que fueron elaboradas,

Achenwall (1748).- "La Estadística tiene por objeto el conocimiento de

Achenwall (1749).-"La Estadística es la ciencia del Estado que se ocupa de

Achenwall (1749).-"La Estadística es la ciencia del Estado que se ocupa de

Bielfield (1770).- "La Estadística es aquella rama del conocimiento

A. F. Luder (1792).- "La Estadística describe la situación de un estado en

Meusel (1794).- "La Estadística es una exposición científica ordenada de la

PROFESOR: GENARO SÁNCHEZ BARAJAS 5

Sociedad Estadística de Londres (1838).- "La Estadística es la

D. E. Worl (1840).- "La finalidad de la Estadística consiste en la

Joe Fallati (1843).- "La noción de lo real es el punto medio de la

Noreau de Jonneis (1847).- "La Estadística es la ciencia de los hechos

Romelín (1863).-"La Estadística describe las características de la sociedad