0% encontró este documento útil (0 votos)
6 vistas105 páginas

Bioestadística Apuntes Completos

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 105

METODOLOGÍA CIENTÍFICA

BIOESTADÍSTICA
EXAMEN FINAL

Paula Calls
TEMA 1 INTRODUCCIÓN CONCEPTUAL E HISTÓRICA

1.1 ESTADÍSTICA. CONCEPTO Y DEFINICIÓN

La estadística puede definirse como la disciplina que se dedica al tratamiento de la


información que contiene una serie de datos procedentes de observaciones de fenómenos
colectivos.
El objetivo de la estadística es reunir información cuantitativa concerniente a individuos,
grupos, series, etc., y analizando los datos deducir significados precisos o previsibles. La
estadística se basa en la teoría de probabilidad y en el cálculo infinitesimal.
Fue Godofredo Achenwall (1719 - 1772) quien en 1749 introdujo el término estadística
para denominar lo que se conocía como aritmética política. John Sinclair (1754 – 1835) fue
el primero en introducir la estadística en Inglaterra, y la utilizo como generadora de
información interna para encontrar carencias y proponer mejoras en el país.
A principios del siglo XIX, el término estadística adquirió un significado más general,
orientado a la obtención, clasificación y tratamiento de cualquier conjunto de datos
colectivos cuantitativos.

1.2 CONCEPTO DE BIOESTADÍSTICA


La aplicación de la estadística a las ciencias biológicas y de la salud se denomina
bioestadística. Es decir, la obtención y análisis de datos biológicos o de la salud mediante la
utilización de métodos estadísticos. En algunos ámbitos también se denomina biometría.

1.3 ÁREAS DE LA ESTADÍSTICA


La estadística ofrece métodos para analizar series de datos de modo descriptivo o
inferencial. Según esto, podemos distinguir entre estadística descriptiva y estadística
inferencial.

1.4 ESTADÍSTICA DESCRIPTIVA (DEDUCCIÓN)


Pretende describir, analizar y representar las características que existen en un conjunto de
datos, obtenidos de una población o de una muestra. Incluye la tabulación, presentación y
descripción de los datos empíricos, para hacerlos manejables y de fácil interpretación.
Cuando el valor se ha obtenido a partir de una muestra, hablamos de estadístico, mientras
que un parámetro es un valor obtenido de una población.
Generalmente, los estadísticos se simbolizan con letras latinas (!# , S) y los parámetros con
letras griegas (µ, σ).

1.5 ESTADÍSTICA INFERENCIAL O ANALÍTICA (INDUCCIÓN)

Apoyándose en el cálculo de probabilidades y a partir de los datos obtenidos de una muestra,


trata de sacar conclusiones acerca de las características de una población.
1.6 ESTADÍSTICA. DESARROLLO HISTÓRICO

Desde que existen las primeras sociedades humanas, fue necesario desarrollar un sistema
para contar el número de personas, animales, alimentos, etc.

Hace más de 3000 años se usaban en Babilonia tablas de arcilla donde se recopilaban datos
de la producción agrícola y actividades comerciales. En esa época, en Egipto, desarrollaron
sistemas de cálculo y medida, obligados por la necesidad de redistribución de las tierras tras
las inundaciones periódicas del Nilo.

Conocemos que tanto griegos como chinos realizaron cómputos de población con fines
tributarios, militares y sociales. Fue con los romanos cuando se utilizó con mayor rigor todos
los recursos de la estadística para recoger una gran cantidad de datos.

En la Edad Media, al igual que todas las ciencias, se sufrió una considerable regresión.
Aunque se conocen algunos censos minuciosos realizados en Europa. Fue en 1086 por orden
de Guillermo I cuando se realizó el Domesday book o Libro del gran catastro, considerado el
primer compendio estadístico de Inglaterra.

En el Renacimiento, hombres como Leonardo da Vinci, Nicolás Copérnico, Galileo, Francis


Bacon, etc. realizaron grandes aportaciones al método científico. Con la creación de nuevos
estados, la estadística adquirió importancia a la hora de recopilar datos sociales,
demográficos y económicos.

1.6.1 John Graunt (1620 – 1674)

Demostró la uniformidad y, por tanto, las posibilidades de pronóstico de los fenómenos


biológicos, sentando las bases de la estadística científica. Publicó el primer estudio
epidemiológico en el London bills of mortality, estimando una mortalidad en niños nacidos
vivos, menores de seis años, del 36%. Asimismo, elaboro la primera tabla de vida que se
conoce y que especifica las probabilidades de morir y vivir durante el curso de la vida.
Graunt es considerado el primer demógrafo, el fundador de la bioestadística y el precursor
de la epidemiologia.

1.6.2 Johan Carl Friedrich Gauss (1777 – 1855)

Considerado “el príncipe de las matemáticas” y “el matemático más grande desde la
antigüedad”. Es uno de los matemáticos más influyentes de la historia.

Las principales aportaciones de Gauss a la estadística son la teoría de la estimación: el


método de los mínimos cuadrados y, como consecuencia, el llamado modelo lineal de Gauss.
Estudió también la teoría de los errores y dedujo la curva normal la curva normal de la
probabilidad, conocida como curva de Gauss.

1.6.3 Jacques Quetelet (1796 – 1874)

Reconocido como uno de los padres de la estadística moderna y fundador de la ciencia social
cuantitativa moderna, fue el primero en aplicar la estadística y la teoría de la probabilidad
a los fenómenos sociales.
Desarrolló el concepto de hombre medio, como modelo social que permite expresar las
diferencias entre los individuos en términos de desviación de la norma. Esto llevo a Quetelet
a formular su “teoría de la oscilación”, por la cual, conforme aumentan los contactos sociales
y las relaciones interraciales, las diferencias entre los hombres disminuyen en intensidad
gracias a un proceso social y cultural de oscilación que dará lugar a un equilibrio cada vez
mayor y, finalmente, al equilibrio y a la paz universales.

1.6.4 Francis Galton (1822 – 1911)

La pasión por la medida que Galton desarrolló durante su vida es paradigmática. Es conocido
su empeño por contar y medir cualquier cosa que presentara un aspecto de regularidad. Fue
el primero en proponer las huellas dactilares como procedimiento de identificación, invento
los términos altas y bajas presiones para meteorología.

Introdujo el análisis estadístico como aspecto fundamental de la toma de decisiones en las


cuestiones planteadas por la evaluación psicológica.

Introdujo el concepto de mediana como medida de tendencia central, considerándola más


fiable que la media, al no estar afectada por las puntuaciones extremas. Junto a Karl Pearson
(1857 – 1936), desarrolló el concepto de regresión a la media y el coeficiente de correlación
producto-momento para el análisis de estos datos. Posteriormente, Pearson desarrollo el
concepto matemático de correlación, agregando los coeficientes parcial y múltiple de
correlación, la prueba de bondad de ajuste y la prueba “ji cuadrado” al repertorio de técnicas
disponibles.

Otro de sus colaboradores, Charles Spearman (1863 – 1945), desarrolló procedimientos


para el análisis de matrices de correlación más complejas, estableciendo los fundamentos
del análisis factorial. Spearman también sentó las bases de la teoría de la puntación
verdadera, el error de medida y de la fiabilidad, asociados al proceso de medición.

1.6.5 Florence Nightingale (1820 – 1910)

Nightingale hizo un amplio uso de los análisis estadísticos en la compilación, el análisis y la


presentación de estadísticas de la atención médica y la salud pública. También fue pionera
en el uso de los gráficos de presentación de los informes estadísticos, incluso creo el
diagrama de área polar o coxcomb, para proporcionar una información gráfica de las cifras
de mortalidad durante la guerra de Crimea.

Usando su estadística ilustró la necesidad de una reforma sanitaria en los hospitales


militares, consiguiendo que se crease la Royal Commission on the Health of the Army.

Estableció los fundamentos del análisis de datos en relación con la “gestión de calidad” y las
“auditorias de los cuidados de la salud”

1.6.6 William Sealey Gosset (1876 – 1937)

Es más conocido como student, seudónimo con el que firmaba sus trabajos, debido a que su
empresa le prohibió expresamente que sus empleados publicaran cualquier tipo de
información.

Gosset es uno de los estadísticos con más influencia en los métodos actuales. Especialmente
conocidos son sus trabajos sobre la forma de distribución t y t-test (conocida como prueba t
de Student), para muestras pequeñas, una de las pruebas de contraste de hipótesis más
utilizadas en la práctica.

1.6.7 Ronald Fisher (1890 – 1962)

Se le deben los fundamentos de la estadística actual y muchos de los métodos de inferencia


en las pruebas de contraste de hipótesis. Se considera que Student y Fisher iniciaron una
nueva era en el estudio de las distribuciones muestrales.

Fisher sentó las bases del diseño de experimentos, con lo que la estadística incorporó
plenamente a la investigación científica. Introdujo el análisis de varianza, de la covarianza
y otras pruebas no paramétricas.
TEMA 2 POBLACIÓN Y MUESTRA
2.1 CONCEPTOS PRELIMINARES

La estadística obtiene y estudia datos sobre individuos, que no tienen que ser
necesariamente personas. El conjunto de todos los individuos posibles constituye el
universo.

Normalmente, se estudian poblaciones, aunque obtener y analizar los datos de toda una
población suele ser imposible, por lo que suele estudiarse una muestra de individuos de la
población.

2.2 INDIVIDUO

Es cada elemento que lleva asociada una medida, un número de orden o una característica
predeterminada.

2.3 UNIVERSO

Es el conjunto, finito o infinito, de todos los posibles individuos que cumplen ciertas
propiedades.

2.4 POBLACIÓN

Es el conjunto de todos los individuos que cumplen ciertas propiedades y de quienes


deseamos estudiar ciertos datos. Deberá ser definida sobre la base de las características que
la delimitan, que la identifican y que permiten la posterior selección de unos elementos que
se pueden entender como representativos (muestra).

Debemos distinguir entre población diana o población objetivo (población a la que se desea
extrapolar los resultados del estudio) y población accesible (población cuyos individuos son
directamente accesibles al investigador). Una población puede ser finita o infinita.

2.5 MUESTRA

Una muestra es una porción de algo. Así, una muestra es una parte de la población en la que
se observa el fenómeno a estudiar y de donde sacaremos unas conclusiones generalizables a
toda la población. Una muestra se considera grande cuanto tiene 30 o más individuos, si
tiene menos de 30 se considera pequeña. Para que la muestra sea representativa debe:

- Han de definirse claramente las características que conforman la totalidad de la


población.
- Han de haber garantías de que cada miembro de la población tiene las mismas
oportunidades de figurar en la muestra.
- La muestra deberá tener el tamaño adecuado para la extrapolación de datos.
2.6 MUESTREO

El muestreo es el procedimiento destinado a obtener una muestra adecuada que reproduzca


las características básicas de la población. Por lo general podemos dividirlos en dos grandes
grupos: métodos aleatorios o probabilísticos y métodos no aleatorios o no probabilísticos.

Aleatorio o probabilístico (al azar) No aleatorio o no probabilístico (no al azar)


- Simple
- Sistemático
- Accidental
- Estratificado
- Intencionado
Proporcional
- Por cuotas
No proporcional
- Por conglomerados

2.7 MUESTREO ALEATORIO

Parte de una igualdad absoluta de todos los elementos de la población para ser seleccionados,
de manera que conocemos la probabilidad que tiene un elemento de ser incluido en la
muestra.

2.7.1 MUESTREO ALEATORIO SIMPLE

Es el más sencillo, aunque en la práctica es difícil aplicar este tipo de muestreo de una
manera eficaz. Consiste en elegir al azar los individuos que formaran la muestra, para ello
se siguen los siguientes pasos:

1. Se confecciona la lista de todos los elementos de la población, asignándoles números


consecutivos.
2. Se decide el tamaño deseado de la muestra. Llamaremos “n” al número de elementos.
3. Se extraen al azar los “n” elementos para completar el tamaño de la muestra.

2.7.2 MUESTREO ALEATORIO SISTEMÁTICO

Es una variable del muestro aleatorio simple, que parte también de la lista total de la
población, pero en lugar de extraer “n” número aleatorios, sólo se extrae uno y se
seleccionan los demás a intervalos (5, 10, 15, …), siendo el tamaño del intervalo el resultado
de dividir población entre muestra.

2.7.3 MUESTREO ALEATORIO ESTRATIFICADO

Si las poblaciones son muy grandes, interesa dividirla en subpoblaciones en virtud de


determinadas características (edad, sexo, estado civil…), consiguiendo que cada
subpoblación sea homogénea. A continuación, se eligen en cada subpoblación las personas
que formaran la muestra por el método aleatorio simple. Este sistema permite mayor
profundización y precisión en el análisis de cada estrato.

Este muestreo estratificado puede ser proporcional (cada estrato aporta una proporción a
la muestra según su número de individuos) o no proporcional (cada estrato aporta el mismo
número de elementos).
2.7.4 MUESTREO ALEATORIO POR CONGLOMERACIÓN

En el muestreo aleatorio por conglomerado la muestra es un grupo de elementos de la


población que forman una unidad, el conglomerado. Este procedimiento consiste en
seleccionar aleatoriamente los conglomerados necesarios para alcanzar el tamaño de la
muestra, que se formará por todos los elementos de los conglomerados elegidos.

2.8 MUESTREO NO ALEATORIO

En este muestreo los individuos se seleccionan siguiendo determinados criterios, de manera


que no todos los elementos de la población tienen la misma probabilidad de figurar en la
muestra.

2.8.1 MUESTREO NO ALEATORIO ACCIDENTAL O INCIDENTAL

Se basa en usar los sujetos a los que se tiene fácil acceso o mayor comodidad. Un caso
particular que puede incluirse en esta categoría es el de los sujetos voluntarios.

2.8.2 MUESTREO NO ALEATORIO INTENCIONADO

Se caracteriza por la inclusión deliberada en la muestra de elementos con características


similares a la población elegida. Es decir, el investigador selecciona los elementos que a su
juicio son representativos. Es un muestreo utilizado en estudios cualitativos.

2.8.3 MUESTREO NO ALEATORIO POR CUOTAS

Es semejante al muestreo aleatorio estratificado, pero sin tener su característica de


aleatoriedad. La población también se divide en estratos o subpoblaciones y en cada una de
ellas se fija una “cuota” o número de individuos, que son seleccionados de forma accidental.
TEMA 3 VARIABLES ESTADÍSTICAS Y ESCALAS DE MEDIDA
3.1 VARIABLES

Una variable es una característica, propiedad o atributo susceptible de asumir diferentes


valores en los diferentes sujetos

3.2 CLASIFICACIÓN DE LAS VARIABLES

Existen diferentes clasificaciones de las variables, en función del criterio utilizado:

Criterio de Medida Criterio Metodológico Criterio de Control


- Cuantitativas
Continuas
Discretas - Independientes
- Aleatorias
- Cualitativas - Dependientes
- Controladas
Dicotómicas - De confusión
Politómicas
- Ordinales

3.3 VARIABLES CUANTITATIVAS

Son las que pueden medirse numéricamente, pudiendo cuantificarse mediante valores con
significado matemático a partir de unas determinadas unidades de medida. Pueden ser
continuos o discretas.

3.3.1 VARIABLES CUANTITATIVAS CONTINUAS

Es en la que encontramos infinitos valores entre dos datos aportados. La dificultad para
encontrar todos los valores intermedios se debe a las limitaciones del instrumento de
medida. Son ejemplos de variables cuantitativas continuas el peso de una persona en Kg, la
altura en cm, la glucemia en sangre, la temperatura corporal, etc.

3.3.2 VARIABLES CUANTITATIVAS DISCRETAS

Son en las que entre dos valores no podemos encontrar ningún otro valor. Son ejemplos de
variables cuantitativas discretas el número de alumnos, camas de un hospital, médicos de
una comarca, leucocitos en sangre.

3.4 VARIABLES CUALITATIVAS

Son variables que expresan cualidades o características. También se denominan atributos.


No pueden medirse numéricamente. Estas variables presentan distintas categorías, y deben
cumplir unas condiciones:

- Estar bien definidas


- Ser mutuamente excluyentes. Ningún dato puede tener dos categorías.
- Ser exhaustivas. Ningún dato puede quedar sin categoría.
3.4.1 VARIABLES CUALITATIVAS DICOTÓMICAS

Son las que únicamente presentan dos categorías, como el sexo (hombre o mujer). A su vez
pueden ser auténticas, cuando sólo pueden tomar dos valores por la naturaleza intrínseca
de la variable (el sexo) o artificiales, cunado son variables dicotomizadas artificialmente
(alto-bajo).

3.4.2 VARIABLES CUALITATIVAS POLITÓMICAS

Son las que presentan más de dos categorías, como el estado civil, el grupo sanguíneo o la
afiliación religiosa.

3.5 VARIABLES ORDINALES O CUASICUANTITATIVAS

Son variables cualitativas pero sus categorías pueden ordenarse siguiendo un criterio o una
escala establecida (el intervalo entre categorías no es necesario que sea uniforme).
notas de un examen: ex, notable, aprobado suspenso
medallas: plata, oro, bronce

3.6 VARIABLE INDEPENDIENTE

La variable independiente es la que se supone causa del fenómeno estudiado, de manera que
no varía en función de ora variable, sino que es la supuesta causa en una asociación causa-
efecto. El investigador puede observar y manipular deliberadamente la variable
independiente para descubrir la asociación que existe con la variable dependiente.

3.7 VARIABLE DEPENDIENTE

Es el efecto o consecuencia de la variable independiente, el fenómeno que aparece,


desaparece o cambia cuando el investigador aplica, suprime o modifica la variable
independiente.

3.8 VARIABLES DE CONFUSIÓN

También llamadas variables intervinientes o extrañas. Son variables no introducidas


deliberadamente por el investigador pero que puede actuar sobre los valores observados de
la variable dependiente. El investigador debe controlarlas o eliminarlas.

3.9 VARIABLES ALEATORIAS Y VARIABLES DE CONTROL

La variable aleatoria es aquella que el investigador no controla, sino que toma valores en
cada individuo dependiendo de sus características propias. El valor de la PA tras la ingesta
de un fármaco es un ejemplo de variante aleatoria.

La variable controlada es aquella en la que la determinación de su valor depende del


investigador. La dosis del fármaco administrado es un ejemplo.

Variable aleatoria = Variable dependiente Variable controlada = Variable independiente


3.10 ESCALAS DE MEDIDA

Para un análisis correcto es fundamental conocer el tipo de medida que puede aplicarse a las
diferentes variables. Las escalas de medida son el sistema para la asignación de números a
los objetos o fenómenos que se estudian. Una escala de mediada contiene todos los valores
que podrían presentar una variable determinada.

Las escalas de medida se clasifican en:

- Escala nominal
- Escala ordinal
- Escala de intervalo
- Escala de proporción o razón

3.11 ESCALA NOMINAL

La única relación que se establece entre las distintas modalidades de la variable es la de


igualdad o de desigualdad, de manera que permite la clasificación según conceptos de
naturaleza cuantitativa. Permite determinar si una modalidad es igual a otra, pero sin
establecer ninguna otra relación (sexo, nacionalidad, religión…).

3.12 ESCALA ORDINAL

Además de la relación de igualdad o de desigualdad, permite establecer un orden entre las


modalidades, en función de los conceptos de mayor, igual o menor (orden de llegada, nivel
de estudios, satisfacción…).

3.13 ESCALA DE INTERVALO

Además de las relaciones anteriores, permite comprobar la igualdad o la desigualdad de las


distancias entre los valores. Las variables medidas así deben ser cuantitativas, pero no
tienen cero absolutos, sino que éste es arbitrario (temperatura en Celsius, año del
calendario…)

3.14 ESCALA DE LA PROPORCIÓN O RAZÓN

La escala de proporción permite establecer proporciones entre valores y variables, lo que


supone un mayor grado de cuantificación y la existencia del cero absoluto (edad, altura,
peso, longitud…).

Escala Finalidad Condiciones Estadísticos Ejemplo


aplicables
Nominal Conocer igualdad o Frecuencias, Estado civil,
Permutación.
desigualdad. moda. sexo.
Ordinal Conocer si son Test de Apgar,
Mantenimiento Mediana,
iguales, mayores o pronostico
de un orden. percentiles.
menores. vital.
Intervalo Unidad de Tallas,
Conocer la distancia Media aritmética,
medida Temperaturas
entre una y otra desviación típica
constante en ºC
Proporción Establecer la Media geométrica,
Existencia del Hijos, edad,
relación entre una y coeficiente de
cero absoluto. altura.
otra. variación
TEMA 4 CLASIFICACIÓN DE LOS DATOS: TABULACIÓN Y
REPRESENTACIÓN GRÁFICA

4.1 TABULACIÓN

Es el proceso de presentar de una manera ordenada una serie de datos en una tabla. La
agrupación de variables cuantitativas continuas en intervalos de clase se utiliza para
sintetizar la información en el tratamiento estadístico de números elevados. Sin embargo, el
uso de programas informáticos en los análisis estadísticos ha hecho innecesario este
procedimiento.

Actualmente, el análisis estadístico suele comenzar por la introducción de los valores de las
variables en el editor de datos del programa estadístico que se utilice.

4.2 FRECUENCIA Y TABLAS DE FRECUENCIAS

La frecuencia es el número de veces que tiene lugar la observación de un determinado


fenómeno, Las tablas de frecuencia permiten presentar una gran cantidad de datos en un
espacio reducido. Muestran valores numéricos exactos y los datos se presentan de manera
ordenada en columnas y filas.

Los elementos que componen una tabla de frecuencia son:

1. Columnas: Formadas por datos numéricos o alfabéticos. La primera expresa valores o


categorías de la variable que se está tabulando.
2. Filas: Formadas por datos numéricos o alfabéticos colocados de izquierda a derecha.

4.3 TIPOS DE FRECUENCIA

4.3.1 FRECUENCIA ABSOLUTA fi

Expresan el número de veces que tiene lugar un determinado valor de la variable. La suma
de todas las frecuencias absolutas es igual al total de individuos estudiados (N).

∑ fi = N

4.3.2 FRECUENCIAS RELATIVAS hi

Se calcula dividiendo la frecuencia absoluta por el número de individuos estudiados (N).

,+
ℎ+ =
-
La suma de todas las frecuencias relativas es igual a la unidad.

∑ hi = 1
4.3.3 PORCENTAJES pi

Se calcula multiplicando por 100 cada frecuencia relativa.

pi = hi • 100

La suma de todos los porcentajes es igual a 100.

∑ pi = 100

4.3.4 FRECUENCIA ABSOLUTA ACUMULADA Fi

Se calcula sumando cada frecuencia absoluta a la frecuencia absoluta anterior. La primera


frecuencia absoluta acumulada será igual al primer valor, y la última frecuencia absoluta
acumulada será igual a N.

4.3.5 FRECUENCIA RELATIVA ACUMULADA HI

Se obtiene sumando a cada frecuencia relativa la frecuencia relativa anterior. La última será
igual a 1.

4.3.6 PORCENTAJES ACUMULADOS Pi

Se obtiene sumando a cada porcentaje el porcentaje acumulado anterior. El último será igual
a 100.

Tabla de frecuencias para la variable de edad en un grupo de 93 alumnos de


enfermería
Xi fi hi pi Fi Hi Pi
18 27 0,290 29,0 27 0,290 29,0
19 26 0,280 28,0 53 0,570 57,0
20 9 0,097 9,7 62 0,667 66,7
21 5 0,054 5,4 67 0,720 72,0
22 12 0,129 12,9 79 0,849 84,9
23 3 0,032 3,2 82 0,882 88,2
24 4 0,043 4,3 86 0,925 92,5
25 1 0,011 1,1 87 0,935 93,5
26 3 0,032 3,2 90 0,968 96,8
28 1 0,011 1,1 91 0,978 97,8
39 1 0,011 1,1 92 0,9889 98,9
42 1 0,011 1,1 93 1 100
Total 93 1,00 100

Tabla de frecuencias para la variable sexo


Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado
Mujer 75 80,6 80,6 80,6
Hombre 18 19,4 19,4 100
Total 93 100 100
EJERCICIOS

GLICEMIA EN UNA PLANTA DE ONCOLOGÍA


Xi fi hi pi Fi Hi Pi
98 7
102 5
104 6
105 8
110 5
111 9
116 4
117 2
119 45
125 6
128 8
160 7
169 4
180 1
200 2
212 1
Total 1,00 100

ALTURA EN CLASE DE EDUCACIÓN FÍSICA


Xi fi hi pi Fi Hi Pi
154 2
156 5
158 4
162 8
165 10
167 8
169 6
172 3
175 1
178 2
186 1
Total 1,00 100

PESO EN CLASE DE PILATES


Xi fi hi pi Fi Hi Pi
55 6
60 5
65 5
68 4
70 4
85 2
95 1
111 1
Total 1,00 100
4.4 REPRESENTACIÓN GRÁFICA

Para presentar resultados es habitual el uso de graficas o imágenes, ya que permite la


descripción de esta información de forma clara y resumida. La información puede
presentarse de diversas formas y no todas ellas son adecuadas. Por ello debemos asumir
unos criterios y normas para construir y presentar adecuadamente los gráficos.

4.5 GRÁFICOS: VENTAJAS E INCONVENIENTES

Ventajas:

a) Visualización dinámica de los datos.


b) Interpretación sencilla para ajenos a los conocimientos estadísticos.
c) En determinadas ciencias son sumamente útiles.

Inconvenientes:

a) No pueden contener muchos datos


b) Dan valores aproximados, dado que las escalas no pueden ser del todo exactas.
c) En ocasiones se precisa que vayan junto a una tabla estadística.

4.6 CONSTRUCCIÓN DE GRÁFICOS

Los más usados son los gráficos basados en el sistema de coordenadas cartesianas
ortogonales. Este sistema consta de dos ejes:

- OX: Es la línea horizontal, el eje de abscisas. Aquí se expone la variable independiente.


- OY: Es la línea vertical, el eje de ordenadas. Aquí se colocan las frecuencias o variables
independientes.

La intersección de ambo ejes es el punto 0, denominado origen de coordenadas.

4.7 GRÁFICOS PARA VARIABLES CUALITATIVAS

4.7.1 DIAGRAMA DE BARRAS

El diagrama de barras o columnas es el grafico más usado para representar variables


cualitativas, aunque se puede usar en cuantitativas discretas y en medidas de escala ordinal
(cuasicuantitativas).

Se construye desde un eje de coordenadas. El eje de abscisas (OX) se asigna a las


modalidades variables, y el de ordenadas (OY) a la escala de frecuencias. La escala debe
iniciarse siempre en el 0 y debe coincidir con el 0 de las coordenadas. Se levantan líneas
perpendiculares sobre el eje de abscisas, cuya altura será la frecuencia de cada uno de los
valores de la variable.
Se puede presentar también el diagrama de barras con varias variables apiladas o
agrupadas, muy útiles para representar gráficamente tablas de contingencia.

Lugar de trabajo de una muestra de 198 enfermeras


80

70

60

50

40

30

20

10

0
Medicina Interna Urgencias UCI Pediatría Cirugía

Lugar de trabajo de una muestra de 198 enfermeras

Lugar de trabajo de 198 enfermeras


Frecuencia Porcentaje Porcentaje valido Porcentaje acumulado

Medicina interna 42 21,2 21,2 21,2


Urgencias 72 36,4 36,34 57,6
UCI 36 18,2 18,2 75,8
Pediatría 24 12,1 12,1 87,9
Cirugía 24 12,1 12,1 100
Total 198 100 100

Fumar - Sexo
60

50

40

30

20

10

0
NO SI

Mujer Hombre
Tabla contingencia: Fumar - sexo
Sexo
Total
Mujer Hombre
Si Fuman 56 10 66
No Fuman 19 8 27
Total 75 18 93

4.7.2 CICLOGRAMAS O SECTORES CIRCULARES

En esta representación cada una de las variables ocupa una porción de la superficie de un
circulo. Son especialmente utilizados para representar categorías de variable medidas en
escala nominal, donde el orden entre ellas no tiene ninguna relevancia. Los sectores deberán
ajustarse proporcionalmente a la frecuencia de aparición de los valores de la variable, por lo
que deberemos calcular los grados del ángulo que ocupa cada sector.

Medicina Interna Urgencias UCI Pediatría Cirugía

4.7.3 OTROS GRÁFICOS PARA VARIABLES CUALITATIVAS

Otros gráficos usados son los pictogramas, gráficos que utilizan dibujos que simbolizan la
variable y en los que la frecuencia es proporcional al tamaño o número de dibujos. Y los
cartogramas, que utilizan mapas geográficos para indicar los valores de la variable.
4.8 GRÁFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS

4.8.1 HISTOGRAMAS

Son adecuados para variables cuantitativas continuas. En el eje de abscisas se sitúan los
extremos verdaderos de los intervalos y encima de cada intervalo se levanta un rectángulo
cuya área es igual a la frecuencia del intervalo.

4.8.2 GRÁFICOS DE CAJA (BOXPLOT)


En vez de visualizar los valores individuales, se representan estadísticos básicos de la
distribución: la mediana, el percentil 25, el percentil 75 y los valores extremos. El ancho de
la caja nos da una idea de la variabilidad de las observaciones. Si la mediana no está en el
centro de la caja, podemos deducir que la distribución es asimétrica: asimétrica positiva si
está próxima al límite inferior de la caja y asimetría negativa si está próxima al límite
superior. Son especialmente útiles para comparar la distribución de los valores de una
misma variable entre diferentes grupos.
4.8.3 POLÍGONOS DE FRECUENCIA
Para frecuencias no acumuladas, se obtiene uniendo con segmentos los puntos medios de
cada intervalo en el lado superior del rectángulo que forma el histograma.

4.8.4 CURVA DE FRECUENCIAS ACUMULADAS


Partiendo del histograma de frecuencias acumuladas, se unen por una línea los vértices
superiores derechos de cada intervalo, que constituyen las frecuencias acumuladas hasta el
límite superior exacto de este intervalo.
TEMA 5 MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central tienen por objeto descubrir un conjunto de datos de forma
abreviada y comprensible.

La media aritmética es la más estable de las medidas de tendencia central. Su principal


ventaja es que para su cálculo intervienen todos los valores de la variable, quedando
influenciada por los valores extremos de esta variable. Si en la distribución existen algunos
valores extremos, es preferible utilizar la mediana.

Es importante calcular la medida de tendencia central que más interese para lo que se desea:
un valor promedio (media), el valor central de la distribución (mediana) o el valor que
aparece en más ocasiones (moda).

5.1 MEDIA ARITMÉTICA

La media aritmética es la medida de tendencia central más común para variables


cuantitativas. No debe confundirse con la media µ, que indica la media de una variable en
una población, con la media !̅ , que indica la media calculada en una muestra.

5.2 PROPIEDADES DE LA MEDIA ARITMÉTICA


1. Si a todos los valores se les suma o se les resta una constante K, la media de los nuevos
valores es igual a la media de los anteriores sumando o restando la constante K.
2. Si todos los valores se multiplican o dividen por una constante K, la media de los
nuevos valores será igual a la media de los anteriores multiplicada o dividida por K.
3. La suma de las desviaciones de los valores de la variable con su media aritmética es
igual a O.

∑ (xi - !̅ ) = 0

5.3 CÁLCULO DE LA MEDIA ARITMÉTICA


La media aritmética se calcula sumando todos los valores y dividiendo el resultado por el
número de valores.

∑ 9:
!̅ =
;

Ejemplo: Las edades de 10 pacientes atendidos en urgencias: 21, 32, 15, 59, 60, 61, 64, 60,
71 y 80 ¿Cuál sería la media de edad de estos pacientes?

<=>?<>=@>@A>BC>B=>BAD>BC>E=>FC
!̅ = = 52,3 años
=C
5.4 CÁLCULO DE LA MEDIA CON LOS DATOS AGRUPADOS POR FRECUENCIAS
Cuando disponemos de la frecuencia, en vez de sumar tantas veces el valor de la variable
como indica su frecuencia, se multiplica cada valor de la variable por su frecuencia y se
divide por el número de frecuencias.

∑ 9: ∗ H:
!̅ =
;

Ejemplo: Peso en kg de 100 pacientes agrupados por frecuencias. Halla el peso medio.
Xi fi Xi fi Xi f i
54 20 54 20 1080
∑ 9: ∗ H: BC=C
59 30 59 30 1770
!̅ = = = 60,10 kg
63 40 63 40 250 ; =CC
64 10 64 10 640
Total 100 6010

EJERCICIOS MEDIA ARITMÉTICA


1- Considérense los siguientes datos: 3, 8, 4, 10, 6, 2:
- Calcular su media.
- Si los todos los datos anteriores los multiplicamos por 3, cuál será la nueva media

2- A un conjunto de 5 números cuya media es 7.31 se le añaden los números 4.47 y 10.15.
¿Cuál es la media del nuevo conjunto de números?

3- Calcular la media de las tablas estadística siguientes:

Xi fi
61 5
64 18
67 42
70 27
73 8
fi
10-15 3
25-20 5
20-25 7
25-30 4
30-35 2

4- Un grupo de 6 amigas tienen distintas edades. Son las siguientes: 2 de ellas tienen 28
años y otras 2 tienen 32 años, el resto tienen 29 y 30 años respectivamente. Calcula la
media aritmética del grupo.

5- En clase de inglés 10 alumnos han sacado las siguientes notas: 7, 6.5, 4, 1, 9, 5, 8, 8.5, 2,
5.5. Siendo 10 la mayor nota y 0 la más baja. Calcula la media aritmética de las notas de la
clase.

6- Tenemos los siguientes datos sobre el número de televisores que encontramos en diez
hogares: 1, 2, 3, 4, 1, 2, 3 ,1, 1 y 2. Encuentra la media aritmética

7- En un partido de baloncesto, se tiene la siguiente anotación en los jugadores de un equipo:


0, 2, 4, 5, 8, 8, 10, 15 y 38. Calcular la media de anotación del equipo.
8- A los cursillos del inglés asistieron 15 personal el lunes, el martes — 10, el miércoles — 12,
el jueves — 11, el viernes — 7, el sábado — 14, el domingo — 8. Calcular asistencia media de
los cursillos por la semana.

9- El piloto estuvo yendo dos horas a la velocidad de 120 km a la hora y horas a la velocidad
de 90 km a la hora. Calcule la velocidad media del coche durante la carrera.
Solución. Calculemos la media aritmética de las velocidades del coche por cada hora del
camino:

5.5 MEDIA PONDERADA


En ocasiones no todos los valores de la variable tienen la misma importancia,
independientemente de la frecuencia. En esas ocasiones, en las que deseamos dar más
importancia a unos valores, se utiliza la media ponderada. La media ponderada se calcula
multiplicando cada observación por su factor de ponderación (p) y dividiendo la suma de
estos productos por la suma de los factores de ponderación.

∑ 9: O:
MN =
∑ PQ
Ejemplo I: Un profesor que evalúa mediante una escala de 0-10, concede diferente valor a los
tres exámenes, siendo este:
- Primer parcial = 2
- Segundo parcial = 3
- Examen final = 5
¿Cuál será la nota final de un alumno con 6,5 en el primer parcial, 6 en el segundo y 4 en el
examen final?

Xi fi Xi f i
6,5 2 13 ∑ 9: O: @=
6 3 18 MN = = = 5,1 nota final
4 5 20 ∑ PQ =C
B 10 51
Ejemplo II: Las estaturas medias de tres grupos de estudiantes son de 1,69, 1,72 y 1,70.
Calcula la estatura media de todos los estudiantes sabiendo que en el primer grupo hay 50,
en el segundo 20 y en el tercero 10.

Xi fi Xi f i
1,69 50 84,5 ∑ 9: O: =?@,A
1,72 20 34,4 MN = = = 1,70 metros
∑ PQ FC
1,70 10 17
Total 80 135,9

EJERCICIOS MEDIA PONDERADA


1- Calcula la media aritmética ponderada hallando la nota promedio de dos asignaturas que
tienen valores diferentes. Química tiene un valor de 3 créditos y Física vale 2 créditos. Si
Pedro ha sacado un 8 en la primera y un 7 en la segunda.

2- Para calcular la nota final del curso de literatura en donde cada apartado ha tenido
distinta importancia. Los dos primeros trabajos tienen valor de 20% y 20% respectivamente,
y el examen de 60%; las calificaciones respectivas son de 6.4, 9.2 y 8.1.

3- La nota final de una asignatura es una media ponderada de las notas que han obtenido los
alumnos en los cuatro elementos evaluables que determina el profesor. El responsable de la
asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo entregable, 2 al trabajo final
y 4 al examen final. Las notas de un alumno han sido las siguientes:

Notas del alumno


Elemento Nota Peso
Examen inicial 5,2 3
Trabajo inicial 8,2 1
Trabajo final 7,4 2
Examen final 5,7 4
5.6 OTRA MEDIAS

5.6.1 MEDIA GEOMÉTRICA

La media geométrica (Z̅ ) de un conjunto de números positivos es la raíz enésima del


producto de esos números. Ese usa con existen diferencias muy grandes o cuando la
profesión de los valores no es lineal, es decir, cuando los valores crecen en progresión
geométrica.

Se calcula multiplicando entre sí todos los valores de la variable y aplicando al producto la


raíz enésima, donde n= total de los valores.

∑^
Z̅ = [∏ ]+

Ejemplo: Calcula la media geométrica de los valores 2, 4 y 8

∑^
Z̅ = [∏ ]+ = b
[(2)(4)(8) =
b
√64 = 4

Si los datos están agrupados, los valores se elevan a las frecuencias.

∑^
Z̅ = d∏ !+H

EJERCICIOS MEDIA GEOMÉTRICA

1- Calcular la media geométrica del número de hermanos que tienen Berta, Borja y Diana si
tienen 2, 2 y 4 respectivamente.

2- Tenemos los siguientes datos sobre el número de televisores que encontramos en diez
hogares: 1, 2, 3, 4, 1, 2, 3, 1, 1, 1 y 2. Calcula la media geométrica
5.6.2 LA MEDIA CUADRÁTICA

La media cuadrática (e̅ ) se define como la raíz cuadrada de la media de los cuadrados. Se
calcula para solucionar los problemas que plantea trabajar con números negativos. Para
ellos se elevan los números al cuadrado

∑9 f
e̅ = d :
;
Ejemplo I: Calcula la media cuadrática de los valores 2, 3 y 7.

∑9 f f > ?f > Ef
< B<
e̅ = d : = d = d = √20,67 = 4,55
; ? ?

Ejemplo II: Calcula la media cuadrática de los valores 1, 3, 4, 5 y 7.

∑9 f f > ?f > D f > @f > Ef


= =CC
e̅ = d : = d = d = √20 = 4,47
; @ @

Cuando los datos están agrupados por frecuencias, se eleva al cuadrado cada uno de los
valores y se multiplica por su frecuencia.

∑ 9:f H:
e̅ = d
;
Ejemplo: Calcula la media cuadrática de la siguiente distribución de frecuencias:
Xi fi Xi fi !+< !+< ,+
2 14 4 54
2 14 ∑ 9:f H: @D@
3 17
9 153 e̅ = d d = 3,24
4 21 3 17 ; @<
4 21 16 336
Total 52 545

5.6.3 LA MEDIA ARMÓNICA

La media armónica (g̅) se define como el inverso de la media de los inversos. Para calcularla,
se obtienen los inversos de todos los valores, siendo 1/x el inverso de x. a continuación se
obtiene la media normalmente y se calcula el inverso de esta.

=
g̅ = h

i:
^
Ejemplo: Calcula la media armónica de los valores 2, 3 y 7
= = = =
g̅ = h = h h h = m,no C,?? = 3,03
=
∑ k k
i: f b l b
^ b

Si los datos están agrupados por frecuencias. Se multiplica por su frecuencia cada uno de los
inversos de los valores de la variable.
Ejemplo. Calcula la media armónica de la siguiente distribución de frecuencia

t
vw xw x = =
vw w =
2 14 g̅ = h = hl,nf = = 2,94
∑( )p C,?D
3 17 5,67 i: : qf
4 21 5,25
^
Total 52 17,92

5.7 LA MEDIANA
La mediana es el valor de la distribución que deja a su derecha y a su izquierda el mismo
número de individuos. La mediana es la medida de tendencia central que divide la serie de
datos en dos mitades completamente iguales. Esto lleva implícito el ordenamiento de menor
a mayor de las variables.
Uno de sus usos es cuando la distribución presenta valores extremos, ya que la media no se
ve afectada por valores muy alejados.

5.8 CÁLCULO DE LA MEDIANA


Primero ordenaremos los valores de menor a mayor. Si el valor de números es impar, la
mediana será el valor central. Si el número de valores es par, la mediana será la media
aritmética de los dos valores centrales.
Ejemplo I: Calcula la mediana de los siguientes valores: 10, 6, 3, 4, 4, 8, 5, 8 y 8
Ordenamos: 3, 4, 4, 5, 6, 8, 8, 8 y 10
Son 9 valores, por lo tanto, la mediana es el valor central, en este caso el 5 valor = 6
Ejemplo II: Calcula la mediana de los valores: 9, 7, 5, 18, 15, 12, 5, y 11
Ordenamos: 5, 5, 7, 9, 11, 12, 15 y 18
Son 8 valore, por lo tanto, la mediana es la media aritmética del valor 4 y 5 = 9 y 11
9 + 11
= tu
2
5.9 CÁLCULO DE LA MEDIANA CON LOS DATOS AGRUPADOS POR FRECUENCIA
Cuando tenemos los valores agrupados por frecuencias, se utiliza la columna de frecuencias
acumuladas (Fi). Se calcula N/2. La primera frecuencia acumulada superior a N/2 será la
mediana. Si la frecuencia acumulada es exactamente N/2, la primera mitad termina en este
punto y la segunda mitad comienza en el siguiente valor: la mediana se la media aritmética
entre estos dos valores.
Ejemplo I: Calcula la mediana en la siguiente distribución de frecuencia:

y ?C
zw xw zw xw {w Calculamos = =15
55 3 3 < <
55 3
62 7 62 7 10 Buscamos la frecuencia acumulada superior
a 15. En este caso Fi=26. Esta frecuencia nos
69 16 69 16 26
indica que la mediana corresponde al
76 3 76 3 29 número 69
83 1 83 1 30

Ejemplo II: Calcula la mediana en la siguiente distribución de frecuencia:

y =<
zw xw {w Calculamos = =6
2
< <
2 2
3 2 4 El resultado coincide con una frecuencia acumulada, por lo tanto, la
mediana corresponde a la media aritmética del valor de la xi
4 2 6
correspondiente a esta frecuencia con el siguiente.
6 3 9
7 1 10 D>B
8 2 12
=5
<

EJERCICIOS MEDIANA
1- Halla la mediana de los datos 4, 5, 2, 7, 5, 9, 5, 2 y 8

2- Halla la mediana de los datos 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5 y 4.


3- Calcular la mediana de las alturas de los jugadores de un equipo de baloncesto, que vienen
dadas por la tabla

Nº de
Altura
jugadores
1,70 1
1,75 3
1,80 4
1,85 8
1,90 5
1,95 2

4- Calcula la mediana de las estaturas en centímetros de un grupo de dieciséis amigos: 150,


160, 164, 157, 183, 163, 182, 170, 159, 157, 151, 161, 163, 178, 173, 172.

5- Calcula la mediana de las clasificaciones de historia del arte de los 40 alumnos.

zw xw
1 2
2 2
3 4
4 5

5 8

6 9

7 3

8 4

9 3
6- Encuentre la mediana del conjunto 2, 5, 8, 11, 16, 21, 30

7- Encuentre la mediana del conjunto 3, 10, 36, 255, 79, 24, 5, 8

5.10 LA MODA

La moda (Mo) es el valor más frecuente de la variable, es decir, el valor que tiene más
frecuencia. La moda es una medida de tendencia central adecuada para escalas nominales.
Una distribución puede tener más de una moda, de manera que puede ser bimodal, trimodal,
etc. al igual que puede no tener moda y ser amodal.

Para calcular la moda crearemos una tabla con las frecuencias absolutas y buscaremos el
valor o valores con la frecuencia más alta.

Si tenemos dos modas y los valores no son consecutivos será una distribución bimodal, si
son consecutivos, la moda es la media aritmética de los dos valores.

Ejemplo: Calcula la moda en la siguiente distribución de frecuencias:

zw xw En este caso la moda corresponde al valor 69, ya que es el valor con la


55 3 mayor frecuencia (16).
62 7
69 16
76 3
83 1

EJERCICIOS MODA
1- Encuentre la moda del conjunto 2, 3, 5, 5, 7, 9, 9, 9, 10, 12

2- Encuentre la moda del conjunto 2, 5, 5, 6, 8, 8, 9, 11


TEMA 6 MEDIDAS DE POSICIÓN: CUANTILES
Los cuantiles nos indican el lugar que ocupa un valor determinado de la variable dentro del
conjunto ordenado de valores. No se consideran medidas de tendencia central, sino de
posición. Las principales medidas de posición son los cuartiles, los deciles y los centiles o
percentiles.

6.1 CUARTILES

Los cuartiles dividen los valores de la variable en cuatro partes porcentuales iguales. Hay
tres cuartiles: Q1, Q2 y Q3. El primer cuartil (Q1) es el que deja una cuarta parte de las
observaciones por debajo suyo y tres cuartas partes por encima de él. El segundo cuartil (Q2)
deja el 50% a cada lado y coincide con el valor de la mediana. El tercer cuartil (Q3) Deja tres
cuartas partes por detrás de él y una cuarta parte por delante.

6.2 DECILES

Son los valores de la variable que dividen la distribución en diez partes iguales: D1, D2, D3,
D4 ….. D9.

6.3 CENTILES O PERCENTILES

Son los valores de la variable que dividen la distribución en cien partes iguales: C1, C2, C3, C4,
C5 ……….. C99

6.4 EQUIVALENCIAS

- El Q2 D5 y C50 son iguales a la mediana.


- Los centiles C10, C20, etc. son iguales al D1, D2, etc.
- Los centiles C25, C50 y C75 son iguales al Q1, Q2 y Q3.
6.5 CÁLCULO DE LOS CUARTILES

El cálculo de los cuartiles es similar al del cálculo de la mediana, utilizando la columna de


frecuencias acumuladas absolutas (Fi).
;
Para calcular el primer cuartil (Q1) se usa y se busca la frecuencia acumulada superior a
D
<;
ese valor. Para el segundo cuartil (Q2) sería y se busca la frecuencia acumulada superior
D
a ese valor, y con el tercer cuartil (Q3) se buscaría la frecuencia acumulada superior con el
?;
resultado de
D

Ejemplo: Calcula los cuartiles de la siguiente distribución del número de hijos de cien
familias.
zw xw zw xw F1
; =CC
0 14 0 14 14 Q1= = = 25 Fi cercana a 25= 39 Q1 = 2
1 10 D D
1 10 24
2 15 2 15 39 <; <CC
3 26 3 26 65 Q2= = = 50 Fi cercana a 50= 65 Q2 = 3
D D
4 20 4 20 85
5 15 5 15 100 ?; ?CC
Total 100
Q3= = = 75 Fi cercana a 75= 85 Q3 = 4
Total 100 D D

6.6 CÁLCULO DE DECILES

; <; ?; A;
El cálculo es similar al de la mediana y los cuartiles, pero desde la formula , , ,…
=C =C =C =C
Utilizando la misma tabla del ejemplo anterior el decil 7 seria:
E; ECC
D7= = = 70 Fi cercana a 70= 85 D7 = 4
=C =C

6.7 CÁLCULO DE LOS CENTILES

; <; ?; AA;
El cálculo es similar al de los otros cuantiles, pero desde la formula , , ,…
=CC =CC =CC =CC
Utilizando la misma tabla del ejemplo anterior el centil 15 sería:

=@; =@CC
C15= = = 15 Fi cercana a 15= 24 C15 = 1
=CC =CC

6.8 CÁLCULO DE LOS CUANTILES A PARTIR DE LOS PORCENTAJES ACUMULADOS

El cálculo de cuartiles, deciles y centiles es fácil de calcular a partir de la columna de


porcentajes acumulados.
Ejemplo: Tabla de distribución de la variable edad de un grupo de 93 alumnos.

Porcentaje
zw xw Porcentaje
acumulado
18 27 29,0 29,0
19 26 28,0 57,0
20 9 9,7 66,7
21 5 5,4 72,0
22 12 12,9 84,9
23 3 3,2 88,2
24 4 4,3 92,5
25 1 1,1 93,5
26 3 3,2 96,8
28 1 1,1 97,8
39 1 1,1 98,9
42 1 1,1 100
Total 93 100

Cuartiles: Buscaremos el primer dato que supere el 25% en la columna de porcentajes


cumulados, y este será el cuartil 1 (Q1), en este caso sería el primer dato (29), que
corresponde a la xi 18. Q1 = 18. Lo mismo para el Q2, pero con el dato que supere el 50%, que
sería 57, por lo tanto, Q2 = 19. Y por último el Q3 en el que usaríamos el 75%, que sería 84,9,
por lo tanto, el Q3 = 22.

Con los deciles será de la misma manera, pero superando los datos de 10 en 10. Por ejemplo,
el D4 sería equivalente al 40% y equivaldría al dato 57, por lo que el D4 = 19.

Con los centiles/percentiles simplemente debemos buscar el valor en la tabla que supere ese
centil que buscamos. Por ejemplo, el C65 sería equivalente al 65% y equivaldría al 66,7, por
lo que el C65 = 20.

EJERCICIOS DE CUANTILES

1- En las siguientes distribuciones de frecuencias calcular:

- Todos cuartiles
- Deciles 3 y 7
- Centiles 22 y 45

zw xw
1 2
2 4
3 2
4 6
5 4
6 2
7 2
8 2
2- Con los siguientes datos calcular los cuartiles:

- 10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8 y 18
- 3, 5, 2, 7, 6, 4 y 9
- 3, 5, 2, 7, 6, 4, 9 y 1

3- De la siguiente distribución halla los:

- Cuartiles 1 y 3
- Deciles 8 y 9
- Centiles 25, 65, y 82

zw xw
1 20
2 15
3 30
4 25
5 4
6 23
7 11
8 8
9 65
10 30
11 10
12 5
13 22
14 47
15 33
16 21
17 12
18 11
19 2
20 5
TEMA 7 MEDIDAS DE DISPERSIÓN
Las medidas de dispersión indican cómo se sitúan los valores en la tabla: si se agrupan
mayoritariamente en torno a las medidas centrales, o si, por el contrario, se encuentran
dispersos y alejados de su centro.

7.1 AMPLITUD O RANGO DE LA DISTRIBUCIÓN

La amplitud o distancia de la distribución es la distancia entre sus valores extremos. Se


calcula restando el valor máximo y mínimo.

A = Xi (máxima) – Xi (mínima)
Ejemplo: La amplitud de la distribución 2, 3, 3, 5, 6, 6, 7, y 9 es: 9 – 2 = 7

Para este cálculo la frecuencia de los valores no se tiene en consideración. Este dato es poco
fiable dado que únicamente tiene en cuenta dos valores, pero en cambio su cálculo es muy
sencillo.

7.2 AMPLITUD INTERCUARTIL

Es la medida de intervalo que hay entre Q1 y Q3. Nos permite valorar la dispersión de los
valores mayoritarios, desechando el 25% superior e inferior de los valores extremos. Es una
medida adecuada para distribuciones con pocos valores extremos.

AQ = Q3 – Q1

7.3 DESVIACIÓN CUARTIL

Se obtiene dividiendo entre 2 la amplitud intercuartil.

ÖÜ
DQ =
<

7.4 DESVIACIÓN MEDIA

La desviación media (DM) tiene en cuenta todos los valores, calculando cuanto se desvía
cada valor de la media y luego halla el promedio de estas desviaciones. Por lo tanto, la DM es
la media aritmética de los valores absolutos de las desviaciones respecto a la media.

∑|]+ − !̅ |
áà =
ã
Si lo valores están agrupados por frecuencias, cada una de las desviaciones se multiplica por
su frecuencia absoluta:

∑|]+ − !̅ | ,+
áà =
ã

En este cálculo no se tienen en cuenta los signos, dado que lo que nos interesa es el promedio
de las desviaciones. Además, la media de las desviaciones de los valores con su media, si se
tiene en cuenta el signo es siempre igual a 0.

Ejemplo I: Calcula la desviación media de las puntuaciones: 8, 9, 10, 11 y 12


Primero - Calculamos la media aritmética:

8 + 9 + 10 + 11 + 12 50
!̅ = = = 10
5 5
Segundo- Calculamos los valores absolutos de las desviaciones:
zw |]+ − !̅ |
8 2
9 1
10 0
11 1
12 2
Total 6
Tercero- Ya podemos calcular la desviación media aplicando la fórmula:

∑|]+ − !̅ | 6
áà = = = t, å áçéèQêëQíã àçìQê
ã 5

Ejemplo II: Calcula la desviación media en la siguiente distribución de frecuencias:


zw xw ]+ ,+ |]+ − !̅ |,+
4 10 40 66
8 20 160 52
10 30 300 18
12 20 240 28
16 20 320 108
Total 100 1060 272
Calculamos la media que en este caso sería Xifi dividido entre Xi (1060/100 = 10,6) y las
desviaciones de cada valor. Después aplicamos la fórmula para la desviación media.

∑|]+ − !̅ | ,+ 272
áà = = = å, îå áçéèQêëQíã àçìQê
ã 100
EJERCICIOS DESVIACIÓN MEDIA

1- Hallar la desviación media de las siguientes series de números:

- 2, 3, 6, 8 y 11
- 12, 6, 7, 3, 15, 10, 18 y 5
- 18, 82, 36, 14, 35 ,25 ,35, 64 ,12, 5, 75, 64, 51,44 y 2

2- Calcula la desviación media de la distribución:

zw xw
12 3
17 5
22 7
27 4
32 2

zw xw
82 8
85 4
99 8
120 4
125 3
135 2
150 5
152 9
160 5
185 2
190 1
195 1
220 3
7.5 LA VARIANZA

La varianza mide la dispersión de los valores respecto a un valor central (media). Es la


media aritmética de las desviaciones al cuadrado entre cada valor de la variable y su media
aritmética. Se simboliza con S2 para muestras y con σ2 para poblaciones.

7.6 PROPIEDADES DE LA VARIANZA

- La varianza siempre es positiva.


- Si a todos los datos les sumamos o restamos una constante, la varianza no se modifica.
- Se multiplicamos o dividimos todos los datos por una constante, la varianza queda
multiplicada o dividida por el cuadrado de esta constante.

7.7 CÁLCULO DE LA VARIANZA

Dado que es la media aritmética de las desviaciones de los valores de la variable con su
aritmética, elevadas al cuadrado, su fórmula, si se trata de una muestra es:

∑(]+ − !̅ )<
<
ï =
ã−1
En caso de ser una población y no una muestra la fórmula sufre alguna pequeña variación:

<
∑(]+ − µ)<
í =
-

Ejemplo: Calcula la varianza de las puntuaciones: 4, 5, 6, 7, 7, 7, 8, 9 y 10


Primero – Calcularemos la media aritmética:

4 + 5 + 6 + 7 + 7 + 7 + 8 + 9 + 10 63
!̅ = = =7
9 9
Segundo – Calcularemos las desviaciones:

zw #
zw − v # )å
( vw − v
4 -3 9
5 -2 4
6 -1 1
7 0 0
7 0 0
7 0 0
8 1 1
9 2 4
10 3 9
Total 28
Aplicamos la fórmula de la varianza:

<
∑(]+ − !̅ )< 28 28
ï = = = = ñ, óu
ã−1 9−1 8

7.8 CÁLCULO DE LA VARIANZA CON LOS DATOS AGRUPADOS POR FRECUENCIA

Cuando tenemos los datos agrupados por frecuencia, la varianza se calcula igual, pero
multiplicando cada desviación al cuadrado por su frecuencia.

∑(]+ − !̅ )< ,+
<
ï =
ã−1

Ejemplo: Calcula la varianza de la siguiente distribución de frecuencias:

zw xw
61 5
64 18
67 42
70 27
73 8
n = 100

Primero – Calculamos la media aritmética para obtener después las desviaciones:

zw xw zw xw #
zw − v v)å xw
(zw − #
61 5 305 -6,45 208,01
64 18 1152 -3,45 214,25
67 42 2814 -0,45 8,50
70 27 1890 2,55 175,57
73 8 584 5,55 246,42
Total n = 100 6745 852,75
6745
!̅ = = 67,45
100
Segundo – Calculamos la varianza aplicando la fórmula:

∑(ò: ô9̅ )f H: F@<,E@ F@<,E@


ï< = = = = ö, õt Varianza
;ô= =CCô= AA
7.9 DESVIACIÓN TÍPICA O DESVIACIÓN ESTÁNDAR

La varianza se expresa en unidades cuadráticas, por lo que su interpretación puede ser


complicada. Para evitar esto se utiliza otra medida, la desviación típica, que se define como
la media cuadrática de los valores absolutos de las desviaciones. Sin simboliza con una S
para las muestras y con σ para poblaciones. Se calcula extrayendo la raíz cuadrada de la
varianza.

7.10 PROPIEDADES DE LA DESVIACIÓN TÍPICA

- Si sumamos o restamos una constante a todos los datos de la distribución, la


derivación típica de los nuevos valores no varía.
- Si multiplicamos o dividimos todos los datos de la distribución por una constante, la
desviación típica de los nuevos valores será igual a la desviación típica de los
anteriores, multiplicada o dividida por la constante.

7.11COEFICIENTE DE VARIACIÓN

Es una medida sencilla que nos indica si la distribución está concentrada en torno a la media.
Es útil para comparar dispersiones entre variables medidas con escala distinta, pues es
invariante ante cambios de escala. Se obtiene dividiendo la desviación típica por la media y
multiplicando el cociente por 100. Los valores superiores a 50 indican una gran dispersión.

ù
eú = 100

EJERCICIOS DE VARIANZA

1- Hallar la varianza de las siguientes series de números:

- 2, 3, 6, 8 y 11
- 12, 6, 7, 3, 15, 10, 18 y 5
- 18, 82, 36, 14, 35 ,25 ,35, 64 ,12, 5, 75, 64, 51,44 y 2
2- Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta
en el momento de andar por primera vez. Calcula la varianza.

Meses Niños
9 1
10 4
12 16
13 11
14 8
15 1

3- Calcula la varianza de una distribución dada por la siguiente tabla:

zw xw
12 2
17 5
22 6
25 4
27 2
32 10
35 2
39 5
45 9
55 8
58 3

4- Calcula la varianza de la distribución de la tabla:

zw xw
15 1
25 8
35 10
45 9
55 8
65 4
75 4
85 8
TEMA 8 MEDIDAS DE FORMA
Estas medidas nos aportan información sobre la forma de la distribución: si es simétrica en
cuanto al eje central y si se produce un aplanamiento o elevación excesiva en el centro de la
distribución.

8.1 COEFICIENTE DE ASIMETRÍA

Una figura es simétrica cuando existe una aplicación biyectiva entre los dos conjuntos de
puntos situados a cada lado del eje. Del mismo modo, una distribución estadística es
simétrica cuando su grafica también cumple esta condición.

El parámetro que mide el grado de simetría es el coeficiente de asimetría (As), que estima la
asimetría de la distribución de los valores respecto a la media.

Una distribución perfectamente simétrica tendrá un coeficiente de asimetría igual a 0. En


este caso hay el mismo número de observaciones por encima y por debajo de la moda.

Un As>0 indica una asimetría positiva, de modo que hay más valores por encima de la moda
que por debajo, es decir a la derecha de la escala. Esta distribución se dice que está sesgada
hacia la derecha.

Un As<0 indica una asimetría negativa, de modo que hay más valores por debajo de la moda
que por encima, es decir a la izquierda de la escala. Esta distribución se dice que está sesgada
hacia la izquierda.

En la práctica, entre -0,5 y +0,5 se considera prácticamente simétrica.

8.2 MEDIDAS DE TENDENCIA CENTRAL Y ASIMETRÍA

Según la asimetría de la distribución, las medidas de tendencia central (media, mediana y


moda) se ordenan de un modo determinado:

- Cuando la asimetría es nula, ósea la distribución es simétrica, las tres medidas


coinciden.
- Cuando la asimetría es positiva, ósea cuando hay un mayor número de individuos a la
derecha de la curva, la media es mayor que la mediana, y ambas son mayores que la
moda.
- Cuando la asimetría es negativa, ósea cuando hay un mayor número de individuos a
la izquierda de la curva, la media es menor que la mediana, y ambas son menores que
la moda.

# = ûü = û†
Asimetría nula: v

# > ûü > û†
Asimetría positiva: v

# < ûü < û†
Asimetría negativa: v
8.3 CURTOSIS O APUNTAMIENTO

La curtosis o apuntamiento nos indica las desviaciones en sentido vertical.

- Una distribución es platicúrtica cuando su curva es aplanada.


- Una distribución es leptocúrtica cuando su curva es elevada.
- Una distribución es mesocúrtica cunado no es ni platicúrtica ni leptocúrtica.

8.4 COEFICIENTE DE CURTOSIS

La curtosis se mide mediante el coeficiente de curtosis (Cu), que es la medida de la


concentración de las puntuaciones de la distribución en torno a la media. Si la distribución
es mesocúritca (normal), el valor del coeficiente de curtosis será igual a 0. Los valores
mayores de 0 indican una distribución leptocúrtica, ósea que sus valores tienen a
concentrarse en torno a la media. Los valores menores que 0 indican que la distribución es
platicúrtica, ósea que las puntuaciones tienden a dispersarse más que en la distribución
normal.

Cu = 0 Distribución mesocúrtica

Cu > 0 Distribución leptocúrtica

Cu < 0 Distribución platicúrtica

Como sucedo con el coeficiente de asimetría, se considera que un coeficiente de curtosis


situado en el intervalo -0,5 y +0,5 indica una distribución prácticamente mesocúrtica.
TEMA 9 CÁLCULO DE PROBABILIDADES

9.1 EXPERIMENTOS Y SUCESOS ALEATORIOS

Un experimento es todo proceso que se efectúa para obtener información de los individuos
de la población estudiada, estos pueden dividirse en deterministas y aleatorios. Un suceso
determinista es aquel en el que el investigador puede predecir los resultados antes de
llevarlo a cabo, ya que siempre sucede de la misma manera. Un suceso aleatorio es aquel en
que el resultado no puede predecirse con certeza.

9.2 CONCEPTO DE PROBABILIDAD

La probabilidad de un suceso aleatorio es el cociente obtenido de dividir el número de casos


favorables por el número de casos posibles. Esta definición es de Laplace en el siglo XVII y
supone que todos los sucesos elementales de un mismo experimento aleatorio han de tener
la misma probabilidad.
ã
M=
-
n = número de casos favorables N = número de casos posibles

La probabilidad es un número que varía entre 0 y 1. La probabilidad es 0 cuando el suceso


es imposible y es 1 cunado el suceso es seguro.

9.3 CONCEPTOS BÁSICOS

9.3.1 ESPACIO MUESTRAL

Es el conjunto de todos los sucesos posibles de un experimento. Se simboliza con Ω. Según el


número de sucesos posibles, el espacio muestral se puede clasificar en:

a) Espacio muestral finito: Consta de un número finito de elementos (como las veces que
lanzamos un dado).
b) Espacio muestral infinito: Consta de un número infinito de elementos, que pueden
denominarse mediante los números naturales (pacientes que se asisten en
urgencias).
c) Espacio muestral continuo: Consta de un número infinitos de sucesos, pero que no
pueden denominarse mediante la sucesión de números naturales (peso de un
neonato).
9.3.2 SUCESO

Es cualquier subconjunto de un espacio muestral Ω. Los distintos sucesos se pueden


clasificar en:

a) Sucesos elementales: Son los que constan de uno solo de los distintos elementos del
espacio muestral Ω.
b) Sucesos compuestos: Son los que están formados por dos o más sucesos elementales.
c) Sucesos seguros: Son los que están formados por todos los sucesos del espacio
muestral.
d) Sucesos imposibles: Son los que no constan de ningún elemento del espacio muestral.
Se simboliza con un Ø.
e) Sucesos complementarios: Dado un suceso “A” de un espacio muestral, se denomina
suceso complementario (Ac) al que sucede siempre que no sucede “A”.
f) Sucesos de unión: Dados los sucesos “A” y “B” del espacio muestral Ω, llamamos suceso
de unión al suceso constituido por los elementos de Ω que pertenecen a “A” o “B”, o a
los dos a la vez. Se simboliza A ⋃ B.
g) Sucesos intersección: Dados los sucesos “A” y “B” del espacio muestral Ω, llamamos
suceso de intersección al suceso constituido por los elementos de Ω que pertenecen
simultáneamente a “A” y “B”. Se simboliza A ⋂ B.
h) Sucesos compatibles: Dados los sucesos “A” y “B” del espacio Ω, se denominan sucesos
compatibles aquellos sucesos cuya aparición simultanea es posible, ya que tienen
elementos comunes.
i) Sucesos incompatibles: Dados los sucesos “A” y “B” del espacio Ω, se denominan
sucesos incompatibles o mutuamente excluyentes aquellos sucesos cuya aparición
simultanea es imposible. Es decir, aquellos en los que la intersección de A ⋂ B = Ø no
tienen ningún elemento común.

9.4 PROPIEDADES DE LA PROBABILIDAD

1. La probabilidad de un suceso cualquiera está comprendida entre 0 y 1


2. La probabilidad de un suceso imposible es nula. En efecto, un suceso imposible está
formado por 0 sucesos favorables.
3. La probabilidad de un suceso seguro es igual a 1. En efecto, en un suceso seguro, el
número de casos favorables es igual al número de casos posibles.
4. Si el suceso A está contenido en el suceso B, y A≠B, la probabilidad del suceso A es
menor que la del suceso B.
5. La probabilidad de un suceso más la probabilidad de su contrario es igual a 1.
6. La probabilidad de un suceso contrario es igual a 1 menos la probabilidad del suceso.
7. La probabilidad del suceso unión de dos sucesos incompatibles es igual a la suma de
las probabilidades de cada uno de ellos. Si tenemos dos sucesos incompatibles A y B,
es evidente que, al ser incompatibles, no existe ningún suceso elemental que
pertenezca a ambos, esto es, los sucesos elementales de A son distintos de los sucesos
elementales de B.
8. La probabilidad del suceso unión de dos sucesos compatibles es igual a la suma de las
probabilidades de cada uno de ellos menos la probabilidad de su intersección.
9.5 TEOREMAS BÁSICOS DE LA PROBABILIDAD

9.5.1 TEOREMA DE LA PROBABILIDAD TOTAL O DE LA SUMA

La probabilidad total puede darse en dos circunstancias

a) Sucesos incompatibles o mutuamente excluyentes.


b) Sucesos compatibles.

9.5.2 TEOREMA DE LA PROBABILIDAD COMPUESTA O DEL PRODUCTO

a) Sucesos independientes: Cuando la ocurrencia de un suceso no afecta a la del otro.


b) Probabilidad condicionada: Se entiende por la probabilidad del suceso A, condicionada
a otros sucesos B, la probabilidad de que se presente el suceso A sabiendo que ya se ha
presentado el suceso B. Se simboliza con P(A\B).
c) Sucesos dependientes: Cuando un acontecimiento depende de dos sucesos A y B, la
probabilidad es igual a la del primer A, multiplicado por la nueva probabilidad de B
cuando se sabe que A se ha verificado.
TEMA 10 DISTRIBUCIÓN DE PROBABILIDAD PARA
VARIABLES CONTINUAS: LA DISTRIBUCIÓN NORMAL

10.1 LA LEY NORMAL

Muchos de los datos observados en las ciencias sociales, físicas y biológicas siguen un modelo
común: la ley normal. Variables continuas como el peso, la estatura, el cociente intelectual,
etc. siguen este modelo, distribuyéndose según una función de densidad en forma de
campana, con parámetros µ y σ.

µ es la media de la variable aleatoria y σ es su desviación típica. Este tipo de variables se dice


que se distribuyen normalmente y se representan mediante la que se conoce como curva
normal o campana de Gauss. La curva normal es asintótica al eje de abscisas. Por ello,
cualquier valor entre -∞ y ∞ es teóricamente posible. El área total bajo la curva es, por lo
tanto, igual a 1.

Diremos que una distribución sigue una distribución normal de media µ y desviación típica
σ, cuando la representación gráfica de su función de densidad es una curva continua,
simétrica respecto a la media, que tiene dos puntos de inflexión situados a ambos lados de la
media (µ - σ y µ + σ, respectivamente). Una distribución con este modelo tendrá las siguientes
características:

- Tendrá una sola moda.


- Será simétrica, coincidiendo media, mediana y moda.
- Será exactamente mesocúrtica.

Además, puede conocerse cuántos individuos se encuentran entre dos valores cualesquiera.
En concreto:

- Entre -1σ y +1σ se encuentran el 68,26% de individuos.


- Entre -2σ y +2σ se encuentran el 95,44% de individuos.
- Entre -3σ y +3σ se encuentran el 99,74% de individuos.
10.2 LA CURVA NORMAL TIPIFICADA

Para el cálculo de las probabilidades con variables que siguen la distribución normal se
utilizan tablas. Necesitamos transformar las puntuaciones X en puntuaciones Z,
correspondientes a una distribución normal estandarizada N (0, 1) mediante el proceso de
“tipificación de la variable”. De esta manera, todas las posibles distribuciones normales, con
distintas µ y σ, quedan convertidas en una distribución normal estándar o tipificada, con µ=0
y con σ=1, cuyas probabilidades están contenidas en las tablas de la curva normal tipificada.

Para tipificar una variable se utiliza la fórmula:

Del mismo modo, una puntuación Z puede convertirse en el valor X con la transformación
que se obtiene de la formula anterior:

10.3 APLICACIONES DE LA CURVA NORMAL

La curva normal nos permite su aplicación a numerosos problemas:

1. Dado un punto de la escala, hallar el porcentaje de casos por encima y por debajo.

a) Calcular el porcentaje de casos que están por encima o por debajo de una puntuación
dada.

Ejemplo: El cociente de inteligencia es una variable que se distribuye en la población según


una ley normal de µ=100 y σ=15 ¿Qué porcentaje de individuos de la población tendrán un
CI superior a 120?
Primer – Tipificamos la puntuación X:
òô™ =<Cô=CC
©= =©= = 1,33
´ =@
Segundo - Buscamos en la tabla la puntuación Z = 1,33

Z = 1,33 = 0,4082

Tercero - Como este es el área entre 0 y Z y lo que nos interesa es el área entre Z y ∞,
obtendremos el área que no interesa mediante la resta:

0,50 – 0,4082 = 0,0918 => 9,18%

b) Calcular el porcentaje de casos comprendidos entre dos puntuaciones dadas.

Ejemplo: ¿Qué porcentaje de individuos tendrán el CI entre 90 y 110?


Primero – Tipificamos ambas puntuaciones:
òô™ ACô=CC
©= =©= = -0,67
´ =@
òô™ ==Cô=CC
©= =©= = 0,67
´ =@
Segundo – Aunque con diferente signo ambas puntuaciones tienen el mismo valor absoluto,
las áreas bajo la curva normal serán las mimas, de manera que nos bastará con buscar una
de ellas y multiplicarlas por dos:

Z = 0,67 => 0,2486 + 0,2486 = 0,4972 => 49,72%

c) Determinar si una puntuación elegida se encuentra por encima o por debajo de una
puntuación determinada:

Ejemplo: ¿Cuál es la probabilidad de que un individuo elegido al azar tenga un CI inferior a


70?
Primero – Tipificamos la puntuación:
òô™ ECô=CC
©= =©= = -2
´ =@
Segundo – Buscamos en la tabla el área correspondiente a Z = -2

Z= -2 = 0,4772

Tercero – Esta es el área entre Z y 0 lo que no interesa es el área entre -∞ y 0, obtenemos la


diferencia:

0,50 – 0,4772 = 0,0228

d) Hallar la probabilidad de que un valor elegido al azar esté comprendido entre dos
puntuaciones dadas.

Ejemplo: ¿Cuál es la probabilidad de que un individuo elegido al azar tenga un CI entre 120
y 130?
Primero – Tipificamos las puntuaciones:
òô™ =<Cô=CC
©= =©= = 1,33
´ =@
òô™ =?Cô=CC
©= =©= =2
´ =@
Segundo – Buscamos las áreas correspondidas a las respectivas puntuaciones Z:

Z = 1,33 = 0,4082

Z = 2 = 0,4772
Tercero – La diferencia entre el área de Z=1,33 y Z=2 nos dará la probabilidad pedida:

0,4772 – 0,4082 = 0,0690

2. Hallar las puntuaciones o valores de la escala por debajo o por encima de los cuales queda
un porcentaje de frecuencia determinado.

a) Determinar la puntuación por encima o por debajo de la cual existe un determinado


porcentaje de casos.

Ejemplo: ¿Qué valor de CI es superado por el 20% de la población?


Primero – El área comprendida entre 0 y Z será 0,30. En las tablas buscaremos la Z que
corresponda al valor más próximo a 0,30:

Z (0,30) => 0,84

Segundo – Obtendremos la puntuación Z mediante la fórmula:

] = µ + Zσ = 100 + (0,84 • 15) = 112,6

b) Determinar la distancia a ambos lados de la media, que comprende un porcentaje de


casos determinados.

Ejemplo: ¿Entre qué valores de CI se encuentran el 40% central de la población?


Primero – Tendremos dos áreas iguales, a ambos lados de la media, con el 20% en cada una
de ellas. Buscaremos la puntuación Z correspondiente al área más cercana a 0,20:

Z (0,20) => 0,52

Segundo – Para determinar la puntuación X, se aplicará la fórmula utilizando el mismo valor


Z, pero con distinto signo:

] = µ + Zσ = 100 + (-0,52 • 15) = 92,2

] = µ + Zσ = 100 + (0,52 • 15) = 107,8

c) Determinar la puntuación acerca de la cual hay una determinada probabilidad de que


una puntuación elegida al azar esté por encima o por debajo de ella.

Ejemplo: ¿Qué valor de CI tiene una probabilidad de 0,25 de ser superado por un individuo
elegido al azar?
Primero – Buscamos la Z correspondiente al área más próxima a 0,25:

Z (0,25) => 0,67

Segundo – Aplicamos la fórmula:

] = µ + Zσ = 100 + (0,67 • 15) = 110,05


Ejercicio I: La altura de los individuos de una población escolar se distribuye normalmente
con una media de 163 y una varianza de 49 cm. Calcular:
a) La probabilidad de que un individuo al azar mida menos de 172 cm.
Primero – Tipificaremos la puntuación X:
òô™ =E<ô=B?
©= =©= = 1,29
´ E
Segundo – Buscamos en la tabla el área correspondiente a Z = 1,29

Z (1,29) => 0,4015

Tercero - como este valor corresponde al área entre 0 y Z, hemos de sumarle el área
correspondiente a la otra mitad de la curva, de manera que:

0,4015 + 0,5 = 0,9015

Alternativamente, si utilizamos la tabla específica para valores de Z positivos, observamos


directamente:

Z = 1,29 => 0,9015

b) La probabilidad de que un individuo elegido al azar mida menos de 160 cm.


Primero – Tipificamos la puntuación X:
òô™ =BCô=B?
©= =©= = 0,43
´ E
Segundo – Buscamos en la tabla el área correspondiente:

Z = 0,43 => 0,1664

Tercero – Corresponde al área entre 0 y Z, pero como lo que buscamos es el área entre -∞ y
Z, calcularemos:

0,50 – 0,1664 = 0,3336

De la misma manera, si utilizamos la tabla específica para valores de Z negativos,


obtendremos:

Z = -0,43 => 0,3336

c) La probabilidad de que un individuo elegido al azar mida más de 155 cm.


Primero- Tipificamos la puntuación X

òô™ =@@ô=B?
©= =©= = 1,14
´ E
Segundo – Buscamos en la tabla el área correspondiente:

Z = 1,14 => 0,3729


Tercero - como buscamos el área de Z a ∞, calcularemos:

0,50 + 0,3729 = 0,8729

Ejercicio II: El peso de los niños nacidos en un hospital durante un año se distribuye
normalmente con una media de 2,6 Kg y una desviación típica de 0,5 kg.
a) Si se estima que los niños nacidos con menos de 1,7 Kg necesitan pasar un período en
la incubadora, ¿Qué porcentaje de niños necesitaran pasar por este período?
Primero - Tipificamos la X
òô™ =,Eô<,B
©= =©= = 1,8
´ C,@

Segundo – Buscamos en la tabla el área correspondiente:

Z = 1,8 => 0,4641

Tercero - Corresponde al área entre 0 y Z, pero como buscamos el área entre -∞ y Z,


calcularemos:

0,5 – 0,4641 = 0,0359

Cuarto – Multiplicando la probabilidad por 100, tendremos el porcentaje de niños que


deberán pasar por la incubadora.

0,0359 • 100 = 3,59%

b) ¿Entre qué pesos, centrados alrededor de la media, se encontrará el 80% de los niños
nacidos en este hospital?
Primero – Tendremos dos áreas iguales, a ambos lados de la media, con el 40% en cada una
de ellas. Buscamos la puntuación Z correspondiente al área más cercana a 0,40.

Z (0,40) => 1,28

Segundo – Para determinar las puntuaciones X se aplicará la fórmula utilizando el mismo


valor de Z pero con distinto signo:

] = µ + Zσ = 2,6 + (-1,28 • 0,5) = 1,96

] = µ + Zσ = 2,6 + (1,26 • 0,5) = 3,24


Concluimos que los pesos del 80% de los niños nacidos en el hospital tendrán un peso entre
1,96 y 3,24 Kg.
EJERCICIOS DISTRIBUCIÓN NORMAL

1- En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media de 23° y desviación típica de 5°. Calcula el número de días
al mes en los que se espera alcanzar máximas entre 21° y 27 °.

2- La media de los pesos de 500 estudiantes de un colegio es de 70 Kg y la desviación típica


es de 3 Kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuantos
estudiantes pesan:

a) Entre 60 y 75 Kg
b) Más de 90 Kg.
c) Menos de 64 Kg.
d) 64 kg.
e) 64Kg o menos.
3- Se supone que los resultados de un examen siguen una distribución normal con media de
78 y desviación típica de 36.

a) ¿Cuál es la probabilidad de que una persona que se presenta al examen obtenga una
calificación superior a 72?
b) Calcular la proporción de estudiantes que tienen puntuaciones que exceden por lo
menos cinco puntos de la puntuación que marca la frontera entre Apto y no-Apto (Son
declarados no-Aptos el 25% de los estudiantes que obtuvieron la puntuación más baja)
c) Si se sabe que la calificación de un estudiante es mayor que 72 ¿Cuál es la probabilidad
de que su calificación se superior a 84?

4- En una comunidad de 120 vecinos la media de ingresos es de 25.000 euros con una
varianza de 4.000. Suponiendo que siga una distribución normal.

a) ¿Cuántos vecinos superan los 32.000 de ingresos?


b) ¿Cuánto sería el sueldo medio de la mitad de vecinos que se encuentran en el centro?
c) Eligiendo un vecino al azar, ¿qué posibilidades hay que sus ingresos sean de más de
50.000 euros?
TEMA 11 INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

11.1 LA INFERENCIA ESTADÍSTICA

La estadística descriptiva permite obtener información acerca de muestras aleatorias


tomadas de una población conocida, mediante el cálculo de sus estadísticos. La inferencia
estadística se plantea la estimación de parámetros de la población a partir de sus
estadísticos muestrales.

11.2 ESTIMACIÓN PUNTUAL E INTERVALOS DE CONFIANZA

A partir de la observación de unos datos que siguen una distribución conocida, la estimación
puntual de un parámetro consiste en estimar este parámetro mediante un solo número. No
obstante, la información que se proporciona suele ser insuficiente, por lo que suele
proporcionarse un intervalo formado por dos valores, el cual, con una probabilidad fijada a
priori, contiene el verdadero valor del parámetro. El intervalo de confianza para un
parámetro al nivel de confianza ß= 1- α es el intervalo de longitud mínima que contiene el
verdadero valor del parámetro con una probabilidad igual a ß.

11.3 PRUEBAS ESTADÍSTICAS INFERENCIALES

Las pruebas estadísticas se utilizan para decidir si una propiedad supuesta para una
población es confirmada por la observación de la muestra. En la práctica, nos vemos
obligados a tomar decisiones respecto a una población sobre la base de información
procedente de una muestra.

El procedimiento estadístico de decisión consiste en formular una hipótesis sobre la


población, elegir la prueba estadística adecuada para contrastar dicha hipótesis y aplicar la
prueba sobre la muestra estudiada. Las hipótesis formuladas, ciertas o no, se denominan
hipótesis estadísticas y por lo general son enunciados acerca de las distribuciones de
probabilidad de las poblaciones.

11.4 CONTRASTES DE HIPÓTESIS Y SIGNIFICACIÓN

Si suponemos que una hipótesis es cierta, pero observamos que los estadísticos observados
difieren notablemente de los esperados bajo tal hipótesis, entonces diremos que las
diferencias observadas son significativas y nos veremos inclinados a descartar la hipótesis
o, al menos, a no aceptarla. Así, si en 20 tiradas de una moneda salen 16 caras, estaremos
inclinados a no aceptar la hipótesis de que la moneda es buena, aunque cabe la posibilidad
de equivocarnos.

Los procedimientos que nos capacitan para determinar si los datos de las muestras
observadas difieren significativamente de los esperados y que, por tanto, nos ayudan a
decidir si aceptamos o no una hipótesis, se denominan contrastes o test de hipótesis o de
significación.
11.5 HIPÓTESIS NULA

La hipótesis que se desea contrastar se denomina hipótesis nula, se simboliza con H0 y en


muchas ocasiones se formula con el único propósito de demostrar que es falsa. La hipótesis
nula nunca se considera probada, en el sentido que, aunque por los datos observados no
podamos demostrar que es falsa, no puede ser demostrada más que estudiando todos los
posibles elementos de la población, o todas las muestras posibles.

11.6 HIPÓTESIS ALTERNATIVA

Toda hipótesis que difiere de la hipótesis nula se denomina hipótesis alternativa. Por
ejemplo, si una hipótesis es p=0,5, posibles hipótesis alternativas podrían ser p=0,7; p<0,5;
p>0,5. Una hipótesis alternativa a la hipótesis nula se simboliza con H1.

11.7 NIVEL DE SIGNIFICACIÓN

Para decidir si la diferencia entre los datos observados y los datos teóricos o esperados es
muy grande, o lo que es lo mismo, si la probabilidad de encontrar dicha diferencia, cuando la
hipótesis nula es cierta, es muy pequeña, deje fijarse un nivel de probabilidad tal que sucesos
con probabilidad menor que dicho nivel induzcan a no aceptar la hipótesis nula y a aceptar
la hipótesis alternativa. El nivel de probabilidad elegido se denomina nivel de significación
α. En general, sus valores suelen fijarse en 0,05 o 0,01. Así, por ejemplo, si se escoge un nivel
de significación de α de 0,05 (5%), tenemos 5 probabilidades entre 100 de no aceptar la
hipótesis nula cuando deberíamos haberla aceptado; es decir, tenemos un nivel de confianza
ß (ß= 1- α) del 95% (0,95) de que hemos adoptado la decisión adecuada. En tal caso, decimos
que la hipótesis nula ha sido descartada al nivel de significación 0,05, lo que significa que la
hipótesis alternativa tiene una probabilidad de 0,05 de ser falsa.

11.8 EL VALOR-P

Si d es la discrepancia observada en la muestra, se denomina valor-p asociado a d, a la


probabilidad del conjunto de valores de la distribución más extremos que d. Es decir, el valor-
p es la probabilidad de obtener diferencias entre lo observado en la muestra y lo esperado
bajo la hipótesis nula al menos tan grandes como la discrepancia d. Si dicha probabilidad es
menor o igual que α, se descartará la hipótesis nula al nivel de significación α. En otras
palabras, si valor-p es menor que α, la diferencia entre lo observado en la muestra y lo
esperado bajo la hipótesis nula será estadísticamente significativo al nivel de significación
α, lo que nos llevará a rechazar la hipótesis nula y a aceptar la hipótesis alternativa.

De manera más comprensible, podemos definir valor-p como la probabilidad que tenemos de
tomar la decisión correcta si aceptamos la hipótesis nula, o, lo que es lo mismo, la
probabilidad de equivocarnos si aceptamos la hipótesis alternativa. Según esto, cuanto
menor sea el valor-p, más evidencia tendremos de que la hipótesis alternativa es verdadera
y debemos rechazar la hipótesis nula. Así, por ejemplo, si obtenemos un valor-p igual o
inferior a 0,05 pero superior a 0,01, aceptaremos la hipótesis alternativa con un nivel de
confianza del 95%. En el caso de que el valor-p sea también inferior a 0,01, el nivel de
confianza asumido será del 99%. Cuando el valor-p es superior a 0,05, no podemos rechazar
la hipótesis nula, ya que, por consenso, se ha establecido en el 95% el nivel de confianza
mínimo para poder aceptar la hipótesis alternativa en un contaste estadístico de hipótesis.

11.9 REGIÓN CRÍTICA Y REGIÓN DE ACEPTACIÓN

Para rechazar una hipótesis nula es necesario que las evidencias sean muy fuertes y
garanticen que los cambios no son debidos al azar, sino a otras causas. Debemos fijar un
intervalo dentro del cual los cambios pueden ser atribuidos al azar, de manera que, si los
cambios se mantienen en este intervalo, seguiremos aceptando la hipótesis nula. Este
intercambio se denomina región de aceptación y su tamaño depende del nivel de confianza
1 – α que se asuma.

La región critica o región de rechazo es la que queda fuera de esta región de aceptación e
indica que los cambios no se pueden atribuir al azar, sino a otras causas, de manera que
debemos rechazar la hipótesis nula y aceptar la hipótesis alternativa. A la hora de
determinar la región de aceptación y la región de rechazo, nos podemos encontrar con dos
casos: contrastes bilaterales o contrastes unilaterales.

11.10 CONTRASTES DE HIPÓTESIS BILATERALES

Las contrastes bilaterales o de dos colas se dan en el caso de que la hipótesis nula es del tipo
H0: Æ = k (o también H0: P = k); siendo, por tanto, la hipótesis alternativa del tipo H1: Æ ≠ k (o
bien H1: P ≠ k). En estos casos, la región crítica o de rechazo se encuentra dividida en dos
partes discontinuas, situadas en las dos colas de la distribución, mientras que la región de
aceptación corresponde al intervalo central (1 – α).

11.11 CONTRASTES DE HIPÓTESIS UNILATERALES

En los contrastes unilaterales o de una cola, la región crítica se sitúa en una sola zona
(derecha o izquierda) de la distribución. Se da cundo la hipótesis nula es del tipo H0: Æ ≥ k (o
también H0: P ≥ k); siendo la hipótesis alternativa H1: Æ < k (o bien H1: P < k).
11.12 PRUEBAS DE CONTRASTE DE HIPÓTESIS PARAMÉTRICAS O NO
PARAMÉTRICAS

Antes de proceder a la prueba de contraste de hipótesis hay que determinar si las variables
que forman la hipótesis siguen o no una distribución normal. En las que se ajustan a una
distribución normal, podemos aplicar pruebas paramétricas, de lo contrario deben aplicarse
pruebas no paramétricas.

Las pruebas paramétricas se llaman así porque el cálculo implica una estimación de los
parámetros de la población tomando como base muestras estadísticas. Cuanto más grande
sea la muestra, más exacta será la estimación. Estas pruebas exigen que los datos a los que
se aplican cumplan los siguientes requisitos:

- Que los valores de la variable dependiente sigan una distribución normal.


- Que las varianzas de los grupos que se comparan es una variable dependiente sean
aproximadamente iguales
- Que la variable dependiente esté medida en una escala que sea por lo menos de
intervalo.

Las pruebas paramétricas más conocidas y usadas son la prueba t de Student, la prueba F
(en honor a Fisher) y el coeficiente de correlación de Pearson, simbolizado por r.

Por el contrario, las pruebas no paramédicas no requieren una distribución particular, de


manera que algunas veces son referidas como pruebas de libre distribución. Este tipo de
pruebas pueden aplicarse a una amplia variedad de situaciones, ya que no tienen los rígidos
requisitos de los métodos paramétricos, dado que los resultados estadísticos que
proporcionan se derivan generalmente de procedimientos de ordenación y recuento,
presentan una menor eficacia y necesitan una mayor evidencia para rechazar la hipótesis
nula. Las pruebas no paramétricas más utilizadas son, la prueba ji cuadrado (∞ < ) de Pearson,
la prueba V de Cramer, la prueba U de Mann-Whitney, el ANOVA de Kruskall Wallis y el
coeficiente de concordancia W de Kendall.
Para saber si debemos aplicar un test paramétrico o no paramétrico, se puede aplicar el test
Kolomogorov-Smirnov, con el que se puede concluir si una serie de observaciones siguen una
distribución normal. Lo usaremos cuando no haya una evidencia clara de que tenemos una
distribución normal y el número de observaciones sea inferior a 30 (si tenemos más de 30
casos podemos aplicar tests paramétrico, independientemente de la distribución que tenga).
TEMA 12 PRUEBAS PARAMÉTRICAS

12.1 PRUEBA T DE STUDENT

12.1.1 PRUEBA T DE STUDENT PARA UNA MUESTRA

Supongamos que se dispone de una muestra de una población y que en cada individuo de la
muestra medimos la variable X, que se ajusta a una distribución normal. La prueba t de
Student se utiliza para contrastar la hipótesis nula de que la muestra procede de una
población en la que la media X es igual a una determinada constante m.

±C : Æ9 = ≥

La prueba t de Student para una muestra consiste en comparar, teniendo en cuenta la


dispersión de los datos, la media observada en la muestra con la esperada bajo la hipótesis
nula. Si el valor-p asociado al estadístico de contraste es mayor que α se asumirá la hipótesis
nula, lo que significará que la muestra pertenece a la población.

Ejemplo: Un total de 409 alumnos de enfermería han contestado la Death Anxiety Scale,
habiendo obtenido una media de 6,95. Se desea efectuar un estudio con una muestra
aleatoria de 50 alumnos. Una vez obtenida, mediante el programa informático, la muestra
aleatoria, queremos comprobar si esta muestra puede considerarse válida para la población
de la que ha sido obtenida.

Estadísticos
Total
N Válidos 409
N Perdidos 0
Media 6,95
Desviación típica 2,809

Estadísticos para una muestra


Desviación Error típico de
N Media
típica la media
Total 50 7,16 2,992 0,423

Prueba para una muestra


Valor de prueba = 6,95
95 % intervalo de
Diferencias confianza para la
T gl Sig.(bilateral)
medias diferencia
Inferior Superior
Total 0,496’’ 49 0,622 0,210 -0,64 1,06
El valor-p asociado al estadístico de contraste (significación bilateral = 0,622) es mayor que
0,05; luego, al nivel de significación del 0,05 (con un nivel de confianza del 95%), asumimos
la hipótesis nula. Dado que la diferencia entre lo observado en la muestra y lo esperado bajo
la hipótesis nulo no es estadísticamente significativa, se puede aceptar que la muestra de 50
estudiantes es una muestra válida para la población sometida a estudio.

El intervalo de confianza es una manera alternativa de comprobar lo mismo. Si el intervalo


de confianza no incluye el valor 0, la muestra no pertenece a la población media dada. Si el
intervalo de confianza incluye el valor 0, la muestra pertenece a la población. En nuestro
caso, (-0,64 a 1,06) incluye el valor 0, por lo que se considera que la muestra pertenece a la
población.

12.1.2 PRUEBA T DE STUDENT PARA DOS MUESTRAS RELACIONADAS (DATOS


APAREADOS)

Esta prueba se efectúa para contrastar la hipótesis nula de no-existencia de diferencias


significativas entre las medias de dos variables (X e Y) con distribución normal, medidas en
los mismos sujetos, o bien la no-existencia de diferencias significativas entre la medida de
una misma variable medida en los mismos sujetos en situaciones diferentes. La aplicación
de la prueba exige el mismo número de sujetos para en ambas situaciones. Si el valor-p (sig.
bilateral) asociado al estadístico de contraste es mayor que α, se aceptará la hipótesis nula.
Por el contrario, si el valor-p es menor que α, se aceptará la hipótesis alternativa de
diferencias significativas entre las medias de ambas variables, al nivel de significación α.

Ejemplo: Una muestra de 50 pacientes hipertensos fueron sometidos a un nuevo


tratamiento, tomándose datos de su presión arterial sistólica antes y después del
tratamiento. Se desea saber si existen diferencias estadísticamente significativas entre las
medidas de presión arterial sistólica antes y después del tratamiento.

Estadísticos de muestras relacionadas


Desviación Error típico de
Media N
típica la media
Par Pretratamiento 155,0000 50 15,81139 2,23607
Par Postratamiento 150,0000 50 14,98298 2,11891

Prueba de muestras relacionadas


Diferencias relacionadas
95 % intervalo de
Error confianza para la
Desviación Sig.
Media típico de t
típica diferencia (bilateral)
la media
Inferior Superior
Par
Pretratamiento- 5,00000 6,77631 0,95831 3,07419 6,92581 5,217 0,000
Postratamiento
El valor-p obtenido (0,0000) es menor de 0,05 con lo que se acepta la hipótesis nula y se
concluye, con un nivel de confianza del 99%, que existe una diferencia significativa entre las
medias de las presiones arteriales de los pacientes antes y después del tratamiento. Como la
media postratamiento es menor que la media pretratamiento, podemos aceptar que el nuevo
tratamiento es eficaz para tratar la hipertensión arterial.
12.1.3 PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES (la más
usada)

La prueba t de Student para dos muestras independientes se utiliza para contrastar la


hipótesis nula de que las muestras proceden de dos subpoblaciones en las que la media de la
variable X es la misma. Es decir, la hipótesis nula de la prueba es que las medias de ambas
muestras son iguales, de manera que si el valor-p asociado al estadístico de contraste (sig.
Bilateral) es mayor que 0,05 asumiremos la hipótesis nula de igualdad de medidas,
entendiendo que no existen diferencias significativas. Por el contrario, si el valor-p es igual
o menor a 0,05. Asumiremos la hipótesis alternativa, en el sentido de que las medias
presentan diferencias estadísticamente significativas entre las dos muestras.

La t de Student para muestras independientes tiene distintas fórmulas en función de que las
varianzas de los grupos sean o no iguales, por lo que previamente habrá que contrastar la
igualdad de varianzas de la variable en los dos grupos, mediante la prueba de Levene. En la
prueba de Levene la hipótesis nula es la igualdad de varianzas, de manera que si el valor-p
de la prueba es mayor de 0,05 asumiremos que las varianzas son iguales, mientras que si es
igual o menor a 0,05 asumiremos varianzas desiguales. En uno u otro caso, la interpretación
se hará en la fila que proceda.

Ejemplo: Un total de 200 estudiantes y 200 profesionales de enfermería contestaron la death


anxiety scale. Se desea saber si existen diferencias significativas entre las medidas de las
puntuaciones obtenidas por los estudiantes y los profesionales.

Estadísticos de grupo
Desviación Error típico de
N Media
típica la media
DAS estudiantes 200 7,01 2,742 0,194
DAS enfermeras 200 6,68 2,832 0,200

Prueba de muestras independientes


Prueba de
Levene para
Prueba T para la igualdad de medias
la igualdad de
varianzas
95% Intervalo de
Sig. confianza para la
F Sig. T gl
(bilateral) diferencia
Inferior Superior
DAS Se ha
asumido
1,184 398 0,237 -0,218 0,878
varianzas
iguales
1,036 0,309
DAS No se
han asumido
1,184 397,588 0,237 -0,218 0,878
varianzas
iguales
Primero – Comprobamos el test de Levene. Como el valor-p (sig.) es 0,309 > 0,05, asumimos
la hipótesis nula de igualdad de varianzas, por lo que consideraremos los datos de la fila “se
han asumido varianzas iguales”. Vemos que el valor-p de la prueba t es 0,237>0,05, por lo
que aceptamos la hipótesis nula de la prueba, según la cual no existen diferencias
estadísticamente significativas entre estudiantes y profesionales.

Esta comprobación también puede hacerse examinando el intervalo de confianza. Vemos


que este intervalo incluye el valor 0, con lo cual puede concluirse que las diferencias no son
significativas.

12.2 ANÁLISIS DE LA VARIANZA DE UN FACTOR (ANOVA)

El ANOVA se aplica para contrastar la hipótesis nula de que K medias son iguales, es decir:

±C = Æ= = Æ< = Æ? = ÆD …

El análisis de la varianza se basa en la comparación de la variabilidad que hay entre los


grupos con la que hay dentro de los grupos, proporcionando el estadístico F para contrastar
la hipótesis nula de igualdad de medias en los grupos. Cuanto mayor sea el valor estadístico
F, más diferenciados estará, los grupos. Si el valor-p asociado a F es igual o menor que ¥, se
rechazará la hipótesis nula al nivel de significación ¥.

ANOVA sólo puede hacerse cuando se cumplen dos requisitos: la normalidad de la


distribución de la variable y la homoscedasticidad o igualdad de varianzas. Para garantizar
la correcta aplicación de la prueba, es conveniente realizar previamente la prueba
Kolmogorov-Smirnov, para comprobar la normalidad, y la prueba de Levene, para
comprobar la igualdad de varianzas.

Cuando el ANOVA halla una diferencia significativa entre las medias de varios grupos, quiere
decir que hay una diferencia significativa entre al menos dos de las medias, por no indica
entre qué medias hay diferencias. Para ello es necesario hacer un análisis posterior y
comprobar la diferencia entre todos los pares de medias utilizadas.

Ejemplo: Un total de 183 estudiantes de los tres cursos de enfermería respondieron a la


escala de actitud ante el SIDA para enfermería (EASE). Se desea saber si existen diferencias
significativas entre los tres cursos.

Descriptivos
Intervalo de confianza para
Desviación la media al 95%
N Media
típica Límite Límite
inferior superior
Primero 79 83,10 9,376 81,00 85,20
Segundo 63 81,54 10,455 78,91 84,17
Tercero 39 84,67 7,811 82,13 87,20
Total 181 82,90 9,485 81,50 84,29
ANOVA
Suma de cuadrados gl Media cuadrática F Sig.
Intergrupos 241,498 2 120,749 1,347 0,263
Intragrupos 15.953,507 178 89,626
Total 16.195,006 180
Tenemos que el valor-p asociado a F es 0,263>0,05 de manera que aceptamos la hipótesis
nula de igualdad de medias en los tres cursos.

12.3 ANOVA DE MEDIDAS REPETIDAS

El ANOVA de medidas repetidas se utiliza en muestras separadas o dependientes para saber


si existen diferencias estadísticamente significativas entre tres o más medias de una misma
variable tomadas en los mismos sujetos en diferentes momentos. Como en el caso anterior,
la hipótesis nula es:

±C = Æ= = Æ< = Æ? = ÆD …

Ejemplo: Se desea saber si la dutasterida modifica los niveles de PSA prostáticos en hombres
con hiperplasia benigna de próstata. Para ello se toman, en un grupo de 60 pacientes, medias
de PSA antes del tratamiento, a los tres meses, a los seis meses y al año.

Factores
intrasujetos Estadísticos descriptivos
Variable Media Desv. Tip. N
Tiempo
dependiente Niveles Basales 9,4800 3,14879 60
1 Basal Tres meses 8,7800 2,96035 60
Seis meses 8,8200 3,42418 60
2 Tres meses
Un año 8,5000 2,74918 60
3 Seis meses

4 Un año

Pruebas de efectos intrasujetios


Suma de
Media
Fuente cuadrados gl F Significación
cuadrática
tipo III
Temp. Esfericidad
31,026 3 10,342 50,312 0,000
asumida
Temp. Greenhouse-Geisser 31,026 1,081 28,688 50,312 0,000
Temp. Huynh-Feldt 31,026 1,086 28,574 50,312 0,000
Temp. Límite inferior 31,026 1,000 31,026 50,312 0,000
Error Esfericidad asumida 36,384 177 0,206
Error Greenhouse-Geisser 36,384 63,808 0,570
Error Huynh-Feldt 36,384 64,064 0,568
Error Límite inferior 36,384 59,000 0,617
En la tabla “Pruebas de efectos intrasujetos” miramos la significación de la esfericidad
asumida, que igual a 0,000>0,01. Por lo tanto, rechazamos la hipótesis nula de igualdad de
medias y aceptamos la hipótesis alternativa, en el sentido de que la dutasterida modifica
significativamente los niveles de PSA.

12.4 COEFICIENTE DE CORRELACION DE PEARSON

El coeficiente de correlación de Pearson (r) mide el grado de asociación lineal entre dos
variables cuantitativas, tomando calores entre -1 y 1. Los valores próximos a 1 indican una
fuerte asociación lineal positiva (a medida que aumentan los valores de una de las dos
variables, aumentan los de la otra); los valores próximos a -1 indican una fuerte asociación
lineal negativa (a media que aumentan los valores de una de las dos variables, disminuyen
los de la otra); lo valores próximos a 0 indican que no existe asociación lineal entre las
variables.

Para determinar si la asociación es estadísticamente significativa, se plantea la hipótesis


nula de que el coeficiente de correlación lineal entre las variables es igual a 0. Si el valor-p
asociado al coeficiente de Pearson es igual o menor que ¥, se rechazará la hipótesis nula.

Ejemplo: Una muestra de 91 estudiantes de enfermería respondieron una escala de


depresión (Zung) y una escala de ansiedad general (STAI). Se desea saber si existe
asociación entre las puntuaciones de depresión y las de ansiedad.

Correlaciones
Zung STAI
Zung Correlación de Pearson
Zung Sig. (bilateral)
Zung N
STAI Correlación de Pearson 0,657
STAI Sig. (bilateral) 0,000
STAI N 91

En la tabla proporcionada por SPSS vemos que el coeficiente de Pearson es igual a 0,657, lo
que indica una fuerte asociación positiva entre las puntuaciones de la escala de depresión de
Zung y la escala de ansiedad general STAI. Por otro lado, dado el valor-p asociado es
0,000>0,01 podemos considerar que esta asociación es estadísticamente significativa con
un nivel de confianza del 99% (¥ = 0,01).
TEMA 13 PRUEBAS NO PARAMÉTRICAS

13.1 PRUEBA DE KOLMOGOROV-SMIRNOV PARA COMPROBAR LA NORMALIDAD

La prueba de Kolmogorov-Smirnov (K-S) se aplica para contrastar la hipótesis nula de que


una muestra procede de una población en la cual la variable X sigue una determinada
distribución teórica (generalmente distribución normal).

Si el valor-p asociado a la K-S es mayor que ¥, aceptaremos la hipótesis de normalidad de


distribución. En caso contrario rechazaremos la hipótesis nula de normalidad y
aceptaremos la alternativa de que los datos no se ajustan a una distribución normal.

Ejemplo: Se desea saber si las puntuaciones de 336 alumnos en la escala de depresión de


Zung se ajustan a una distribución normal.

Prueba de Kolmogorov-Smirnov
Zung
N 336
Parámetros normales Media 47,70
Parámetros normales Desviación típica 13,107
Diferencias más extremas Absolutas 0,061
Diferencias más extremas Positivas 0,061
Diferencias más extremas Negativas -0,045
Z de Kolmogorov-Smirnov 1,122
Sig. Asintót. (bilateral) 0,161

Vemos en la tabla que el valor-p asociado al estadístico Z de la K-S es de 0,161>0,05, por lo


que aceptamos la hipótesis nula de normalidad.

LA PRUEBA DE SHAPIRO-WILK SE USA CUANDO N<50, Y SU HIPOTEISIS NULA ES LA


DISTRIBUCION NORMAL **** PREGUNTA DE EXAMEN***

13.2 PRUEBA JI CUADRADO DE PEARSON (µå )

En una hipótesis donde la variable independiente y la variable dependiente son cualitativas


o están categorizadas, el test estadístico que de debe aplicar es la prueba ji cuadrado (∂ < ).
Este test consiste en cruzar las dos variables en una tabla formada por tantas celdas como
categorías combinadas tengamos entre ambas variables.

La prueba ∂ < permite determinar si dos variables cualitativas están o no asociadas. Si al final
del estudio concluimos que no está asociadas podremos afirmar con un determinado nivel
de confianza que ambas son independientes.

Por lo tanto, la prueba ∂ < se aplica para contrastar la hipótesis nula de que dos variables
cualitativas son independientes.

±∑ = ] ç ∏ éíã QãìçPçãìQçãπçé
La prueba se basa en la comparación de las frecuencias esperadas con las frecuencias
observadas en realidad. El estadístico ∂ < proporciona una medida de discrepancia existente
entre las frecuencias observadas o empíricas y las frecuencias teóricas o esperadas bajo la
hipótesis nula. Si el valor-p asociado a la ∂ < es igual o menor que ¥, rechazaremos la hipótesis
nula de independencia y asumiremos que ambas variables están relacionadas, con un nivel
de confianza de 1- ¥.

Existen limitaciones en el uso de ∂ < . Así, cuando el tamaño muestral es reducido, la


utilización de esta prueba puede introducir algún sesgo en los cálculos, de modo que el valor
del estadístico ∂ < tiende a ser mayor. En ocasiones se utiliza una corrección para eliminar
este sesgo, que para el caso de tablas 2x2, se conoce como corrección por continuidad de
Yates.

Otra de las limitaciones de ∂ < se refiere al tamaño muestral. Como norma se exige que una
tabla de contingencia, el 80% de las celdas deben tener valores mayores a 5. Por lo tanto, en
una tabla 2x2 será necesario que todas las celdas verifiquen esta condición. En lo casos que
no se verifique este requisito, existe un test que puede utilizarse como alternativa al ∂ < y que
se conoce como test exacto de Fisher, que permite analizar si dos variables dicotómicas
están asociadas cuando la muestra que se debe estudiar es demasiado pequeña y no se
cumplen las condiciones necesarias para que la aplicación del test ∂ < sea adecuada.

Ejemplo: En una muestra de 100 ancianos, de los cuales 50 están diagnosticados de


demencia tipo Alzheimer, se pretende saber si el hecho de tener antecedentes de tabaquismo
está relacionado con el diagnostico de demencia.

Tabla de contingencia: diagnostico de Alzheimer - antecedentes de tabaquismo


Antecedentes de tabaquismo
Total
Si No
Con Alzheimer recuento 16 21 37
Con Alzheimer frecuencia esperada 18,5 18,5 37,0
Sin Alzheimer recuento 34 29 63
Sin Alzheimer frecuencia esperada 31,5 31,5 63,0
Total, recuento 50 50 100
Total, frecuencia esperada 50,0 50,0 100,0
El cálculo de las frecuencias esperadas se hace multiplicando entre sí los marginales de la
casilla correspondiente y dividiendo el producto por N.

Pruebas ji cuadrado
Sig. Asintótica Sig. Exacta Sig. Exacta
Valor gl
(bilateral) (bilateral) (unilateral)
Ji cuadrado de Pearson 1,073 1 0,300
Corrección por continuidad 0,686 1 0,407
Razón de verosimilitud 1,075 1 0,300
Estadístico exacto de Fisher 1 0,408 0,204
Asociación lineal por lineal 1,062 1 0,303
N de casos válidos 100
Resulta que el valor-p de la prueba (sig. Asintótica) es 0,300>0,05. Por lo tanto, aceptamos
la hipótesis nula de independencia de variables, de manera que no podemos afirmar que los
antecedentes de tabaquismo estén asociados al diagnostico de demencia tipo Alzheimer.

13.3 EL COEFICIENTE PHI (dicotómicas)

Es una medida del grado de asociación entre dos variables dicotómicas basadas en el
estadístico ∂ < , que toma valores entre 0 y 1. Los próximos 0 indican la no-asociación entre
las variables, mientras que los valores cercanos a 1 indican una fuerte asociación entre ellas.
En el caso del Alzheimer y el tabaquismo, el coeficiente Phi es igual a 0,104. Por lo tanto,
debemos considerarlo una asociación muy débil.

13.4 PRUEBA V DE CRAMER (politómicas)

Es una extensión del coeficiente Phi al caso de las variables politómicas. De la misma
manera, los valores de V próximos a 0 indican la no-asociación entre las variables y los
valores próximos a 1 indican una fuerte asociación.

Medidas simétricas
Valor Sig. Aproximada
Nominal por Phi -0,104 0,300
Nominal V de Cramer 0,104 0,300
N de casos válidos 100

13.5 PRUEBA PARA DOS MUESTRAS INDEPENDIENTES: LA PRUEBA U DE MANN-


WHITNEY

Es la prueba no paramétrica paralela a la paramétrica de la t de Student para muestras


independientes. Contrasta la hipótesis nula de igualdad de medias. La prueba calcula el
llamado estadístico U, cuya distribución para muestras con más de 20 observaciones se
aproxima bastante bien a la distribución normal.

Ejemplo: Deseamos saber si existen diferencias significativas entre las edades de 22 mujeres
y 14 hombres residentes en un centro sociosanitario. Los resultados que nos proporciona el
programa son los siguientes:
Prueba de Mann-Whitney
Sexo N Rango promedio Suma de rangos
Edad mujeres 22 21,95 483,00
Edad hombres 16 16,13 258,00
Total 38
Estadísticas de contraste
Edad El valor-p asociado al estadístico Z es
U de Mann-Whitney 122,000 0,109>0,05, por lo que aceptamos la hipótesis
Z -1,603 nula de igualdad de medias. Es decir, no
Sig. Asintót. (bilateral) 0,109 existen diferencias significativas entre las
Sig. Exacta [2 (Sig. Bilateral) 0,114 edades de los hombres y las de las mujeres
13.6 PRUEBA PARA DOS MUESTRAS RELACIONADAS: LA PRUEBA DE WILCOXON

Para el contraste no paramétrico de dos muestras relacionadas se utiliza la prueba de


Wilcoxon. Al igual que la anterior prueba U de Mann-Whitney, la de Wilcoxon se presenta
como alternativa a la prueba t Student cuando el supuesto de normalidad no es asumible.

Ejemplo: Se desea saber si un fármaco disminuye significativamente las cifras de colesterol


tras tres meses de tratamiento. Para ello, se toman las cifras de colesterol de 19 pacientes,
antes y después de realizar el tratamiento.

Prueba de los rangos con signo de Wilcoxon


N Rango promedio Suma de rangos
Colesterol postratamiento rangos negativos 5 3,00 15,00
Colesterol pretratamiento rangos positivos 0 0,00 0,00
Empates 14
Total 19

Estadísticas de contraste
Colesterol postratamiento –
colesterol pretratamiento
Z -2,041
Sig. Asintót. (bilateral) 0,041

El valor-p de la prueba es igual a 0,041< 0,05; por tanto, rechazamos la hipótesis nula de
igualdad de medias y aceptamos la hipótesis alternativa de diferencias significativas. Como
la prueba nos indica también que el colesterol postratamiento < colesterol pretratamiento,
podemos afirmar, con un nivel de confianza del 95%, que el tratamiento es útil para reducir
de forma significativa las cifras de colesterol.

13.7 PRUEBA PARA TRES O MÁS MUESTRAS INDEPENDIENTES: EL ANOVA DE


KRUSKALL-WALLIS

Se utiliza para comprobar si existen diferencias entre varias muestras independientes. Es


la prueba no paramétrica paralela al ANOVA para muestras independientes.

Ejemplo: Se desea saber si existen diferencias significativas entre las puntuaciones medias
en la escala de actitud ante el SIDA por 22 estudiantes de primer curso, 29 estudiantes de
segundo curso y 25 estudiante de tercer curso.
Prueba de Kruskal-Wallis
Curso N Rango promedio
Actitud SIDA 1 curso 22 37,41
Actitud SIDA 2 curso 29 20,57
Actitud SIDA 3 curso 25 60,26
Total 76

Estadísticos de contraste
Actitud SIDA
Ji cuadrado 46,210
gl 2
Sig. Asintót. 0,000
El valor-p de la prueba es 0,000 < 0,01, por lo que rechazamos la hipótesis nula de igualdad
de medias y asumimos, con un nivel de confianza del 99%, que existen diferencias
significativas entre las puntuaciones de los tres cursos.

13.8 PRUEBA PARA TRES O MÁS MUESTRAS RELACIONADAS: LA PRUEBA DE


FRIEDMAN

Esta prueba podemos considerarla una extensión de Wilcoxon para el caso de más de dos
muestras relacionadas. Es la prueba no paramétrica paralela al ANOVA de medidas
repetidas y, al igual que éste, contrasta la hipótesis nula de igualdad de tres o más muestras
relacionadas.

Ejemplo: En un total de 19 pacientes que siguieron un tratamiento para la obesidad, se


tomaron mediadas de su peso en cuatro momentos: antes de iniciar el tratamiento, a los tres
meses, a los seis meses y al año. Se desea saber si hay diferencias significativas entre los
pesos medios de los cuatro momentos.

Prueba de Friedman
Rangos promedios
Inicio 3,61
Tres meses 2,29
Seis meses 1,84
Un año 2,24

Estadísticos de contraste
N 19
Ji cuadrado 2,0475
gl 3
Sig. Asintót. 0,000

El valor-p de la prueba es 0,000 < 0,001, de manera que podemos asumir la hipótesis
alternativa de diferencia significativa entre las medias de los pesos, con un nivel de
confianza del 99%.

13.9 COEFICIENTE DE CONCORDANCIA W DE KENDALL

Se utiliza para medir el grado de acuerdo entre varios jueces y observadores, cuando estos
han de evaluar una misma variable. El coeficiente W toma valores entre 1 y 0. Los valores
de W próximos a 0 indican desacuerdo entre los observadores, mientras que los valores
próximos a 1 indican total acuerdo.

Ejemplo: Cuatro enfermeras de un servicio de cuidados intensivos realizan una valoración


independiente, mediante una escala analógica de 0 a 10, del grado de ansiedad que, a su
juicio, tienen los 10 pacientes ingresados en la unidad. Se desea saber el grado de acuerdo
entre las puntuaciones otorgadas por las cuatro enfermeras.
Prueba W de Kendall
Rango promedio
Paciente 1 4,38
Paciente 2 4,50
Paciente 3 4,13 Estadísticos de contraste
Paciente 4 5,63 N 4
Paciente 5 6,38 W de Kendall 0,154
Paciente 6 7,25 Ji cuadrado 5,558
Paciente 7 5,63 gl 9
Paciente 8 5,75 Sig. Asintót. 0,783
Paciente 9 5,13
Paciente 10 6,25

El valor W es 0,154, que indica un grado de acuerdo bajo entre las puntuaciones de las
enfermeras.

Adicionalmente, puede evaluarse la hipótesis nula de no-acuerdo entre observadores


mediante el valor-p que proporciona la prueba (sig. asintót.). En este caso el valor-p es
0,783> 0,05, de manera que aceptamos la hipótesis nula de falta de acuerdo.

13.10 COEFICIENTE DE CORRELACIÓN DE SPEARMAN

El coeficiente de correlación de Spearman (Rho) es una prueba no paramétrica que mide la


asociación o interdependencia entre dos variables discretas medidas, al menos una de ellas,
en escala ordinal.

Es recomendable utilizar el coeficiente de correlación de Spearman cuando los datos


presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de
correlación de Pearson, o ante distribuciones no normales. La interpretación del coeficiente
de Rho de Spearman es igual que la del coeficiente de correlación de Pearson, con valores
que oscilan entre el -1 y 1. Los valores próximos a 1 indican una correlación fuerte y positiva.
Los valores próximos a -1 indican una correlación fuerte y negativa. Los valores próximos a
0 indican que no hay correlación lineal.

Ejemplo: En una muestra de 72 neonatos, se desea saber si existe correlación entre el peso
del niño y la puntuación del test de Apgar asignada en el momento del nacimiento.

Correlación
Peso Apgar
Rho de Spearman Correlación coeficiente PESO 1,00 0864
Sig. (bilateral) PESO - 0,000
N 72 72
Correlación coeficiente APGAR 0,864 1,000
Sig. (bilateral) APGAR 0,000 -
N 72 72
El coeficiente de Spearman es igual a 0,864, lo que indica una fuerte correlación positiva
entre las puntuaciones del test de Apgar y el peso del niño. Con el valor-p asociado de
0,000<0,01, podemos considerar que esta asociación es estadísticamente significativa, con
un nivel de confianza del 99% (¥ = 0,01).
PREGUNTAS VERDADERO-FALSO
1 La estadística es un modelo de análisis cualitativo V F
La estadística analítica se aplica al análisis de un conjunto de datos
2 V F
obtenidos de una población o muestra
3 Generalmente, los parámetros se simbolizan con letras griegas V F
La estadística permite interpretar datos cuya característica fundamental
4 V F
es la variabilidad

La estadística se basa, para su aplicación, en la teoría de probabilidades y


5 V F
en el calculo infinitesimal.

6 Un valor obtenido en una muestra se denomina “parámetro” V F

En la inferencia estadística se realiza una afirmación sobre una población


7 V F
a partir de los resultados de una muestra.
La medida del colesterol sérico de todos los enfermos de un hospital es un
8 V F
parámetro.
La estadística descriptiva permite realizar predicciones y
9 V F
generalizaciones a partir de un número limitado de casos.
El primero en aplicar la teoría de la probabilidad de los fenómenos sociales
10 V F
fue Jacques Quetelet
Los fundamentos del análisis factorial fueron establecidos por Kart
11 V F
Pearson.
12 La primera tabla de vida que se conoce fue elaborada por John Graunt. V F
Una de las principales aportaciones de Francis Galton a la teoría
13 V F
estadística fue el método de los mínimos cuadrados.
El análisis de la varianza y de la covarianza fue introducido por Ronald
14 V F
Fisher.
La prueba estadística conocida como prueba t Student se debe a William
15 V F
Gosset.
Se denomina población accesible aquella a la que se desea extrapolar los
16 V F
resultados del estudio.
Desde el punto de vista estadístico, una muestra pequeña es la que está
17 V F
compuesta por menos de 50 individuos.

Se denomina individuo al elemento que presenta asociada una medida, un


18 V F
número de orden o una característica determinada.
El conjunto de todos los estudiantes de enfermería de Cataluña es una
19 V F
población infinita.
El muestreo estratificado proporcional es un método de muestreo no
20 V F
probabilístico.
En el muestreo no aleatorio, todos los individuos de la población tienen la
21 V F
misma probabilidad de figurar en la muestra.

22 El muestreo por cuotas es una modalidad de muestreo aleatorio. V F

El muestro con sujetos voluntarios es un método de muestreo no aleatoria


23 V F
accidental.
Una variable es un atributo que solo puede tomar un valor para todos los
24 V F
individuos.
25 Las variables cualitativas pueden presentar una o varias categorías. V F
El número de estudiantes matriculados en una escuela de enfermería es un
26 V F
ejemplo de variable cuantitativa discreta.

27 Las variables cuantitativas son las que pueden medirse numéricamente. V F

28 Las variables cualitativas nunca pueden tomar valores numéricos V F

Son variables cuantitativas continuas aquellas en las cuales entre dos


29 V F
valores consecutivos no podemos encontrar ningún otro valor.
Tener el colesterol alto o bajo es un ejemplo de variable cualitativa
30 V F
dicotómica continua.
La temperatura corporal de un grupo de enfermos es un ejemplo de
31 V F
variable cualitativa continua.
Si como resultado de un examen dividimos la clase en aprobados y
32 V F
suspendidos, tenemos una variable dicotómica autentica.

33 El grupo sanguíneo es una variable cualitativa politómica. V F

Para que una variable cualitativa esté bien definida es necesario que sus
34 V F
categorías sean exhaustivas y mutuamente excluyentes

35 El estado civil es un ejemplo de variable cualitativa dicotómica. V F

Un investigador puede observar y manipular de manera deliberada la


36 V F
variable dependiente.
La variable dependiente es el efecto o la consecuencia de la variable
37 V F
independiente.
La determinación de los valores de la variable dependiente es decisión del
38 V F
investigador.
En general, se considera que el término variable aleatoria es sinónimo de
39 V F
variable independiente.
La escala nominal permite determinar si una modalidad es o no igual a la
40 V F
otra.
La escala de proporción se puede aplicar a variables cuantitativas que
41 V F
poseen el cero absoluto.
En una variable medida con escala ordinal puede calcularse la media
42 V F
aritmética como medida de tendencia central
El objetivo fundamental de la tabulación de los datos es su organización
43 V F
para hacerlos comprensibles.
El número de veces que encontramos un valor se denomina frecuencia
44 V F
absoluta de dicho valor.
Las tablas de frecuencia sólo pueden construirse para variables
45 V F
cuantitativas.
La suma de todas las frecuencias relativas de una tabla de frecuencias es
46 V F
igual a 100.
El eje vertical en el sistema de coordenadas cartesianas se denomina eje de
47 V F
abscisas.
En un sistema de coordenadas cartesianas, en el eje de abscisas se colocan
48 V F
los valores y en el de ordenadas, las frecuencias.

El diagrama de columnas es un gráfico adecuado para representar


49 V F
variables cuantitativas discretas.
El diagrama circular es el gráfico más adecuado para representar una
50 V F
variable ordinal.

51 Los pictogramas son gráficos que reflejan la evolución temporal. V F


Los gráficos de caja se construyen a partir de las medidas de posición de
52 V F
una distribución.
En general, los valores de una variable tienden a agruparse alrededor de
53 V F
un punto central.
Las medidas de tendencia central muestran cómo varían los valores de la
54 V F
distribución en torno a su media aritmética.
La media aritmética se puede definir como el valor que ocupa el lugar
55 V F
central en un conjunto ordenado de datos.
La media aritmética es la medida de tendencia central en la que menos
56 V F
influyen los valores extremos.

57 La medida de tendencia central más estable es la moda. V F

La medida de tendencia central más conocida, utilizada y que


58 V F
generalmente se necesita para cálculos posteriores es la mediana.
Media, mediana y moda miden la tendencia de los datos a agruparse en
59 V F
torno a un valor central.
La suma de las desviaciones de los valores de la distribución con respecto
60 V F
a su media aritmética es siempre igual a 0.
La mediana se obtiene sumando todos los valores de la distribución y
61 V F
dividiendo el resultado por el número de valores.
La media ponderada de varias medias se obtiene sumándolas todas y
62 V F
dividiendo el resultado por el número de medias.
La media geométrica de un conjunto de valores es la raíz enésima del
63 V F
producto de todos ellos.
La media armónica permite solucionar los problemas que plantea trabajar
64 V F
con números negativos.

65 La media cuadrática se define como el inverso de la media de los inversos. V F

66 La mediana divide la distribución en dos mitades o partes iguales. V F

La mediana es la medida de tendencia central adecuada para variables que


67 V F
se miden con escala nominal.

68 La moda nos indica el valor de la distribución que más veces se repite. V F

Cuando en la distribución existen valores muy extremos, la medida de


69 V F
tendencia central más representativa es la mediana.
Para poder calcular la mediana, previamente hay que ordenar los valores
70 V F
de la distribución.
En una distribución de frecuencias impar, la mediana será la media
71 V F
aritmética de los dos valores centrales.

Cuando los datos están agrupados por frecuencias, la mediana se calcula a


72 V F
partir de la columna de las frecuencias acumuladas.

73 Una distribución de frecuencias puede tener varias medianas V F

La moda es la medida de tendencia central que puede calcularse para todas


74 V F
las escalas de medidas.
Las medidas de posición nos indican el lugar que ocupa un valor de la
75 V F
variable en un conjunto ordenado de valores.
Los percentiles dividen la distribución de frecuencias en diez partes
76 V F
iguales.
77 El valor del primer cuartil coincide con el del centil 75 y con el del decil 7. V F

El valor del segundo cuartil coincide con el centil 50, el del decil 5 y la
78 V F
mediana.
El centil 35 es el valor de la variable que nos indica que el 35% de los
79 V F
valores son iguales o inferiores a esta puntuación.
El decil 6 es el valor de la variable que nos indica que el 60% de los valores
80 V F
son iguales o superiores a este valor.

81 El valor del tercer cuartil coincide con el del centil 30. V F

Entre el centil 60 y el centil 90 se en encuentran el 30% de los valores de


82 V F
la distribución.
El tercer cuartil es el valor de la variable que deja por debajo el 75% de los
83 V F
valores.
Entre el primer cuartil y el tercer cuartil se encuentran el 50% de los
84 V F
valores de la distribución.
Las medidas de dispersión indican la concentración de los valores
85 V F
alrededor de una medida de tendencia central.

86 La amplitud intercuartil es la diferencia entre los centiles 75 y 25 V F

La desviación típica y la media aritmética son los parámetros o estadísticos


87 V F
más representativos de una distribución.

88 La varianza se obtiene mediante la raíz cuadrada de la desviación típica. V F

La amplitud de una distribución es la diferencia entre sus valores máximo


89 V F
y mínimo.
Con valores agrupados por frecuencias, la amplitud se obtiene hallando la
90 V F
diferencia entre las frecuencias máxima y mínima.
La amplitud intercuartil es una medida adecuada cuando existen en la
91 V F
distribución valores extremos.
92 Su la varianza de una distribución es 4, la desviación típica será 16. V F

93 La desviación cuartil se obtiene dividiendo por dos la amplitud intercuartil. V F

La desviación media es la media aritmética de los valores de la variable


94 V F
respecto a la media.

95 El valor de la varianza puede ser tanto positivo como negativo. V F

La varianza es la media aritmética de las desviaciones al cuadrado entre


96 V F
cada valor de la variable y su media aritmética.

Si multiplicamos todos los valores de la distribución por una constante, la


97 V F
varianza de los nuevos valores no se modifica.

La desviación típica es la media cuadrática de los valores absolutos de las


98 V F
desviaciones.
El coeficiente de variación permite comparar dispersiones entre variables
99 V F
medidas con diferentes escalas.

100 Una distribución asimétrica también se denomina sesgada V F

Si el gráfico de una distribución tiene la cola derecha más larga que la de la


101 V F
izquierda, se dice que tiene sesgo negativo.

102 Asimetría y curtosis son dos índices del apuntamiento de una distribución. V F

La curtosis se refiere a la inclinación de la grafica de una distribución hacia


103 V F
uno de los lados.

En una distribución con asimetría negativa, la moda es siempre mayor que


104 V F
la media.

105 En una distribución de sesgo positivo, la media es menor que la mediana. V F


Si una distribución es perfectamente simétrica, coincidirán las tres
106 V F
medidas de tendencia central.

107 La curva normal es platicúrtica. V F

En una distribución platicúrtica, el tercer cuartil es menor que el primer


108 V F
cuartil.

109 Una curva con mayor elevación que la normal se denomina leptocúrtica. V F

110 La distribución normal tiene un coeficiente de asimetría igual a 0. V F

111 El coeficiente de asimetría tiene valores entre -1 y 1 V F

La distribución de los valores de una variable se considera leptocúrtica


112 V F
cunado el coeficiente de curtosis es menor que 0.

Un suceso determinista es aquel en el cual conocemos el resultado antes de


113 V F
realizarlo.

114 La teoría de probabilidades se aplica al estudio de sucesos deterministas. V F

115 La probabilidad de un suceso imposible es igual a un número entre 1 y 0. V F

La probabilidad de dos sucesos independientes es igual a la probabilidad


116 V F
del primero por la probabilidad del segundo.

117 Dos sucesos son excluyentes cuando tienen elementos en común. V F

Dos sucesos son condicionados cuando la ocurrencia de uno imposibilita la


118 V F
ocurrencia del otro.

119 La probabilidad de un suceso cualquiera está comprendida entre 0 y 1. V F

La probabilidad de un suceso más la probabilidad de su contrario es igual


120 V F
a 0.

La probabilidad del suceso unión de dos sucesos incompatibles es igual al


121 V F
producto de la probabilidad de cada uno de ellos.

La probabilidad del suceso union de dos sucesos compatibles es igual a la


122 V F
suma de las probabilidades de cada uno de ellos.

123 La ley normal se aplica en el caso de variables cuantitativas continuas. V F

124 La curva normal es asintótica al eje de ordenadas. V F

125 Una distribución normal puede tener una o varias modas. V F

En la curva normal, la mitad de los valores de la variable son superiores a


126 V F
la media aritmética.
127 La densidad de frecuencias en la curva normal es mayor en los extremos. V F

El área comprendida en la curva normal a la izquierda de la media es


128 V F
aproximadamente el 68% de los casos.

Una puntuación Z indica las unidades de desviación típica que un


129 V F
determinado calor está a la derecha o a la izquierda de la media.

En una distribución normal, a una puntuación superior a la media


130 V F
corresponderá siempre una Z positiva.

La curva normal viene definida por dos parámetros: la media aritmética y


131 V F
la varianza.

132 La curva normal tipificada tiene de media 0 y desviación típica 1. V F

133 La distribución binomial se aplica en variables cuantitativas discretas. V F

En una distribución binomial nos interesa conocer la probabilidad de éxito


134 V F
o de fracaso.

Las pruebas paramétricas precisan mayor evidencia que las no


135 V F
paramétricas para poder rechazar la hipótesis nula.

La hipótesis nula de una prueba estadística solamente puede tener una


136 V F
hipótesis alternativa.

Para poder aplicar una prueba paramétrica, la variable dependiente


137 V F
deberá medirse con una escala cuantitativa.

Las pruebas no paramétricas se basan en el principio que los datos se


138 V F
ajustan a una distribución conocida.

Al realizar una prueba estadística inferencial, la hipótesis que se desea


139 V F
contrastar se denomina hipótesis nula.

Un nivel de significación ¥ de 0,05 supone que asumimos un nivel de


140 V F
confianza del 5%.

Trabajar con un nivel de confianza del 99% significa que tendremos un


141 V F
nivel de significación ¥ de 0,10.

Rechazar una hipótesis nula al nivel de significación ¥ = 0,01 significa la


142 V F
probabilidad del 1% de cometer un error tipo I.

Cuando los resultados de una prueba inferencial se sitúan en la región


143 V F
crítica, aceptamos la hipótesis nula.

Si aceptamos la hipótesis alternativa al nivel de significación ¥ = 0,05, la


144 V F
hipótesis nula tiene un 5% de probabilidades de ser falsa.
En los contrastes de hipótesis bilateral, la región crítica se encuentra
145 V F
situada a la derecha o la izquierda de la distribución.

Un intervalo de confianza para que una media, tendrá mayor amplitud


146 V F
para un nivel de confianza del 99% que para uno del 95%

Cuanto más pequeño es el valor-p, más evidencia tenemos de que la


147 V F
hipótesis alternativa es cierta.

El valor-p representa la probabilidad de equivocarse si aceptamos la


148 V F
hipótesis alternativa.

Cometemos un error tipo II cuando rechazamos la hipotisis nula, siendo


149 V F
esta cierta.

El poder o la potencia estadística representa la probabilidad de rechazar la


150 V F
hipótesis nula cuando es realmente falsa.

Al aplicar la prueba t de Student para una muestra relacionadas, el número


151 V F
de sujetos debe ser exactamente el mismo en las dos medias.

152 La prueba t de Student se utiliza para comparar dos o más medias. V F

Si de la prueba t de Student para una muestra resulta un valor-p menor de


153 V F
0,05, concluimos que la muestra no pertenece a la población.

Si comparamos dos medias tomadas en los mismos sujetos, utilizaremos la


154 V F
prueba t de Student para independientes.

En la prueba t de Student para muestras independientes no es condición


155 V F
necesaria que las muestras tengan el mismo tamaño.

Si el intervalo de confianza de la prueba t de Student contiene el valor 0,


156 V F
concluimos que las diferencias no son significativas.

157 La prueba de Levene contrasta la homoscedasticidad de varianzas. V F

La prueba t de Student para muestras apareadas tiene como hipótesis nula


158 V F
que las medias presentan diferencias significativas.

Para poder aplicar ANOVA se debe cumplir el criterio de


159 V F
homoscedasticidad.

El ANOVA de medidas repetidas se utiliza en muestras apareadas o


160 V F
dependientes.

El coeficiente de correlación de Pearson tiene como hipótesis nula que la


161 V F
correlación entre las variables es igual a 1.

162 El coeficiente de correlación de Pearson presenta valores de -1 a 1. V F


Si el valor-p asociado al coeficiente de Pearson es mayor de 0,05,
163 V F
concluimos que la correlación es estadísticamente significativa.

Si al aplicar la prueba ji cuadrado resulta un valor-p mayor de 0,05,


164 V F
concluimos que las variables son independientes.

El test exacto de Fisher se aplica cuando la muestra que se debe estudiar


165 V F
es demasiado pequeña.

166 El coeficiente Phi toma valores entre -1 y 1. V F

La prueba V de Cramer se aplica cuando tenemos variables cualitativas


167 V F
politómicas.

La prueba U de Mann-Whitney contrasta la hipótesis nula de igualdad de


168 V F
medias.

La prueba de Wilcoxon es la prueba no paramétrica paralela al ANOVA


169 V F
para muestras independientes.

La prueba ji cuadrado se aplica cuando tanto la variable independiente


170 V F
como la variable dependiente son cuantitativas.

La prueba de Kolmogorov-Smirnov se aplica para contrastar la hipótesis


171 V F
nula de normalidad de una distribución.

El ANOVA de Kruskal-Wallis se utiliza para comprobar si existen


172 V F
diferencias entre varias muestras independientes.

La prueba de Friedman es la prueba no paramétrica paralela al ANOVA de


173 V F
medidas repetidas.

El coeficiente W de Kendall se utiliza para comprobar la relación entre dos


174 V F
o más variables cualitativas.

El coeficiente de correlación de Spearman se aplica ante variables


175 V F
cuantitativas que no siguen una distribución normal.
RESPUESTAS VERDADERO-FALSO
1 F 28 F 55 F 82 V

2 F 29 F 56 F 83 V

3 V 30 V 57 F 84 V

4 V 31 V 58 F 85 F

5 V 32 F 59 V 86 V

6 F 33 V 60 V 87 V

7 V 34 V 61 F 88 F

8 V 35 F 62 F 89 V

9 F 36 F 63 V 90 F

10 V 37 V 64 F 91 V

11 F 38 F 65 F 92 F

12 V 39 F 66 V 93 V

13 F 40 V 67 F 94 F

14 V 41 V 68 V 95 F

15 V 42 F 69 V 96 V

16 F 43 V 70 V 97 F

17 F 44 V 71 F 98 V

18 V 45 F 72 V 99 V

19 F 46 F 73 F 100 V

20 F 47 F 74 V 101 F

21 F 48 V 75 V 102 F

22 F 49 V 76 F 103 F

23 V 50 F 77 F 104 V

24 F 51 F 78 V 105 F

25 F 52 V 79 V 106 V

26 V 53 V 80 F 107 F

27 V 54 F 81 F 108 F
109 V 138 F 167 V

110 V 139 V 168 V

111 F 140 F 169 F

112 F 141 F 170 F

113 V 142 V 171 V

114 F 143 F 172 V

115 F 144 F 173 V

116 V 145 F 174 F

117 F 146 V 175 V

118 F 147 V

119 V 148 V

120 F 149 F

121 F 150 V

122 F 151 V

123 V 152 F

124 F 153 V

125 F 154 F

126 V 155 V

127 F 156 V

128 F 157 V

129 V 158 F

130 V 159 V

131 F 160 V

132 V 161 F

133 V 162 V

134 V 163 F

135 F 164 V

136 F 165 V

137 V 166 F
PREGUNTAS DE OPCIÓN MÚLTIPLE
1. Se entiende por población diana:
a. La totalidad de casos que se adaptan a un conjunto de criterios y de los cuales
se puede obtener una información.
b. El conjunto de casos que cumplen los criterios predeterminados y que son
accesibles al investigador como sujetos de estudio.
c. El conjunto de casos que cumplen los criterios a los cuales se pretende
extrapolar los resultados del estudio.
d. El conjunto de casos representativos seleccionados mediante procedimientos
de muestreo probabilístico
e. A y C son ciertas.
2. Una muestra es:
a. Un subconjunto de la población que es representativo de la misma.
b. Un conjunto de individuos que cumplen unos determinados criterios de
inclusión.
c. Un subconjunto de la población del cual se pretende obtener información.
d. Un conjunto de individuos a los cuales se pretende extrapolar los resultados del
estudio.
e. A, B y C son ciertas.
3. El método de muestreo que asegura la representatividad de la muestra es el:
a. Probabilístico.
b. Al azar.
c. Aleatorio.
d. Por cuotas.
e. A, B y C son ciertas.
4. ¿Cuál de los siguientes muestreos es de tipo no probabilístico?
a. Muestreo sistemático.
b. Muestreo estratificado.
c. Muestreo por cuotas.
d. Muestreo aleatorio simple.
e. Muestreo por conglomerados.
5. Se ha realizado un estudio para conocer el efecto de un nuevo analgésico. La
variable principal de respuesta es una escala de dolor con los siguientes valores:
1 (no dolor), 2 (dolor leve), 3 (dolor moderado) y 4 (dolor intenso). ¿De qué
tipo de variable se trata?
a. De una variable dicotómica.
b. De una variable continua.
c. De una variable discreta.
d. De una variable ordinal.
e. De una variable cuantitativa.
6. Es una variable cualitativa nominal politómica:
a. La edad.
b. El grupo sanguíneo.
c. La evolución de una enfermedad (buena, intermedia, mala).
d. El sexo.
e. La escala de ansiedad (de 0 a 4).
7. Las diversas religiones pueden considerarse como:
a. Una variable cuantitativa continua.
b. Una variable cuantitativa discreta.
c. Una variable cualitativa dicotómica.
d. Una variable cualitativa politómica.
e. Una variable cuasicuantitativa.

8. El estado civil puede considerarse como:


a. Una variable cuantitativa continua.
b. Una variable cuantitativa discreta.
c. Una variable cualitativa dicotómica.
d. Una variable cualitativa politómica.
e. Una variable cuasicuantitativa.

9. La variable “numero de hijos” es:


a. Cualitativa dicotómica.
b. Cualitativa politómica
c. Cuantitativa continua.
d. Cuantitativa discreta.
e. Cuasicuantitativa.

10. La variable “número de habitantes” es:


a. Cualitativa dicotómica.
b. Cualitativa politómica
c. Cuantitativa continua.
d. Cuantitativa discreta.
e. Cuasicuantitativa.

11. La variable “tener el colesterol alto o bajo” es:


a. Cualitativa dicotómica.
b. Cualitativa politómica
c. Cuantitativa continua.
d. Cuantitativa discreta.
e. Cuasicuantitativa.

12. La variable “presión arterial sistólica” es:


a. Cualitativa dicotómica.
b. Cualitativa politómica
c. Cuantitativa continua.
d. Cuantitativa discreta.
e. Cuasicuantitativa.
13. Una variable cuantitativa que sólo admite valores enteros se denomina:
a. Continua.
b. Categórica.
c. Discreta.
d. Atributo.
e. Politómica.
14. Las variables continuas son las que:
a. Toman un conjunto de calores enteros.
b. Toman como valores un conjunto de cualidades o atributos.
c. Toman un conjunto infinito de valores.
d. Pueden tomar cualquier valor dentro de un conjunto de valores dados.
e. Admiten un criterio de ordenación.

15. De las siguientes variables estudiadas en un grupo de enfermos, se considera


variable cualitativa:
a. La profesión.
b. El número de hijos.
c. El número de leucocitos en sangre.
d. Los valores de presión arterial.
e. El peso.

16. Queremos averiguar si existe relación entre el sexo (masculino-femenino) y la


cifra de colesterol en sangre. Para ello, a través de una muestra determinamos la
cifra de colesterol en los hombres y en las mujeres. En este caso, las variables de
estudio son:
a. Dos: sexo y colesterol.
b. Tres: hombres, mujer y colesterol.
c. Dos: sexo (hombre-mujer) y colesterol (sí- no).
d. Una: cifra de colesterol.
e. Cuatro: hombre, mujer, colesterol sí, colesterol no.

17. Para medir variables cuantitativas con cero arbitrario, la escala de medida será:
a. Nominal.
b. Ordinal.
c. De intervalo.
d. De proporción.
e. Cualquiera de ellas, pues la última comprende las demás.

18. Para medir variables como el sexo o la profesión, el tipo de escala utilizada será:
a. Nominal.
b. Ordinal.
c. De proporción.
d. De intervalo.
e. Nominal u ordinal, indistintamente.

19. La escala de medida que sirve para ordenar a los individuos según los conceptos
de mayor, igual o menor, es:
a. De proporción.
b. Nominal.
c. De intervalo.
d. Ordinal.
e. Todas las anteriores.
20. Los pictogramas:
a. Son gráficos que reflejan una evolución temporal.
b. Son un tipo de diagrama para representar las variables.
c. Se emplean para mostrar la información mediante un dibujo alusivo al colectivo
que se estudia, con el área (o su altura) proporcional a la frecuencia que
representa.
d. Se utilizan en el cálculo de la covarianza.
e. Todas las respuestas son ciertas.

21. La media aritmética de las desviaciones de la variable respecto a la media de esta


es siempre igual a:
a. 1
b. -1
c. Un número positivo.
d. Un número negativo.
e. 0

22. Si a todos los valores de una distribución les sumamos un mismo número, la media
aritmética de los nuevos valores:
a. Es igual a la media de los anteriores.
b. Es igual a la media de los anteriores más el número que se ha sumado.
c. Es igual a la media de los anteriores multiplicada por el número que se ha
sumado.
d. Es igual a la media de los anteriores más el cuadrado del número que se ha
sumado.
e. Todas las respuestas anteriores son falsas.

23. En nueve familias estudiadas, el numero de hijos por familia era 4, 6, 2, 2, 4, 3, 2,


1, y 7. La media, la mediana y la moda de hijos será:
a. 3, 4, 2 y 3
b. 3, 3, 4 y 2
c. 3, 3 y 2
d. 2, 3, 5 y 3
e. Ninguna de las anteriores.

24. Un grupo de 50 niños tiene una estatura media de 115 cm y otro grupo de 30 niños
de la misma edad tiene una estatura media de 122 cm. ¿Cuál es la estatura media
de todos los niños?
a. 115,25 cm.
b. 12,48 cm.
c. 116,50 cm.
d. 117,62 cm.
e. 118,50 cm.
25. En la provincia de Barcelona se construyeron 15 centros sanitarios hace 20 años,
30 centros hace 10 años y 50 centros hace 5 años. ¿Cuál es la media de años que
llevan construidos todos estos centros?
a. 8,95 años.
b. 11,67 años.
c. 10,91 años.
d. 12,24 años.
e. 9,33 años.
26. En la siguiente distribución de frecuencias: 5, 9, 7, 11, 18, 5, 12 y 15, la mediana
es:
a. 7
b. 8
c. 9
d. 10
e. 11
27. En la siguiente distribución de frecuencias 9, 10, 12, 7, 11 y 7 la mediana es:
a. 7
b. 7,5
c. 8
d. 9,5
e. 10
28. Dadas las puntuaciones 1, 5, 7, 10, 15, 10, 7, 5, 1 y 1 la mediana vale:
a. 5
b. 7
c. 6
d. 6,5
e. Ninguna de los anteriores.
29. A partir de las siguientes distribuciones (14, 10, 6, 18, 6 y 8), ¿Cuál es el valor
de la mediana y de la moda, respectivamente?
a. 6 y 12
b. 9 y 6
c. 12 y 6
d. No se puede calcular con estos datos.
e. Todas las respuestas anteriores son falsas.
30. La medida de tendencia central aplicable a una variable cualitativa politómica
es:
a. La media aritmética.
b. La mediana.
c. La moda.
d. El coeficiente de variación.
e. Cualquiera de ellas.
31. El cálculo de la mediana de una muestra requiere:
a. Tipificar los datos.
b. Ordenar los datos de menor a mayor.
c. Calcular previamente la moda.
d. Calcular previamente la amplitud de la muestra.
e. Conocer el valor del coeficiente de curtosis.
32. Si la distribución de una variable cuantitativa es muy asimétrica, el índice de
tendencia central más representativo de esta distribución es:
a. La media aritmética.
b. La mediana.
c. La moda.
d. La amplitud intercuartil.
e. El coeficiente de variación.

33. El percentil 50:


a. Es un valor que se refiere a la desviación típica.
b. Es un tipo de desviación típica para distribuciones continuas.
c. Coincide con la moda en cualquier distribución.
d. Tiene el mismo valor que la mediana, el cuartil segundo y el decil quinto.
e. Significa que una distribución está sesgada en su punto central.

34. En una distribución de pesos, la cantidad de 55 kilos equivale al percentil 80. Esto
indica que:
a. Una minoría de individuos de esta distribución pesan igual o menos de 55 kilos.
b. La mayoría de los individuos de esta distribución pesan igual o más de 55 kilos.
c. Hay 80 individuos de esta distribución que pesan 55 kilos.
d. La mayoría de los individuos de esta distribución pesan igual o menos de 55
kilos.
e. La mediana de los pesos de la distribución es de 55 kilos.

35. Si una cierta puntuación de una variable corresponde al percentil 35, significa que:
a. El 35% de los valores observados son iguales o superiores a esta puntuación.
b. El 35% de los valores observados son iguales o inferiores a esta puntuación.
c. El 35% de los valores observados son iguales a esta puntuación.
d. El 65% de los valores observados son iguales o inferiores a esta puntuación.
e. Ninguna de las respuestas anteriores es cierta.

36. ¿Qué porcentaje de individuos de la distribución se encuentra entre el centil 60 y


el centil 90?
a. El 60%
b. El 10%
c. El 30%
d. El 40%
e. El 90%

37. La amplitud de la siguiente distribución de frecuencias (3, 3, 5, 6, 2, 6, 9 y 7), es


igual a:
a. 5
b. 8
c. 4
d. 7
e. 9
38. La amplitud de la siguiente distribución de frecuencias (4, 2, 16, 9, 2, 4, 8 y 10)
es igual a:
a. 14
b. 16
c. 2
d. 9
e. 12
39. En una distribución donde existen pocos valores extremos, la medida de
dispersión más adecuada es:
a. La amplitud de distribución.
b. La amplitud intercuartil.
c. La desviación cuartil.
d. La varianza.
e. La desviación típica.
40. En una distribución con valores muy concentrados alrededor de la media,
podemos afirmar que:
a. La amplitud será grande.
b. La mediana será pequeña.
c. La desviación típica será pequeña.
d. La media será cercana a 0.
e. La desviación típica será grande.
41. La media cuadrática de los valores absolutos de las desviaciones es:
a. La desviación típica.
b. La varianza.
c. El coeficiente de variación.
d. La desviación media.
e. La amplitud intercuartil.
42. La desviación típica de una distribución es una medida:
a. De tendencia central.
b. De dispersión.
c. De dispersión relativa.
d. De posición.
e. De forma.
43. Sabiendo que la varianza de una serie de puntuaciones es 16 y su coeficiente de
variación es igual a 50, ¿Cuál es la media aritmética de dichas puntuaciones?
a. 8
b. 4
c. 32
d. 0,8
e. 0,4
44. Sabiendo que la media de una serie de puntuaciones es 12 y su coeficiente de
varianza es igual a 25, ¿Cuál es la varianza de dichas puntuaciones?
a. 3
b. 6
c. 9
d. 18
e. 1
45. Las medidas que nos proporcionan información sobre la forma de la distribución
son las de:
a. Tendencia central.
b. Dispersión.
c. Asimetría.
d. Apuntamiento
e. C y D son correctas

46. La distribución de los valores de una variable se considera leptocúrtica cuando el


coeficiente de curtosis es:
a. Igual a 0.
b. Mayor que 0.
c. Menor que 0.
d. Igual a 1.
e. El coeficiente de curtosis no permite hacer esta valoración.

47. Un coeficiente de asimetría mayor de 0 indica que:


a. La distribución tiene más valores por encima de la moda.
b. La distribución tiene más valores por debajo de la moda.
c. La distribución tiene los mismos valores por encima y por debajo de la moda.
d. La distribución tiene asimetría negativa.
e. A y D son ciertas.

48. En una distribución con asimetría positiva:


a. La media, la mediana y la moda tienen el mismo valor.
b. La media es mayor que la mediana y ambas son mayores que la moda.
c. La media es menor que la mediana y ambas son menores que la moda.
d. La mediana es mayor que la media y menor que la moda.
e. La moda es mayor que la mediana y ambas son mayores que la media.

49. En una distribución con asimetría negativa:


a. La media, la mediana y la moda tienen el mismo valor.
b. La moda es mayor que la mediana y ambas son mayores que la media.
c. La moda es menor que la mediana y ambas son menores que la media.
d. La mediana es mayor que la media y ambas son mayores que la moda.
e. La media es mayor que la mediana y ambas son mayores que la moda.

50. En una distribución de frecuencias, las medidas de tendencia central presentan


los siguientes valores: media 8, moda 17, mediana 13. Referente a la asimetría de
esta distribución, puede decirse que:
a. Tiene asimetría positiva.
b. Tiene asimetría negativa.
c. El coeficiente de asimetría será igual a 0.
d. El coeficiente de asimetría será mayor que 0.
e. A y D son ciertas.
51. En una distribución de frecuencias, las medidas de tendencia central presentan
los siguientes valores: media 17, moda 8, mediana 13. Referente a la asimetría de
esta distribución, puede decirse que:
a. El coeficiente de asimetría será igual a 0.
b. El coeficiente de asimetría será menor que 0.
c. El coeficiente de asimetría será mayor que 0.
d. B y D son correctas.

52. Dos sucesos se denominan incompatibles cuando:


a. Siempre que sucede el uno, sucede el otro.
b. Siempre que uno de ellos no se verifica, se verifica el otro.
c. No pueden ocurrir simultáneamente.
d. Dándose uno de ellos, puede darse el otro.
e. Nada de lo anterior es cierto.
53. Si A y B son dos sucesos independientes, con P(a)=0,5 y P(b)=0,4, la probabilidad
del suceso “A unión B” es igual a:
a. 0,70
b. 0,80
c. 0,90
d. 0,20
e. Ninguna de las anteriores.

54. Supongamos que, en general, el hecho de que en una familia fume el padre es
independiente del hecho de que fume la madre. Si la probabilidad de que fume el
padre es de 0,7 y la probabilidad de que fumen la madre es de 0,4, entonces, la
probabilidad de que fume el padre y la madre es:
a. 0,11
b. 0,30
c. 0,28
d. 0,57
e. No pude calcularse con esos datos.
55. Al lanzar un dado al aire, ¿Cuál es la probabilidad de que salga un número impar?
a. 0
b. 0,5
c. 0,25
d. 0,33
e. 0,17

56. Se lanza al aire un dado dos veces. ¿Cuál es la probabilidad de obtener 4, 5 y 6 en


la primera tirada y 1, 2, 3 o 4 en la segunda?
a. 1/3
b. 1/5
c. 1/6
d. 2/3
e. 2/6
57. ¿Cuál es la probabilidad de obtener dos “cruces” al lanzar simultáneamente dos
monedas?
a. 0
b. 0,25
c. 0,33
d. 0,50
e. 0,75

58. Una bolsa contiene bolas de color rojo y bolas de color negro, sumando un total de
120 bolas. Si sabemos que, al extraer una bola al azar, la probabilidad de que ésta
sea roja es de 0,75, ¿Cuántas bolas negras hay en la bolsa?
a. 65
b. 90
c. 100
d. 80
e. 30

59. Lanzando al aire tres dados iguales, ¿Cuál es la probabilidad de que salgan tres
ases?
a. 1/18
b. 1/72
c. 1/216
d. 1/3
e. 1/6

60. La probabilidad de nacer con la característica A es de 0,10 y la probabilidad de


nacer con la característica B es de 0,50. si las características A y B son
independientes, ¿Cuál es la probabilidad de nacer con la característica A, con la B
o con ambas?
a. 0,05
b. 0,40
c. 0,50
d. 0,55
e. 0,60

61. En una clase de 140 alumnos, sabemos que la probabilidad de que al elegir un
alumno al azar éste sea de sexo masculino es de 0,15. ¿Cuántas alumnas hay en la
clase?
a. 82
b. 115
c. 113
d. 119
e. 125
62. En una muestra de 1000 personas se encontró que 120 presentaban alteraciones
del oído y 50 eran diabéticas. El número de personas que presentaban alteraciones
de oído eran a la vez diabéticas era de 6. Con estos datos se puede concluir que:
a. La diabetes y las alteraciones de oído son dos características independientes.
b. La diabetes protege de padecer alteraciones de oído.
c. Los diabéticos tienen más probabilidad de padecer alteraciones del oído.
d. Hay interacción entre diabetes y alteraciones del oído.
e. Los datos presentados son insuficientes para considerar ninguna de las
afirmaciones anteriores.

63. El peso de los niños varones españoles en el momento del nacimiento sigue una
distribución normal de media 3,25 Kg y desviación típica 0,82 Kg. ¿Cuál es la
probabilidad de que el peso de un niño al nacer sea superior a 4 Kg?
a. 0,0038
b. 0,9146
c. 0,3186
d. 0,1814
e. 0,0091

64. Las estaturas de una población se distribuyen normalmente con una media de 168
cm y una desviación típica de 8 cm. ¿Cuál es la probabilidad de que una persona de
esta población elegida al azar mida como máximo 170 cm?
a. 0,0250
b. 0,0987
c. 0,4013
d. 0,9013
e. 0,5987

65. El peso de los niños nacidos en un hospital durante un año se distribuye


normalmente con una media de 2,6 Kg y una desviación típica de 0,5 Kg. Si se
estima que los niños nacidos con menos de 1,7 kg necesitan pasar un periodo en la
incubadora, ¿qué porcentaje de niños necesitaran pasar por este período?
a. 46,41%
b. 3,59%
c. 35,9%
d. 4,64%
e. 2,60%

66. Referente al ejercicio anterior, entre qué pesos, centrados alrededor de la media,
se encontrarán el 80% de los niños nacidos en este hospital?
a. 2,43 y 4,05
b. 1,57 y 3,07
c. 2,13 y 3,99
d. 1,96 y 3,24
e. 3,05 y 4,77
67. La edad de los trabajadores en un centro de atención primaria se distribuye
normalmente con una media de 30 años y una varianza de 9 años. ¿Cuál es la
probabilidad de que un trabajador tenga una edad superior a 24 años?
a. 0,2897
b. 0,0228
c. 0,9687
d. 0,9772
e. 0,7486

68. A partir del enunciado anterior, ¿entre qué edades se encuentran el 94% de la
población?
a. Entre 24,36 y 35,64
b. Entre 25,04 y 36,32
c. Entre 28,99 y 40,35
d. Entre 34,29 y 45,65
e. Entre 26,76 y 38,12

69. Si la prueba ji cuadrado para una tabla de contingencia resulta significativa,


puede admitirse que:
a. Que las variables son independientes.
b. Que las variables son continuas.
c. Que las dos características están asociadas.
d. Que las características estudiadas no están relacionadas.
e. Ninguna de ellas.

70. En un ensayo clínico se comparan tres tratamientos (placebo, tratamiento


establecido y un tratamiento nuevo). La variable respuesta es continua (nivel de
glucosa en sangre). Si la variable no tiene una distribución normal, el test correcto
para comparar la respuesta es:
a. La prueba t de Student.
b. La prueba de Wilcoxon.
c. El análisis de la varianza.
d. El test de Kruskal-Wallis.
e. La prueba ji cuadrado.

71. Para contrastar la hipótesis de que la media de colesterol (medido en mg/dl) es


diferente en los pacientes que presentan accidentes cerebrovasculares (100 casos)
de los pacientes que no los presentan (100 controles), ¿qué prueba estadística es
la más apropiada?
a. La correlación de Spearman.
b. La prueba t de Student.
c. La prueba ji cuadrado.
d. La correlación de Pearson.
e. La prueba de Fisher.
72. Un investigador está interesado en determinar si existe una asociación entre las
cifras de tensión arterial diastólica (medida en mm de Hg) y los niveles de
colesterol (medidos en mgr/ml). Para ello, ha realizado estas mediciones a 230
voluntarios. ¿Qué prueba estadística es la más apropiada para examinar esta
asociación?
a. La regresión logística.
b. La prueba t de Student.
c. La prueba ji cuadrado.
d. La correlación de Pearson.
e. La prueba de Wilcoxon.

73. En un ensayo clínico se comparan tres tratamientos (placebo, tratamiento


establecido y un tratamiento nuevo). La variable respuesta es continua (nivel de
glucosa en sangre). Aceptando que la variable tiene una distribución normal, el
test correcto para comparar la respuesta:
a. La prueba t de Student.
b. La prueba de Wilcoxon.
c. El análisis de la varianza.
d. El test de Kruskal-Wallis.
e. La prueba ji cuadrado.

74. A 25 personas con sobrepeso se les mide el peso en Kg antes y después de un


programa de adelgazamiento. ¿Qué test estadístico permitirá comprobar la eficacia
del programa suponiendo que la variable no se distribuye normalmente?
a. La prueba de Wilcoxon para muestras apareadas.
b. La prueba U de Mann-Whitney para muestras apareadas.
c. La prueba de Kolmogorov-Smirnov para muestras independientes.
d. La prueba U de Mann-Whitney para muestras independientes.
e. La prueba de Wilcoxon para muestras independientes.

75. El test estadístico más adecuado para determinar si existen diferencias en el nivel
sérico de un metabolito entre hombres y mujeres, suponiendo que las variables se
distribuyen normalmente, es:
a. La prueba t de Student para muestras apareadas.
b. La prueba de Wilcoxon.
c. El ANOVA de Kruskal-Wallis.
d. La prueba t de Student para dos muestras independientes.
e. La prueba U de Mann-Whitney.

76. Al realizar una prueba estadística inferencial, la hipótesis que se debe contrastar
se denomina:
a. Hipótesis nula.
b. Hipótesis alternativa.
c. Hipótesis de investigación.
d. Estadístico de contraste.
e. Valor-p
77. Un nivel de significación ª de 0,05 supone que:
a. Asumimos un nivel de confianza del 99%.
b. Asumimos un nivel de confianza del 5%.
c. Asumimos un nivel de confianza del 90%
d. Asumimos un nivel de confianza del 1%.
e. Todas las respuestas son falsas.

78. Trabajar con un nivel de confianza del 99% supone que:


a. Tendremos un nivel de significación ¥ de 0,05.
b. Tendremos un nivel de significación ¥ de 0,99.
c. Tendremos un nivel de significación ¥ de 0,10.
d. Tendremos un nivel de significación ¥ de 0,95
e. Todas las respuestas anteriores son falsas.

79. Rechazar una hipótesis nula al nivel de significación ª=0,01, significa que:
a. La hipótesis nula tiene un 1% de probabilidades de ser cierta.
b. La hipótesis nula tiene un 1% de probabilidades de ser falsa.
c. La hipótesis alternativa tiene un 1% de probabilidades de ser cierta.
d. La hipótesis alternativa tiene un 99% de probabilidades de ser falsa.
e. La hipótesis nula tiene un 99% de probabilidades de ser cierta.

80. Aceptar una hipótesis alternativa al nivel de significación ª= 0,05, significa que:
a. La hipótesis nula tiene un 5% de probabilidades de ser falsa.
b. La hipótesis alternativa tiene un 5% de probabilidades de ser cierta.
c. La hipótesis nula tiene un 95% de probabilidades de ser cierta.
d. La hipótesis nula tiene un 5% de probabilidades de ser cierta.
e. La hipótesis alternativa es cierta.

81. La prueba t de Student para muestras se utiliza para:


a. Contrastar la hipótesis nula de que la media de la variable en la muestra difiere
significativamente de la meda de la variable de la población.
b. Contrastar la hipótesis nula de que la variable en la muestra sigue una
distribución normal.
c. Contrastar la hipótesis nula de que la muestra no procede de la población.
d. Contrastar la hipótesis nula de que la media de la variable en la muestra es la
misma que en la población.
e. A y C son ciertas.

82. La prueba t de Student para dos muestras relacionadas se utiliza para contrastar
la hipótesis nula de que:
a. Existen diferencias significativas entre las medias de ambas muestras.
b. Las medias de ambas muestras son iguales.
c. Las muestras pertenecen a poblaciones diferentes.
d. A y C son ciertas.
e. Todas las respuestas son falsas.
83. La prueba t de Student para dos muestras independientes se utiliza para
contrastar la hipótesis nula de que:
a. La media de la variable es la misma en ambas muestras.
b. Existen diferencias significativas entre las medias de ambas muestras.
c. Las muestras proceden de poblaciones diferentes.
d. La media de la variable en la muestra difiere significativamente de la media de
la variable de la población.
e. B y C son correctas.

84. La prueba de Levene se utiliza para contrastar la hipótesis nula de:


a. Igualdad de medias.
b. Desigualdad de medias.
c. Igualdad de varianzas.
d. Desigualdad de varianzas.
e. B y D son ciertas.

85. En una muestra de 16 personas sanas obtenidas aleatoriamente, observamos un


nivel medio de triglicéridos en plasma de 80 mg/dl, con una varianza de 16 mg/dl.
Se debe calcular el intervalo de confianza en la población origen de la muestra, con
un nivel de confianza del 99%:
a. 76 - 84
b. 77,42 – 82,58
c. 70,30 – 82,42
d. 78,04 – 81,96
e. Todas las respuestas son falsas.

86. La prueba ji cuadrado se aplica para contrastar la hipótesis nula de que:


a. Una variable independiente cualitativa y una variable dependiente cuantitativa
no están relacionadas.
b. Una variable dependiente cuantitativa y una variable dependiente cualitativa
están relacionadas.
c. Dos variables cuantitativas están relacionadas.
d. Dos variables cualitativas estas relacionadas.
e. Dos variables cualitativas no están relacionadas.

87. Para determinar si la distribución de una variable se ajusta a una ley normal.
Aplicamos la prueba de Kolmogorov-Smirnov, obteniendo un valor-p asociado al
estadístico de contraste de p= 0,02. Con este dato podemos tomar la decisión de que:
a. Los valores de la variable se ajustan a una distribución normal, con un nivel de
confianza del 99%.
b. Los valores de la variable se ajustan a una distribución normal, con un nivel de
confianza del 95%.
c. Los valores de la variable no se ajustan a una distribución normal, con un nivel
de confianza del 99%.
d. Los valores de la variable no se ajustan a una distribución normal, con un nivel
de confianza del 95%.
e. Todas las respuestas son falsas.
88. Deseamos saber si el hecho de recibir lactancia materna o lactancia artificial está
relacionado con el hecho de padecer sarampión durante los 10 primeros años de
vida. Para efectuar el estudio, tomamos una muestra de 100 niños que recibieron
lactancia materna y otros 100 que recibieron lactancia artificial. ¿Qué prueba de
contraste de hipótesis seria de elección en este caso?
a. La prueba t de Student para muestras independientes.
b. La prueba t de Student para muestras relacionadas.
c. El análisis de la varianza de un factor (ANOVA).
d. La comparación de medias.
e. La prueba ji cuadrado.

89. Con relación al ejercicio anterior, una vez aplicada la prueba de contraste de
hipótesis, obtenemos un valor-p asociado al estadístico de contraste de p= 0,638.
Con este dato podemos tomar la decisión que:
a. Las variables están relacionadas, con un nivel de confianza del 95%.
b. Las variables no están relacionadas.
c. Las variables están relacionadas, con un nivel de confianza del 99%.
d. Las medias de ambas variables pueden considerarse iguales.
e. Todas las respuestas son falsas.

90. Deseamos saber si el hecho de recibir lactancia materna, lactancia artificial o


lactancia mixta está relacionado con el peso de los niños a los 10 años. Para
efectuar el estudio, tomamos una muestra de 100 niños que recibieron lactancia
materna, 100 que recibieron lactancia artificial y otros 100 que recibieron
lactancia mixta. ¿Qué prueba de contraste de hipótesis seria de elección en este
caso?
a. La prueba t de Student para muestras independientes.
b. La prueba t de Student para muestras relacionadas.
c. El análisis de la varianza de un factor (ANOVA).
d. La comparación de medias.
e. La prueba ji cuadrado.

91. Deseamos conocer si los niveles de colesterol en mujeres menopáusicas difieren


significativamente entre las que han tenido hijos y las que no los han tenido para
lo que estudiamos 100 mujeres en cada una de las condiciones. ¿Qué prueba de
contraste de hipótesis sería de elección en este estudio?
a. La prueba ji cuadrado.
b. La prueba t de Student para muestras independientes.
c. La prueba t de Student para muestras relacionadas.
d. El análisis de la varianza de un factor (ANOVA).
e. La comparación de varianzas.
92. Con la relación al ejercicio anterior, una vez aplicada la prueba de contraste de
hipótesis, obtenemos un valor-p asociado al estadístico de contraste de p= 0,04. Con
este dato podemos afirmar que:
a. No existen diferencias significativas entre los niveles de colesterol de las
mujeres que han tenido hijos y las que no los han tenido, con un nivel de
confianza del 95%.
b. No existen diferencias significativas entre los niveles de colesterol de las
mujeres que han tenido hijos y las que no los han tenido, con un nivel de
confianza del 99%.
c. Existen diferencias significativas entre los niveles de colesterol de las mujeres
que han tenido hijos y las que no los han tenido, con un nivel de confianza del
95%.
d. Existen diferencias significativas entre los niveles de colesterol de las mujeres
que han tenido hijos y las que no los han tenido, con un nivel de confianza del
99%.
e. El nivel de colesterol de las mujeres que no han tenido hijos es superior al de las
que sí los han tenido.

93. Al comparar, mediante la prueba t de Student, los niveles de ansiedad entre


hombres y mujeres, obtenemos un intervalo de confianza para la diferencia de
(1,42; 2,48). Con este dato podemos afirmar que:
a. No hay diferencias significativas, porque el intervalo incluye el valor 0.
b. No hay diferencias significativas, porque el intervalo no incluye el valor 0.
c. Existen diferencias significativas, porque el intervalo incluye el valor 0.
d. Existen diferencias significativas, porque el intervalo no incluye el valor 0.
e. Para tomar una decisión debemos conocer el valor-p asociado al estadístico de
contraste.
94. Se sospecha que un tratamiento para la artrosis puede producir un descenso en las
cifras de hemoglobina plasmática en los hombres. Para comprobarlo, se aplica este
tratamiento en una muestra de 70 hombres con artrosis, tomando medidas de su
hemoglobina plasmática antes de iniciar el tratamiento y después de concluirlo.
¿Qué prueba de contraste de hipótesis emplearíamos para estudiar los supuestos
efectos en una muestra del tratamiento sobre la hemoglobina?
a. La prueba ji cuadrado.
b. La prueba t de Student para una muestra.
c. La prueba t de Student para muestras independientes.
d. El análisis de la varianza de un factor (ANOVA).
e. Todas las respuestas son falsas.

95. Si deseamos conoce el grado de asociación existente entre dos variables


cualitativas dicotómicas, nos será útil conocer:
a. La prueba V de Cramer.
b. El coeficiente Phi.
c. La prueba U de Mann-Whitney.
d. La prueba t de Student.
e. EL coeficiente W de Kendall.
96. La prueba no paramétrica paralela al análisis de varianza para muestras
independientes es:
a. La prueba V de Cramer.
b. El coeficiente Phi.
c. La prueba U de Mann-Whitney.
d. El ANOVA de Kruskall-Wallis.
e. La prueba t de Student para muestras independientes.
97. Se realizó un estudio para conocer si el lugar de trabajo de la enfermera influye en
su grado de satisfacción laboral. Como muestras se tomaron 50 enfermeras de
urgencias, 50 de cuidados paliativos y otras 50 de planta de hospitalización
general. Las 150 enfermeras contestaron el cuestionario de satisfacción laboral de
McGregor, que puntura entre 0 y 100. Para conocer si existen diferencias
significativas de satisfacción laboral entre las tres muestras de enfermeras, ¿Cuál
de las siguientes pruebas aplicaremos?
a. El análisis de la varianza de un factor.
b. La prueba t de Student para muestras relacionadas.
c. La prueba t de Student para muestras independientes.
d. La prueba ji cuadrado.
e. El coeficiente Phi.
98. El coeficiente de correlación lineal de Pearson:
a. Toma valores entre -1 y 1.
b. Toma valores entre 0 y 1.
c. Mide el grado de asociación lineal entre dos variables cualitativas.
d. Es una prueba no paramétrica.
e. B y C son correctas.
99. Para estudiar el grado de asociación lineal entre la edad de los pacientes y su nivel
de glucemia obtenemos el coeficiente de correlación lineal de Pearson, resultando
un coeficiente de correlación de 0,021 y un valor-p asociado de p= 0,432. Con estos
datos podemos deducir que:
a. Existe una fuerte correlación, estadísticamente significativa.
b. Existe una correlación débil, pero estadísticamente significativa.
c. Existe una correlación débil, pero estadísticamente no significativa.
d. La correlación es bastante fuerte, pero no llega a ser estadísticamente
significativa.
e. Nos faltan datos para poder tomar una decisión.
100. La prueba V de Cramer:
a. Mide el grado de asociación entre dos variables cuantitativas.
b. Es la prueba no paramétrica paralela a la prueba t de Student para muestras
independientes.
c. Es la prueba no paramétrica paralela a la prueba t de Student para muestras
relacionadas.
d. Es una extensión del coeficiente Phi para el caso de variables con más de dos
categorías.
e. Tiene valores entre -1 y 1.

También podría gustarte