Probailidad y Estadistica Parcial 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 126

1.1.

Elementos básicos de la estadística


La estadística está ligada con los métodos científicos en la toma, organización,
recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones
como para tomar decisiones razonables de acuerdo con tales análisis.

Población

En general, en estadística se denomina población a un conjunto de elementos (de


personas, objetos, etc.), que contiene una o más características observables que se
pueden medir.

A cada elemento de la población se lo denomina unidad elemental o unidad estadística.


El resultado de medir una característica observable en la unidad elemental se llama dato
estadístico.

Muestra

Se denomina muestra a una parte de la población seleccionada de acuerdo con un plan,


con el fin de obtener información referente a la población de la que proviene. La muestra
debe ser seleccionada de tal manera que sea representativa y, por lo tanto, el método
de selección de muestras debe garantizar la obtención de datos fidedignos.

Parámetro

Es una medida descriptiva que resume una característica de la población; por ejemplo:
la media, la mediana, la varianza.

Estadístico

Llamado también estadígrafo, es una medida descriptiva que resume una característica
de una muestra y es calculada a partir de datos observados de una muestra aleatoria.

Variables

Se llama variable estadística a una característica definida en la población por la


investigación estadística y que puede tomar dos o más valores.

Las variables pueden ser cualitativas y cuantitativas. La primera describe cualidades


mientras que la segunda describe cantidades. A su vez, la variable cuantitativa puede
ser continua o discreta; es continua cuando puede tener valores en un intervalo y
es discreta cuando puede tomar exclusivamente valores exactos (enteros).

Los datos que vienen definidos por una variable discreta o continua se llaman datos
discretos o datos continuos, respectivamente. En general, las medidas dan origen a
datos continuos, mientras que las enumeraciones o conteos originan datos discretos.
1.2. Niveles o escalas de medición de las variables
Se denomina escala de medición a un instrumento de medida, con el que se asignan
valores a las unidades estadísticas para una variable definida.

Las escalas de medición son de los siguientes tipos:

 Variables nominales. No tienen un orden o jerarquía determinados.

Ejemplos: color, nacionalidad, religión, estado civil.

 Variables ordinales. Sí tienen un orden o jerarquía establecidos.

Ejemplos: clase social (alta, media, baja), estado de conservación (excelente, muy
bueno, bueno, regular, malo).

 Variables de nivel de intervalo. El cero es arbitrario y no representa la


ausencia de la variable.

Ejemplo: temperatura: 0 grados centígrados (no representa la ausencia de variable, es


decir, no significa que no haya temperatura).

 Variables de nivel de razón o proporción. El “0” sí representa la ausencia de


variable.

Ejemplos: dinero (0 dólares representa que no hay dinero), n.° de personas (0 personas
representa la ausencia de personas).

1.3. Importancia del muestreo


En estadística, una muestra estadística (llamada también muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una población
estadística.

Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la


población, para lo cual deben ser representativas de la misma. Para cumplir esta
característica, la inclusión de sujetos en la muestra debe seguir una técnica de muestreo.
En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo
con mayor rapidez y menor coste.

Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda
la población porque el manejo de un menor número de datos provoca también menos
errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra
es el sujeto realmente estudiado.

El muestreo es importante porque:


 Por lo general no se pueden estudiar a las poblaciones en su totalidad, entonces
estaremos obligados a hacer el muestreo.
 Es más rápido y económico para conocer los parámetros (características) de
interés de la población.
 Existe metodología clara y confiable para el muestreo (y tamaño de muestra).

2.1. Fuentes de información


En el proceso de cualquier investigación, la recolección de datos constituye el paso
fundamental para asegurar la obtención de resultados idóneos, ya sea dentro de una
muestra o de una población.

La recolección de la información tiene que hacerse de acuerdo con una planificación y


esquematización de la investigación, caso contrario vamos a tener datos que no son
relevantes, repetitivos y excesivos. Necesitamos organizar la información de tal manera
que pueda contribuir favorablemente al logro de los objetivos propuestos.

Con el panorama claro de las necesidades de información del proyecto, se deben realizar
las siguientes actividades:

 Desarrollar instrumentos de medición o técnicas de recolección de información


 Aplicación de los instrumentos de medición
 Sistematización, codificación y estructura de la información

A continuación vamos a ver los diferentes instrumentos y técnicas que tenemos para
recolectar información.

¿Qué entendemos por técnicas de recolección de datos?

Podemos decir que son las herramientas con las que se cuenta para la recolección de
datos. Son los procedimientos especiales utilizados para obtener y evaluar las evidencias
necesarias, suficientes y competentes, que permiten formar un juicio profesional y
objetivo. En resumen, podemos decir que es cualquier recurso que recopile
información referente a nuestro proyecto.

Tenemos diferentes clases de técnicas para recolectar información: verbales, oculares,


documentales, físicas, escritas y de auditoría.

a. Verbales. Consisten en obtener la información de manera oral mediante


averiguaciones o indagaciones. Pueden ser: entrevistas, encuestas y
cuestionarios.
b. Oculares. Obtienen la información verificando visualmente en forma directa y
paralela cómo los responsables de cada proceso desarrollan o documentan los
procesos o variables evaluadas. Pueden ser: observación, comparación o
confrontación, revisión selectiva y rastreo.
c. Documentales. Obtienen información escrita para soportar afirmaciones, análisis
o estudios previos. Pueden ser: comprobación y revisión analítica.
d. Físicas. Reconocimiento real sobre hechos o situaciones dadas en tiempo y
espacio determinados y se emplean como técnica de la inspección.
e. Escritas. Reflejan toda la información que se considera importante para sustentar
los hallazgos del trabajo realizado.
f. De auditoría. Conducen a obtener información sobre el desarrollo de destrezas y
habilidades dentro de un proceso específico.

Ahora veamos algunos de los instrumentos que nos ayudan a obtener la información.

 La observación
 La encuesta
 La entrevista

La observación

Es el registro visual de una situación real, estableciendo los acontecimientos de acuerdo


con algún esquema ya planificado.

La encuesta

Es una búsqueda sistemática de información en la que el investigador pregunta a los


investigados sobre los datos que desea obtener y posteriormente reúne estos datos.

La entrevista

Es la comunicación interpersonal establecida entre el investigador y el sujeto de estudio,


a fin de obtener respuestas verbales a las interrogantes planteadas sobre el problema
propuesto.

Dada la utilidad, complejidad y clasificación que tiene la encuesta, nos vamos a centrar
en el estudio de la misma, además hay que mencionar que es una de las más utilizadas
para la recolección de información.

La encuesta

Vamos a ver algunas de las características de una encuesta.

 Es una observación no directa de los hechos, sino por medio de lo que manifiestan
los interesados.
 Es un método preparado para la investigación.
 Permite una aplicación masiva que, mediante un sistema de muestreo, puede
extenderse universalmente.

Se puede clasificar en:

a. Exploratoria
Se usa cuando la información previa del fenómeno a estudiar es escasa o poco fiable o
es la primera toma de contacto con un fenómeno no muy conocido.

- Utilidad

 Desarrolla hipótesis de trabajo.


 Verificación factible de la investigación.

- Estrategia

 Consulta a expertos o grupos de discusión.


 Revisión y análisis de datos disponibles en otras fuentes.

b. Descriptiva

Permite definir la realidad, examinar un fenómeno para caracterizarlo y/o para


diferenciarlo de otros. Es el paso previo en cualquier investigación (provoca los porqué
de la investigación explicativa).

- Etapas

 Definición teórica del fenómeno a estudiar y selección/definición de las variables.


 Definir la población.
 Seleccionar muestras representativas.

c. Explicativa

 Determinar las relaciones causa y efecto entre los fenómenos.


 Es imprescindible el control de las posibles explicaciones alternativas.
 Considerar todas las variables del fenómeno.

Tipos de variables

 Variables independientes: causa de la explicación.


 Variables dependientes: efecto producido por las anteriores.
 Variables extrañas: ajenas al objeto de investigación pero pueden afectar las
variables explicativas.
 Variables controladas: bajo el control del investigador.
 Variables no controladas: aleatorias / perturbadoras.

d. Predictiva

 Predice el funcionamiento de un fenómeno.


 Es necesario conocer la explicación de los fenómenos antes de tratar de
establecer una predicción de estos.

Diseño de la encuesta
El diseño del cuestionario constituye el elemento principal de la encuesta; por lo tanto,
su estructura es muy importante. Dado esto, tenemos que formular preguntas directas y
concretas, que abarquen la necesidad de información que el proyecto requiere, de tal
manera que en el momento de procesar toda esta información, esta no sea insuficiente
ni inconsistente.

Las preguntas a formular se pueden clasificar entre otras de la siguiente manera:

a. Pregunta cerrada. Se proporciona una serie de opciones donde se escoge una


como respuesta, tiene la ventaja de ser fácil de procesar.
b. Pregunta abierta. No se proporciona opciones, se puede responder con libertad,
tiene la ventaja de una mayor riqueza de respuestas pero es difícil de procesar.
c. Pregunta de profundización. Se utiliza para obtener una respuesta más amplia
y completa a una pregunta abierta.
d. Pregunta parcialmente estructurada. Puede tener dos o más opciones o ser de
tipo sí/no.
e. Pregunta de control. Son preguntas que nos indican si el encuestado no está
mintiendo.

La estadística está ligada con los métodos científicos en la toma, organización,


recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones
como para tomar decisiones razonables de acuerdo con tales análisis.

Características del cuestionario

 Sencillo de entender.
 Preciso y claro en las preguntas.
 Debe tener un vocabulario adecuado.
 Debe tener espacio suficiente para las respuestas.

Una vez que ya tengamos listos los apartados anteriores, procedemos a realizar una
prueba piloto o experimental, con el fin de identificar puntos críticos en los que exista
controversia en las respuestas debido a una mala formulación de alguna pregunta (estas
se reformulan o en ciertos casos se eliminan).

2.2. Distribuciones de frecuencia


Toda actividad que hagamos con un propósito investigativo, en el cual el resultado sean
varias mediciones, tiene más que simples números o valores en una hoja. Este conjunto
de datos puede ser organizado y tabulado, y de esta manera realizar, entre otros
procesos, gráficos que nos ayuden a captar tendencias y a establecer modelos de
probabilidades. Lo que nos dice esto es que la organización de los datos es muy
importante para los procesos y análisis estadísticos.

Métodos de organización de datos


Existen muchas herramientas para describir y resumir un gran conjunto de datos. Una
de las más simples pero no menos importante es la ordenada, es decir, ordenar los datos
de forma ascendente o descendente. Para ciertos propósitos este orden de los datos no
es suficiente, y es cuando necesitamos otras herramientas o métodos para organizarlos,
es así como tenemos lo siguiente:

Distribucion de frecuencias

Una distribución de frecuencias se puede tomar como una tabla donde los datos están
categorizados por filas y su ocurrencia o frecuencia en columnas. La finalidad que tiene
esta distribución es hacer más fácil la obtención de información de los datos.

El número de veces que aparece un valor o la frecuencia con que aparece un valor se
llama frecuencia absoluta (fi) y la suma de estas frecuencias absolutas nos tiene que dar
como resultado el número de datos.

Al ordenar nuestros datos tomando en cuenta estas consideraciones, podemos decir que
hemos realizado una distribución de frecuencias o tabla de frecuencias.

En la Tabla 1 se muestra un ejemplo de distribución de frecuencias del peso de 100


estudiantes de una universidad de Perú.
De acuerdo con esta tabla, se pueden visualizar varias características que no podríamos
ver si los datos no estuvieran organizados y tabulados. La primera clase comprende los
pesos de los estudiantes, que están entre 140 y 149 libras. En esta clase, hay ocho
estudiantes, es decir, la frecuencia de esta clase es 8.

Un dato importante que hay que mencionar es que cada clase tiene un límite inferior y
un límite superior (por ejemplo la tercera clase 160-169 tiene como límite superior a 169
y como límite inferior a 160). Podemos ver que estos valores son exactos y más adelante
notaremos su importancia, además es esencial que los valores no se solapen de una
clase a otra, esto puede causar mucha confusión.

Existen también los denominados límites reales o verdaderos de clase, que se obtienen
sumando al límite superior de una clase 0,5 y restando al límite inferior del misma clase
0,5. Cuando los límites de la clase se expresan con un decimal, la regla nos indica que
se debe sumar 0,05 al límite superior y restar el mismo valor al límite inferior. Por ejemplo,
los límites reales de la cuarta clase de la tabla 1 serían: 170-0,5 = 169,5 y 179+0,5 =
179,5.

El número de clases (o número de intervalos) de una tabla de frecuencias de manera


general debe tener entre 5 y 20 clases. Si tuviera pocas clases no se tendría ningún
detalle sobre los datos, de la misma manera si hubiera muchas clases se crearía
confusión.

El intervalo de clase son las divisiones o ancho de los valores que se encuentran dentro
de una clase. Para determinar este valor se resta el límite superior menos el límite
inferior. Lo mejor es hacer iguales los intervalos de clase de una distribución de
frecuencias, de esta manera podemos facilitar la interpretación estadística.

El intervalo de clase se determina con la siguiente expresión:

Otro elemento necesario para una tabla de distribución de frecuencias es establecer un


punto medio o marca de clase, que es el punto medio del intervalo de clase. Este se
determina sumando el límite inferior con el límite superior y se divide por dos. Por
ejemplo, para la quinta clase de la tabla 1, la marca de clase o punto medio sería:
Distribuciones de frecuencias acumuladas

Se conoce como frecuencia acumulada (Fi), la suma de las frecuencias menores que el
límite real superior de la clase de un intervalo de clase. También podemos decir que es
la suma de todas las fi hasta el intervalo requerido. Por ejemplo, la frecuencia acumulada
hasta el intervalo de clase 170-179 de la tabla 1 es: 8+15+46+22 = 91.

Una tabla que represente estas frecuencias acumuladas se llama distribución de


frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente distribución
acumulada. Es importante mencionar que el proceso de acumulación puede basarse en
“o más” o “menor que”, todo dependerá de lo requerido.

Distribución de frecuencias relativas

La frecuencia relativa (fr) se determina dividiendo cada frecuencia absoluta por el número
de datos. Por ejemplo, en la tabla 1, la frecuencia absoluta de la tercera clase es 46. Este
valor se lo divide por el número de datos, que en este caso es 100, dándonos como
resultado 0.46, que es la frecuencia relativa.

Es importante mencionar que la suma de estas frecuencias siempre dará 1, o también


expresado en porcentaje la suma será del 100 %.

Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las


correspondientes frecuencias relativas, la tabla resultante se llama distribución de
frecuencias relativas, distribución porcentual o tabla de frecuencias relativas.

Distribución de frecuencias relativas acumuladas

Una distribución de frecuencias relativas acumuladas (H i) es la división de cada una de


las frecuencias acumuladas por el total de datos. Por ejemplo, en la tabla 1 la frecuencia
acumulada de la cuarta clase es 91, esto dividido por el número de datos que es 100 nos
da 0.0091, dato que nos indica frecuencia relativa acumulada.

El proceso de acumulación, igual que en las distribuciones de frecuencia, también se


basa en un principio “o más” o “menor que”.

Ejemplo 1

La siguiente tabla representa la distribución de frecuencias para los gastos semanales


de 80 trabajadoras de una compañía de fabricación de pantalones en la ciudad de
Ambato.
Tarea

Elaborar una tabla de frecuencias acumuladas, frecuencias relativas y relativas


acumuladas. Adicionalmente, incluir el valor de la marca de clase.

Desarrollo

Utilizando los conceptos revisados, calculamos lo solicitado (se puede hacer


manualmente o utilizando una hoja de cálculo, en la cual hay que tener en cuenta la
codificación de las fórmulas en cada celda):
Ejemplo 2

La siguiente tabla representa la distribución de frecuencias para los valores pagados por
horas extras de 70 trabajadores del Área de Limpieza de la Universidad Internacional.

Tarea

Elaborar una tabla de frecuencias acumuladas con criterio “menor que” y “o más”.

Desarrollo

Utilizando los contenidos estudiados, se sabe que se debe tomar en cuenta el límite
inferior de cada intervalo de clase.

1. Criterio “menor que”


2. Criterio “o más”

La tabla de contingencia es una tabla que nos da el número de las observaciones en


diferentes variables; es decir, tenemos varias variables con varias categorías a la vez.
Con esto podemos determinar si dos características están relacionadas y de qué manera
lo están.

La tabla 2 muestra una tabla de contingencia en donde se evalúan dos variables: sexo y
voto de 92 electores seleccionados de manera aleatoria.

Tabla 2

Sexo y voto de 92 electores


2.3. Gráficos estadísticos
Las visualizaciones gráficas son una manera muy práctica de describir un conjunto de
datos, mediante las cuales se puede adquirir enseguida una comprensión suficiente de
los mismos. Entre estas podemos mencionar: gráfico circular, gráfico de barras,
histograma, polígono de frecuencia y ojivas.

Gráfico circular

Presenta los datos en forma de círculo o tarta y de ahí que se lo llama también gráfico
de pastel. El círculo que lo describe se encuentra dividido en segmentos en donde cada
área de cada uno de los segmentos es proporcional al número de casos en esa categoría.
De manera general, se usan porcentajes para cada categoría. Una muestra de cómo se
ve el gráfico de pastel se presenta en la figura 1.

Gráfico de barras

Otra manera de representar los datos es mediante el llamando gráfico de barras, que
consiste en exhibir los datos mediante un número de rectángulos, del mismo ancho, en
donde cada uno de ellos representa una categoría particular. La longitud (y por lo tanto el
área) de cada rectángulo es proporcional al número de casos en la categoría que
representa. Se usa de manera general para datos cualitativos. Una muestra de cómo se ve
el gráfico de barras se presenta en la figura 2.
Histograma

Es un método útil y muy corriente de visualizar datos. Las clases de una distribución de
frecuencias están en el eje horizontal y las frecuencias en el eje vertical. Representa los
datos de manera similar que el diagrama de barras, es decir, que el área de cada barra
rectangular es proporcional a la frecuencia de la clase. Se usa para datos cuantitativos.

Una muestra de cómo se ve el histograma se presenta en los figuras 3 y 4.

Polígono de frecuencias

Es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse uniendo los
puntos medios de los techos de los rectángulos en el histograma.

Una muestra de cómo se ve el polígono de frecuencias se presenta en las figuras 5 y 6.


Ojivas

Es un gráfico de línea que representa frecuencias acumuladas. En el eje horizontal se


muestra el límite superior de cada clase.

Una muestra de cómo se ve las ojivas se presenta en las figuras 7 y 8.


2.4. Medidas descriptivas
Es importante saber que los datos recolectados para un estudio estadístico no son
generalmente constantes. Es necesario ver una medida que nos indique la variabilidad
de estos datos y nos dé una referencia sobre alrededor de qué valor fluctúan. Por otro
lado, también es necesario conocer la simetría y la forma en la que los datos tienden a
agruparse.

Las medidas que permite esto son las llamadas medidas descriptivas y usualmente se
encuadran en los siguientes tipos:

 Medidas de posición (o de tendencia central)


 Medidas de dispersión
 Medidas de simetría (sesgo)
 Medidas de forma (curtosis)

 Los estadísticos de ubicación o de tendencia central (también llamados


promedios) proporcionan una estimación de la puntuación típica, común o normal
encontrada en una distribución de puntuaciones en bruto.
 Es muy importante que a más de saber calcular las medidas de tendencia central,
se pueda dar una interpretación correcta de la información que estas
proporcionan.
 Una primera medida es la media poblacional, que es la suma de todos los
valores observados en la población dividido por el número de datos en la
población. La media muestral es la suma de todos los valores de la muestra
dividido por el número de datos en la muestra.
 Una de las propiedades de la media aritmética que se destaca es que es única y
que su cálculo incluye todos los datos de la muestra. Es por esto que es la medida
de tendencia central más utilizada; sin embargo, el valor de la media aritmética se
ve afectado por la presencia de uno o más valores sumamente grandes o
pequeños (valores extremos). En tales casos, la medida de tendencia central más
representativa es la mediana. La media ponderada es un caso especial de la
media aritmética.
 Otra medida de tendencia central que es utilizada es la media geométrica, que
resulta útil para determinar el promedio de porcentajes, razones, índices o tasas
de crecimiento. La media geométrica es la raíz enésima del producto de n datos.
 La mediana es el punto medio de los valores una vez que se han ordenado de
menor a mayor. Si el número de datos es par, la mediana es la media aritmética
de los dos valores centrales. Si el número de datos es impar, la mediana es el
único dato central.
 Las principales propiedades de la mediana son que no es influida por la presencia
de valores extremos y que es calculable en el caso de datos de nivel ordinal o más
altos.
 La moda es el dato que aparece con mayor frecuencia. En una distribución puede
haber una o más modas o no haber ninguna. La moda puede determinarse para
todos los niveles de datos y tiene la ventaja de que no influyen en ella los valores
extremos; sin embargo, se usa menos que la media o la mediana, ya que en
muchos casos no hay moda o hay más de una.
 Si Media = Mediana = Moda, la distribución es simétrica. Si Media > Mediana >
Moda, la distribución no es simétrica y tiene sesgo positivo. Si Moda > Mediana
>Media, la distribución no es simétrica y tiene sesgo negativo.
 Ejemplo
 Con los siguientes datos: 8, 2, 3, 5, 4, 2, 6, 3, 1, 3, 13, 4, calcular la media
aritmética, la media geométrica, la mediana y la moda. Indicar, además, si hay un
valor extremo y cuál es el tipo de sesgo de la distribución.

1) Media aritmética

2) Media geométrica

3) Mediana. Para determinar la mediana, ordenar los datos: 1,2,2,3,3,3,4,4,5,6,8,13.

Como n = 12 es par, la mediana es la media de las dos puntuaciones centrales, es decir


Mediana = (3+4)/2 = 3.5

4) Moda = 3 (el valor con la frecuencia mayor)

5) Valor extremo: 13 (claramente separado de los demás valores)

6) Tipo de sesgo: Media > Mediana > Moda sesgo positivo o a la derecha

Para datos agrupados en una distribución de frecuencias, en el cálculo de la media


aritmética intervienen el producto de la frecuencia y el punto medio de cada intervalo de
clase.

Las ecuaciones que se utilizarán para este tipo de datos serán:

Media aritmética

Donde: X = punto medio o marca de clase

f = frecuencia
Mediana

Donde:

Ln = límite inferior de la clase de la mediana.

Fa = frecuencia acumulada de la clase anterior a la clase de la mediana.

fn =frecuencia de la clase que contiene a la mediana.

Moda

Se la puede aproximar por el punto medio de la clase modal.

Un valor más preciso se obtiene aplicando la siguiente fórmula:

Donde:

Lmo= límite inferior de la clase modal.

d1= (frecuencia de la clase modal) – (frecuencia de la clase que le antecede).

d 2= (frecuencia de la clase modal) - (frecuencia de la clase que le sigue).

w = es el ancho del intervalo de clase.

Una medida de ubicación, como la media o la mediana, solo describe el centro de los
datos pero no dice nada sobre la dispersión de los datos. Por eso son necesarias las
medidas de dispersión.

Una medida de dispersión pequeña indica que los datos se acumulan con proximidad
alrededor de la media aritmética, mientras que una medida de dispersión grande indica
que hay uno o varios datos alejados de la media aritmética.

El rango es la medida de dispersión más simple. Es la diferencia entre el valor máximo


y el valor mínimo de un conjunto de datos. Es muy fácil de calcular y entender, sin
embargo, es una medida de dispersión que da una información limitada ya que solo toma
en cuenta dos valores (el máximo y el mínimo) de la distribución.
La varianza es la media aritmética de las desviaciones de la media elevadas al
cuadrado. La desviación estándar es la raíz cuadrada de la varianza. Podemos hablar
de una varianza poblacional y de una varianza muestral.

La diferencia principal es que en la varianza poblacional, el numerador se divide por N


(tamaño de poblacional) y en la varianza muestral por n-1 (donde n es el tamaño
muestral) ya que se debe compensar el hecho de que la distribución muestral tiene menor
dispersión que la distribución poblacional.

Ejemplo

Calcular la desviación estándar de los siguientes datos considerando que son datos: a)
de una población y b) de una muestra.

4 5 8 7 9 6
La desviación estándar es una medida de dispersión más adecuada que el rango ya que
en su cálculo entran todos los datos. Esta medida se utiliza normalmente para comparar
la dispersión de dos o más conjuntos de datos.

Para datos agrupados en una distribución de frecuencias, la desviación estándar toma


en cuenta también la frecuencia de cada clase, como se muestra en las ecuaciones a
continuación:

Amplitud de variación o rango

AV = límite superior de la clase más alta – límite inferior de la clase más baja

Desviación estándar
Cuartiles, deciles y centiles

Para calcular la posición de un cuartil, decil o percentil se usa la fórmula:

Una vez calculada la posición del percentil, proceda a calcular el percentil conforme se
explica en los ejemplos 1 y 2. (No confunda la posición del centil o percentil con su valor).

Ejemplo

Para la posición del primer cuartil Q1 use C = 25, para el tercer cuartil Q3 use C = 75. (Q1 =
C25; Q3 = C75), en algunos textos en vez de C se usa P, así P25

Para calcular la posición de un decil, por ejemplo, D3 use C = 30; para el decil 7 D7 use. C
= 70

Si Lc es entero el centil es el dato de la posición Lc

Si Lc no es entero, por ejemplo, si L25 = 7.62, el centil o percentil 25 se encontrará a 0.62 de


la distancia entre el séptimo y el octavo dato. Su valor se calcula del siguiente modo:

C25 = Q1 = Dato7 + 0.62(Dato8 – Dato7)

En el cálculo de los cuartiles, recuerde por ejemplo que el primer cuartil Q1 es aquel valor
que es mayor o igual que el 25 % de los datos y menor o igual que el 75 % de ellos.

Ejemplo

Calcular el primer y tercer cuartiles de los siguientes datos:

8.4 8.8 9.2 10 11.3 12.5 12.9 13.6 14 15

Solución

En este caso: n = 10, para Q1 C = 25 y para Q3 C = 75


Aparte de las medidas de tendencia central y de dispersión, otra característica de un
conjunto de datos es la forma. Hay cuatro formas: simétrica, con sesgo positivo, con
sesgo negativo y bimodal.

En un conjunto simétrico media, mediana y moda son iguales y los valores de los datos
se dispersan uniformemente en torno a estos valores. Un conjunto de valores se
encuentra sesgado a la derecha o positivamente sesgado si existe un solo pico y los
valores se extienden mucho más allá a la derecha del pico que a la izquierda de este.

En una distribución sesgada a la izquierda o negativamente sesgada existe un solo pico


pero las observaciones se extienden más a la izquierda, en dirección negativa (figura 1).

La medida más sencilla para calcular el sesgo es el coeficiente de sesgo de Pearson, que se
puede calcular con dos fórmulas distintas. La primera basada en la media, mediana y
distribución estándar de una distribución, la cual se puede obtener mediante programas
estadísticos.
La curtosis mide cuán puntiaguda es una distribución, en general en referencia a la
distribución normal. Si tiene un pico alto, se dice leptocúrtica mientras que si es aplastada se
dice platicúrtica. La distribución normal, que no es ni muy puntiaguda ni muy aplastada, se
llama mesocúrtica. El coeficiente de curtosis se calcula con la fórmula siguiente:

Si el coeficiente es mayor a 3, la forma es leptocúrtica. Si es igual a 3, la forma es mesocúrtica


y si es menor a 3, la forma es platicúrtica (figura 2).
La curva es platicúrtica.

Otra manera de visualizar la simetría es utilizando el llamado diagrama de caja.

El diagrama de caja permite visualizar la simetría o la asimetría de una distribución de


datos.

Para construir un diagrama de caja se requieren cinco valores: La media, la mediana, el


dato menor o mínimo, el dato mayor o máximo y el primero y tercer cuartiles.

Rango intercuartílico

Es la diferencia entre el tercer y el primer cuartil.

Rango intercuartílico = Q3 - Q1

Ejemplo

Suponga que en el servicio de entrega a domicilio de cierta pizza, el tiempo mínimo de


entrega es de 15 minutos, que el tiempo máximo es de 40 minutos, que la mediana es
25 minutos y que los cuartiles son: Q1 = 20 Q3 = 32.5 minutos.

a) Calcular el rango intercuartílico.

b) Trazar el diagrama de caja y sobre la base de este, indique si la distribución de los


datos es o no simétrica.

Solución

a) Rango intercuartílico = 32.5 – 20 = 12.5

b) El diagrama de caja es el que se muestra a continuación:

El diagrama muestra que:

1. El bigote izquierdo es más corto que el derecho.

2. Que Q1 está más cerca de la mediana que Q3

Comentario
Se observa que la cola o el bigote de la derecha es más largo que el de la izquierda, y
también la distancia entre la mediana y Q3 es mayor que la distancia entre Q1 y la
mediana, lo que indica que la distribución de los datos es asimétrica, con sesgo positivo.

Las líneas que van desde el mínimo a Q1 y desde Q3 al máximo se denominan bigotes.

3.1. Teoría de probabilidades


En la naturaleza y en la vida cotidiana se presentan fenómenos cuyo resultado se lo da
anticipadamente a través de la aplicación de leyes o fórmulas, sin embargo, existen otros
cuyo resultado no puede ser anticipado con certeza, sino que existe una probabilidad de
que un cierto resultado se dé. Para dar una explicación matemática a aquellos resultados
que podrían aparecer, se desarrolló lo que se llama teoría de la probabilidad.

En general, la probabilidad es la posibilidad de que algo pase; es decir, una probabilidad


provee una descripción cuantitativa de la posibilidad de ocurrencia de un evento
particular y se puede pensar que es su frecuencia relativa en una serie larga de
repeticiones de una prueba, en la que uno de los resultados es el evento de interés.

Para una mejor comprensión, se utilizan ciertas definiciones generales.

a) Experimento

Es un proceso que genera un conjunto de datos, ya sean estos cualitativos o


cuantitativos. En su mayoría, los resultados dependen del azar, siendo imposible
pronosticar con exactitud.

Ejemplos

 Registrar el tiempo de los competidores en una carrera.


 Medir los cambios en la bolsa de valores.
 Lanzar un dado.

b) Evento

Son todos los resultados posibles de un experimento u otra situación que genere
incertidumbre. Podemos clasificar los eventos en dos tipos:

 Los elementales (aquellos que constan de un solo resultado).


 Los compuestos (que consisten en dos o más resultados).

Ejemplo

Al lanzar un dado, el evento “sale uno” es un evento elemental porque es un único evento
posible; mientras que el evento “sale impar” es un evento compuesto porque está
formado de los eventos elementales “sale uno”, “sale tres” y “sale cinco”.
Debemos indicar que dos eventos son mutuamente excluyentes si cuando ocurre un
evento los otros no pueden ocurrir y viceversa. Por ejemplo, al lanzar una moneda al
aire, si cae y “sale cruz” ya no puede darse el evento “sale cara”.

c) Espacio muestral

Es el conjunto de todos los resultados posibles de un experimento, se le identifica con el


simbolo Ω.

Ejemplos

En el experimento: lanzar la moneda, el espacio muestral sería: evento “cae cruz” y


evento “cae cara”.

En el experimento, registre el tipo de sangre de una persona, el espacio muestral está


formado por cuatro eventos, que son mutuamente excluyentes: “sangre tipo A”, “sangre
tipo B”, “sangre tipo AB”, “sangre tipo O”.

Existen tres maneras básicas de estudiar la probabilidad, sin embargo, representan


planteamientos conceptuales para el estudio de la teoría de probabilidades generando
que los expertos no logren ponerse de acuerdo en el más apropiado. Estos son:

a) El planteamiento clásico

Supóngase un suceso E, que de un total de n casos posibles, todos igualmente


posibles, puede presentarse en h de los casos. Entonces la probabilidad de aparición
del suceso (es decir la probabilidad de ocurrencia) viene dada por:

La probabilidad de NO aparición del suceso (llamada no ocurrencia del suceso) viene


dada por:

b) El planteamiento como frecuencia relativa

La definición anterior de probabilidad tiene el inconveniente de que las palabras


“igualmente posibles” son poco concretas generando el efecto circular porque se define
a la probabilidad en términos de ella misma. Se ha generado, entonces, una definición
con mucho más rigor en donde la probabilidad empírica de un suceso se toma como
la frecuencia relativa de la aparición del suceso, cuando el número de observaciones
es muy grande. La probabilidad por sí misma es el límite de la frecuencia relativa cuando
el número de observaciones crece indefinidamente.

A pesar de ser práctica, esta definición tiene problemas desde el punto de vista
matemático, ya que no puede existir un número límite generándose una moderna teoría
de probabilidades en donde la probabilidad es un concepto no definido como ocurre con
el punto y la línea en geometría.

c) El planteamiento subjetivo

Está basado en las creencias de las personas que efectúan la estimación de la


probabilidad definiéndose como la probabilidad asignada a un evento por parte de un
individuo, basada en la evidencia que tenga disponible.

Las asignaciones de probabilidades subjetivas se dan con más frecuencia cuando los
eventos se presentan una sola vez o un número muy reducido de veces.

Ejemplo de probabilidad clásica

Si se lanza al aire una moneda equilibrada, ¿cuál será la probabilidad de que se obtenga
una cruz o cara?

a) Cruz es: P(cruz) = 1/2 porque 1 de las 2 alternativas.

b) Cara es: P(cara) = 1/2 porque 1 de las 2 alternativas.

Ejemplo de probabilidad empírica

Suponga que en un experimento se realizan 1000 ensayos y se produjo un evento E en


200 ocasiones. ¿Cuál es la probabilidad de que en un ensayo cualquiera se produzca el
evento E?

R: P(E) =200/1000 = 1/5 = 0.20

PROBABILIDAD Y TEORIA DE CONJUNTOS


El estudio de las reglas de probabilidad está estrechamente relacionado con la teoría de
conjuntos, para ello se asimila un evento con un conjunto.
En conjuntos En probabilidades

U = Conjunto universo S ó Ω = Espacio muestral

A = Subconjunto de U E = Evento

Φ = Conjunto vacío Φ = Evento nulo

Ā = Complemento de A Ē = Evento contrario de E

Ā=U-A⇒U=A∪Ā

Axiomas de Kolmogorov

1. P(E) ≥ 0 La probabilidad de un evento es un número comprendido entre 0 y 1.


2. P(S) = 1 La probabilidad del espacio muestral es 1.
3. P(E1 o E2 o …o En) = P(E1) + P(E2)+… +P(En) donde E1, E2,,… son eventos
mutuamente excluyentes.

Propiedades de las probabilidades


REGLAS DE POSIBILIDAD

Regla especial de adición

Se aplica cuando los eventos son mutuamente excluyentes o disjuntos.

Para un par de eventos A, B: P(A o B) = P(A) + P(B)

Para tres eventos A, B, C : P(A o B o C) = P(A) + P(B) + P(C)

En el ejemplo de las 3 bolas rojas, 2 blancas y 5 azules, calcular la probabilidad de que


al sacar una bola de la urna esta sea:

a) Roja o blanca: P(roja o blanca) = P(roja) +P(blanca) = 3/10 + 2/10 = ½

b) Blanca o azul: P(blanca o azul) =P(blanca) + P(azul) = 2/10 + 5/10 = 7/10

Regla general de la adición

Se aplica para calcular la probabilidad de ocurrencia de uno u otro evento que no sean
mutuamente excluyentes (la fórmula es válida también para eventos mutuamente
excluyentes dado que P(A y B) = 0).

Para los eventos A, B: P(A o B) = P(A) + P(B) – P(A y B)

Ejemplo

Un estudiante está tomando Álgebra y Castellano, si la probabilidad de que apruebe


Álgebra es 0.75, la de que apruebe Castellano es 0.90 y la probabilidad de que
apruebe Álgebra y Castellano es 0.70, se pregunta: ¿cuál es la probabilidad de que
apruebe Álgebra o Castellano?

P(A o C) = P(A) + P(C) – P(A y C)

= 0.75 + 0.90 - 0.70 = 0.95

Para resolver estos problemas debe realizar un diagrama de Venn como el de la


figura:

Regla especial de la multiplicación

Se aplica para calcular la probabilidad conjunta de ocurrencia de eventos


independientes.
Para dos eventos A y B: P(A y B) = P(A) P(B)

Para tres eventos A, B y C: P(A y B y C) = P(A) P(B) P(C)

Ejemplo

Se lanza un dado por dos ocasiones, ¿cuál es la probabilidad de que en los dos
lanzamientos caiga en 3?

P(3, 3) = P(3) P(3) = (1/6) (1/6) = 1/36

Obsérvese que el resultado del segundo lanzamiento es independiente del primero.

Probabilidad condicional

Es la probabilidad de que ocurra un evento B, dado que ya ocurrió un evento A, o


también la probabilidad de que ocurra un evento A dado que ya ocurrió el evento B.
Esto se escribe:

Si se cumple que los eventos o sucesos A y B son estadísticamente independientes.

Regla general de la multiplicación

Se aplica para calcular la probabilidad conjunta de eventos dependientes, es decir,


cuando la ocurrencia de uno de ellos está condicionada a la ocurrencia del
otro.

P(A y B) = P(A) P(B/A) o también P(A y B) = P(B) P(A/B)

Estas fórmulas y las de la probabilidad condicional están relacionadas, ya que las unas
se obtienen de las otras mediante despejes.

Tomemos el ejemplo de las 3 bolas rojas, 2 blancas y 5 azules y supongamos que se


desea calcular la probabilidad de que al sacar una bola y luego otra, la primera sea roja
y la segunda blanca:

Obsérvese que la probabilidad de que la primera vez salga roja es 3 /10, pero al haber
sacado una roja ahora nos quedan en total 9 bolas, de las cuales 2 son blancas.
Calculemos ahora la probabilidad de sacar una bola roja y una azul:

Como no se indica el orden tendremos que:

Tabla de contingencia o matriz de probabilidad

Los problemas de probabilidades se resuelven fácilmente usando una tabla de


contingencia o matriz de probabilidad, en ella se pueden leer las probabilidades a priori
y las probabilidades conjuntas o de intersección. Además permite calcular fácilmente
las probabilidades de la unión de eventos y las condicionales, tal como se ilustra a
continuación.

Ejemplo

El personal que labora en una empresa está formado por hombres y mujeres que
trabajan en las siguientes secciones: Gerencia, Profesional y Técnica, cuyos datos se
resumen en la siguiente tabla:

Tarea

Complete esta tabla de contingencia y luego suponiendo que se elige al azar un


empleado calcule las siguientes probabilidades.

a) La probabilidad de que sea mujer.

b) La probabilidad de que sea hombre y trabaje en la sección técnica.

c) La probabilidad de que trabaje en Gerencia o en la sección profesional.

d) La probabilidad de que trabaje en gerencia, dado que sea mujer.

e) La probabilidad de que sea hombre dado que trabaje en la sección técnica.

Solución
A la tabla de los datos le añadimos una fila y una columna para los totales parciales de
las filas y de las columnas. En la celda del extremo inferior derecho se coloca el total
horizontal y el vertical.

a) P(Mujer) = 54/136

b) P(Hombre y técnica) = 50/136

c) P (Gerencia o profesional) = P(Gerencia) + P(Profesional) = 11/136 + 40/136 =


51/136

d) P(Gerencia/ mujer) = 3/54 En la columna Mujer vemos que 3 de las 54 trabajan en


gerencia. También se puede aplicar la fórmula de la probabilidad condicional.

e) P(Hombre/ técnica) = 50/85 En la fila Técnica se ve que 50 de los 85 técnicos son


hombres.

Aplicando la fórmula:
TEOREMA DE BAYES

Entonces la probabilidad de que ocurra B viene dada por:

Esta es la probabilidad total de que ocurra B.

De la probabilidad condicional sabemos que:

Si ahora suponemos que P(A1) es una probabilidad a priori, P(B/A1) es la probabilidad


condicional de que ocurra B dado que ocurrió A1; y pensemos que se quiere calcular la
probabilidad a posteriori de que ocurra A1 dado que ocurrió B, simplemente despejemos
P(A1/B); según la fórmula anterior.
Un diagrama de árbol es una herramienta que se utiliza para determinar todos los
posibles resultados de un experimento aleatorio (su uso es más característico en el
Teorema de Bayes).

El diagrama de árbol es una representación gráfica de los posibles resultados del


experimento, el cual consta de una serie de pasos, donde cada uno de estos tiene un
número finito de maneras de ser llevado a cabo.

Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada
una de las posibilidades, acompañada de su probabilidad. Cada una de estas ramas se
conoce como rama de primera generación.

En el final de cada rama de primera generación se constituye a su vez, un nudo del cual
parten nuevas ramas conocidas como ramas de segunda generación, según las
posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final).

Hay que tener en cuenta que la construcción de un árbol no depende de tener el mismo
número de ramas de segunda generación que salen de cada rama de primera generación
y que la suma de probabilidades de las ramas de cada nudo ha de ser DVD x h.

Existe un principio sencillo de los diagramas de árbol que hace que estos sean mucho
más útiles para los cálculos rápidos de probabilidad: multiplicamos las probabilidades si
se trata de ramas adyacentes (contiguas).

Ejemplos

Una universidad está formada por tres facultades:

 La 1.ª con el 50 % de estudiantes.


 La 2.ª con el 25 % de estudiantes.
 La 3. ª con el 25 % de estudiantes.

Las mujeres están repartidas uniformemente, siendo un 60 % del total en cada facultad.
3.2. Técnicas de conteo
Las técnicas de conteo son aquellas que son usadas para enumerar eventos difíciles de
cuantificar. Son utilizadas de manera común en probabilidades.

1. Fórmula de la multiplicación

Si hay m formas de realizar una cosa y n formas de hacer otra, habrán mxn formas de
realizar ambas en conjunto. Esta regla se extiende a 3, 4 o más acciones.

Ejemplo

Un joven tiene 3 pares de zapatos, 4 pantalones y 5 camisas. ¿De cuántas maneras


puede vestirse?

N = 3x4x5 = 60 (puede vestirse de 60 formas).

Ejemplo

¿De cuántas maneras puede usted colocar cuatro libros en un estante?

El libro que va a colocar en primer lugar puede elegir de cuatro maneras, le quedan tres
libros, entonces el que va a colocar en la segunda posición puede elegirse de tres
maneras; le quedan dos para la tercera posición; y una vez colocado el tercero le queda
uno para la cuarta posición; es decir: n.° de formas = 4x3x2x1 = 24 = 4!.

2. Permutaciones
Nos da el número de arreglos de r objetos tomados de un grupo de n objetos. Un arreglo
se diferenciará de otro por el orden de sus elementos, por ejemplo ab y ba son diferentes.

Ejemplo

Cuántos números de dos cifras se pueden escribir usando los dígitos 1, 2 y 3 bajo la
condición de que no haya dígitos repetidos.

Los números de dos cifras construidos con los dígitos 1, 2 y 3 son efectivamente 6, tal
como usted puede ver: 12 13 21 23 31 32

3. Combinaciones

Las combinaciones son arreglos de r objetos tomados de un grupo de n objetos, donde


no importa el orden de ellos.

Ejemplo

Con los dígitos 1, 2 y 3, cuántas sumas diferentes se pueden tener, tomando dos a dos,
bajo la condición de que no haya dígitos repetidos.

Observe que en este caso no importa el orden porque, por ejemplo, las sumas 1+2 y 2+1
son las mismas, entonces el número de sumas distintas son:
Tema 1: Definiciones básicas -

 Definiciones básicas
o 1.1. Elementos básicos de la estadística
o 1.2. Niveles o escalas de medición de las variables
o 1.3. Importancia del muestreo

Autoevaluación
1. Se entiende por población:

Al conjunto de elementos que contiene una o más características observables.

Opción correcta

2. Un parámetro es:

Una característica de la población que se analiza.

Opción correcta

3. Una variable es:

Característica definida en la población por la tarea o investigación estadística.

Opción correcta

4. Las variables pueden ser:

Cuantitativas y cualitativas.

Opción correcta

5. Las variables cuantitativas se clasifican en:

Continuas y discretas.

Opción correcta

6. Una medición es ordinal cuando:

Son nombres donde los valores se pueden ordenar ya sea en forma ascendente o
descendente.
Opción correcta

7. Son mediciones de intervalos cuando:

Se trata de medidas arbitrarias para definir un proceso.

Opción correcta

8. La escala de medición de una variable es:

Instrumento de medida, con el que se asigna valores a las unidades estadísticas.

Opción correcta

9. Una muestra es:

Porción representativa de un conjunto grande de colecciones.

Opción correcta

10. El muestreo es importante porque:

Por lo general no se pueden estudiar a las poblaciones en su totalidad, entonces


estaremos obligados a hacer el muestreo.
Tema 2: Estadística descriptiva: Distribución -
100
 Estadística descriptiva: Distribución de frecuencia y medidas descriptivas
o 2.1. Fuentes de información
o 2.2. Distribuciones de frecuencia
o 2.3. Gráficos estadísticos
o 2.4. Medidas descriptivas
o

1. Las técnicas de recolección de datos son las_____________ con las que se cuenta
para _____________, son los procedimientos especiales utilizados para obtener y
evaluar las evidencias necesarias.

Herramientas/la recolección de datos.

2. Una característica de un cuestionario es:

Ordenado.

3. Son técnicas de recolección de datos:

Verbales, oculares, documentales.

4. Una técnica de recolección es la ocular, que consiste en:

Obtener la información verificando visualmente en forma directa.

5. Cuál de las siguientes opciones no es un tipo de encuesta.

Inferencial.

6. Cuál de las siguientes opciones es una característica de un cuestionario.

Preciso y claro en las preguntas.

7. Los tipos de pregunta que pueden realizarse en un cuestionario son: _______, de


profundización, _________ o de control.

Abierta/parcialmente estructurada.
8. Un cuestionario debe ser: interesante, sencillo de entender, ____________,
ordenado, ___________ y debe terne espacio suficiente para las respuestas.

Preciso y claro en las preguntas/ tener un vocabulario adecuado.

9. Qué es la distribución de frecuencias.

Una herramienta con la cual podemos resumir, mediante una tabla, numerosos
datos de tal manera que se ponga de manifiesto la localización y la dispersión de las
observaciones.

10. Qué es la frecuencia absoluta.

El número de veces que aparece un determinado valor en un estudio estadístico.

11. Cómo se obtiene la frecuencia relativa.

Dividiendo la frecuencia absoluta para el número total de observaciones.

12. Un intervalo de clase es:

El recorrido de los valores que se encuentran dentro de una clase.

13. La marca de clase es:

Un valor que se obtiene sumando los límites superior e inferior dividiéndolo para
dos.

14. Las distribuciones de frecuencias acumuladas “menor que” u “o más” se utilizan


cuando:

Se quiere determinar el número de observaciones que son mayores o menores que


determinada cantidad.

15. Se presenta a continuación los pesos (en libras) de 40 estudiantes de la UDLA. Si


se construye una tabla de distribución de frecuencias entonces qué enunciado es
verdadero.

138 164 150 132 144 125 149 157

146 158 140 147 136 148 152 144

168 126 138 176 163 119 154 165

146 173 142 147 135 153 140 135

161 145 135 142 150 156 145 128


El rango de estos datos es 57 libras y el tamaño de cada uno si se utilizan cinco
intervalos es 11 aproximadamente.

16. La curtosis cuando tiene un pico alto se llama:

Leptocúrtica.

17. De manera general, los histogramas sirven para representar:

Variable aleatoria continua.

18. Qué se representa con las ojivas.

Frecuencias acumuladas.
Tema 3: Probabilidades y técnicas de conteo -
100
 Probabilidades y técnicas de conteo
o 3.1. Teoría de probabilidades
o 3.2. Técnicas de conteo

1. La probabilidad de extracción de una baraja de 52 cartas de: un rey, as, jota de


tréboles o reina de diamantes es:

5/26.

2. La probabilidad de que aparezca al menos una cara en tres lanzamientos de una


moneda es:

7/8.

3. Se extrae una bola al azar de una caja que contiene 10 rojas, 30 blancas, 20 azules
y 15 naranjas. La probabilidad de que sea no roja o azul es:.

3/5

4. Una caja contiene 9 papeletas numeradas del 1 al 9 inclusive. Si se extraen tres


papeletas sucesivamente, la probabilidad de que sean alternativamente impar, par,
impar o par, impar, par es:

5/18.

5. La probabilidad de conseguir un total de siete puntos una vez en dos lanzamientos


de dos dados es:

5/18.

6. La probabilidad de conseguir un total de siete puntos al menos una vez en dos


lanzamientos de dos dados es:

11/36.

7. Se extraen sucesivamente dos cartas de una baraja de 52. La probabilidad de que


la primera carta sea un as pero la segunda no es:

16/221.
8. Se extraen tres cartas de una baraja de 52. La probabilidad de que dos sean jotas y
una rey es:

6/5525.

9. La probabilidad de la aparición de un número impar en una tirada de un dado es:

1/2.

10. En una encuesta realizada por la American encontró que 60 % de sus socios
hicieron alguna reservación en una línea aérea el año pasado. Se toman dos
integrantes al azar. ¿Cuál es la probabilidad de que ambos hayan hecho una
reservación en alguna línea área?

0.36.

11. Hallar la probabilidad de que en tres lanzamientos aparezcan dos caras y un


sello.

3/8.

12. Hallar la probabilidad de que en una familia con cuatro hijos tenga al menos un
niño.

15/16.

13. La media de los pesos de 500 estudiantes de un cierto colegio es de 151 libras y
la desviación típica es de 15 libras. Suponiendo que los pesos se distribuyen
normalmente hallar cuántos estudiantes pesan entre 120 y 155 libras.

300.

14. Si las alturas de 300 estudiantes se distribuyen normalmente con media de 68


pulgadas y desviación típica de tres pulgadas, cuántos estudiantes tienen alturas
mayores a 72 pulgadas.

20.

15. Un 10 % de los utensilios producidos en un cierto proceso de fabricación resulta


ser defectuoso. La probabilidad de que de una muestra de diez utensilios elegidos al
azar sean exactamente dos los defectuosos mediante la aproximación de Poisson a
la binomial es:

0.184.
16. Si la probabilidad de que un individuo sufra una reacción por una inyección de un
determinado suero es de 0.001, la probabilidad de que de un total de 2000 individuos
exactamente tres tengan reacción (use la aproximación de Poisson a la binomial) es:

0.180.
Sistema Virtual de Educación [Evaluaciones] https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19...

Contenidos > Unidad > Evaluación

Primer Parcial
Evaluación en línea primer parcial

Evaluación en línea primer parcial


Puntaje total: 20.00
Puntaje de aprobación: 14.00
Incorrectas restan: No
Abierta: desde 03/07/2021 08:00 hasta 03/07/2021 21:30
Realización

Fecha: 03-jul-2021 14:19:15


Tiempo realización: 00:38:37 Aprobada - 16.25
Cantidad de veces realizada: 1
Cantidad de respuestas correctas: 13 / 16

Con 5 matemáticos y 7 físicos hay que formar un comité que conste de 2


matemáticos y 3 físicos. ¿De cuántas maneras se puede formar este comité si: hay
uno de los físicos que tiene que formar parte del comité?

150

Con 5 matemáticos y 7 físicos hay que formar un comité que conste de 2


matemáticos y 3 físicos. ¿De cuántas maneras se puede formar este comité si:
puede incluirse a cualquiera de los matemáticos y a cualquiera de los físicos?

1 de 6 3/7/2021 14:58
Sistema Virtual de Educación [Evaluaciones] https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19...

350

El enfoque de la probabilidad Objetivo se clasifica en:

Probabilidad clásica y empírica o frecuencia relativa

El nivel de medición ordinal es:

No es posible distinguir la magnitud de las diferencias entre los grupos (bueno,


malo) ni considerar que la una sea el doble de la otra.

2 de 6 3/7/2021 14:58
Sistema Virtual de Educación [Evaluaciones] https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19...

Marque solo la opción de las variables cualitativas:

Kilometraje de gasolina, temperatura de una persona y la clasificación de un


equipo.

El propósito de la estadística es:

Estudia los métodos científicos en forma secuencial: clasificar, recoger,


organizar y graficar los resultados para presentarlos en las diferentes reuniones
de directorio.

El proceso de recogida de datos es importante por:

3 de 6 3/7/2021 14:58
Sistema Virtual de Educación [Evaluaciones] https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19...

Debido a la obtención del conjunto de datos relevante el problema que se


estudia sea la parte más fácil (normar las unidades, definir el número de
decimales a utilizar, etc.), económica y rápida de toda la investigación.

Los tipos de fuente de datos es:

Los datos necesarios para elaborar un análisis estadístico o bien se encuentran


disponibles o deben recogerse. Los datos que se encuentran disponibles se
denominan datos secundarios y los datos que se deben recoger se llaman datos
primarios.

Defina una variable cuantitativa:

Es aquellas cuyos valores se pueden expresar en cantidades numéricas, como


medidas o recuentos.

Si p es el mayor de tres números consecutivos, entonces, el promedio de ellos es:

4 de 6 3/7/2021 14:58
Sistema Virtual de Educación [Evaluaciones] https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19...

p-1

El rango como medida de dispersión proporciona:

Información limitada por que se basa en solo dos medidas (el mayor y menor)
de las observaciones

Si el examen final de un curso cuenta tres veces más que una evaluación parcial, y un
estudiante tiene calificación 85 en el examen final y 70 y 90 los dos parciales la
calificación media es:

83

Otro nombre para estadística inferencial es estadística descriptiva

Falso

Un hospital emplea 200 personas en su cuerpo de enfermería. De ese personal, 50


son ayudantes de enfermera, 50 son enfermeras prácticas y 100 son enfermeras
registradas. Las primeras reciben un sueldo de $ 8 (dólares) por hora; las segundas,
uno de $ 10, y las últimas de $ 14. ¿Cuál es el valor medio ponderado del sueldo?

5 de 6 3/7/2021 14:58
Sistema Virtual de Educación [Evaluaciones] https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19...

11.5

Mutuamente excluyente significa:

El hecho de que un evento se presente significa que ninguno de los demás


eventos puede ocurrir al mismo tiempo.

La clasificación de una distribución por la Curtosis es:

Leptocúrtica, Platicúrtica, Mesocúrtica.

  Anterior

6 de 6 3/7/2021 14:58
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

Contenidos > Unidad > Evaluación

Primer Parcial
Evaluación en línea primer parcial

Evaluación en línea primer parcial


Puntaje total: 20.00
Puntaje de aprobación: 14.00
Incorrectas restan: No
Abierta: desde 03/07/2021 08:00 hasta 03/07/2021 21:30
Realización

Fecha: 03-jul-2021 17:13:29


Tiempo realización: 00:31:40 Aprobada - 17.50
Cantidad de veces realizada: 1
Cantidad de respuestas correctas: 14 / 16

El nivel de medición de intervalo es:

No es posible distinguir la magnitud de las diferencias entre los grupos (bueno,


malo) ni considerar que la una sea el doble de la otra.

La diferencia entre valores constituye una magnitud constante y el cero es un


punto mas de la escala no representa la ausencia del estado.

El punto cero tiene sentido ya que es ausencia del recurso y la razón entre dos
números es significativa (el peso de mi padre es el doble que el mío).

Las observaciones acerca de una variable cualitativa solo se clasifican y se


cuentan

El nivel de medición de razon es:

No es posible distinguir la magnitud de las diferencias entre los grupos (bueno,


malo) ni considerar que la una sea el doble de la otra.

La diferencia entre valores constituye una magnitud constante y el cero es un


punto mas de la escala no representa la ausencia del estado.

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19127&wAccion=verevaluacion 1/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

El punto cero tiene sentido ya que es ausencia del recurso y la razón entre dos
números es significativa (el peso de mi padre es el doble que el mío).

Las observaciones acerca de una variable cualitativa solo se clasifican y se


cuentan

En los siguientes casos indique cual literal tiene datos continuos:

Cantidad de acciones que se venden diariamente en la bolsa de valores, ingreso


anual de los profesores universitarios.

Temperatura registrada cada media hora en un observatorio, longitud de 100


pernos producidos en una fábrica.

Cantidad de acciones que se venden diariamente en la bolsa de valores,


longitud de 100 pernos producidos en una fábrica

Ingreso anual de los profesores universitarios, temperatura registrada cada


media hora en un observatorio

Existe una razón para realizar el muestreo de una población:

Los resultados de una muestra permiten calcular adecuadamente el valor del


parámetro poblacional, con lo cual se ahorra tiempo y dinero

Entrar en contacto con todos los miembros de la población consume


demasiado conflicto

Resulta imposible verificar y localizar todos los miembros de la muestra

El costo de estudiar a todos los elementos de la muestra resulta prohibitivo.

Marque solo la opción de las variables cualitativas:

Kilometraje de gasolina, temperatura de una persona y la clasificación de un


equipo.

Marca de la gasolina en el tablero, la clasificación de un trabajo de un


trabajador, la clasificación de un equipo de futbol

Kilometraje de gasolina, temperatura de una persona, la calificación de un


examen y el valor de desempeño de un trabajador

Marca de la gasolina en el tablero, la calificación de un examen y el valor de


desempeño de un trabajador

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19127&wAccion=verevaluacion 2/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

Fercuencia absoluta es:

Es el número de veces que aparece un determinado valor en un valor


estadístico. Se representa por fila. La suma de la frecuencia absoluta
(completa) es igual al número total de datos, que se representa por n. Para
indicar resumidamente estas sumas se utiliza la letra griega (sigma mayúscula)
que se lee sumatoria.

Es el cociente entre la frecuencia de un determinado valor y el número total de


datos. Se puede expresar en tantos por ciento y se representa por fr. La suma
de las frecuencias relativas es igual a 1. además es el cociente entre la
frecuencia y el tamaño de la muestra (n).

Es la suma de las frecuencias de todos los valores inferiores o iguales al valor


de la primera clase o considerado.

Es el dato que se encuentra demasiado alejado de las observaciones


homogéneas.

Especifique si cada una de las siguientes variables es cualitativa o cuantitativa: 1)


Cantidad de kilómetros por galón de gasolina;2) Marca de gasolina; 3) Temperatura
de una persona; 4) Calificación de un examen y 5) Color de ojos de las personas

Variable cuantitativa (1, 2,3); Variable cualitativa (4,5)

Variable cuantitativa (1, 3,4); Variable cualitativa (2,5)

Variable cuantitativa (1,2); Variable cualitativa (3, 4,5)

Variable cuantitativa (4,5); Variable cualitativa (1, 2,3)

¿Qué es una Distribución de frecuencias?

Son toda la información estadística en tablas para su análisis.

Son porcentajes que se calcular dividiendo la frecuencia real de cada clase


entre el número total de observaciones que se clasifican.

Muestran el número total de ocurrencias que son menores o mayores que


ciertos valores claves.

Agrupación de datos cualitativos en clases mutuamente excluyentes que


muestra el número de observaciones en cada clase.

En la ESPE los alumnos pasan el nivel de estadística con el promedio de 14/20


durante el semestre (tres periodos). Si Nelson tiene el primer periodo 13.7, el

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19127&wAccion=verevaluacion 3/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

segundo 12.25. ¿Qué nota debe sacar para pasar el nivel, exactamente sin
aproximar?

13.05

14.05

15.05

16.05

El promedio de los datos de la muestra: (x, x+1, x-1, 2x-1, 2x+1) es.

x/5

7x

7x/5

¿Qué sucede con la media aritmética, que contiene uno o dos valores muy grandes o
valores muy pequeños?

Es representativa

No es representativa

Es media ponderada

Es media poblacional

Cuando la distribución de las medidas de tendencia central se encuentra con sesgo


positivo; las medidas más representativas serán:

Media aritmética y mediana

mediana y la moda

Media aritmética y moda

Solo la media aritmética

La media de una distribución de probabilidad también recibe el nombre de:

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19127&wAccion=verevaluacion 4/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

Distribución aleatoria

Valor esperado

Medida de dispersión

Media aritmética

Los ingresos netos diarios de una muestra de industriales de acero en Quebec son
(en millones de dólares): $96.70, $67.10, $89.70, $96.70, $91.40, $96.70, $82.60.
¿Cuál es el ingreso neto modal?

ninguna

67.1

88.7

96.7

La grafica de pastel se la utiliza para:

Representar en forma gráfica un diagrama de barras múltiple del total de


observaciones, individuos o ítems.

Representar en forma gráfica en 360 grados, la parte o porcentaje de cada clase


del total de observaciones, individuos o ítems.

Representar en forma gráfica las frecuencias acumuladas de cada clase del


total de observaciones, individuos o ítems.

Representar en forma gráfica un pictograma.

Los pasos para construir una distribución de frecuencias en datos agrupados son:

Calcular la media aritmética, mediana y moda.

Calcular el número de clases, determinar el intervalo de clase, establecer los


límites de cada clase, colocar las observaciones en cada una de las clases.

Realizar el cálculo de la desviación estándar, colocar el intervalo de dispersión.

Obtenemos los datos, organizamos de menor a mayor, clasificamos los mismos


y representamos un histograma de frecuencias.

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19127&wAccion=verevaluacion 5/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

 
Anterior Siguiente
 

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926897&id_curso=19127&wAccion=verevaluacion 6/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

Contenidos > Unidad > Evaluación

Primer Parcial
Evaluación en línea primer parcial

Evaluación en línea primer parcial


Puntaje total: 20.00
Puntaje de aprobación: 14.00
Incorrectas restan: No
Abierta: desde 03/07/2021 08:00 hasta 03/07/2021 21:30
Realización

Fecha: 03-jul-2021 11:47:14


Tiempo realización: 00:41:43 Aprobada - 16.25
Cantidad de veces realizada: 1
Cantidad de respuestas correctas: 13 / 16

Que distribución de probabilidades se la conoce como Ley de eventos improbables.

Hipergeométrica

Poisson

Binomial

Exponencial

Que distribución de probabilidades se tiene que aplicarse esta consideración n/N


sea mayor a 5 porciento.

Hipergeométrica

Poisson

Binomial

Exponencial

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926893&id_curso=19126&wAccion=verevaluacion 1/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

El muestreo por conglomerados:

Se selecciona un punto aleatorio de inicio y posteriormente se elige cada K-


ésimo miembro de la población.

Una población se divide en sub grupos, denominados estratos, y se selecciona


al azar una muestra de cada estrato.

La población se divide a partir de los límites naturales geográficos o de otra


clase. Seguidamente se selecciona los conglomerados al azar y se toma una
muestra aleatoria con elementos de cada grupo.

Cuando se selecciona n elementos de una población, de manera que todas las


combinaciones posibles de n elementos de la población tienen igual
probabilidad de ser elegidas.

El muestreo aleatorio estratificado:

Se selecciona un punto aleatorio de inicio y posteriormente se elige cada K-


ésimo miembro de la población.

Una población se divide en sub grupos, denominados estratos, y se selecciona


al azar una muestra de cada estrato.

La población se divide a partir de los límites naturales geográficos o de otra


clase. Seguidamente se selecciona los conglomerados al azar y se toma una
muestra aleatoria con elementos de cada grupo.

Cuando se selecciona n elementos de una población, de manera que todas las


combinaciones posibles de n elementos de la población tienen igual
probabilidad de ser elegidas.

Un histograma de frecuencias y un polígono de frecuencias son representados en:

Datos no agrupados

Datos agrupados

Nivel de medición ordinal

Nivel de medición nominal

Índice de asimetría es:

Hace referencia al grado de apuntalamiento de una distribución

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926893&id_curso=19126&wAccion=verevaluacion 2/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

Es cuando la curva que la representa una distribución es exactamente igual a


ambos lados del punto de referencia

Es una distribución unimodal si los datos se concentran hacia los valores altos
de la variable

Es una distribución que hace referencia al grado en que los datos se reparten
por encima y por debajo de la tendencia central

Dato atípico es:

Es el número de veces que aparece un determinado valor en un valor


estadístico. Se representa por fila. La suma de la frecuencia absoluta
(completa) es igual al número total de datos, que se representa por n. Para
indicar resumidamente estas sumas se utiliza la letra griega (sigma mayúscula)
que se lee sumatoria.

Es el cociente entre la frecuencia absoluta de un determinado valor y el número


total de datos. Se puede expresar en tantos por ciento y se representa por fr. La
suma de las frecuencias relativas es igual a 1. además es el cociente entre la
frecuencia absoluta y el tamaño de la muestra (n).

Es la suma de las frecuencias de todos los valores inferiores o iguales al valor


de la primera clase o considerado.

Es el dato que se encuentra demasiado alejado de las observaciones


homogéneas.

El tipo de fuente de datos secundarios son:

Datos de la biblioteca

Datos disponibles de otros proyectos que ya se han compilado y están


disponibles para el análisis disponible

Datos que deben recogerse específicamente para el análisis deseado en el


campo, designando su nomenclatura, unidades y cantidad de decimales de
acuerdo a la precisión y exactitud del proyecto

Datos de indicadores anuales económicos

Defina que es una Muestra:

Una colección completa de personas, animales, plantas o cosas de las cuales


se desea recolectar datos.

Grupo de unidades seleccionadas de un grupo mayor (la población), que se


espera obtener conclusiones sobre la población.
https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926893&id_curso=19126&wAccion=verevaluacion 3/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

Son mediciones o valores obtenidos en un proyecto.

Son valores u observaciones que pertenecen a un sistema de simulación.

El histograma y el polígono de frecuencias nos permite visualizar:

Las medidas de tendencia central

Las medidas de posición

Donde tiende a acumularse los datos, los valores máximos y mínimos en forma
general

Las medidas de dispersión

¿Cuál es la diferencia entre un diagrama de barras y un histograma?

El diagrama de Barras se utiliza con frecuencia para datos de intervalos o de


razón y el histograma para datos con escala nominal y ordinal.

El diagrama de Barras se utiliza con frecuencia para datos nominales y


ordinales y el histograma para datos con escala de intervalos o de razón.

El diagrama de Barras se utiliza con frecuencia sola para datos de intervalos y


el histograma solo para datos ordinales.

El diagrama de Barras se utiliza con frecuencia solo para datos de razón y el


histograma solo para datos con escala nominal.

La grafica de pastel se la utiliza para:

Representar en forma gráfica un diagrama de barras múltiple del total de


observaciones, individuos o ítems.

Representar en forma gráfica en 360 grados, la parte o porcentaje de cada clase


del total de observaciones, individuos o ítems.

Representar en forma gráfica las frecuencias acumuladas de cada clase del


total de observaciones, individuos o ítems.

Representar en forma gráfica un pictograma.

Cinco oficinistas cobran $4.52, $5.28, $5.75, $5.96 y $11.20, de acuerdo a los datos
calcule la media aritmética, ¿Cuál de las dos es más representativa?

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926893&id_curso=19126&wAccion=verevaluacion 4/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

La media= $ 6.54; la mediana es la más representativa que la media aritmética.

La media= $ 6.54; la media aritmética es la más representativa que la mediana.

La media= $ 10.54; la media aritmética es la más representativa que la


mediana.

La media= $ 10.54; las dos medidas son representativas.

El conjunto de eventos es colectivamente exhaustivo cuando:

Por lo menos uno de los eventos debe ocurrir cuando se lleva a cabo un
experimento.

Proceso que induce a que ocurra una y sólo una de varias posibles
observaciones.

Parte del supuesto de que los resultados de un experimento son igualmente


posibles

El hecho de que un evento se presente significa que ninguno de los demás


eventos puede ocurrir al mismo tiempo.

Un hospital emplea 200 personas en su cuerpo de enfermería. De ese personal, 50


son ayudantes de enfermera, 50 son enfermeras prácticas y 100 son enfermeras
registradas. Las primeras reciben un sueldo de $ 8 (dólares) por hora; las segundas,
uno de $ 10, y las últimas de $ 14. ¿Cuál es el valor medio ponderado del sueldo?

11.5

66.67

1600

16

Diez medidas del diámetro de un cilindro fueron anotadas por un científico como
3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 4.03, 3.92, 3.98 y 4.06 centímetros. Hallar la media
aritmética de tales medidas.

4.03 cm

3.98 cm

3.93 cm

3.88 cm

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926893&id_curso=19126&wAccion=verevaluacion 5/6
3/7/2021 Sistema Virtual de Educación [Evaluaciones]

  Anterior Siguiente  

https://evirtual.espe.edu.ec/evaluaciones.cgi?id=7926893&id_curso=19126&wAccion=verevaluacion 6/6
13/3/2021 Test de autoevaluacion

Preguntas de tipo test

Tema 1:Introducción Tema 2: Estadísticos Tema 3: Regresión Tema 4: Probabilidad

Tema 5: Variable aleatoria Tema 6: Muestreo Tema 7: Contrastes de hipótesis Soluciones

Mostrar Lista Pregunta aleatoria

Preg. 1. Ref:1000
En una muestra de pacientes, el número de varones dividido entre el total de pacientes es:
a Una frecuencia relativa.
b Una frecuencia absoluta.
c Una variable cuantitativa.
d Una variable cualitativa.
e Un valor de la variable.

Preg. 2. Ref:2000
Cuál de las siguientes medidas define mejor la tendencia central de los datos: 5 , 4, 42, 4, 6
a La mediana.
b La media.
c El sesgo
d El rango.
e La proporción.

Preg. 3. Ref:4000
Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en
sangre de una serie de individuos, utilizamos
a Las desviaciones típicas.
b Los rangos.
c Los coeficientes de variación.
d La diferencia de las medias.
e La diferencia de las varianzas.

Preg. 4. Ref:5000
Si al calcular el coeficiente de correlación de dos variables X e Y, se tiene r=-0.20 ocurre que
a La pendiente de la recta de regresión es pequeña.
b La pendiente de la recta de regresión es grande.
c X e Y están poco relacionadas, aunque cuando X decrece, Y tiene tendencia a crecer.
El modelo lineal de regresión explica el 20% de la varianza de una variable cualquiera en
d
función de la otra.
El modelo lineal de regresión explica el 80% de la varianza de una variable cualquiera en
e
función de la otra.

Preg. 5. Ref:6000
La media aritmética de una variable cuantitativa:
a Es siempre un valor de la variable.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 1/31
13/3/2021 Test de autoevaluacion

b No tiene sentido calcularla para variables discretas.


c Es el valor más representativo de una modalidad.
d Si la variable es discreta, puede no ser única.
e Existe siempre.

Preg. 6. Ref:7000
Las siguientes medidas son todas de centralización, excepto:
a La media.
b La moda.
c La mediana.
d Rango intercuartílico.
e El percentil 50.

Preg. 7. Ref:26000
En un estudio descriptivo se obtiene una que el peso tiene una media de 60 kg y una desviación
típica de 20 kg., mientras que la media de las edades es 15 años, con una desviación típica de 5
años. Entonces:
a Hay más dispersión en pesos que en edades.
b Hay más dispersión en edades que en pesos.
c Peso y edad están dispersos de modo equivalente.
d No tiene sentido compararlos al no coincidir las unidades de medida.
e Para comparar ambas dispersiones debemos usar la covarianza.

Preg. 8. Ref:226160
Se realiza una auditoría de historias clínicas tomando una primeria historia al azar y después
sucesivamente, la que ocupa la vigésima posición detrás de la anterior. Este procedimiento de
muestreo se denomina:
a Por conglomerados.
b Sistemático.
c Correlativo.
d Consecutivo.
e Equidistante.

Preg. 9. Ref:226150
Se realiza un estudio con objeto de determinar el tiempo de supervivencia en pacientes con
cáncer. Para ello de los dos hospitales existentes en una ciudad, se selecciona aleatoriamente
uno de ellos, y se elige una muestra aleatoria de pacientes, atendiendo al tipo de cáncer: El
muestreo realizado es:
a Sistemático.
b Aleatorio.
c Por conglomerados.
d Estratificado.
e Por conglomerados y estratificado.

Preg. 10. Ref:226140


Para conocer los índices predictivos en un test diagnóstico para una enfermedad que tiene un 1%
de afectados en la población, será necesario conocer:

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 2/31
13/3/2021 Test de autoevaluacion

a Sensibilidad y verdaderos positivos


b Prevalencia.
c Verdaderos positivos y prevalencia.
d Especificidad y verdaderos negativos
e Falsos positivos y verdaderos positivos.

Preg. 11. Ref:35000


Si la probabilidad de tener la enfermedad A es del 5%, la de tener la enfermedad B es del 10% y
la de tener al menos una de las dos es del 13%, ¿cúal es la probabilidad de tener las dos?
a Cero
b 1%
c 2%
d 5%
e 8%

Preg. 12. Ref:36000


Qúe propiedad o propiedades caracterizan a una distribución normal tipificada frente a una
distribución normal cualquiera:
a El área bajo su función de densidad es igual a 1.
b Su media es 1 y su desviación típica es 0.
c Su rango de valores oscila entre 0 y 3.
d Su media es 0 y su desviación típica es 1.
e Son ciertas (c) y (d)

Preg. 13. Ref:37000


Cierto tests diagnóstico acierta sobre el 100% de los individuos enfermos y el 50% de los sanos.
Cierta persona pasa el test con resultado negativo. Entonces:
a Esta sana.
b Esta enferma.
c Existe una probabilidad del 50% de que esté sana.
d Existe una probabilidad del 75% de que esté sana.
e Existe una probabilidad del 75% de que esté enferma.

Preg. 14. Ref:38000


¿Cómo se calcula la sensibilidad de un test diagnóstico?
a Contabilizando el número de tests positivos en una muestra aleatoria de individuos.
b Contabilizando el número de tests negativos en una muestra aleatoria de individuos.
c Contabilizando el número de tests positivos en una muestra aleatoria de enfermos.
d Contabilizando el número de tests negativos en una muestra aleatoria de sanos.
e Ninguna de las anteriores es cierta.

Preg. 15. Ref:39000


Cierto test diagnóstico acierta sobre el 100% de los individuos sanos y el 0% de los individuos
enfermos. Elegida una persona al azar:
a Hay una probabilidad del 50% de que esté enferma.
b Hay una probabilidad del 0% de que esté enferma.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 3/31
13/3/2021 Test de autoevaluacion

c Hay una probabilidad del 100% de que esté enferma.


d El test será negativo.
e Ninguna de las anteriores es cierta.

Preg. 16. Ref:48000


La edad de los individuos de una población sigue una distribución normal. Se extrae
aleatoriamente una muestra de 300 pacientes cuya media es de 50 años, y la desviación típica es
10 años. Entonces:
a Aproximadamente el 95% de los pacientes tienen edades entre 30 y 70 años.
Existe una probabilidad del 95% de que la verdadera media de la población esté entre 30 y 70
b
años.
c Aproximadamente el 95% de los pacientes tienen edades entre 40 y 60 años.
Existe una probabilidad del 95% de que la verdadera media de la pobllación esté entre 40 y 60
d
años.
Existe una probabilidad del 95% de que la verdadera media de la pobllación esté entre 45 y 55
e
años.

Preg. 17. Ref:56000


Un estudio sobre la efectividad de un fármaco llega a la conclusión de que éste es mejor que el
placebo con p<0,05 ¿Cuál es la interpretación correcta de este resultado?
a Con toda seguridad, el tratamiento es mejor que el placebo.
b La probabilidad de que el nuevo tratamiento sea mejor que el placebo es superior al 95%.
c El tratamiento es un 95% más efectivo que el placebo.
d La probabilidad de que el placebo sea mejor que el nuevo fármaco es menor de 5%.
Si el tratamiento no fuese efectivo, existe menos del 5% de probabilidad de observar unas
e
muestras tan contrarias a dicha hipótesis como las obtenidas.

Preg. 18. Ref:57000


En un contraste de hipótesis la cantidad p es:
a Un número pequeño.
b Fijada antes de realizar el contraste.
c La probabilidad de rechazar la hipótesis nula.
d La probabilidad de error al rechazar la hipótesis alternativa.
e Conocida al extraer la muestra y calcular el estadístico experimental.

Preg. 19. Ref:63000


Un contraste de hipótesis se considera significativo si:
a Una muestra aleatoria es coherente con la hipótesis nula.
b Una muestra aleatoria no es coherente con la hipótesis nula.
c La hipótesis alternativa es más probable que la nula.
d Todo lo anterior es cierto.
e Son ciertas (b) y (c).

Preg. 20. Ref:66000


Se desea estimar confidencialmente el número medio de veces que asiste a un servicio de salud
los individuos de una población. Para ello se toman muestras aleatorias entre los individuos que
asisten regularmente a los mismos. Esta técnica de muestreo es:
a Un muestreo aleatorio simple.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 4/31
13/3/2021 Test de autoevaluacion

b Un muestreo aleatorio estratificado.


c Un muestreo aleatorio por conglomerados.
d Incorrecta.
e Ninguna de las anteriores.

Preg. 21. Ref:73000


Un contraste de hipótesis se considera no significativo si:
a Una muestra aleatoria es coherente con la hipótesis nula.
b Una muestra aleatoria no es coherente con la hipótesis nula.
c La hipótesis nula es más probable que la alternativa.
d Todo lo anterior es cierto.
e Son ciertas(a) y (c).

Preg. 22. Ref:1100


Señale cuál de las siguientes afirmaciones es falsa:
a La aparición o no de bacterias en un cultivo es una variable dicotómica
b La estatura de un individuo es una variable cuantitativa discreta.
El lugar que ocupa una persona entre sus hermanos (de menor a mayor edad) es una variable
c
ordinal.
d El estado civil es una variable cualitativa.
e La glucemia es continua.

Preg. 23. Ref:1120


¿Cuál de las siguientes características no se corresponde con el concepto de mediana?
a Es el centro de gravedad de la distribución.
b No se ve afectada por los valores extremos.
c Deja por debajo el mismo número de datos que por encima.
d Es el segundo cuartil.
e Todo lo anterior se corresponde con la mediana.

Preg. 24. Ref:1140


Señale cual de las siguientes afirmaciones es verdadera:
a La media, la mediana y el rango orientan sobre la tendencia central de los datos.
b La desviación típica me orienta sobre la "validez" de la media.
c El rango me orienta sobre la simetría de la distribución.
Las marcas de clase de una variable cualitativa se calculan como los puntos medios de los
d
intervalos.
e La media, mediana y moda resumen todo tipo de información de los datos.

Preg. 25. Ref:109000


En una población, hay tantos hombres como mujeres, el 20% son varones y fumadores y el 20%
de las mujeres fuman. Entonces:
a Fuman tantos hombres como mujeres.
b Por cada mujer fumadora hay dos hombres fumadores.
c Por cada hombre fumador hay dos mujeres fumadoras.
d Hay un 40% de fumadores en la población.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 5/31
13/3/2021 Test de autoevaluacion

e Nada de lo anterior es cierto.

Preg. 26. Ref:1150


En una población, el peso tiene media 60kg y desviación típica 6Kg. La altura tiene de media
170cm y desviación 6cm. Cierto individuo tiene un peso de 70 Kg y altura 180cm.
a La altura tiene un valor más extremo que el peso.
b El peso es menos extremo que la altura.
c Peso y altura son valores igualmente extremos.
d El peso es más extremo que la altura.
e La altura es menos extrema que el peso.

Preg. 27. Ref:1160


Señale cuál de las siguientes afirmaciones es falsa:
a La media aritmética es siempre el centro de gravedad de la distribución.
b En una distribución continua simétrica, media y mediana coinciden.
c La media aritmética cambia cuando cambia algún dato.
d La mediana no siempre cambia cuando lo hace algún dato.
e En las distribuciones continuas simétricas todas las medidas de centralización coinciden.

Preg. 28. Ref:1170


El coeficiente de variación:
a Permite comparar la dispersión de dos poblaciones.
b Es menor que la media.
c Es menor que la desviación típica.
d No depende de la media ni la desviación típica.
e Depende de la escala que se use al medir la variable.

Preg. 29. Ref:1180


Los diagramas de sectores son muy útiles para comparar:
a Dos variables cualitativas en una población.
b Dos variables cuantitativas en una población.
c Una variable cualitativa en dos poblaciones.
d Una variable cuantitativa en dos poblaciones.
e Una variable cuantitativa con otra cualitativa.

Preg. 30. Ref:1210


En el caso de una variable ordinal, el número n de datos válidos es:
a La suma de las frecuencias absolutas.
b La frecuencia absoluta acumulada de la categoría más frecuente.
c La suma de las frecuencias relativas.
d La frecuencia relativa acumulada en la última catetgoría.
e La (a) y la (d) son ciertas.

Preg. 31. Ref:1230


La recta de regresión de Y sobre X se muestra como una buen modelo para explicar la relación
entre dos variables numéricas. Entonces:

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 6/31
13/3/2021 Test de autoevaluacion

a Y se puede calcular exactamente como una función matemática de X.


b Y es independiente de X.
c La covarianza de X e Y no es nula.
d La media de X coincide con la media de Y.
e Sólo dos de las afirmaciones anteriores son correctas.

Preg. 32. Ref:1240


En una población se obtiene con una bondad de ajuste de 0,9 que la relación entre nivel de
glucemia (Y) y nivel de colesterol (X) es de Y=20 + X/4. Entonces:
a Todos los individuos con un valor de colesterol 100, presentan glucemia 45.
b Existe tendencia a que a mayor nivel de glucemia, mayor nivel de colesterol.
c Hay mas individuos con colesterol alto que con glucemia baja.
d Las observaciones se muestran como una nube de puntos creciente.
e Sólo dos de las afirmaciones anteriores son correctas.

Preg. 33. Ref:1260


Dos variables numéricas son incorreladas. Entonces:
a r=0
b El modelo lineal de regresión sólo propone un valor como predicción de Y.
c La nube de puntos no presenta aspecto creciente.
d La varianza residual en el modelo de regresión de Y sobre X es igual a la varianza de Y.
e Todo lo anterior es cierto.

Preg. 34. Ref:1280


Se pide a unos enfermos que valoren su grado de mejoría tras un tratamiento en una escala de 1 a
5. De la siguiente colección de posibilidades, cuál cree que resume mejor los mismos:
a Media, Mediana y Moda.
b Percentil 25, Percentil 50, Percentil 75.
c Media y desviación típica.
d Mediana y desviación típica.
e Rango

Preg. 35. Ref:1290


Al aplicar un tratamiento a un paciente, puede que este empeore, no le haga efecto, o mejore. Si
dicho tratamiento se aplica a una población de 100 pacientes, ¿qué medidas cree que resumen
mejor los datos?
a Media, mediana, moda, desviación típica y asimetría.
b Mediana y coeficiente de variación.
c Media y coeficiente de variación.
d Percentil 25, percentil 50 y percentil 75.
e Ninguna de las anteriores.

Preg. 36. Ref:1300


En cierta población se observa la distribución de los grupos sanguíneos. Si queremos resumir la
información obtenida podemos utilizar:
a Moda.
b Mediana.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 7/31
13/3/2021 Test de autoevaluacion

c Frecuencias acumuladas absolutas.


d Frecuencias relativas.
e Nada de lo anterior.

Preg. 37. Ref:1310


De las siguientes medidas, cuáles podria utilizar para argumentar en favor o en contra de la
asimetría de la variable edad:
a Percentil 25 y percentil 75.
b Media y Percentil 60.
c Media y mediana
d Media y desviación típica.
e Ninguna de las anteriores.

Preg. 38. Ref:1320


La pregunta: ¿qué nivel de colesterol sólo es superado por el 5% de los individuos?, tiene por
respuesta:
a El percentil 95.
b El percentil 5.
c Los percentiles 2,5 y 97,5
d 95%.
e Nada de lo anterior.

Preg. 39. Ref:1330


Qué peso no llega a alcanzar el 40% de los individuos de una población:
a El 40%.
b El 60%.
c El percentil 60.
d El percentil 40.
e Los percentiles 20 y 60.

Preg. 40. Ref:1370


Una distribución presenta asimetría negativa siempre que:
a Hay más valores negativos que positivos.
b Hay menos valores negativos que positivos.
c No es simétrica.
d La media es menor que la varianza.
e Nada de lo anterior es cierto.

Preg. 41. Ref:238000


La media aritmética de una variable discreta:
a Puede ser un valor de la variable.
b No debería ser utilizada como medida de centralización.
c Es lo mismo que el percentil 50.
d Puede no ser única.
e Todo lo anterior es falso.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 8/31
13/3/2021 Test de autoevaluacion

Preg. 42. Ref:259000


En un estudio sobre problemas cervicales preguntamos a los pacientes acerca del tipo de
almohada que usan. Las respuestas deberían ser consideradas como una variable:
a Cualitativa nominal
b Numérica
c Discreta
d Continua.
e Ordinal

Preg. 43. Ref:296000


En relación a las técnicas de inferencia estadística, elija la afirmación correcta:
a La media poblacional es una estimación puntual.
b La media muestral es un parámetro.
c Sólo se rechaza una hipótesis nula si esta es falsa.
d Un intervalo de confianza es una estimación confidencial de un parámetro.
e Todo lo anterior es falso.

Preg. 44. Ref:297000


En relación con los contrastes de hipótesis, elija la afirmación correcta:
a La hipótesis nula es la correcta.
b La hipótesis nula es la falsa.
c Si la hipótesis alternativa es cierta, seguro que se rechaza la nula.
El contraste es significativo cuando los datos muestrales no son los esperados si la hipótesis
d
nula fuese cierta,
Si es más probable que sea cierta la hipótesis alternativa que la nula, el contraste es
e
significativo.

Preg. 45. Ref:298000


Se realiza un estudio para saber si dos tratamientos de quimioterapia presentan diferencias en
cuanto a la supervivencia de los pacientes. No se encontró diferencia estadísticamente
significativa. ¿Cuál de las siguientes razones podrían ser causantes del resultado?
a Los tratamientos ofrecen tiempos de supervivencia muy diferentes.
b El nivel de significación es demasiado alto.
c Las muestras son demasiado numerosas.
d Las muestras son demasiado pequeñas.
e Nada de lo anterior.

Preg. 46. Ref:315000


Elija la afirmación correcta sobre variables observadas en individuos:
a Poseer vivienda propia es una variable numérica.
b Poseer animales de compañía es una variable cualitativa.
c La nacionalidad es una variable ordinal.
d El tipo de almohada que usa es variable ordinal.
e La longitud de la cama donde duerme es variable discreta.

Preg. 47. Ref:318000


Se pregunta a los individuos su opinión sobre una cuestión, pudiendo valorar estos su respuesta
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&VS… 9/31
13/3/2021 Test de autoevaluacion

en términos de: en contra, en parte a favor, muy a favor, totalmente de acuerdo. Elija la afirmación
correcta:
a Podemos calcular la media.
b Podemos calcular el coeficiente de variación.
c La variable es de tipo ordinal
d La variable es de tipo cualitativo nominal.
e Nada de lo anterior es cierto.

Preg. 48. Ref:321000


Un estadístico es:
a Un valor numérico definido sobre los valores de una muestra.
b La media muestral.
c Un valor numérico definido sobre los valores de una población.
d Un individuo de una muestra.
e Ninguna de las anteriores son correctas

Preg. 49. Ref:226100


Para estudiar la efectividad de un test diagnóstico ante una enfermedad se toma un grupo de 200
personas enfermas y 200 que no la padecen, y se observan los resultados. ¿Qué podemos
estimar directamente de ellos?
a La sensibilidad y especificidad del test.
b La incidencia de la enfermedad en la población.
c El índice predictivo de verdaderos positivos.
d Son correctas (a) y (c).
e Todo lo anterior.

Preg. 50. Ref:327013


La estadística en Ciencias de la Salud se utiliza para obtener información sobre situaciones de
caracter:
a Determinista.
b Sistemático.
c Exhaustivo.
d Aleatorio.
e Excluyente.

Preg. 51. Ref:327014


Elija la afirmación que pueda considerarse admisible al leer un estudio estadístico:
a Se estudió a una muestra en vez de a la población, para mayor precisión.
b Se estudió a la población para obtener información sobre la muestra.
c Se estudió a una muestra representativa de la población.
d Se estudiaron todas las variables de la población.
e Se observó a un individuo de cada variable.

Preg. 52. Ref:327017


Elija la afirmación correcta:
a Los valores de cualquier variable deben ser agrupados en intervalos.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 10/31
13/3/2021 Test de autoevaluacion

b Las variables deben ofrecer valores que no se repitan en los diferentes individuos.
c Las modalidades de una variable deben poder ser observadas en todos los individuos.
d Los individuos pueden poseer diferentes modalidades de la misma variable.
e Todo lo anterior es falso.

Preg. 53. Ref:327018


En cuanto a la presentación ordenada del estudio de una variable aislada:
a Lo más informativo es mostrar las medidas de tendencia central.
b Lo más informativo es mostrar las medidas de dispersión.
c Se deben presentar todos los valores observados de la variable, uno a uno, de menor a mayor.
d Las representaciones gráficas dan más información que las tablas de frecuencia.
e A veces no tiene sentido usar frecuencias acumuladas.

Preg. 54. Ref:327019


En las representaciones gráficas de variables cualitativas, la regla fundamental a tener en cuenta
es:
a Las alturas en cada modalidad son proporcionales al valor de la variable.
b Las áreas para cada modalidad son proporcionales al valor de la variable.
c Las áreas para cada modalidad son proporcionales a las frecuencias acumuladas.
d Las áreas para cada modalidad son proporcionales a las frecuencias absolutas o relativas.
e Las alturas para cada modalidad son proporcionales a las frecuencias acumuladas.

Preg. 55. Ref:327020


Entre las representaciones gráficas para variables cualitativas tenemos:
a Histogramas.
b Diagramas integrales.
c Diagramas diferenciales.
d Diagramas de cajas y bigotes.
e Nada de lo anterior.

Preg. 56. Ref:327021


Elija la opción correcta.
a Un parámetro es algo calculado sobre cada individuo.
b Un parámetro es calculado sobre la muestra.
c Una variable se calcula sobre los parámetros de una población.
d Un estadístico se calcula sobre la población.
e Nada de lo anterior es correcto.

Preg. 57. Ref:327022


La calificación de selectividad que sólo es superada por el 12% de los estudiantes se denomina:
a Percentil 12.
b Cuantil 0,88
c Cuantil 0,12
d Decil 88
e Nada de lo anterior es correcto.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 11/31
13/3/2021 Test de autoevaluacion

Preg. 58. Ref:327023


En una población, el 70% de las alturas consideradas "más normales" se encuentran:
a Por encima del percentil 70.
b Por debajo del cuantil 0,30
c Entre el percentil 30 y el 70
d Entre el percentil 15 y el 85.
e Entre la media y la mediana.

Preg. 59. Ref:327024


Las medidas de centralización, en cuanto a la información que ofrecen sobre una variable
numérica, preferimos (por orden, de peor a mejor):
a media, mediana, moda
b moda, media, mediana
c media, moda, mediana.
d No se puede en general recomendar una como mejor que las otras.
e Todo lo anterior es falso.

Preg. 60. Ref:327025


Si una muestra posee valores anómalos, de las siguientes cuál usarías como medida de
dispersión:
a Varianza.
b Desviación típica.
c Rango intercuartílico.
d Rango.
e Máximo y coeficiente de variación.

Preg. 61. Ref:327026


Si queremos saber cómo de disperso está una variable relativamente con respecto a la magnitud
de los valores centrales de la misma, usaremos:
a Varianza.
b Desviación típica.
c Rango intercuartílico.
d Rango.
e Coeficiente de variación.

Preg. 62. Ref:327027


Si el coeficiente de asimetría en una población presenta el valor 0,99 entonces:
a La distribución presenta una cola a la derecha.
b La distribución presenta una cola a la izquierda.
c La distribución es más apuntada que la normal.
d La distribución es menos apuntada que la normal.
e La distribución es prácticamente simétrica.

Preg. 63. Ref:327028


Si la media del peso en una población es 60 kg. y la mediana 65kg., entonces afirmamos que la
distribución del peso en la población es:
a Platicúrtica.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 12/31
13/3/2021 Test de autoevaluacion

b Mesocúrtica.
c Leptocúrtica.
d Asimétrica.
e Unimodal.

Preg. 64. Ref:327029


De las siguientes parejas de variables, en cuáles crees que puede ser útil un análisis de regresión
lineal:
a La presión sanguínea y el grupo sanguíneo.
b El nivel de colesterol y la concentración de bilirrubina.
c El grupos sanguíneo y el factor Rh.
d El género y la edad.
e Poseer ideología racista y el factor RH.

Preg. 65. Ref:327030


Si el coeficiente de correlación lineal de Pearson entre dos variables es -0,8 podemos decir:
a La covarianza es negativa.
b La relación entre las variables es directa.
c Hay poca relación lineal entre las variables.
d Hay un error de cálculo.
e El 80% de las predicciones son correctas.

Preg. 66. Ref:327031


En un estudio de regresión lineal, donde el peso se estudie conjuntamente con otras variables, en
qué casos lo usarías como variable dependiente:
a Al estudiarlo con la altura.
b Al estudiarlo con el nivel del colesterol.
c Al estudiarlo con la presión sanguínea.
d Al estudiarlo con el grupo sanguíneo.
e Nada de lo anterior.

Preg. 67. Ref:327032


En una población formada por unidades familiares, la altura media del padre en la familia se
comporta como una distribución normal de media 170cm con desviación típica 5 cm. La altura del
primer hijo varón es otra variable con distribución similar. Con estos datos podemos afirmar:
a No hay relación entre ambas variables.
b Hay relación inversa entre las variables.
c No debemos intentar predecir la altura del hijo de un padre que mide 140cm.
d Hay relación directa entre las variables.
e Nada de lo anterior.

Preg. 68. Ref:327033


El porcentaje de individuos fumadores o con bronquitis se puede interpretar como una
probabilidad:
a De un suceso intersección
b Condicionada.
De un suceso unión.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 13/31
13/3/2021 Test de autoevaluacion

c
d A posteriori.
e De un suceso complementario.

Preg. 69. Ref:327034


El porcentaje de individuos con bronquitis entre los fumadores se puede interpretar como una
probabilidad:
a De un suceso intersección
b Condicionada.
c De un suceso unión.
d A posteriori.
e De un suceso complementario.

Preg. 70. Ref:327035


El porcentaje de individuos con bronquitis que además son fumadores se puede interpretar como
una probabilidad:
a De un suceso intersección
b Condicionada.
c De un suceso unión.
d A posteriori.
e De un suceso complementario.

Preg. 71. Ref:327036


El 12% de los individuos de una población padece osteoporosis. EL 25% de ellos lo sabe. ¿Qué
tasa de individuos tiene osteoporosis y lo desconoce?
a 3%
b 6%
c 9%
d 12%
e 25%

Preg. 72. Ref:327038


La osteoporosis afecta 4 veces más a mujeres que a hombres. El 8% de las mujeres padece
osteoporosis en una población donde hay tantos hombres como mujeres. ¿Cuál es la prevalencia
de la osteoporosis en la población?
a 2%
b 5%
c 8%
d 10%
e 12%

Preg. 73. Ref:327039


Elija la afirmación correcta relativa a pruebas diagnósticas:
a La sensibilidad se obtiene usando la noción subjetiva de probabilidad.
b El índice predictivo positivo se obtiene directamente de la noción frecuentista de probabilidad.
La tasa de verdaderos positivos se obtiene directamente de la noción frecuentista de
c
probabilidad.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 14/31
13/3/2021 Test de autoevaluacion

d La prevalencia de la enfermedad se obtiene a partir del teorema de Bayes.


e nada de lo anterior es cierto.

Preg. 74. Ref:327042


El nivel medio de glucemia en una población tiene un comportamiento gausiano co n media
150mg/dl, y un coeficiente de variación del 10%. Entre qué valores se situa el 95% de los
individuos de la población.
a Entre 140 y 160.
b Entre 130 y 170.
c Entre 120 y 180.
d Entre 110 y 190.
e Entre 100 y 200.

Preg. 75. Ref:327043


Deseamos conocer la opinión de los ciudadanos de Málaga sobre el sistema de salud pública.
Para ello elegimos una muestra aleatoria de entre los abonados a telefónica. Entonces:
a La población de estudio es la de los ciudadanos de Málaga.
b La población de estudio es la de los abonados a telefónica.
c La población objetivo es la de los abonados a telefónica.
d El conjunto de abonados a telefónica son la muestra.
e Nada de lo anterior es cierto.

Preg. 76. Ref:327044


Se quiere hacer un estudio sobre el tabaquismo en la provincia de Málaga. Queremos
asegurarnos tener cierto número de individuos de la zona litoral, la capital y del interior, pues
creemos que en cada una de esas zonas la incidencia es diferente. Haremos un muestreo:
a Aleatorio simple.
b Estratificado.
c Sistemático.
d Por grupos.
e No probabilístico.

Preg. 77. Ref:327045


Una estimación confidencial para un nivel de confianza fijado, da por respuesta:
a Una aproximación de la media.
b Una aproximación de una proporción.
c Una probabilidad.
d Un intervalo.
e Un nivel de significación.

Preg. 78. Ref:327046


Se realiza un experimento donde nos basaremos en un contraste de hipótesis para tomar una
decisión con un nivel de significación del 1%. De las siguientes cuál no es un resultado posible de
un contraste de hipótesis:
a El experimento no es concluyente.
b El experimento permite obtener conclusiones.
c Se rechaza la hipótesis nula.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 15/31
13/3/2021 Test de autoevaluacion

d Se rechaza la hipótesis alternativa.


e Se acepta la hipótesis alternativa.

Preg. 79. Ref:327048


Elija la afirmación falsa:
a El nivel de significación es normalmente un valor pequeño.
b La significación de un contraste es conocida tras analizar los datos.
c El nivel de significación de un contraste debe ser fijado antes de analizar los datos.
d Un contraste debe ser declarado significativo antes de recoger los datos.
Un contraste es declarado significativo si se obtiene una muestra que discrepa mucho de la
e
hipótesis nula.

Preg. 80. Ref:327050


Cuando la población objetivo y de estudio en un muestreo difieren mucho, entonces:
a Debe usarse el método de respuestas aleatorizadas.
b Pueden existir sesgos.
c No pueden seleccionarse unidades de muestreo.
d Se debe usar un muestreo no probabilístico.
e Nada de lo anterior es correcto.

Preg. 81. Ref:327169


¿A qué se debe el sesgo de selección?
a A falta de sinceridad en los individuos de la muestra.
b A las diferencia existente entre diversas muestras.
c A la diferencia entre la población de estudio y la población objetivo.
d A no usar la técnica de respuesta aleatorizada.
e A nada de lo anterior.

Preg. 82. Ref:327191


Se observa que al aumentar el consumo de estanol, disminuye el nivel de colesterol en sangre. Se
utiliza un modelo de regresión lineal donde el nivel de colesterol es la variable independiente y el
consumo de estanol es la dependiente. Se calcula una bondad de ajuste para el modelo del 25%.
Entonces:
a El 25% de las predicciones del modelo son correctas.
b r= 0.5
c r= 0.25
d r= -0.25
e r= -0.5

Preg. 83. Ref:327240


El perímetro torácico en un grupo de militares presenta distribución gaussiana con 95 cm de
media y 5 cm de desviación típica. Elegimos a una muestra de 100 indivíduos y calculamos la
media de la misma. Elija la afirmación correcta:
a La media de la muestra valdrá 95cm.
b La media de la muestra sería un valor comprendido entre 90 y 100 cm con confianza del 68%.
c La media de la muestra será un valor comprendido entre 95 y 100 cm con confianza del 95%.
d La media de la muestra será un valor comprendido entre 94 y 96 cm con confianza del 95%.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 16/31
13/3/2021 Test de autoevaluacion

e Todo lo anterior es falso.

Preg. 84. Ref:327262


Si el coeficiente de asimetría en una población presenta el valor -5,22 entonces:
a La distribución presenta una cola a la derecha.
b La distribución presenta una cola a la izquierda.
c La distribución es más apuntada que la normal.
d La distribución es menos apuntada que la normal.
e Ese valor de asimetría es imposible.

Preg. 85. Ref:327263


Si el coeficiente de correlación lineal de Pearson entre dos variables es -0,1 podemos decir:
a La covarianza es pequeña.
b Hay fuerte relación inversa entre las variables.
c Hay poca relación lineal entre las variables.
d Hay un error de cálculo.
e El 10% de las predicciones son correctas.

Preg. 86. Ref:327264


El 2% de la población padece diabetes. Si de ellos, el 30% no está diagnósticado, esta cantidad
puede entenderse como una probabilidad...
a De un suceso intersección
b Condicionada.
c De un suceso unión.
d A posteriori.
e De un suceso complementario.

Preg. 87. Ref:327265


Disponemos de la distribución de edades de los individuos de una población. El número de ellos
que no es mayor de edad, es:
a Una frecuencia relativa.
b Una frecuencia absoluta.
c Una frecuencia acumulada.
d Una variable numérica.
e Una variable cualitativa.

Preg. 88. Ref:327266


Medimos el número de glóbulos rojos y el de blancos en cada individuo de una población. Se
observa determinada variabilidad en esas cantidades. Queremos saber de qué tipo de célula se
presenta mayor variabilidad
a Compararemos las desviaciones típicas.
b Compararemos los rangos.
c Estudiaremos la covarianza.
d Estudiaremos el coeficiente de correlación lineal de Pearson.
e Compararemos los coeficientes de variación.

Preg. 89. Ref:327267


https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 17/31
13/3/2021 Test de autoevaluacion

En una población, el 5% son enfermos diagnosticados de una enfermedad, la cual padece el 10%
de la población. La probabilidad de estar diagnósticado para un individuo enfermo es:
a 2%
b 5%
c 15%
d 50%
e No puede calcularse con esos datos.

Preg. 90. Ref:327269


Una prueba diagnóstica de cierta enfermedad, tiene una tasa de aciertos del 90% tanto sobre
enfermos como sanos. La incidencia de la enfermedad en la población es del 50%. Si se pasa el
test a una persona y sale positivo, la probabilidad de que realmente esté enferma es:
a 45%
b 50%
c 75%
d 90%
e 100%

Preg. 91. Ref:327271


La concentración de calcio se comporta en los mamíferos como una distribución normal de media
10 y desviación típica 2. ¿Con qué frecuencia se encuentran mamíferos con una concentración
superior a 14?
a 95%
b 68%
c 50%
d 5%
e 2,5%

Preg. 92. Ref:327272


En una muestra de 1000 mujeres se estudia su número de hijos. Si quiero tener el máximo de
información sobre la variable del estudio, preferimos:
a Media, Mediana y Moda.
b Percentil 25, Percentil 50, Percentil 75.
c Media y desviación típica.
d Media, mediana, cuartiles, asimetría, curtosis y desviación típica.
e Distribución de frecuencias

Preg. 93. Ref:327273


Una variable continua presenta una fuerte asimetría positiva. De entre las siguientes posibilidades,
cuál es preferible para resumir la información que hay en la muestra.
a La mediana.
b La media y la desviación típica.
c Los cuartiles.
d El mínimo y el máximo.
e El diagrama de cajas de Tukey.

Preg. 94. Ref:327274


https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 18/31
13/3/2021 Test de autoevaluacion

El 3% de los individuos tiene una altura superior a 190cm. El 5% mide menos de 150cm.
Conocemos:
a El percentil 3
b El cuantil 0,06
c El percentil 95
d El percentil 97
e Nada de lo anterior.

Preg. 95. Ref:327282


Conocemos la distribución de estudiantes entre las distintas facultades del campus de Teatinos. El
número de estudiantes de Psicología es:
a Una frecuencia relativa.
b Una frecuencia absoluta.
c Una frecuencia acumulada.
d Un porcentaje.
e Una variable cualitativa.

Preg. 96. Ref:327290


Se estudia la asociación lineal entre dos variables numéricas. El coeficiente de determinación
vale 0,95.
a Hay poca asociación.
b Hay asociación directa.
c Hay asociación inversa.
d Hay una buena asociación
e Nada de lo anterior.

Preg. 97. Ref:327291


Elija la afirmación correcta sobre teoría de muestreo:
a La población de estudio es aquella de la que finalmente extraeremos una muestra aleatoria.
b El sesgo de selección es la diferencia existente entre la población de estudio y la muestra.
c Cuando se pueda, se prefieren los muestreos no probabilísticos.
d El muestreo aleatorio simple es normalmente el más económico en la práctica.
e El mejor tipo de muestreo es el sistemático.

Preg. 98. Ref:327315


De los siguientes conceptos indique el que no tenga sentido:
a Diagrama de barras para la variable "Grupo sanguíneo"
b Pictograma para la variable "Altura"
c Diagrama integral para la variable "Nivel de colesterol"
d Diagrama de sectores para la variable "Sexo"
e Histograma para la variable "Peso"

Preg. 99. Ref:327316


En un grupos de niños se tiene una altura media de 150cm con desviación típica de 10cm. La
edad media es 12 años, con desviación típica de 3 años. ¿Dónde se presenta mayor dispersión?
a En edades.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 19/31
13/3/2021 Test de autoevaluacion

b En alturas.
c Las dispersiones son similares.
d No se puede decir con esos datos qué variable está más dispersa.
e Nada de lo anterior.

Preg. 100. Ref:327317


De los siguientes representaciones gráficas, cual muestra directamente las observaciones
extremas:
a Diagrama de excesos
b Barras.
c El diagrama de observaciones atípicas.
d Pictograma
e Cajas de Tukey.

Preg. 101. Ref:327318


El peso presenta una distribución con gran asimetría positiva en un grupo de individuos obesos.
¿Qué valor divide a los mismos en dos grupos con la misma cantidad de individuos?
a La moda
b El percentil 25.
c El percentil 75
d La media.
e Ninguno de los anteriores.

Preg. 102. Ref:327319


Se observa que al disminuir el consumo de comida rápida, disminuye el nivel de colesterol en
sangre. Se usa un modelo de regresión entre ambas que ofrece una bondad de ajuste del 36%.
Entonces:
a El 36% de las predicciones del modelo son correctas.
b r= +0.60
c r= +0.36
d r= -0.60
e r= -0.36

Preg. 103. Ref:327320


Un modelo de regresión lineal para calcular la glucemia (sangre) a partir de la de la orina
(glucosuria) es"glucemia=20+ 0.5 glucosuria". Si dos personas se diferencian en 10 unidades de
glucosuria, cual es la mejor estimación que puede hacer para la diferencia en glucemia:
a5
b 10
c 15
d 20
e 25

Preg. 104. Ref:327321


El IMC se distribuye en una población de forma normal. El 95% central de los individuos tiene un
IMC comprendido entre 20 y 24. Entonces:
a La media es 22.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 20/31
13/3/2021 Test de autoevaluacion

b La desviación típica es 1.
c La curtosis es cero.
d Todas las anteriores son correctas.
e Sólo dos de las anteriores son correctas.

Preg. 105. Ref:327322


Una enfermedad tiene una incidencia del 50% en la población. Un test para detectarla posee una
tasa de verdaderos positivos del 80%, y de falsos positivos del 20%. Si un individuo resulta ser
positivo, la probabilidad de que esté enfermo es:
a 20%
b 40%
c 50%
d 60%
e 80%

Preg. 106. Ref:327332


El consumo diario de Calorías se distribuye en una población de forma normal, con media 2500 y
desviación típica 100. Si elijo una muestra de tamaño 100, entre qué valores espero encontrar su
media (con una probabilidad del 95% de acertar):
a Entre 2400 y 2600.
b Entre 2300 y 2700.
c Entre 2490 y 2510.
d Entre 2480 y 2520.
e Entre 2498 y 2502.

Preg. 107. Ref:327336


Se llama parámetro a:
Una función de valor numérico definida sobre alguna característica observable en los
a
individuos de una población.
b Una función definida sobre los valores numéricos de una muestra.
c Cualquier variable observable de una población
d Las variables numéricas de la muestra
e Cualquier función sobre las variables observadas

Preg. 108. Ref:327339


Si queremos representar gráficamente los porcentajes de una variable cuantitativa continua
debemos usar:
a Pictogramas
b Diagrama de barras
c Diagrama diferencial acumulado
d Histograma
e No existe gráfica posible

Preg. 109. Ref:327345


Respecto a las medidas de centralización:
a La media no debe usarse en distribuciones muy asimétricas.
b La moda puede no ser única.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 21/31
13/3/2021 Test de autoevaluacion

c En distribuciones simétricas media, mediana y moda coinciden.


d Las tres anteriores son correctas.
e Sólo la a) y la b) son correctas

Preg. 110. Ref:327347


Para medir la variabilidad de una variable utilizamos:
a El coeficiente de variación
b La desviación típica
c El coeficiente de determinación.
d Todas las anteriores.
e Sólo la a) y la b).

Preg. 111. Ref:327348


Si queremos comparar la variabilidad de dos variables diferentes utilizaremos:
a Las desviaciones típicas.
b Las puntuaciones típicas.
c Los coeficientes de variación.
d Las varianzas.
e Ninguna de las anteriores.

Preg. 112. Ref:327352


Qué afirmación sobre la covarianza es falsa:
a La covarianza es una medida de la variabilidad conjunta de dos variables numéricas.
b Si la covarianza es positiva implica una relación creciente entre las variables.
c A partir de ella se obtiene el coeficiente de correlació lineal de Pearson.
d Posee dimensiones.
e Si es 0 podemos afirmar que no existe relación posible entre las variables.

Preg. 113. Ref:327354


La pendiente de una recta de una función de regresión lineal Y = b0 + b1 X
a Representa el incremento de Y por cada unidad de incremento de X.
b Tiene el mismo signo que la covarianza.
c Es el valor de la variable Y cuando X=0.
d Todas las anteriores son correctas.
e Sólo la a) y la b) son correctas.

Preg. 114. Ref:327360


Se define la sensibilidad de un test como:
a La probabilidad de que si el test da positivo el sujeto esté enfermo.
b La probabilidad de que si el sujeto está enfermo el test de positivo.
c La probabilidad de que si el test da negativo el sujeto esté sano.
d La probabilidad de que si el sujeto está sano el test de negativo.
e Ninguna de las anteriores.

Preg. 115. Ref:327362


En una población el 30% son hombres de los cuales son deportistas el 20%, frente al 25% de las
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 22/31
13/3/2021 Test de autoevaluacion

mujeres. Escogida una persona al azar es deportista. La probabilidad de que sea mujer es
(aproximadamente):
a 0,235
b 0,60
c 0,74
d 0,25
e No puede calcularse con esos datos.

Preg. 116. Ref:327459


De los siguiente estudios de relación entre variables, en cuál crees que no sería oportuno usar la
técnica de regresión lineal.
a La presión sanguínea y la acidez (ph).
b El número de glóbulos rojos y el grupo sanguíneo
c La altura y las horas de sueño.
d La edad y el conteo de plaquetas.
e El nivel de colesterol y la concentración de bilirrubina.

Preg. 117. Ref:327457


El coeficiente de asimetría en una población vale 3. Elija la afirmación correcta:
a La distribución presenta una cola a la derecha.
b La distribución presenta una cola a la izquierda.
c La distribución es simétrica.
d La distribución es más apuntada que la normal
e La media es igual a la mediana.

Preg. 118. Ref:327469


En una muestra aleatoria de 100 individuos se obtiene una media muestral de 50, la desviación
típica es 20. Elija la afirmación correcta:
a El 68% de los individuos de la muestra tiene sus valores comprendidos entre 48 y 52.
b El 95% de los individuos de la muestra tiene sus valores comprendidos entre 46 y 54.
Hay una probabilidad del 68% de que la media de la población esté comprendida entre 30 y
c
70.
d Hay una probabilidad del 95% de que la media de la población esté entre 46 y 54.
e Todo lo anterior es falso.

Preg. 119. Ref:327476


¿Qué altura no es superada por el 75% de los individuos?
a Primer cuartil
b Cuantil 0.75
c Percentil 25
d Cuantil 75
e Segundo cuartil

Preg. 120. Ref:327479


Después de estudiar la relación existente entre la flexión y la extensión de cuello de los alumnos
de la UMA, obtenemos que el valor de la covarianza es -0,57. ¿El valor de r saldrá positivo o
negativo?
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 23/31
13/3/2021 Test de autoevaluacion

a Saldrá positivo porque la relación es inversa.


Saldrá negativo también porque el signo de la covarianza y del coeficiente de correlación lineal
b
de Pearson siempre coinciden.
c No podemos saber el signo de r sabiendo la covarianza porque no están relacionados.
d Todas las anteriores son falsas.
e Necesitamos conocer R2 para saber el signo de r

Preg. 121. Ref:327483


El grado de satisfacción (poco/regular/mucho) con la política española la trataría como:
a una variable cualitativa nominal.
b una variable cuantitativa discreta.
c una variable cualitativa ordinal.
d una variable numérica continua.
e ninguna de las anteriores es correcta.

Preg. 122. Ref:327484


Con respecto a la modalidades de una variable cualquiera:
a Pueden siempre agruparse en clases.
b Deben formar un sistema exhaustivo.
c No pueden agruparse en intervalos.
d No tienen porqué formar un sistema excluyente.
e Solo dos son correctas.

Preg. 123. Ref:327486


Si el coeficiente de correlación lineal de Pearson entre dos variables es -0,9 podemos decir que:
a La covarianza será positiva.
b La relación lineal es buena.
c Al ser inferior a 1, la relación lineal es pequeña.
d Tenemos una relación lineal inversa, pero no buena.
e Sólo dos son correctas.

Preg. 124. Ref:327489


Cuando hablamos de número de cumpleaños que ha tenido una persona estamos ante:
a Una variable cualitativa ordinal.
b Una variable cualitativa nominal.
c Una variable cuantitativa discreta.
d Una variable cuantitativa continua.
e El número de cumpleaños no es una variable.

Preg. 125. Ref:327492


¿Cuál de las siguientes medidas define mejor la tendencia central de los datos: 1, 2, 4, 5, 9, 1, 3,
9, 400?
a Media.
b Cuantil 0,5.
c Moda
d Desviación típica.
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 24/31
13/3/2021 Test de autoevaluacion

e Ninguna de las anteriores.

Preg. 126. Ref:327506


Las siguientes medidas son de posición excepto:
a Percentil
b Cuartil
c Mediana
d Media
e Deciles

Preg. 127. Ref:327509


Cual de las siguientes propiedades de r son correctas:
a Es adimensional
b Cuanto más cerca esté r de de +1 o -1 mejor será el grado de relación lineal
c Las variables son incorreladas cuando r=0
d Todas las anteriores son correctas
e Son todas incorrectas

Preg. 128. Ref:327515


Los gráficos indicados para variables cualitativas son:
a Los diagramas de barras y los histogramas
b Los diagramas de barras, los de sectores y los pictogramas
c Los histogramas y pictogramas
d Sólo los diagramas de barras
e Los diagramas integrales

Preg. 129. Ref:327518


Se dice que la relación entre dos variables es directa cuando:
a La covarianza es igual a cero
b La covarianza es negativa
c La covarianza es mayor que cero
d El coeficiente de correlación lineal es positivo
e Las respuestas c) y d) son correctas

Preg. 130. Ref:327523


De las siguientes variables ¿con cuáles NO puedo calcular la media?
a temperatura corporal
b pH del estómago
c grupo sanguíneo
d número de glóbulos rojos
e edad

Preg. 131. Ref:327524


De las siguientes variables con cuál sería menos adecuado un diagrama de barras?
a Número de hijos
b Número de coches que posee la familia
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 25/31
13/3/2021 Test de autoevaluacion

c Número de cigarros fumados al día


d Número de glóbulos rojos
e Número de mascotas.

Preg. 132. Ref:327525


¿cuál des estas características no es propia de la media?
a Es sensible a valores extremos
b Es el centro de gravedad de los datos
c en distribuciones simétricas, coincide con la mediana
d Deja el mismo número de datos por arriba que por abajo
e Las opciones a) y b)

Preg. 133. Ref:327527


Sabiendo que r=+0.7 elija la afirmación falsa
a La covarianza es positiva
b Hay cierta relación lineal entre las variables
c La bondad de ajuste es 0.14
d La nube de puntos es creciente
e Existe una relación directa

Preg. 134. Ref:327534


Las frecuencias acumuladas tienen sentido para:
a Variables ordinales
b Variables numéricas
c Variables nominales
d Todas son correctas.
e Las opciones a) y b) son correctas.

Preg. 135. Ref:327537


En un estudio de regresión, ¿cuándo coincidirán los valores de la variable dependiente con los
propuestos por el modelo lineal de regresión?
a Cuando r tenga un valor positivo
b Cuando r sea igual a cero
c Nunca, aunque el modelo sea perfecto
d Cuando r valga 1 ó -1
e Las opciones c) y d) son correctas

Preg. 136. Ref:327551


La altura superada por el 25% de la población es:
a El percentil 75
b El percentil 25
c Entre el percentil 25 y 75
d El cuantil 0.25
e El percentil 5

Preg. 137. Ref:327555


https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 26/31
13/3/2021 Test de autoevaluacion

Cuál es la mediana de los siguientes datos 22, 5, 9, 11, 10, 14, 7


a5
b9
c 11
d 10
e 14

Preg. 138. Ref:327564


Disponemos de la distribución de edades de los individuos de una población. El número de ellos
que tiene dos o menos hijos es:
a Una variable cualitativa.
b Una variable numérica.
c Una frecuencia acumulada.
d Son correctas a) y b)
e Ninguna es correcta.

Preg. 139. Ref:327573


Si el cuantil 0,9 del peso es 70 kilogramos, quiere decir esto:
a Que una frecuencia del 70% individuos pesa más de 70 kilogramos.
b Que una frecuencia del 90% de individuos pesa más de 70 kilogramos.
c Que una frecuencia del 90% individuos pesa menos de 70 kilogramos.
d Que una frecuencia de 70% de individuos pesa menos de 90 kilogramos.
e Todas son falsas.

Preg. 140. Ref:327576


¿Cuál de las siguientes es una medida de dispersión poco sensible a valores extremos?
a Rango.
b Moda.
c Desviación típica.
d Rango intercuartílico.
e Varianza.

Preg. 141. Ref:327597


En una distribución: P25 =40, P50 =60 y P75 =70.
a La distribución es simétrica
b La distribución sugiere asimetría negativa
c La distribución sugiere asimetría positiva
d La distribución es leptocúrtica
e Las opciones a) y d) son ciertas

Preg. 142. Ref:327609


Si el coeficiente de correlación lineal de Pearson entre dos variables es -0,82, podemos afirmar
que:
a la relación entre las dos variables es casi nula
b la relación que hay entre las variables es muy buena y directa
c la covarianza es positiva
https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 27/31
13/3/2021 Test de autoevaluacion

d la relación que hay entre las variables es muy buena e inversa


e solo dos de las afirmaciones anteriores son correctas

Preg. 143. Ref:327614


Qué nivel de oxígeno en sangre es tal que el 70% de los individuos presenta un valor superior al
mismo:
a Percentil 70
b Percentil 30
c 1º Cuartil
d 3º Cuartil
e Todas son falsas

Preg. 144. Ref:327639


En los diagramas de Tukey, se representan entre otros:
a El mínimo y el máximo
b La moda y la mediana
c Los cuartiles
d Las opciones b) y c) son correctas
e Las opciones a) y c) son correctas

Preg. 145. Ref:327650


En una distribución la mediana es 20 y la media es 26:
a Con seguridad hay asimetría negativa
b Con seguridad hay asimetría positiva
c Hay colas hacia la derecha y hacia la izquierda.
d Los datos son simétricos.
e Los datos sugieren una cola hacia la derecha. Habría que estudiarlo con más detalle.

Preg. 146. Ref:327694


¿Qué gráfico elegirías para representar una las respuestas a una encuesta sobre el número de
hijos que tiene la población?
a Histograma
b Diagrama de sectores
c Pictograma
d Diagrama de Barras
e Ninguna de las anteriores

Preg. 147. Ref:327698


¿Qué otro nombre reciben los diagramas de dispersión?
a Diagrama de regresión
b Nube de puntos
c Diagrama lineal
d Diagrama de relación inversa
e Diagrama simple

Preg. 148. Ref:327703

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 28/31
13/3/2021 Test de autoevaluacion

Rango Intercuartílico:
a Es sensible a los datos extremos.
b Es la distancia ente el primer y segundo cuartil.
c Es la raíz cuadrada de la varianza
d Sus unidades son el cuadrado de las variables.
e Mide el grado de dispersión de los datos, independientemente de su causa.

Preg. 149. Ref:328021


Cual de las siguientes frases no nos encontraríamos nunca en un estudio estadístico.
a La media era mayor que la mediana.
b El rango de la variable es negativo.
c La correlación de las variables es negativa.
d La asimetría es negativa.
e La media es negativa.

Preg. 150. Ref:328022


Elija la afirmación falsa:
a Una variable solo puede recibir un valor en cada individuo.
b En las variables nominales se pueden calcular percentiles.
c La mediana no se puede calcular en cualquier tipo de variable.
d En todas las variables numéricas podemos calcular medidas de dispersión.
e En todas las variables numéricas podemos calcular medidas de centralización.

Preg. 151. Ref:328041


Un modelo de regresión lineal para calcular "Fatty liver Index" (FLI) a partir del consumo de aceite
de oliva es "FLI=70- 4 aceite". Si dos personas se diferencian en 5 unidades de consumo de
aceite, cual es la mejor estimación que puede hacer para la diferencia en FLI:
a5
b 10
c 15
d 20
e 60

Preg. 152. Ref:328084


El porcentaje de variabilidad explicada por un modelo lineal de regresión es 3%
a El modelo lineal de regresión es insuficiente para explicar la variable dependiente.
b Las variables son incorreladas.
El error cometido por el modelo lineal de regresión es pequeño, por tanto el ajuste lineal es
c
bueno.
d Hay una relación creciente entre las variables.
e Todo lo anterior es falso.

Preg. 153. Ref:328085


En una población la altura tiene una distribución simétrica, con el 80% de los individuos
comprendidos entre 150cm y 180cm. Entonces:
a El percentil 20 es 150 cm.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 29/31
13/3/2021 Test de autoevaluacion

b El percentil 80 es 180cm.
c El percentil 10 es 150 cm.
d La desviación típica es 15 cm.
e El rango intercuartílico es 15cm.

Preg. 154. Ref:328086


Si en un experimento realizado sobre estudiantes voluntarios a los que se coloca en situación de
estrés se observa que los cambios en ritmo cardíaco (latidos por minuto) se asocian a cambios en
la frecuencia de la voz (Hz) con una bondad de ajuste del 15% según el modelo FrecuenciaVoz =
-5 + 3 RitmoCardiaco, marque la afirmación verdadera.
a La relación entre las variables es inversa.
b Las variables no presentan ninguna relación.
c La voz disminuye su frecuencia en 5Hz.
Por cada aumento de 1 latido por minuto cardíaco, se produce un aumento de 3Hz en
d
frecuencia de la voz,
e Todo lo anterior es falso.

Preg. 155. Ref:328090


Solamente una de las siguientes frases podría alguna vez encontrarse como conclusión de un
estudio científico. ¿Cuál es?
a El tratamiento produjo un efecto significativamente mayor que el placebo (p=0.75)
b El tratamiento produjo un efecto significativamente menor que el placebo (p=0.25)
c El tratamiento no produjo un resultado diferente al placebo (p<0.001)
d El tratamiento produjo un efecto significativamente menor que el placebo (p=0.99)
e Se apreciaban diferencias significativas entre el placebo y el tratamiento (p<0.001)

Preg. 156. Ref:328091


Para un estudio epidemiológico sobre dolencias de suelo pélvico en mujeres en la provincia de
málaga, se decide seguir la siguiente estrategia de muestreo: Se elige aleatoriamente 10
poblaciones de la provincia, y en cada una de ellas se elige aleatoriamente 10 calles. Allí se elige
aleatoriamente 5 números de la calle y se estudia a las mujeres que aceptan participar. El
muestreo es:
a Aleatorio simple
b Por conglomerados.
c Estratificado.
d Sistemático.
e Estratificado y por conglomerados.

Preg. 157. Ref:328099


Los habitantes de una sociedad A tienen una renta anual media de 20.000€ (DT 5.000€). En otra
sociedad B, la renta anual media es de 30.000€ (DT 5.000€).
a Hay más variabilidad relativa en la sociedad A.
b Hay más variabilidad relativa en la sociedad B.
c Hay la misma variabilidad relativa en ambas sociedades.
El 95 % de los habitantes de cada sociedad tienen salarios comprendidos en una horquilla de
d
5.000€
e Nada de lo anterior es cierto.

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 30/31
13/3/2021 Test de autoevaluacion

Preg. 158. Ref:328101


Una muestra aleatoria de 64 pacientes refleja que el presión arterial diastólica media es 150 (DT
16), con distribución aproximadamente normal. Elija la afirmación correcta.
a La media de la población está con confianza del 95% entre 134 y 166
b La media de la población está con confianza del 68% entre 142 y 158
c La media de la población está con confianza del 95% entre 148 y 152
d La media de la población está con confianza del 95% entre 146 y 154
e El error típico es de 1 punto.

Preg. 159. Ref:328239


La pregunta: ¿Entre qué valores de colesterol se encuentra el 90% de los individuos más
frecuentes?, tiene por respuesta:
a por encima del percentil 95.
b por debajo del percentil 5.
c Entre los percentiles 5 y 95
d 90%.
e Nada de lo anterior.

Soluciones: (1,a) (2,a) (3,c) (4,c) (5,e) (6,d) (7,c) (8,b) (9,e) (10,e) (11,c) (12,d) (13,a) (14,c) (15,d)
(16,a) (17,e) (18,e) (19,b) (20,d) (21,a) (22,b) (23,a) (24,b) (25,b) (26,c) (27,e) (28,a) (29,c) (30,a)
(31,c) (32,e) (33,e) (34,b) (35,d) (36,d) (37,c) (38,a) (39,d) (40,e) (41,a) (42,a) (43,d) (44,d) (45,d)
(46,b) (47,c) (48,a) (49,a) (50,d) (51,c) (52,c) (53,e) (54,d) (55,e) (56,e) (57,b) (58,d) (59,d) (60,c)
(61,e) (62,a) (63,d) (64,b) (65,a) (66,a) (67,c) (68,c) (69,b) (70,a) (71,c) (72,b) (73,c) (74,c) (75,b)
(76,b) (77,d) (78,d) (79,d) (80,b) (81,c) (82,e) (83,d) (84,b) (85,c) (86,b) (87,c) (88,e) (89,d) (90,d)
(91,e) (92,e) (93,e) (94,d) (95,b) (96,d) (97,a) (98,b) (99,a) (100,e) (101,e) (102,b) (103,a) (104,d)
(105,e) (106,d) (107,a) (108,d) (109,e) (110,e) (111,c) (112,e) (113,e) (114,b) (115,c) (116,b) (117,a)
(118,d) (119,b) (120,b) (121,c) (122,b) (123,b) (124,c) (125,b) (126,d) (127,d) (128,b) (129,e)
(130,c) (131,d) (132,d) (133,c) (134,e) (135,d) (136,a) (137,d) (138,c) (139,c) (140,d) (141,b)
(142,d) (143,b) (144,e) (145,e) (146,d) (147,b) (148,e) (149,b) (150,b) (151,d) (152,a) (153,c)
(154,d) (155,e) (156,b) (157,a) (158,d) (159,c)

https://www.bioestadistica.uma.es/baron/autoevaluacion/index.php?VSeleccionar%5B%5D=f1&VSeleccionar%5B%5D=f2&VSeleccionar%5B%5D=f3&V… 31/31
Temario:
Si se realiza una medición in situ es factible tener errores:
Siempre.
Una variable aleatoria es:
Se define asignando un valor númerico a cada suceso simple de un experimento que conduzca a resultados
aleatorios.
Se extrae una bola al azar de una caja que contiene 10 rojas, 30 blancas, 20 azules y 15 naranjas. La
probabilidad de que sea no roja o azul es:
3/5
El valor de z crítico cuando el nivel de confianza para una prueba de hipótesis de dos colas es del 99%
es:
2.575
Para calcular el rango se tiene que considerar que:
Los valores extremos se elimina para poder tener más claramente la dispersión de las observaciones
Un fabricante de marcos para ventanas sabe, por experiencia, que el 5% de la producción tendra algún
tipo de defecto menor, que requerirá reparación. ¿Cuál es la probabilidad de que en una muestra de 20
marcos, por lo menos uno requiera reparación?
0,6415
Otro nombre para estadística inferencial es estadística descriptiva
Falso.
¿Qué sucede con la media aritmética, que contiene uno o dos valores muy grandes o valores muy
pequeños?
Es representativa No es representativa Es media ponderada Es media poblacional.
A la prueba de cola derecha se la conoce también como:
Prueba de cola superior izquierda
Los análisis de regresión y correlación nos muestran:
La naturaleza y la fuerza de una relación entre dos variables.
Si la pendiente es negativa en un gráfico X-Y al hacer el análisis de regresión y correlación, podemos
indicar que la relación es:
Directa
La prueba de dos colas es una prueba de hipótesis que:
Involucra dos regiones de rechazo
La diferencia de la muestra y población es:
La población es el conjunto de individuos u objetos de interés y muestra es la porción o parte de la población
de interés.
Al hablar de una prueba de hipótesis de cola izquierda quiere decir que:
La hipótesis alternativa involucra un “menor que” o un “menor que o igual” como signo.
La probabilidad de que aparezca al menos una cara en tres lanzamientos de una moneda:
7/8
La prueba de cola izquierda es una prueba de hipótesis en la que un valor de la muestra
significativamente menor que el valor crítico de la población lleva a:
Aceptar la hipótesis alternativa

La prueba de cola derecha es una prueba de hipótesis en la que un valor de la muestra significativamente
mayor que el valor crítico de la población lleva a:
Rechazar la hipótesis nula

La obtención del conjunto de datos en estadística es:


La parte más difícil, costosa y lenta de toda la investigación.
Las variables cualitativas son:
Solo puede clasificarse pero no medirse como: género, raza, provincia donde nació, estado civil.
El Nivel de medición nominal es:
El que consiste en categorías mutuamente excluyente que no implica ningún orden lógico.
El Nivel de medición ordinal es:
Se compone de distintas categorías en la que hay implícito un orden
El tipo de fuente de datos secundarios son:
Datos disponibles de otros proyectos que ya se han compilado y están disponibles para el análisis disponible
Especifique si cada una de las siguientes variables es cualitativa o cuantitativa: 1) Cantidad de
kilómetros por galón de gasolina;2) Marca de gasolina; 3) Temperatura de una persona; 4) Calificación
de un examen y 5) Color de ojos de las personas
Variable cuantitativa (1, 3,4); Variable cualitativa (2,5)
¿Qué es una Distribución de frecuencias?
Agrupación de datos cualitativos en clases mutuamente excluyentes que muestra el número de observaciones
en cada clase.
Muestra aleatoria simple es
Resulta cuando se selecciona n elementos de una población, de manera que todas las combinaciones posibles
de n elementos de la población tienen igual probabilidad de ser elegidas.
Las posiciones relativas de la media aritmética, mediana y moda para curvas de frecuencia asimétrica a
la derecha (sesgo positivo) son:
Moda, mediana y media aritmética

Principio de conteo fórmula de la multiplicación es:


Si hay m formas de hacer una cosa y n formas de hacer otra cosa, hay m x n formas de hacer ambas cosas.
Una de las siguientes características no es de la probabilidad binomial :
La probabilidad de éxito y fracaso no es la misma en cada ensayo.
La probabilidad de conseguir un total de 7 puntos una vez en dos lanzamientos de dos dados es: 5/18
Las Siglas UCL significan?
Límite inferior de confianza
Se está investigando la seguridad de una peligrosa intersección. Los registros policiacos indican una
media de cinco accidentes mensuales en esta intersección. El número de accidentes está distribuido de
acuerdo con una distribución de Poisson y se desea calcular la probabilidad de que en cualquier mes
ocurra exactamente 1 accidente. El valor de esta probabilidad será entonces:
0.03370
Analizando la gráfica de una distribución normal podemos afirmar que:
La curva tiene un pico: es unimodal
Analizando la gráfica de una distribución normal podemos afirmar que:
La media de una población cae en el centro de su curva normal.
El teorema del Límite Central asegura que:
La distribución de muestreo de la media se aproxima a la normal al incrementarse el tamaño de la muestra
La prueba de cola izquierda es una prueba de hipótesis en la que un valor de la muestra
significativamente menor que el valor crítico de la población lleva a:
Aceptar la hipótesis alternativa
Qué es una distribución de probabilidad?
Es un valor entre cero y uno, inclusive, que describe la posibilidad relativa (oportunidad o casualidad) de que
ocurra un evento.
Una de las siguientes características, es de la probabilidad Poisson es :
Se le conoce por lo general con el nombre de ley de eventos improbables
Se extraen sucesivamente dos cartas de una baraja de 52. La probabilidad de que la primera carta sea
un as pero la segunda no es:
16/221
En el muestreo estratificado, se divide a la población en grupos:
Relativamente homogéneos llamados estratos.
Al plantear una prueba de hipótesis se pueden tener dos casos:
De dos colas y de una cola
La duración de las bombillas de 100 watt que fabrica una empresa sigue una distribución normal con
una desviación de 120 horas. Su media está garantizada durante un mínimo de 800 horas. Se escoge al
azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de
750 horas. Si se quiere analizar la posibilidad de rechazar el lote, ¿qué tipo de prueba de hipótesis se
plantearía?
De cola izquierda.
A la prueba de cola izquierda se la conoce también como:
Prueba de cola superior
Una relación lineal puede definirse como:
Tipo particular de asociación entre dos variables que puede describirse matemáticamente mediante una línea
recta.
Diagrama de puntos es:
Es una forma de resumir datos cuantitativos, en la que cada observación se representa mediante un punto sobre
una recta numérica.
En la ESPE los alumnos pasan el nivel de estadística con el promedio de 14/20 durante el semestre (tres
periodos). Si Nelson tiene el primer periodo 13.7, el segundo 12.25. ¿Qué nota debe sacar para pasar el
nivel, exactamente sin aproximar?
16.05
El promedio de los datos de la muestra: (x,x+1,x-1,2x-1,2x+1) es.
7x/5.
Nelson, Rita y Nancy pesan 55,35 y 18 kilogramos, respectivamente. ¿Cuál(es) de las siguientes
expresiones representa(n) la media aritmética de sus pesos?. I) (55+35+18)/3 ; II) 3(10+2) ; III)
55/3+35/3+6.
I,II,III
Qué sucede con la mediana, si contiene en las observaciones uno o dos valores muy grandes o valores
muy pequeños?
No influye
Cuando la distribución de las medidas de tendencia central se encuentran con sesgo positivo; la
medidas más representativas serán
Mediana y la moda
Mutuamente excluyente significa:
El hecho de que un evento se presente significa que ninguno de los demás eventos puede ocurrir al mismo
tiempo.
Una de las características de la distribución de probabilidad es:
La suma de las probabilidades de los diversos eventos es igual a 1.
El enfoque para asignar probabilidades objetivas se clasifica en:
Probabilidad clásica y empírica.
Un sindicato de plomeros y colocadores de tubería tiene 5020 agremiados. Se seleccionó e interrogo a
un grupo representativo de 248 integrantes. Se considera que 248 es la población. Falso.
Diagrama del árbol es:
Una gráfica útil para organizar cálculos que implican varias etapas.
La probabilidad de conseguir un total de 7 puntos una vez en dos lanzamientos de dos dados es 11/36
Dennis Hogan es el supervisor de la presa Conowingo Hydroelectric. El señor Hogan sabe que las
turbinas de la presa generan electricidad a una tasa pico cada día sólo cuando pasan al menos 1’000000
de galones de agua a través de las compuertas. También sabe, por experiencia, que el flujo diario tiene
una distribución normal con media igual al flujo del día anterior y desviación estándar de 200000
galones. Ayer fluyeron 850,000 galones por la presa. ¿Cuál es la probabilidad de que las turbinas hoy
generen electricidad a la tasa pico?
0.2226
En un muestreo aleatorio simple las muestras se seleccionan mediante métodos que permitan que:
Cada posible muestra tenga igual probabilidad de ser seleccionada.
Se toma una muestra de 60 individuos a partir de una población de 540. De esta muestra, se encuentra
que la media es 6,2 y la desviación estándar es 1,368. Considerando un 96% de confianza, el intervalo
que se forma es:
(5.86 , 6.54)
Los límites de confianza, numéricamente hablando, son:
2
La duración de las bombillas de 100 watt que fabrica una empresa sigue una distribución normal con
una desviación de 120 horas. Su media está garantizada durante un mínimo de 800 horas. Se escoge al
azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de
750 horas. A un nivel de significancia del 0.01, ¿Se debe rechazar el lote por no cumple con la garantía?
Si
Dispersión es:
Los valores obtenidos de una muestra no son todos iguales. La variación entre estos valores es dispersión.
Defina una variable cuantitativa:
Es aquellas cuyos valores se pueden expresar en cantidades numéricas, como medidas o recuentos.
Defina una variable cualitativa:
No es cualitativa y solo puede clasificarse, pero no medirse.
Seleccione las medidas de tendencia central, de posición y de dispersión del siguiente grupo: 1)
Desviación media;2) Percentiles;3) Moda; 4) Coeficiente de variación; 5) El Rango; 6)Mediana y 7)
Cuantiles.
Tendencia central (3,6); medidas de posición (2,7); medidas de dispersión (1, 4,5).
Nelson ha obtenido en estadística un promedio semestral de 5.5, con cuatro notas. Si obtuvo dos 6.0 y
un 4.8. ¿Cuál fue la cuarta nota?
5.2
Colectivamente, cuartiles, deciles y percentiles se denominan:
Cuantiles
El conjunto de eventos es colectivamente exhaustivo cuando:
Por lo menos uno de los eventos debe ocurrir cuando se lleva a cabo un experimento.
Datos primarios son:
Los que se recogen específicamente para el análisis deseado.
La medida de una muestra o cualquier otra medición basada en una muestra de datos recibe el nombre
de:
Estadístico
Diagrama de caja es:
Es una representación gráfica, basada en cuartiles, que ayuda a presentar un conjunto de datos
Diez medidas del diámetro de un cilindro fueron anotadas por un científico como 3.88, 4.09, 3.92, 3.97,
4.02, 3.95, 4.03, 3.92, 3.98 y 4.06 centímetros. Hallar la media aritmética de tales medidas.
3.98 cm
El señor Nelson Ortega quiere tener sólo dos hijas. Suponiendo que las probabilidades de tener un niño
o una niña son iguales, determine la probabilidad de éxito para que sea en exactamente dos partos.
P(E)= 1/4
Principio de conteo formula de la multiplicación es:
Si hay m formas de hacer una cosa y n formas de hacer otra cosa, hay m x n formas de hacer ambas cosas.
Calcular la media, varianza y desviación estandar de los siguientes datos: valores de x= (2,8,10) y
P(x)=(0,5; 0.3 y 0,2)
Media= 5,40; varianza= 12,04 y desviación estándar= 3,47
La probabilidad de conseguir un total de 7 puntos al menos una vez en dos lanzamientos de dos dados
es:
5/18.
Un tamaño de muestra grande es?
Mayor o igual a 30
Un intervalo de confianza puede definirse como:
Un rango de valores, derivados de los estadísticos de la muestra, que posiblemente incluya el valor de un
parámetro de población desconocido.
La Distribución T Student se utiliza cuando el número de muestra es:
Menor o igual a 30
Los nombres de los límites de confianza son:
Límite superior de confianza y límite inferior de confianza
La prueba de cola izquierda es una prueba de hipótesis en la que un valor de la muestra
significativamente menor que el valor crítico de la población lleva a:
Rechazar hipótesis nula
Las variables en un análisis de regresión y correlación son de dos clases:
Dependiente e independiente
¿En qué distribución de probabilidades las pruebas no son independientes?
Hipergeometrica.
El señor Nelson Ortega quiere tener sólo dos hijas. Suponiendo que las probabilidades de tener un niño
o una niña son iguales, determine la probabilidad de éxito para que sea en exactamente tres partos.
P(E)= 3/8
La biblioteca de la universidad tiene cinco ejemplares de un cierto texto de reserva. Dos ejemplares (1
y 2) son las primeras impresiones y las otras tres (3,4 y 5) son segundas impresiones. Un estudiante
examina estos libros en orden aleatorio, deteniéndose sólo cuando selecciona una segunda impresión.
Dos posibles resultados son 5 y 2, 1, 3. Haga una lista de los resultados posibles:
3,4,5,13,14,15,23,24,25,123,124,125,213,214,215.
La media de los pesos de 500 estudiantes de un cierto colegio es de 151 libras y la desviación típica es
de 15 libras. Suponiendo que los pesos se distribuyen normalmente hallar cuántos estudiantes pesan
entre 120 y 155 libras:
300.
Se está investigando la seguridad de una peligrosa intersección. Los registros policiacos indican una
media de cinco accidentes mensuales en esta intersección. El número de accidentes está distribuido de
acuerdo con una distribución de Poisson y se desea calcular la probabilidad de que en cualquier mes
ocurra exactamente 1 accidente. El valor de esta probabilidad será entonces:
0.03370
La temperatura durante septiembre está distribuida normalmente con una temperatura media de 18,7°C
y desviación estándar de 5°C. La probabilidad de que la temperatura en Septiembre esté sobre los 21°C
es:
0.3228
La media de los pesos de 5000 estudiantes de un Instituto Tecnológico de Carreras Informáticas es 70
kg y la desviación típica es 3 kg. Suponiendo que se distribuyen normalmente, los estudiantes que pesan
menos de 60 kg son:
2
Al hablar de pruebas de hipótesis de una cola, se puede tener:
De cola izquierda y de cola derecha
Al hablar de una prueba de hipótesis de cola derecha quiere decir que:
La hipótesis alternativa involucra un “mayor que” o un “mayor que o igual” como signo.
Cuantos tipos de variables aleatorias conoce:
Continua y discreta.
Una de las características que identifican la distribución Binomial es:
El resultado de cada prueba en un experimento es mutuamente excluyentes
Una de las siguientes características, es de la probabilidad Poisson es:
La varianza y la media son iguales
El coeficiente de correlación se define como:
la raíz cuadrada del coeficiente de determinación.
La biblioteca de la universidad tiene cinco ejemplares de un cierto texto de reserva. Dos ejemplares (1
y 2) son las primeras impresiones y las otras tres (3,4 y 5) son segundas impresiones. Un estudiante
examina estos libros en orden aleatorio, deteniéndose sólo cuando selecciona una segunda impresión.
Dos posibles resultados son 5 y 2, 1, 3. Si B es un evento cuando el libro 5 es seleccionado, ¿Cuáles
resultados están en B?
B= 5, 15, 25, 125,215.
Si la probabilidad de que un individuo sufra una reacción por una inyección de un determinado suero
es de 0.001, la probabilidad de que de un total de 2000 individuos exactamente tres tengan reacción (use
la aproximación de Poisson a la binomial):
0.180
Se tiene una moneda y se la lanza por tres oportunidades, la probabilidad de obtener dos caras en estos
tres lanzamientos es:
0.375
Martha Gómez una ingeniera de seguridad en carreteras, decide probar la capacidad de un puente que
tiene 20 años. Dispone de una gran cantidad de pruebas similares en el mismo puente. Si la capacidad
de carga mínima de este puente debe ser de 10 toneladas. ¿Qué tipo de prueba de hipótesis usará?
De una cola
En la transmisión de información digital, la probabilidad de que un bit sufra una distorsión alta,
moderada o baja es 0.01, 0.04 y 0.95, respectivamente. Suponga que se trasmiten tres bits y que la
cantidad de distorsión en cada uno de ellos es independiente. ¿Cuál es la probabilidad de que dos bits
tengan una distorsión alta y uno una distorsión moderada?
0,000012
Se extraen 3 cartas de una baraja de 52. La probabilidad de que dos sean jotas y una rey es: 6/5525
En la prueba de dos colas, la hipótesis nula se rechaza si la muestra es significativamente:
Mayor o menor que el valor hipotético (valor crítico) del parámetro de la población.
Defina que es una Muestra:
Grupo de unidades seleccionadas de un grupo mayor (la población), que se espera obtener conclusiones sobre
la población.
¿Qué son los puntos medios de clase o marcas de clase?
Son la suma entre el límite superior de una clase específica y el inferior de la misma, todo esto dividido para
dos.
El promedio entre un número natural y su antecesor es 3.5. ¿Cuál es el sucesor del número?
5.
El histograma y el polígono de frecuencias nos permite visualizar:
Donde tiende a acumularse los datos, los valores máximos y mínimos en forma general
Los salarios de cuatro individuos es $15.000, $16.000, $16.500 y $40.000, ¿Puede decirse que ese
promedio es típico de dichos salarios?
No es típico
Los pasos para construir una distribución de frecuencias en datos agrupados es:
Calcular el número de clases, determinar el intervalo de clase, establecer los límites de cada clase, colocar las
observaciones en cada una de las clases.
La clasificación de una distribución por la Curtosis es:
Leptocúrtica, Platicúrtica, Mesocúrtica.
La relación entre las medias : aritmética, geométrica (G) y armónica (H) es
Armónica menor o igual que la geométrica menor o igual que la media aritmética.
La media de la distribución de probabilidad es igual a:
Se multiplica cada valor x por la probabilidad de que ocurra y se suma los productos.
El tipo de fuente de datos primarios son:
Datos que deben recogerse específicamente para el análisis deseado en el campo, designando su
nomenclatura, unidades y cantidad de decimales de acuerdo a la precisión y exactitud del proyecto
Si p es el mayor de tres números consecutivos, entonces, el promedio de ellos es:
p-1
Un hospital emplea 200 personas en su cuerpo de enfermería. De ese personal, 50 son ayudantes de
enfermera, 50 son enfermeras prácticas y 100 son enfermeras registradas. Las primeras reciben un
sueldo de $ 8 (dólares) por hora; las segundas, uno de $ 10, y las últimas de $ 14. ¿Cuál es el valor medio
ponderado del sueldo?
11.5
Tabla de contingencia es:
Es una variable que puede tomar solo valores de un conjunto predeterminado.
Variable aleatoria discreta es:
Es una variable que puede tomar solo valores de un conjunto predeterminado.
En la nomenclatura de fórmula de la probabilidad Binomial es:
C=una combinación, n=el número de pruebas; x= variable aleatoria definida como el número de éxitos; p=
probabilidad de un éxito en cada prueba.
Si las alturas de 300 estudiantes se distribuyen normalmente con media de 68 pulgadas y desviación
típica de 3 pulgadas, cuántos estudiantes tienen alturas mayores de 72 pulgadas:
20
La distribución normal es una distribución de probabilidad de variable:
Continua
En una prueba de hipótesis, la suposición que deseamos probar se llama:
Hipótesis nula
Cuando se sondeó una muestra de 70 ejecutivos de ventas respecto al bajo desempeño, durante
noviembre, en las industrias de tecnología, el 66% pensó que la disminución en las ventas se debía a
las temperaturas inusualmente altas, haciendo que los consumidores retrasaran sus compras. Los
límites de confianza para esta proporción dado un nivel del 95% de confianza es: (0.549 , 0.771
Si la pendiente es positiva en un gráfico X-Y al hacer el análisis de regresión y correlación, podemos
indicar que la relación es:
Inversa
Los Niveles de medición son:
Nominal, Ordinal, de intervalo y de razón
¿Es posible determinar la moda para las siguientes medidas de medición?
Nominal, Ordinal, de razón y de Intervalo.
Las variables cuantitativas son:
Es aquella que cuyos valores se pueden expresar como cantidades numericas como: peso en libras, número
de clientes, estatura, distancia de una ciudad a otra.
El Nivel de medición de razón es:
Consiste en medidas numericas por las cuales las distancias entre los números tienen un tamaño constante y
conocido, y donde la razón entre los números tiene algún significado, además existe un punto cero fijo no
arbitrario
Cualquier característica medible de una población recibe el nombre de:
Parámetro
¿Cuáles de las medidas de medición poseen una media aritmética?
Razón e Intervalo
En la transmisión de información digital, la probabilidad de que un bit sufra una distorsión alta,
moderada o baja es 0.01, 0.04 y 0.95, respectivamente. Suponga que se trasmiten tres bits y que la
cantidad de distorsión en cada uno de ellos es independiente. ¿Cuál es la probabilidad de que tres bits
tengan una distorsión baja?
0,8574
Una de las siguientes características, es de la probabilidad Poisson es:
El número de veces que se presenta un evento durante un intervalo específico.
La biblioteca de la universidad tiene cinco ejemplares de un cierto texto de reserva. Dos ejemplares (1
y 2) son las primeras impresiones y las otras tres (3,4 y 5) son segundas impresiones. Un estudiante
examina estos libros en orden aleatorio, deteniéndose sólo cuando selecciona una segunda impresión.
Dos posibles resultados son 5 y 2, 1, 3. Si C es un evento cuando el libro 1 no se examina, ¿Cuáles
resultados están en C?
C= 3, 4, 5, 23, 24,25
Hallar la probabilidad de que en una familia con cuatro hijos tenga al menos un niño:
15/16
Las distribuciones de probabilidad se clasifican en:
Discretas y Continuas
Analizando la gráfica de una distribución normal podemos afirmar que:
Las dos colas de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje
horizontal.
Variable es:
Es un elemento de interés que puede tomar muchos valores numéricos diferentes.
La media aritmética de tres números es 2n. Si dos de ellos son -4n y 8n, entonces ¿Cuál es el tercero?
2n
Una distribución simétrica es:
La que representada por una curva que puede dividirse con una línea vertical en dos partes iguales que son
como imágenes en un espejo.
La media de una distribución de probabilidad también recibe el nombre de:
Valor esperado
Se está investigando la seguridad de una peligrosa intersección. Los registros policiacos indican una
media de cinco accidentes mensuales en esta intersección. El número de accidentes está distribuido de
acuerdo con una distribución de Poisson y se desea calcular la probabilidad de que en cualquier mes
ocurra exactamente 2 accidente2. El valor de esta probabilidad será entonces:
0.08425
El muestreo estratificado es un tipo de muestreo:
Aleatorio
Si decimos que el nivel de confianza en una prueba de hipótesis de dos colas es del 95%, entonces el z
crítico a utilizar es:
1.96
Si se indica que el nivel de confianza en una prueba de hipótesis es del 99%, decimos que el nivel de
significancia es:
0.01
El coeficiente de determinación se identifica como:
R2
H es un conjunto de números consecutivos entre -5 y 6, incluido ambos números. ¿Cuál es la media
aritmética de los elementos de H?
1/2 .
Si el examen final de un curso cuenta tres veces más que una evaluación parcial, y un estudiante tiene
calificación 85 en el examen final y 70 y 90 los dos parciales la calificación media es:
83
Algunos ejemplos de la variable cualitativa o atributo son:
El género (masculino, femenino), religión, lugar de nacimiento.
Un experimento tiene dos eventos A y B mutuamente excluyentes, en donde A es cinco veces tan
probable como B. Determine P(A) y P(B).
P(A)=5/6 ; P(B)= 1/6
En una encuesta realizada por la American encontró que 60% de sus socios hicieron alguna reservación
en una línea aérea el año pasado. Se toman dos integrantes al azar. ¿Cuál es la probabilidad de que
ambos hayan hecho una reservación en alguna línea área?
0.36
Un tamaño de muestra pequeña es?
Menor que 30
Son puede definir como variable independiente a:
La variable ausente en el análisis de regresión.
Los tipos de variables son:
Discreta y Continua
Las reglas para calcular la probabilidad tenemos
Regla especial y general de la adición, del complemento,regla especial y general de la multiplicación.
La distribución de Poisson es un ejemplo de distribución de probabilidad de variable:
Discreta
Se sabe que el promedio del siguiente grupo de datos 2,4,6,8,x es 10 ¿Cuál es el valor de x?
30 .
En una distribución de probabilidad continua, la variable que se considera puede tomar:
Cualquier valor dentro de un intervalo dado.
Si se indica que el nivel de confianza en una prueba de hipótesis es del 90%, decimos que el nivel de
significancia es:
0.1.
¿Qué es Estadística?
Ciencia que recoge, organiza, presenta y analiza e interpreta datos con el fin de propiciar la toma de decisiones
más eficaz.
¿Cuál es la diferencia entre un diagrama de barras y un histograma?
El diagrama de Barras se utiliza con frecuencia para datos nominales y ordinales y el histograma para datos
con escala de intervalos o de razón.
La biblioteca de la universidad tiene cinco ejemplares de un cierto texto de reserva. Dos ejemplares (1
y 2) resultados son son las primeras impresiones y las otras tres (3,4 y 5) son segundas impresiones.
Un estudiante examina estos libros en orden aleatorio, deteniéndose sólo cuando selecciona una
segunda impresión. Dos posibles 5 y 2, 1, 3. Si A simboliza el evento cuando exactamente un libro es
examinado, ¿Cuáles resultados están en A?
A= 3, 4,5.
Cuál es una técnica de enmascaramiento?
Simple ciego.
Valores atípicos son:
Observaciones que se lejana, en valor, del resto de datos, es decir es un dato inusualmente grande o
inusualmente pequeño, comparado con los otros.
El promedio entre un número natural y su antecesor es 19.5. ¿Cuál es el número?
20
Valor esperado de una variable aleatoria discreta es:
El valor promedio de la variable aleatoria despues de un numero grande de observaciones
Un 10% de los utensilios producidos en un cierto proceso de fabricación resulta ser defectuoso. La
probabilidad de que de una muestra de 10 utensilios elegidos al azar sean exactamente dos los
defectuosos mediante la aproximación de Poisson a la binomial es:
0.184
El valor de la varianza puede ser:
Cero si todas las observaciones son las mismas
Los ingresos netos diarios de una muestra de industriales de acero en Quebec son (en millones de
dólares): $96.70, $67.10, $89.70, $96.70, $91.40,$ 96.70,$82.60. Cuál es la media de los ingresos?
88.7
Una de las siguientes características es de la probabilidad Hipergeométrica:
Los ensayos no son independientes.
La probabilidad de extracción de una extracción de una baraja de 52 cartas de un rey, as, jota de tréboles
o reina de diamantes es:
5/26
La probabilidad de la aparición de un número impar en una tirada de un dado es:
1/2
El Nivel de medición de intervalo es:
Es un conjunto de valores numéricos para los que la distancia entre números sucesivos es de tamaño constante
y medible
El rango como medida de dispersión proporciona:
Información ilimitada por que se basa en solo dos medidas (el mayor y menor) de las observaciones.
La edad promedio de un grupo de 5 amigos es de 17.4 años. Si se incorpora al grupo un amigo de 18
años. ¿Cuál es la edad promedio del nuevo grupo?:
17.5 años
Se sabe que la media del consumo de energía eléctrica en cierta provincia es de 721 kwh. Una empresa
tecnológica de la región cree que sus empleados consumen más que el promedio provincial, para lo
cual recoge información e 20 empleados obteniéndose una media de consumo de 745 kwh con una
desviación del 49,63. A un nivel de significancia del 10%, ¿hay evidencia para afirmar que el consumo
promedio de energía eléctrica hogareño de los empleados de la empresa es superior a la media del
consumo a nivel provincial?
Si
La gráfica de pastel se la utiliza para:
Representar en forma gráfica en 360 grados, la parte o porcentaje de cada clase del total de observaciones,
individuos o ítems.
Si se indica que el nivel de confianza en una prueba de hipótesis es del 95%, decimos que el nivel de
significancia es:
0.05
Los ingresos netos diarios de una muestra de industriales de acero en Quebec son (en millones de
dólares): $96.70, $67.10, $89.70, $96.70,$91.40,$96.70,$82.60.Cual es ingresos neto?
96.7
Una distribución de probabilidad es:
Es la enumeración de los valores posibles que puede tomar una variable aleatoria junto con sus probabilidades.
El símbolo! significa:
Factorial.
Los tipos de fuente de datos son:
Datos primarios y secundarios
¿Qué es una variable?
Es un elemento de interés que puede tomar muchos valores numéricos diferentes.
Una distribución simétrica es:
Cuando en una distribución las medidas de moda, mediana y media aritmética se encuentran en un mismo lugar
central de la misma.
Una distribución asimétrica hacia la derecha es:
Cuando en una distribución se encuentra la moda, la mediana y después la media aritmética.
Una distribución asimétrica hacia la izquierda es:
Cuando en una distribución se encuentra la media aritmética, la media, y después la moda.
Hallar la probabilidad de que en tres lanzamientos aparezcan dos caras y un sello:
3/8
En la distribución de probabilidad discreta está permitido considerar:
Sólo un número limitado de valores
Sesgo es:
El grado de asimetría de una distribución.
Cinco oficinistas cobran $4.52, $5.28, $5.75, $5.96 y $11.20, de acuerdo a los datos calcule la media
aritmética, ¿Cuál de las dos es más representativa?
La media= $ 6.54; la mediana es la más representativa que la media aritmética
Estadístico es:
Característica de una muestra

También podría gustarte