TALLER 1 Bioestadística Fundamental 2024 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

UNIVERSIDAD NACIONAL DE COLOMBIA

Facultad de Ciencias - Departamento de Estadı́stica


TALLER I

Curso: Bioestadı́stica Fundamental


Código: 1000012-B
Docente: Juan Fernando Salamanca Amaya
Correo: jfsalamancaa@unal.edu.co

Instrucción
El taller debe ser subido al Moodle del curso como un archivo PDF. La fecha lı́mite para la entrega es el
dı́a del primer parcial, según lo establecido en el programa del curso. Los grupos deben estar conformados
por un máximo de 4 o 5 integrantes. Este equipo será el que trabajará durante el semestre.

• Parte 1. Estadı́stica Descriptiva: Se permite el uso de cualquier herramienta computacional


para el procesamiento de datos. Sin embargo, se deben presentar únicamente tablas, gráficas y
resultados numéricos concretos, conservando dos decimales como establecidos en cada punto. No
se presentaran para este punto archivos de Excel ni código R.

• Parte 1. Fundamentos de Probabilidad y variables aleatorias: Todos los ejercicios plantea-


dos deben tener un procedimiento y un resultado establecidos con un (1) decimal, si es necesario.

Estadı́stica Decriptiva:
1. Determine para cada una de las siguientes variables de qué tipo son (Nominal, ordinal, discreta y
continua):

a) Hora del dı́a


b) Cantidad de pacientes en una clı́nica
c) Nombre de la especie de un ave tropical
d) Color de un medicamento
e) Número de veces que una persona come al dı́a
f) Edad en años de los sujetos que participan en un determinado estudio
g) Tipo de transporte que utiliza un grupo de estudiantes para poder llegar, desde sus viviendas,
a la institución educativa correspondiente.
h) Nivel de calidad de un medicamento (Bajo, Medio o Alto)
i) Porcentaje de niños y niñas menores de 15 años de edad en el paı́s, que actualmente sufren
de desnutrición severa.
j) Número de medicamentos vencidos en una determinada droguerı́a
k) Percepción de una persona con respecto al tratamiento que recibió para recuperarse de una
determinada lesión (Pésimo, Regular, Bueno o Excelente).
l) Tiempo en años que puede tardar cierto bovino para tener su primera crı́a
m) Nombre de un medicamento
n) Número de mariposas Monarcas en un mariposario
o) Porcentaje de estudiantes del sexo masculino en una determinada universidad
p) Nombre de la posible causa de esguince de tobillo que puede tener una persona
q) Nombre de un determinado tratamiento fisioterapéutico
r) Tiempo en minutos que tarda un perro de raza Pug en realizar una determinada actividad.

1
s) Número de personas del sexo femenino menores de edad (¡ 18 años) que se encuentran en
estado de embarazo.
t) Nivel de calidad del alimento que recibe un grupo de estudiantes (Bajo, Moderado o Alto),
en el comedor de la institución educativa donde realizan sus estudios.
u) Número de niños con TEA (Trastorno del Espectro Autista) en una ciudad
v) Nivel de ansiedad de un niño (Bajo, Moderado o Alto)
2. En un estudio realizado a una muestra de 26 clı́nicas de una determinada ciudad, se determinó para
cada una de ellas el número de pacientes que actualmente están atendiendo por fracturas abiertas.
Los datos recolectados se presentan a continuación:

13 5 19 0 2 16 7 10 12 2 1 0 22
15 0 13 9 11 13 7 0 0 2 6 15 0

a) Determinar si se está analizando una población o una muestra.


b) Determinar cuáles o quiénes son los individuos de estudio.
c) Determinar cuál es la variable de estudio.
d) Determinar si la variable de estudio es cualitativa o cuantitativa y su correspondiente escala
de medición.
e) Calcular el porcentaje de clı́nicas que no están atendiendo actualmente pacientes por fracturas
abiertas.
f) Calcular el porcentaje de clı́nicas que están atendiendo actualmente más de 10 pacientes por
fracturas abiertas.
g) Calcular el porcentaje de clı́nicas que están atendiendo actualmente 2 pacientes o menos por
fracturas abiertas.
h) Suponer que se realiza un agrupamiento del conjunto de datos presentado anteriormente con
seis intervalos de la forma, los cuales se presentan a continuación: [0 − 3], [4 − 7], [8 − 11], [12 −
15], [16 − 19], [20 − 23]. Teniendo en cuenta estas clases o intervalos, realizar una presentación
tabular de los datos relacionados que incluya, además de los intervalos mencionados, las
columnas Marca de clase, Frecuencia absoluta, Frecuencia acumulada, Frecuencia relativa y
Frecuencia relativa acumulada.
3. A continuación se presentan las tasas de mortalidad por una determinada enfermedad (por 100.000
habitantes), registradas en una población de 40 ciudades latinoamericanas en el mes de diciembre
de 2014:

Ciudad No. Tasa de mortalidad Ciudad No. Tasa de mortalidad


1 8.57 21 15.2
2 19.7 22 15
3 13.7 23 13.2
4 14.5 24 18
5 14.3 25 9.38
6 16.9 26 15.5
7 12.8 27 9
8 11.8 28 18.5
9 10.6 29 18.4
10 12.2 30 10
11 11.2 31 20.1
12 14.3 32 16.8
13 12.6 33 11.6
14 11.6 34 16
15 14.3 35 17.3
16 12.2 36 13.9
17 15 37 11.8
18 16.5 38 20.5
19 20.8 39 12
20 9.02 40 16.5

2
Teniendo en cuenta la información anterior, resuelva:

a) Determine cuál es la variable de estudio.


b) Determine la escala de medición de la variable en estudio.
c) Construya una tabla de distribución de frecuencias para datos agrupados usando la regla de
Sturges
d) Realice un histograma para la variable Tasa de mortalidad por la enfermedad, haciendo uso
de los datos agrupados en el inciso c).
e) Consulte qué es y cómo se realiza la ojiva, y realice ésta para la variable Tasa de mortalidad
por la enfermedad, haciendo uso de los datos agrupados en el inciso c).

4. Los siguientes datos se refieren al peso en libras de jóvenes pacientes de sexo femenino con anorexia
después de un determinado tratamiento.

80.2 80.1 86.4 86.3 76.1


78.1 134.1 86.7 73.5 84.6
77.4 79.5 89.6 81.4 81.4
77.3 84.2 75.4 79.5 73.0
88.3 84.7 81.4 81.2 88.2
78.8 82.2 85.6 81.4 81.9
76.4 103.6 98.4 93.4 73.4
82.1 96.7 95.3 82.4 72.5
90.9 71.3 85.4 81.6 89.1
83.9 82.7 75.7 82.6 100.4
85.2 83.6 84.6 96.2 86.7
95.2 94.3 91.5 91.9 100.3
76.7 76.8 101.6 94.9 75.2
77.8 95.5 90.7 92.5 93.8

a) Realice un diagrama de cajas y bigotes para ese conjunto de datos.


b) Construya una tabla de distribución de frecuencias para datos agrupados usando la regla de
Scott
c) Realice un histograma para la variable con la distribución de los datos el inciso anterior.
d) Calcule media, moda, varianza, desviación estándar, coeficiente de variación, percentil 20,
decil 2, mediana, per- ´ centil 50, decil 5, cuartil 2, percentil 35, cuartil 2, percentil 25, cuartil
3 y percentil 75.

Fundamentos de Probabilidad y Variables Aleatorias.


1. El siguiente diagrama de Venn presentado en la figura 1, contiene tres eventos A, B y C:

3
Figure 1: Diagrama de Venn para los tres eventos A, B y C.

Teniendo en cuenta la figura anterior, sombree la región que corresponde a cada uno de los siguientes
eventos:
• A∩B
• A∩B∪C
• B∪C
• (B ∪ C)c
• A ∩ Bc ∪ C
2. Una muestra de 100 pacientes de un hospital fue clasificada de acuerdo a la respuesta al tratamiento
del sı́ndrome de hombro doloroso. La clasificación es hecha por sexo y por tiempo de evolución de
la sintomatologı́a (que puede ser normal y alta). La clasificación de los 100 pacientes se resume a
continuación:

Sexo Masculino Sexo Femenino


Tiempo Normal 80 9
Tiempo Alto 6 5

Denota como A el evento en el que un paciente es de sexo femenino, y denota como B el evento en
el que un paciente tiene tiempo normal en la evolución de la sintomatologı́a. Determine el número
de pacientes en los eventos A ∩ B, Ac y A ∪ B.
3. Se te da P (A ∪ B) = 0.7 y P (A ∪ B ′ ) = 0.9. Calcule P (A)
4. Un estudio de los hábitos de visualización de un grupo durante el último año reveló la siguiente
información:

4
(a) 28% vio gimnasia
(b) 29% vio béisbol
(c) 19% vio fútbol
(d) 14% vio gimnasia y béisbol
(e) 12% vio béisbol y fútbol
(f) 10% vio gimnasia y fútbol
(g) 8% vio los tres deportes.
Calcule el porcentaje del grupo que no vio ninguno de los tres deportes durante el último año.

5. La probabilidad de que una sutura intradérmica, que se mantenga seca, se infecte durante el tiempo
de recuperación de un paciente, es del 1%. Si la herida se moja, la probabilidad de infección durante
el perı́odo de recuperación será del 5%. Datos históricos refieren que el 90% de los pacientes logran
mantener secas las suturas y que el 10% las mantienen mojadas. ¿Cuál serı́a la proporción de
pacientes que infectarı́an sus suturas durante el perı́odo de recuperación?

6. En cierta región del paı́s se sabe por experiencia que la probabilidad de seleccionar un adulto mayor
de 40 años de edad con cáncer es 0.05. Si la probabilidad de que un doctor diagnostique de forma
correcta que un adulto mayor de 40 años de edad con cáncer tiene la enfermedad es 0.78, y la
probabilidad de que diagnostique de forma incorrecta que un adulto mayor de 40 años de edad sin
cáncer tiene la enfermedad es 0.06, resuelve:
a) ¿Cuál es la probabilidad de que a un adulto mayor de 40 años de edad de la región se le
diagnostique cáncer? b) Si a un adulto mayor de 40 años de edad de la región le fue diagnosticado
cáncer, ¿cuál es la probabilidad de que no tenga la enfermedad?
7. El espacio muestral de un experimento aleatorio es {a, b, c, d, e, f} y cada resultado es igualmente
probable. Una variable aleatoria es definida como se describe a continuación:

Resultado a b c d e f
X 0 0 1.5 1.5 2 3

Escriba la función de probabilidad de X.


8. Considere la función de probabilidad de la variable aleatoria X dada a continuación y calcule las
probabilidades indicadas:

x −2 −1 0 1 2
P (X = x) 18 2
8
2
8
2
8
1
8

a) P (X ≤ 2)
b) P (X > −2)
c) P (−1 ≤ X ≤ 1)
d) P (X ≤ −1 o X = 2)
9. Verifique si la siguiente función es una función de probabilidad, y, si lo es, determine las probabil-
idades solicitadas:
(
2x + 1, si x = 0, 1, 2, 3, 4
pX (x) = P (X = x) =
0, en otro caso

a) P (X = 4)
b) P (X ≤ 1)
c) P (2 ≤ X < 4)
d) P (X > −10)

5
10. Verifique cuál de las siguientes funciones realmente representa funciones de probabilidad. En el
caso de que lo sean, determine la media y la varianza de la variable aleatoria.
a)
x −2 −1 0 1 2
pX (x) 18 2
8
2
8
2
8
1
8

b)
x 0 2 4 6 8 10
pX (x) 0.1 0.09 0.2 0.15 0.16 0.2

c)
x 0 1 2 3 4 5
pX (x) −0.1 0.09 0.3 0.15 0.16 0.4

11. El contenido de magnesio en miligramos por cada 25 gr de un determinado alimento es una variable
aleatoria dada por la siguiente función de densidad de probabilidad:

x
fX (x) = , 0 ≤ x ≤ 6.
18
Ahora definamos la variable P = 10 + 2X. ¿Cuál es la esperanza de P ?
12. Están planeadas seis misiones espaciales independientes para la luna. La probabilidad estimada de
éxito en cada misión es de 0.95. ¿Cuál es la probabilidad de que por lo menos cinco misiones sean
exitosas?

También podría gustarte