Biologia-Prueba Diagnóstica de Estadística II

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

Elisa Barboza Benavides

Melissa Pérez Acevedo

Departamento de Educación y Ciencias


Programa de Biología
Bioestadística II

Prueba Diagnóstica
Con la intención de saber las fortalezas y debilidades que usted tiene en su proceso de
formación en la línea de la estadística los invito a que realicen las siguientes actividades
en equipos de 3 integrantes. Pueden utilizar herramientas electrónicas de apoyo en su
realización, pero sería conveniente mostrar procedimientos cuando se les solicite en el
desarrollo de los ejercicios:

Ejercicio 1. Se inició una investigación para averiguar el número de bacterias que


aparecen en determinados cultivos. Para ello, se tomaron 40 de estos cultivos y se contó
el número de bacterias, xi , que aparecieron en cada uno de ellos.

a) Obtener las frecuencias relativas, relativas acumuladas y absolutas acumuladas


b) Representar la distribución de frecuencias absolutas
c) Porcentaje de valores menores o iguales a 3.
d) Porcentaje de valores mayores que 5.

A)
Xi 0 1 2 3 4 5 6
Ni 1 12 22 34 26 14 0
               
marca de
Xi f F fr fr (%) Fr Fr (%) clase
0 1 1 0,01 1% 0,01 1% 0
1 12 13 0,11 11% 0,12 12% 1
2 22 35 0,20 20% 0,32 32% 2
3 34 69 0,31 31% 0,63 63% 3
4 26 95 0,24 24% 0,87 87% 4
5 14 109 0,13 13% 1,00 100% 5
6 0 109 0,00 0% 1,00 100% 6
  109            
B)

HISTOGRAMA DE f
40
35 34

30
26
25 22
20
15 14
12
10
5
1 0
0
0 1 2 3 4 5 6

           
PUNTO C          
en este estudio se obtuvo un porcentaje de un 63% en valores menores o iguales a 3
           
PUNTO D          
en este estudio se obtuvo un porcentaje de 0% en vales mayores que 5  
           

Ejercicio 2. Para obtener información acerca del porcentaje de albúmina en el suero


proteico de personas normales se analizaron muestras de 40 personas, entre 2 y 40 años
de edad, con los siguientes resultados:

Se pide:

Suponiendo que un error del 0.5 % en el porcentaje de albúmina no es importante,


agrupar las medidas de la muestra en intervalos de clase de amplitud igual a la unidad y
organizar los datos de la muestra en una tabla completa de distribución de frecuencias:
Extremos de los intervalos de clase, marcas de clase, frecuencias acumuladas,
frecuencias relativas, frecuencias absolutas acumuladas y frecuencias relativas
acumuladas

a) Hallar el tanto por ciento de personas cuyo porcentaje de albúmina en el suero


proteico está comprendido entre el 62% y 72%. En este caso, como la variable es
continua y está agrupada en intervalos de clase, es indiferente incluir o no estos
valores.
b) Hallar el % de personas de la muestra cuyo porcentaje de albúmina es superior al
72%.
c) Calcular la media, mediana, desviación absoluta media respecto de la media,
varianza, desviación típica y el coeficiente de variación de Pearson.

A)
                 
marca de
CLASE INTERVALO f F fr fr (%) Fr Fr (%) clase
1 60.4 - 63.5 7 7 0,175 17.5% 0,175 17.5% 61.95
2 63.5 - 66.6 10 17 0,25 25% 0,425 42.5% 65.05
3 66.6 - 69.7 9 26 0,225 22.5% 0,65 65% 68.15
4 69.7 - 72.8 10 36 0,25 25% 0,9 90% 71.25
5 72.8 - 75.9 3 39 0,075 7.5% 0,975 97.5% 74.35
6 75.9 - 79.1 1 40 0,025 2.5% 1 100% 77.5
    40            

numero de clase     marca de clase  


(60.4 + 63.5) /
k= 1+3.322log(40)     2= 61.95
(63.5 + 66.6) /
k= 6.32 --> 6   2= 65.05
(66.6 + 69.7) /
        2= 68.15
(69.7 + 72.8) /
Amplitud       2= 71.25
(72.8 + 75.9) /
  (max - min) / num. de clase   2= 74.35
(75.9 + 79.1) /
  (79.1 - 60.4) /6     2= 77.5
  1.87 / 6        
  3.117        
amplitud --> 3.1        
           

B)
PUNTO B                
El 90% de las personas bajo estudio presentaron entre el 62% y el 70% de albúmina en el suero proteico  
                 

C)
             
El 10% de las personas bajo estudio presentaron un valor del 72% de albúmina en el suero proteico
               

D)
media   mediana  
∑= 2705.1 Me = (67.5+ 67.8) / 2
∑/n= 2705.1/40 Me = 135.3 / 2
∑/n= 67.628 Me = 67.65
x̄= 67.628    
   

desviación absoluta media respecto de la media  


INTERVALO xi fi |xi- x̄| |xi- x̄| fi
60.4 - 63.5 61.95 7 -5.678 -39.746
63.5 - 66.6 65.05 10 -2.578 -26
66.6 - 69.7 68.15 9 0.522 4.698
69.7 - 72.8 71.25 10 3.622 36.22
72.8 - 75.9 74.35 3 6.722 20.166
75.9 - 79.1 77.5 1 9.872 9.872
    40   5.21
         
  x̄= 67.628    
  Dx̄= 5.21/40    
  Dx̄= 0.13025    

INTERVALO xi fi xi fi xi-x̄ (xi-x̄)2 (xi-x̄)2 fi


60.4 - 63.5 61,95 7 433.65 -6 36 252
63.5 - 66.6 65,05 10 650.5 -3 9 90
66.6 - 69.7 68,15 9 613.35 0 0 0
69.7 - 72.8 71,25 10 712.5 3 9 90
72.8 - 75.9 74,35 3 223.05 7 49 147
75.9 - 79.1 77,5 1 77.5 10 100 100
    40 2710.55   203 679
x̄= 68      
varianza 679/40 = 16.975      
             
variacion tipica
=            

σ2= √ 16.975          
σ2= 4.12          
             
coeficiente de variación de Pearson.
σ/x̄= 16.975/ 68  
σ/x̄= 0.2510  
     

Ejercicio 3. En un parque natural se está realizando un estudio sobre el recorrido que


realizan los pájaros. Para ello se estudió la distancia de vuelo desde el punto en que se
soltó un pájaro recién anillado hasta su primera posada. Los siguientes datos
corresponden a dos tipos de pájaros:

Se pide:
a) La media, mediana de cada grupo ¿Son semejantes los conjuntos con respecto a
alguna de las medidas?

Media Estorninos: 127,875


Mediana Estorninos: 119,5
Media Vencejos: 296,525
Mediana Vencejos: 133,75
No son semejantes en ninguna medida

b) Obsérvese que el último dato del segundo grupo es muy diferente al resto; este dato
recibe el nombre de outlier o dato atípico. Para comprobar su efecto: eliminar el dato y
calcular la media y mediana para los restantes. ¿Qué medida está menos afectada por
la presencia del dato atípico?

Media: 142,736842
Mediana: 133,2
La medida menos afectada es la mediana

c) La varianza y desviación típica de cada grupo. ¿Son estas medidas de variabilidad


resistentes al dato atípico?

Varianza Estornino: 1275,11566


Desviación: 35,7087616

Varianza Vencejos: 474597,305


Desviación: 688,91023

Varianza sin dato atípico: 1669,20801


Desviación sin dato atípico: 40,8559422
No son resistentes puesto que en el grupo donde hay un dato atípico al quitarlo y
calcular nuevamente la varianza y desviación típica este valor cambio drásticamente.

d) ¿Alguna de estas distribuciones es sesgada? Si es así, ¿en qué dirección?

Si son sesgadas porque las medias y las medianas son diferentes. En todas las
distribuciones es segada hacia la derecha, es decir, que la media es mayor que la
mediana

e) ¿Qué grupo tiene el rango intercuartílico más grande?

RI Estorninos: 32,6
RI Vencejos: 80,8
El rango intercuartil más grande es el del grupo de los Vencejos

f) ¿Qué grupo posee variabilidad más grande?


g) ¿Qué grupo es más simétrico?

Ejercicio 4: Se han estudiado los pesos (Kg) y las tallas (cm) correspondientes a un grupo
de individuos, obteniendo la siguiente información:

A) El peso y la talla media.

 X/Y  160 162  164  166   168  170  ni

 48 3 2 2 1 0 0 8

 51 2 3 4 2 2 1 14

 54 1 3 6 8 5 1 24

 57 0 0 1 2 8 3 14

 60 0 0 0 2 4 4 10

ni  6 8 15 19 9 n=70
xi ni xi ni
48 8 384
51 14 714
54 24 1296
57 14 798
60 10 600
3792
yi ni yi ni
160 6 960
162 8 1296
164 13 2132
166 15 2490
168 19 3192
170 9 1530
11600
1 1
x̄= n ∑xini y = n ∑yini

1 1
x̄= 70 3.792 y = 70 ∑11.600

x̄=54.1714 y=165.714
que miden 164 o el de los que miden 168?

xi ni xi ni xi ni2
48 2 96 4608
51 4 204 10404
54 6 234 17496
57 1 5 3249
60 0 0 0
  13 681 35757

∑ nixi
x̄= n = 681/ 13= 52.3856

∑ nixi 53757
σ2= – x2 = - 52,38462  σ 2 = 6.3921
n 13

σ = √ σ2  σ = √ 6.39212

σ =2,528

σ 2,528
CV= =  CV= 0.0482
x̄ 52,3856

Ejercicio 5: En una región se observó durante algunos años el precio de la leche y la


cantidad de leche que consumían, obteniéndose los resultados que muestra la siguiente
tabla:

donde X denota el precio de la leche e Y la cantidad de leche en miles de litros.


Considerando X agrupada en intervalos de amplitud 5 y siendo 30 el límite inferior del
primer intervalo. Construir la tabla bidimensional.
a) ¿Cuál es el precio medio de la leche? ¿Y la producción media?
b) ¿Cuál es el precio más habitual de la leche cuando la producción es superior a
120.000 l.?
c) ¿Cuál es el porcentaje de años en que el precio de la leche fue superior a 47?
d) En los años en que el precio de la leche oscila entre 35 y 55, ¿Cuál es la cantidad
máxima de litros del 30% de las menores producciones?
Ejercicio 6: Se realiza un estudio para investigar la relación entre el nivel de humedad del
suelo y la tasa de mortalidad en lombrices. La tasa de mortalidad, Y, es la proporción de
lombrices de tierra que mueren tras un periodo de dos semanas; el nivel de humedad, X,
viene medido en milímetros de agua por centímetro cuadrado de suelo. Los datos se
muestran en la siguiente tabla. Se pide:
a) ¿Muestran los datos una tendencia lineal?
b) Determinar el grado de asociación lineal entre la tasa de mortalidad y el nivel de
humedad y la bondad del ajuste realizado en la recta de regresión.
R/ 0,540245114

Sxy
r=
SxSy
0 ,35618182
Sxy = ∑ ¿¿ ¿ = = 0,032380165
11
∑2=
Sx=
√ ( x−x́ )

∑2=
N
√1,030472727
11
= 0,306070807

Sy=

r=

Sxy
N
=
( y− ý )

0,032380165
0,421818182
11
= 0,195824175

= 0,540245114
SxSy 0,306070807 x 0,195824175

Tiempo estimado: Entregar el lunes 15 de marzo de 2021

También podría gustarte