ESTADISTICA DESCRIPTIVA Yeraldin Acosta

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 21

Fase 2 – Identificación de Variables Estadísticas

Presentado por:
Yeraldin Acosta Madera
Código:
1003177912

Tutor
William Fernando Cortes Palacios

Curso:
Estadística y Probabilidades a Ciencias Agrarias
Código: 300032

Universidad Nacional Abierta y a Distancia – UNAD


Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente - ECAPMA
Zootecnia
2024
Diligencie el siguiente cuadro indicando la diferencia de cada
variable:
Variables cuantitativas Variables categóricas o
nominales

Continua Discreta Nominal Ordinal

Cuando pueda Cuando Cuando la Cuando siga un


tomar cualquier presenta variable no orden
valor entre dos valores enteros presente especifico
valores ningún orden

Defina los siguientes tipos de muestreo:


Muestreo aleatorio simple:
Esto garantiza que se obtenga una muestra que sea representativa de
toda la población y que todos tengan las mismas posibilidades de ser
seleccionados.
Muestreo estratificado:
Este método divide la población en segmentos homogéneos y luego
realiza un muestreo aleatorio para definir cada sector
Muestreo por conglomerados:
Se selecciona aleatoriamente un grupo de individuos con características
diferentes pero similares. Se utilizan cuando no es posible probar todos
los elementos o individuos de una población.
Muestreo sistemático
En este se toma el primer elemento de la muestra se selecciona al
azar y los elementos posteriores se seleccionan utilizando intervalos
fijos o sistemáticos hasta alcanzar el tamaño de muestra deseado.
Indique los aspectos a tener en cuenta para elegir un tamaño
de muestra adecuado.
Se debe tener en cuenta los factores como variables, cantidad de
participantes, tamaño de la muestra y tener en cuenta que la muestra
debe ser representativa de la población.
Qué es la Regla de Sturges ¿para qué sirve?
Dice que el número de clase que tenemos que hacer en la tabla depende
del número de datos
Sirve para saber conocer cuál es el número de intervalos para una tabla
En el siguiente cuadro indique la diferencia de cada tabla de
frecuencia:

Tablas de frecuencia
Absolutas Relativas Absolutas Relativas
acumuladas acumuladas
veces que veces que se repite el dato Es la suma Es la suma
se repite de un dividido por el total de de todas las de todas las
un dato. unidades o personas frecuencias frecuencias
encuestadas, (La suma de absolutas relativas
todas la FR debe dar como anteriores anteriores
resultado 1) hasta la fila hasta la fila
actual. actual.

¿Cómo se deben organizar los datos en una tabla de


frecuencias absolutas para una variable continua?
Para organizar los datos de una tabla de frecuencia absoluta para una
variable continua se debe seguir los siguientes pasos

1. Se organizan los datos en diferentes categorías y construir la tabla

a la que cada fila corresponde una categoría.

2. Se calcula la frecuencia absoluta en cada categoría en la segunda

tabla de frecuencias

3. Se calcula la frecuencia absoluta acumulada de cada categoría en

la tercera columna de la tabla de frecuencias

4. Se calcula la frecuencia relativa de cada categoría en la cuarta

columna.
5. Se calcula la frecuencia relativa acumulada de cada categoría en la

quinta columna de la tabla de frecuencia

6. De manera opcional se pueden añadir dos columnas en las cuales

se calculan la frecuencia relativa y la frecuencia relativa

acumulada de porcentaje para eso se debe multiplicar ambas

columnas por 100

Rellene el siguiente cuadro con 5 ejemplos de variables


continuas, discretas y cualitativas relacionadas con su programa
de estudio:

VARIABLE CUANTITATIVA CUANTITATIVA CUALITATIVA


CONTINUA DISCRETA O
CATEGORICA
1. Porcentaje de número de aves Especie animal
peso de las aves en el corral
de corral
2. litros de número de crías Color de
producción de vivas en el pelaje.
leche periodo de
partos
3. kilos de número de Tamaño del
producción de decesos en huevo
carne proceso de parto
4. Temperatura de número de Genero del
galpones potrero animal
5. Área de forrajes número de Estado
peces por reproductivo.
estanque
1. VARIABLE CONTINUA:
Datos:
En Guayabal de Síquima, predomina el minifundio; se realizó un
muestreode 50 campesinos que se dedican a la actividad agropecuaria
y se les preguntó el área de sus parcelas (en fanegadas):

11,1 8,4 7,1 6,4 6,7 7,6 7,9 8,9 8,2 7,3
8,3 8,9 8,6 6,9 8,1 6,7 7,4 8,6 2,7 6,6
9,0 8,0 12,0 11,7 4,6 7,4 5,7 11,1 10,9 6,7
5,1 8,4 8,3 8,2 6,6 7,7 7,9 8,0 7,4 5,5
10,2 7,3 7,9 5,8 11,3 5,9 6,8 6,4 8,2 6,8

Hallar:
a. Media Muestral:
El primer paso es encontrar la cantidad de intervalos que podemos
formar, por tanto, hacemos uso de la regla de Sturge.
𝑘 = 1 + 3,32𝑙𝑜𝑔𝑁
𝑘 = 1 + 3,322𝑙𝑜𝑔(50) = 6,6 ≅ 5
Luego determinamos la amplitud del intervalo
𝑅𝑎𝑛𝑔𝑜 = 𝑋𝒎𝒂𝒙 − 𝑋𝑚𝑖𝑛 = 12 − 2,7 = 9,3
𝑅 9,3
𝐴= = = 1,86
𝑘 5
Área f F 𝑴𝒊
[2,7-4,6) 1 1 3,65
[4,6-6,4) 8 9 5,5
[6,4-8,2) 25 34 7,3
[8,2-10,1) 9 43 9,15
[10,1-12) 7 50 11,05

3,65 ∗ 1 + 5,5 ∗ 8 + 7,3 ∗ 25 + 9,15 ∗ 9 + 11,05 ∗ 7


𝑋̅ = = 7,79
50
b. Mediana
𝑁
− 𝑁𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∙𝑎
𝑛𝑖
25 − 9
𝑀𝑒 = 6,4 + ∗ 1,86 = 7,6
25
c. Varianza
Área f F x ̅ )𝟐
(𝒙 − 𝑿 ̅ )𝟐 ∙ 𝒇
(𝒙 − 𝑿
[2,7-4,6) 1 1 3,65 16,40 16,40
[4,6-6,4) 8 9 5,5 4,84 38,72
[6,4-8,2) 25 34 7,3 3,24 4
[8,2-10,1) 9 43 9,15 2,10 18,9
[10,1-12) 7 50 11,05 11,22 78,54
TOTAL 156,56

156,56
𝜎 2= 50
=3,13

d. Desviación estándar:

𝜎 = √3,13 = 1,76

e. Rango de datos: para determinar el rango realizamos la diferencia


entre el dato mayor menos el dato menor.
𝑅𝑎𝑛𝑔𝑜 = 𝑋𝒎𝒂𝒙 − 𝑋𝑚𝑖𝑛 = 12 − 2,7 = 9,3
f. Valor de los cuartiles:
12,5 − 9
𝑄1 = 6,4 + 1,86 ( ) = 6,7
34 − 9
25 − 9
𝑄2 = 6,4 + 1,86 ( ) = 7,6
34 − 9
37,5 − 34
𝑄3 = 8,2 + 1,86 ( ) = 8,7
43 − 34
g. Rango intercuartilico
𝑅𝑖 = 𝑄3 − 𝑄1 = 8,7 − 6,7 = 2,0
h. Tabla de frecuencias:

Área x f F 𝒇𝒓 𝑭𝒓
[2,7-4,6) 3,65 1 1 0,02 0,02
[4,6-6,4) 5,5 8 9 0,16 0,18
[6,4-8,2) 7,3 25 34 0,5 0,68
[8,2-10,1) 9,15 9 43 0,18 0,86
[10,1-12) 11,05 7 50 0,14 1

i. Diagrama de caja:
1. Variable discreta:

Problema:
Uno de los medios de subsistencia en la región, es la cría de cerdos
criollos; por lo tanto, se le preguntó a cada campesino cuántos
tenían:
5 7 5 5 1 4 6 8 7 4
1 4 3 2 6 8 7 4 6 6
7 3 4 5 2 3 5 5 3 6
5 4 4 5 2 1 6 1 4 1
6 6 6 6 4 6 2 1 2 5

Hallar:

a. Media Muestral: organizamos los datos y su frecuencia absoluta.

Número f
de
cerdos
1 6
2 5
3 4
4 9
5 9
6 11
7 4
8 2

Usamos la ecuación para determinar la muestra realizamos la suma


de la multiplicación de cada dato por las veces que se repite.

1 ∗ 6 + 2 ∗ 5 + 3 ∗ 4 + 4 ∗ 9 + 5 ∗ 9 + 6 ∗ 11 + 7 ∗ 4 + 8 ∗ 2 219
𝑥̅ = = = 4,38
50 50
b. Mediana: Para determinar la mediana organizamos los datos de
menor a mayor y seleccionamos el dato que se encuentra en la
mitad.
𝑀𝑒 = 5
c. La moda es el dato que mas que se repite, por tanto, es 6.

d. Varianza:

Número de F ̅) 𝟐
(𝒙 − 𝒙
cerdos
1 6 11,42
2 5 5,66
3 4 1,90
4 9 0,14
5 9 0,38
6 11 2,62
7 4 6,86
8 2 13,10

𝜎2
6 ∗ 11,42 + 5 ∗ 5,66 + 4 ∗ 1,90 + 9 ∗ 0,14 + 9 ∗ 0,38 + 11 ∗ 2,62 + 4 ∗ 6,86 + 2 ∗ 13,10
=
50
= 3,83
e. Desviación estándar:

𝜎 = √3,83 = 1,95

a. Rango de datos:
𝑅𝑎𝑛𝑔𝑜 = 𝑋𝒎𝒂𝒙 − 𝑋𝑚𝑖𝑛 = 8 − 1 = 7
b. Valor de los cuartiles: organizamos los datos en dos grupos a partir
de la mediana y determinamos la mediana de cada grupo
𝑄1 = 3 = 25%
𝑄2 = 5 = 50%
𝑄3 = 6 = 75%
c. Rango intercuartilico

𝑅𝑖 = 𝑄3 − 𝑄1 = 6 − 3 = 3
d. Tabla de frecuencias

Número f F 𝒇𝒓 𝑭𝒓
de cerdos
1 6 6 0,12 0,12
2 5 11 0,1 0,22
3 4 15 0,08 0,3
4 9 24 0,18 0,48
5 9 33 0,18 0,66
6 11 44 0,22 0,88
7 4 48 0,08 0,96
8 2 50 0,04 1

h. Diagrama de caja y Bigotes

2. Variable cualitativa nominal:


A cada campesino se le preguntó si además de la cría de cerdos,
sembraba algúncultivo:
4 1 5 6 4 1 1 3 4 1
1 4 1 6 6 5 3 1 3 6
5 5 2 5 6 2 1 3 3 6
1 4 2 1 2 5 3 1 1 5
6 2 5 1 4 1 6 5 4 6

datos se codificaron de la siguiente manera:


1= plátano
2= fríjol
3= aguacate
4= tomate de árbol
5= otro cultivo
6= no tienen ningún cultivo

a. Presente la tabla de frecuencias absolutas y frecuencias relativas de


la variable cualitativa nominal.
CULTIVO f F 𝒇𝒓 𝑭𝒓
1 14 14 0,28 0,28
2 5 19 0,1 0,38
3 6 25 0,12 0,5
4 7 32 0,14 0,64
5 9 41 0,18 0,82
6 9 50 0,18 1
b. Realice el gráfico de frecuencia relativa de la variable cualitativa
nominal.

3. Variable cualitativa ordinal:


A cada agricultor se le preguntó su nivel de estudios:
3 2 1 2 2 4 2 1 1 3
2 1 4 1 1 1 2 2 1 3
3 3 2 4 1 1 1 2 1 3
1 4 1 1 2 3 4 3 3 2
2 2 2 2 2 1 1 4 1 4
Los datos se codificaron de la siguiente manera:
1= primaria
2= secundaria
3= profesional – técnico/tecnólogo
4= profesional universitario
a. Presente la tabla de frecuencias absolutas y frecuencias relativas
de la variable cualitativa ordinal.
Nivel de f F 𝑓𝑟 𝐹𝑟
estudio
1 18 18 0,36 0,36
2 16 34 0,32 0,68
3 9 43 0,18 0,86
4 7 50 0,14 1

b. Realice el gráfico de frecuencia relativa de la variable cualitativa


ordinal.

c.

4. Ejecute el script de la Fase 2 en el Programa R (revise el tutorial


suministrado por el director de curso para el manejo del programa).
El script está diseñado para analizar los mismos datos que se le
suministraron en los puntos 2, 3 y 4.
a.
Estadístico Variable continua Variable discreta
Manual Programa R Manual Programa R

Media 7,7 7,78 4,38 4,38


Mediana 7,6 7,8 5 5
Moda ----- ----- 6 6
Varianza 3,13 3,36 3,83 3,9
Desviación 1,76 1,83 1,9 1,9
estándar
Rango de datos 9,3 9,3 7 7
Cuartil 1 6,7 6,70 3 3
Cuartil 2 7,6 7,8 5 5
Cuartil 3 8,7 8,4 6 6
Rango 2,0 1,7 3 3
intercuartilico

5. Análisis de gráficos del programa R


a. Gráficos de la variable cuantitativa continua:
i. Histograma de la variable continua

En el grafico se puede evidenciar que las parcelas de la mayoría


de los campesinos tienen un área entre 7 y 9.
ii. Boxplot o diagrama de cajas variable continua

En el gráfico de caja los datos se evidencia que los datos se


ubican entre 6 y 8,7 lo cual indica que el área de la mayoría
de las parcelas de los campesinos están en este rango.

b. Gráficos de la variable cuantitativa discreta:

i. Diagrama de barras Frecuencia Absoluta


Con la gráfica de los datos que se obtuvieron al preguntar a 50
campesinos la cantidad de cerdos que tienen se puede decir
que son más los campesinos que tienen 6 cerdos.

ii. Diagrama de barras Frecuencias relativas acumuladas

Según la grafica de las frecuencias relativas acumuladas de los


datos obtenidos al encuestar a los campesinos por la cantidad
de cerdos que tienen se puede concluir que son pocos los
campesinos que tienen entre 1 y 4 cerdos, los demás tienen
entre 6 y 8.

iii. Boxplot o diagrama de cajas variable discreta

Con el diagrama de caja se muestra la ubicación de los datos,


que están en el rango de 3 a 5 los que implica que hay varios
campesinos que tienen 3 y 4 cerdos.
c. Gráficos de la variable cualitativa nominal:
i. Diagrama de barras frecuencias absolutas

En la gráfica se evidencia que son pocos los campesinos que


deciden cultivar frijoles, son más los que deciden cultivar
plátano y hay que 9 de los 50 no tienen ningún cultivo.
ii. Diagrama de barras frecuencias relativas
La columna 6 representa los campesinos que deciden no
sembrar ningún cultivo, y el cultivo que predomina es el de
platano.
iii. Gráfico de tarta

En el gráfico de torta los datos se ubican en numeral 6, lo cual


evidencia que el cultivo elegido por los campesinos es el del
plátano y un gran porcentaje no tiene ningún cultivo.

d. Gráficos de la variable cualitativa ordinal:

i. Diagrama de barras frecuencias absolutas


En el diagrama de barras de las frecuencias absolutas de la
variable cualitativa ordinal se muestra
ii. Diagrama de barras frecuencias relativas
Las barras 1 y 2 que corresponden a primaria y secundaria
respectivamente muestran que la mayoría de las respuestas registradas
por los campesinos indican que los campesinos solo tienen primaria y
secundaria.

iii. Gráfico de tarta

En gráfico de torta de la variable ordinal se muestra que más


de la mitad de los campesinos encuestados solo tienen primaria
y secundaria como nivel de estudio, es mucho más bajo el
porcentaje de los que tiene educación superior.
Conclusión
La identificación de variables estadísticas es un proceso crucial en el análisis de datos y la

investigación. Implica la selección cuidadosa de las características o atributos que se van a

estudiar en un conjunto de datos, con el fin de comprender mejor el fenómeno en

cuestión y tomar decisiones fundamentadas.


Referencias Bibliográficas

• Balzarini Mónica, Di Rienzo Julio, Tablada Margot,


Gonzalez Laura, Bruno Cecilia, Córdoba Mariano, Walter
Robledo y Casanoves Fernando. 2015. Capítulo 2 -
Variables Aleatorias y Probabilidades. En: Estadística y
biometría: ilustraciones del uso de InfoStat en
problemas de agronomía. Editorial Brujas. Páginas 59-
78. https://elibro-
net.bibliotecavirtual.unad.edu.co/es/lc/unad/titulos/781
27

En el siguiente texto, podrá ampliar la consulta de los temas


abordados en la Unidad 2:

• García, P. A. (2014). La interpretación de los datos: Una


introducción a la estadística aplicada. Biblioteca virtual
UNAD https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/4880
2

Estos materiales le apoyarán con la manipulación del Programa R:

• Perpiñán, O. (sf). Introducción a R. Oscar Perpiñán


Lamiguerio https://oscarperpinan.github.io/R/#datos
• Sáez, J. (2010). Métodos estadísticos con R y R
comanderOpen this document with ReadSpeaker
docReader . R Project https://cran.r-
project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf

Revise los siguientes objetos virtuales de información y de


aprendizaje:

• Cáceres, L. (2020). Distribución normal y algunas de sus


aplicaciones. [Objeto_virtual_de_Informacion_OVI].
Repositorio Institucional
UNAD. https://repository.unad.edu.co/handle/10596/33
961

También podría gustarte