Hector Fernando Gamba Trujillo - 204040A - 612

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 23

Guía de actividades y rúbrica de evaluación - Paso 3 - Análisis de

la Información.

Tutor/a:

Luis Robinso Camelo

Estudiante:

Hector Fernando Gamba Trujillo

Código: (N° de cédula)

1112763685

Grupo:

2204040_56

Universidad Nacional Abierta y a Distancia UNAD

Escuela Ciencias de la Educación

Ingenieria en Telecomunicaciones

Estadisticas Descriptiva

Dosquebraadas

27-05-2019
INTRODUCCION

Las medidas de dispersión indican el valor de la variable en torno a la


cual se está situando el grupo de observación, esta se divide en 2 las
medidas de tendencia central (media aritmética, armónica, geométrica,
mediana y moda) y las medidas de tendencia no central (cuantiles),
media aritmética solo se puede calcular si la variable es de naturaleza
cuantitativa por eso se debe tener en cuenta si son datos agrupados o
no este es una información importantes para todas las medidas de
dispersión, la mediana es un valor del recorrido de la variable que deja
el mismo número de observaciones a su izquierda y derecha, la moda
representa el valor de la variable con mayor frecuencia en la respectiva
tabla de distribución.
Por otro lado y ya hablando sobre medidas de tendencia no central
como los cuantiles (K) estos serán los valores del recorrido de la
variable que dividirán la distribución en K partes conteniendo cada una
de ellas la misma proporción y ya tomando otro tema y no tan
importante las medias de dispersión que hacen referencia a como de
distantes, de separados se encuentran los datos estas se distribuyen las
siguientes el rango que es la diferencia entre el valor máximo y mínimo
una desventaja de esta es que solo se toma en cuenta dos valores de la
variable ahora también la varianza (S²) que es la media aritmética de
los cuadrados de las diferencias que se encuentran en las variables,
cuanto mayor sea la varianza, cuanto mayor sea la dispersión menos
representativa será la media. Así que en lo anterior vimos resumidos
todos los temas trabajados en esta parte del trabajo.
JUSTIFICACION

Este trabajo fue realizado con el objetivo de aprender, analizar y


comprender más sobre las medidas de tendencia central, las medidas de
dispersión los datos agrupados y no agrupados. Con la ayuda de los
textos de José maría montero se pudo desarrollar cada uno de los
puntos y así concluir con este trabajo, dándonos una ampliación de que
la estadística es una disciplina aplicada en todos los de la vida cotidiana
y la cual ha cobrado gran importancia en los últimos tiempos dándonos
así las bases para cuando enfrentemos un problema, una situación
podamos resolverlo con la ayuda estadística resumiendo datos grandes
explicándolos y dando así una mejor explicación de todo esto.
En el plano laboral como producción, ventas, organización, proyecciones
y estimaciones a corto y largo plazo que con la ayuda estadística nos
darán procesos encaminados a facilitar la toma de decisiones de unos
datos plasmados en tablas y gráficos.
OBJETIVOS

 Diferenciar y observar en cualquier tabla de frecuencias cuando


son datos agrupados y cuando no.
 Calcular media, mediana y moda para datos no agrupados y
agrupados.
 Calcular y sacar conclusiones dependiendo de los resultados de la
varianza, desviación típica, rango y el coeficiente de variación de
cualquier tabla de frecuencia.
 realizar un histograma y un polígono de frecuencias en Excel.
 Al observar problemas del común detectar calcular y realizar
tablas de frecuencias y calcular las medidas de dispersión y las de
tendencia central.
Actividades a desarrollar

Actividad 1. Mapa Mental.


Resumir mediante un mapa mental las medidas estadísticas
univariantes, describiendo ampliamente una de ellas, ya sean las
medidas de tendencia central, de posición o de dispersión.

Actividad 2. Laboratorio Medidas Univariantes

Para este paso 3 se continuará trabajando con la base de datos


denominada “Indicadores socioeconómicos 120 municipios (2019)
16-2”. Por favor descargue la base de datos (Archivo en Excel) que se
encuentra en el entorno de aprendizaje colaborativo, carpeta: Guía de
actividades y rúbrica de evaluación - Paso 2– Organización y
presentación, una vez tenga la base de datos desarrolle lo siguiente:
Realicé el Laboratorio identificado como medidas univariantes, el cual
se encuentra en el Entorno de aprendizaje práctico, carpeta: Guía para
el uso de recursos educativos. El laboratorio lo puede desarrollar con el
programa Infostat o Excel.

De optar por el uso del programa Infostat, lo podrá descargar en el


entorno de aprendizaje practico, carpeta: Laboratorios Estadística
Descriptiva: Infostat tutoriales, enlace descarga del Infostat

Cada estudiante desarrollará el laboratorio; posteriormente, deberá


subirlo al foro paso 3. Análisis de la Información, en un archivo
denominado: Nombre Apellido_lab_Medidas Univariantes.

1. MEDIDAS UNIVARIANTES: Desarrollar en el paso (3)

Este ejercicio práctico, pretende hacer la transferencia del conocimiento


adquirido a partir de la elaboración del laboratorio de medidas
univariantes, el cual se realizará utilizando el software gratuito
INFOSTAT, que podrá descargar ingresando a Laboratorios Estadística
Descriptiva: Infostat, Tutoriales, (Entorno de aprendizaje práctico).
Los ejercicios prácticos también los podrán desarrollar utilizando la
herramienta EXCEL, la cual aparece instalada por defecto en el Office de
su computador.

MEDIDAS UNIVARIANTES PARA VARIABLE CUANTITATIVA


DISCRETA

A partir de la base de datos “Indicadores socioeconómicos 120


municipios (2019) 16-2”, encontrada en el entorno de aprendizaje
Colaborativo Paso 2– organización y presentación, cada estudiante
deberá resolver para una variable cuantitativa discreta diferente,
los ejercicios que aparecen a continuación y socializarlos en el foro.
VARIABLE CUANTITATIVA DISCRETA cantidad de resguardos
indígenas

FRECUENCIA
DATOS ABSOLUTA
0 60
1 9
2 11
3 10
4 7
5 12
6 11
TOTAL 120

1. Medidas Univariantes de Tendencia Central.


a. Para la variable elegida, se deberán calcular las medidas
univariantes de tendencia central:

 MEDIA: 17

nota: la media aritmética es la suma de todos los datos dividido sobre


el número de datos que hay en la tabla

 MEDIANA: 10
nota: la mediana busca calcular el centro de todo el conjunto de
datos a partir de la posición del dato central en el conjunto
ordenado.
 MODA: 60
nota: la moda es el valor con mayor frecuencia en todo el
conjunto de datos.
B) CALCULAR
- todos los cuartiles

         
7 9 10 11 12 60
           

Q1: (1*6)/4 Q2:(2+6)/4


POCISION 1,5 POCISION 3
VALOR VALOR
=(7+9)/2 8 =(10+11)/2 10,5

 Deciles 5 y 7

  POCISION VALOR
DECIL5 3 10,5
DECIL7 4,2 11,5
     

 Percentiles 25 y 50

Percentil 25

i:(p/100)*n = (25/100)*6 = 1,5


nota: como i no dio un número entero debemos redondear este
resultado la posición del percentil 25 es 2.

Percentil 50
i:(p/100)*n = (50/100)*6 = 3
nota: en este caso sí dio un número entero por eso la posición del
percentil 50 está en el 3.

C. Interpretar sus resultados

 Al calcular la media, moda y mediana de esta variable cuantitativa


discreta se pudo observar como todos los 3 resultados dieron
números enteros que son más fáciles de concluir y observar dando
como resultado una moda alta (60) y como resultado una media
de (10) y la moda fue muy fácil de observar ya que estaba
central.

 Al calcular los cuartiles (dando posiciones bajas y valores altos en


los dos cuartiles), decirles y percentiles de esta tabla en todos
estos 3 casos paso lo mismo dando una variabilidad y posiciones
concretas en la respectiva tabla.

2. Medidas univariantes de dispersión:


a. Para la variable elegida, se deberán calcular las medidas
univariantes de dispersión:

 RANGO:

R: Xmayor-Xmenor R: 60-7 = 53

nota: el rango mide la distancia que hay desde el dato menor hasta el
dato mayor.
 VARIANZA:

(DATOS-
DATOS (DATOS-MEDIA) MEDIA)^2
60 43 1849
9 -8 64
11 -6 36
10 -7 49
7 -10 100
12 -5 25
11 -6 36
2159

VARIANZA: sumatoria (datos-media)^2/n-1 = 307,43

 DESVIACION TIPICA (S):


√ 307,43 = 17,53

 COEFICIENTE DE VARIACION (cv):


cv:(S/media)*100 = 10226%

b. Interpretar los resultados obtenidos y asociarlos con el problema


objeto de estudio

 En las medidas univariantes de dispersión se pudo observar como


en el RANGO dio que hay una distancia de 53 que es alta para el
numero de datos, en la VARIANZA que se calcula teniendo en
cuenta la media que calculamos anteriormente y la DESVIACION
TIPICA que se deduce con el resultado de la varianza pero aquí lo
calculamos con la raíz cuadrada para todos estos cálculos siempre
debemos tener en cuenta la media.
Actividad 3. Variable Cuantitativa continúa
A partir de la base de datos “Indicadores socioeconómicos 120
municipios (2019) 16-2”, encontrada en el entorno de aprendizaje
Colaborativo, cada estudiante deberá elegir una variable cuantitativa
continua distinta, manifestarlo en el foro Unidad 2 paso 3 y calcular las
medidas de tendencia central y de dispersión.

% Ocupantes en viviendas sin energía eléctrica

a. Tabla de frecuencia datos agrupada. Cada estudiante deberá


elegir una variable cuantitativa continua y diseñar una tabla de
frecuencia para datos agrupados, a partir de ella elaborar un
histograma de frecuencias y un polígono de frecuencias.
TABLA DE FRECUENCIA DE DATOS AGRUPADOS

MARCA DE F (frec absoluta frec


DATOS CLASE Fi   acumulada) relativa
(O,01-
0,40) 0,205 16 1455% 16 1455%
(0,40-
0,70) 0,55 21 1909% 37 3364%
(0,70-
0,99) 0,845 16 1455% 53 4818%
(0,99-
1,30) 1,145 11 1000% 64 5818%
(1,30-
1,70) 1,5 7 636% 71 6455%
(1,70-
1,90) 1,8 6 545% 77 7000%
(1,90-
2,20) 2,05 4 364% 81 7364%
(2,20-
2,60) 2,4 4 364% 85 7727%
(2,60-
2,80) 2,7 3 273% 88 8000%
(2,80-
3,00) 2,9 2 182% 90 8182%
(3,00-
5,00) 4 8 727% 98 8909%
(5,00-
7,00) 6 4 364% 102 9273%
(7,00-
11,00) 9 2 182% 104 9455%
(11,00-
14,00) 12,5 2 182% 106 9636%
(14,00-
30,00) 22 2 182% 108 9818%
(30,00-
60,00) 45 2 182% 110 10000%
    110      
HISTOGRAMA

histograma y poligono de frecuencia


25

20

15

10

0
0.21 0.55 0.85 1.15 1.5 1.8 2.05 2.4 2.7 2.9 4 6 9 12.5 22 45

b. Medidas de tendencias central. Para la variable cuantitativa


continúa elegida, cada estudiante deberá calcular las medidas de
tendencia central (media, mediana, moda), cuartiles, Decil 5 y
percentil 50, determinar el tipo de asimetría y curtosis e
interpretar los resultados y asociarlos con la problemática: “¿En
qué condiciones de desarrollo territorial, social y humano
se encuentran las comunidades con mayor pobreza extrema
en Colombia?”
F (frec
MARCA DE absoluta
DATOS CLASE (Xi) Fi acumulada) Xi.Fi
(O,01-
0,40) 0,205 16 16 3,28
(0,40- para hallar
0,70) 0,55 21 37 11,55 la moda
(0,70-
0,99) 0,845 16 53 13,52
(0,99- para hallar
1,30) 1,145 11 64 12,595 la mediana
(1,30-
1,70) 1,5 7 71 10,5
(1,70-
1,90) 1,8 6 77 10,8
(1,90-
2,20) 2,05 4 81 8,2
(2,20-
2,60) 2,4 4 85 9,6
(2,60-
2,80) 2,7 3 88 8,1
(2,80-
3,00) 2,9 2 90 5,8
(3,00-
5,00) 4 8 98 32
(5,00-
7,00) 6 4 102 24
(7,00-
11,00) 9 2 104 18
(11,00-
14,00) 12,5 2 106 25
(14,00-
30,00) 22 2 108 44
(30,00-
60,00) 45 2 110 90
TOTAL 110 326,945
MEDIDAS DE TENDENCIA CENTRAL
MEDIA

Formula = (Σxi*Fi)/N = 2,97

MEDIANA
El número de datos es par entonces N/2 = 55

Formula = Li+((N/2)-Fi-1)/Fi*ai = 0,99+((110/2)-53)/11*0,31 =


1,046

ai=Ls-Li = -0,31

MODA
Formula =
Li+(Fi-(Fi-1))/(Fi-(Fi-1))+(Fi-(Fi+1))*ai =
0,40+(21-(16))/(21-(16))+(21-(16))*0,3 =
0,40+5/5+5*0,3
0,40+(5/10)*0,3
0,40+(1,5/10)
0,55 esta es la moda

DATOS Fi F (frec absoluta


acumulada)
(O,01-0,40) 16 16
(0,40-0,70) 21 37
(0,70-0,99) 16 53 para hallar el
(0,99-1,30) 11 64 decil 5
(1,30-1,70) 7 71
(1,70-1,90) 6 77
(1,90-2,20) 4 81
(2,20-2,60) 4 85
(2,60-2,80) 3 88
(2,80-3,00) 2 90
(3,00-5,00) 8 98
(5,00-7,00) 4 102
(7,00-11,00) 2 104
(11,00-14,00) 2 106
(14,00-30,00) 2 108
(30,00-60,00) 2 110
TOTAL 110

DECIL 5
Posición: Kn/10 = 55
Formula= Li+A((Kn/10)-(Fi-1))/(Fi-(Fi-1))
1,046 DECIL 5

PERCENTIL 50
Posición: Kn/100 = 55
Formula= Li+A((Kn/100)-(Fi-1))/(Fi-(Fi-1))
1,046 percentil 50

CONCLUSION
“¿En qué condiciones de desarrollo territorial, social y humano se
encuentran las comunidades con mayor pobreza extrema en Colombia?”
Como conclusión podemos observar como resultado tenemos una media
de 2,97 - una mediana de 1,046 y una moda de 0,55 reflejando que las
comunidades con mayor pobreza de Colombia están dispersas en
intervalos altos y altos dando un reflejo y una conexión entre estos
valores.

TIPO DE ASIMETRIA Y CURTOSIS


MARCA DE
DATOS CLASE (X) F X*F (x-promedio)²
(O,01-0,40) 0,205 16 3,28 7,657546779
(0,40-0,70) 0,55 21 11,55 5,867184961
(0,70-0,99) 0,845 16 13,52 4,52509587
(0,99-1,30) 1,145 11 12,595 3,338759506
(1,30-1,70) 1,5 7 10,5 2,167453143
(1,70-1,90) 1,8 6 10,8 1,374116779
(1,90-2,20) 2,05 4 8,2 0,850503143
(2,20-2,60) 2,4 4 9,6 0,327444052
(2,60-2,80) 2,7 3 8,1 0,074107688
(2,80-3,00) 2,9 2 5,8 0,005216779
(3,00-5,00) 4 8 32 1,056316779
(5,00-7,00) 6 4 24 9,167407688
(7,00-11,00) 9 2 18 36,33404405
(11,00-14,00) 12,5 2 25 90,77845314
(14,00-30,00) 22 2 44 362,056135
(30,00-60,00) 45 2 90 1766,33368
TOTAL 110 326,945 2291,913466

(x-
(x- (x- promedio)^ (x-
promedio)².F (x-promedio)³ promedio)³.F 4 promedio)^4.f
122,5207485 -21,139 -338,224754 58,4494653 935,1914448
123,2108842 -14,172488 -297,622248 34,29742096 720,2458402
72,40153392 -9,595703125 -153,53125 20,39086914 326,2539063
36,72635457 -6,078390625 -66,86229688 11,09306289 122,0236918
15,172172 -3,177 -22,235661 4,66948881 32,68642167
8,244700674 -1,601613 -9,609678 1,87388721 11,24332326
3,40201257 -0,778688 -3,114752 0,71639296 2,86557184
1,309776207 -0,185193 -0,740772 0,10556001 0,42224004
0,222323064 -0,020 -0,059049 0,00531441 0,01594323
0,010433558 -0,000343 -0,000686 2,401E-05 4,802E-05
8,450534231 1,092727 8,741816 1,12550881 9,00407048
36,66963075 27,818127 111,272508 84,28892481 337,1556992
72,6680881 219,256 438,512454 1322,115049 2644,230098
181,5569063 865,523177 1731,046354 8248,435877 16496,87175
724,1122699 6891,541327 13783,08265 131146,0315 262292,0629
3532,667361 74246,87343 148493,7469 3120596,09 6241192,18
4939,345729 163674,4015 3261529,688 6525122,453

promedio 2,97

DESVIACION ESTANDAR

Σ ( x −promedio )2 . f 4939,34
Σf √ 110
√ 44,90 6,7

CURTOSIS (g1)

Σ ( x− promedio )³ . f
Formula 447520,0365
( Σ f )∗desviacion ³

MEDIDA DE CURTOSIS (g2)

Σ ( x− promedi o 4 ) . f
Formula -3 119535026,2
( Σ f )∗desviacion 4
ASIMETRIA (AS)

moda 0,55
promedio 2,97
desviación 6,7

Formula
promedio−moda
0,36119403
desviacion
CONCLUSION: al realizar todas estas formulas y ecuaciones llegamos a
la conclusion de que esta es ASIMETRICA POSITIVA ya que el resultado
de la asimetría es mayor que cero.

c. Medidas de Dispersión. Para la variable cuantitativa continúa


elegida calcular: Rango, varianza, desviación típica, coeficiente de
variación, posteriormente interpretar los resultados y asociarlos
con la problemática: “¿En qué condiciones de desarrollo
territorial, social y humano se encuentran las comunidades
con mayor pobreza extrema en Colombia?”

MEDIDAS DE DISPERSION

DATOS MARCA DE F X*F (x- (x-


CLASE (X) promedio) promedio)².F
²
(O,01-
0,40) 0,205 16 3,28 7,66 122,5207
(0,40- 123,210884
0,70) 0,55 21 11,55 5,87 2
(0,70- 72,4015339
0,99) 0,845 16 13,52 4,53 2
(0,99- 36,7263545
1,30) 1,145 11 12,595 3,34 7
(1,30-
1,70) 1,5 7 10,5 2,17 15,172172
(1,70- 8,24470067
1,90) 1,8 6 10,8 1,37 4
(1,90-
2,20) 2,05 4 8,2 0,85 3,40201257
(2,20- 1,30977620
2,60) 2,4 4 9,6 0,33 7
(2,60- 0,22232306
2,80) 2,7 3 8,1 0,07 4
(2,80- 0,01043355
3,00) 2,9 2 5,8 0,01 8
(3,00- 8,45053423
5,00) 4 8 32 1,06 1
(5,00- 36,6696307
7,00) 6 4 24 9,17 5
(7,00-
11,00) 9 2 18 36,33 72,6680881
(11,00- 181,556906
14,00) 12,5 2 25 90,78 3
(14,00- 724,112269
30,00) 22 2 44 362,06 9
(30,00- 3532,66736
60,00) 45 2 90 1766,33 1
TOTAL 110 326,945 2291,91 4939,3457

promedio= Σx.f/n
promedio = 2,97
RANGO

formula Lm-Lo
límite superior del ultimo
Lm intervalo
Lo limite o extremo inferior del primer intervalo

59
,9
Rango 9

VARIANZA

formula ((x-promedio)².F)/n

varianza 44,90

DESVIACION

44,90² √ 44,90 6,7

COEFICIENTE DE VARIACION

formula (desviación/promedio)*100

CV 225,589

CONCLUSIONES
¿En qué condiciones de desarrollo territorial, social y humano se
encuentran las comunidades con mayor pobreza extrema en Colombia?
En las medidas de dispersión vimos como el resultado del rango (59,99)
y la varianza (44,90) es casi paralelo mientras que la varianza (6,7) y el
coeficiente de variación es alto (225,589) entonces podemos concluir
que en esta tabla no dio una varianza tan alta está casi en la mitad
entonces la media es representativa , en esta grafica observamos cómo
no dieron resultados tan altos fuera de lo normal.
CONCLUSIONES
Como se pudo observar en el trabajo realizado, en general se puede
concluir que las medidas de tendencia central y las medidas de
dispersión son muy importantes para nuestro campo laboral, para
nuestra vida diaria ya que podemos reflejar datos resumidos en grandes
cantidades de números para así entenderlos mucho mejor y despejarlos
para poder comprender una gran muestra, y las conclusiones
respectivas al trabajo se encontraran en cada uno de los ejercicios
realizados y desarrollados.
REFERENCIAS BIBLIOGRAFICAS

 https://www.youtube.com/watch?v=uZ3Q6Nth7-E
 https://www.youtube.com/watch?v=5bZXpfxwHqk
 https://www.youtube.com/watch?v=5EpnuRQ5pGY
 http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052300007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=
03f8699ec7ccf10e8745c0ceb7b85bf1
 García, J. E (2005). Análisis de Datos Unidimensionales.et al.
Madrid: Paraninfo. Página 26 -42

 Montero, J. M. (2007). Características de Una Distribución de


Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo,
S.A. Páginas 41-50

También podría gustarte