Capítulo 9: Introducción
Capítulo 9: Introducción
Capítulo 9: Introducción
ANÁLISIS DE DATOS
INTRODUCCIÓN
3. Interpretación de resultados.
El primer paso es describir los datos obtenidos para cada variable, esto se hace
con la ayuda de la estadística descriptiva y... ¿ Cómo describimos los datos
obtenidos? Para esto seleccionamos la prueba estadísticas necesaria, por
ejemplo, para la variable "altura" en un estudio hipotético sobre las características
físicas de 100 estudiantes de la UPTC, lo podemos hacer por medio de la
distribución de frecuencias y mediante las medidas de tendencia central. cCómo
se aplica la distribución de frecuencias? Veámoslo:
Donde:
Nc = frecuencia absoluta.
Nt = total de casos.
40
Porcentaje = --- (100) = 6.7 % (7% aproximado)
596
Un posible comentario sería: la altura más repetida está entre 171 y 180
centímetros que corresponde a un 42% de la muestra. Solamente el 13% de la
muestra posee la estatura más baja (150-160 centímetros) y un 27% posee la
estatura más alta (181-190 centímetros).
Hombres Mujeres
Ancianos 80% 100%
Entre estos encontramos los diagramas de barras, los gráficos circulares, los
histogramas y los polígonos de frecuencia. Su utilidad se basa en que permiten
comparar de un vistazo frecuencias pertenecientes a categorías distintas pues, por
lo menos, se representan dos parámetros (variables): uno, en el eje vertical y el
otro, en el eje horizontal. Podemos representar gráficamente lo anterior,
mediante la aplicación de los datos tomados de un estudio titulado " Consultas
Odontológicas vs. Sexo" realizado en la Escuela de Administración de Negocios
por Oiga Báez en el año 2000.
81 a 100
61 a 80
O
-c
O
41 a60 ¡_1Tota!
w
21 a 40
O a 20
O 20 40 60 80 100
{5O,00%)
{1,01%)
Se utilizan cuando los parámetros (i.e, consulta- sexo) son escalas graduales
cuantitativas. Los grados de las escalas (intervalos) deben estar dispuestos de tal
forma que su valor cuantitativo sea inferior al de los grados superiores y superior
al de los grados inferiores. Los contenidos de los histogramas se representan por
curvas o combinando diversas técnicas: curvas y diagramas de barras. En el
ejemplo Báez 2000, respondamos esta pregunta: ¿Cuántas consultas
odontológicas realizaron las mujeres y cuántas los hombres de 35 años de edad,
durante el mes de febrero de 2000?
50 ••••.....----------- •••••
(]
10 20 30 40 50 60 70 80 90
EDAD
0-10 47 47
11 - 20 10 80
21 - 30 20 30
31-40 70 60
41 - 50 20 80
51 - 60 10 10
61 -70 60 20
71 -80 25 60
80r---~------~~------~
70+--'~-----,,~r-T---------4
60+--h--r---'~c--4-----,,--~
50+-~--4---jb-'r-~--~~~~~
40+--~--~f~--~--+--~--1"~
30+-~~---J~----~--4~'~+-'r1
20·~~,--~~-----·,~h~~--~
10~--~i-~--~~--~~--~
o 10 20 30 40 50 60 70 80
"', HOMBREftt- MUJER
Categorías o intervalos
LX
X=---
N
Donde:
Remplazamos.
4.0+3.0+2.8 9.8
X = ------ = -- = 3.26
3 3
9.1.2.2 Mediana.
I I
4+5+6+8+12 35 I
X =------ =7 Mediana = 6 (punto intermedio).
5 5
5+1
Mediana = = 3
2
9.1.2.3 Moda.
9.1.3.1 Varianza.
x d x
12 7 49 22 17 289
8 3 9 18 13 169
7 2 4 2 -3 9
6 1 1 2 -3 9
6 1 1 1 -4 16
4 -1 1 1 -4 16
3 -2 4 1 -4 16
2 -3 9 1 -4 16
1 -4 16 1 -4 16
1 -4 16 1 -4 16
I x = 50 I/ = 110 Ix = 50
X=5 I X=5
.... , ,
.............................••
HOMBRES MUJERES
110 572
v=--- v= ---=12.2 v= -- =63.6
n-l 10-1 10-1
s=F S=~12.2
3.5
S=~63.%
HOMBRES MUJERES
Xm
15 18 21 28 31 35 40
El rango será: 40 -15 = 25. Cuanto más grande sea el rango, mayor será la
dispersión de los datos de una distribución ..
Cuando los datos han sido descritos y se han corregido valores estadísticos
importantes como media y desviación típica, se puede, a partir de las frecuencias
profundizar el estudio planteando un conjunto de hipótesis que los datos deben
aceptar o rechazar ofreciendo probabilidades de error él más bajo posible. Las
hipótesis pueden referirse a la existencia de diversas variables y plantearse en
forma negativa o positiva.
La hipótesis negativa o nula consiste en presentar una hipótesis que debe ser
rechazada al aplicar la estadística sobre los datos, de tal manera que se
compruebe lo contrario, tal como se explicó en 5.4.3.2. Hacia la hipótesis nula
están orientadas varias pruebas estadísticas: varianza, T y X2.
Su fin coincide con el del análisis simple anterior. Para aplicar la prueba T
necesitamos contar con dos variables, ejemplo, sexo y abertura de la vocal final
tras la caída de una consonante implosiva final, así la primera se cuantifica, sería
la variable independiente y la segunda la dependiente (lingüística). Aplicando la
prueba T se averigua si la conducta de hombres y mujeres es significativamente
distinta en relación con la abertura de la vocal final. La diferencia entre las
muestras se da por el cálculo de F (F.-) dividiendo la varianza más grande entre
las más pequeñas. La prueba T dice si la diferencia se debe al azar o no. Para
calcular el valor de t se aplica:
(1 y 2)
s = Desviación típica.
x = Media.
La diferencia entre la prueba t y el análisis simple está en que t solo trabaja con
2 muestras y el simple con más, siempre que sena estados distintos de una misma
variable (variantes) ejemplo, edad - 20; 21-30; 31- 40. La ventaja del análisis
compuesto de la varianza es que maneja más de una variable (sexo, edad) dentro
de las cuales se distinguen niveles, con los cuales se trabaja realmente.
Esta prueba se llama así porque su descubridor Cosset publicó trabajos con el
seudónimo Student a principios del siglo XX.
Esta prueba se puede aplicar sobre cualquier número de variable y trabaja con
frecuencias absolutas. El cálculo de los valores esperados se hace sobre la tabla
de frecuencias observadas y ordenadas en líneas (horizontal) y columnas
(vertical) ejemplo:
f-------.- -.-_ ..
.... _-_Coíurnna A
_-_ _-_ _----_ _----_
... ... ... ...
Columna B
.. _ ..--_._. __ ... _ .._._ .•....•.. _- .._ ..... -.... _ ......
Columna (
_--_ ...__ ._._--. __ .._-----
Total
Línea 1 62 58 60 180
Línea 2 108 96 102 306
Línea 3 46 31 49 126
..- f--_.--_ ..
___ o
f-------.-
Línea 4 33 27 37 97
TOTAL 249 212 248 709
249 X 180
e = ------ = 63.2
709
X2
x -----l~ ••.. W L
YI
Y2
Yk
/ Correlación
(
DISTRIBUCIÓN
DE FRECUENCIAS
TABLAS
GRÁFICAS
r
-<;
Diagrama de Barras
Diagrama Circular
Hístoqrarna
Polígono de
L frecuencias
r:
ESTADíSTICA MEDIDAS DE Media
DESCRIPTIVA TENDENCIA
CENTRAL
., I
Mediana
Moda
L
MEDIDAS DE Varianza
VARIABILIDAD Desviación Estándar
O DISPERSiÓN Rango o Recorrido
~ ¡
"-
ESTADiSTICA
ANÁLISIS
PARAMÉTRICO
ANÁLISIS NO
{ T de Student
Análisis de Varianza (ANOVA)
Análisis de Covarianza (ANCOVA)
Chl Cuadrado
INFERENCIAl PARAMÉTRICO
{ Coeficiente de Correlación
ANÁLISIS
MULTlVARIADO l ("
I
Regresión Múltiple
Análisis Lineal Path
Anállsts de factores
Análisis Multivariado de vartanza
(MANOVA)
Análisis Discriminante
PRÁCTICA 9
Ejemplo:
~ ~
I I
8. MILROY, L. (1987). Language and social Networks, 2" de. Oxford, Blackwell.
12. SELL TIZ, C. y otros. (1980). Métodos de investigación en las relaciones sociales,
9a ed. Madrid, Rialp.