Cartilla - S4 PDF
Cartilla - S4 PDF
Cartilla - S4 PDF
SEMA
Herramientas de Análisisde
NA 4
[ MÉTODOS CUANTITATIVOS
DE PSICOLOGÍA ]
MÉTODO CUANTITATIVO
ÍNDICE
Objetivos
-Aprender a analizar descriptivamente los datos numéricos
Contenido
- Distribuciones de frecuencia
- Medidas de tendencia central
- Medidas de variabilidad.
ANÁLISIS DESCRIPTIVOS
La estadística resulta útil para los análisis psicológicos ya que nos permite tanto describir como
inferir a partir de un conjunto de información recopilada. Existen dos tipos de análisis
estadísticos: los descriptivos y los inferenciales. En esta ocasión nos centraremos en los análisis
descriptivos.
2
Medidas de tendencia central
Existen distintas medidas de tendencia. Para este módulo hablaremos de tres de ellas: la media,
la mediana y la moda.
2, 5, 7, 8, 3, 7,
La mediana, informa del valor central de un conjunto de datos. El paso para calcularla depende
de que los datos estén ordenados ascendentemente. Así, en el ejemplo anterior, tendríamos
que ordenar los datos de la siguiente manera:
2, 3, 5, 7, 7, 8.
En este ejemplo no hay un solo dato en la mitad sino dos, el 5 y el 7. Cuando esto sucede
(porque el número de datos es par) se toman estos datos y se calcula su promedio (5 + 7 y se
divide por 2), lo cual da un valor de 6, como dato intermedio entre 5 y 7.
M:6
La moda, es el valor que más se repite, o el dato que tiene una mayor frecuencia de aparición.
En el ejemplo anterior es bastante fácil ver que el dato que más se repite es 7, por tanto, esta
sería la moda para este ejercicio.
m: 7
Medidas de dispersión
Para el investigador no sólo es importante conocer hacia dónde tienden los datos sino también
qué tan dispersos se encuentran unos de otros. Dentro de los tipos de medida de dispersión
encontramos:
R: (8 – 2) + 1 : 5.
∑(𝑥𝑖 − ∆𝑥)2
𝑆𝑥 = √
𝑛− 1
1. Calcular la media
2. Restar, a cada uno de los valores el valor de la media, para obtener la serie de
desviaciones
3. Calcular el cuadrado de cada resta
4. Sumar estas desviaciones
5. Dividir el resultado entre el número de datos menos 1
6. Calcular la raíz de éste valor.
2, 3, 5, 7, 7, 8
4
c. (-0.33)2 : 0,1
d. (1,67)2 : 2,78
e. (1,67)2 : 2,78
f. (2,67)2 : 7,12
4. Sumamos estos valores : 29,3
5. Dividimos este valor entre (6 – 1) :29,3/5 : 5,85
6. Calculamos la raíz de este valor : 2,42.
Para calcular la varianza simplemente elevamos este valor al cuadrado. S2: (2,42)2 :5,85
En nuestra base de SPSS vamos a insertar una variable que se llame ejemplo, desde la vista de
variables. Aquí debemos revisar que el tipo de medida aparezca como [Escalar].
Luego de ello vamos a ir a la vista de datos e incluiremos los valores utilizados en el ejercicio
anterior (2, 3, 5, 7, 7, 8). Debe quedarnos algo como esto:
6
Debe aparecernos un cuadro de diálogo como el que sigue:
Pasamos la variable ejemplo al cuadro que dice [Variables], ya sea arrastrando EJEMPLO o
simplemente seleccionando la variable y oprimiendo la flecha que aparece en la parte central
del cuadro de diálogo.
Luego de esto damos a la opción que dice [Estadísticos…]. Allí aparecerá un cuadro de diálogo
como el que sigue, desde donde nos es posible especificar las tendencias centrales que
queremos, al igual que las medidas de dispersión. Seleccionamos entonces, para este ejercicio,
la Media y la Desviación típica. Damos a [Continuar] y a [Aceptar].
8
SPSS abrirá una ventana de resultados como la que sigue, en donde informa del valor de la
media y la desviación.
Si comparamos, los valores arrojados por SPSS son exactos a los que arroja el análisis manual de
los datos.
Frecuencias y distribuciones
Es muy probable que, con un conjunto de datos, existan algunos de ellos que se repitan en cada
uno de los casos. La frecuencia hace referencia justamente a estas repeticiones de los valores
en los datos. La distribución es la forma en la cual los datos se encuentran repartidos en una
muestra o población. Generalmente es posible representarla con una curva de distribución o
curva normal (de la cuál hablaremos más adelante).
Vamos a volver a la pequeña base que hemos elaborado en SPSS anteriormente con los datos
de la tabla que aparece al inicio de la cartilla (base que tiene una variable de género y 3
variables escalares VAR1, VAR2 y VAR3, y que se encuentra anexa a este módulo).
Al hacer esto, verifico que el cuadro de dialogo tenga seleccionada la opción Mostrar tablas de
frecuencias, como aparece abajo.
10
Luego, selecciono las tres variables escalares: VAR1, VAR2 y VAR 3 y las paso al cuadro
[Variables:]. Selecciono el botón que dice [Estadístico…] Debemos recordemos que, al ser
escalares, es posible realizar mediciones de tendencia central y dispersión sin problemas. De
preferencia vamos a tomar la media, la mediana y la moda como medidas de tendencia central,
y de dispersión la desviación típica, la varianza y el rango. Luego de esto damos a [Aceptar].
Debe aparecernos en la ventana de resultados un cuadro como este:
Allí, vemos que los valores 21, 30, 45 y 50 se repiten dos veces en la VAR3. Este cuadro nos
muestra, en las columnas, tanto los valores de frecuencia o repetición de los datos como el
valor de porcentaje, que representa el porcentaje de cada dato respecto del total de datos
(100%).
Podemos resumir estos gráficos en: gráfica de barras, barras agrupadas, gráficas lineales,
histogramas, diagramas de cajas y bigotes y diagramas de dispersión.
Para entender cómo se grafican estos datos vamos a volver a nuestra base anterior en SPSS
(base que tiene una variable de género y 3 variables escalares VAR1, VAR2 y VAR3).
En esta ocasión vamos a seleccionar el botón que dice [Gráficos…]. Aquí aparecerán tres
opciones: 1. Gráfico de barras, 2. De sectores y3. Histograma (el cual permite la opción de
mostrar curva normal).
Además, este paso permite decidir si trabajar con frecuencias, como valores del gráfico, o con
porcentajes. Generalmente esta decisión depende del estudio y de lo que se quiera mostrar en
él, pero, en muchas ocasiones resulta útil presentar los datos en términos de porcentajes por
cuanto permite comparar una categoría respecto a otra de un total de datos (100%).
Los gráficos de barras, además, permiten observar en detalle la distribución de los datos, por
ello no es recomendable utilizar variables escalares para este tipo de gráficos, ya que este
ejercicio me arrojaría una barra por cada dato, los cuales son generalmente extensos en las
variables escalares, hecho que no aportaría información relevante para el estudio.
Vamos a utilizar para este ejercicio la variable Género del ejemplo anterior. Un aspecto
importante a tener en cuenta es que esta variable es nominal. Así, no pueden realizarse
medidas de dispersión o medidas de tendencia central. Algunos autores sugieren cálculo de
modas como única alternativa para este tipo de nivel de medida. Por ello, si se ha realizado un
análisis previo de estas estadísticas, es importante quitar la selección de las medidas de
tendencia para luego sí continuar con los análisis.
Otro elemento importante para proceder es la atribución de las categorías de las variables. Para
ello hemos de ir a la vista de variables. Si seleccionamos la casilla de valores, aparecerán unos
puntos suspensivos […] le damos a esta opción y aparecerá el siguiente cuadro de diálogo de
etiquetas de valor:
12
Fuente. Archivo personal
En esta parte hay que asignar valores a las categorías. Como mencionaba arriba, la mejor opción
es asignar el valor de 1 a la categoría de hombres y 2 a las mujeres (aunque no hay un orden
preestablecido para esto). Lo importante es que se tenga en cuenta esta categoría cuando se
pasen los datos a la variable o utilizar las categorías preestablecidas cuando se coloquen las
etiquetas. Colocamos en Valor:1 y en Etiqueta: Hombres, y damos a la opción de añadir. Luego
colocamos el valor: 2 y en etiqueta Mujeres y damos añadir y aceptar.
Gráficas lineales
Este tipo de gráficas me permite describe el progreso de algún grupo. Me permite mostrar
evoluciones o cambios a lo largo del tiempo. En este caso es común representar, en el eje “x”, el
valor tiempo y, en el eje “y”, los cambios asociados a la variable en ese sentido.
Vamos a continuar con nuestra base para ejemplificar este tipo de gráfico, pero vamos a hacerlo
desde otra opción de SPSS, utilizando el comando siguiente:
14
Fuente. Archivo personal
En la opción [Líneas] que aparece en la imagen en gris, me aparecerán dos cuadros. Selecciono
el primero (por tratarse sólo de un conjunto de datos a visualizar) y arrastro la imagen en el
cuadro que dice arrastre hasta aquí un gráfico…. Luego de eso el programa nos presentará un
cuadro con puntos en el eje “x” y en el eje “y”. Como el eje x indica la medida de tiempo, vamos
a seleccionar, del conjunto de variables, la variable ID, ya que esta es una variable de orden de
secuencia. En el eje “y” estaría la variable de cambio, que para este pequeño ejemplo será la
Histograma
El histograma permite visualizar un conjunto de barras agrupadas que representa, cada barra,
los valores por cada categoría. El total de todas las áreas de las columnas representarán a toda
la muestra. Es importante notar que las barras, en el histograma, sólo pueden representar
frecuencias, a diferencia del gráfico de barras en donde era posible representar también
porcentajes.
16
SPSS permite además trazar una curva para el histograma. Esta curva llega a ser importante,
como veremos más adelante, para entender si la distribución de los datos es o no normal.
Diagrama de dispersión
Este tipo de grafico permite visualizar, en un plano x-y, los puntos de relación de dos variables
(x1, y1), (x2, y2),…, (xn, yn). Generándose un cuadro de puntos donde es posible ver la tendencia o
dispersión de los datos. Tal gráfico, como veremos más adelante, resulta muy útil para entender
las correlaciones.
18
Fuente. Archivo personal
Distribución normal
Otra forma importante de describir los datos tiene que ver con la distribución normal de los
mismos. Generalmente esta se realiza a través de la curva que vimos al hacer el histograma,
llamada también curva gaussiana. Esta curva representa la distribución y tiene las siguientes
características:
Ahora bien, existen diferentes formas de dividir esta curva. Estas divisiones tendrán el propósito
de ubicar, en porcentaje y en dispersión, un dato específico.
En el ejemplo inicial:
2, 3, 5, 7, 7, 8.
La media tiene un valor de 5,33, y el valor de desviación es de 2,42 (calculados, ambos, más
arriba). Entre la media y el valor de desviación habrán 2,91 unidades (calculado al restar a 5,33
2,42). Estas podrán representar nuestra primera unidad 1 (1: 2,91). Tanto por encima como por
debajo de la media. Es decir que de 2,42 a 5,33 habrá una primera unidad (con un valor de
rango de 2,91). A este tipo de unidad estándar d conversión se le denominará puntuación z.
Puntuaciones z
Así, la puntuación z o puntaje z es la puntuación que representa el valor estándar de conversión
a partir de la desviación, es decir, es el número de desviaciones estándar a las que está una
puntuación de la media. La fórmula para calcularla es la que sigue:
𝑥𝑖 − ∆𝑥
𝑧=
𝑆𝑥
Siendo Sx la desviación estándar.
Como les venía diciendo, esta es útil como medida de identificación o ubicación de unos datos
respecto a un conjunto de datos ya que, a más unidades o puntajes z esté un dato, sabremos
que ese dato estará más alejado de la media.
Con esta información damos por finalizada la Unidad Dos y la presentación de los análisis
descriptivos. En una próxima cartilla hablaremos de los análisis inferenciales y las formas de
proceder con ellos desde SPSS.
20