Anexo 1 Importar Datos A Herramientas

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 88

Anexos N02

Actividad cuyo propósito es proponer a los participantes un trabajo grupal en


torno a un tópico específico, crea un entorno muy propicio para compartir sus
conocimientos con los demás compañeros de taller y fomentar el aprendizaje. A
diferencia de un curso que consta de varias jornadas, este se desarrolla en una
sola sesión que suele durar entre dos y cuatro horas

Taller Práctico De la
Observación a la Tabla de
Investigación. Preparación
de los Datos
Anexo 1 N02

IMPORTAR datos a
herramientas

INDICE
ANEXO 1 IMPORTAR DATOS A HERRAMIENTAS

a. Creación e identificación de los datos con Entorno R 2

Importación y exportación de datos en R 11

b. Creación e identificación de los datos con SPAD 5 13

Importación de archivos de texto a SPAD 20

c. Creación e identificación de los datos con DTM-Visualization, inference,


classification 25

Importación de datos a DTM Visualization, inference, classification 26

CESARI 2018 Página 1


Anexo 1 N02

IMPORTAR datos a
herramientas

ANEXO 1
IMPORTAR datos a herramientas
a. Creación e identificación de los datos con Entorno R
Software estadístico que se ha ido convirtiendo desde su creación en 1993 en uno de los
programas informáticos para el análisis de datos más utilizados en todo en el mundo. En
todas las disciplinas científicas y ámbitos profesionales de aplicación, R empieza a ser una
referencia obligada. ¿A qué se debe este éxito? Sugerimos la respuesta diciendo que cumple
con esa máxima de ser bueno, bonito y barato. Principalmente por su inigualable relación
calidad/precio. Es un producto de primera calidad, potente y eficiente, flexible, que se ha
extendido mundialmente con una red de apoyo entre usuarios valiosísima, al mejor precio
posible: software libre que se distribuye gratuitamente bajo licencia GNU1.
R es un conjunto integrado de programas para manipulación de datos, cálculo y gráficos.
Entre otras características dispone de:
 almacenamiento y manipulación efectiva de datos,
 operadores para cálculo sobre variables indexadas (Arrays), en particular matrices,
 una amplia, coherente e integrada colección de herramientas para análisis de datos,
 posibilidades gráficas para análisis de datos, que funcionan directamente sobre pantalla o
impresora, y
 un lenguaje de programación bien desarrollado, simple y efectivo, que incluye
condicionales, ciclos, funciones recursivas y posibilidad de entradas y salidas. (Debe
destacarse que muchas de las funciones suministradas con el sistema están escritas en el
lenguaje R)
El término “entorno” lo caracteriza como un sistema completamente diseñado y coherente,
antes que como una agregación incremental de herramientas muy específicas e inflexibles,
como ocurre frecuentemente con otros programas de análisis de datos.
Junto con R se incluyen ocho bibliotecas pero otras muchas están disponibles a través de
Internet en CRAN (http://www.r-project.org).
Destacan entre sus ventajas, además de ser un software libre:
- Es un programa multiplataforma y, por tanto, existen versiones para Mac, iPhone, Linux o
Windows.
- A través del software R es posible analizar cualquier tipo de datos. Destaca por su
compatibilidad con todos los formatos de datos (txt, csv, xls, sav, sas,...).
- Tiene una capacidad gráfica muy buena en relación a los otros paquetes estadísticos.
- Existen miles de técnicas estadísticas que se han implementado en R, y siguen aumentando día
tras día. Así, la instalación base del programa es ampliable mediante extensiones para realizar
análisis específicos para infinidad de disciplinas.
R tampoco deja de tener inconvenientes: el principal, para un iniciado en ciencias sociales y
humanas, el lenguaje de programación; también la interfaz gráfica básica, la no
actualización de algunos paquetes, las dificultades de instalación y funcionamiento en un
entorno, las dificultades o la imposibilidad de utilizar los acentos o las dificultades para
trabajar con datos de encuesta ya no se conciben valores y etiquetas o valores perdidos
diferenciados. Pero son obstáculos en parte solucionables, que esperamos se resuelvan con
el tiempo, en relación con las ventajas que pueden obtenerse.
1
Software completamente libre, para su uso, modificación y distribución, evitando también su comercialización (ver
http://www.gnu.org/)
CESARI 2018 Página 2
Anexo 1 N02

IMPORTAR datos a
herramientas

La curva de aprendizaje de R, como también sucede con las técnicas de análisis de datos
estadísticos, es lenta y costosa al inicio. Trabajar con R implica conocer el lenguaje de
programación de R, significa tener que elaborar programas de instrucciones que se irán
ejecutando a medida que se vayan enviando para ser procesados, en vez de trabajar con
menús y cuadros de diálogo donde a base de clics de ratón se modelizan o parametrizan los
distintos procedimientos. Este aspecto tiene la gran ventaja de que permite al usuario un
mayor control de los procedimientos que ejecuta.
En una etapa inicial del aprendizaje y mediante la utilización de interfaces gráficos
(denominados GUI, Graphical User Interface) veremos cómo se facilita el uso y el
aprendizaje de R para realizar algunas tareas de análisis preestablecidas en un entorno
gráfico más amigable.
Una interfaz gráfica de usuario permite realizar las operaciones más comunes mediante
una serie de menús o mediante interacción con los objetos gráficos que aparecen en
pantalla, a través de periféricos como el ratón. Se opone a interfaz de programador o de
comandos, donde se teclean las instrucciones que se pretenden ejecutar. Una lista
exhaustiva de las interfaces para R se encuentra en http://www.sciviews.org/_rgui
1. Rkward. Se trata de la interfaz gráfica para R más prometedora. Está escrita en PHP y
C++ (sobre las bibliotecas del entorno gráfico KDE). Se distribuye bajo licencia GPL de GNU.
Para más información, visite http://es.wikipedia.org/wiki/RKWard.
Hemos de advertir que el entorno KDE funciona perfectamente sobre Ubuntu, pero todavía
no sobre Windows.
2. RCommander. Se trata de una interfaz más primitiva que Rkward, aunque más madura.
Se distribuye también bajo licencia GPL de GNU. Utiliza el entorno gráfico Tcl/Tk, así que
funciona adecuadamente tanto en Ubuntu como en Windows.
Por ello, es ahora mismo la interfaz más popular para R. Varias universidades han
desarrollado cursos basados en ella; véanse por ejemplo las páginas
http://knuth.uca.es/moodle/ (Universidad de Cádiz) y
http://crisol.uc3m.es/index.php/gnur (Universidad Carlos III).
Como cualidades podemos destacar:
- Adecuado para un curso de iniciación a la Estadística.
- Numerosa documentación en castellano.
- Módulos adicionales para Estadística avanzada.
- Introduce a la programación de R, al mostrar el código asociado a cada acción de los
menús.
- Fácil intalación.
Editor de datos deficiente. Se recomienda importar los datos y no editarlos directamente.

3. Deducer. Se trata de una interfaz que nos facilita la utilización de unos pocos paquetes
de R. Seguramente con el tiempo se irán ampliando las opciones de análisis con este tipo de
entorno, pero hasta el momento es limitado. La práctica de la investigación se extiende a
necesidades del analista que están limitadas por la configuración actual de estos editores,
ya sea porque alguna opción del paquete en cuestión no está disponible ya sea porque
sencillamente no se implementó en este entorno. El conocimiento progresivo de estas
herramientas ilustrará la necesidad de realizar tareas fuera del mismo, circunstancia que
obliga a combinar y conocer ambas forma de trabajo con el software.

CESARI 2018 Página 3


Anexo 1 N02

IMPORTAR datos a
herramientas

Para trabajar con el lenguaje de programación de R el usuario/a maneja un intérprete de


línea de comandos a través de una consola. La instalación inicial de R proporciona esta
consola básica. Alternativamente se han creado editores de texto de R (denominados IDE,
Integrated Development Environment) que trabajan con versiones mejoradas de la consola
que nos facilitan el trabajo de programación y la visualización y tratamiento de los
resultados. Entre las distintas posibilidades existentes optamos por R-Studio.

R se descarga desde la página oficial: http://cran.r-project.org , eligiendo la plataforma de


cada usuario/a (Windows, Linux o MacOSX).
Cuando acabemos nos aparecerá el mensaje de finalización de la instalación y
dispondremos de un acceso a la aplicación.

Al abrir la aplicación para trabajar con R nos aparecerá una ventana como la siguiente que
recibe el nombre de consola de R.

Consola de R
En color rojo, al final, aparece el símbolo del sistema (el prompt): > y el cursor |
posicionado esperando la introducción de una instrucción en el lenguaje de programación
de R. La barra de menús nos ofrece algunas posibilidades de tareas a realizar pero no es el
lugar donde se pueden encontrar las instrucciones de los procedimientos de R para el
análisis estadístico y la obtención de representaciones gráficas.

CESARI 2018 Página 4


Anexo 1 N02

IMPORTAR datos a
herramientas

Para trabajar en este entorno podemos hacerlo de forma interactiva ejecutando una
instrucción cada vez y viendo el resultado a continuación, o podemos elaborar programas
con diversas instrucciones (denominados scripts) que se pueden ejecutar en bloque.
Probemos ejecutar una instrucción tan sencilla como sumar 2 más 2. Escribimos 2+2 y
apretamos sobre la tecla <Enter>, obtendremos el resultado esperado:
> 2+2
[1] 4
Ahora repitamos la misma operación pero asignando el resultado de la suma a un objeto. Si
a este objeto le llamamos suma la asignación se realiza así:
> suma = 2+2
o bien
> suma <- 2+2
El operador de asignación = es equivalente al operador <-
A continuación para visualizar el resultado, basta con escribir suma y darle a <Enter>:
> suma
[1] 4

El software se caracteriza en primer lugar por ser un programa orientado a objetos, es


decir, que se identifican como objetos cada uno de los elementos con los que se trabaja: ya
sean datos, variables, matrices, cálculos, funciones, resultados de tablas de un análisis,
gráficos, funciones, etc
Un elemento importante y útil en R es el Workspace, el área o espacio de trabajo de R, es el
lugar donde se incluyen los objetos con los que trabaja el programa (variables, matrices de
datos,…). Cuando se cierra la aplicación siempre se pregunta si se quiere guardar y así
poder volver a cargarlo en la siguiente sesión, lo que significa una gran ventaja y eficiencia
en el trabajo. Por defecto el espacio de trabajo se localiza en el directorio de trabajo
(working directory) que se haya definido en la instalación.
Es recomendable que utilice un directorio de trabajo diferente para cada problema que
analice con R. Es muy común crear objetos con los nombres x e y, por ejemplo. Estos
nombres tienen sentido dentro de un análisis concreto, pero es muy difícil dilucidar su
significado cuando se han realizado varios análisis en el mismo directorio.
Bajo Microsoft Windows el procedimiento a seguir es: Cree una carpeta o directorio. Ejecute
R haciendo doble click en el icono correspondiente. Seleccione Cambiar dir del menú Archivo
para indicar que desea cambiar el directorio de trabajo (ubicación por defecto para los
análisis que se realicen en el espacio de trabajo) y a continuación seleccione Guardar
dentro del menú Archivo para salvar esta imagen en el directorio que acaba de crear. Puede
comenzar ahora los análisis y cuando salga de R, éste le preguntará si desea salvar la
imagen en el directorio de trabajo.
Para continuar con este análisis posteriormente basta con pulsar en el icono de la imagen
salvada, o bien puede ejecutar R y utilizar la opción Abrir dentro del menú Archivo para
seleccionar y abrir la imagen salvada.
Para ver todos los objetos de nuestro espacio o área de trabajo podemos ejecutar por el
menú Misc / Listar objetos o bien ejecutar el comando:
> ls()
Para eliminar objetos utilizaríamos el comando rm.

CESARI 2018 Página 5


Anexo 1 N02

IMPORTAR datos a
herramientas

Para ver el espacio de trabajo donde estamos trabajando podemos ir a Archivo /


Guardar área de trabajo o ejecutar el comando: getwd()
Para cambiar el espacio: Archivo / Cambiar dir, o bien ejecutamos el cambio a la carpeta,
por ejemplo, Espacio de la unidad c:
> setwd("c:/Espacio")
Para guardar el área de trabajo por el menú: Archivo / Guardar área de trabajo o con el
comando, al que le damos el nombre Espacio.RData:
> save.image("C: \\Espacio\\Espacio.RData")
Para cargar un espacio de trabajo guardado: Archivo / Cargar área de trabajo o bien:
> load("C: \\Espacio\\Espacio.RData")

Una base o matriz de datos de estas características se identifica en R como un data frame,
(mediante el símbolo (df) en Data Set se identifica el tipo de datos) traducido como marco
de datos. Pero R también trabaja con el concepto de matriz en otro sentido y es preciso no
confundirlo. Se denomina matrix a un tipo de objeto que también es un conjunto de filas y
columnas, pero a diferencia del data frame en una matrix todos los elementos deben ser del
mismo tipo.
Por tanto, un data frame es una generalización de una matrix y puede contener, por
ejemplo, columnas con variables de diferente tipo: numéricas, factor, carácter, etc.
En matrix todas las variables deben ser del mismo tipo.
Como hemos comentado en general trabajaremos con data frames que denominaremos
matriz de datos o base de datos, si hacemos referencia en algún momento a una matriz de
elementos iguales en el contexto de R emplearemos la expresión matrix.
Los diferentes paquetes instalados de R disponen de archivos de datos que podemos
utilizar en cualquier momento. Ejecutando el comando data() desde la consola obtenemos
un extenso listado de los conjuntos de datos disponibles:
> data()
Se puede abrir cualquier conjunto de datos ejecutando el mismo comando con el nombre
del archivo de datos entre paréntesis. Por ejemplo en el paquete effects existe una matriz
(data frame) con datos de la World Values Survey, si ejecutamos:
> data(WVS)
Se cargará en el editor de datos, desplegamos el Data Set y veremos la matriz WVS.

Los paquetes son colecciones de funciones de R, datos y código compilado en un formato


definido. La primera instalación de R incorpora los paquetes base que se pueden ir
ampliando.
Los paquetes los podemos encontrar en el Comprehensive R Archive Network o CRAN
(http://cran.r-project.org/) que es el repositorio oficial de paquetes disponibles para R.

El CRAN se encuentra en diversos servidores espejo en todo el mundo y cuando queremos


descargar uno para ampliar nuestra instalación de paquetes de R tendremos que
seleccionar de una lista de servidores el que queramos: el de la nube (0-Cloud), el que esté
más cercano físicamente (Argentina La Plata) o cualquier otro. Desde la consola se accede
al CRAN Mirror a través del menú: Paquetes / Seleccionar espejo CRAN.

CESARI 2018 Página 6


Anexo 1 N02

IMPORTAR datos a
herramientas

Espejo del CRAN

El paquete que deseemos instalar del CRAN los encontraremos listado a través de: Paquetes
/ Instalar paquete.

Paquetes para descargar

Los paquetes que se descargan están disponibles entre las librerías de nuestra instalación
pero no están cargados en el sistema de R hasta que no se indica. Para ello es necesario
seleccionar el paquete y cargarlo a través de Paquetes / Cargar paquete.

CESARI 2018 Página 7


Anexo 1 N02

IMPORTAR datos a
herramientas

Paquetes disponibles

Así pues para proceder a instalar un paquete adicional que necesitemos en R seguiremos
los siguientes pasos:
1) En el menú Paquetes / Instalar paquete elegimos el nuevo paquete.
2) Nos aparecerá la imagen del CRAN Mirror y elegiremos el servidor de descarga.
3) Para usarlo deberemos cargarlo a través de Paquetes / Cargar paquete.
A medida que se profundiza el conocimiento y se adquiere experiencia, y también se van
ampliando las necesidades, tanto en R como en el tratamiento y análisis de datos
cuantitativos, se irán incorporando distintos procedimientos de esta inmensidad de
alternativas que nos ofrecen hoy en día los paquetes estadísticos y R en particular.
Finalmente comentaremos que un paquete también se puede actualizar (a través del menú
Paquetes / Actualizar paquetes o con el comando update.packages) o desinstalar (el
comando uninstall.packages). La desinstalación del software es la habitual de cualquier
sistema operativo, en el caso de MS-Windows a través de Panel de control / Programas y
características.
Realizaremos esta tarea de edición de los datos con Deducer que nos facilitará el trabajo
de creación e identificación en un entorno de ventanas.
Deducer2 está diseñado para ser una alternativa gratuita y fácil de usar al software
patentado de análisis de datos, como SPSS, JMP y Minitab. Tiene un sistema de menú para
realizar tareas comunes de manipulación y análisis de datos, y una hoja de cálculo similar a
Excel para ver y editar marcos de datos.
Proporciona una interfaz gráfica de usuario (GUI) intuitiva para R, que alienta a los
usuarios no técnicos a aprender y realizar análisis sin que la programación se interponga
en su camino.
Aumenta la eficiencia de los usuarios expertos de R cuando realice tareas comunes
reemplazando cientos de teclas con unos pocos clics del mouse. Además, en la medida de lo
posible, la GUI no debería interferir si solo quieren hacer algo de programación.

2 http://www.deducer.org/pmwiki/index.php?n=Main.DeducerManual?from=Main.HomePage
CESARI 2018 Página 8
Anexo 1 N02

IMPORTAR datos a
herramientas

Deducer está diseñado para ser utilizado con la consola JGR basada en Java JGR, aunque
admite varios otros entornos R (por ejemplo, Windows RGUI y RTerm)

Para crea una matriz de datos, si acabamos de entrar en Deducer, tendremos la opción de
clicar sobre New Data en la ventana inicial de Data Viewer, nos aparecerá seguidamente un
cuadro para darle un nombre que no contenga ni acentos ni espacios. Le podremos el
nombre de Encuesta. Se abrirá el editor de datos en blanco.
Si estuviéramos trabajando con otros datos, desde el editor abierto procederemos a abrir
una nueva ventana del editor de datos en blanco mediante: File / New Data /Datos, o bien
con las teclas <CTRL>+<N>. El tipo de archivos de datos con los que trabajaremos
habitualmente, nuestras matrices de datos, se identifican en R como data frames.
El editor de datos, que abre al inicio o a partir del menú de la consola permite crear o
examinar una matriz de datos a partir de dos pestañas. En la [1] Data View introduciremos
los datos propiamente, es decir, los códigos o valores de las variables, mientras que en la
[2] Variable View identificaremos las características de éstos, su diccionario. Podríamos
optar tanto por empezar a introducir los datos como por elaborar el diccionario, pero es
recomendable proceder en primer lugar a introducir los datos, pues nos ayudarán, en el
caso de las variables cualitativas, a generar automáticamente el diccionario de sus valores.
En el visor de datos si clicamos el botón derecho del ratón en cualquier fila, además de
copiar, cortar y pegar, podremos: insertar una nueva fila (Insert New Row), borrarla
(Remove Row) y cambiar el nombre de la fila (Edit Row Name). Desde el momento que
creamos una nueva línea ésta aparece con el valor NA (Not Available) en cada casilla que
identifica la ausencia de valor (casilla en blanco). Si clicamos el botón derecho del ratón en
cualquier columna, además de copiar, cortar y pegar, podremos: insertar una nueva
columna vacía (Insert Empty), borrarla (Remove), o duplicarla (Duplicate), así como
ordenar los datos de la columna de forma ascendente o descendente (Sort: Increasing-
Decreasing).
Podemos modificar la información de identificación y crear el diccionario de los datos. Para
ello especificaremos la información siguiente en relación a cada variable que se dispone en
las filas:
- El nombre de la variable (Variable): tiene que empezar con una letra o con punto, el
nombre que se asigna es distinto si se escribe con mayúsculas o minúsculas, no pueden
tener acentos, ni ñ ni ç, ni espacios en blanco, ni ningún carácter fuera del estándar inglés,
tampoco admite los símbolos de los operadores aritméticos.
- El tipo de formato de la variable (Type): las variables de un data frame de R pueden ser de
diferente tipo. En particular podemos hacer la distinción fundamental entre:
 Cualitativas o categóricas: valores de texto o etiqueta (numérica o textual) que representa el
grupo o categoría a la que pertenece el caso. Se pueden diferenciar entre nominales (por ejemplo
el sexo) y ordinales (nivel de estudios).
En R se denominan factores, y en el caso de ser de nivel ordinal factores ordenados.
 Cuantitativas: valores numéricos con los que tiene sentido realizar aritmética. Se pueden
diferenciar entre continuas (índice de masa corporal) y discretas (número de hijos).
En R se llaman double si tienen decimales e integer si representan datos discretos. Cuando
clicamos sobre cada casilla de la columna Type se abre un desplegable que nos permite definir el
formato de la variable. Así, el paquete estadístico Deducer clasifica los tipos de variables en:
CESARI 2018 Página 9
Anexo 1 N02

IMPORTAR datos a
herramientas

- Character: variables cadena (texto).


- Factor: variables categóricas que pueden ser nominales u ordinales.
- Double: variables cuantitativas continuas.
- Integer: variables cuantitativas discretas.
- Logical: variables lógicas o dicotómicas.
- Date: variables de fechas.
- Time: variables de tiempo.
- Los valores de las variables factor (Factor Levels): se detallan las etiquetas o valores de
estas variables que tratamos como cualitativas, de nivel de medida nominal u ordinal, y
donde hay que especificar cada etiqueta o valor de la variable.
Las etiquetas se pueden definir y editar clicando en la propia celda. Cuando creamos una
matriz de datos no es necesario definir de antemano las etiquetas del variable factor. A
medida que se introducen los datos las siguientes etiquetas se irán incorporando
automáticamente. El conjunto de las etiquetas se ordenan según el orden de introducción:
o bien en el editor del factor o bien en la vista de datos. Este orden puede ser relevante
para las características de la variable y puede resultar que la introducción de las etiquetas
no se adecúe a lo que queremos. Con las flechas las podemos ordenar. También podemos
añadirlas con + o quitarlas con -. Cuando en particular la categoría de la variable (level)
pueda tomar varios valores ordenables siguiendo una escala preestablecida (variable
ordinal) marcaremos la casilla Ordered. También se pueden modificar a través de la
consola en el menú Data / Edit Factor. Finalmente hay que destacar que cada etiqueta se
identifica en el sistema de R con un valor entero consecutivo que aparece entre paréntesis
en cada celda de la variable precisando numéricamente el orden. Esto suele pasar en la
mayoría de los editores de datos de los software de análisis de datos.
- Valores ausentes o marcantes: A diferencia de otros paquetes estadísticos donde se
pueden asignar valores específicos a cada situación y tratarlos de formas distinta, en R la
solución es drástica: cualquier valor que sea considerado perdido no se codifica y se tratan
de forma unificada identificándolos con el símbolo NA (Not Available).
En R no es necesario asignarles ningún valor particular, sencillamente se corresponden
con un “agujero” de información de la matriz, casillas que se dejan en blanco y que
reconocemos porque aparecen la letras NA3.
Los valores o categorías de las variables cualitativas no hay que introducirlos
necesariamente desde el visor de variables, el sistema los puede crear automáticamente a
medida que introducimos los datos en la pestaña del visor de datos, además les asigna
internamente un valor numérico que indica el orden de posición de cada categoría de la
variable.
En el momento de introducir los datos en el Data View, Deducer interpreta el tipo de
variable según la información proporcionada, e incluso cambia (sin aviso) el tipo. Esto
puede generar problemas: si definimos una variable como integer pero introducimos un
número con decimales, 2.0 por ejemplo, la convierte en double, si introducimos un número
decimal con coma 2,3 en vez de punto 2.3 la convierte en character. En R, y por tanto en
Deducer, el separador de decimales es el punto, y no la coma. Un dato introducido que
contenga una coma no es tratada como numérica, sino como texto.

3 Una forma alternativa de tratar en R de forma diferencial estos valores perdidos es (1) codificarlos con un valor
diferenciado, (2) crear una copia de la variable original en la cual los valores perdidos correspondientes estén en
blanco (NA), y (3) realizar los análisis seleccionando la versión de la variable que más interese en cada caso, con
sin NA, o combinando la información de ambas
CESARI 2018 Página 10
Anexo 1 N02

IMPORTAR datos a
herramientas

En el caso de las variables factor seguimos como criterio utilizar un código sintético de una
sola palabra, pudiendo utilizar los acentos. No obstante, trabajar con acentos en R es
problemático y obliga a renunciar a la especificidad de la lengua propia en favor de la
anglosajona, aspecto que debería ser revisado.
Hay que tener en cuenta que si editamos los Factores levels de una variable cualitativa y
borramos por error uno de los niveles, borraremos los datos correspondientes de la matriz
y se convertirán en NA (valores perdidos).

Importación y exportación de datos en R.


Si disponemos de datos ya creados por otro software con un formato definido (SPSS, SAS,
Excel,…) o bien sin formato, de texto plano (DAT, TXT), se puede importar fácilmente desde
R. A través del menú File / Open Data de Deducer o con las teclas <CTRL>+<L>, o el botón
del Data Viewer, accedemos a un cuadro de diálogo que nos permite abrir un fichero
eligiendo entre una diversidad de formatos:

En la página web de este Workshop, se encuentran los archivos4 01Encuesta.xls,


Encuesta.csv, y Encuesta.txt, si los abrimos desde Deducer veremos cómo realiza la
importación. En el caso del archivo en formato Excel nos pedirá qué hoja de cálculo
importar y a continuación creará una nueva matriz de datos con el nombre Encuesta15.
Se puede observar cómo ha asignado el nombre de las variables pues la primera línea de la
hoja de Excel contiene el nombre y considera como variable de tipo character a los datos
que están codificados textualmente. Cuando las convirtamos en variables tipo factor se
generaran automáticamente los niveles o valores categóricos.
Podemos realizar en segundo lugar una importación de un archivo csv, es decir, un formato
donde los datos están separados por una coma. Al abrir el fichero Encuesta.csv aparece
este cuadro de diálogo de importación:

4 http://pagines.uab.cat/plopez/content/III.2
5 Si estamos en un espacio de trabajo con la matriz Encuesta que hemos identificado
CESARI 2018 Página 11
Anexo 1 N02

IMPORTAR datos a
herramientas

Al cargarlo en R se genera la matriz de datos Encuesta26, con los datos, los nombres de las
variables y las que son cualitativas ya se incorporan como variables tipo factor con sus
valores correspondientes.
Finalmente podemos importar un archivo de texto plano como Encuesta.txt donde los
datos están separados por tabulaciones. Los resultados son similares a los de la matriz
importada Encuesta2.
También podemos guardar (exportar) nuestros datos en diferentes formatos. En este caso
las opciones disponibles de formatos son menos pero suficientes para llevarlos a cualquier
otra aplicación:

Una vez introducidos los datos, o a medida que los vamos grabando para no perder el
trabajo realizado, debemos guardarlos y convertirlos en un fichero del sistema R, por
ejemplo con el nombre Encuesta.rda.
Para guardar un archivo de datos: a través del menú File / Save Data, haciendo clic sobre
el botón, o con las teclas <CTRL> <S>. Al guardar los datos nos aparecerá siempre la
carpeta de trabajo definida por defecto (Mis documentos) o bien la que hayamos definido a
través del menú File / Set Working Directory (<CTRL>+<D>).
Es importante recordar que el directorio del archivo no puede tener acentos, ni tampoco el
archivo de datos.

6 Será así si estamos en un espacio de trabajo con la matriz Encuesta que hemos identificado al inicio y además
hemos importado de Excel el archivo Encuesta.xlsx que pasó a denominarse Encuesta1
CESARI 2018 Página 12
Anexo 1 N02

IMPORTAR datos a
herramientas

b. Creación e identificación de los datos con SPAD 5


Spad (Sisteme Protable pur 1`Analyses des Données) es un paquete estadístico general.
Implementa métodos descriptivos y multidimensionales aplicables a grandes matrices de
datos cuantitativos, cualitativos o textuales.

Para iniciar el programa, se aprieta dos veces en el icono SPAD.


Aparecen automáticamente tres ventanas
[1] Ventana principal del SPADN,
[2] Ventana de métodos estadísticos (Méthodes)
[3] Ventana de programación. (Filiére 1:sans noms)

El archivo BASE, con extensión .sba, es el archivo predefinido de trabajo de SPAD donde se
almacenan los datos y los meta datos. SPAD incorpora un editor de este tipo de ficheros,
llamado EDIBASE. Todos los análisis de datos requerirán un fichero BASE. SPAD ofrece la
posibilidad de abrir / crear / modificar este tipo de archivos.

Esta opción nos abre una nueva ventana (EDIBASE), con la que podemos editar el archivo.
Esta ventana se organiza en cuatro subventanas, accesibles por menú vía Fenêtre o bien
con los iconos de la barra de herramientas:

CESARI 2018 Página 13


Anexo 1 N02

IMPORTAR datos a
herramientas

La ventana que aparece por defecto es la ventana Valeurs, en forma de matriz, y se puede
editar directamente. Destacamos que las dos primeras columnas corresponden a los
identificadores de individuos y a sus etiquetas (Libellées). Las opciones del menú Edition
permiten añadir / suprimir individuos, entre otras. Los valores faltantes (missings) se
indican con una ausencia de valor.
La ventana Variables contiene cinco columnas:

Si seleccionamos la variable nominal (N) y cliqueamos sobre el icono Modalités aparecerá


la pantalla con las etiquetas para cada categoría de la variable. Esta ventana es también
editable y se nos presentan dos columnas correspondientes a las etiquetas cortas (4 letras)
y largas. El hecho de disponer de dos tamaños de etiquetas es útil para un uso posterior en
la parte gráfica del programa.

En el comando
Enregistrer sous del
menú Fichier podemos
guardar el fichero con
otro nombre.

CESARI 2018 Página 14


Anexo 1 N02

IMPORTAR datos a
herramientas

Para crear un nuevo archivo BASE debemos seleccionar la opción Nouvelle Base del menú
Base. Esta acción nos abrirá una nueva base vacía
Primeramente debemos definir las variables y su tipo. Por defecto ya viene definido un
identificador de individuo y su etiqueta. Debemos por tanto añadir tres nuevas variables:
una nominal (N), otra continua (C) y otra textual (T). Debemos también definir su rango y
las etiquetas de las modalidades de la variable nominal.
Para introducir los valores, debemos cliquear sobre el icono Valeurs. Observaremos que la
matriz de valores está vacía. Debemos ejecutar la opción Ajuter N fois del menú Edition, y
indicar que queremos añadir 10 individuos.
Ya podemos introducir los datos. El editor de bases de SPAD permite realizar las
operaciones Copiar / Cortar / Pegar usuales en Windows. Así pues, puede interaccionar
con otras aplicaciones que contengan datos, como WORD, EXCEL, SPSS,...
Una vez los hayamos introducido debemos guardar la base, utilizando la opción Enregistrer
del menú Fichier y debemos indicarle el nombre y el directorio donde se guardará el
fichero de datos. Supongamos que guardamos el fichero con el nombre Encuesta.sba

Manejo de bases de datos con SPAD


SPAD posee diferentes herramientas para el manejo de datos. En general, trabaja con un
tipo de ficheros de formato definido, para los que se dispone de un editor. Igualmente
ofrece opciones para importar / exportar bases con otros formatos: ficheros de textos,
ficheros de tablas de SAS, ficheros SPSS y OBDC. Todas estas herramientas se encuentran
en las opciones del menú Base de la ventana principal de SPAD.

El archivo BASE, con extensión .sba, es el archivo predefinido de trabajo de SPAD donde se
almacenan los datos y los meta datos.
SPAD incorpora un editor de este tipo de ficheros, llamado EDIBASE. Todos los análisis de
datos requerirán un fichero BASE. SPAD ofrece la posibilidad de abrir / crear / modificar
este tipo de archivos.
La filière es el objeto básico para realizar análisis con SPAD. En ella, se indican el archivo
BASE que se utiliza y se parametrizan los análisis. Toda la información y resultados se
puede guardar en una filière, mediante un archivo con extensión .fil.
En una filière se definen en un primer momento, de forma encadenada y secuencial, los
análisis que se realizarán sobre los datos y en un segundo momento se ejecuta la filière,
produciendo los resultados. Tanto las parametrizaciones como los resultados se presentan
como iconos.

CESARI 2018 Página 15


Anexo 1 N02

IMPORTAR datos a
herramientas

Para crear una nueva filière debemos ejecutar la opción Nouvelle filière del menú Filière.

Por defecto, al abrir SPAD ya nos aparecerá una filière vacía, con el siguiente aspecto:

El primer paso que se debe realizar es indicar con qué archivo BASE se desea trabajar. Para
ello se puede ejecutar la opción Sélectionner Base del menú Filière o bien hacer un doble
clic sobre el icono BASE.
Nos aparecerá una nueva pantalla donde debemos indicar el directorio del archivo de datos

Para el ejemplo de estudio, abrimos el fichero: Contaminacion.sba

CESARI 2018 Página 16


Anexo 1 N02

IMPORTAR datos a
herramientas

La filière debería tener el siguiente aspecto:

Una vez tenemos la filière referida a un archivo de datos, ya podemos empezar a encadenar
análisis, mediante los métodos (méthodes).
Todos los métodos disponibles los encontramos en la ventana
Méthodes, agrupados según su tipo.
Para definir un análisis necesitamos encadenar un conjunto
de métodos dentro de una filière. SPAD tiene definidos
muchos métodos agrupados según el tipo de análisis de
realizan, constituyendo módulos.

Destacamos los métodos siguientes:


- Description statistique. Realizan análisis estadísticos descriptivos.

STATS. Tablas de frecuencias y gráficos descriptivos (histogramas, diagramas de


barra, diagramas de dispersión, boxplots, ...)
DEMOD. Caracterización de una variable cualitativa. Realiza comparaciones múltiples
entre medias y proporciones con el resto de variables para observar las relaciones
más evidentes.
DESCO. Caracterización de una variable continua. Realiza comparaciones múltiples
entre proporciones y calcula correlaciones para observar las relaciones más
evidentes.

TABLE. Construcción de tablas cruzadas con los estadísticos usuales, recuentos,


medias, desviaciones, ...

BIVAR. Analiza pares de variables continuas, su correlación y las posibles relaciones


del espacio bidimensional creado con el resto de variables.

MSMOD. Caracterización de una variable nominal siguiendo un criterio de


recubrimiento

CESARI 2018 Página 17


Anexo 1 N02

IMPORTAR datos a
herramientas

- Analyses factorielles. Métodos para realizar análisis factoriales: análisis de


componentes principales, correspondencias simples y múltiples

COPRI. Análisis de componentes principales.

CORBI. Análisis de correspondencias simples (o binarias).

CORMU. Análisis de correspondencias múltiples.

COREM. Análisis de correspondencias múltiples con la opción de escoger las


modalidades activas en el análisis.

DEFAC. Descripción de los ejes factoriales.


TYTRA1. Análisis de correspondencias múltiples con una variable tiempo
- Classification. Métodos para ejecutar algoritmos de clasificación.

RECIP-SEMIS. Partición de los individuos en clases. Árbol de agregación.

PARTI-DECLA. Partición de los individuos en clases. Algoritmo de k-medias.

CLASS-MINER. Caracterización de las clases de individuos.

MSCLA. Caracterización de las clases de individuos

TYTRA2. Partición de los individuos (partiendo de TYTRA1).


- Módulo de exportación de datos

ESCAL. Creación de un archivo BASE conteniendo ejes factoriales y/o particiones de


individuos.

EXDON. Creación de un fichero de texto conteniendo los datos originales.

EXGUS. Creación de un fichero de texto conteniendo las coordenadas factoriales.


- Análisis estadístico de datos textuales
MOTS. Creación del glosario de palabras.
SEGME. Creación del glosario de segmentos repetidos.
VOSPEC. Formas léxicas características según grupos de individuos.
TALEX. Creación de tablas de contingencia léxicas.
CORBIT. Análisis de correspondencias simples en un tabla de contingencia léxica.
TEXNU. Creación de un archivo BASE conteniendo las palabras y la frecuencia para cada
uno de los individuos.
CORDA. Concordancias de formas léxicas.

CESARI 2018 Página 18


Anexo 1 N02

IMPORTAR datos a
herramientas

- Otros módulos
 Segmentación. Métodos para ajustar árboles de regresión y clasificación.
 Decisión – Modelos. Métodos para ajustar modelos de regresión lineales, loglineales,
lineales generales,...
 Tablas múltiples. Métodos para construir tablas múltiples y realizar análisis factoriales
múltiples.
 Amado. Métodos que interaccionan con el software AMADO.

Para introducir un nuevo método a la filière basta con seleccionar la opción Insérer
Méthode del menú Méthode o bien cliquear con el botón de la derecha en el icono BASE, y
seleccionar la misma opción en el submenú que aparece.

Esta acción nos insertará un nuevo icono vacío, donde deberemos indicar el método que
deseemos ejecutar.
Para indicar el método debemos arrastrar el icono desde la ventana Méthodes.
Para parametrizar el método basta con realizar un doble clic sobre el icono. Se nos abrirá
una ventana de parametrización donde debemos indicarle las variables continuas y
categóricas que queremos analizar.
Antes de ejecutar la filière debemos guardarla sobre un archivo .fil. Para ello, debemos
seleccionar la opción Sauvegarder Filière del menú Filière. Opcionalmente, podemos dar a
la filière una etiqueta larga.
Una vez guardada, ya podemos ejecutar la filière, seleccionando la opción Exécuter filière
del menú Filière.
Después de la ejecución nos aparecerán los iconos de resultados, a la derecha de los
métodos Podemos realizar un doble click sobre cada uno de los iconos. Los símbolos de los
iconos nos indicarán el tipo de los resultados:

Icono LISTAGE. Proporciona los resultados estadísticos en forma de listado, en formato


texto, mediante un navegador de resultados.
Icono GRAPHIQUES. Nos proporciona una interficie interactiva para la edición de
gráficos. Permite realizar una gama amplia de gráficos: dispersión, diagramas de
barras, boxplots, realizar rotaciones, inserir una línea de regresión, ...
Icono GRAPHIQUES. Nos proporciona una interficie interactiva para la edición de los
planos factoriales (scattePlot)
Icono EXCEL. Crea una hoja de EXCEL con los datos del análisis. Resulta muy útil en
muchas ocasiones, por ejemplo, cuando deseamos hacer gráficos en formato EXCEL.

CESARI 2018 Página 19


Anexo 1 N02

IMPORTAR datos a
herramientas

Para abrir una filière existente basta con ejecutar la opción Ouvrir filière del menú Filière e
indicar dónde se encuentra el archivo .fil.
Nota:
Tanto los iconos de resultado como las parametrizaciones de los métodos no se pierden y
son de inmediato editables. Cabe destacar que SPAD utiliza muchos ficheros intermedios,
muchos de los cuáles van ligados a la filière. Es recomendable crear un directorio propio
para cada análisis o bien para cada archivo BASE. No es recomendable copiar la filière a
otro directorio, pues daría problemas en la localización de ficheros.
El modo de encadenar los análisis no es indiferente. Hay análisis que se alimentan de
análisis anteriores. Esto provoca que ciertos encadenamientos sean imposibles de ejecutar.
El caso de los análisis factoriales es un ejemplo. Primero debe realizarse el análisis factorial
para luego aplicar la clasificación sobre los ejes factoriales creados.
Un mismo método puede ser encadenado tantas veces consecutivas como se desee. En el
caso de disponer de bases de datos complejos, es aconsejable realizar diversas filières,
separando los análisis.
SPAD dispone de una opción para crear filières predefinidas, es decir, encaradas a realizar
un análisis clásico. Para crear una nueva filière predefinida debe ejecutarse la opción
Filière prédéfinie del menú Filière.

Importación de archivos de texto a SPAD


SPAD no importa directamente hojas Excel (de extensión .xls), pero si ficheros ASCII o de
texto delimitados por comas (también admite espacios, tabuladores, puntos y coma,...).
Generamos uno desde Excel desde Archivo ⇒ Guardar como...

Abriéndose una ventana en la que tenemos que especificar en la carpeta o directorio de


destino (P.ej.: A:\, C:\Mis Documentos, ...) el nombre de fichero (en este caso,
calidadVino.txt) y el tipo de archivo como TXT (Delimitado por tabulaciones) o CSV
(delimitado por comas).
Nota: revisar que las celdas no tengas caracteres especiales como “, #, $, % y /, evitar el uso
de “-“, “+”. Asegurar el formato de punto decimal y que las variables numéricas tengan
valores numéricos o vacíos. En este proceso las modalidades de las variables nominales se
les asignara un identificador corto de las 4 primeras letras del nombre de la variable.

CESARI 2018 Página 20


Anexo 1 N02

IMPORTAR datos a
herramientas

SPAD no trabaja directamente con ficheros de datos ASCII, sino que necesita convertirlos a
un formato propio de fichero, lo que se conoce como base de datos SPAD, que tiene
extensión .sba.
Para importar archivos ASCII que contengan datos a SPAD debemos seleccionar la opción
Importation fichier Ascii dentro de Importer del menú Base.

Con lo que se abre la siguiente ventana, en la que pinchamos en Nouveau (nuevo)


Especificamos un nombre cualquiera que nos guste y tenga que ver con los datos, p.ej., vino
⇒ OK.

La siguiente ventana que se abre es para incluir el fichero TXT o CSV a importar. Lo
buscaremos en el lugar donde lo hayamos guardado, y pinchamos Abrir.
Supongamos que disponemos de un archivo ASCII (.txt, .cvs o .dat) que contiene los datos
del ejemplo calidadVino.txt, donde los valores de las variables están separados por un
espacio tabulador. Este fichero contiene 4 variables numéricas continuas y 1 categórica
ordinal (mas una primera columna de identificadores) lo que es importante especificar. La
primera fila contiene, además, las etiquetas de las variables.
Para importar el archivo calidadVino.txt debemos parametrizar la pantalla como se
muestra a continuación.

CESARI 2018 Página 21


Anexo 1 N02

IMPORTAR datos a
herramientas

La siguiente ventana permite a SPAD leer correctamente los datos según sea el tipo de
fichero ASCII que estamos importando (existencia o no de etiquetas, decimales -si los hay-,
si los separadores son blancos, comas o puntos y comas,...). En la ventana inferior de pre-
visualizacion podemos comprobar esto.
En el caso del fichero calidadVino.txt, la primera línea contiene las etiquetas de las
variables, el texto tiene delimitadores (si son espacios, las posiciones de los datos son fijas)
y los separadores son tabulaciones.
Cliqueamos sobre el botón Suivant y nos aparece una nueva ventana donde debemos
indicar de qué tipo son las variables.

CESARI 2018 Página 22


Anexo 1 N02

IMPORTAR datos a
herramientas

La siguiente pantalla permite especificar algo muy importante en SPAD: el tipo de variables
estadísticas que estamos creando. En el caso de este fichero, la primera columna (C1 - id) es
un identificador de individuos ⇒ Identificateur, mientras que C2 - C5, son variables
continuas ⇒ Continue (Otros tipos de variable que admite son nomínales o alfabéticas y
textuales. También se puede abandonar una variable - Abandon).
Para crear el archivo SPAD debemos cliquear sobre el botón Executer e indicar el nombre
del nuevo archivo.

CESARI 2018 Página 23


Anexo 1 N02

IMPORTAR datos a
herramientas

Entonces, se abre un recuadro de diálogo en el que tenemos que escribir un nombre para la
base de datos, por ejemplo “calidadVino.sba” ⇒ Guardar.
Si la importación se ha realizado de manera correcta, veremos una pantalla como la
siguiente.

Presionamos Femer (cerrar). Listo los datos están listos para ser usados por el Spad
Sólo nos quedará comprobar que la importación se ha realizado correctamente, abriendo el
nuevo archivo con EDIBASE.

CESARI 2018 Página 24


Anexo 1 N02

IMPORTAR datos a
herramientas

c. Creación e identificación de los datos con DTM-Visualization, inference,


classification
Software de análisis exploratorio multidimensional de datos numéricos y textuales. Las
herramientas básicas son, por una parte, los métodos factoriales (o análisis en ejes
principales), tal como el análisis en componentes principales, los análisis de
correspondencias simples y múltiples y, por otro lado, los métodos de clasificación
(clasificación jerárquica, los métodos de partición, mapas auto-organizados). Estas técnicas
no se excluyen mutuamente sino que, al contrario, se utilizan sistemáticamente como
técnicas complementarias que ofrecen, cada una, los puntos de vista indispensables sobre
la realidad estadística.
Las limitaciones actuales (revisables) del software con relación al tamaño de los datos de
entrada son: 30.000 filas (las filas son individuos u observaciones); 1.200 columnas
(variables numéricas continuas, variables numéricas de codificación de variables
nominales - una variable nominal = una columna); 100.000 caracteres para "las respuestas
textuales" de un individuo /observación, pero no hay límites para un texto que no esté
asociado a un archivo numérico. Este formato corresponde a la gran mayoría de las
aplicaciones en las encuestas socioeconómicas, a los archivos provenientes de las
encuestas de gestión o de satisfacción, a los datos ecológicos, y a los análisis sensoriales,
etc.
Para ejecutar el Dtm-Vic, basta con hacer Clic en el icono

Obtenemos la pantalla de inicio siguiente:

CESARI 2018 Página 25


Anexo 1 N02

IMPORTAR datos a
herramientas

Dtm-Vic está estructurado en dos etapas:


I. La primera etapa Dtm – Data and Text mining incluye los procedimientos para la preparación de
los datos (importación, captura, exportación) y los procedimientos de análisis de datos (creación
y ejecución del archivo de comandos).
II. La segunda etapa Vic – Visualization, Inference, Classification proporciona las herramientas de
validación e interpretación de los resultados.
También se puede ver en la pantalla de inicio dos elementos opcionales: la "caja de
herramientas", DtmVic Tools que ofrece diferentes tipos de recodificación, almacenaje de
datos, y la sección DtmVic Images dedicada a algunos análisis de imágenes.

Importación de datos a DTM Visualization, inference, classification


La meta de los métodos de importación es transformar un archivo del texto preexistente
en el "formato interno DTM".
En la configuración más general, dos archivos constituyen el SET (conjunto) interno de
datos de DTM:
1) El archivo con diccionario, provee los nombres (o los identificadores) de las variables
numéricas y categóricas (incluye los nombres de las modalidades correspondientes a cada
variable categórica).
2) Los ficheros de datos, contiene los valores de estas variables para un SET de individuos (o las
observaciones), conjuntamente con los identificadores de los mismos.
Estos tres tipos de archivos están en formato del texto simple (la extensión ".txt", legible a
través del “Bloc de Notas” u otro editor de texto, (o también con un procesador de texto,
siempre que se tome como archivos del texto simples sin formato). Se suele colocar como
extensión (en reemplazo del txt) para estos ficheros de texto “dic” para el diccionario y
“dat” para los datos. Tabla 1 y 2 se muestra un ejemplo pequeño, implicando cuatro
variables.

Tabla 1: Ejemplo de un diccionario interno DTM para 4 variables:


Género (2 categorías); Edad (0 categorías es una variable = numérica);
Edad dividida en 4 categorías; Nivel educativo (3 categorías).
2 ENGENDRAN (4 espacios; el número de categorías N; espacio vacío; título de la variable)
MASC MASCULINO (identificador corto de 4 caracteres; espacio vacío; identificador < 20 caracteres)
FEME FEMENINO (identificador corto de 4 caracteres; espacio vacío; identificador < 20 caracteres)
0 EDAD_num (4 espacios; el número de categorías 0; espacio vacío; nombre variable numérica)
4 EDAD_rango (4 espacios; el número de categorías N; espacio vacío; título de la variable)
EDA1 18_24 (identificador corto de 4 caracteres; espacio vacío; identificador < 20 caracteres)
EDA2 25_39 (identificador corto de 4 caracteres; espacio vacío; identificador < 20 caracteres)
EDA3 40_59 (identificador corto de 4 caracteres; espacio vacío; identificador < 20 caracteres)
EDA4 60 (identificador corto de 4 caracteres; espacio vacío; identificador < 20 caracteres)
3 EDUCACIÓN (4 espacios; el número de categorías N; espacio vacío; título de la variable)
EDUL Baja
EDUM Media
EDUH Alta

CESARI 2018 Página 26


Anexo 1 N02

IMPORTAR datos a
herramientas

Tabla 2: El ejemplo de un fichero de datos interno DTM para las 4 variables previas:
El género, la Edad numérica, la Edad en 4 categorías, el nivel Educativo.
Tres encuestados (individuos, observaciones)
' 1006 ' 1 76 4 1 (Los identificadores de los individuos: entre comillas simples,
' 1007 ' 2 20 2 2 sin espacio vacío, menos de 20 caracteres.
' 1008 ' 2 29 3 2 Los separadores entre los valores: como mínimo un espacio en blanco)

Haga Clic en Data Importation, Preprocessing, Data Capture, Exportation en Data File
Aparece una ventana que sugiere diferentes procedimientos.

CESARI 2018 Página 27


Anexo 1 N02

IMPORTAR datos a
herramientas

La carga de datos / diccionario:


Tomando nota del diccionario y los datos presentado más arriba en la tabla 1 y 2:
Dé un clic sobre “DataCapture (carga de datos), Data importation (importar datos),
Preprocessing (preprocesamiento)”, opción del menú principal de DTM (1º botón).

Aparece una nueva ventana.

Escoja la opción: “Building the Dictionary” (construir el diccionario manualmente).


Aparece una nueva ventana, lista para introducir la información referente a la primera
variable, para los tres casos (amarillos).
 “Variable number” (Número de la variable), tipiar: "0001".
 “Variable identifier” (Identificador de la variable), escribir: “Género”;
 “Variable type” (Tipo de variable): Tipo "2" es nominal, y presionar “Enter”.
[El tipo de una variable nominal es el número de sus categorías, se
coloca “0” o “1” para una variable numérica)

CESARI 2018 Página 28


Anexo 1 N02

IMPORTAR datos a
herramientas

Cuando el número de categorías es mayor que 1, aparece una segunda ventana (a la


derecha) donde se debe registrar los nombres de las categorías o modalidades: “Masculino” y
“Femenino”.

En cuanto presionamos “Enter”, nos permite registrar una segunda variable (figura 1).
Siguiendo con el ejemplo ingresamos la “Edad”, cuyo tipo es "0" (o: 1), es una variable
numérica. En este caso no aparece ninguna venta a la derecha, ya que no es una variable
cualitativa donde debe especificarse modalidades.

CESARI 2018 Página 29


Anexo 1 N02

IMPORTAR datos a
herramientas

Volvemos a presionar “Enter”, nos permite registrar una tercera variable (figura 2).
Siguiendo con el ejemplo, ingresamos la “Edad discretizada en rangos”, variable categórica
de 4 modalidades.

CESARI 2018 Página 30


Anexo 1 N02

IMPORTAR datos a
herramientas

Se muestra en la ventana inferior (abajo) un informe de los datos grabados, en la ventana a


la derecha se exhibe el diccionario en formato interno de DTM. Es este diccionario el que se
genera al final del proceso de captura.
Cuando todas las variables se ingresaron, se debe hacer clic en “SAVE DICTIONARY". Se
aconseja construir un directorio nuevo (o: carpeta) en un área de trabajo conveniente, abrir
ese directorio y salvar el diccionario como "encuesta.dic".

Podemos modificar este archivo con el


Bloc de Notas de Windows o cualquier
otro editor, para modificar las etiquetas
o agregar variables respetando el
formato (tabla 1), por ejemplo, en la
siguiente figura, se modificó la etiqueta
corta de la edad en rango y se agregó
otra variable “Educación”.
Nota: asegurarse siempre de cerrar el
fichero cuando termine de editarlo.
Luego regrese: “RETURN”.

CESARI 2018 Página 31


Anexo 1 N02

IMPORTAR datos a
herramientas

Regresamos a la ventana “DataCapture” (captura de datos).


Ingresamos en “Creating the data file” (crear fichero de datos”.

Aparece la ventana “Creating data source file”.

Dé un clic sobre “LOAD DICTIONARY” (cargar diccionario)


--- > Ignorar el botón “Update an existing data file” (cargar un archivo existente).
Se visualiza el directorio escogido previo. Seleccionar el fichero "encuesta.dic".

CESARI 2018 Página 32


Anexo 1 N02

IMPORTAR datos a
herramientas

El diccionario se muestra en la ventana superior. Simultáneamente, la ventana izquierda


superior (amarilla) permite ingresar los datos referentes al primer individuo:
- Su identificador, (escriba para el ejemplo "1008")
- Luego el valor de la primera variable para ese individuo: “Género”. Con un clic en el
borde derecho de la lista se visualiza los dos valores posibles. Escoger a "Femenino".
Una vez que se presiona “Enter”, se dispone de la segunda variable, la “Edad”. Se debe
ingresar un valor numérico, etc.

En la parte inferior izquierda de la ventana se visualiza el contenido del fichero, es posible


escribir, modificar o borrar siempre respetando el formato (Tabla 2).
Cuando se termina de llenar todas las variables, se habilita las ventanas para ingresar otro
individuo u observación. Se aconseja registrar 3, 4 o más individuos en este ejercicio, luego
presione el botón “SAVE”.
CESARI 2018 Página 33
Anexo 1 N02

IMPORTAR datos a
herramientas

Déle un nombre al fichero de datos. Se recomienda la extensión ".txt", para facilitar un


acceso rápido al contenido del archivo desde cualquier editor de texto. Escriba por ejemplo
el nombre "encuesta.dat”.

Luego regrese: “RETURN”.


Presione luego el botón: “Create a first parameter file” (Crear un primer archivo de
parámetro).

Aparece la ventana “Creating a starting parameter file”. Haga clic en “Create a


parameter file” (crear un archivo de parámetro).

Se muestra en la ventana inferior un archivo de parámetro de DTM. Este es


automáticamente creado bajo el nombre de: "Param start.txt".
El archivo de parámetro incluye recuentos básicos de categorías, y cálculo de valores
extremos y promedios para las variables numéricas.
Es decir, sólo es una comprobación de la captura de la información.

CESARI 2018 Página 34


Anexo 1 N02

IMPORTAR datos a
herramientas

Los comentarios acerca del


"primer archivo de
parámetro"
 El "ARDAT" carga los
ficheros de datos y diccionario.
 El "SELEC" selecciona las
variables para el subsiguiente
procesamiento. En este caso,
todas las variables disponibles
son seleccionadas.
 El "STATS" computa las
estadísticas básicas
mencionadas arriba.
La nota de la derecha indica cómo ejecutar ese archivo de parámetro. Regrese al “Main
menu” (menú principal) de DTM.

En la opción “Open an existing Command file” (abrir un archivo existente de comandos).


Busque en el directorio de trabajo el archivo de parámetro "param start.txt" (por regla
general, los archivos de parámetros, datos y diccionarios deben estar en el mismo
directorio).

Regrese “RETUN”.

CESARI 2018 Página 35


Anexo 1 N02

IMPORTAR datos a
herramientas

Haga Clic en "Execute" (Responda NO a la pregunta acerca de un formato posible XML para
el archivo de salida).

Lea los resultados haciendo clic en “Main basic numerical results” (principales resultados
numéricos básicos) del menú. Estos resultados son guardados bajo el nombre "imp.txt" en
el mismo directorio de trabajo.

CESARI 2018 Página 36


Anexo 1 N02

IMPORTAR datos a
herramientas

Junto con el instalador de DTM, se descargó ejemplos, en cualquiera de las carpetas de los
ejercicios se puede copiar el fichero “CLEAN_dtm_files.BAT”, al directorio de trabajo
actual; al ejecutar este archivo se limpian los ficheros temporales (ocultos bajo Windows)
que genera el programa DTM.
Siempre copiar este fichero en la carpeta de trabajo.

Los datos en "formato CSV - Excel".


Transformando un archivo de Excel, formato XLS (CSV) en diccionario y ficheros de datos
de DTM. Para empezar, le daremos un vistazo (fuera de DTM) al archivo original a ser
importado.
Este archivo está bajo el formato de la planilla de cálculo Microsoft Excel7.
1. Buscar del “DTM-EXAMPLES” el directorio de ejemplos.
2. En ese directorio, abra la carpeta del ejemplo EX.02, llamado: EX02.Importation.XL
3. Seleccione el archivo: “Datbase classical.xls" (la tabla de datos) para verlo a través de
una hoja de cálculo de Excel.
La primera fila contiene las
etiquetas que identifican las
variables.
La primera columna contiene los
identificadores de individuos,
Las celdas (a partir de la segunda fila
y columna) son los valores de las 14
variables. Las celdas en blanco
representan "ninguna respuesta" o
"valor perdido".
Nota: Asegurarse que después de la tabla con los datos, tanto las filas como las
columnas del resto de la planilla estén vacías y sin formato. Se recomienda que la
primer columna sea destinada para etiquetas que identifiquen a los individuos, si la
tabla no tiene identificador de observaciones agregar una primer columna con un “id”
que identifique a cada fila.
Restricciones importantes:
a) Los nombres de variables deben tener menos de 20 caracteres,
b) Estos nombres no deberían tener espacios en blanco (en todo caso, reemplácelos por
líneas subrayadas).

7 El lector que no es provisto de ese software debería saltarse las siguientes instrucciones
CESARI 2018 Página 37
Anexo 1 N02

IMPORTAR datos a
herramientas

Estos nombres estarán truncados hasta 10 caracteres para construir luego los
identificadores de las modalidades. El archivo está formado por 1043 líneas (la muestra
de individuos de una encuesta socio económica sirve de ejemplo de aplicación en EX05,
EX06, EX07)).
4. Debemos guardar este archivo como un fichero de “texto delimitado por coma” con la
extensión ".csv". (En “Archivo”, ingresar a "Guardar como…") obtenemos un archivo de
formato libre con las columnas separadas por punto y coma.

Si ignoramos la primera fila, el archivo es similar al archivo de formato libre del ejemplo
anterior. En el directorio de ejemplo, se proveee el archivo en formato "csv".
Importante: Si hay puntos y comas en el fichero de datos, deberán ser reemplazados por otro
símbolo antes de realizar la transformación al formato CSV. También antes de guardar el
archivo, el formato de las celdas debe ser "normal", para evitar algunos espacios en blanco
adicionales.
Si su versión de Excel no tiene previsto la opción "guardar como un archivo de csv", usted
puede guardar el archivo usando "tabulaciones" como separadores, y luego, puede cambiar
las "tabulaciones" en "puntos y comas" (paso básico: ingrese a “Data capture, data
importation”, luego: presione “specific preprocessing”, luego: el botón “replacing tabs with
semicolons”).
Una vez creado el archivo con la
extensión CSV, lo abrimos con el
Bloc de Notas u otro editor de
texto para eliminar, al final del
mismo, líneas en blancos.
Chequeamos que todo está bien.

CESARI 2018 Página 38


Anexo 1 N02

IMPORTAR datos a
herramientas

5. La secuencia de operaciones:
a) Clic sobre “DataCapture, Data importation, Preprocessing” (importación / captura /
preprocesamiento de datos).
b) Seleccione: “Importing Dictionary ,Data and Texts” (Importar Diccionario, Datos y
Textos)". Se muestra una nueva ventana para la importación.

c) Presione el primer botón habilitado a la izquierda: “Excel ® Files” (archivos de


Excel). Se muestra la ventana “Importing from an Excel (r) file”. Si el archivo Excel
ha sido guardado con tabulaciones como separadores de columnas, se presiona el
botón: “0. Change tabs into semi-colons” (cambiar tabulaciones a puntos y comas).
Seleccione el archivo con tabulaciones y conviértalo.
Se crea un nuevo archivo “New_datbase_classical.tx".

CESARI 2018 Página 39


Anexo 1 N02

IMPORTAR datos a
herramientas

Luego, haga clic en: “1. Add the types of variables” (indicar tipos de variables ).

Ingrese a Select Data. (cargar fichero csv). Seleccione el archivo creado previamente
"datbase_classical.csv" .

Un cuadro de dialogo confirma la selección.


Debería aparecer la lista de variables.

CESARI 2018 Página 40


Anexo 1 N02

IMPORTAR datos a
herramientas

Ingrese a Values and Counts. (analizar los valores) y luego a Show results (muestra los
resultados).

Luego seleccionar uno o varios identificadores de variable, en la lista, y escoger, para cada
atributo (cada variable), una palabra clave entre las tres siguientes:
- “char” significa que nos ocupamos de una variable categórica (nominal). Tal variable
podría ser codificada con, a lo sumo, 6 caracteres. Por ejemplo, “masc” y “feme” para
codificar el sexo (o "0" y "1", o "10" y "20").
- “text” significa que los registros (hasta 30 caracteres), no serán tomados en cuenta en
un fichero de datos8. El identificador de individuos se coloca de este tipo (1º columna).
- “num” significa que nos ocupamos de una variable numérica (continua).

8 Es recomendable, siempre manteniendo el mismo identificador de individuos, colocar los textos en un


archivo aparte con el formato tipo 1 o tipo 2, según vimos en la tabla 3 y 4
CESARI 2018 Página 41
Anexo 1 N02

IMPORTAR datos a
herramientas

Una vez completado el que el ingreso del tipo de variable, dé un clic sobre “update the
data file” (actualización) para modificar el fichero.

El programa crea un nuevo archivo, en donde se agrego una fila después de los
identificadores de variables, con el tipo de dato. Este archivo es "
New_typevar_datbase_classical.csv".
Luego, haga clic en: “Impor Data” (importar). El proceso de importación consiste en
construir un diccionario DTM y un fichero de datos DTM a partir del fichero de datos
creado en el paso anterior “1”.
- los nombres de las variables se extraen de la primera fila del archivo
“New_typevar_datbase_classical.csv”.
- el número de categorías para cada variable y los nombres de estas modalidades se
obtienen al realizar un análisis del fichero Para cada variable, son detectadas todas las
diferentes secuencias de caracteres de importancia. Las modalidades son ordenadas
alfabéticamente por sus identificadores.

CESARI 2018 Página 42


Anexo 1 N02

IMPORTAR datos a
herramientas

- el fichero de datos DTM comienza con el mismo identificador entre comillas simples, las
modalidades de las variables categóricas serán enteros consecutivos comenzando con el
valor "1", en lugar de un símbolo alfanumérico. Los valores numéricos serán idénticos
al del fichero de datos original, excepto los valores perdidos reemplazados, en esta
versión de DTM, por el valor estándar "999".
Se muestra la ventana: “Format type XL ®. Finding the states of each categorical variables,
frequencies… “.

d) Clic en: “Select Basic file” (Seleccionar archivo Básico). Seleccione el archivo
“New_typevar_datbase_classical.csv” en el directorio: EX2.Importation.XL

e) Clic en “Values and counts” (Valores y recuentos). Análisis de todas las variables
nominales (el símbolo: "Achichárrese" en el diccionario) se forma de los dos
archivos básicos. Se muestra la lista de todas las modalidades encontraron en el
fichero de datos, con las frecuencias correspondientes.

CESARI 2018 Página 43


Anexo 1 N02

IMPORTAR datos a
herramientas

Clic en “Create Dictionary and Data” (crear el diccionario y los datos DTM).
La secuencia es idéntica a las fases correspondientes de ejemplo EX.1.
Clic en “Name for the new dictionary”
(nombre para el diccionario nuevo)
para escoger un nombre para el
diccionario en formato de DTM,
siempre en el mismo directorio. (se
recomienda la extensión ".DIC"). Por
ejemplo “diccionario.DIC”

Clic en “Name for the new data file”


(nombre para el archivo de datos
nuevo) para escoger un nombre del
fichero de datos en formato del DTM,
siempre en el mismo directorio. (se
recomienda la extensión ".DAT"). Por
ejemplo “datos.DAT”

Clic en “Create new dictionary” (crear diccionario nuevo). Analiza las modalidades para las
variables nominales. Es creado un diccionario en formato interno de DTM, el cuál se
visualiza en las notas a la derecha. Clic en “Create new data file” (crear fichero de datos
nuevo). Al cabo de un rato, un cuadro de mensajes muestra el número de individuos.
Clic sobre ese botón “Create a DTM parameter file”. (Crear un archivo de parámetros DTM).
Se muestra la ventana “Creating a starting parameter file”.
Clic en “Create a first parameter file” (crea un primer archivo de parámetro). Se muestra un
archivo de comandos DTM en la ventana inferior. Los demás operaciones y comentarios
son idénticos a la de la introducción. El archivo de comandos es automáticamente creado
bajo el nombre: "Param start.txt".
Haga Clic en "Execute" (Responda NO a la pregunta acerca
de un formato posible XML para el archivo de salida). Lea
los resultados haciendo clic en “Main basic numerical
results” (principales resultados numéricos básicos) del
menú.
Estos resultados son guardados bajo el nombre "imp.txt"
en el mismo directorio de trabajo.

CESARI 2018 Página 44


Anexo 1 N02

IMPORTAR datos a
herramientas

d. Creación e identificación de los datos con SPSS Statistica


Se creó en 1968 con este acrónimo para identificar lo que originalmente se denominó como
Statistical Package for the Social Sciences y se ha convertido en el programa estadístico de
referencia obligada a nivel mundial. La diversificación de productos de la compañía y
una marcada orientación hacia la comercialización en múltiples ámbitos explica el cambio
de denominación hacia la nueva identificación de Statistical Product and Service Solutions.
La primera versión del programa fue desarrollada por Norman H. Nie, Dale H. Bent y C.
Hadlai Hull9 en 1968 en la Stanford University. Entre 1969 y 1975 la University of Chicago
por medio de su National Opinion Research Center estuvo a cargo del desarrollo,
distribución y venta. A partir de 1975 se crea la compañía SPSS Inc. Las primeras versiones
funcionaban en grandes ordenadores y no es hasta el año 1984 que aparece la primera
versión para ordenadores personales, llamado SPSS/PC+ para la plataforma de MS-DOS.
Con la versión 10, en 1992, empezó a correr en el entorno gráfico de Windows. Desde
entonces la empresa fue creciendo y consolidándose, e introdujo distintas aplicaciones
analíticas que ampliaron considerablemente la oferta de productos que se expresan bajo el
concepto de análisis predictivo. La etapa actual está marcada por la adquisición de SPSS
Inc. por IBM en 2009. Una de las constantes de esta evolución es la progresiva introducción
de mejoras destinadas a facilitar la realización de las diferentes tareas de análisis así como
la continua incorporación de nuevos procedimientos. También ha significado la
diversificación de los usuarios, inicialmente circunscrito al ámbito de la investigación más
académica para generalizarse a todo tipo de usuario e institución.
Muchas de las características básicas de SPSS no se han modificado en el tiempo. La
mayoría de los procedimientos que se ejecutaban hace 20 o 30 años siguen funcionando,
muchos con mejoras introducidas y otros, si bien continúan existiendo, han entrado en
desuso. No obstante, en una perspectiva de 20 o 30 años los cambios son relevantes, en el
entorno de trabajo y la resolución gráfica, en la cantidad y calidad de los procedimientos
disponibles o en la capacidad de procesamiento10.
SPSS es un paquete estadístico que integra un conjunto de programas y subprogramas
organizados de forma que cada uno de ellos está interconectado con todos los demás. Así,
la utilidad del conjunto integrado es mayor que la suma de las partes. De esta forma el
paquete estadístico permite que se puedan aplicar a un mismo fichero de datos un conjunto
muy amplio de procedimientos estadísticos de manera sincronizada, sin salir nunca del
programa. En SPSS existe un módulo base y diversos módulos adicionales que amplían las
posibilidades de análisis y configuran distintas ofertas de procedimientos adecuados para
distintas necesidades y ámbitos profesionales.
Si entramos en la página de IBM SPSS podemos ver los distintos módulos y
productos (http://www01.ibm.com/software/analytics/spss/).
Junto al módulo base se dispone de los módulos siguientes:
Statistics, Advanced Statistics, Regression, Categories, Exact Test, Custom Tables,
Decision Trees, Complex Samples, Neural Networks, Forecasting, Conjoint,
Bootstrapping, Missing Values, Data Preparation

9 Hay quien ha señalado (Wellman, 1998) que el manual de estos tres autores (Nie, Bent y Hull, 1970) ha sido uno
de los libros más influyentes entre los sociólogos en aquel entonces, tras su amplia difusión en el ámbito
universitario estadounidense
10 El relato de la historia de SPSS se puede cosultar en: http://www.spss.com.hk/corpinfo/history.htm.

CESARI 2018 Página 45


Anexo 1 N02

IMPORTAR datos a
herramientas

El propio software estadístico dispone de una ayuda muy completa que se puede obtener a
través del menú de Ayuda y que enlaza con diversas direcciones de SPSS en internet:
1. El entorno de trabajo de SPSS
El entorno de trabajo del SPSS es una interface gráfica de ventanas, menús y cuadros de
diálogo propios del sistema operativo de Microsoft Windows.
Cuando iniciamos una sesión con el paquete estadístico nos aparece una ventana de
bienvenida que nos permite ver los productos instalados y no instalados, acceder a guías de
aprendizaje, ver las novedades de la versión e iniciar nuestra sesión de trabajo a partir de
archivos trabajados con anterioridad o con otros nuevos.
Al iniciar el uso del programa se muestran dos pantallas, la primera es muy similar a una
hoja de Excel, de la cual hablaremos posteriormente, la segunda es un cuadro de diálogo
que aparece en primer plano y que ofrece diversas opciones tales como información sobre
los módulos y las ampliaciones de programabilidad, así como útiles guías de aprendizaje
sobre múltiples temas relacionados con el programa y aspectos de estadística.

Cuadro de diálogo al iniciar el IBM SPSS Statistics


Si se trata de la primera vez que se trabaja con el programa, la forma más sencilla de iniciar
es cerrando la caja de diálogo, ya sea dando clic en la parte superior derecha [1] o en el
botón cancelar [2]. Otra forma de comenzar es seleccionando la opción nuevo conjunto de
datos [3] la cual es la siguiente acción a realizar y presionar el botón aceptar [4].

CESARI 2018 Página 46


Anexo 1 N02

IMPORTAR datos a
herramientas

Existen diversos tipos de ventanas:


 Editor de datos. El Editor de datos muestra el contenido del archivo de datos. Puede
crear nuevos archivos de datos o modificar los existentes con el Editor de datos. Si tiene
más de un archivo de datos abierto, habrá una ventana Editor de datos independiente
para cada archivo.
 Visor. Todas las tablas, los gráficos y los resultados estadísticos se muestran en el Visor.
Puede editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del
Visor se abre automáticamente la primera vez que se ejecuta un procedimiento que
genera resultados.
 Editor de tablas dinámicas. Con el Editor de tablas dinámicas es posible modificar los
resultados mostrados en este tipo de tablas de diversas maneras. Puede editar el texto,
intercambiar los datos de las filas y las columnas, añadir colores, crear tablas
multidimensionales y ocultar y mostrar los resultados de manera selectiva.
 Editor de gráficos. Puede modificar los gráficos y diagramas de alta resolución en las
ventanas de los gráficos. Es posible cambiar los colores, seleccionar diferentes tipos de
fuentes y tamaños, intercambiar los ejes horizontal y vertical, rotar diagramas de
dispersión 3-D e incluso cambiar el tipo de gráfico.
 Editor de resultados de texto. Los resultados de texto que no aparecen en las tablas
dinámicas pueden modificarse con el Editor de resultados de texto. Puede editar los
resultados y cambiar las características de las fuentes (tipo, estilo, color y tamaño).
 Editor de sintaxis. Puede pegar las selecciones del cuadro de diálogo en una ventana de
sintaxis, donde aparecerán en forma de sintaxis de comandos. A continuación puede
editar esta sintaxis de comandos para utilizar las características especiales que no se
encuentran disponibles en los cuadros de diálogo. También puede guardar los comandos
en un archivo para utilizarlos en sesiones posteriores.
En SPSS existen tres ventanas principales que se corresponden con los tres archivos
principales del software estadístico:

El editor de datos: Nombre_archivo.SAV


El editor o visor de resultados: Nombre_archivo.SPV que
Incluye a su vez tres editores, de:
Tablas
Gráficos
Texto

El editor de sintaxis: Nombre_archivo.SPS


Se puede abrir más de una ventana de cada tipo de editor. La ventana que se considera
activa (designada) incorpora el signo + en el icono que la representa.
La barra de estado que aparece en la parte inferior de cada ventana de IBM SPSS Statistics
proporciona la siguiente información:
- Estado del comando. En cada procedimiento o comando que se ejecuta, un recuento de
casos indica el número de casos procesados hasta el momento. En los procedimientos
estadísticos que requieren procesamientos iterativos, se muestra el número de
iteraciones.

CESARI 2018 Página 47


Anexo 1 N02

IMPORTAR datos a
herramientas

- Estado del filtro. Si ha seleccionado una muestra aleatoria o un subconjunto de casos


para el análisis, el mensaje Filtrado indica que existe algún tipo de filtrado activado
actualmente y por tanto en el análisis no se incluyen todos los casos del archivo de
datos.
- Estado de ponderación. El mensaje Ponderado indica que se está utilizando una variable
de ponderación para ponderar los casos para el análisis.
- Estado de Segmentar archivo. El mensaje Segmentar archivo activado indica que el
archivo de datos se ha segmentado en diferentes grupos para su análisis en función de
los valores de una o más variables de agrupación
La mayoría de las opciones de los menús acceden a un cuadro de diálogo cuando se
seleccionan. Los cuadros de diálogo se utilizan para seleccionar variables y opciones para
el análisis. Los cuadros de diálogo para los procedimientos estadísticos tienen
normalmente dos componentes básicos:
- Lista de variables de origen. Una lista de variables en el conjunto de datos activo. En la
lista de origen sólo aparecen los tipos de variables que el procedimiento seleccionado
permite. La utilización de variables de cadena corta y de cadena larga está restringida
en muchos procedimientos.
- Listas de variables de destino. Una o varias listas que indican las variables elegidas para
el análisis; un ejemplo son las listas de variables dependientes e independientes.
Puede mostrar tanto nombres como etiquetas de variable en las listas de los cuadros de
diálogo y puede controlar el orden en el que aparecen las variables en las listas de variables
de origen. Para controlar los atributos de presentación predeterminados de las variables en
las listas de origen, elija Opciones en el menú Editar.
También puede cambiar los atributos de visualización de la lista de variables en los cuadros
de diálogo. El método para cambiar los atributos de visualización depende del cuadro de
diálogo: Si el cuadro de diálogo proporciona controles de clasificación y visualización en la
lista de variables de origen, utilícelos para cambiar los atributos de visualización. Si el
cuadro de diálogo no contiene controles de clasificación de la lista de variables, pulse con el
botón derecho en cualquier variable de la lista de origen y seleccione los atributos de
visualización del menú emergente.
Puede mostrar los nombres o las etiquetas de variable (los nombres se muestran para
cualquier variable sin etiquetas definidas) y puede ordenar la lista de origen por orden de
archivo, orden alfabético o nivel de medición. (En cuadros de diálogo con controles de
clasificación de la lista de variables de origen, la selección predefinida de Ninguna clasifica
la lista por orden de archivos.)
Puede ajustar el tamaño de los cuadros de diálogo como si fueran ventanas, pulsando y
arrastrando los bordes o esquinas exteriores. Por ejemplo, si aumenta el ancho del cuadro
de diálogo, las listas de variables también serán más anchas.

A continuación se describen las características generales de cada menú. En particular cabe


destacar como principales los correspondientes a: Datos, Transformar, Analizar y Gráficos
Menú destinado a crear, abrir y guardar los archivos, pedir información
ARCHIVO:
de los mismos o imprimirlos.
Menú de edición habitual del entorno Windows que incluye también la
EDITAR:
configuración de las opciones generales del SPSS.
VER: Menú que permite activar diferentes opciones de visualización de la ventana.

CESARI 2018 Página 48


Anexo 1 N02

IMPORTAR datos a
herramientas

Menú que recoge un conjunto de comandos de manipulación del archivo de


DATOS: datos (definición de los datos, selección y ponderación de casos, segmentación
del archivo, agregación de datos, unión de ficheros, reestructuración, etc).
Menú de los procedimientos de transformación de los datos de un archivo y que
TRANSFORMAR: implican en general la generación de nuevas variables como resultado de su
recodificación o la realización de cálculos.
ANALIZAR: Menú de todos los procedimientos de análisis estadístico con SPSS.
GRÁFICOS: Menú para obtener representaciones gráficas de los datos.
FORMATO: Menú de utilidades de formato en la ventana de resultados.
Menú de utilidades para pedir información de les variables, definir
UTILIDADES:
conjuntos de variables, ejecutar procesos, configurar los menús, etc.
Menú de organización y de desplazamiento entre las diferentes ventanas y
VENTANA:
de división del visor de datos.
AYUDA: Menús de ayuda del SPSS comentado.

Los diferentes procedimientos o comandos del SPSS están destinados a la realización de 4


tipos principales de tareas:
1. La generación y transformación de archivos de datos: identificación de los datos,
importación y exportación de archivos, su combinación, así como comandos de
información de los mismos.
2. La transformación de los datos: para la modificación y creación de nuevas variables que
preparan los datos para el análisis.
3. El análisis estadístico de los datos: procedimientos de análisis y de representación
gráfica.
4. Un conjunto de comandos adicionales de operación para la configuración, el control y la
obtención de información del entorno de trabajo del SPSS, o para ser utilizados en la
programación con el lenguaje de comandos.
En el menú Editar se encuentra la configuración de las opciones que controlan diversas
alternativas de trabajo con el software. Con el objetivo de favorecer el aprendizaje del
funcionamiento del paquete estadístico mantendremos activadas una opción de interés.

CESARI 2018 Página 49


Anexo 1 N02

IMPORTAR datos a
herramientas

En la pestaña de Resultados, en el apartado de Etiquetado de tablas dinámicas (también


llamadas tablas pivote) activaremos las opciones Nombre y etiquetas para las variables
y Valores y etiquetas para los valores. De esta forma podremos identificar mejor las
variables y sus valores en el momento de trabajar con los datos

2. Introducción a la Edición de datos en SPSS


Para trabajar con el SPSS tenemos que empezar necesariamente por crear o abrir un
archivo de datos:
• Introduciéndolos en la ventana de datos.
• Importándolos de hojas de cálculos, bases de datos, archivos txt,...
• Abriendo un archivo previamente creado en formato SPSS.
• O incluso a partir de instrucciones en un programa de sintaxis.
El EDITOR DE DATOS proporciona un método práctico (al estilo de las hojas de cálculo)
para la creación y edición de archivos de datos. La ventana Editor de datos se abre
automáticamente cuando se inicia una sesión.
El programa cuenta con tres “vistas”, la de datos, variables y de resultados.
Estas pantallas se mantendrán abiertas siempre que se esté trabajando con el software,
aunque la primera y la segunda solo se podrán ver una a la vez, no así con la tercera, pues si
ésta no se encuentra maximizada se puede conseguir observarla todo el tiempo.
Para cambiar de pantalla entre la vista de datos y la de variables lo único que hay que hacer
es dar clic en las pestañas que corresponden a cada vista.

CESARI 2018 Página 50


Anexo 1 N02

IMPORTAR datos a
herramientas

Pestañas para cambiar de vista en el SPSS


- VISTA DE DATOS. Esta vista muestra los valores de datos reales o las etiquetas de valor
definidas. Muchas de las características de la Vista de datos son similares a las que se
encuentran en aplicaciones de hojas de cálculo. Sin embargo, existen varias diferencias
importantes:
 Las filas son casos. Cada fila representa un caso o una observación. Por ejemplo, cada
individuo que responde a un cuestionario es un caso.
 Las columnas son variables. Cada columna representa una variable o una característica que se
mide. Por ejemplo, cada elemento en un cuestionario es una variable.
 Las casillas contienen valores. Cada casilla contiene un valor único de una variable para cada
caso. La casilla se encuentra en la intersección del caso y la variable. Las casillas sólo
contienen valores de datos. A diferencia de los programas de hoja de cálculo, las casillas del
Editor de datos no pueden contener fórmulas.
 El archivo de datos es rectangular. Las dimensiones del archivo de datos vienen determinadas
por el número de casos y de variables. Se pueden introducir datos en cualquier casilla. Si
introduce datos en una casilla fuera de los límites del archivo de datos definido, el rectángulo
de datos se ampliará para incluir todas las filas y columnas situadas entre esa casilla y los
límites del archivo. No hay casillas “vacías” en los límites del archivo de datos. Para variables
numéricas, las casillas vacías se convierten en el valor perdido del sistema. Para variables de
cadena, un espacio en blanco se considera un valor válido.

CESARI 2018 Página 51


Anexo 1 N02

IMPORTAR datos a
herramientas

Vista de datos del SPSS


Como cualquier programa, el SPSS guarda sus archivos con extensiones específicas. En el
caso de las vistas de datos y variables los documentos se guardan con la extensión
(.sav), mientras que en el visor de resultados se almacena como (.spv).
Los archivos de datos pueden tener formatos muy diversos, y este programa se ha sido
diseñado para trabajar con muchos de ellos, incluyendo:
o Hojas de cálculo Excel
o Tablas de base de datos de muchos orígenes de base de datos, incluidas Oracle,
SQLServer, DB2 y otras
o Delimitado por tabuladores, CSV, y otros tipos de archivos de texto simples
o Archivos de datos de SAS
o Archivos de datos de Stata
Además de los archivos guardados en formato IBM SPSS Statistics, puede abrir archivos
de Excel, SAS, Stata, archivos delimitados por tabuladores y otros archivos sin necesidad
de convertirlos a un formato intermedio ni de introducir información sobre la definición
de los datos.
Abre un archivo de datos y lo convierte en el conjunto de datos activo. Si ya ha abierto
uno o más archivos de datos, permanecerán abiertos y disponibles para su uso posterior
durante la sesión. Al pulsar en cualquier punto de la ventana Editor de datos de un
archivo de datos abierto lo convertirá en el conjunto de datos activo.
En el análisis en modo distribuido donde un servidor remoto procesa los comandos y
ejecuta los procedimientos, las unidades, carpetas y archivos de datos disponibles
dependen de lo que esté disponible en el servidor remoto. En la parte superior del
cuadro de diálogo se indica el nombre del servidor actual. Sólo tendrá acceso a los
archivos de datos del equipo local si especifica la unidad como un dispositivo
compartido y las carpetas que contienen los archivos de datos como carpetas
compartidas.

CESARI 2018 Página 52


Anexo 1 N02

IMPORTAR datos a
herramientas

Tipos de archivos de datos


SPSS Statistics. Abre archivos de datos que se guardan en el formato de IBM SPSS Statistics y
también el producto SPSS/PC+ para DOS.
SPSS Statistics comprimido. Abre archivos de datos que se guardan en el formato comprimido
de IBM SPSS Statistics.
SPSS/PC+. Abre archivos de datos de SPSS/PC+. Esta opción sólo está disponible en los
sistemas operativos Windows.
Portátil. Abre archivos de datos que se guardan en formato portátil. El almacenamiento de
archivos en este formato lleva mucho más tiempo que guardarlos en formato IBM SPSS
Statistics.
Excel. Abre archivos de Excel.
Lotus 1-2-3. Abre archivos de datos que se guarda en formato 1-2-3 para el release 3.0, 2.0, o
1A de Lotus.
SYLK. Abre archivos de datos que se guardan en formato SYLK (enlace simbólico), un formato
que utilizan algunas aplicaciones de hoja de cálculo.
dBASE. Abre archivos con formato dBASE para dBASE IV, dBASE III o III PLUS, o dBASE II.
Cada caso es un registro. Las etiquetas de valor y de variable y las especificaciones de valores
perdidos se pierden si se guarda un archivo en este formato.
SAS. Versiones 6-9 de SAS y archivos de transporte SAS.
Stata. Stata versiones 4–13.

- VISTA DE VARIABLES. Esta segunda pantalla es la que permite ver y editar las
propiedades de cada una de las variables con las que se trabajará en la vista de datos.
Esta vista muestra la información de definición de las variables, que incluye las etiquetas
de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha o numérico),
nivel de medición (nominal, ordinal o de escala) y los valores perdidos del usuario. La
Vista de variables contiene descripciones de los atributos de cada variable del archivo de
datos. En la Vista de variables:
 Las filas son variables.
 Las columnas son atributos de las variables.
Se pueden añadir o eliminar variables, y modificar los atributos de las variables,
incluidos los siguientes:
o Nombre de variable
o Tipo de dato
o Número de dígitos o caracteres
o Número de decimales
o Las etiquetas descriptivas de variable y de valor
o Valores perdidos del usuario
o Ancho de columna
o Nivel de medición
Todos estos atributos se guardan al guardar el archivo de datos.
Además de la definición de propiedades de variables en la Vista de variables, hay dos
otros métodos para definir las propiedades de variables:
 El Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un archivo
de datos IBM SPSS Statistics externo u otro conjunto de datos que esté disponible en la sesión
actual como plantilla para definir las propiedades del archivo y las variables del conjunto de
datos activo. También puede utilizar variables del conjunto de datos activo como plantillas
para otras variables del conjunto de datos activo. La opción Copiar propiedades de datos está
disponible en el menú Datos en la ventana Editor de datos.

CESARI 2018 Página 53


Anexo 1 N02

IMPORTAR datos a
herramientas

 La opción Definir propiedades de variables (también disponible en el menú Datos de la


ventana Editor de datos) explora los datos y muestra una lista con todos los valores de datos
exclusivos para las variables seleccionadas, indica los valores sin etiquetas y ofrece una
característica de etiquetas automáticas. Este método es especialmente útil para las variables
categóricas que utilizan códigos numéricos para representar las categorías (por ejemplo, 0
= hombre, 1 = mujer.

Vista de variables
Para seleccionar una única variable, simplemente selecciónela en la lista de variables
de origen y arrástrela y colóquela en la lista de variables de destino. También puede
utilizar el botón de dirección para mover las variables de la lista de origen a las listas de
destino. Si sólo existe una lista de variables de destino, puede pulsar dos veces en las
variables individuales para desplazarlas desde la lista de origen hasta la de destino.
También pueden seleccionar diversas variables:
- Para seleccionar varias variables que estén agrupadas en la lista de variables, pulse
en la primera de ellas y, a continuación, en la última del grupo mientras mantiene
pulsada la tecla Mayús.
- Para seleccionar varias variables que no estén agrupadas en la lista de variables,
pulse en la primera de ellas; a continuación, pulse en la siguiente variable mientras
mantiene pulsada la tecla Ctrl, y así sucesivamente (en Macintosh, pulse mientras
mantiene pulsada la tecla Comando).
CESARI 2018 Página 54
Anexo 1 N02

IMPORTAR datos a
herramientas

Nombres de variable. En esta primer columna de la vista de variables se deberá poner


el nombre con el que se le conocerá a cada variable de la matriz de datos, por lo general
se usan nombres cortos que identifiquen a las variables o ítems. Al nombrarlas se debe
de cuidar no iniciar con números, pues el programa no lo permite y emite un cuadro de
diálogo en el que menciona que “el primer carácter del nombre de la variable no es
válido”. Por otro lado, hay que tomar en cuenta que no se deben dejar espacios entre
caracteres y si éstos se requieren se recomienda utilizar guiones.
Para nombrar la variable no hay que hacer más que posicionarse en la celda
correspondiente de la primer columna y escribir el nombre con el que se identificará la
variable. Cabe señalar que es precisamente éste el que se verá en la parte superior de la
columna en la vista o matriz de datos.

Vista de variables, primer columna – nombre


En caso de que no se introdujera el nombre de la variable, éste se crearía
automáticamente como “var” y el número de variable. Sin embargo, estos nombres no
son descriptivos y mucho menos recomendables para archivos de datos grandes.
Para los nombres de variable se aplican las siguientes normas:
- Cada nombre de variable debe ser exclusivo; no se permiten duplicados.
- Los nombres de variable pueden tener una longitud de hasta 64 bytes y el primer carácter
debe ser una letra o uno de estos caracteres: @, # o $. Los caracteres posteriores puede ser
cualquier combinación de letras, números, caracteres que no sean signos de puntuación y
un punto (.). En el modo de página de código, sesenta y cuatro bytes suelen equivaler a 64
caracteres en idiomas de un solo byte (por ejemplo, inglés, francés, alemán, español,
italiano, hebreo, ruso, griego, árabe y tailandés) y 32 caracteres en los idiomas de dos bytes
(por ejemplo, japonés, chino y coreano). Muchos caracteres de una cadena ocuparán un solo
byte en el modo de página de código y dos o más bytes en el modo Unicode. Por ejemplo, é
ocupa un byte en el formato de página de código pero dos bytes en el formato Unicode; por
lo que résumé ocupa seis bytes en un archivo de página de código y ocho bytes en modo
Unicode.
Nota: las letras incluyen todos los caracteres que no son signos de puntuación y se utilizan
al escribir palabras normales en los idiomas admitidos en el juego de caracteres de la
plataforma.
- Las variables no pueden contener espacios.
- Un carácter # en la primera posición de un nombre de variable define una variable
transitorio. Sólo puede crear variables transitorios mediante la sintaxis de comandos. No
puede especificar un # como primer carácter de una variable en los cuadros de diálogo que
permiten crear nuevas variables.

CESARI 2018 Página 55


Anexo 1 N02

IMPORTAR datos a
herramientas

- Un signo $ en la primera posición indica que la variable es una variable del sistema. El signo
$ no se admite como carácter inicial de una variable definida por el usuario.
- El punto, el subrayado y los caracteres $, # y @ se pueden utilizar dentro de los nombres de
variable. Por ejemplo, A._$@#1 es un nombre de variable válido.
- Se deben evitar los nombres de variable que terminan con un punto, ya que el punto puede
interpretarse como un terminador del comando. Sólo puede crear variables que finalicen
con un punto en la sintaxis de comandos. No puede crear variables que terminen con un
punto en los cuadros de diálogo que permiten crear nuevas variables.
- Se deben evitar los nombres de variable que terminan con un carácter de subrayado, ya que
tales nombres puede entrar en conflicto con los nombres de variable creados
automáticamente por comandos y procedimientos.
- Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras
reservadas son ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO y WITH.
- Los nombres de variable se pueden definir combinando de cualquier manera caracteres en
mayúsculas y en minúsculas, esta distinción entre mayúsculas y minúsculas se conserva en
lo que se refiere a la presentación.
- Cuando es necesario dividir los nombres largos de variable en varias líneas en los
resultados, las líneas se dividen aprovechando los subrayados, los puntos y cuando el
contenido cambia de minúsculas a mayúsculas.
Tipo. En la segunda columna de la misma pantalla de
variables, se deberá definir a qué tipo de ítem o variable
corresponde. De manera predeterminada aparecerá
“Numérico”, sin embargo esto se puede modificar al dar
clic en el cuadro gris con tres puntos suspensivos que
aparece a la derecha de la celda al cambiar. Al presionar
los puntos suspensivos aparecerá un cuadro de diálogo,
que permite definir el tipo de información que se estará
capturando y utilizando.
Opción para cambiar el tipo de datos a analizar en la
variable

Cuadro de diálogo para modificar el tipo de variable que se desea incluir

CESARI 2018 Página 56


Anexo 1 N02

IMPORTAR datos a
herramientas

Los tipos de variables más utilizados son el numérico y el de cadena. El primero


generalmente se usa cuando las opciones de respuesta son números, por ejemplo edad
en años, pero también se usa cuando son necesarios códigos numéricos que
representan algo más, este sería el caso de que arbitrariamente eligiéramos el número
“1” para identificar a las mujeres y el “2” para los hombres. El tipo de variable cadena se
utiliza cuando la respuesta se capturará directamente en texto y no mediante códigos,
por ejemplo, la colonia en que vive el respondiente, siempre y cuando ésta no se haya
precodificado.
Asimismo, el cuadro de diálogo permite hacer modificaciones a la anchura dada a la
variable o ítem en número de caracteres. Cabe señalar que si se trata de una variable de
cadena se sugiere ampliar esta opción para tener la posibilidad de incluir por completo
la respuesta recogida mediante el instrumento de medición. Otro aspecto que se puede
cambiar en la misma caja de diálogo son los decimales que deberá considerar el
programa en las respuestas que se capturarán más adelante. Sin embargo, solamente se
consideran decimales si aplican a la variable (por ejemplo: estatura –en metros y
centímetros, 1.70, 1.78, 1.85, etc.–, ingreso –en pesos y centavos–). De lo contrario (si no
se requieren decimales), se recomienda dejar en cero, esto es, si la respuesta será un
código (“1”, “2”, “3”, etc.).
De forma predeterminada, se asume que todas las variables nuevas son numéricas. Se
puede utilizar Tipo de variable para cambiar el tipo de datos. El contenido del cuadro de
diálogo Tipo de variable depende del tipo de datos seleccionado. Para algunos tipos de
datos, hay cuadros de texto para la anchura y el número de decimales; para otros tipos
de datos, simplemente puede seleccionar un formato de una lista desplegable de
ejemplos.
Anchura. Esta columna tiene la misma función que la opción anchura que se encuentra
dentro del cuadro del diálogo en el que se selecciona el tipo de variable. Como ya se
mencionó, de manera predeterminada el programa establece el tipo de información
como numérica y, en muchas ocasiones no es necesario cambiarla, es por eso que en la
columna anchura de la vista de datos se puede también indicar el número máximo de
caracteres que permitirá el programa, el cual se encuentra predefinido en 8. En este
caso, el SPSS aceptaría números como 00000001 (8 caracteres) o el nombre de una
colonia como “La Cruz” (7 caracteres contando el
espacio).
En caso de requerir una anchura diferente, ésta se
puede modificar posicionándose a la derecha en la
celda correspondiente, en donde aparecerán un
par de flechas (una hacia arriba y la otra hacia
abajo), las cuales permiten aumentar o disminuir
el número de caracteres. De igual forma se puede
escribir directamente sobre la celda y definir esta
información.

Columna Anchura de la vista de variables

CESARI 2018 Página 57


Anexo 1 N02

IMPORTAR datos a
herramientas

Decimales. Igual que en la columna anterior, ésta tiene la misma función que la opción
decimales de la caja de diálogo en donde se selecciona el tipo de variable, pero por la
misma razón que se explicó en el anterior atributo (anchura), se ofrece la opción de
modificar esta información directamente sobre la vista de variables. De manera
predefinida, el programa considera dos decimales, sin embargo esto se puede modificar
de la misma forma que la opción de anchura.
Etiqueta. Tal como lo menciona el tutorial del SPSS, además de precisar los tipos de
datos, el programa brinda la posibilidad de definir etiquetas para las variables, las cuales
se emplean y visualizan en los gráficos e informes estadísticos (IBM SPSS Statistics,
2014). El rótulo puede ser una definición de lo que la variable representa (Cuevas,
2014).
Para escribir o nombrar la etiqueta de la variable, únicamente hay que posicionarse
sobre la celda correspondiente y escribir el título o rótulo que se requiera para dicha
variable, por ejemplo: “Edad” o “Por favor, ¿me podría indicar su edad?”, Es muy
importante cuidar que al teclear la etiqueta no se cometan errores ortográficos o
“dedazos”, pues aunque como veremos más adelante, se puede realizar ediciones a las
etiquetas, esto nos tomaría algún tiempo, mismo que se podría evitar.

Columna Etiqueta de la vista de variables


Valores. La siguiente columna de la vista de variables corresponde al atributo de la
variable conocido como valores o también como etiquetas de valor. Este espacio
proporciona el método que hace posible que ciertos valores definidos por quien vaya a
realizar el análisis, se relacionen con una etiqueta de texto. En otras palabras, aquí se
introducen los valores que se asignarán a las categorías del ítem o variable considerada
(codificación).
Para llevar a cabo esta acción se deberá dar clic en los tres puntos suspensivos que
aparecen a la derecha de la celda correspondiente y en donde se editarán los valores [1].
Al realizar esto, automáticamente se abrirá un cuadro de diálogo en el cual se definirán
los valores que corresponderán a cada categoría. Para hacerlo se tendrá que establecer
un número en la caja correspondiente a Valor [2], que tendrá el significado que el
investigador defina y que se deberá establecer en el espacio correspondiente a Etiqueta
[3]. Posteriormente, se tendrá que dar clic en el botón Añadir [4]. Con esta acción, el
valor y su significado pasarán a una nueva caja, la cual agrupará cada valor establecido y
su correspondiente significado [5].

CESARI 2018 Página 58


Anexo 1 N02

IMPORTAR datos a
herramientas

Estos pasos se deberán repetir tantas veces como posibles categorías u opciones de
valor y significado tenga la pregunta, ítem o variable. Finalmente, después de haber
definido todos los valores de las categorías se deberá dar clic en el botón Aceptar6 para
que el programa guarde la información vertida, en caso de no realizar este paso el SPSS
no respetará los cambios realizados en el cuadro de etiquetas de valor.

Edición de las etiquetas de valor


En el ejemplo se puede ver que los valores significan un rango de edad preestablecido, el
cual comúnmente se define desde antes de aplicar el instrumento de recolección
utilizado.
Igual que con las etiquetas que llevarán las variables, es muy importante cuidar no
cometer errores ortográficos o “dedazos” en las etiquetas de valor, ya que de suceder
esto las tablas y gráficos de resultados tendrán los mismos errores. Para intentar evitar
esto al máximo, desde la versión 17 del SPSS se incluyó dentro de la caja de diálogo de
etiquetas de valor, una opción que permite revisar ortográficamente los nombres que
otorguemos a cada opción de respuesta [1].

Revisión de la ortografía en las etiquetas de valor

CESARI 2018 Página 59


Anexo 1 N02

IMPORTAR datos a
herramientas

Perdidos (valores). Los datos numéricos erróneos, campos de datos vacíos o campos
con entradas no válidas son convertidos por el programa a lo que se denomina: valores
perdidos por el sistema y se identifican en las celdas de la Vista de datos como puntos.
Para identificar el motivo por el cual se perdió ese dato, el programa incluye la opción
“perdidos”, la cual ayuda a diferenciar en el análisis de los datos la razón específica (por
ejemplo, separa a los que se perdieron porque los respondientes se negaron a contestar
la pregunta de aquellos que no la contestaron porque no les aplicaba).
Para definir los datos que el sistema no deberá considerar para los análisis, se tendrá
que dar clic en la celda correspondiente a la columna “Perdidos”, [1] en donde aparecerá
de nuevo una caja gris con puntos suspensivos a su derecha [2], que habrá que pulsar
para abrir la caja de diálogo Valores perdidos [3]. En ésta se definen aquellos valores
que el programa deberá identificar como no válidos y excluirlos de los análisis. Existen
dos opciones: la primera consiste en seleccionar valores perdidos discretos, [4] para lo
cual la caja ofrece hasta tres posibilidades (muestra tres espacios),* y la segunda estriba
en estipular un rango de valores perdidos [5] (del menor al mayor 6) más un valor
perdido discreto adicional [6]. Con la finalidad de guardar los cambios realizados en el
cuadro de diálogo no se debe olvidar pulsar “Aceptar” antes de cerrarlo mismo [7].
Supongamos que nosotros queremos identificar cuando en la P_1 (Edad) las personas
encuestadas no contestaron, para ello seguiríamos los pasos anteriormente descritos y
seleccionaríamos la opción Valores perdidos discretos [4], posteriormente, en alguna de
las cajas que se encuentran debajo de esta opción [*] pondríamos el código numérico
que tendría para nosotros este significado, por ejemplo 99. Posteriormente pulsamos el
botón Aceptar.

Después de añadir dicho valor de datos perdidos, podríamos aplicar una etiqueta a este
valor. Seleccionamos la casilla Valores [1] de la fila correspondiente a la P_1, acto
seguido daríamos clic a la caja gris con puntos suspensivos [2] que aparece a la derecha
de la casilla para abrir el cuadro de diálogo Etiquetas de valor. Ya en el cuadro
escribiríamos 99 en el campo de Valor [3] y No contestó en el espacio para Etiqueta [4].
No debemos olvidar pulsar Añadir [5] para incorporar esta etiqueta a la base de datos y
finalmente dar clic en Aceptar [6] para guardar los cambios.

CESARI 2018 Página 60


Anexo 1 N02

IMPORTAR datos a
herramientas

Etiquetas para los valores perdidos


Columnas. El atributo que sigue es el que se refiere a las Columnas, en esta opción se
define el ancho que tendrá la columna correspondiente a esa pregunta o ítem en la
matriz o vista de los datos. El valor predeterminado para este atributo es ocho, sin
embargo, éste se puede modificar de la misma manera que los atributos Anchura o
Decimales.
Alineación. Esta propiedad se refiere a la alineación que mantendrá el contenido o
valores en las celdas de la matriz o vista de los datos. De manera predefinida, los
números se alinean a la derecha y el texto a la izquierda, lo cual se puede modificar
pulsando la casilla de Alineación y seleccionando entre la opción izquierda, derecha o
centrado.
Medida. Este atributo se edita al introducir las variables o ítems que serán objeto de
análisis con ayuda del programa. Puede especificar el nivel de medición como Escala
(datos numéricos de una escala de intervalo o de razón), Ordinal o Nominal. Los datos
nominales y ordinales pueden ser de cadena (alfanuméricos) o numéricos.
 Nominal. Una variable puede ser tratada como nominal cuando sus valores representan a un
concepto y únicamente indican diferencia entre categorías que no obedecen a una
clasificación intrínseca. Por ejemplo, el departamento de la compañía en el que trabaja un
empleado. Algunos ejemplos de variables nominales son: región, código postal o confesión
religiosa, carrera que estudia, colonia donde vive, nacionalidad, etcétera.
 Ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan
conceptos que además de indicar diferencia, revelan un orden o jerarquía de categorías con
alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con un servicio, que
abarquen desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos de variables
ordinales se incluyen escalas de actitud que representan el grado de satisfacción o confianza
y las puntuaciones de evaluación de las preferencias.
 Escalas. Una variable puede tratarse como escala (continua) cuando sus valores representan
categorías ordenadas con una métrica con significado, por lo que son adecuadas las
comparaciones de distancia entre valores. Se utiliza para variables de intervalos o razón
(cuyas categorías son codificadas con un número o valor aritmético. Son ejemplos de
variables de escala: la edad en años, minutos de traslado de un lugar a otro, ingreso
mensual, veces que acude al cine al mes, escalas para calificar un objeto de actitud –1 al 10 o
Likert asumida por intervalos.
CESARI 2018 Página 61
Anexo 1 N02

IMPORTAR datos a
herramientas

Para modificar el tipo de medida lo único que hay que hacer es pulsar la casilla que
corresponde a la Medida y seleccionar el tipo más adecuado a la variable
Nota: Para variables de cadena ordinales, se asume que el orden alfabético de los valores de
cadena indica el orden correcto de las categorías. Por ejemplo, en una variable de cadena
cuyos valores sean bajo, medio, alto, se interpreta el orden de las categorías como alto, bajo,
medio (orden que no es el correcto). Por norma general, se puede indicar que es más fiable
utilizar códigos numéricos para representar datos ordinales.

Reglas para determinar el nivel de medición


Los iconos que se muestran junto a las variables en las listas de los cuadros de diálogo
proporcionan información acerca del tipo de variable y el nivel de medición.

Iconos de tipo de datos, nivel de medición y lista de variables


La mayoría de los cuadros de diálogo permiten conocer mejor las variables que se
muestran en la lista de variables.
Rol. Esta opción es relativamente nueva pues SPSS la incorporó a partir de su
adquisición por parte de IBM. El tutorial (IBM SPSS Statistics, 2014) la define como “la
pestaña Campos” y explica que especifica los campos que se deben comprobar y el
campo que se usará para definir grupos. Sus opciones o papeles según el mismo tutorial
son:
- Entrada: Se trata de la variable que se usará como entrada por ejemplo predictor o
variable independiente.
- Destino: Es la variable que servirá como salida u objetivo, por ejemplo la variable
dependiente.
- Ambos: Tendrá las dos funciones explicadas con anterioridad.
- Ninguno: No tiene ninguna función asignada.
- Partición: “La variable se utilizará para dividir los datos en muestras diferentes para
entrenamiento, prueba y validación.”
- Segmentar o dividir: Esta opción busca ser un elemento de compatibilidad con IBM SPSS
Modeler y no sirve como las anteriores como variable segmentación.

CESARI 2018 Página 62


Anexo 1 N02

IMPORTAR datos a
herramientas

En ambas vistas, se puede añadir, modificar y eliminar la información contenida en el


archivo de datos.
- Vista de resultados. SPSS tiene una tercera vista, denominada de resultados. En ésta se
pueden visualizar los productos de los análisis realizados con la ayuda del programa,
además de otra información relevante. La vista de resultados cuenta con un explorador
que permite dirigirse rápidamente a cualquier elemento de la misma. El explorador
trabaja de forma similar al de Windows, pues permite abrir directorios y subdirectorios
así como la fácil navegación entre resultados contrayendo, desplegando, borrando o
cambiando de lugar los titulares.
Supongamos que le interesa revisar los gráficos de barras producto de los análisis que
solicitó al programa. Para hacerlo, simplemente tendría que pulsar el ícono con el
nombre Gráfico de barras [1] y se desplegarían todos los gráficos permitiéndole
seleccionar y visualizar el o los que sean de su interés. Los resultados se muestran a la
derecha del explorador, en este caso se graficó la variable “Bienestar de los empleados”.

Explorador de resultados

Vista de resultados

CESARI 2018 Página 63


Anexo 1 N02

IMPORTAR datos a
herramientas

Ventana del visor de resultados del SPSS

Los resultados de texto , las tablas y los gráficos que aparecen en la ventana
de resultados se pueden editar (o abrir en una ventana propia) de forma independiente
si hacemos doble-clic sobre cada objeto (o a través del menú contextual).

CESARI 2018 Página 64


Anexo 1 N02

IMPORTAR datos a
herramientas

Si queremos guardar un archivo de resultados, desde la ventana del visor de resultados


optamos por:
• A través del menú: Archivo / Guardar, o bien Archivo / Guardar como
• Con el teclado: <Ctrl>+<S>
• Clicando sobre el botón Guardar este documento
Otra herramienta bastante práctica que tiene la Vista de datos es que permite llevar un
control de los análisis realizados o de las instrucciones que se le dieron al programa.
Por ejemplo se muestran los análisis solicitados y se enlistan las variables que se
revisaron.
La herramienta nos permite tener siempre en mente cuáles han sido los análisis que se
han llevado a cabo e incluso el orden en que se requirieron.

Vista de resultados: instrucciones de los análisis realizados


- Vista de sintaxis. La programación con SPSS
Con el software SPSS existen dos formas posibles de
trabajo:
1) Interactivamente. La ejecución de las instrucciones se realiza una a una, viendo los
resultados de cada acción. Así podemos hacerlo a través de:
•El sistema de menús donde la instrucción se elabora a través de los cuadros de diálogos y
cuya ejecución se produce cuando clicamos Aceptar, como se hizo anteriormente. Esta
es la manera de trabajar habitualmente en una etapa inicial de formación y cuando no
se domina el lenguaje de comandos.
•La ventana del editor de sintaxis, donde se escriben las instrucciones en el lenguaje
de comandos del SPSS, a continuación se selecciona la instrucción y se ejecuta a través
del botón de ejecución . Es necesario por tanto conocer dicho lenguaje, pero sin
conocerlo las instrucciones se pueden obtener automáticamente si clicamos sobre el
botón Pegar desde los cuadros de diálogo de cada procedimiento de los menús.
2) Procesando por lotes o en modo batch. La ejecución de las instrucciones se realiza
con ayuda del editor de sintaxis y donde se elaboran programas de instrucciones
que se ejecutan conjuntamente. Una modalidad alternativa de esta forma de
ejecución es la denominada unidad de producción (Production mode) donde las
instrucciones se almacenan en un archivo de extensión .SPP y se ejecutan en bloque
sin necesidad de abrir la aplicación del SPSS
En un inicio, cuando se empieza a utilizar y aprender el uso del software, o en el caso de
una utilización no experta, se puede sugerir que la opción más conveniente es emplear la
modalidad de ejecución de instrucciones a través de los menús, ya que el aprendizaje inicial
es mucho más fácil y rápido.
A medida que se conoce y se domina el software se constata que de hecho la mejor opción
es la utilización diversificada de las diferentes modalidades de trabajo.

CESARI 2018 Página 65


Anexo 1 N02

IMPORTAR datos a
herramientas

En ciertos momentos la utilización de los menús sigue siendo efectiva y la opción óptima,
pero hay muchas situaciones y necesidades que no se pueden lograr de esta forma; la
experiencia sugiere estrategias de trabajo mixtas que se adapten a las preferencias de cada
usuario/a y los requerimientos de cada tarea a realizar, pero se constata a la larga que el
uso avanzado del software implica trabajar con el lenguaje de comandos.
¿Por qué este interés por la programación? Un usuario avanzado o profesional del software
precisará del uso de la sintaxis por varias razones, entre ellas cabe destacar:
- Algunos comandos sólo están disponibles a través del uso del lenguaje de
comandos.
- Ciertas opciones de algunos comandos, los cuales se pueden ejecutar por menús, no se
pueden ejecutar si no es a través de la sintaxis.
- En algunas ocasiones la programación es más fácil y rápida que la utilización de los
menús, como es el caso de la ejecución de comandos relacionados con la transformación
de los datos.
- El lenguaje de comandos permite guardar las instrucciones en un archivo de sintaxis
que puede ser reutilizado o revisado con el objetivo de recordar, comprobar o repetir
las tareas realizadas. Favorece por tanto la replicación y el control del trabajo
Suponemos que estuvimos calculando la frecuencia de nuestras variables y accedimos al
cuadro de diálogo de la manera tradicional. Para volver al cuadro de diálogo de Frecuencias
se puede ir por el camino anterior: Analizar / Estadísticos descriptivos / Frecuencias, o bien
a través de una “atajo” si clicamos sobre el botón de Recuperar los cuadros de diálogo
recientes y eligiendo Frecuencias. Con la misma variable anterior o con otra de nuestra
elección procedemos a ejecutar el procedimiento, pero esta vez en lugar de clicar sobre
Aceptar lo haremos sobre Pegar. Se abrirá inmediatamente una ventana de sintaxis con las
instrucciones del procedimiento de frecuencias en lenguaje de comandos.

Ventana de sintaxis del SPSS

Se han incluido en el editor de sintaxis dos comandos: DATASET ACTIVATE, que hace que
el conjunto de datos nombrado se convierta en el fichero activo para trabajar (el nombre
asignado es automático: Conjunto_de_datos 2), y FREQUENCIES, que extrae la tabla de
frecuencias y el gráfico.

CESARI 2018 Página 66


Anexo 1 N02

IMPORTAR datos a
herramientas

Para ejecutar instrucciones se seleccionan y se clica sobre el botón de ejecución . No es


necesario seleccionar la instrucción completa, con enlazar el final de una con el inicio de la
otra es suficiente. En el caso de la ejecución de un solo comando incluso no es necesaria la
selección, basta con tener el cursor en cualquier posición entre el primer carácter y el
último de la instrucción, el punto.

3. Manejo de datos en la matriz: Vista de los datos


El SPSS ofrece la oportunidad de vaciar los datos obtenidos en la etapa de recolección
mediante tres maneras: directo en SPSS, copiando la(s) base(s) de dato(s) de Excel o
importando las hojas completas del mismo programa de Microsof
Captura de los datos directamente del SPSS
Para capturar directamente los datos que se consiguieron en la etapa de recolección,
simplemente habrá que ir llenando las casillas con los códigos que se asignaron a las
opciones de respuesta, en cada variable o ítem y por cada caso.
Aunque el SPSS permite utilizar texto, lo más recomendable es utilizar códigos numéricos
que permitan aprovechar al máximo las ventajas del programa, incluso en las preguntas
con nivel de medición nominal.

Base de datos del SPSS llena

CESARI 2018 Página 67


Anexo 1 N02

IMPORTAR datos a
herramientas

Copiar desde una hoja de datos de Excel


Una opción bastante útil, sobre todo cuando varias personas participan en la investigación
como encuestadores – codificadores y no se cuenta más que con una licencia del SPSS. Cada
uno de ellos vacía los datos codificados en una matriz elaborada en el programa Excel.
Dicha matriz deberá ser idéntica a la generada en el SPSS y seguir la misma lógica de la
vista de datos de este programa (las columnas son las variables o ítems del instrumento de
recolección y las filas los casos u observaciones conseguidas).

Matriz de datos en Excel


Para llevar los datos vaciados en la matriz de Excel al SPSS, se deberán seleccionar las
celdas que nos interesan de la matriz de Excel [1] ordenando al programa copiar las
mismas [2].

Después de copiar las celdas desde Excel, habrá que pegarlas en la Vista de datos del SPSS
cuidando que al hacerlo las casillas copiadas correspondan a las celdas donde se están
pegando (recordemos que la matriz de Excel debe ser idéntica a la matriz del SPSS). Para
esto se sugiere posicionarse en la primera celda del primer caso [1] y ahí dar la instrucción
de pegar [2].

CESARI 2018 Página 68


Anexo 1 N02

IMPORTAR datos a
herramientas

Matriz de datos en SPSS

Importar datos desde Excel


Si bien con la anterior opción se podían copiar los datos numéricos desde una matriz en
Excel y posteriormente pegarlos en la equivalente de SPSS, existe también la oportunidad
de importar los registros con todo y los nombres de las variables. Para llevar a cabo esto, se
deberá de abrir el SPSS en la Vista de datos, pulsar la opción Archivo [1] que se encuentra
en la barra superior de la pantalla a mano izquierda de donde se abrirá un menú, dentro de
éste se deberá seleccionar Abrir [2] y dar clic en Datos [3].

Importar los datos desde una matriz de Excel [1]

Al hacer esto se abrirá un cuadro de diálogo con el título Abrir datos, entonces debemos
seleccionar la carpeta en donde se encuentra la matriz, no sin antes cambiar en la opción
Archivos de tipo a Excel (*.xls, *.xlsx, *.xlsm) 1, seleccionar la base de datos2 y pulsar
Abrir3

CESARI 2018 Página 69


Anexo 1 N02

IMPORTAR datos a
herramientas

Importar los datos desde una matriz de Excel [2]

Después de esto se abrirá una nueva caja de diálogo con el título Apertura de origen de
datos de Excel, debemos asegurarnos que esté “palomeada” la opción Leer nombre de
variables de la primera fila de datos1 y pulsar Aceptar2 (Figura 26), con esto se abrirá la
matriz de datos en el SPSS incluyendo los títulos de las variables (Figura 27). No se debe
olvidar que después de esto se tendrán que editar las propiedades de las variables en la
Vista de variables.

Importar los datos desde una matriz de Excel [3]

Copiar y exportar los resultados de SPSS


Todos los objetos de resultados se pueden exportar o copiar a otras aplicaciones como
procesadores de texto (MS-Word, OpenOffice Writer) o como hojas de cálculo (MS_Excel,
OpenOffice Calc). También se pueden exportar en formato HTML para incrustarlas en
páginas web, o PDF para el intercambio de documentos.

CESARI 2018 Página 70


Anexo 1 N02

IMPORTAR datos a
herramientas

Para copiar una tabla, un texto o un


gráfico simplemente accionamos la
opción copiar y pegamos en la
aplicación de destino. Sobre el mismo
elemento podemos abrir el menú
contextual con el botón derecho del
ratón y elegir Copiar o bien precisar
la opción de copiado con Copiar
especial. En este último caso podemos
decidir y configurar si se copia como
texto simple, enriquecido, imagen,
metaarchivo o formato de Excel:
Al clicar sobre Guardar como predeterminado se mantendrá por defecto la configuración
de tipos de copiado.
La opción de copiar como Imagen (JPG, PNG) es aconsejable cuando queremos mantener el
aspecto con el que aparece en SPSS y facilita ajustar su tamaño en la aplicación de destino.
Si la copiamos como Texto enriquecido (RTF) se puede adjuntar como una tabla del editor
de textos. Si la queremos editar desde Excel optaremos por Hoja de trabajo de Excel (BIFF).
También disponemos de la opción “Exportar” (a través del menú contextual, del menú
Archivo / Exportar o con el botón que nos permite guardar los textos, las tablas y los
gráficos conjuntamente en un archivo con diversidad de formatos: Word, Excel, HTML,
Power-Point, TXT,...

Cuadro de diálogo de exportación de resultados de SPSS

CESARI 2018 Página 71


Anexo 1 N02

IMPORTAR datos a
herramientas

Abrir una matriz de datos en SPSS creada previamente


Desde el editor de datos abriremos dos de las matrices de datos que utilizamos en este
manual: IDH2014.sav y CIS3041.sav11
Para abrir una matriz de datos en SPSS creada previamente:
• A través del menú: Archivo / Abrir / Datos
• Clicando sobre el botón desde la ventana del editor de datos.
Si abrimos la primera de las matrices accedemos a un cuadro como el siguiente donde, en
particular, hemos seleccionado la matriz IDH2014.sav:

Este archivo en la ventana del editor de datos se considera el conjunto de datos activo

Ventana del editor de datos del SPSS. Archivo IDH2014.sav


El formato más habitual de matriz de datos es aquél donde cada línea, llamada registro
(record), constituye un caso (individuo o unidad) sobre el que se expresan los valores
codificados correspondientes a las variables consideradas a las columnas.

11 López-Roldán, P.; Fachelli, S. (2015). Software para el análisis de datos: SPSS, R y SPAD. En P. López-Roldán y
S. Fachelli, Metodología de la Investigación Social Cuantitativa. Bellaterra (Cerdanyola del Vallès): Dipòsit
Digital de Documents, Universitat Autònoma de Barcelona. Capítulo III.1. 1ª edición. Edición digital:
http://ddd.uab.cat/record/129380
CESARI 2018 Página 72
Anexo 1 N02

IMPORTAR datos a
herramientas

En este caso cada fila representa un país y cada columna un atributo o propiedad que
caracteriza a cada uno de ellos. Los datos provienen de Naciones Unidas y corresponden a
los indicadores que se utilizan para construir el Índice de Desarrollo Humano (IDH)
correspondiente al año 201412.
Podemos comprobar que disponemos de información para 195 países en relación a 114
variables. La primera variable corresponde a la posición de cada país en el ranking que
establece el índice y la segunda es el identificador del país. Las 112 variables restantes son
los indicadores que considera el United Nations Development Programme para construir el
indicador sintético IDH, todas ellas son variables medidas en una escala numérica o
cuantitativa (de escala en terminología del SPSS).
La segunda matriz de datos, CIS3041.sav, corresponde a los datos del Barómetro del Centro
de Investigaciones Sociológicas de octubre de 2014 (estudio número 3041) 13.
Se trata de una muestra estadística de 2480 individuos que contestaron la encuesta del
barómetro en relación a diversas cuestiones de la actualidad política, entre otras, y que dan
lugar a un total de 210 variables. En esta matriz cada fila es un individuo anónimo que se
identifica con un número correspondiente al código numérico asignado a su cuestionario.
En este caso la mayor parte de las variables son cualitativas, medidas en una escala
nominal u ordinal.

Ventana del editor de datos del SPSS. Archivo CIS3041.sav.

Crear una matriz de datos en SPSS


Si tenemos abierta una matriz de datos previamente en el editor y queremos crear una
nueva, procederemos en primer lugar a abrir una nueva ventana del editor de datos en
blanco. A través del menú, haremos: Archivo / Nuevo / Datos.
Los datos se introducen en la pestaña Vista de datos y se identifican en términos de lo que
llamaremos diccionario de los datos en la pestaña Vista de variables.
Desde la pestaña de datos introduciremos los 5 casos de esta forma:

12 Los datos han sido extraídos de la dirección: http://hdr.undp.org/es/data.


13 La información del barómetro (datos, cuestionario, resultados,…) se puede consultar en la dirección:
http://www.cis.es/cis/opencm/ES/1_encuestas/estudios/ver.jsp?estudio=14119..
CESARI 2018 Página 73
Anexo 1 N02

IMPORTAR datos a
herramientas

Cuando se introducen los datos el sistema asigna automáticamente un nombre a las


variables (VAR00001, VAR00002 y VAR00003) y asigna dos decimales a los valores
numéricos. Los datos pueden ser textuales (como el nombre) o numéricos (como la edad).
En el caso del sexo hemos introducido un código numérico para diferenciar ambos sexos
(el 1 para los varones y el 2 para las mujeres). Introducida así la información la pestaña de
variables presenta esta imagen:

Este diccionario que identifica las variables iniciales lo mejoraremos con los siguientes
cambios: damos nombre a las variables, ajustamos la anchura y el número de decimales,
ponemos una etiqueta identificativa para cada variable y también una etiqueta para
identificar cada código de la variable sexo, finalmente precisaremos el nivel de medida:

Una vez introducidos los datos es necesario guardarlos y convertirlos en un fichero del
sistema SPSS, por ejemplo con el nombre Datos1.sav.
Para guardar un archivo de datos:
• A través del menú: Archivo / Guardar, o bien Archivo / Guardar como
• Con el teclado: <Ctrl>+<S>
• Clicando sobre el botón Guardar este documento

CESARI 2018 Página 74


Anexo 1 N02

IMPORTAR datos a
herramientas

4. Análisis de datos con SPSS: el editor de resultados


Con una matriz de datos que se abre o que acabamos de crear hay dos tipos principales de
tareas que se poden realizar con SPSS: manipularlas (menús Datos y Transformar) y
analizarlas (menús Analizar y Gráficos). Todos los resultados obtenidos de estas tareas
generan tablas, gráficos y anotaciones de texto, que aparecerán automáticamente
en la ventana de resultados o Visor de resultados. Los tres tipos de materiales son editables
y podemos adaptar su información para mejorar la lectura y la presentación formal.
Realizaremos a continuación diversos ejercicios sencillos que nos permitirán obtener
resultados a través de los menús de Analizar y Gráficos.

Para empezar debemos abrir la matriz o Vista de los datos que se analizará con ayuda del
programa, sin olvidar que ésta deberá de contar con los valores recolectados y que
previamente se debieron editar las variables [1] en la Vista de variables. En la parte
superior de cualquiera de las dos vistas del SPSS, se puede observar la barra de
herramientas en la cual se incluye el botón Analizar, [2] al pulsar éste se despliegan una
serie de opciones entre las que se encuentra una denominada Estadísticos descriptivos [3],
al seleccionarla se abrirán más opciones y daremos clic en Frecuencias [4].

Al pulsar el botón Frecuencias se abrirá un cuadro de diálogo con el mismo nombre, en


donde encontraremos dos cajas, la primera contiene las variables del estudio [1], mientras
que la segunda se encuentra en blanco [2].

CESARI 2018 Página 75


Anexo 1 N02

IMPORTAR datos a
herramientas

Para indicarle al programa las variables que se analizarán, deberemos seleccionarlas de las
que se encuentran en la caja de la izquierda [1], posteriormente tendremos que pulsar la
flecha azul ubicada en medio de las cajas [2] lo que resultará en el cambio de lugar de las
variables de un cajón a otro [3].

Posterior a esto damos clic en el botón Estadísticos descriptivos para abrir una nueva caja
de diálogo denominada Frecuencias, de la cual seleccionaremos las medidas de tendencia
central o de dispersión, la distribución y/o los valores percentiles según nos interese, para
finalmente pulsar Continuar
Después de indicarle al programa los estadísticos que requerimos, deberemos dar clic en el
botón Gráficos, del cuadro de diálogo Frecuencias, lo que hará que aparezca otra caja
denominada Frecuencias: Gráficos, en la cual deberemos elegir el tipo de gráfico que
requerimos para presentar las distribuciones de las variables, [1] así como la clase de
valores a los que se hará referencia en los gráficos (frecuencias o porcentajes), [2] sin
olvidar pulsar el botón Continuar [3].

CESARI 2018 Página 76


Anexo 1 N02

IMPORTAR datos a
herramientas

A continuación pulsaremos el botón Formato del cuadro de diálogo Frecuencias para abrir
una nueva caja llamada Frecuencias: Formato, la cual nos permitirá seleccionar el criterio
para ordenar los valores de las categorías de las múltiples variables de la investigación
(tanto ítems o variables de la matriz como variables compuestas integradas de varios
ítems), no deberemos olvidar como siempre dar clic en Continuar.

Para finalizar tendremos que pulsar Aceptar en el cuadro de diálogo Frecuencias, no sin
antes verificar que esté palomeada la opción Mostrar tablas de frecuencias.
Al terminar esta serie de pasos se abrirá la Vista de resultados, la cual mostrará
primeramente los estadísticos que se solicitaron, posteriormente las tablas de frecuencias
por variable analizada y finalmente las gráficas de barras también por cada variable del
estudio.

CESARI 2018 Página 77


Anexo 1 N02

IMPORTAR datos a
herramientas

Estadísticos. El SPSS presenta la información referente a los estadísticos a modo de tabla.


En la primera columna de ésta (de izquierda a derecha) se incluyen las etiquetas de los
datos válidos, los perdidos y, posteriormente, los nombres de los estadísticos solicitados
(por ejemplo: media, mediana y moda).
Los encabezados del resto de las
columnas serán las etiquetas de las
variables analizadas, mientras que los
valores obtenidos mediante el análisis se
encontrarán en el cruce de las etiquetas
de la primera columna con la variable
correspondiente.
Tablas de frecuencias. Las tablas de frecuencias que se despliegan en la Vista de resultados
cuentan siempre con la siguiente información:
o Válidos (datos) [1]. Esto nos señala las opciones de respuesta o categorías que se consideraron y
de las que se encontraron registros, para el análisis de esa variable (en el ejemplo es el género).
o Frecuencia [2]. Es el número de veces que apareció determinada categoría o respuesta (en el
ejemplo las categorías femenino y masculino).
o Porcentaje [3]. Éste es el porcentaje que representa de la muestra total sobre la que se
recolectaron los datos, cada una de las respuestas o categorías posibles.
o Porcentaje válido [4]. Representa el porcentaje de registros que verdaderamente se
consideraron en cada categoría o respuesta para llevar a cabo los análisis, eliminando los valores
perdidos.
o Porcentaje acumulado [5].
Su nombre describe la
función que realiza, la cual
es acumular los porcentajes
de las respuestas posibles
hasta conseguir el cien por
ciento.
SPSS desplegará una tabla por cada variable de la investigación seleccionada para análisis,
recordando que a veces son ítems que corresponden a una sola columna y en otras
ocasiones son variables compuestas por varios ítems o columnas.
Gráfico de barras. Continuando con el ejemplo, para cada tabla aparecerá su
correspondiente gráfico (en este caso,
respecto al género), éste muestra las
características que le indicamos al
programa en el momento de darle las
instrucciones para el análisis:
El título de la gráfica, [1] el porcentaje
en el eje de las “y”, [2] la variable
analizada en el de las “x” [3] y los
valores obtenidos representados
mediante las barras [4].

Estilo y Bootstrap. La versión 22 del SPSS incluye dos opciones nuevas en el análisis
descriptivo. El botón de estilo sirve para especificar las condiciones para cambiar de forma
automática las propiedades de la tabla pivote basándose en condiciones específicas. Por
ejemplo, puede convertir todos los valores de significación menores a .05 a negrita y rojo.
CESARI 2018 Página 78
Anexo 1 N02

IMPORTAR datos a
herramientas

Por otro lado, el comando Bootstrap se utiliza para hacer uso del Bootstrapping, el cual es
un método para derivar estimaciones robustas de errores estándar e intervalos de
confianza en estimaciones tales como: media, mediana, moda, proporciones, odds ratio,
coeficientes de correlación o regresión e incluso para construir pruebas de hipótesis (IBM
SPSS Statistics, 2014).
Cálculo de confiabilidad. Una muestra más de las múltiples ventajas que ofrece el SPSS es la
posibilidad de calcular la confiabilidad de un instrumento, lo cual, como ya se comentó en el
libro, se determina mediante diversas técnicas o métodos. El programa ofrece diferentes
coeficientes para llevar a cabo el cálculo, sin embargo la elección de éstos dependerá
nuevamente del nivel de medición utilizado en el instrumento de recolección de los datos.
En la barra de herramientas que se encuentra en la parte superior de la pantalla, se puede
ubicar el botón Analizar [1] y dentro de las opciones que se despliegan se incluye la de
Escala, [2] ésta a su vez ofrece dos alternativas de las cuales elegiremos Análisis de
fiabilidad [3].

Al pulsar Análisis de fiabilidad aparecerá un nuevo cuadro de diálogo con el mismo nombre,
dentro de éste a la izquierda se encuentra una caja en la que se incluyen las variables del
instrumento [1] de las cuales se deberán seleccionar aquellas que se pretenden analizar
(que conforman la escala) y pasarlas al cuadro de la derecha [2] por medio de la flecha azul,
[3] que ya nos debe ser familiar. Posterior a esto se tendrá que seleccionar el Modelo, que
se usará para el cálculo [4] y finalmente escribir la Etiqueta de escala [5], sin olvidar pulsar
el botón Aceptar [6]. Dentro del cuadro existe también la opción Estadísticos [7] la cual
permite solicitar estos sobre la escala analizada.

CESARI 2018 Página 79


Anexo 1 N02

IMPORTAR datos a
herramientas

Correlación. Esta prueba también se puede llevar a cabo mediante el SPSS siguiendo los
pasos que a continuación se describen. Para iniciar, debemos pulsar el botón Analizar, el
cual ya hemos utilizado en anteriores ocasiones; al hacerlo se desplegarán de nuevo varias
opciones, entre las cuales daremos clic a la de Correlaciones, seleccionando la que se
requiera para el estudio.
Como ejemplo para este manual elegiremos
Bivariadas, por lo que como de costumbre se abrirá
un cuadro con el título de Correlaciones bivariadas.
En éste se encuentran de nuevo dos cajas, una a la
derecha [1] y la otra a la izquierda [2]. De la primera
seleccionaremos las variables sobre las que
queremos probar correlación, con la flecha azul [3]
pasaremos a la otra caja éstas, lo que nos indica que
sobre ellas se hará el análisis.
Paso seguido debemos elegir el Coeficiente de correlación [4] adecuado para el nivel de
medición de las variables y la Prueba de significancia o significación [5].
Otras ventajas que podemos aprovechar son las que se obtienen al pulsar Marcar las
correlaciones significativas [6], con lo que al ver los resultados de la prueba, el programa
nos señalará los coeficientes que son significativos; otras se consiguen dando clic en
Opciones [7], lo que nos brindará la posibilidad de solicitar Estadísticos [8] y el tratamiento
para Valores perdidos [9], no se debe olvidar pulsar Continuar [10] y Aceptar (11) según
sea el caso.

CESARI 2018 Página 80


Anexo 1 N02

IMPORTAR datos a
herramientas

Las funciones de Estilo y Bootstrap también se ofrecen para las correlaciones, y tienen la
misma finalidad y uso explicados con anterioridad en este mismo manual.

5. Administración de datos y variables


Algunas de las funciones más útiles que ofrece el SPSS, además de los múltiples análisis que
permite generar, son las que nos ayudan a administrar los datos y variables del estudio,
pues posibilitan manejarlos de tal manera que la información conseguida sea de mayor
riqueza.
Ya sea en la Vista de variables o en la de datos, la barra de herramientas que se encuentra
en la parte superior de cualquiera de éstas, incluye el botón Datos, [1] que al pulsarlo se
abre una serie de opciones tales como: Segmentar archivo [2] y Seleccionar casos [3]
Precisamente acerca de estas herramientas hablaremos a continuación por considerarlas
de mayor aplicación, sobre todo cuando nos iniciamos en el uso del SPSS, sin embargo se
recomienda estudiar el resto de las opciones, ya que pueden ser de mucha utilidad al
momento de analizar los datos.

CESARI 2018 Página 81


Anexo 1 N02

IMPORTAR datos a
herramientas

CESARI 2018 Página 82


Anexo 1 N02

IMPORTAR datos a
herramientas

Segmentar archivo
Esta herramienta sirve precisamente para lo que describe su nombre, y con el fin de
aprovecharla, se debe pulsar esta opción. Esto provocará que se abra una caja de diálogo
con el título Segmentar archivo. En ésta se ofrecen las opciones Analizar todos los casos [1],
comparar los grupos [2] y organizar los resultados por grupo [3], de las cuales nosotros
tendremos que elegir la que consideremos más conveniente para el estudio, sin olvidar
seleccionar la variable bajo la cual estarán basados los grupos [4], se recomienda elegir
solo una variable (por ejemplo género), finalmente no debemos olvidar pulsar el botón
Aceptar [5]. Con lo anterior, al solicitar los análisis que se requieran para el estudio, los
resultados se ofrecerán segmentados de acuerdo con lo que se haya indicado en este paso.

Como ya lo mencionamos para segmentar un archivo se ofrecen distintas opciones, la


primera (Analizar todos los casos, no crear grupos) se encuentra pre seleccionada, lo cual
hace que no exista segmentación alguna en los datos, y que éstos y los resultados se
presenten de manera general y abarcando a toda la muestra.
Si seleccionamos la segunda opción (Comparar los grupos), al realizar los análisis
necesarios para el estudio, los resultados se ofrecerán (recordemos que éstos se reflejarán
en la vista del mismo nombre) haciendo precisamente una comparación de grupos hechos
con base en la variable que se haya elegido.

CESARI 2018 Página 83


Anexo 1 N02

IMPORTAR datos a
herramientas

Tabla de frecuencias en la que se analiza el nivel socioeconómico de las personas


consideradas para cierto estudio, agrupándolas por género (la variable que se seleccionó en
el cuadro de diálogo) y haciendo su comparación.

Elegir la tercera opción (Organizar los resultados por grupos), implica que al solicitar
cualquier análisis, los resultados producto de éste se ofrecerán también con base en la
variable seleccionada, pero no en una misma tabla sino por separado.

Tabla de frecuencias en la que se analiza el nivel socioeconómico de las personas pero


utilizando la herramienta de organización de los resultados por grupos.

Se puede observar en la parte inferior izquierda de cada tabla que la segmentación está
hecha con base en la variable género y que se señala a cuál de estos corresponde cada una.
Finalmente, para quitar la segmentación habrá que abrir de nuevo la opción Segmentar
archivo y dar clic en Analizar todos los casos, no crear grupos.

CESARI 2018 Página 84


Anexo 1 N02

IMPORTAR datos a
herramientas

Seleccionar casos
Esta opción permite seleccionar aquellos casos que sean de interés para el investigador por
alguna razón (ejemplo, casos extremos), y el SPSS lo hace mediante una función “if” o “si”;
la forma de hacerlo es similar a las anteriores, se debe pulsar el botón Seleccionar casos, lo
que abrirá una caja con el mismo nombre, en ésta nosotros debemos elegir el criterio de
selección, [1] así como el tratamiento que se le dará al resultado, [2] para finalmente dar
clic en Aceptar [3]. Para quitar esta selección lo único que habrá que hacer es pulsar en
Restablecer [4] y luego Aceptar.

Un ejemplo de la utilidad de esta herramienta es el siguiente, supongamos que la gerente


de una cadena de cines (Maru) se encuentra analizando con el SPSS su base de datos sobre
los productos menos vendidos en la dulcerías de la empresa, ella se da cuenta que las
golosinas “El Chinito” no se están vendiendo bien a pesar de que son de excelente calidad y
su sabor es bueno, por lo que quiere llevar a cabo ciertos análisis sólo sobre ese producto,
para así plantear una mejor estrategia de venta. Lo que deberá hacer Maru es usar la
herramienta Seleccionar casos, indicándole al programa que tome en cuenta solo los dulces
de interés, esto provocará que al solicitar cualquier análisis el SPSS ya no considere todos
los productos, sino únicamente al que definimos, en otras palabras, para el SPSS la base de
datos solo estaría formada por respuestas acerca de los productos marca “El Chinito”.

CESARI 2018 Página 85


Anexo 1 N02

IMPORTAR datos a
herramientas

Calcular variable
Esta opción resulta de vital importancia para aquellos estudios en los que se requiere
realizar cálculos para la interpretación de los resultados, por ejemplo una investigación
que midiera la satisfacción laboral, la cual constituye una variable compuesta de varios
ítems (columnas), por ejemplo: satisfacción respecto al superior, satisfacción en torno a la
jornada de trabajo, satisfacción sobre la capacitación recibida, satisfacción respecto a los
compañeros, etc. Entonces, los resultados solamente tienen sentido al sumar los valores de
los ítems que conforman a la variable de la investigación.
Satisfacción laboral = satisfacción respecto al superior + satisfacción en torno a la jornada
de trabajo + satisfacción sobre la capacitación recibida + satisfacción respecto a los
compañeros + satisfacción…
Para usar la herramienta de calcular, debemos pulsar el botón Transformar, [1] el cual se
encuentra a la derecha del que usamos anteriormente (Datos). Al hacerlo se abrirán de
nuevo una serie de opciones entre las que se encuentra Calcular variable, [2] que debemos
pulsar para abrir una caja de diálogo con el mismo nombre.

El cuadro de diálogo nos ofrece un espacio para nombrar la variable de destino, en este
caso “compuesta” (por ejemplo, satisfacción laboral), [1] debajo de éste se encuentra un
botón que al pulsarlo abre un nuevo cajón para definir el tipo de variable que se creará, así
como la etiqueta que llevará [2]. Lo mismo que en anteriores ocasiones, las variables
(ítems o columnas) se encuentran agrupadas en un mismo espacio para poder elegir con
cuáles de ellas se trabajará [3] Para hacerlo simplemente tendremos que seleccionarlas y
pasarlas al espacio en blanco (con ayuda de la flecha azul) [4] que se encuentra en la parte
superior derecha del cuadro, denominado Expresión numérica [5].

CESARI 2018 Página 86


Anexo 1 N02

IMPORTAR datos a
herramientas

Asimismo debajo de éste se encuentran las funciones que nos permitirán establecer las
operaciones que llevaremos a cabo con las variables, para, con esto, crear una nueva
(compuesta) [6]. De igual forma el programa ofrece opciones como las llamadas Grupos de
variables [7] y la opción condicional [8]. Al terminar de realizar las acciones necesarias no
debemos olvidar presionar el botón Aceptar [9] para guardar los cambios realizados.

Referencias
- Cuevas, A. (2014). Introducción a SPSS. Manuscrito no publicado, Centro de Investigación de la
Universidad de Celaya en Guanajuato, México.
- IBM (2014). Background. Recuperado de http://www-
03.ibm.com/press/us/en/background.wss
- IBM SPSS Statistics (2014). ¿Por qué elegir IBM? Recuperado de http://www-
01.ibm.com/software/mx/analytics/spss/products/statistics/
- IBM SPSS Statistics (Edition 22) [Software de computación]. Chicago, IL, EE.UU.

CESARI 2018 Página 87

También podría gustarte