Anexo 1 Importar Datos A Herramientas
Anexo 1 Importar Datos A Herramientas
Anexo 1 Importar Datos A Herramientas
Taller Práctico De la
Observación a la Tabla de
Investigación. Preparación
de los Datos
Anexo 1 N02
IMPORTAR datos a
herramientas
INDICE
ANEXO 1 IMPORTAR DATOS A HERRAMIENTAS
IMPORTAR datos a
herramientas
ANEXO 1
IMPORTAR datos a herramientas
a. Creación e identificación de los datos con Entorno R
Software estadístico que se ha ido convirtiendo desde su creación en 1993 en uno de los
programas informáticos para el análisis de datos más utilizados en todo en el mundo. En
todas las disciplinas científicas y ámbitos profesionales de aplicación, R empieza a ser una
referencia obligada. ¿A qué se debe este éxito? Sugerimos la respuesta diciendo que cumple
con esa máxima de ser bueno, bonito y barato. Principalmente por su inigualable relación
calidad/precio. Es un producto de primera calidad, potente y eficiente, flexible, que se ha
extendido mundialmente con una red de apoyo entre usuarios valiosísima, al mejor precio
posible: software libre que se distribuye gratuitamente bajo licencia GNU1.
R es un conjunto integrado de programas para manipulación de datos, cálculo y gráficos.
Entre otras características dispone de:
almacenamiento y manipulación efectiva de datos,
operadores para cálculo sobre variables indexadas (Arrays), en particular matrices,
una amplia, coherente e integrada colección de herramientas para análisis de datos,
posibilidades gráficas para análisis de datos, que funcionan directamente sobre pantalla o
impresora, y
un lenguaje de programación bien desarrollado, simple y efectivo, que incluye
condicionales, ciclos, funciones recursivas y posibilidad de entradas y salidas. (Debe
destacarse que muchas de las funciones suministradas con el sistema están escritas en el
lenguaje R)
El término “entorno” lo caracteriza como un sistema completamente diseñado y coherente,
antes que como una agregación incremental de herramientas muy específicas e inflexibles,
como ocurre frecuentemente con otros programas de análisis de datos.
Junto con R se incluyen ocho bibliotecas pero otras muchas están disponibles a través de
Internet en CRAN (http://www.r-project.org).
Destacan entre sus ventajas, además de ser un software libre:
- Es un programa multiplataforma y, por tanto, existen versiones para Mac, iPhone, Linux o
Windows.
- A través del software R es posible analizar cualquier tipo de datos. Destaca por su
compatibilidad con todos los formatos de datos (txt, csv, xls, sav, sas,...).
- Tiene una capacidad gráfica muy buena en relación a los otros paquetes estadísticos.
- Existen miles de técnicas estadísticas que se han implementado en R, y siguen aumentando día
tras día. Así, la instalación base del programa es ampliable mediante extensiones para realizar
análisis específicos para infinidad de disciplinas.
R tampoco deja de tener inconvenientes: el principal, para un iniciado en ciencias sociales y
humanas, el lenguaje de programación; también la interfaz gráfica básica, la no
actualización de algunos paquetes, las dificultades de instalación y funcionamiento en un
entorno, las dificultades o la imposibilidad de utilizar los acentos o las dificultades para
trabajar con datos de encuesta ya no se conciben valores y etiquetas o valores perdidos
diferenciados. Pero son obstáculos en parte solucionables, que esperamos se resuelvan con
el tiempo, en relación con las ventajas que pueden obtenerse.
1
Software completamente libre, para su uso, modificación y distribución, evitando también su comercialización (ver
http://www.gnu.org/)
CESARI 2018 Página 2
Anexo 1 N02
IMPORTAR datos a
herramientas
La curva de aprendizaje de R, como también sucede con las técnicas de análisis de datos
estadísticos, es lenta y costosa al inicio. Trabajar con R implica conocer el lenguaje de
programación de R, significa tener que elaborar programas de instrucciones que se irán
ejecutando a medida que se vayan enviando para ser procesados, en vez de trabajar con
menús y cuadros de diálogo donde a base de clics de ratón se modelizan o parametrizan los
distintos procedimientos. Este aspecto tiene la gran ventaja de que permite al usuario un
mayor control de los procedimientos que ejecuta.
En una etapa inicial del aprendizaje y mediante la utilización de interfaces gráficos
(denominados GUI, Graphical User Interface) veremos cómo se facilita el uso y el
aprendizaje de R para realizar algunas tareas de análisis preestablecidas en un entorno
gráfico más amigable.
Una interfaz gráfica de usuario permite realizar las operaciones más comunes mediante
una serie de menús o mediante interacción con los objetos gráficos que aparecen en
pantalla, a través de periféricos como el ratón. Se opone a interfaz de programador o de
comandos, donde se teclean las instrucciones que se pretenden ejecutar. Una lista
exhaustiva de las interfaces para R se encuentra en http://www.sciviews.org/_rgui
1. Rkward. Se trata de la interfaz gráfica para R más prometedora. Está escrita en PHP y
C++ (sobre las bibliotecas del entorno gráfico KDE). Se distribuye bajo licencia GPL de GNU.
Para más información, visite http://es.wikipedia.org/wiki/RKWard.
Hemos de advertir que el entorno KDE funciona perfectamente sobre Ubuntu, pero todavía
no sobre Windows.
2. RCommander. Se trata de una interfaz más primitiva que Rkward, aunque más madura.
Se distribuye también bajo licencia GPL de GNU. Utiliza el entorno gráfico Tcl/Tk, así que
funciona adecuadamente tanto en Ubuntu como en Windows.
Por ello, es ahora mismo la interfaz más popular para R. Varias universidades han
desarrollado cursos basados en ella; véanse por ejemplo las páginas
http://knuth.uca.es/moodle/ (Universidad de Cádiz) y
http://crisol.uc3m.es/index.php/gnur (Universidad Carlos III).
Como cualidades podemos destacar:
- Adecuado para un curso de iniciación a la Estadística.
- Numerosa documentación en castellano.
- Módulos adicionales para Estadística avanzada.
- Introduce a la programación de R, al mostrar el código asociado a cada acción de los
menús.
- Fácil intalación.
Editor de datos deficiente. Se recomienda importar los datos y no editarlos directamente.
3. Deducer. Se trata de una interfaz que nos facilita la utilización de unos pocos paquetes
de R. Seguramente con el tiempo se irán ampliando las opciones de análisis con este tipo de
entorno, pero hasta el momento es limitado. La práctica de la investigación se extiende a
necesidades del analista que están limitadas por la configuración actual de estos editores,
ya sea porque alguna opción del paquete en cuestión no está disponible ya sea porque
sencillamente no se implementó en este entorno. El conocimiento progresivo de estas
herramientas ilustrará la necesidad de realizar tareas fuera del mismo, circunstancia que
obliga a combinar y conocer ambas forma de trabajo con el software.
IMPORTAR datos a
herramientas
Al abrir la aplicación para trabajar con R nos aparecerá una ventana como la siguiente que
recibe el nombre de consola de R.
Consola de R
En color rojo, al final, aparece el símbolo del sistema (el prompt): > y el cursor |
posicionado esperando la introducción de una instrucción en el lenguaje de programación
de R. La barra de menús nos ofrece algunas posibilidades de tareas a realizar pero no es el
lugar donde se pueden encontrar las instrucciones de los procedimientos de R para el
análisis estadístico y la obtención de representaciones gráficas.
IMPORTAR datos a
herramientas
Para trabajar en este entorno podemos hacerlo de forma interactiva ejecutando una
instrucción cada vez y viendo el resultado a continuación, o podemos elaborar programas
con diversas instrucciones (denominados scripts) que se pueden ejecutar en bloque.
Probemos ejecutar una instrucción tan sencilla como sumar 2 más 2. Escribimos 2+2 y
apretamos sobre la tecla <Enter>, obtendremos el resultado esperado:
> 2+2
[1] 4
Ahora repitamos la misma operación pero asignando el resultado de la suma a un objeto. Si
a este objeto le llamamos suma la asignación se realiza así:
> suma = 2+2
o bien
> suma <- 2+2
El operador de asignación = es equivalente al operador <-
A continuación para visualizar el resultado, basta con escribir suma y darle a <Enter>:
> suma
[1] 4
IMPORTAR datos a
herramientas
Una base o matriz de datos de estas características se identifica en R como un data frame,
(mediante el símbolo (df) en Data Set se identifica el tipo de datos) traducido como marco
de datos. Pero R también trabaja con el concepto de matriz en otro sentido y es preciso no
confundirlo. Se denomina matrix a un tipo de objeto que también es un conjunto de filas y
columnas, pero a diferencia del data frame en una matrix todos los elementos deben ser del
mismo tipo.
Por tanto, un data frame es una generalización de una matrix y puede contener, por
ejemplo, columnas con variables de diferente tipo: numéricas, factor, carácter, etc.
En matrix todas las variables deben ser del mismo tipo.
Como hemos comentado en general trabajaremos con data frames que denominaremos
matriz de datos o base de datos, si hacemos referencia en algún momento a una matriz de
elementos iguales en el contexto de R emplearemos la expresión matrix.
Los diferentes paquetes instalados de R disponen de archivos de datos que podemos
utilizar en cualquier momento. Ejecutando el comando data() desde la consola obtenemos
un extenso listado de los conjuntos de datos disponibles:
> data()
Se puede abrir cualquier conjunto de datos ejecutando el mismo comando con el nombre
del archivo de datos entre paréntesis. Por ejemplo en el paquete effects existe una matriz
(data frame) con datos de la World Values Survey, si ejecutamos:
> data(WVS)
Se cargará en el editor de datos, desplegamos el Data Set y veremos la matriz WVS.
IMPORTAR datos a
herramientas
El paquete que deseemos instalar del CRAN los encontraremos listado a través de: Paquetes
/ Instalar paquete.
Los paquetes que se descargan están disponibles entre las librerías de nuestra instalación
pero no están cargados en el sistema de R hasta que no se indica. Para ello es necesario
seleccionar el paquete y cargarlo a través de Paquetes / Cargar paquete.
IMPORTAR datos a
herramientas
Paquetes disponibles
Así pues para proceder a instalar un paquete adicional que necesitemos en R seguiremos
los siguientes pasos:
1) En el menú Paquetes / Instalar paquete elegimos el nuevo paquete.
2) Nos aparecerá la imagen del CRAN Mirror y elegiremos el servidor de descarga.
3) Para usarlo deberemos cargarlo a través de Paquetes / Cargar paquete.
A medida que se profundiza el conocimiento y se adquiere experiencia, y también se van
ampliando las necesidades, tanto en R como en el tratamiento y análisis de datos
cuantitativos, se irán incorporando distintos procedimientos de esta inmensidad de
alternativas que nos ofrecen hoy en día los paquetes estadísticos y R en particular.
Finalmente comentaremos que un paquete también se puede actualizar (a través del menú
Paquetes / Actualizar paquetes o con el comando update.packages) o desinstalar (el
comando uninstall.packages). La desinstalación del software es la habitual de cualquier
sistema operativo, en el caso de MS-Windows a través de Panel de control / Programas y
características.
Realizaremos esta tarea de edición de los datos con Deducer que nos facilitará el trabajo
de creación e identificación en un entorno de ventanas.
Deducer2 está diseñado para ser una alternativa gratuita y fácil de usar al software
patentado de análisis de datos, como SPSS, JMP y Minitab. Tiene un sistema de menú para
realizar tareas comunes de manipulación y análisis de datos, y una hoja de cálculo similar a
Excel para ver y editar marcos de datos.
Proporciona una interfaz gráfica de usuario (GUI) intuitiva para R, que alienta a los
usuarios no técnicos a aprender y realizar análisis sin que la programación se interponga
en su camino.
Aumenta la eficiencia de los usuarios expertos de R cuando realice tareas comunes
reemplazando cientos de teclas con unos pocos clics del mouse. Además, en la medida de lo
posible, la GUI no debería interferir si solo quieren hacer algo de programación.
2 http://www.deducer.org/pmwiki/index.php?n=Main.DeducerManual?from=Main.HomePage
CESARI 2018 Página 8
Anexo 1 N02
IMPORTAR datos a
herramientas
Deducer está diseñado para ser utilizado con la consola JGR basada en Java JGR, aunque
admite varios otros entornos R (por ejemplo, Windows RGUI y RTerm)
Para crea una matriz de datos, si acabamos de entrar en Deducer, tendremos la opción de
clicar sobre New Data en la ventana inicial de Data Viewer, nos aparecerá seguidamente un
cuadro para darle un nombre que no contenga ni acentos ni espacios. Le podremos el
nombre de Encuesta. Se abrirá el editor de datos en blanco.
Si estuviéramos trabajando con otros datos, desde el editor abierto procederemos a abrir
una nueva ventana del editor de datos en blanco mediante: File / New Data /Datos, o bien
con las teclas <CTRL>+<N>. El tipo de archivos de datos con los que trabajaremos
habitualmente, nuestras matrices de datos, se identifican en R como data frames.
El editor de datos, que abre al inicio o a partir del menú de la consola permite crear o
examinar una matriz de datos a partir de dos pestañas. En la [1] Data View introduciremos
los datos propiamente, es decir, los códigos o valores de las variables, mientras que en la
[2] Variable View identificaremos las características de éstos, su diccionario. Podríamos
optar tanto por empezar a introducir los datos como por elaborar el diccionario, pero es
recomendable proceder en primer lugar a introducir los datos, pues nos ayudarán, en el
caso de las variables cualitativas, a generar automáticamente el diccionario de sus valores.
En el visor de datos si clicamos el botón derecho del ratón en cualquier fila, además de
copiar, cortar y pegar, podremos: insertar una nueva fila (Insert New Row), borrarla
(Remove Row) y cambiar el nombre de la fila (Edit Row Name). Desde el momento que
creamos una nueva línea ésta aparece con el valor NA (Not Available) en cada casilla que
identifica la ausencia de valor (casilla en blanco). Si clicamos el botón derecho del ratón en
cualquier columna, además de copiar, cortar y pegar, podremos: insertar una nueva
columna vacía (Insert Empty), borrarla (Remove), o duplicarla (Duplicate), así como
ordenar los datos de la columna de forma ascendente o descendente (Sort: Increasing-
Decreasing).
Podemos modificar la información de identificación y crear el diccionario de los datos. Para
ello especificaremos la información siguiente en relación a cada variable que se dispone en
las filas:
- El nombre de la variable (Variable): tiene que empezar con una letra o con punto, el
nombre que se asigna es distinto si se escribe con mayúsculas o minúsculas, no pueden
tener acentos, ni ñ ni ç, ni espacios en blanco, ni ningún carácter fuera del estándar inglés,
tampoco admite los símbolos de los operadores aritméticos.
- El tipo de formato de la variable (Type): las variables de un data frame de R pueden ser de
diferente tipo. En particular podemos hacer la distinción fundamental entre:
Cualitativas o categóricas: valores de texto o etiqueta (numérica o textual) que representa el
grupo o categoría a la que pertenece el caso. Se pueden diferenciar entre nominales (por ejemplo
el sexo) y ordinales (nivel de estudios).
En R se denominan factores, y en el caso de ser de nivel ordinal factores ordenados.
Cuantitativas: valores numéricos con los que tiene sentido realizar aritmética. Se pueden
diferenciar entre continuas (índice de masa corporal) y discretas (número de hijos).
En R se llaman double si tienen decimales e integer si representan datos discretos. Cuando
clicamos sobre cada casilla de la columna Type se abre un desplegable que nos permite definir el
formato de la variable. Así, el paquete estadístico Deducer clasifica los tipos de variables en:
CESARI 2018 Página 9
Anexo 1 N02
IMPORTAR datos a
herramientas
3 Una forma alternativa de tratar en R de forma diferencial estos valores perdidos es (1) codificarlos con un valor
diferenciado, (2) crear una copia de la variable original en la cual los valores perdidos correspondientes estén en
blanco (NA), y (3) realizar los análisis seleccionando la versión de la variable que más interese en cada caso, con
sin NA, o combinando la información de ambas
CESARI 2018 Página 10
Anexo 1 N02
IMPORTAR datos a
herramientas
En el caso de las variables factor seguimos como criterio utilizar un código sintético de una
sola palabra, pudiendo utilizar los acentos. No obstante, trabajar con acentos en R es
problemático y obliga a renunciar a la especificidad de la lengua propia en favor de la
anglosajona, aspecto que debería ser revisado.
Hay que tener en cuenta que si editamos los Factores levels de una variable cualitativa y
borramos por error uno de los niveles, borraremos los datos correspondientes de la matriz
y se convertirán en NA (valores perdidos).
4 http://pagines.uab.cat/plopez/content/III.2
5 Si estamos en un espacio de trabajo con la matriz Encuesta que hemos identificado
CESARI 2018 Página 11
Anexo 1 N02
IMPORTAR datos a
herramientas
Al cargarlo en R se genera la matriz de datos Encuesta26, con los datos, los nombres de las
variables y las que son cualitativas ya se incorporan como variables tipo factor con sus
valores correspondientes.
Finalmente podemos importar un archivo de texto plano como Encuesta.txt donde los
datos están separados por tabulaciones. Los resultados son similares a los de la matriz
importada Encuesta2.
También podemos guardar (exportar) nuestros datos en diferentes formatos. En este caso
las opciones disponibles de formatos son menos pero suficientes para llevarlos a cualquier
otra aplicación:
Una vez introducidos los datos, o a medida que los vamos grabando para no perder el
trabajo realizado, debemos guardarlos y convertirlos en un fichero del sistema R, por
ejemplo con el nombre Encuesta.rda.
Para guardar un archivo de datos: a través del menú File / Save Data, haciendo clic sobre
el botón, o con las teclas <CTRL> <S>. Al guardar los datos nos aparecerá siempre la
carpeta de trabajo definida por defecto (Mis documentos) o bien la que hayamos definido a
través del menú File / Set Working Directory (<CTRL>+<D>).
Es importante recordar que el directorio del archivo no puede tener acentos, ni tampoco el
archivo de datos.
6 Será así si estamos en un espacio de trabajo con la matriz Encuesta que hemos identificado al inicio y además
hemos importado de Excel el archivo Encuesta.xlsx que pasó a denominarse Encuesta1
CESARI 2018 Página 12
Anexo 1 N02
IMPORTAR datos a
herramientas
El archivo BASE, con extensión .sba, es el archivo predefinido de trabajo de SPAD donde se
almacenan los datos y los meta datos. SPAD incorpora un editor de este tipo de ficheros,
llamado EDIBASE. Todos los análisis de datos requerirán un fichero BASE. SPAD ofrece la
posibilidad de abrir / crear / modificar este tipo de archivos.
Esta opción nos abre una nueva ventana (EDIBASE), con la que podemos editar el archivo.
Esta ventana se organiza en cuatro subventanas, accesibles por menú vía Fenêtre o bien
con los iconos de la barra de herramientas:
IMPORTAR datos a
herramientas
La ventana que aparece por defecto es la ventana Valeurs, en forma de matriz, y se puede
editar directamente. Destacamos que las dos primeras columnas corresponden a los
identificadores de individuos y a sus etiquetas (Libellées). Las opciones del menú Edition
permiten añadir / suprimir individuos, entre otras. Los valores faltantes (missings) se
indican con una ausencia de valor.
La ventana Variables contiene cinco columnas:
En el comando
Enregistrer sous del
menú Fichier podemos
guardar el fichero con
otro nombre.
IMPORTAR datos a
herramientas
Para crear un nuevo archivo BASE debemos seleccionar la opción Nouvelle Base del menú
Base. Esta acción nos abrirá una nueva base vacía
Primeramente debemos definir las variables y su tipo. Por defecto ya viene definido un
identificador de individuo y su etiqueta. Debemos por tanto añadir tres nuevas variables:
una nominal (N), otra continua (C) y otra textual (T). Debemos también definir su rango y
las etiquetas de las modalidades de la variable nominal.
Para introducir los valores, debemos cliquear sobre el icono Valeurs. Observaremos que la
matriz de valores está vacía. Debemos ejecutar la opción Ajuter N fois del menú Edition, y
indicar que queremos añadir 10 individuos.
Ya podemos introducir los datos. El editor de bases de SPAD permite realizar las
operaciones Copiar / Cortar / Pegar usuales en Windows. Así pues, puede interaccionar
con otras aplicaciones que contengan datos, como WORD, EXCEL, SPSS,...
Una vez los hayamos introducido debemos guardar la base, utilizando la opción Enregistrer
del menú Fichier y debemos indicarle el nombre y el directorio donde se guardará el
fichero de datos. Supongamos que guardamos el fichero con el nombre Encuesta.sba
El archivo BASE, con extensión .sba, es el archivo predefinido de trabajo de SPAD donde se
almacenan los datos y los meta datos.
SPAD incorpora un editor de este tipo de ficheros, llamado EDIBASE. Todos los análisis de
datos requerirán un fichero BASE. SPAD ofrece la posibilidad de abrir / crear / modificar
este tipo de archivos.
La filière es el objeto básico para realizar análisis con SPAD. En ella, se indican el archivo
BASE que se utiliza y se parametrizan los análisis. Toda la información y resultados se
puede guardar en una filière, mediante un archivo con extensión .fil.
En una filière se definen en un primer momento, de forma encadenada y secuencial, los
análisis que se realizarán sobre los datos y en un segundo momento se ejecuta la filière,
produciendo los resultados. Tanto las parametrizaciones como los resultados se presentan
como iconos.
IMPORTAR datos a
herramientas
Para crear una nueva filière debemos ejecutar la opción Nouvelle filière del menú Filière.
Por defecto, al abrir SPAD ya nos aparecerá una filière vacía, con el siguiente aspecto:
El primer paso que se debe realizar es indicar con qué archivo BASE se desea trabajar. Para
ello se puede ejecutar la opción Sélectionner Base del menú Filière o bien hacer un doble
clic sobre el icono BASE.
Nos aparecerá una nueva pantalla donde debemos indicar el directorio del archivo de datos
IMPORTAR datos a
herramientas
Una vez tenemos la filière referida a un archivo de datos, ya podemos empezar a encadenar
análisis, mediante los métodos (méthodes).
Todos los métodos disponibles los encontramos en la ventana
Méthodes, agrupados según su tipo.
Para definir un análisis necesitamos encadenar un conjunto
de métodos dentro de una filière. SPAD tiene definidos
muchos métodos agrupados según el tipo de análisis de
realizan, constituyendo módulos.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
- Otros módulos
Segmentación. Métodos para ajustar árboles de regresión y clasificación.
Decisión – Modelos. Métodos para ajustar modelos de regresión lineales, loglineales,
lineales generales,...
Tablas múltiples. Métodos para construir tablas múltiples y realizar análisis factoriales
múltiples.
Amado. Métodos que interaccionan con el software AMADO.
Para introducir un nuevo método a la filière basta con seleccionar la opción Insérer
Méthode del menú Méthode o bien cliquear con el botón de la derecha en el icono BASE, y
seleccionar la misma opción en el submenú que aparece.
Esta acción nos insertará un nuevo icono vacío, donde deberemos indicar el método que
deseemos ejecutar.
Para indicar el método debemos arrastrar el icono desde la ventana Méthodes.
Para parametrizar el método basta con realizar un doble clic sobre el icono. Se nos abrirá
una ventana de parametrización donde debemos indicarle las variables continuas y
categóricas que queremos analizar.
Antes de ejecutar la filière debemos guardarla sobre un archivo .fil. Para ello, debemos
seleccionar la opción Sauvegarder Filière del menú Filière. Opcionalmente, podemos dar a
la filière una etiqueta larga.
Una vez guardada, ya podemos ejecutar la filière, seleccionando la opción Exécuter filière
del menú Filière.
Después de la ejecución nos aparecerán los iconos de resultados, a la derecha de los
métodos Podemos realizar un doble click sobre cada uno de los iconos. Los símbolos de los
iconos nos indicarán el tipo de los resultados:
IMPORTAR datos a
herramientas
Para abrir una filière existente basta con ejecutar la opción Ouvrir filière del menú Filière e
indicar dónde se encuentra el archivo .fil.
Nota:
Tanto los iconos de resultado como las parametrizaciones de los métodos no se pierden y
son de inmediato editables. Cabe destacar que SPAD utiliza muchos ficheros intermedios,
muchos de los cuáles van ligados a la filière. Es recomendable crear un directorio propio
para cada análisis o bien para cada archivo BASE. No es recomendable copiar la filière a
otro directorio, pues daría problemas en la localización de ficheros.
El modo de encadenar los análisis no es indiferente. Hay análisis que se alimentan de
análisis anteriores. Esto provoca que ciertos encadenamientos sean imposibles de ejecutar.
El caso de los análisis factoriales es un ejemplo. Primero debe realizarse el análisis factorial
para luego aplicar la clasificación sobre los ejes factoriales creados.
Un mismo método puede ser encadenado tantas veces consecutivas como se desee. En el
caso de disponer de bases de datos complejos, es aconsejable realizar diversas filières,
separando los análisis.
SPAD dispone de una opción para crear filières predefinidas, es decir, encaradas a realizar
un análisis clásico. Para crear una nueva filière predefinida debe ejecutarse la opción
Filière prédéfinie del menú Filière.
IMPORTAR datos a
herramientas
SPAD no trabaja directamente con ficheros de datos ASCII, sino que necesita convertirlos a
un formato propio de fichero, lo que se conoce como base de datos SPAD, que tiene
extensión .sba.
Para importar archivos ASCII que contengan datos a SPAD debemos seleccionar la opción
Importation fichier Ascii dentro de Importer del menú Base.
La siguiente ventana que se abre es para incluir el fichero TXT o CSV a importar. Lo
buscaremos en el lugar donde lo hayamos guardado, y pinchamos Abrir.
Supongamos que disponemos de un archivo ASCII (.txt, .cvs o .dat) que contiene los datos
del ejemplo calidadVino.txt, donde los valores de las variables están separados por un
espacio tabulador. Este fichero contiene 4 variables numéricas continuas y 1 categórica
ordinal (mas una primera columna de identificadores) lo que es importante especificar. La
primera fila contiene, además, las etiquetas de las variables.
Para importar el archivo calidadVino.txt debemos parametrizar la pantalla como se
muestra a continuación.
IMPORTAR datos a
herramientas
La siguiente ventana permite a SPAD leer correctamente los datos según sea el tipo de
fichero ASCII que estamos importando (existencia o no de etiquetas, decimales -si los hay-,
si los separadores son blancos, comas o puntos y comas,...). En la ventana inferior de pre-
visualizacion podemos comprobar esto.
En el caso del fichero calidadVino.txt, la primera línea contiene las etiquetas de las
variables, el texto tiene delimitadores (si son espacios, las posiciones de los datos son fijas)
y los separadores son tabulaciones.
Cliqueamos sobre el botón Suivant y nos aparece una nueva ventana donde debemos
indicar de qué tipo son las variables.
IMPORTAR datos a
herramientas
La siguiente pantalla permite especificar algo muy importante en SPAD: el tipo de variables
estadísticas que estamos creando. En el caso de este fichero, la primera columna (C1 - id) es
un identificador de individuos ⇒ Identificateur, mientras que C2 - C5, son variables
continuas ⇒ Continue (Otros tipos de variable que admite son nomínales o alfabéticas y
textuales. También se puede abandonar una variable - Abandon).
Para crear el archivo SPAD debemos cliquear sobre el botón Executer e indicar el nombre
del nuevo archivo.
IMPORTAR datos a
herramientas
Entonces, se abre un recuadro de diálogo en el que tenemos que escribir un nombre para la
base de datos, por ejemplo “calidadVino.sba” ⇒ Guardar.
Si la importación se ha realizado de manera correcta, veremos una pantalla como la
siguiente.
Presionamos Femer (cerrar). Listo los datos están listos para ser usados por el Spad
Sólo nos quedará comprobar que la importación se ha realizado correctamente, abriendo el
nuevo archivo con EDIBASE.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Tabla 2: El ejemplo de un fichero de datos interno DTM para las 4 variables previas:
El género, la Edad numérica, la Edad en 4 categorías, el nivel Educativo.
Tres encuestados (individuos, observaciones)
' 1006 ' 1 76 4 1 (Los identificadores de los individuos: entre comillas simples,
' 1007 ' 2 20 2 2 sin espacio vacío, menos de 20 caracteres.
' 1008 ' 2 29 3 2 Los separadores entre los valores: como mínimo un espacio en blanco)
Haga Clic en Data Importation, Preprocessing, Data Capture, Exportation en Data File
Aparece una ventana que sugiere diferentes procedimientos.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
En cuanto presionamos “Enter”, nos permite registrar una segunda variable (figura 1).
Siguiendo con el ejemplo ingresamos la “Edad”, cuyo tipo es "0" (o: 1), es una variable
numérica. En este caso no aparece ninguna venta a la derecha, ya que no es una variable
cualitativa donde debe especificarse modalidades.
IMPORTAR datos a
herramientas
Volvemos a presionar “Enter”, nos permite registrar una tercera variable (figura 2).
Siguiendo con el ejemplo, ingresamos la “Edad discretizada en rangos”, variable categórica
de 4 modalidades.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Regrese “RETUN”.
IMPORTAR datos a
herramientas
Haga Clic en "Execute" (Responda NO a la pregunta acerca de un formato posible XML para
el archivo de salida).
Lea los resultados haciendo clic en “Main basic numerical results” (principales resultados
numéricos básicos) del menú. Estos resultados son guardados bajo el nombre "imp.txt" en
el mismo directorio de trabajo.
IMPORTAR datos a
herramientas
Junto con el instalador de DTM, se descargó ejemplos, en cualquiera de las carpetas de los
ejercicios se puede copiar el fichero “CLEAN_dtm_files.BAT”, al directorio de trabajo
actual; al ejecutar este archivo se limpian los ficheros temporales (ocultos bajo Windows)
que genera el programa DTM.
Siempre copiar este fichero en la carpeta de trabajo.
7 El lector que no es provisto de ese software debería saltarse las siguientes instrucciones
CESARI 2018 Página 37
Anexo 1 N02
IMPORTAR datos a
herramientas
Estos nombres estarán truncados hasta 10 caracteres para construir luego los
identificadores de las modalidades. El archivo está formado por 1043 líneas (la muestra
de individuos de una encuesta socio económica sirve de ejemplo de aplicación en EX05,
EX06, EX07)).
4. Debemos guardar este archivo como un fichero de “texto delimitado por coma” con la
extensión ".csv". (En “Archivo”, ingresar a "Guardar como…") obtenemos un archivo de
formato libre con las columnas separadas por punto y coma.
Si ignoramos la primera fila, el archivo es similar al archivo de formato libre del ejemplo
anterior. En el directorio de ejemplo, se proveee el archivo en formato "csv".
Importante: Si hay puntos y comas en el fichero de datos, deberán ser reemplazados por otro
símbolo antes de realizar la transformación al formato CSV. También antes de guardar el
archivo, el formato de las celdas debe ser "normal", para evitar algunos espacios en blanco
adicionales.
Si su versión de Excel no tiene previsto la opción "guardar como un archivo de csv", usted
puede guardar el archivo usando "tabulaciones" como separadores, y luego, puede cambiar
las "tabulaciones" en "puntos y comas" (paso básico: ingrese a “Data capture, data
importation”, luego: presione “specific preprocessing”, luego: el botón “replacing tabs with
semicolons”).
Una vez creado el archivo con la
extensión CSV, lo abrimos con el
Bloc de Notas u otro editor de
texto para eliminar, al final del
mismo, líneas en blancos.
Chequeamos que todo está bien.
IMPORTAR datos a
herramientas
5. La secuencia de operaciones:
a) Clic sobre “DataCapture, Data importation, Preprocessing” (importación / captura /
preprocesamiento de datos).
b) Seleccione: “Importing Dictionary ,Data and Texts” (Importar Diccionario, Datos y
Textos)". Se muestra una nueva ventana para la importación.
IMPORTAR datos a
herramientas
Luego, haga clic en: “1. Add the types of variables” (indicar tipos de variables ).
Ingrese a Select Data. (cargar fichero csv). Seleccione el archivo creado previamente
"datbase_classical.csv" .
IMPORTAR datos a
herramientas
Ingrese a Values and Counts. (analizar los valores) y luego a Show results (muestra los
resultados).
Luego seleccionar uno o varios identificadores de variable, en la lista, y escoger, para cada
atributo (cada variable), una palabra clave entre las tres siguientes:
- “char” significa que nos ocupamos de una variable categórica (nominal). Tal variable
podría ser codificada con, a lo sumo, 6 caracteres. Por ejemplo, “masc” y “feme” para
codificar el sexo (o "0" y "1", o "10" y "20").
- “text” significa que los registros (hasta 30 caracteres), no serán tomados en cuenta en
un fichero de datos8. El identificador de individuos se coloca de este tipo (1º columna).
- “num” significa que nos ocupamos de una variable numérica (continua).
IMPORTAR datos a
herramientas
Una vez completado el que el ingreso del tipo de variable, dé un clic sobre “update the
data file” (actualización) para modificar el fichero.
El programa crea un nuevo archivo, en donde se agrego una fila después de los
identificadores de variables, con el tipo de dato. Este archivo es "
New_typevar_datbase_classical.csv".
Luego, haga clic en: “Impor Data” (importar). El proceso de importación consiste en
construir un diccionario DTM y un fichero de datos DTM a partir del fichero de datos
creado en el paso anterior “1”.
- los nombres de las variables se extraen de la primera fila del archivo
“New_typevar_datbase_classical.csv”.
- el número de categorías para cada variable y los nombres de estas modalidades se
obtienen al realizar un análisis del fichero Para cada variable, son detectadas todas las
diferentes secuencias de caracteres de importancia. Las modalidades son ordenadas
alfabéticamente por sus identificadores.
IMPORTAR datos a
herramientas
- el fichero de datos DTM comienza con el mismo identificador entre comillas simples, las
modalidades de las variables categóricas serán enteros consecutivos comenzando con el
valor "1", en lugar de un símbolo alfanumérico. Los valores numéricos serán idénticos
al del fichero de datos original, excepto los valores perdidos reemplazados, en esta
versión de DTM, por el valor estándar "999".
Se muestra la ventana: “Format type XL ®. Finding the states of each categorical variables,
frequencies… “.
d) Clic en: “Select Basic file” (Seleccionar archivo Básico). Seleccione el archivo
“New_typevar_datbase_classical.csv” en el directorio: EX2.Importation.XL
e) Clic en “Values and counts” (Valores y recuentos). Análisis de todas las variables
nominales (el símbolo: "Achichárrese" en el diccionario) se forma de los dos
archivos básicos. Se muestra la lista de todas las modalidades encontraron en el
fichero de datos, con las frecuencias correspondientes.
IMPORTAR datos a
herramientas
Clic en “Create Dictionary and Data” (crear el diccionario y los datos DTM).
La secuencia es idéntica a las fases correspondientes de ejemplo EX.1.
Clic en “Name for the new dictionary”
(nombre para el diccionario nuevo)
para escoger un nombre para el
diccionario en formato de DTM,
siempre en el mismo directorio. (se
recomienda la extensión ".DIC"). Por
ejemplo “diccionario.DIC”
Clic en “Create new dictionary” (crear diccionario nuevo). Analiza las modalidades para las
variables nominales. Es creado un diccionario en formato interno de DTM, el cuál se
visualiza en las notas a la derecha. Clic en “Create new data file” (crear fichero de datos
nuevo). Al cabo de un rato, un cuadro de mensajes muestra el número de individuos.
Clic sobre ese botón “Create a DTM parameter file”. (Crear un archivo de parámetros DTM).
Se muestra la ventana “Creating a starting parameter file”.
Clic en “Create a first parameter file” (crea un primer archivo de parámetro). Se muestra un
archivo de comandos DTM en la ventana inferior. Los demás operaciones y comentarios
son idénticos a la de la introducción. El archivo de comandos es automáticamente creado
bajo el nombre: "Param start.txt".
Haga Clic en "Execute" (Responda NO a la pregunta acerca
de un formato posible XML para el archivo de salida). Lea
los resultados haciendo clic en “Main basic numerical
results” (principales resultados numéricos básicos) del
menú.
Estos resultados son guardados bajo el nombre "imp.txt"
en el mismo directorio de trabajo.
IMPORTAR datos a
herramientas
9 Hay quien ha señalado (Wellman, 1998) que el manual de estos tres autores (Nie, Bent y Hull, 1970) ha sido uno
de los libros más influyentes entre los sociólogos en aquel entonces, tras su amplia difusión en el ámbito
universitario estadounidense
10 El relato de la historia de SPSS se puede cosultar en: http://www.spss.com.hk/corpinfo/history.htm.
IMPORTAR datos a
herramientas
El propio software estadístico dispone de una ayuda muy completa que se puede obtener a
través del menú de Ayuda y que enlaza con diversas direcciones de SPSS en internet:
1. El entorno de trabajo de SPSS
El entorno de trabajo del SPSS es una interface gráfica de ventanas, menús y cuadros de
diálogo propios del sistema operativo de Microsoft Windows.
Cuando iniciamos una sesión con el paquete estadístico nos aparece una ventana de
bienvenida que nos permite ver los productos instalados y no instalados, acceder a guías de
aprendizaje, ver las novedades de la versión e iniciar nuestra sesión de trabajo a partir de
archivos trabajados con anterioridad o con otros nuevos.
Al iniciar el uso del programa se muestran dos pantallas, la primera es muy similar a una
hoja de Excel, de la cual hablaremos posteriormente, la segunda es un cuadro de diálogo
que aparece en primer plano y que ofrece diversas opciones tales como información sobre
los módulos y las ampliaciones de programabilidad, así como útiles guías de aprendizaje
sobre múltiples temas relacionados con el programa y aspectos de estadística.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
- VISTA DE VARIABLES. Esta segunda pantalla es la que permite ver y editar las
propiedades de cada una de las variables con las que se trabajará en la vista de datos.
Esta vista muestra la información de definición de las variables, que incluye las etiquetas
de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha o numérico),
nivel de medición (nominal, ordinal o de escala) y los valores perdidos del usuario. La
Vista de variables contiene descripciones de los atributos de cada variable del archivo de
datos. En la Vista de variables:
Las filas son variables.
Las columnas son atributos de las variables.
Se pueden añadir o eliminar variables, y modificar los atributos de las variables,
incluidos los siguientes:
o Nombre de variable
o Tipo de dato
o Número de dígitos o caracteres
o Número de decimales
o Las etiquetas descriptivas de variable y de valor
o Valores perdidos del usuario
o Ancho de columna
o Nivel de medición
Todos estos atributos se guardan al guardar el archivo de datos.
Además de la definición de propiedades de variables en la Vista de variables, hay dos
otros métodos para definir las propiedades de variables:
El Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un archivo
de datos IBM SPSS Statistics externo u otro conjunto de datos que esté disponible en la sesión
actual como plantilla para definir las propiedades del archivo y las variables del conjunto de
datos activo. También puede utilizar variables del conjunto de datos activo como plantillas
para otras variables del conjunto de datos activo. La opción Copiar propiedades de datos está
disponible en el menú Datos en la ventana Editor de datos.
IMPORTAR datos a
herramientas
Vista de variables
Para seleccionar una única variable, simplemente selecciónela en la lista de variables
de origen y arrástrela y colóquela en la lista de variables de destino. También puede
utilizar el botón de dirección para mover las variables de la lista de origen a las listas de
destino. Si sólo existe una lista de variables de destino, puede pulsar dos veces en las
variables individuales para desplazarlas desde la lista de origen hasta la de destino.
También pueden seleccionar diversas variables:
- Para seleccionar varias variables que estén agrupadas en la lista de variables, pulse
en la primera de ellas y, a continuación, en la última del grupo mientras mantiene
pulsada la tecla Mayús.
- Para seleccionar varias variables que no estén agrupadas en la lista de variables,
pulse en la primera de ellas; a continuación, pulse en la siguiente variable mientras
mantiene pulsada la tecla Ctrl, y así sucesivamente (en Macintosh, pulse mientras
mantiene pulsada la tecla Comando).
CESARI 2018 Página 54
Anexo 1 N02
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
- Un signo $ en la primera posición indica que la variable es una variable del sistema. El signo
$ no se admite como carácter inicial de una variable definida por el usuario.
- El punto, el subrayado y los caracteres $, # y @ se pueden utilizar dentro de los nombres de
variable. Por ejemplo, A._$@#1 es un nombre de variable válido.
- Se deben evitar los nombres de variable que terminan con un punto, ya que el punto puede
interpretarse como un terminador del comando. Sólo puede crear variables que finalicen
con un punto en la sintaxis de comandos. No puede crear variables que terminen con un
punto en los cuadros de diálogo que permiten crear nuevas variables.
- Se deben evitar los nombres de variable que terminan con un carácter de subrayado, ya que
tales nombres puede entrar en conflicto con los nombres de variable creados
automáticamente por comandos y procedimientos.
- Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras
reservadas son ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO y WITH.
- Los nombres de variable se pueden definir combinando de cualquier manera caracteres en
mayúsculas y en minúsculas, esta distinción entre mayúsculas y minúsculas se conserva en
lo que se refiere a la presentación.
- Cuando es necesario dividir los nombres largos de variable en varias líneas en los
resultados, las líneas se dividen aprovechando los subrayados, los puntos y cuando el
contenido cambia de minúsculas a mayúsculas.
Tipo. En la segunda columna de la misma pantalla de
variables, se deberá definir a qué tipo de ítem o variable
corresponde. De manera predeterminada aparecerá
“Numérico”, sin embargo esto se puede modificar al dar
clic en el cuadro gris con tres puntos suspensivos que
aparece a la derecha de la celda al cambiar. Al presionar
los puntos suspensivos aparecerá un cuadro de diálogo,
que permite definir el tipo de información que se estará
capturando y utilizando.
Opción para cambiar el tipo de datos a analizar en la
variable
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Decimales. Igual que en la columna anterior, ésta tiene la misma función que la opción
decimales de la caja de diálogo en donde se selecciona el tipo de variable, pero por la
misma razón que se explicó en el anterior atributo (anchura), se ofrece la opción de
modificar esta información directamente sobre la vista de variables. De manera
predefinida, el programa considera dos decimales, sin embargo esto se puede modificar
de la misma forma que la opción de anchura.
Etiqueta. Tal como lo menciona el tutorial del SPSS, además de precisar los tipos de
datos, el programa brinda la posibilidad de definir etiquetas para las variables, las cuales
se emplean y visualizan en los gráficos e informes estadísticos (IBM SPSS Statistics,
2014). El rótulo puede ser una definición de lo que la variable representa (Cuevas,
2014).
Para escribir o nombrar la etiqueta de la variable, únicamente hay que posicionarse
sobre la celda correspondiente y escribir el título o rótulo que se requiera para dicha
variable, por ejemplo: “Edad” o “Por favor, ¿me podría indicar su edad?”, Es muy
importante cuidar que al teclear la etiqueta no se cometan errores ortográficos o
“dedazos”, pues aunque como veremos más adelante, se puede realizar ediciones a las
etiquetas, esto nos tomaría algún tiempo, mismo que se podría evitar.
IMPORTAR datos a
herramientas
Estos pasos se deberán repetir tantas veces como posibles categorías u opciones de
valor y significado tenga la pregunta, ítem o variable. Finalmente, después de haber
definido todos los valores de las categorías se deberá dar clic en el botón Aceptar6 para
que el programa guarde la información vertida, en caso de no realizar este paso el SPSS
no respetará los cambios realizados en el cuadro de etiquetas de valor.
IMPORTAR datos a
herramientas
Perdidos (valores). Los datos numéricos erróneos, campos de datos vacíos o campos
con entradas no válidas son convertidos por el programa a lo que se denomina: valores
perdidos por el sistema y se identifican en las celdas de la Vista de datos como puntos.
Para identificar el motivo por el cual se perdió ese dato, el programa incluye la opción
“perdidos”, la cual ayuda a diferenciar en el análisis de los datos la razón específica (por
ejemplo, separa a los que se perdieron porque los respondientes se negaron a contestar
la pregunta de aquellos que no la contestaron porque no les aplicaba).
Para definir los datos que el sistema no deberá considerar para los análisis, se tendrá
que dar clic en la celda correspondiente a la columna “Perdidos”, [1] en donde aparecerá
de nuevo una caja gris con puntos suspensivos a su derecha [2], que habrá que pulsar
para abrir la caja de diálogo Valores perdidos [3]. En ésta se definen aquellos valores
que el programa deberá identificar como no válidos y excluirlos de los análisis. Existen
dos opciones: la primera consiste en seleccionar valores perdidos discretos, [4] para lo
cual la caja ofrece hasta tres posibilidades (muestra tres espacios),* y la segunda estriba
en estipular un rango de valores perdidos [5] (del menor al mayor 6) más un valor
perdido discreto adicional [6]. Con la finalidad de guardar los cambios realizados en el
cuadro de diálogo no se debe olvidar pulsar “Aceptar” antes de cerrarlo mismo [7].
Supongamos que nosotros queremos identificar cuando en la P_1 (Edad) las personas
encuestadas no contestaron, para ello seguiríamos los pasos anteriormente descritos y
seleccionaríamos la opción Valores perdidos discretos [4], posteriormente, en alguna de
las cajas que se encuentran debajo de esta opción [*] pondríamos el código numérico
que tendría para nosotros este significado, por ejemplo 99. Posteriormente pulsamos el
botón Aceptar.
Después de añadir dicho valor de datos perdidos, podríamos aplicar una etiqueta a este
valor. Seleccionamos la casilla Valores [1] de la fila correspondiente a la P_1, acto
seguido daríamos clic a la caja gris con puntos suspensivos [2] que aparece a la derecha
de la casilla para abrir el cuadro de diálogo Etiquetas de valor. Ya en el cuadro
escribiríamos 99 en el campo de Valor [3] y No contestó en el espacio para Etiqueta [4].
No debemos olvidar pulsar Añadir [5] para incorporar esta etiqueta a la base de datos y
finalmente dar clic en Aceptar [6] para guardar los cambios.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Para modificar el tipo de medida lo único que hay que hacer es pulsar la casilla que
corresponde a la Medida y seleccionar el tipo más adecuado a la variable
Nota: Para variables de cadena ordinales, se asume que el orden alfabético de los valores de
cadena indica el orden correcto de las categorías. Por ejemplo, en una variable de cadena
cuyos valores sean bajo, medio, alto, se interpreta el orden de las categorías como alto, bajo,
medio (orden que no es el correcto). Por norma general, se puede indicar que es más fiable
utilizar códigos numéricos para representar datos ordinales.
IMPORTAR datos a
herramientas
Explorador de resultados
Vista de resultados
IMPORTAR datos a
herramientas
Los resultados de texto , las tablas y los gráficos que aparecen en la ventana
de resultados se pueden editar (o abrir en una ventana propia) de forma independiente
si hacemos doble-clic sobre cada objeto (o a través del menú contextual).
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
En ciertos momentos la utilización de los menús sigue siendo efectiva y la opción óptima,
pero hay muchas situaciones y necesidades que no se pueden lograr de esta forma; la
experiencia sugiere estrategias de trabajo mixtas que se adapten a las preferencias de cada
usuario/a y los requerimientos de cada tarea a realizar, pero se constata a la larga que el
uso avanzado del software implica trabajar con el lenguaje de comandos.
¿Por qué este interés por la programación? Un usuario avanzado o profesional del software
precisará del uso de la sintaxis por varias razones, entre ellas cabe destacar:
- Algunos comandos sólo están disponibles a través del uso del lenguaje de
comandos.
- Ciertas opciones de algunos comandos, los cuales se pueden ejecutar por menús, no se
pueden ejecutar si no es a través de la sintaxis.
- En algunas ocasiones la programación es más fácil y rápida que la utilización de los
menús, como es el caso de la ejecución de comandos relacionados con la transformación
de los datos.
- El lenguaje de comandos permite guardar las instrucciones en un archivo de sintaxis
que puede ser reutilizado o revisado con el objetivo de recordar, comprobar o repetir
las tareas realizadas. Favorece por tanto la replicación y el control del trabajo
Suponemos que estuvimos calculando la frecuencia de nuestras variables y accedimos al
cuadro de diálogo de la manera tradicional. Para volver al cuadro de diálogo de Frecuencias
se puede ir por el camino anterior: Analizar / Estadísticos descriptivos / Frecuencias, o bien
a través de una “atajo” si clicamos sobre el botón de Recuperar los cuadros de diálogo
recientes y eligiendo Frecuencias. Con la misma variable anterior o con otra de nuestra
elección procedemos a ejecutar el procedimiento, pero esta vez en lugar de clicar sobre
Aceptar lo haremos sobre Pegar. Se abrirá inmediatamente una ventana de sintaxis con las
instrucciones del procedimiento de frecuencias en lenguaje de comandos.
Se han incluido en el editor de sintaxis dos comandos: DATASET ACTIVATE, que hace que
el conjunto de datos nombrado se convierta en el fichero activo para trabajar (el nombre
asignado es automático: Conjunto_de_datos 2), y FREQUENCIES, que extrae la tabla de
frecuencias y el gráfico.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Después de copiar las celdas desde Excel, habrá que pegarlas en la Vista de datos del SPSS
cuidando que al hacerlo las casillas copiadas correspondan a las celdas donde se están
pegando (recordemos que la matriz de Excel debe ser idéntica a la matriz del SPSS). Para
esto se sugiere posicionarse en la primera celda del primer caso [1] y ahí dar la instrucción
de pegar [2].
IMPORTAR datos a
herramientas
Al hacer esto se abrirá un cuadro de diálogo con el título Abrir datos, entonces debemos
seleccionar la carpeta en donde se encuentra la matriz, no sin antes cambiar en la opción
Archivos de tipo a Excel (*.xls, *.xlsx, *.xlsm) 1, seleccionar la base de datos2 y pulsar
Abrir3
IMPORTAR datos a
herramientas
Después de esto se abrirá una nueva caja de diálogo con el título Apertura de origen de
datos de Excel, debemos asegurarnos que esté “palomeada” la opción Leer nombre de
variables de la primera fila de datos1 y pulsar Aceptar2 (Figura 26), con esto se abrirá la
matriz de datos en el SPSS incluyendo los títulos de las variables (Figura 27). No se debe
olvidar que después de esto se tendrán que editar las propiedades de las variables en la
Vista de variables.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Este archivo en la ventana del editor de datos se considera el conjunto de datos activo
11 López-Roldán, P.; Fachelli, S. (2015). Software para el análisis de datos: SPSS, R y SPAD. En P. López-Roldán y
S. Fachelli, Metodología de la Investigación Social Cuantitativa. Bellaterra (Cerdanyola del Vallès): Dipòsit
Digital de Documents, Universitat Autònoma de Barcelona. Capítulo III.1. 1ª edición. Edición digital:
http://ddd.uab.cat/record/129380
CESARI 2018 Página 72
Anexo 1 N02
IMPORTAR datos a
herramientas
En este caso cada fila representa un país y cada columna un atributo o propiedad que
caracteriza a cada uno de ellos. Los datos provienen de Naciones Unidas y corresponden a
los indicadores que se utilizan para construir el Índice de Desarrollo Humano (IDH)
correspondiente al año 201412.
Podemos comprobar que disponemos de información para 195 países en relación a 114
variables. La primera variable corresponde a la posición de cada país en el ranking que
establece el índice y la segunda es el identificador del país. Las 112 variables restantes son
los indicadores que considera el United Nations Development Programme para construir el
indicador sintético IDH, todas ellas son variables medidas en una escala numérica o
cuantitativa (de escala en terminología del SPSS).
La segunda matriz de datos, CIS3041.sav, corresponde a los datos del Barómetro del Centro
de Investigaciones Sociológicas de octubre de 2014 (estudio número 3041) 13.
Se trata de una muestra estadística de 2480 individuos que contestaron la encuesta del
barómetro en relación a diversas cuestiones de la actualidad política, entre otras, y que dan
lugar a un total de 210 variables. En esta matriz cada fila es un individuo anónimo que se
identifica con un número correspondiente al código numérico asignado a su cuestionario.
En este caso la mayor parte de las variables son cualitativas, medidas en una escala
nominal u ordinal.
IMPORTAR datos a
herramientas
Este diccionario que identifica las variables iniciales lo mejoraremos con los siguientes
cambios: damos nombre a las variables, ajustamos la anchura y el número de decimales,
ponemos una etiqueta identificativa para cada variable y también una etiqueta para
identificar cada código de la variable sexo, finalmente precisaremos el nivel de medida:
Una vez introducidos los datos es necesario guardarlos y convertirlos en un fichero del
sistema SPSS, por ejemplo con el nombre Datos1.sav.
Para guardar un archivo de datos:
• A través del menú: Archivo / Guardar, o bien Archivo / Guardar como
• Con el teclado: <Ctrl>+<S>
• Clicando sobre el botón Guardar este documento
IMPORTAR datos a
herramientas
Para empezar debemos abrir la matriz o Vista de los datos que se analizará con ayuda del
programa, sin olvidar que ésta deberá de contar con los valores recolectados y que
previamente se debieron editar las variables [1] en la Vista de variables. En la parte
superior de cualquiera de las dos vistas del SPSS, se puede observar la barra de
herramientas en la cual se incluye el botón Analizar, [2] al pulsar éste se despliegan una
serie de opciones entre las que se encuentra una denominada Estadísticos descriptivos [3],
al seleccionarla se abrirán más opciones y daremos clic en Frecuencias [4].
IMPORTAR datos a
herramientas
Para indicarle al programa las variables que se analizarán, deberemos seleccionarlas de las
que se encuentran en la caja de la izquierda [1], posteriormente tendremos que pulsar la
flecha azul ubicada en medio de las cajas [2] lo que resultará en el cambio de lugar de las
variables de un cajón a otro [3].
Posterior a esto damos clic en el botón Estadísticos descriptivos para abrir una nueva caja
de diálogo denominada Frecuencias, de la cual seleccionaremos las medidas de tendencia
central o de dispersión, la distribución y/o los valores percentiles según nos interese, para
finalmente pulsar Continuar
Después de indicarle al programa los estadísticos que requerimos, deberemos dar clic en el
botón Gráficos, del cuadro de diálogo Frecuencias, lo que hará que aparezca otra caja
denominada Frecuencias: Gráficos, en la cual deberemos elegir el tipo de gráfico que
requerimos para presentar las distribuciones de las variables, [1] así como la clase de
valores a los que se hará referencia en los gráficos (frecuencias o porcentajes), [2] sin
olvidar pulsar el botón Continuar [3].
IMPORTAR datos a
herramientas
A continuación pulsaremos el botón Formato del cuadro de diálogo Frecuencias para abrir
una nueva caja llamada Frecuencias: Formato, la cual nos permitirá seleccionar el criterio
para ordenar los valores de las categorías de las múltiples variables de la investigación
(tanto ítems o variables de la matriz como variables compuestas integradas de varios
ítems), no deberemos olvidar como siempre dar clic en Continuar.
Para finalizar tendremos que pulsar Aceptar en el cuadro de diálogo Frecuencias, no sin
antes verificar que esté palomeada la opción Mostrar tablas de frecuencias.
Al terminar esta serie de pasos se abrirá la Vista de resultados, la cual mostrará
primeramente los estadísticos que se solicitaron, posteriormente las tablas de frecuencias
por variable analizada y finalmente las gráficas de barras también por cada variable del
estudio.
IMPORTAR datos a
herramientas
Estilo y Bootstrap. La versión 22 del SPSS incluye dos opciones nuevas en el análisis
descriptivo. El botón de estilo sirve para especificar las condiciones para cambiar de forma
automática las propiedades de la tabla pivote basándose en condiciones específicas. Por
ejemplo, puede convertir todos los valores de significación menores a .05 a negrita y rojo.
CESARI 2018 Página 78
Anexo 1 N02
IMPORTAR datos a
herramientas
Por otro lado, el comando Bootstrap se utiliza para hacer uso del Bootstrapping, el cual es
un método para derivar estimaciones robustas de errores estándar e intervalos de
confianza en estimaciones tales como: media, mediana, moda, proporciones, odds ratio,
coeficientes de correlación o regresión e incluso para construir pruebas de hipótesis (IBM
SPSS Statistics, 2014).
Cálculo de confiabilidad. Una muestra más de las múltiples ventajas que ofrece el SPSS es la
posibilidad de calcular la confiabilidad de un instrumento, lo cual, como ya se comentó en el
libro, se determina mediante diversas técnicas o métodos. El programa ofrece diferentes
coeficientes para llevar a cabo el cálculo, sin embargo la elección de éstos dependerá
nuevamente del nivel de medición utilizado en el instrumento de recolección de los datos.
En la barra de herramientas que se encuentra en la parte superior de la pantalla, se puede
ubicar el botón Analizar [1] y dentro de las opciones que se despliegan se incluye la de
Escala, [2] ésta a su vez ofrece dos alternativas de las cuales elegiremos Análisis de
fiabilidad [3].
Al pulsar Análisis de fiabilidad aparecerá un nuevo cuadro de diálogo con el mismo nombre,
dentro de éste a la izquierda se encuentra una caja en la que se incluyen las variables del
instrumento [1] de las cuales se deberán seleccionar aquellas que se pretenden analizar
(que conforman la escala) y pasarlas al cuadro de la derecha [2] por medio de la flecha azul,
[3] que ya nos debe ser familiar. Posterior a esto se tendrá que seleccionar el Modelo, que
se usará para el cálculo [4] y finalmente escribir la Etiqueta de escala [5], sin olvidar pulsar
el botón Aceptar [6]. Dentro del cuadro existe también la opción Estadísticos [7] la cual
permite solicitar estos sobre la escala analizada.
IMPORTAR datos a
herramientas
Correlación. Esta prueba también se puede llevar a cabo mediante el SPSS siguiendo los
pasos que a continuación se describen. Para iniciar, debemos pulsar el botón Analizar, el
cual ya hemos utilizado en anteriores ocasiones; al hacerlo se desplegarán de nuevo varias
opciones, entre las cuales daremos clic a la de Correlaciones, seleccionando la que se
requiera para el estudio.
Como ejemplo para este manual elegiremos
Bivariadas, por lo que como de costumbre se abrirá
un cuadro con el título de Correlaciones bivariadas.
En éste se encuentran de nuevo dos cajas, una a la
derecha [1] y la otra a la izquierda [2]. De la primera
seleccionaremos las variables sobre las que
queremos probar correlación, con la flecha azul [3]
pasaremos a la otra caja éstas, lo que nos indica que
sobre ellas se hará el análisis.
Paso seguido debemos elegir el Coeficiente de correlación [4] adecuado para el nivel de
medición de las variables y la Prueba de significancia o significación [5].
Otras ventajas que podemos aprovechar son las que se obtienen al pulsar Marcar las
correlaciones significativas [6], con lo que al ver los resultados de la prueba, el programa
nos señalará los coeficientes que son significativos; otras se consiguen dando clic en
Opciones [7], lo que nos brindará la posibilidad de solicitar Estadísticos [8] y el tratamiento
para Valores perdidos [9], no se debe olvidar pulsar Continuar [10] y Aceptar (11) según
sea el caso.
IMPORTAR datos a
herramientas
Las funciones de Estilo y Bootstrap también se ofrecen para las correlaciones, y tienen la
misma finalidad y uso explicados con anterioridad en este mismo manual.
IMPORTAR datos a
herramientas
IMPORTAR datos a
herramientas
Segmentar archivo
Esta herramienta sirve precisamente para lo que describe su nombre, y con el fin de
aprovecharla, se debe pulsar esta opción. Esto provocará que se abra una caja de diálogo
con el título Segmentar archivo. En ésta se ofrecen las opciones Analizar todos los casos [1],
comparar los grupos [2] y organizar los resultados por grupo [3], de las cuales nosotros
tendremos que elegir la que consideremos más conveniente para el estudio, sin olvidar
seleccionar la variable bajo la cual estarán basados los grupos [4], se recomienda elegir
solo una variable (por ejemplo género), finalmente no debemos olvidar pulsar el botón
Aceptar [5]. Con lo anterior, al solicitar los análisis que se requieran para el estudio, los
resultados se ofrecerán segmentados de acuerdo con lo que se haya indicado en este paso.
IMPORTAR datos a
herramientas
Elegir la tercera opción (Organizar los resultados por grupos), implica que al solicitar
cualquier análisis, los resultados producto de éste se ofrecerán también con base en la
variable seleccionada, pero no en una misma tabla sino por separado.
Se puede observar en la parte inferior izquierda de cada tabla que la segmentación está
hecha con base en la variable género y que se señala a cuál de estos corresponde cada una.
Finalmente, para quitar la segmentación habrá que abrir de nuevo la opción Segmentar
archivo y dar clic en Analizar todos los casos, no crear grupos.
IMPORTAR datos a
herramientas
Seleccionar casos
Esta opción permite seleccionar aquellos casos que sean de interés para el investigador por
alguna razón (ejemplo, casos extremos), y el SPSS lo hace mediante una función “if” o “si”;
la forma de hacerlo es similar a las anteriores, se debe pulsar el botón Seleccionar casos, lo
que abrirá una caja con el mismo nombre, en ésta nosotros debemos elegir el criterio de
selección, [1] así como el tratamiento que se le dará al resultado, [2] para finalmente dar
clic en Aceptar [3]. Para quitar esta selección lo único que habrá que hacer es pulsar en
Restablecer [4] y luego Aceptar.
IMPORTAR datos a
herramientas
Calcular variable
Esta opción resulta de vital importancia para aquellos estudios en los que se requiere
realizar cálculos para la interpretación de los resultados, por ejemplo una investigación
que midiera la satisfacción laboral, la cual constituye una variable compuesta de varios
ítems (columnas), por ejemplo: satisfacción respecto al superior, satisfacción en torno a la
jornada de trabajo, satisfacción sobre la capacitación recibida, satisfacción respecto a los
compañeros, etc. Entonces, los resultados solamente tienen sentido al sumar los valores de
los ítems que conforman a la variable de la investigación.
Satisfacción laboral = satisfacción respecto al superior + satisfacción en torno a la jornada
de trabajo + satisfacción sobre la capacitación recibida + satisfacción respecto a los
compañeros + satisfacción…
Para usar la herramienta de calcular, debemos pulsar el botón Transformar, [1] el cual se
encuentra a la derecha del que usamos anteriormente (Datos). Al hacerlo se abrirán de
nuevo una serie de opciones entre las que se encuentra Calcular variable, [2] que debemos
pulsar para abrir una caja de diálogo con el mismo nombre.
El cuadro de diálogo nos ofrece un espacio para nombrar la variable de destino, en este
caso “compuesta” (por ejemplo, satisfacción laboral), [1] debajo de éste se encuentra un
botón que al pulsarlo abre un nuevo cajón para definir el tipo de variable que se creará, así
como la etiqueta que llevará [2]. Lo mismo que en anteriores ocasiones, las variables
(ítems o columnas) se encuentran agrupadas en un mismo espacio para poder elegir con
cuáles de ellas se trabajará [3] Para hacerlo simplemente tendremos que seleccionarlas y
pasarlas al espacio en blanco (con ayuda de la flecha azul) [4] que se encuentra en la parte
superior derecha del cuadro, denominado Expresión numérica [5].
IMPORTAR datos a
herramientas
Asimismo debajo de éste se encuentran las funciones que nos permitirán establecer las
operaciones que llevaremos a cabo con las variables, para, con esto, crear una nueva
(compuesta) [6]. De igual forma el programa ofrece opciones como las llamadas Grupos de
variables [7] y la opción condicional [8]. Al terminar de realizar las acciones necesarias no
debemos olvidar presionar el botón Aceptar [9] para guardar los cambios realizados.
Referencias
- Cuevas, A. (2014). Introducción a SPSS. Manuscrito no publicado, Centro de Investigación de la
Universidad de Celaya en Guanajuato, México.
- IBM (2014). Background. Recuperado de http://www-
03.ibm.com/press/us/en/background.wss
- IBM SPSS Statistics (2014). ¿Por qué elegir IBM? Recuperado de http://www-
01.ibm.com/software/mx/analytics/spss/products/statistics/
- IBM SPSS Statistics (Edition 22) [Software de computación]. Chicago, IL, EE.UU.