SPSS Curso Básico

CURSO BSICO SPSS
Contedo
1. Inserir dados 2. Variveis Estatsticas e escalas de medida 3. Abertura de um ficheiro de dados 4. Estatstica Descritiva 4.1 Tabelas de Frequncias 4.2 Grficos 5. Coeficiente de Correlao de Pearson 6. Tabelas de Contingncia 7. Coeficiente de Correlao de Spearman 8. Distribuio Binomial e Normal no SPSS 9. Distribuio Binomial e Normal no SPSS 10. Testes de Hipteses no SPSS 10.1 Teste t de Student para o caso de uma amostra (TH para a mdia populacional) 10.2 THpara a diferena entre duas mdias populacionais 2 3 9 11 11 18 30 32 36 42 44 46 46 48
Sandra Ferreira
Pgina 1
CURSO BSICO SPSS

O objectivo deste material no apresentar todas as opes disponveis no SPSS, mas sim apresentar alguns comandos bsicos mais utilizados na prtica. . O manual integral deste programa, em ingls, pode ser encontrado, por exemplo, em: http://support.spss.com/ProductsExt/Statistics/Documentation/18/client/User%20Ma nuals/English/PASW%20Statistics%2018%20Core%20System%20User's%20Guide .pdf Ao gravar o seu trabalho no se esquea que ele estar dividido em duas partes: SPSS Data Editor (editor de dados) e Output (resultados) e ambas devero ser guardadas. Conhecimento bsico dos Menus
1. Inserir dados
Ao abrir o programa SPSS aparecer o ecr de abertura onde poder escolher uma opo. Para introduzir os dados, seleccione a opo Type in data; para abrir ficheiros de dados j existentes, seleccione a opo Open an existing data source; pode ainda seleccionar-se a opo Run the Tutorial de modo a visualizar algumas opes do programa. Pressione em Type in data ou em Cancel. Passar de imediato ao Editor de dados. Nesta janela, do lado esquerdo, logo em baixo, tm-se duas opes: Data View e Variable View, cada uma delas activa vez, conforme mostra a Figura 1:
Sandra Ferreira
Pgina 2
Figura 1: Janela principal do programa SPSS/ PASW.
2. Variveis Estatsticas e Escalas de Medida

Na opo Data View os dados so inseridos, mas comece primeiro por definir as variveis e s depois digite os dados. Na opo Variable View h opes tais como: Name: digite o nome da varivel. O programa s aceita letras minsculas, sem espaos e sem qualquer simbologia; tem no mximo 8 caracteres e deve comear por uma letra, podendo ser seguido por $, _ ,
Sandra Ferreira
Pgina 3
Type: Tipo de varivel: numeric (numrica), comma (vrgula), dot (ponto), scientific notation (notao cientfica), date (data), dollar (dlar), custom currency, string (qualitativa), width (amplitude) e Decimal places (nmero de casas decimais). Dever ser seleccionada a opo desejada e clique em OK. NOTA: No caso de codificar alguma varivel, mais tarde pode querer visualizar os dados originais. Para isso basta escolher no menu > View > Value Labels
Figura 1: Variable Type Decimals: digite o nmero de casas decimais com as quais deseja trabalhar; Label: digite o nome da varivel; Values: valor. Esta coluna reveste-se de extrema importncia quando as variveis so qualitativas, pois nesta coluna que so definidos os cdigos e a designao das respectivas categorias de cada varivel. Por exemplo, a varivel dieta equilibrada pode assumir dois valores ou categorias (1=Sim e 2=No);
Figura 2: Value Labels

Sandra Ferreira Pgina 4
Missing: possibilita a codificao e tratamento dos valores omissos da base de dados; Columns: permite definir a dimenso da coluna de cada varivel; Align (posio): left: esquerda; right: direita; center: centro. Measure: Tipo de medida: (scale) escalar; ordinal ou nominal. As Variveis quantitativas so aquelas cujos dados so valores numricos que expressam quantidades e podem ser classificadas em: - Variveis quantitativas discretas so aquelas em que os dados somente podem apresentar determinados valores, em geral, nmeros inteiros. - Variveis quantitativas contnuas so aquelas cujos dados podem apresentar qualquer valor dentro de um intervalo de variao possvel. As variveis qualitativas ou categricas podem ser medidas numa escala: Escala nominal: uma categoria difere de outra somente por meio da designao da categoria, no sendo possvel qualquer tipo de ordenao. Escala ordinal: possvel indicar diferentes categorias mas tambm reconhecer graus de intensidade entre elas, o que possibilita uma ordenao (que seja inerente varivel e no imposta por convenincia) das diferentes categorias.
Sandra Ferreira
Pgina 5
No quadro seguinte encontram-se os smbolos utilizados consoante os diferentes nveis de mensurao e tipo de valores, aquando da introduo de dados no software SPSS.
Sandra Ferreira
Pgina 6
Figura 3: Janela Variable View do programa SPSS
Missing values
Admita que num questionrio existem indivduos que no informaram sobre a sua idade. As idades devem ser recodificadas, atribuindo o valor 99 s no respostas. Se num questionrio existem perguntas especficas para grupos de indivduos, os restantes casos so vlidos e devem ser identificados como no respostas.
Figura 4: Missing Values
Sandra Ferreira
Pgina 7
Podemos ter valores omissos, por exemplo no resposta e erro de introduo dos valores. Quando aparece um espao em branco ou uma clula no preenchida o SPSS assume que esse valor omisso e faz todo o tratamento sem esse valor: se tivermos 20 dados mas uma clula for branca, os clculos, por exemplo, da mdia, sero feitos contando apenas 19 observaes. Imaginemos outro caso: temos a varivel idade com valores entre 1 e 85 anos. Se alguma pessoa no colocou a idade no inqurito ento colocamos, por exemplo, o nmero 99 para representar os indivduos que no disseram a idade, pois at 85 os valores so vlidos. Assim, h que informar o SPSS que essa idade tratada como um missing value, seno ser considerada vlida. Para transmitir essa informao vamos a Variable View no editor de dados e clicar em Missing. Na caixa de dilogo Missing Values seleccionar Discrete Missing Values e digitar o valor 99. Finalmente clicar em Ok para finalizar a atribuio do valor '99. Os valores desta varivel, especificados como missing values so excludos do tratamento estatstico dos dados e so tratados como um caso especial. No caso de dados no aplicveis habitual usar os valores 8, 88, ..., consoante os valores da varivel em causa.
Anlise com Missing Values

Suponhamos que queremos calcular as correlaes entre as pontuaes a trs temas: matemtica, cincia e leitura. Sero calculadas as correlaes: matemtica vs. Cincia, matemtica vs. Leitura e cincia e leitura. Se utilizarmos a opo pairwise deletion os casos que no tm casos vlidos em ambos os temas sero excludos dos clculos. Se utilizarmos listwise deletion os casos que no tiveram dados vlidos em todos os temas (i.e., em matemtica, cincia e leitura) so excludos dos clculos. Esta opo reduz assim o tamanho da amostra considerada na anlise e assegura que todos os clculos so efectuados com base no mesmo nmero de casos.
Sandra Ferreira
Pgina 8
3. Abrir um ficheiro de dados do EXCEL

necessrio que o Excel tenha os dados num formato que seja possvel o SPSS ler. Por exemplo, uma coluna com datas tem de ser alterada para dias, 1, 2, 3... e o nome das variveis s pode ter, no mximo, oito caracteres.
File Open ficheiro do tipo *.xls

Aparece uma opo de abertura, Read Variable Names, que se pode accionar. Colocando o intervalo de valores especificado podem ler-se os nomes das variveis da primeira linha do ficheiro.
Figura 5: Ficheiros importados do Excel Para abrir um ficheiro do Excel torna-se importante saber que: - a cada coluna corresponde uma varivel e primeira linha o nome de cada varivel;
Sandra Ferreira
Pgina 9
- em cada coluna os valores devem ser sempre do mesmo tipo: apenas datas, apenas nmeros, apenas texto, etc; - se numa coluna de valores numricos existirem clulas em branco, estes sero convertidos no sistema de valores omissos do SPSS. - caso existam dados noutras folhas, elas seriam identificadas e o utilizador apenas teria de escolher a folha e o range pretendidos.
Exemplo 1:
Considere a folha de clculo seguinte, criada no Excel:
Figura 6: Folha de clculo do Excel Para conseguir ler estes dados no Excel, proceda de acordo com o que foi dito anteriormente, no SPSS seleccione > File > Open > Data
Figura 7: Importao de dados do Excel

Figura 8: Deteco de dados no SPSS e visualizao Podemos concordar ou definir um novo intervalo de dados, e assim os dados passam a poder ser visualizados no SPSS.
4. Estatstica Descritiva 4.1 Tabelas de Frequncias Exemplo 2: (ver exemplo 1.8 da sebenta, pg. 12)
Considere os dados seguintes relativos s alturas, em cm, de 25 atletas de maratona: 157, 190, 174, 183, 174, 176, 168, 169, 167, 157, 163, 170, 172 171, 178, 173, 166, 165, 175, 176, 186, 169, 177, 176, 191 Passos a seguir para a construo de uma tabela de frequncias de dados agrupados no SPSS:
Sandra Ferreira
Pgina 11
1) escolher o menu > Transform > Visual Binning e seleccionar a varivel que se pretende agrupar em bins (classes ou novas categorias) e depois seleccione o boto Continue;
Figura 9: Agrupamento em novas classes 2) na janela Visual Binning escolher o nome da Binned Variable podendo alterar o Label. Inserir em Value os valores de cutpoints (valores requeridos para separao das classes inseridos abaixo na clula HIGH, um a um, seguido de ENTER). No nosso caso esses valores so, respectivamente: 157, 163,169, 175, 181 e 187 3) De acordo com a frmula de Sturges temos k = 6 classes. A amplitude, ai = 5,666 que vamos considerar 6 pois ao arredondarmos por excesso a amplitude obtida temos a certeza de que todos os valores estaro contidos nas classes. 4) Seguidamente seleccionar Excluded (<) de modo a que o intervalo da classe esteja aberto direita ([, [). Seguidamente carregar na opo Make Labels e OK;
Sandra Ferreira
Pgina 12
Figura 10: Introduo Dos valores das classes 5) Aparecer uma mensagem Binning specifications will create 1 variables. Clique OK;
Figura 11: Criao de uma nova varivel 6) Na janela de Edio de dados, aparecer a nova varivel; 7) Para realizar o histograma, de modo a visualizar as classes, seleccione no menu > Graphs > Chart Editor (ou Graph Builder ) > Gallery > Histogram; 8) Como o SPSS considera os bins como categorias, o histograma assemelhase a um grfico de barras, logo para que as classes fiquem adjacentes devemos
clicar duas vezes em cima de uma das barras e em Bar Options aumentar o espaamento das barras para 100. A tabela de frequncias obtida atravs do Output do SPSS dada por:
Figura 9: Output do SPSS indicando a tabela de frequncias Polgono de frequncias, que se encontra unindo os pontos mdios das classes:
Sandra Ferreira
Pgina 14
Exemplo 3:
Na opo Data View digite os dados correspondentes ao exemplo referido abaixo. Foi observada uma amostra de 10 atletas do sexo feminino com idades compreendidas entre os 15 e os 20 anos, nas quais tinha sido diagnosticada anemia. Relativamente a cada uma das atletas, durante a permanncia numa unidade hospitalar, foi registada a seguinte informao:
N Ordem 1 2 3 4 5 6 7 8 9 10 Dieta Equilibrada 1 1 2 1 1 2 1 2 2 1 Intensidade dos Treinos 2 3 1 2 3 1 1 1 3 1 Nvel de ferro (mg) 14,3 7,8 27 11 9,9 14,5 15,4 20,8 10,5 15,9
Sendo a varivel nvel de ferro quantitativa contnua e assumindo tantos valores diferentes, a respectiva tabela de frequncias, tal como apresentada, no facilita uma leitura rpida da informao. Assim, deveremos proceder categorizao da varivel, ou seja, transformao da varivel em varivel qualitativa organizada em classes. Vamos considerar, a ttulo de exemplo, que se constroem duas classes a partir dos dados de que dispomos. Para isso fazemos: > Transform > Recode into different Variables > Old and new Values
Sandra Ferreira
Pgina 15
Figura 12: > Recode into different Variables > Change A primeira classe congrega os indivduos com valores de nvel de ferro menores ou iguais a 14,7 mg (valor correspondente media do nvel de ferro). A segunda integra os indivduos com valores do nvel de ferro superiores a 14,7 mg. Esta operao realiza-se do seguinte modo: identificamos a varivel que se pretende classificar (nvel ferro), atribuindo nova varivel um nome (classes_nferro). Atribui-se um label (nvel de ferro [classes]) e depois pressionamos o boto Old and New Values. Na janela Recode into different Variables damos a indicao ao SPSS do critrio a seguir para a constituio das classes. No nosso exemplo, atribumos primeira classe o cdigo numrico 1 clicando em value, associando-o aos indivduos com valores de nvel de ferro menores ou iguais a 14,7 mg (colocar em range 0 e through 14,7). O procedimento o mesmo para definir a segunda classe. Depois pressione Continue e seguidamente clique Change (depois de atribuir o novo nome classes_nferro) varivel em Output variable > Name.
Sandra Ferreira
Pgina 16
Figura 13: > Old and New Values acrescentada base de dados original uma nova varivel (classes_nferro). Esta varivel no est ainda configurada. Para tal necessrio recolher folha variable view. Pode agora considerar-se o nmero de casa decimais igual a zero, preencher a coluna values com os respectivos cdigos e por fim designar correctamente a escala de medida da varivel (ordinal).
Figura 14: Acrescentar a nova varivel no Variable View
Sandra Ferreira
Pgina 17
Pode representar-se a distribuio de frequncias da nova varivel atravs de uma tabela de frequncias, obtidas em > Analyze > Descriptive Statistics > Frequencies Display Frequency Tables, conforme se mostra seguidamente:
Figura 15: Output do SPSS indicando a tabela de frequncias
4.2 Grficos
Na barra de ferramentas seleccione: > Graphs > Interactive onde possvel escolher o modelo de grfico desejado e format-lo. > Graphs > bar (grfico de barras) escolha uma das opes: Simple (grfico de barras simples), Clustered (grfico de barras agrupadas) ou Stacked (grfico de barras em pilhas).
[Seleccione tambm a opo de como os dados e devero apresentar no grfico: Sumaries for groups of cases (soma por grupo de casos), Sumaries of separate variables (soma das variveis separadas) e Values of individual cases (valores individuais dos casos) e clique em > define.] A
> Graphs > line (grfico de linhas) escolha uma das opes: Simple (grfico de linhas simple), Multiple (grfico de vrias linhas) ou Drop-line (grfico de linhas pequenas). Ver A acima. > Graphs > area (grfico de rea) escolha uma das opes: Simple (grfico de rea simples), ou Stacked (grfico de reas em pilhas). Ver A acima.
Sandra Ferreira
Pgina 18
> Graphs > Pie (grfico de pizza) Ver A acima. > Graphs > high law (grfico de pontos altos e baixos) escolha uma das opes: Simple high law close (), Clustered high law close (), Difference line (), Simple range bar () ou Clustered range bar (). Ver A acima. H ainda outras opes de grficos, tais como: Pareto, Control, Boxplot, Error Bar, Scatter, Histograma, P-P, Q-Q, Sequence, ROC curve, Time series. Destes, os grficos Boxplot, Scatter e Histogram so bastante utilizados e por isso sero aqui especificados. > Graphs > Boxplot Escolha uma das opes: Simple (boxplot simples) ou Clustered (boxplot agrupado). Ver A acima.
O grfico circular correspondente ao Exemplo 2, obtm-se atravs de:

>Graphs > Legacy Dialogs > Pie > Define Slices by (colocar Intensidade dos treinos e % of cases) e apresentar-se- o seguinte grfico:
Sandra Ferreira
Pgina 19
Exemplo 4: Abra o separador Data View

se referem s idades de 20 estudantes.
e introduza os valores seguintes que
Figura 15: Introduo dos dados Fazendo > Analyze > Descriptive Statistics > Frequencies, e aps premir o boto OK, abre-se uma nova janela (Output) onde surge a tabela de frequncias pretendida. Para construr um grfico de barras, na barra de menus, seleccione: >Graphs > Interactive > Bar Transporte a varivel Idade da lista da esquerda para o campo referente s abcissas do grfico (mantendo no eixo das ordenadas a frequncia absoluta) (Count)
Sandra Ferreira
Pgina 20
Para construir um grfico circular, na barra de menus, seleccione: >Graphs > Interactive > Pie Ao transportar a varivel Idade da lista da esquerda para o campo referente aos sectores do grfico, aparece um aviso onde proposta a converso da varivel Idade para o tipo qualitativo, passando cada valor da varivel a ser tratado como uma categoria:
Figura 16: Converso
Sandra Ferreira
Pgina 21
Aceitando a converso, (Convert), a varivel surge no campo referente aos sectores do grfico, prima OK e aparece na janela de Output o grfico pretendido:
Premindo duas vezes o boto esquerdo do rato sobre o grfico, abre-se o editor, tornando-se possvel alterar algumas das suas caractersticas. Para calcular a mdia, moda ou mediana, na barra de menus, seleccione: >Analyze > Descriptive Statistics > Frequencies Transporte a varivel Idade da lista esquerda para a lista Variable(s) e prima o boto Statistics. A sero apresentadas vrias listas de medidas estatsticas, podendo seleccionar, por exemplo, a mdia. Na lista das medidas de disperso pode calcular a varincia (Variance) e o desvio padro (Std. Deviation). NOTA: No SPSS, os valores apresentados referem-se varincia e ao desvio padro corrigidos, sendo este ltimo dado por:
Sandra Ferreira
Pgina 22
MDIA, MEDIANA, MODA, SOMA, DESVIO-PADRO, AMPLITUDE, MNIMO E MXIMO da varivel IDADE:
VARINCIA,
Figura 17: Seleco da mdia, moda, mediana, Na lista das medidas de forma da distribuio (Distribution), para calcular o coeficiente de assimetria seleccione (Skewness). NOTA: A medida de assimetria usada pelo SPSS
Sandra Ferreira
Pgina 23
classificando-se a assimetria em funo do seu sinal:
distribuio simtrica g1 = 0
distribuio assimtrica positiva g1 > 0
distribuio assimtrica negativa g1 < 0

Para calcular o Coeficiente de achatamento (curtose), na barra de menus, seleccione (Kurtosis). NOTA: O Coeficiente de achatamento usado pelo SPSS
classificando-se a distribuio em funo do seu sinal:
distribuio mesocrtica g2 = 0 distribuio platicrtica g2 < 0 distribuio leptocrtica g2 > 0
Se quiser calcular o 25 percentil, Q1, na barra de menus, seleccione: >Analyze > Descriptive Statistics > Frequencies
Transporte a varivel da lista esquerda para a lista Variable(s) e retire a opo Display frequency tables. De seguida prima o boto Statistics. Na lista dos percentis (Percentile Values) seleccione a opo Percentile(s), preenchendo o campo com o valor 25. Prima a tecla Add. O valor 25 muda para a lista onde possvel incluir outros valores de percentis que se pretendam calcular. Premindo Continue volta-se caixa anterior. Seleccione OK e apresentado, no Output, o valor do 25 percentil. Para construir um diagrama de extremos e quartis, (tambm conhecida por caixa de bigodes) na barra de menus, seleccione: >Graphs > Interactive > Boxplot Transporte a varivel da lista da esquerda para o campo referente varivel dependente e escolha a orientao do diagrama (vertical ou horizontal). Premindo OK apresentado o diagrama de extremos e quartis na janela de Output:
O conjunto dos valores da amostra compreendidos entre o 1 e o 3 quartis, que se representam por Q1/4 e Q3/4, respectivamente, representado por um rectngulo com a mediana indicada por uma barra, onde a largura pode ser qualquer. O extremo inferior o mnimo da amostra, enquanto que o extremo superior o mximo da amostra. Este tipo de grfico reala informao importante sobre os dados e d-nos uma ideia da simetria ou enviesamento e da sua maior ou menor concentrao.
Sandra Ferreira
Pgina 25
Sugesto: Relembre a denominao de Outlier:

outlier moderado outlier severo
*
Q1 Q2=Me Q3
b1=Q1-1,5Q Q=Q3-Q1 B1=Q1-3Q
b2=Q3+1,5Q
B2=Q3+3Q
Sandra Ferreira
Pgina 26
Exemplo 5: Relativamente aos dados do exemplo 2, calculemos as medidas de

tendncia central e as medidas de disperso respectivas:
Statistics alt N Valid Missing Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles 25 50 75 25 0 172,92 173,00 176 8,631 74,493 ,289 ,464 ,246 ,902 34 157 191 4323 167,50 173,00 176,50
DADOS AGRUPADOS EM CATEGORIAS Exemplo 6:

Num inqurito a famlias portuguesas, referente ao nmero de filhos a cargo de cada famlia, obtiveram-se os seguintes resultados:
Sandra Ferreira
Pgina 27
Figura 18: Insero dos dados Para transmitirmos ao SPSS que existe uma varivel (n alunos) que est a ser ponderada, pesada por uma outra varivel que representa uma frequncia, seleccione > Data > Weight Cases onde surgir a janela abaixo; ser necessrio seleccionar qual a varivel que representa a frequncia.
Figura 19: Seleco da varivel que representa a frequncia
Sandra Ferreira
Pgina 28
Figura 20: Utilizao da opo Statistics para calcular a mdia,

Statistics n_filhos N Valid Missing Mean 250 0 4,2400
Neste caso a mdia de filhos obtida de 4,24 filhos. Se quisssemos desenhar o boxplot referente ao nmero de filhos, recorramos aos seguintes comandos em SPSS: > Graphs > Legacy Dialogs > Boxplot > OK.
Figura 21: Boxplot referente varivel nmero de filhos Observamos que os bigodes so os extremos, correspondentes ao 1 e 3 quartil e o rectngulo divido pela mediana, neste caso igual a 4,5.
5. Coeficiente de Correlao de Pearson

A correlao mede a variao entre variveis (para variveis quantitativas) ou a ordem dessas variveis (para variveis ordinais). O coeficiente de Correlao linear de Pearson dado por:
rx y =
s xy s xx s yy
Valor de r : - vlido somente para a amplitude de variao de x e y observada na amostra, no podendo ser extrapolada; -No reflecte necessariamente uma relao de causa e efeito, por isso, interpreta-se o valor de r em associao com o coeficiente de determinao (r2 potncia quadrada do valor de r). -O coeficiente de determinao (r2) representa a proporo de variao de x que pode ser atribuda sua relao com y. Analisemos este ponto com um exemplo.
Exemplo 7:
Voltemos aos dados do exemplo 2. Na barra de menus escolher: >Analyze > Correlate > Bivariate Em Correlation Coefficients, seleccione o coeficiente pretendido: neste caso Pearson (seleccione Pearson quando as variveis so quantitativas e tm distribuio normal). Seleccione Kendalls tau-b ou Spearman quando as variveis so ordinais ou no tm distribuio normal.
Sandra Ferreira
Pgina 30
Caso se seleccione Flag significant correlations, as correlaes significativas ao nvel de 0,05 so assinaladas com um asterisco, e as correlaes significativas ao nvel de 0,01 so assinaladas com dois asteriscos.
Prima OK.
Figura 22: Seleco do coeficiente de Pearson

Correlations alt alt Pearson Correlation Sig. (2-tailed) N idades Pearson Correlation Sig. (2-tailed) N 25 -,437* ,029 25 25 1 idades -,437* ,029 25 1
*. Correlation is significant at the 0.05 level (2-tailed).
Figura 23: Output da tabela que indica o coeficiente de Pearson
Sandra Ferreira
Pgina 31
Interpretao dos resultados: Os coeficientes de correlao podem variar entre -1 (uma associao negativa perfeita) e +1 (uma associao positiva perfeita). Assim, a correlao entre a idade e a altura significativa a 5% (est assinalada com um asterisco). uma correlao negativa, o que indica que a uma pessoa que seja mais velha (mais idade) est associada menor altura.
6. TABELAS DE CONTINGNCIA
Se as variveis so de natureza ordinal ou nominal e os valores se referem ao nmero ou frequncia de casos que se situam em cada possvel efectuar tabelas de contingncia ou cruzadas (comando Crosstabs). Nas tabelas de contingncia podem cruzar-se variveis pertencentes ao mesmo fenmeno, de modo a perceber as caractersticas mais importantes que o compem, ou cruzar-se variveis pertencentes a fenmenos diferentes, de forma a verificar a existncia de relaes de dependncia. Seleccione a primeira varivel e insira em Row, clicando na seta. Seleccione a segunda varivel Columns. Se houver uma terceira varivel, insira-a na terceira janela utilizando a respectiva seta (caso tenha mais variveis, para inseri-la clique antes em NEXT). > Analyze > Descriptive Statistics > Crosstabs Nesta janela ainda possvel optar por: Statistics Cells Format
Sandra Ferreira
Pgina 32
Em >Analyze > Descriptive Statistics > Crosstabs > Statistics temos as opes: Chi-square: teste estatstico no paramtrico; Correlations: apresenta os resultados das correlaes de Pearson e Spearman; Nominal: teste para varivel nominal; Ordinal: testes para varivel ordinal; Nominal com intervalo: testes para varivel nominal com intervalo.
Em >Analyze > Descriptive Statistics > Crosstabs > Cells temos as opes: Count: soma ou estimativa -observado -esperado Percentages: percentagens -Row (linha) -Column (colunas) -Total Residuals -Unstandardized -Standardized -Adj. Standardized Em >Analyze > Descriptive Statistics > Crosstabs > Format temos as opes: Row order (ordem das linhas) -Ascending -Descending
Exemplo 8:
Para construir uma tabela de contingncia mais completa que contemple as possibilidades atrs mencionadas necessrio primeiro que tudo fazer uma transformao na varivel idades para classes. Recorremos novamente ao exemplo 2, e utilizemos novamente os comandos do exemplo 3: > Transform > Recode into different Variables > Old and new Values
Na janela Recode into different Variables damos a indicao ao SPSS do critrio a seguir para a constituio das classes. No nosso exemplo, atribumos primeira classe o cdigo numrico 1 clicando em value, associando-o aos indivduos com idades entre 18 e 23 anos. Depois o procedimento o mesmo para definir a segunda classe que se refere s idades entre 24 e 29 anos e por a fora. Pressione Continue e seguidamente clique Change (depois de atribuir o novo nome classes_idades) varivel em Output variable > Name.
Figura 24: > Transform > Recode into different Variables > Old and new Values
Para realizarmos o cruzamento das variveis alturas (em classes) e a idade (em classes), considerando os dados do exemplo 2, utilizamos os comandos: >Analyze > Descriptive Statistics > Crosstabs > Cell Display O Output seguinte mostra esse cruzamento, dado que foram seleccionadas as percentagens s das linhas (seleccione Row em Cells):
alturas (Binned) * idadesclasses Crosstabulation idadesclasses 1,00 alturas (Binned) <163 Count % within alturas (Binned) 163-168 Count % within alturas (Binned) 169-174 Count % within alturas (Binned) 175-180 Count % within alturas (Binned) 181-186 Count % within alturas (Binned) 187+ Count % within alturas (Binned) Total Count % within alturas (Binned) 12 48,0% 3 12,0% 2 8,0% 5 20,0% 2 8,0% 1 4,0% 25 100,0% 2 100,0% 0 ,0% 0 ,0% 0 ,0% 0 ,0% 0 ,0% 2 100,0% 1 50,0% 0 ,0% 1 50,0% 0 ,0% 0 ,0% 0 ,0% 2 100,0% 2 33,3% 2 33,3% 1 16,7% 1 16,7% 0 ,0% 0 ,0% 6 100,0% 4 50,0% 0 ,0% 0 ,0% 4 50,0% 0 ,0% 0 ,0% 8 100,0% 3 60,0% 1 20,0% 0 ,0% 0 ,0% 1 20,0% 0 ,0% 5 100,0% 0 ,0% 2,00 0 ,0% 3,00 0 ,0% 4,00 0 ,0% 5,00 1 50,0% 6,00 1 Total 2
50,0% 100,0%
Sandra Ferreira
Pgina 35
A ttulo de exemplo, podemos analisar que 50% dos atletas com menos de 163 cm tm idades entre 42 e 47 anos e entre 48 e 53 anos, respectivamente. No geral, 48% dos atletas tm idades entre 18 e 23 anos.
7. Regresso Linear Simples

O modelo de regresso linear simples, (RLS), analisa a relao entre duas variveis de natureza quantitativa X e Y. Pretende-se explicar Y em funo de X e determinar os parmetros da recta que melhor descreve a relao entre s variveis. Todas as previses de Y a partir de X so previses em mdia e existem factores que influenciam a varivel dependente X e no esto especificados no modelo, que se incluem na varivel aleatria.
Exemplo 9:
Um investigador pretende estudar o comportamento de Staphilococcus aureus, Y, em frango, mantido sob condies de congelamento domstico (-18C) ao longo do tempo, X (dias). Vamos encontrar o modelo de regresso do tempo sobre a populao de bactrias. Tempo (X) Populao (Y) 0 3,114 7 3,568 14 2,845 21 3,079 28 2,699 35 2,663 (in John Neter; Michael H. Kutner; Christopher J. . Applied Linear Regression Models. Nachtsheim & William Wassermam. IRWIN, 3. ed., 1996. ) Introduza os dados. De seguida v folha variable view e designe correctamente o nome e a escala de medida de cada varivel (neste caso scale).
Para construir um diagrama de disperso, na barra de menus, seleccione > Graphs > Legacy Dialogs > Interactive > Scatterplot Aberta a caixa de dilogo Create Scatterplot, no menu Assign Variables, transporte, da lista esquerda, a varivel (independente) Tempo para o campo referente ao eixo das abcissas e a varivel (dependente) Populao para o campo referente ao eixo das ordenadas. No menu Fit, seleccione None. Premindo a tecla OK apresentado o seguinte diagrama de disperso na janela de Output:
Figura 23: Output ( Scatterplot) Para obter a equao da recta de mnimos quadrados, na barra de menus seleccione: >Analyze > Regression > Linear... Transporte, da lista esquerda, a varivel (independente) Tempo e a varivel (dependente) Populao para os campos correspondentes. Seleccione Statistics.
Sandra Ferreira
Pgina 37
Na caixa que agora aparece seleccione as opes Estimates (estimadores dos coeficientes a e b) e Model Fit (Valores de r e r2).
Figura 24: >Analyze > Regression > Linear Premindo Continue volta-se caixa anterior. Seleccionando a tecla OK so apresentados, na janela de Output, os valores dos parmetros a e b assim como os coeficientes de correlao e de determinao (r e r2).
Coefficientsa Standardized Unstandardized Coefficients Model 1 (Constant) Tempo a. Dependent Variable: populao B 3,325 -,019 Std. Error ,186 ,009 -,733 Coefficients Beta t 17,887 -2,154 Sig. ,000 ,098
Model Summary
Sandra Ferreira
Pgina 38
Adjusted R Model 1 R ,733a R Square ,537 Square ,421
Std. Error of the Estimate ,256860
a. Predictors: (Constant), Tempo
Nota: tambm possvel incluir, no diagrama de disperso, a recta de regresso e o valor de r2. Para isso, seleccione, tal como antes, Graphs > Legacy Dialogs > Interactive > Scatterplot No menu Fit, da caixa de dilogo Scatter Plot, escolha Regression na lista Method e seleccione Include constant in equation.
Figura 25: > Graphs > Interactive > Scatterplot
Sandra Ferreira
Pgina 39
Figura 26: Output (Scatterplot)
Clculo dos Valores Estimados

Os valores estimados da funo de regresso so dados por:
= 3,325 0,019 X Y
Interpretando o parmetro b, (interseco da recta com o eixo dos Ys): pode dizer-se que para um tempo nulo, o aumento mdio da populao de 3,325 ufc/cm2. Interpretando a, (inclinao da recta): por cada aumento de uma unidade de tempo, a populao decresce, em mdia, 0,019 ufc/cm2 .
Os valores de Y revistos pelo Mtodo dos mnimos quadrados para as h observaes iniciais, designados por PRE_1, obtm-se na opo Save do comando de regresso escolhendo Predicted Values > Unstandardizes > Continue > OK:
Sandra Ferreira
Pgina 40
Figura 27: >Analyze > Unstandardizes
Regression > Linear > Save > Predicted Values >
Figura 28: Output
Sandra Ferreira
Pgina 41
Agora poderemos obervar que, calculando para x =21 obtemos uma populao mdia de 2,929 ufc/cm2 . Se quisssemos acrescentar base de dados uma nova observao, digamos para o tempo X = 40 e correndo de novo todas as observaes iniciais, PRE_2 igual a PRE_1, pela simples leitura do novo caso. Caso PRE_2 fosse diferente de PRE_1 teria obrigatoriamente de proceder-se ao clculo manual do consumo previsto.
8. Coeficiente de Correlao de Spearman

O teste de correlao ordinal de Spearman constitui a alternativa no paramtrica do coeficiente de correlao. Utiliza-se quando a distribuio no normal.
Exemplo 10:
Um fisioterapeuta desenvolveu um estudo sobre a capacidade funcional de pacientes com determinada patologia, antes e depois do tratamento adequado. Para tal, recolheu uma amostra de 14 pacientes em que utilizou um ndice, denominado ndice de Bartel, IB. O IB quantifica a capacidade funcional e varia do 0, (totalmente dependente), a 100, (totalmente independente), antes e depois do tratamento. Resoluo: Na barra de menus seleccione > Analyze > Correlate > Bivariate (escolher Spearman)
Sandra Ferreira
Pgina 42
Observamos que existe uma correlao forte entre as variveis, ou seja, quanto maior for o valor do IB antes do tratamento, maior ser, em mdia, o IB depois do tratamento.
Sandra Ferreira
Pgina 43
9. Distribuio Binomial e Normal no SPSS

Exemplo 11:
Considerando novamente o exemplo dos 25 atletas qual a probabilidade de que 20 corredores atinjam o final, uma vez que a probabilidade de que os corredores no abandonem as provas de 0,7? Seja X a v.a. que designa o n de corredores que no abandonam a prova, em 25, com uma probabilidade de sucesso de 0.7. X ~B(25;0.7) No SPSS para calcular probabilidades de uma distribuio discreta utilizamos a funo massa de probabilidade f(x)=P(X= x) e obtemos os valores no menu > Transform > Compute Variable Insira uma varivel na janela Target Variable > Function Group (PDF & Noncentral PDF) > Pdf.Binom (preencha os campos da funo) > OK. Obtemos a probabilidade pretendida: P(X=20)=0,10
Figura 25: > Transform > Compute Variable (dist. binomial) Se quisssemos calcular P(X<2), considerando uma distribuio normal, faramos: que nos devolveria o valor 0,98.
Sandra Ferreira
Pgina 44
Figura 26: > Transform > Compute Variable(dist. normal) O grupo PDF & Noncentral PDF contm as funes de distribuio pontuais f(x), referindo-se s funes de massa de probabilidade (no caso discreto) e densidade (no caso contnuo), para distribuies simtricas ou assimtricas. O grupo CDF & Noncentral CDF contm as funes de distribuio cumulativas F(x), para distribuies simtricas ou assimtricas.
Sandra Ferreira
Pgina 45
10. Testes de Hipteses no SPSS

10.1 Teste t de Student para o caso de uma amostra (Teste de hipteses para a mdia populacional) Exemplo 12:
Quinze alunos foram inquiridos quanto ao seu grau de satisfao (numa escala de 0 a 100) em relao sua Universidade, obtendo-se os seguintes resultados: 75 60 55 80 52 90 60 91 72 58 77 80 66 40 62 Teste a hiptese de que a mdia 72, sendo =5%. Resoluo usando o SPSS:
Sandra Ferreira
Pgina 46
Sandra Ferreira
Pgina 47
10.2
Sandra Ferreira
Pgina 48
Sandra Ferreira
Pgina 49
Sandra Ferreira
Pgina 50
Sandra Ferreira
Pgina 51
Sandra Ferreira
Pgina 52
Interpretao: O valor da estatstica do teste 3.174.
Sandra Ferreira
Pgina 53

SPSS Curso Básico

Enviado por

Direitos autorais:

Formatos disponíveis

SPSS Curso Básico

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

SPSS Curso Básico

Enviado por

Direitos autorais:

Formatos disponíveis

CURSO BSICO SPSS

CURSO BSICO SPSS

Figura 1: Janela principal do programa SPSS/ PASW.

2. Variveis Estatsticas e Escalas de Medida

Figura 2: Value Labels

Figura 3: Janela Variable View do programa SPSS

Figura 4: Missing Values

Anlise com Missing Values

3. Abrir um ficheiro de dados do EXCEL

File Open ficheiro do tipo *.xls

Considere a folha de clculo seguinte, criada no Excel:

Figura 7: Importao de dados do Excel

Figura 14: Acrescentar a nova varivel no Variable View

Figura 15: Output do SPSS indicando a tabela de frequncias

O grfico circular correspondente ao Exemplo 2, obtm-se atravs de:

Exemplo 4: Abra o separador Data View

e introduza os valores seguintes que

Figura 16: Converso

classificando-se a assimetria em funo do seu sinal:

distribuio assimtrica positiva g1 > 0

distribuio assimtrica negativa g1 < 0

classificando-se a distribuio em funo do seu sinal:

distribuio mesocrtica g2 = 0 distribuio platicrtica g2 < 0 distribuio leptocrtica g2 > 0

Sugesto: Relembre a denominao de Outlier:

b1=Q1-1,5Q Q=Q3-Q1 B1=Q1-3Q

Exemplo 5: Relativamente aos dados do exemplo 2, calculemos as medidas de

DADOS AGRUPADOS EM CATEGORIAS Exemplo 6:

Figura 19: Seleco da varivel que representa a frequncia

Figura 20: Utilizao da opo Statistics para calcular a mdia,

5. Coeficiente de Correlao de Pearson

Figura 22: Seleco do coeficiente de Pearson

*. Correlation is significant at the 0.05 level (2-tailed).

Figura 23: Output da tabela que indica o coeficiente de Pearson

7. Regresso Linear Simples

Adjusted R Model 1 R ,733a R Square ,537 Square ,421

Std. Error of the Estimate ,256860

a. Predictors: (Constant), Tempo

Figura 25: > Graphs > Interactive > Scatterplot

Figura 26: Output (Scatterplot)

Clculo dos Valores Estimados

Figura 27: >Analyze > Unstandardizes

Regression > Linear > Save > Predicted Values >

Figura 28: Output

8. Coeficiente de Correlao de Spearman

9. Distribuio Binomial e Normal no SPSS

10. Testes de Hipteses no SPSS

Interpretao: O valor da estatstica do teste 3.174.

Você também pode gostar