SPSS Curso Básico
SPSS Curso Básico
SPSS Curso Básico
Contedo
1. Inserir dados 2. Variveis Estatsticas e escalas de medida 3. Abertura de um ficheiro de dados 4. Estatstica Descritiva 4.1 Tabelas de Frequncias 4.2 Grficos 5. Coeficiente de Correlao de Pearson 6. Tabelas de Contingncia 7. Coeficiente de Correlao de Spearman 8. Distribuio Binomial e Normal no SPSS 9. Distribuio Binomial e Normal no SPSS 10. Testes de Hipteses no SPSS 10.1 Teste t de Student para o caso de uma amostra (TH para a mdia populacional) 10.2 THpara a diferena entre duas mdias populacionais 2 3 9 11 11 18 30 32 36 42 44 46 46 48
Sandra Ferreira
Pgina 1
1. Inserir dados
Ao abrir o programa SPSS aparecer o ecr de abertura onde poder escolher uma opo. Para introduzir os dados, seleccione a opo Type in data; para abrir ficheiros de dados j existentes, seleccione a opo Open an existing data source; pode ainda seleccionar-se a opo Run the Tutorial de modo a visualizar algumas opes do programa. Pressione em Type in data ou em Cancel. Passar de imediato ao Editor de dados. Nesta janela, do lado esquerdo, logo em baixo, tm-se duas opes: Data View e Variable View, cada uma delas activa vez, conforme mostra a Figura 1:
Sandra Ferreira
Pgina 2
Sandra Ferreira
Pgina 3
Type: Tipo de varivel: numeric (numrica), comma (vrgula), dot (ponto), scientific notation (notao cientfica), date (data), dollar (dlar), custom currency, string (qualitativa), width (amplitude) e Decimal places (nmero de casas decimais). Dever ser seleccionada a opo desejada e clique em OK. NOTA: No caso de codificar alguma varivel, mais tarde pode querer visualizar os dados originais. Para isso basta escolher no menu > View > Value Labels
Figura 1: Variable Type Decimals: digite o nmero de casas decimais com as quais deseja trabalhar; Label: digite o nome da varivel; Values: valor. Esta coluna reveste-se de extrema importncia quando as variveis so qualitativas, pois nesta coluna que so definidos os cdigos e a designao das respectivas categorias de cada varivel. Por exemplo, a varivel dieta equilibrada pode assumir dois valores ou categorias (1=Sim e 2=No);
Missing: possibilita a codificao e tratamento dos valores omissos da base de dados; Columns: permite definir a dimenso da coluna de cada varivel; Align (posio): left: esquerda; right: direita; center: centro. Measure: Tipo de medida: (scale) escalar; ordinal ou nominal. As Variveis quantitativas so aquelas cujos dados so valores numricos que expressam quantidades e podem ser classificadas em: - Variveis quantitativas discretas so aquelas em que os dados somente podem apresentar determinados valores, em geral, nmeros inteiros. - Variveis quantitativas contnuas so aquelas cujos dados podem apresentar qualquer valor dentro de um intervalo de variao possvel. As variveis qualitativas ou categricas podem ser medidas numa escala: Escala nominal: uma categoria difere de outra somente por meio da designao da categoria, no sendo possvel qualquer tipo de ordenao. Escala ordinal: possvel indicar diferentes categorias mas tambm reconhecer graus de intensidade entre elas, o que possibilita uma ordenao (que seja inerente varivel e no imposta por convenincia) das diferentes categorias.
Sandra Ferreira
Pgina 5
No quadro seguinte encontram-se os smbolos utilizados consoante os diferentes nveis de mensurao e tipo de valores, aquando da introduo de dados no software SPSS.
Sandra Ferreira
Pgina 6
Missing values
Admita que num questionrio existem indivduos que no informaram sobre a sua idade. As idades devem ser recodificadas, atribuindo o valor 99 s no respostas. Se num questionrio existem perguntas especficas para grupos de indivduos, os restantes casos so vlidos e devem ser identificados como no respostas.
Sandra Ferreira
Pgina 7
Podemos ter valores omissos, por exemplo no resposta e erro de introduo dos valores. Quando aparece um espao em branco ou uma clula no preenchida o SPSS assume que esse valor omisso e faz todo o tratamento sem esse valor: se tivermos 20 dados mas uma clula for branca, os clculos, por exemplo, da mdia, sero feitos contando apenas 19 observaes. Imaginemos outro caso: temos a varivel idade com valores entre 1 e 85 anos. Se alguma pessoa no colocou a idade no inqurito ento colocamos, por exemplo, o nmero 99 para representar os indivduos que no disseram a idade, pois at 85 os valores so vlidos. Assim, h que informar o SPSS que essa idade tratada como um missing value, seno ser considerada vlida. Para transmitir essa informao vamos a Variable View no editor de dados e clicar em Missing. Na caixa de dilogo Missing Values seleccionar Discrete Missing Values e digitar o valor 99. Finalmente clicar em Ok para finalizar a atribuio do valor '99. Os valores desta varivel, especificados como missing values so excludos do tratamento estatstico dos dados e so tratados como um caso especial. No caso de dados no aplicveis habitual usar os valores 8, 88, ..., consoante os valores da varivel em causa.
Sandra Ferreira
Pgina 8
Figura 5: Ficheiros importados do Excel Para abrir um ficheiro do Excel torna-se importante saber que: - a cada coluna corresponde uma varivel e primeira linha o nome de cada varivel;
Sandra Ferreira
Pgina 9
- em cada coluna os valores devem ser sempre do mesmo tipo: apenas datas, apenas nmeros, apenas texto, etc; - se numa coluna de valores numricos existirem clulas em branco, estes sero convertidos no sistema de valores omissos do SPSS. - caso existam dados noutras folhas, elas seriam identificadas e o utilizador apenas teria de escolher a folha e o range pretendidos.
Exemplo 1:
Figura 6: Folha de clculo do Excel Para conseguir ler estes dados no Excel, proceda de acordo com o que foi dito anteriormente, no SPSS seleccione > File > Open > Data
Figura 8: Deteco de dados no SPSS e visualizao Podemos concordar ou definir um novo intervalo de dados, e assim os dados passam a poder ser visualizados no SPSS.
4. Estatstica Descritiva 4.1 Tabelas de Frequncias Exemplo 2: (ver exemplo 1.8 da sebenta, pg. 12)
Considere os dados seguintes relativos s alturas, em cm, de 25 atletas de maratona: 157, 190, 174, 183, 174, 176, 168, 169, 167, 157, 163, 170, 172 171, 178, 173, 166, 165, 175, 176, 186, 169, 177, 176, 191 Passos a seguir para a construo de uma tabela de frequncias de dados agrupados no SPSS:
Sandra Ferreira
Pgina 11
1) escolher o menu > Transform > Visual Binning e seleccionar a varivel que se pretende agrupar em bins (classes ou novas categorias) e depois seleccione o boto Continue;
Figura 9: Agrupamento em novas classes 2) na janela Visual Binning escolher o nome da Binned Variable podendo alterar o Label. Inserir em Value os valores de cutpoints (valores requeridos para separao das classes inseridos abaixo na clula HIGH, um a um, seguido de ENTER). No nosso caso esses valores so, respectivamente: 157, 163,169, 175, 181 e 187 3) De acordo com a frmula de Sturges temos k = 6 classes. A amplitude, ai = 5,666 que vamos considerar 6 pois ao arredondarmos por excesso a amplitude obtida temos a certeza de que todos os valores estaro contidos nas classes. 4) Seguidamente seleccionar Excluded (<) de modo a que o intervalo da classe esteja aberto direita ([, [). Seguidamente carregar na opo Make Labels e OK;
Sandra Ferreira
Pgina 12
Figura 10: Introduo Dos valores das classes 5) Aparecer uma mensagem Binning specifications will create 1 variables. Clique OK;
Figura 11: Criao de uma nova varivel 6) Na janela de Edio de dados, aparecer a nova varivel; 7) Para realizar o histograma, de modo a visualizar as classes, seleccione no menu > Graphs > Chart Editor (ou Graph Builder ) > Gallery > Histogram; 8) Como o SPSS considera os bins como categorias, o histograma assemelhase a um grfico de barras, logo para que as classes fiquem adjacentes devemos
Sandra Ferreira Pgina 13
clicar duas vezes em cima de uma das barras e em Bar Options aumentar o espaamento das barras para 100. A tabela de frequncias obtida atravs do Output do SPSS dada por:
Figura 9: Output do SPSS indicando a tabela de frequncias Polgono de frequncias, que se encontra unindo os pontos mdios das classes:
Sandra Ferreira
Pgina 14
Exemplo 3:
Na opo Data View digite os dados correspondentes ao exemplo referido abaixo. Foi observada uma amostra de 10 atletas do sexo feminino com idades compreendidas entre os 15 e os 20 anos, nas quais tinha sido diagnosticada anemia. Relativamente a cada uma das atletas, durante a permanncia numa unidade hospitalar, foi registada a seguinte informao:
N Ordem 1 2 3 4 5 6 7 8 9 10 Dieta Equilibrada 1 1 2 1 1 2 1 2 2 1 Intensidade dos Treinos 2 3 1 2 3 1 1 1 3 1 Nvel de ferro (mg) 14,3 7,8 27 11 9,9 14,5 15,4 20,8 10,5 15,9
Sendo a varivel nvel de ferro quantitativa contnua e assumindo tantos valores diferentes, a respectiva tabela de frequncias, tal como apresentada, no facilita uma leitura rpida da informao. Assim, deveremos proceder categorizao da varivel, ou seja, transformao da varivel em varivel qualitativa organizada em classes. Vamos considerar, a ttulo de exemplo, que se constroem duas classes a partir dos dados de que dispomos. Para isso fazemos: > Transform > Recode into different Variables > Old and new Values
Sandra Ferreira
Pgina 15
Figura 12: > Recode into different Variables > Change A primeira classe congrega os indivduos com valores de nvel de ferro menores ou iguais a 14,7 mg (valor correspondente media do nvel de ferro). A segunda integra os indivduos com valores do nvel de ferro superiores a 14,7 mg. Esta operao realiza-se do seguinte modo: identificamos a varivel que se pretende classificar (nvel ferro), atribuindo nova varivel um nome (classes_nferro). Atribui-se um label (nvel de ferro [classes]) e depois pressionamos o boto Old and New Values. Na janela Recode into different Variables damos a indicao ao SPSS do critrio a seguir para a constituio das classes. No nosso exemplo, atribumos primeira classe o cdigo numrico 1 clicando em value, associando-o aos indivduos com valores de nvel de ferro menores ou iguais a 14,7 mg (colocar em range 0 e through 14,7). O procedimento o mesmo para definir a segunda classe. Depois pressione Continue e seguidamente clique Change (depois de atribuir o novo nome classes_nferro) varivel em Output variable > Name.
Sandra Ferreira
Pgina 16
Figura 13: > Old and New Values acrescentada base de dados original uma nova varivel (classes_nferro). Esta varivel no est ainda configurada. Para tal necessrio recolher folha variable view. Pode agora considerar-se o nmero de casa decimais igual a zero, preencher a coluna values com os respectivos cdigos e por fim designar correctamente a escala de medida da varivel (ordinal).
Sandra Ferreira
Pgina 17
Pode representar-se a distribuio de frequncias da nova varivel atravs de uma tabela de frequncias, obtidas em > Analyze > Descriptive Statistics > Frequencies Display Frequency Tables, conforme se mostra seguidamente:
4.2 Grficos
Na barra de ferramentas seleccione: > Graphs > Interactive onde possvel escolher o modelo de grfico desejado e format-lo. > Graphs > bar (grfico de barras) escolha uma das opes: Simple (grfico de barras simples), Clustered (grfico de barras agrupadas) ou Stacked (grfico de barras em pilhas).
[Seleccione tambm a opo de como os dados e devero apresentar no grfico: Sumaries for groups of cases (soma por grupo de casos), Sumaries of separate variables (soma das variveis separadas) e Values of individual cases (valores individuais dos casos) e clique em > define.] A
> Graphs > line (grfico de linhas) escolha uma das opes: Simple (grfico de linhas simple), Multiple (grfico de vrias linhas) ou Drop-line (grfico de linhas pequenas). Ver A acima. > Graphs > area (grfico de rea) escolha uma das opes: Simple (grfico de rea simples), ou Stacked (grfico de reas em pilhas). Ver A acima.
Sandra Ferreira
Pgina 18
> Graphs > Pie (grfico de pizza) Ver A acima. > Graphs > high law (grfico de pontos altos e baixos) escolha uma das opes: Simple high law close (), Clustered high law close (), Difference line (), Simple range bar () ou Clustered range bar (). Ver A acima. H ainda outras opes de grficos, tais como: Pareto, Control, Boxplot, Error Bar, Scatter, Histograma, P-P, Q-Q, Sequence, ROC curve, Time series. Destes, os grficos Boxplot, Scatter e Histogram so bastante utilizados e por isso sero aqui especificados. > Graphs > Boxplot Escolha uma das opes: Simple (boxplot simples) ou Clustered (boxplot agrupado). Ver A acima.
Sandra Ferreira
Pgina 19
Figura 15: Introduo dos dados Fazendo > Analyze > Descriptive Statistics > Frequencies, e aps premir o boto OK, abre-se uma nova janela (Output) onde surge a tabela de frequncias pretendida. Para construr um grfico de barras, na barra de menus, seleccione: >Graphs > Interactive > Bar Transporte a varivel Idade da lista da esquerda para o campo referente s abcissas do grfico (mantendo no eixo das ordenadas a frequncia absoluta) (Count)
Sandra Ferreira
Pgina 20
Para construir um grfico circular, na barra de menus, seleccione: >Graphs > Interactive > Pie Ao transportar a varivel Idade da lista da esquerda para o campo referente aos sectores do grfico, aparece um aviso onde proposta a converso da varivel Idade para o tipo qualitativo, passando cada valor da varivel a ser tratado como uma categoria:
Sandra Ferreira
Pgina 21
Aceitando a converso, (Convert), a varivel surge no campo referente aos sectores do grfico, prima OK e aparece na janela de Output o grfico pretendido:
Premindo duas vezes o boto esquerdo do rato sobre o grfico, abre-se o editor, tornando-se possvel alterar algumas das suas caractersticas. Para calcular a mdia, moda ou mediana, na barra de menus, seleccione: >Analyze > Descriptive Statistics > Frequencies Transporte a varivel Idade da lista esquerda para a lista Variable(s) e prima o boto Statistics. A sero apresentadas vrias listas de medidas estatsticas, podendo seleccionar, por exemplo, a mdia. Na lista das medidas de disperso pode calcular a varincia (Variance) e o desvio padro (Std. Deviation). NOTA: No SPSS, os valores apresentados referem-se varincia e ao desvio padro corrigidos, sendo este ltimo dado por:
Sandra Ferreira
Pgina 22
MDIA, MEDIANA, MODA, SOMA, DESVIO-PADRO, AMPLITUDE, MNIMO E MXIMO da varivel IDADE:
VARINCIA,
Figura 17: Seleco da mdia, moda, mediana, Na lista das medidas de forma da distribuio (Distribution), para calcular o coeficiente de assimetria seleccione (Skewness). NOTA: A medida de assimetria usada pelo SPSS
Sandra Ferreira
Pgina 23
distribuio simtrica g1 = 0
Se quiser calcular o 25 percentil, Q1, na barra de menus, seleccione: >Analyze > Descriptive Statistics > Frequencies
Sandra Ferreira Pgina 24
Transporte a varivel da lista esquerda para a lista Variable(s) e retire a opo Display frequency tables. De seguida prima o boto Statistics. Na lista dos percentis (Percentile Values) seleccione a opo Percentile(s), preenchendo o campo com o valor 25. Prima a tecla Add. O valor 25 muda para a lista onde possvel incluir outros valores de percentis que se pretendam calcular. Premindo Continue volta-se caixa anterior. Seleccione OK e apresentado, no Output, o valor do 25 percentil. Para construir um diagrama de extremos e quartis, (tambm conhecida por caixa de bigodes) na barra de menus, seleccione: >Graphs > Interactive > Boxplot Transporte a varivel da lista da esquerda para o campo referente varivel dependente e escolha a orientao do diagrama (vertical ou horizontal). Premindo OK apresentado o diagrama de extremos e quartis na janela de Output:
O conjunto dos valores da amostra compreendidos entre o 1 e o 3 quartis, que se representam por Q1/4 e Q3/4, respectivamente, representado por um rectngulo com a mediana indicada por uma barra, onde a largura pode ser qualquer. O extremo inferior o mnimo da amostra, enquanto que o extremo superior o mximo da amostra. Este tipo de grfico reala informao importante sobre os dados e d-nos uma ideia da simetria ou enviesamento e da sua maior ou menor concentrao.
Sandra Ferreira
Pgina 25
*
Q1 Q2=Me Q3
b2=Q3+1,5Q
B2=Q3+3Q
Sandra Ferreira
Pgina 26
Sandra Ferreira
Pgina 27
Figura 18: Insero dos dados Para transmitirmos ao SPSS que existe uma varivel (n alunos) que est a ser ponderada, pesada por uma outra varivel que representa uma frequncia, seleccione > Data > Weight Cases onde surgir a janela abaixo; ser necessrio seleccionar qual a varivel que representa a frequncia.
Sandra Ferreira
Pgina 28
Neste caso a mdia de filhos obtida de 4,24 filhos. Se quisssemos desenhar o boxplot referente ao nmero de filhos, recorramos aos seguintes comandos em SPSS: > Graphs > Legacy Dialogs > Boxplot > OK.
Figura 21: Boxplot referente varivel nmero de filhos Observamos que os bigodes so os extremos, correspondentes ao 1 e 3 quartil e o rectngulo divido pela mediana, neste caso igual a 4,5.
Sandra Ferreira Pgina 29
rx y =
s xy s xx s yy
Valor de r : - vlido somente para a amplitude de variao de x e y observada na amostra, no podendo ser extrapolada; -No reflecte necessariamente uma relao de causa e efeito, por isso, interpreta-se o valor de r em associao com o coeficiente de determinao (r2 potncia quadrada do valor de r). -O coeficiente de determinao (r2) representa a proporo de variao de x que pode ser atribuda sua relao com y. Analisemos este ponto com um exemplo.
Exemplo 7:
Voltemos aos dados do exemplo 2. Na barra de menus escolher: >Analyze > Correlate > Bivariate Em Correlation Coefficients, seleccione o coeficiente pretendido: neste caso Pearson (seleccione Pearson quando as variveis so quantitativas e tm distribuio normal). Seleccione Kendalls tau-b ou Spearman quando as variveis so ordinais ou no tm distribuio normal.
Sandra Ferreira
Pgina 30
Caso se seleccione Flag significant correlations, as correlaes significativas ao nvel de 0,05 so assinaladas com um asterisco, e as correlaes significativas ao nvel de 0,01 so assinaladas com dois asteriscos.
Prima OK.
Sandra Ferreira
Pgina 31
Interpretao dos resultados: Os coeficientes de correlao podem variar entre -1 (uma associao negativa perfeita) e +1 (uma associao positiva perfeita). Assim, a correlao entre a idade e a altura significativa a 5% (est assinalada com um asterisco). uma correlao negativa, o que indica que a uma pessoa que seja mais velha (mais idade) est associada menor altura.
6. TABELAS DE CONTINGNCIA
Se as variveis so de natureza ordinal ou nominal e os valores se referem ao nmero ou frequncia de casos que se situam em cada possvel efectuar tabelas de contingncia ou cruzadas (comando Crosstabs). Nas tabelas de contingncia podem cruzar-se variveis pertencentes ao mesmo fenmeno, de modo a perceber as caractersticas mais importantes que o compem, ou cruzar-se variveis pertencentes a fenmenos diferentes, de forma a verificar a existncia de relaes de dependncia. Seleccione a primeira varivel e insira em Row, clicando na seta. Seleccione a segunda varivel Columns. Se houver uma terceira varivel, insira-a na terceira janela utilizando a respectiva seta (caso tenha mais variveis, para inseri-la clique antes em NEXT). > Analyze > Descriptive Statistics > Crosstabs Nesta janela ainda possvel optar por: Statistics Cells Format
Sandra Ferreira
Pgina 32
Em >Analyze > Descriptive Statistics > Crosstabs > Statistics temos as opes: Chi-square: teste estatstico no paramtrico; Correlations: apresenta os resultados das correlaes de Pearson e Spearman; Nominal: teste para varivel nominal; Ordinal: testes para varivel ordinal; Nominal com intervalo: testes para varivel nominal com intervalo.
Em >Analyze > Descriptive Statistics > Crosstabs > Cells temos as opes: Count: soma ou estimativa -observado -esperado Percentages: percentagens -Row (linha) -Column (colunas) -Total Residuals -Unstandardized -Standardized -Adj. Standardized Em >Analyze > Descriptive Statistics > Crosstabs > Format temos as opes: Row order (ordem das linhas) -Ascending -Descending
Exemplo 8:
Para construir uma tabela de contingncia mais completa que contemple as possibilidades atrs mencionadas necessrio primeiro que tudo fazer uma transformao na varivel idades para classes. Recorremos novamente ao exemplo 2, e utilizemos novamente os comandos do exemplo 3: > Transform > Recode into different Variables > Old and new Values
Sandra Ferreira Pgina 33
Na janela Recode into different Variables damos a indicao ao SPSS do critrio a seguir para a constituio das classes. No nosso exemplo, atribumos primeira classe o cdigo numrico 1 clicando em value, associando-o aos indivduos com idades entre 18 e 23 anos. Depois o procedimento o mesmo para definir a segunda classe que se refere s idades entre 24 e 29 anos e por a fora. Pressione Continue e seguidamente clique Change (depois de atribuir o novo nome classes_idades) varivel em Output variable > Name.
Figura 24: > Transform > Recode into different Variables > Old and new Values
Sandra Ferreira Pgina 34
Para realizarmos o cruzamento das variveis alturas (em classes) e a idade (em classes), considerando os dados do exemplo 2, utilizamos os comandos: >Analyze > Descriptive Statistics > Crosstabs > Cell Display O Output seguinte mostra esse cruzamento, dado que foram seleccionadas as percentagens s das linhas (seleccione Row em Cells):
alturas (Binned) * idadesclasses Crosstabulation idadesclasses 1,00 alturas (Binned) <163 Count % within alturas (Binned) 163-168 Count % within alturas (Binned) 169-174 Count % within alturas (Binned) 175-180 Count % within alturas (Binned) 181-186 Count % within alturas (Binned) 187+ Count % within alturas (Binned) Total Count % within alturas (Binned) 12 48,0% 3 12,0% 2 8,0% 5 20,0% 2 8,0% 1 4,0% 25 100,0% 2 100,0% 0 ,0% 0 ,0% 0 ,0% 0 ,0% 0 ,0% 2 100,0% 1 50,0% 0 ,0% 1 50,0% 0 ,0% 0 ,0% 0 ,0% 2 100,0% 2 33,3% 2 33,3% 1 16,7% 1 16,7% 0 ,0% 0 ,0% 6 100,0% 4 50,0% 0 ,0% 0 ,0% 4 50,0% 0 ,0% 0 ,0% 8 100,0% 3 60,0% 1 20,0% 0 ,0% 0 ,0% 1 20,0% 0 ,0% 5 100,0% 0 ,0% 2,00 0 ,0% 3,00 0 ,0% 4,00 0 ,0% 5,00 1 50,0% 6,00 1 Total 2
50,0% 100,0%
Sandra Ferreira
Pgina 35
A ttulo de exemplo, podemos analisar que 50% dos atletas com menos de 163 cm tm idades entre 42 e 47 anos e entre 48 e 53 anos, respectivamente. No geral, 48% dos atletas tm idades entre 18 e 23 anos.
Exemplo 9:
Um investigador pretende estudar o comportamento de Staphilococcus aureus, Y, em frango, mantido sob condies de congelamento domstico (-18C) ao longo do tempo, X (dias). Vamos encontrar o modelo de regresso do tempo sobre a populao de bactrias. Tempo (X) Populao (Y) 0 3,114 7 3,568 14 2,845 21 3,079 28 2,699 35 2,663 (in John Neter; Michael H. Kutner; Christopher J. . Applied Linear Regression Models. Nachtsheim & William Wassermam. IRWIN, 3. ed., 1996. ) Introduza os dados. De seguida v folha variable view e designe correctamente o nome e a escala de medida de cada varivel (neste caso scale).
Sandra Ferreira Pgina 36
Para construir um diagrama de disperso, na barra de menus, seleccione > Graphs > Legacy Dialogs > Interactive > Scatterplot Aberta a caixa de dilogo Create Scatterplot, no menu Assign Variables, transporte, da lista esquerda, a varivel (independente) Tempo para o campo referente ao eixo das abcissas e a varivel (dependente) Populao para o campo referente ao eixo das ordenadas. No menu Fit, seleccione None. Premindo a tecla OK apresentado o seguinte diagrama de disperso na janela de Output:
Figura 23: Output ( Scatterplot) Para obter a equao da recta de mnimos quadrados, na barra de menus seleccione: >Analyze > Regression > Linear... Transporte, da lista esquerda, a varivel (independente) Tempo e a varivel (dependente) Populao para os campos correspondentes. Seleccione Statistics.
Sandra Ferreira
Pgina 37
Na caixa que agora aparece seleccione as opes Estimates (estimadores dos coeficientes a e b) e Model Fit (Valores de r e r2).
Figura 24: >Analyze > Regression > Linear Premindo Continue volta-se caixa anterior. Seleccionando a tecla OK so apresentados, na janela de Output, os valores dos parmetros a e b assim como os coeficientes de correlao e de determinao (r e r2).
Coefficientsa Standardized Unstandardized Coefficients Model 1 (Constant) Tempo a. Dependent Variable: populao B 3,325 -,019 Std. Error ,186 ,009 -,733 Coefficients Beta t 17,887 -2,154 Sig. ,000 ,098
Model Summary
Sandra Ferreira
Pgina 38
Nota: tambm possvel incluir, no diagrama de disperso, a recta de regresso e o valor de r2. Para isso, seleccione, tal como antes, Graphs > Legacy Dialogs > Interactive > Scatterplot No menu Fit, da caixa de dilogo Scatter Plot, escolha Regression na lista Method e seleccione Include constant in equation.
Sandra Ferreira
Pgina 39
= 3,325 0,019 X Y
Interpretando o parmetro b, (interseco da recta com o eixo dos Ys): pode dizer-se que para um tempo nulo, o aumento mdio da populao de 3,325 ufc/cm2. Interpretando a, (inclinao da recta): por cada aumento de uma unidade de tempo, a populao decresce, em mdia, 0,019 ufc/cm2 .
Os valores de Y revistos pelo Mtodo dos mnimos quadrados para as h observaes iniciais, designados por PRE_1, obtm-se na opo Save do comando de regresso escolhendo Predicted Values > Unstandardizes > Continue > OK:
Sandra Ferreira
Pgina 40
Sandra Ferreira
Pgina 41
Agora poderemos obervar que, calculando para x =21 obtemos uma populao mdia de 2,929 ufc/cm2 . Se quisssemos acrescentar base de dados uma nova observao, digamos para o tempo X = 40 e correndo de novo todas as observaes iniciais, PRE_2 igual a PRE_1, pela simples leitura do novo caso. Caso PRE_2 fosse diferente de PRE_1 teria obrigatoriamente de proceder-se ao clculo manual do consumo previsto.
Exemplo 10:
Um fisioterapeuta desenvolveu um estudo sobre a capacidade funcional de pacientes com determinada patologia, antes e depois do tratamento adequado. Para tal, recolheu uma amostra de 14 pacientes em que utilizou um ndice, denominado ndice de Bartel, IB. O IB quantifica a capacidade funcional e varia do 0, (totalmente dependente), a 100, (totalmente independente), antes e depois do tratamento. Resoluo: Na barra de menus seleccione > Analyze > Correlate > Bivariate (escolher Spearman)
Sandra Ferreira
Pgina 42
Observamos que existe uma correlao forte entre as variveis, ou seja, quanto maior for o valor do IB antes do tratamento, maior ser, em mdia, o IB depois do tratamento.
Sandra Ferreira
Pgina 43
Figura 25: > Transform > Compute Variable (dist. binomial) Se quisssemos calcular P(X<2), considerando uma distribuio normal, faramos: que nos devolveria o valor 0,98.
Sandra Ferreira
Pgina 44
Figura 26: > Transform > Compute Variable(dist. normal) O grupo PDF & Noncentral PDF contm as funes de distribuio pontuais f(x), referindo-se s funes de massa de probabilidade (no caso discreto) e densidade (no caso contnuo), para distribuies simtricas ou assimtricas. O grupo CDF & Noncentral CDF contm as funes de distribuio cumulativas F(x), para distribuies simtricas ou assimtricas.
Sandra Ferreira
Pgina 45
Sandra Ferreira
Pgina 46
Sandra Ferreira
Pgina 47
10.2
Sandra Ferreira
Pgina 48
Sandra Ferreira
Pgina 49
Sandra Ferreira
Pgina 50
Sandra Ferreira
Pgina 51
Sandra Ferreira
Pgina 52
Sandra Ferreira
Pgina 53