SPSS o Essencial Paulo Margotto Manual-Pratico

ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com
Professor do Curso de Medicina da Escola Superior de Cincias da Sade

(ESCS)/SES/DF
I- INTRODUO
II- COMO CRIAR UM COMANDO DE DADOS
III- ESTATSTICAS DESCRITIVAS
-tipo de variveis
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS
V- ESTATSTICA ANALTICA
-teste de hipteses
-tamanho da amostra
V-1-Teste t de Student
V-2- Anlise de Varincia
V-3- Qui-quadrado
V-4- Risco Relativo e Odds Ratio
VI- CORRELAO E REGRESO LINEAR SIMPLES
VII- REGRESSO LOGSTICA BINRIA
VIII-TESTES NO PARAMTRICOS
-teste de Kolmogorov-Smirnov e Shapiro-Wilk para testar normalidade
VIII-1-Teste Binomial
VIII-2-Teste U de Mann- Whitney
VIII-3-Teste T de Wilcoxon
VIII-4- Teste de Kruskal-Wallis
VIII-5-Teste de Friedman
VIII-6-Coeficiente de correlao de Spearman
VIII-7-Teste de McNemar
IX-CURVA DE KAPLAN-MEIER
X-CURVA ROC
XI-ESTATSTICA k:
XII-REFERNCIAS BIBILIOGRFICAS
Braslia, 01 janeiro de 2012
1
ESCOLA SUPERIOR DE CINCIAS DA SADE
SECRETARIA DE ESTADO DE SADE DO DISTRITO FEDERAL
ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
(utilizamos os conceitos de Wagner MB, Motta VT e Dornelles C em SPSS-Passo a Passo, Editora
da Universidade de Caxias do Sul, 2004., com exemplo na base de dados do estudo de Margotto PR e cl,
ainda no publcado sobre Uso do Corticosteride Pr-natal na Maternidade do Hospital Regional da
Asa Sul)
Torture os nmeros e eles admitiro qualquer coisa

Paulo R. Margotto
Professor do Curso de Medicina DA Escola superior de Cincias da Sade (ESCS)/SES/DF
O SPPS um programa que executa anlises estatsticas , desde as simples estatsticas
descritivas (mdia, desvio-padro e tabelas de frequencias) a mtodos avanados (anlise de
variancia, modelos de regresso multivaravel e outros). O programa pode gerar tabelas e grficos
que resumem os dados.
I- INTRODUO
Como iniciar o SPSS
Ao clicar no programa (SPSS for Windows) ser aberta a janela SPSS for Windows,
contendo no centro, a Caixa de Dilogo (Fig.1)
Fig. 1-Janela SPSS for Windows com a Caixa de Dilogos
2
A partir desta caixa de dilogos, escolha o que voc deseja fazer e clicar em [OK].
-run the tutorial: iniciar o tutorial
-type in data: digitar os dados, criando assim um novo arquivo de dados
-run na existing query: importar dados a partir de uma base de dados
-open an existing data source: abrir um arquivo de dados j existentes
-open another type of file: abrir outro tipo de arquivo
Com o melhor conhecimento do programa podemos usar um maior nmero de opes que
esto disponveis por meio de acesso s janelas e aos menus do SPSS. Na barra de tarefas do SPSS
encontram-se os seguintes menus:
File: comanda todo o gerenciamento de arquivos (criar, abrir, ler, salvar e imprimir arquivos)
Edit: utilizado para copiar ou colar informaes, bem como apagar as informaes das clulas; a
opo option permite configurar as sadas do output (tamanho da fonte, bordas das tabelas,
definio do padro dos tipos de variveis)
View: possibilita a visualizao ou no de barras de ferramentas (Toolbars) e barra de estado
(Status Bar) nas janelas; ativa e desativa linhas de grade; mostra os tipos de fontes utilizadas;
estabelece a apresentao de rtulos de variveis e valores (variable and value labels)
Data: permite a definio de variveis, ordenar os dados segundo algum critrio escolhido, inserir
ou retirar observaes ou variveis, unir arquivos (merge files), criar subgrupos para anlise (split
file), selecionar casos especficos (select cases). As mudanas so temporrias, a no ser que sejam
salvas
Transform: cria novas variveis a partir das existentes, modifica dados e variveis por meio de
clculos. As mudanas so temporrias a no ser que sejam salvas.
Analyze: aqui encontramos os diversos procedimentos estatsticos realizados pelo SPSS
(regresso, anlises descritivas, testes de comparao). A cada nova verso do SPSS novos testes
so agregados, aumentando o alcance do SPSS.
Graphs: usado para criar e modificar grficos; h vrias opes de grficos, como barra, linha,
coluna, torta, histograma, disperso, etc, devendo ser escolhido aquele que melhor representa os
dados e as variveis em estudo. Um duplo clique no mouse sobre o objeto abrir a janela Chart
Editor, onde possvel modificar as fontes, cores, escalas e tamanho dos diversos elementos do
grfico.
Utilities: permite a obteno de informaes sobre as variveis e o banco de dados (opo
variables)
Window: mostra as janelas que esto em execuo no SPSS
Help: contem uma janela de ajuda que contem informaes como usar o SPSS
Mostra denominaes
atribudas aos valores
de uma varivel
Insere dados
Vai at o caso
Descreve variveis Insere casos
3
II - COMO CRIAR UM BANCO DE DADOS
No SPSS os dados podem ser tanto digitados no teclado como lidos de um arquivo externo.
O formato do SPSS *.sav.Os dados no SPSS so digitados diretamente na janela Editor de
Dados (Data Editor), como numa planilha eletrnica .Assim possvel criar um arquivo no SPSS
(*.sav) (Figura 2) As variveis podem ser quantitativas (altura, peso), categricas (sexo), de data
9tipo calendrio) ou alfanumricas (letra).
Fig.2. Janela Editor de Dados (Data Editor)

Ao se criar um banco de dados, o primeiro passo definir as variveis, no Variable view
(visualizao das variveis). Na coluna Nome (Name), criar um nome para a varivel com o
mximo de 8 caracteres. Em Type definir se numrica, especificando o nmero de casos
decimais(Decimals). Se a varivel for categrica, especificar o nmero de caracteres que compem
o nome de cada categoria (Width). Na coluna Label (rtulo da varivel), voc pode digitar o nome
completo da varivel e ser este nome que vai aparecer na janela de output (resultados). Em Values
podem ser criados rtulos para as variveis. Os valores Missing (valores omissos) podem ser
representados por vazios na hora da digitao. Align determina o alinhamento da informao
dentro da clula. A coluna Measure classifica a varivel em escalar, ordinal ou nominal (veja
resumo na Tabela 1)).
Tabela 1. Opes nas definies das variveis (Wagner MB e cl, 2004)

Lembrar que cada coluna representa uma varivel e cada linha uma observao ou um
caso.
4
Seja o exemplo: digitar na primeira coluna o nome das variveis que esto apresentadas na Tabela
2
Sexo: (1)feminino; (2) masculino; peso em kg; altura em cm; glicemia em mg%
Tabela 2.Dados de cinco sujeitos de um estudo (Wagner MB e cl, 2004
Aps digitar cada varivel, pressionar Enter e o SPSS automaticamente assume o tipo de
varivel. No final, a tela Data Editor na opo Variable View, dever ficar como na Figura 3.
Figura 3. Visualizao da tela do Data Editor na opo Variable View para as variveis do
Exemplo 1 (Tabela 1)
A seguir, ir para o Data Editor na opo Data View para inserir os dados da Tabela 2. As
informaes devem ser digitadas conforme apresentadas na Figura 4.
Fig. 4.Opo Data View da janela Data Editor com os nomes das variveis no cabealho e os
dados do exemplo da Tabela 2
5
possvel corrigir os dados depois de inseridos na tabela, assim como apagar clulas.
possvel tambm inserir novos casos: escolher Data>Insert Cases, assim como inserir novas
variveis: escolher Data>Insert Variable.
Dependendo do interesse do pesquisador, novas variveis podem ser criadas a partir das j
existentes.Para isto, basta ir ao menu Transform e escolha o comando compute. Suponhamos que
queiramos inserir presso arterial (PA)(Figura 5);
Fig. 5. Seleo do comando Compute

Aps ter terminado a insero dos dados, salvar o arquivo clicando em File >Save
as...Escolha o diretrio no qual o arquivo deve ficar, nomeando-o. Veja na Figura 6.
Figura 6.Caixa de dilogo Save Data As
III- ESTATSTICAS DESCRITIVAS

Os dados referem-se a variveis que por sua vez podem ser qualitativas e
quantitativas. Varivel toda caracterstica ou condio que pode ser mensurada ou
observada.
6
Varivel qualitativa:
-nominal: diferentes categorias sem valores numricos. Os dados podem ser

distribudos em categorias mutuamente exclusivas. Exemplo: Sexo - permite distinguir
duas categorias, masculina e feminina; cor, causa de morte, grupo sangneo.
-ordinal: os dados podem ser distribudos em categorias mutuamente exclusivas que
tm ordenao natural. Exemplo: grau de instruo (as pessoas podem ser distribudas
em categorias mutuamente exclusivas, na seguinte ordem: primrio, 2 ano e superior),
aparncia, status social, estgio da doena
Varivel quantitativa ou contnua: os dados so expressos por nmeros. Exemplo:
idade, estatura, peso corporal.
-Discretas( associao entre valores e nmeros inteiros): idade em anos completos
-Contnua (pode assumir qualquer valor no subconjunto de nmeros reais): peso
A Estatstica Descritiva encarrega-se do levantamento, organizao, classificao e
descrio dos dados em tabelas, grficos ou outros recursos visuais, alm de parmetros
representativos destes dados.
Uma vez criada a base de dados, passamos agora a utilizar os procedimentos estatsticos.
Nestes exerccios vamos usar o arquivo corticosteride pre-natal.sav. Na janela SPSS DATA
Editor. Selecionar File>Open>Data. Aps localizar o arquivo, clicar em [Abrir].
No menu Analyze>Descriptive Statistics, encontram-se os comandos Frequencies,
Descriptive, Explores e Crosstabs.
III-1- Comando Frequencies
Este comando serve para obter tabelas de freqncias, tanto para variveis categricas
quanto quantitativas. Tambm podem ser obtidas estatsticas descritivas clssicas, como mdia,
desvio-padro, mnimo, mximo e outras.
No menu, escolha Analyze>Descriptive Statistics>Frequencies e teremos (Figura 7):
Fig. 7.Construo de Tabelas de Freqncias (observem a caixa de dilogo de

Frequencies)
7
Na caixa de dilogo de Frequencies, selecione as variveis uso de corticide, uso do O 2
com 36 semanas de idade gestacional ps-concepo e tipo de parto e movam-nas para a caixa
Variable(s), clicando no boto []. importante que a opo Dispaly frequency tables esteja
marcada para a obteno da tabela de freqncias. Em seguida, pressionar [OK]. Vejam que as
variveis que enviamos para a direita, desaparece na esquerda. Ao mover a varivel da esquerda
para a direita, selecione-a e pressione [].
Na janela Ouput Viewer vamos ter uma tabela de freqncias para as variveis
selecionadas (Figura 8)
Frequencies
Frequency Table
Figura 8-Resultado da tabela de freqncias para as variveis solicitadas

Observem que temos 219 recm-nascidos estudados, dos quais 52,5% das suas mes
receberam corticosteride pr-natal; 9,6% apresentaram dependncia de O2 com 36 semanas de
idade ps-concepo; o nascimento por cesariana ocorreu em 60,3%.
Para obter as estatsticas descritivas do comando Frequencies, selecionar as variveis
quantitativas peso, idade gestacional, altura e permetro ceflico de vida e mova-as para a esquerda
(que a caixa Variable(s). pressionando no boto [] (Figura 9).
Fig. 9. Seleo das variveis
8
A seguir pressionar[Statistics]: na caixa de dilogo Frequencies: Statistics escolha
Quartiles (quartis), Mean (mdia), Std Desviation (devio-padro), Minimum (mnimo), Mximum
(mximo) e S.E. mean (erro-padro mdia) e pressione [Continue] para voltar a caixa de dilogo
Frequencies (Figura 10).
Fig.10. Caixa de dilogo Frequencies:Statistics

Pressione [OK] e na janela output viewer vamos ter:, teremos (Figura 11 ).
Figura 11.Janela de Output Viewer com os resultados do comando Frequencies para as

variveis peso, idade gestacional, estatura e permetro ceflico.
Observem que houve 1 caso omisso para a estatura e 1 para o permetro ceflico..
Para identificar a simetria da varivel, h as seguintes formas
-relao entre mdia e desvio-padro: na imensa maioria dos casos, as variveis
simtricas que seguem a distribuio normal, o desvio padro menor do que a metade
da mdia (dp<mdia/2)
-mdia e mediana muito prximas ou diferena no mximo de uns 20% uma em
relao a outra para a varivel simtrica
-Testes de normalidade: Kolmogorov-Smirnov e Shapiro-Wilk (veja adiante)
O aparecimento de resultados muito pequenos ou muito grandes, o SPSS
chamada notao cientfica. Por exemplo, um erro-padro da mdia (Std. Error of
Mean) apresentado como 9.729E-03, est no formato de notao cientfica: E-03
representa 10-3; assim o valor passa a ser 9,729 x103.
9
3-2- Comando Descriptive
Este comando mais usado para variveis quantitativas. No menu escolha
Analyze>Descriptive Statistics>Descriptives (Figura 12)
Fig.12. Passos para o Comando Descriptive

Na caixa de dilogo do comando Descriptives, selecionar as variveis peso
estatura e mov-las para a esquerda (caixa Variabe(s), tal como feito no comando
Frequencies (Figura 13)
Figura 13. Caixa de dilogo para seleo de variveis no comando Descriptive
10
A seguir pressionar [0ptions] e selecionar as estatsticas e as opes desejadas.
Neste comando j esto selecionadas previamente as estatsticas Mean (mdia), Std
.Desviation (desvio padro), Minimum (mnimo) e Mximum (mximo). Este comando
permite classificar os resultados segundo critrios de ordem de seleo, como ordem
crescente de mdias (Ascending means) (Figura 14).
Fig.14.Estatstica do Comando Descriptive
A seguir, pressionar [Continue] e em seguida, [OK]. Os resultados vo aparecer da

seguinte forma no Output viewer (Figura 15)
Fig. 15. Output viewer do comando Descriptives
3-3-Comando Explore
Este comando apresenta maiores opes de estatsticas descritivas, alm de dispor de testes
estatsticos para normalidade e grficos especiais. utilizado exclusivamente com variveis
quantitativas e permite comparar tipo de dados entre dois ou mais grupos. Podemos obter:
-medidas de tendncia central:mdia, moda, mediana
-medidas de disperso: desvio-padro, varincia, amplitude e quartis
-outliers: anlise de valores discrepantes
-testes especficos para avaliar a normalidade (Kolmogorov-Smirnov e Shapiro-Wilk
-boxplot
-medidas descritivas adicionais, como assimetria, curtose e outras
Como usar este comando: no menu Analyze Descriptive>Statistics>Explore
11
Exemplo: Na caixa de dilogo Explore, escolha a varivel que se pretende explorar,
colocando-a na lista de variveis dependentes (Dependent List). Na varivel classificatria (Factor
List) coloca-se, geralmente, uma varivel categrica. No nosso exemplo, vamos explorar a
varivel idade gestacional com o uso de corticosteride pr-natal (Figura 16)
Fig.16.Caixa de dilogo para seleo de variveis no comando Explore

Na opo Display, selecionar Both (ambos), para se obter tanto as medidas de sntese como
os grficos. Pressionar [Statistics] para abrir a caixa Explore: Statistics e escolha as opes de
medidas numricas de sntese (Fig.17).
Fig.17. Caixa de dilogo Statistics

A seguir, pressione [Continue] para retornar a caixa anterior. De volta caixa Explore,
clicar no boto [Plots] para abri a caixa Explore:Plots e selecionar Boxplot: Factor levels togheter
(os boxplot estaro juntos no mesmo grfico), Histogram (histograma ou grfico de barras) e
Normality plots with test (grficos e testes para normalidade da dependente) (Figura 18)
Fig.18.Caixa de dilogo Plots
12
Prosseguindo, pressionar o boto [Continue] para voltar caixa Explore. Nesta caixa, clicar
no boto [Continue]. Os resultados da anlise surgiro na janela Output Viewer (Figuras 19). O
comando Explorer produz uma tabela chamada Case Processem Somar que contm os casos
vlidos e omissos includos na anlise para a varivel Apgar trs no 5 minuto estratificada por uso
de corticosteride.
Fig.19. Output viewer do comando Explore

Observem que a Tabela Descriptives produz para cada um dos estratos da varivel
classificatria (idade gestacional) uma lista de estatsticas descritivas: mdia, intervalo de
confiana de 95% para a mdia, mdia aparada em 5% (mdia recalculada excluindo os 5% mais
extremos, ou seja, 2,5% inferiores e 2,5% superiores), o erro-padro da mdia, coeficientes de
assimetria e de curtose, que nos possibilita avaliar como os valores se distribuem.
Na Figura 20 temos a tabela Percentiis que mostra diferentes percentis para a varivel
idade gestacional nos dois grupos (que usou e o que no usou corticosteride pr-natal), segundo
dois mtodos distintos: weights average e Tukeys Hinges.
13
Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5 maiores
e os 5 menores)
A tabela Test of Normality mostra o resultado de dois testes de normalidade: Kolmogorov-
Smirnov e o Shapiro-Wilk. Os dois testes testam a hiptese de que os dados apresentam uma
distribuio normal. No caso de amostras menores (<50 casos), o teste Shapiro-Wilk mais
poderoso. Um valor abaixo da significncia indica um desvio na distribuio dos dados em relao
Curva Normal (de preferncia deve estar abaixo de 0,05 ou mesmo 0,01) (Figura 21)

Observem que a varivel idade gestacional no segue uma distribuio normal
(p=0.0001).
Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5 maiores
e os 5 menores).
O comando Explore produz ainda uma sequncia de grficos, como o histograma (equivale
representao grfica de uma tabela de freqncias) e o boxplot (caixa de bigodes). Quanto ao
boxplot: a representao em forma de grficos dos quartis da distribuio; apresenta, de forma
compacta, diversas informaes sobre um conjunto de dados. A caixa formada pela mediana
(linha central) e pelos quartis inferior e superior (percentis 25 e 75), que so obtidos pelos mtodos
Tukeys Hinges. A mediana d uma estimativa de tendncia central; a altura das caixas (percentil
75percentil 25 a amplitude interquartil (interquatile range) e estima a variabilidade dos dados. A
presena ou no de simetria dada pela posio da mediana (central ou mais prxima dos quartis).
As linhas verticais que saem da caixa so conhecidas como whiskers (bigodes de gato em ingls).
Nas sries assimtricas, os dados mximos e mnimos distanciam-se das hinges de Tukey (percentil
75-percentil 25), sendo os seus valores assinalados separadamente no boxplot com um pequeno
crculo (outlines) e os valores que se distanciam substancialmente so considerados extremos
(extremes) e so assinalados com um asterisco (Figura 22).
Fig.22. Grfico Boxplot de idade gestacional e uso de corticosteride pr-natal
14
No observamos nenhum valor discrepante e extremo. Ao se detectar estes valores,
podemos retornar ao Data Editor para consultar o caso assinalado.
3-4- Comando Crosstabs Este comando est relacionado diretamente com a obteno
de testes estatsticos (qui-quadrado e exato de Fischer) e de medidas de fora de associao, que
sero estudados mais adiante (Estatstica Analtica). Antes, vejamos a Manipulao e Criao de
Novas Variveis
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS

O SPSS disponibiliza o menu Transform para reclassificar variveis (categoria 1 e 2) e
para transformar uma varivel (por exemplo comprimento em metros para cm) ou criar nova
varivel a partir das existentes (por exemplo, a partir do peso, obter o ndice ponderal, que o
peso/comprimento ao cubo).(Figura 23)
Fig.23. Menu Transform em detalhe
15
Compute: realiza clculos; o SPSS disponibiliza mais de 70 funes matemticas (raiz
quadrada, logaritmo, coseno, etc)
Recode: reclassifica variveis, tanto quantitativas como categricas
Visual Bander: permite a criao de novas variveis com base no agrupamento de valores
contnuos de variveis existentes em categorias distintas)
Count: possibilita contar quantas vezes determinado valor aparece
Rank Cases: classifica as observaes em ordem crescente ou decrescente, obtendo assim
os ranks (postos)
Automatic recode: transforma automaticamente valores descontnuos e afastados entre si
em uma srie de valores numricos inteiros e contguos. til para transformar uma varivel
alfanumrica (string) em uma varivel numrica para poder ser utilizada em anlises estatsticas
que requerem categorias numricas
Create time series: cria variveis novas baseado em funes de variveis numricas de
sries temporais
Replace missing values: permite substituir os dados omissos (missing) por valores
numricos vlidos a serem usados em anlises estatsticas. Indicado quando a proporo de
omissos pequena (<10%) e quando a varivel quantitativa.
Randon Number Seed: gera nmeros pseudo-aleatrios, sendo possvel, assim, determinar
o ponto de partida para a gerao automtica destes nmeros pelo SPSS.
COMANDO COMPUTE|:
Vamos criar uma varivel a partir da existente, como: Calcular o ndice ponderal (IP=
peso/altura3).
-Na janela Data Editor, escolha: Transform> Compute e surgir( Figura 24):
Fig.24. Seleo do comando Compute
16
No campo Target Variable (Varivel destino), escrever o nome da varivel que ser
transformada. No exemplo ser criada a varivel IP (ndice ponderal). Digitar IP no campo Target
Variable; clicar a seguir na opo Type&Label e adicionar o rtulo (label) ndice ponderal.
Observe que o SPSS assume tratar-se de uma varivel numrica com duas casas decimais. A
seguir, desloque para o campo Numeric Expression as variveis envolvidas, usando [],
adicionando as operaes matemticas necessrias.; para a exponenciao use asterisco duplo
multiplicado 3 vezes por ela mesma, como na Figura 25.
Fig.25. Definio da expresso numrica

da nova varivel IP
Pressione [OK] e o resultado aparece imediatamente na janela Data Editor, como mostrado
na Figura 26:
Fig.26. Resultado do clculo da nova varivel IP

Havendo valores omissos em peso ou em altura, o SPSS coloca um . (ponto).
Output Viewer: uma vez executado um procedimento no SPSS, os resultados so
apresentados no Output Viewer, que um visualizador de resultados, estando colocados na ordem
17
em que foram realizados. Voc pode copiar a tabela clicando o boto direito do mouse e
selecionando copy e cole onde for necessrio.
Voc tambm pode manipular tabelas, como por exemplo, traduz-las. Para isto, basta ativar
o Pivot Table Editor, clicando o boto direito do mouse na tabela e assim, a tabela fica pronta para
ser editada na prpria janela Pivot Table Editor. Possibilita tambm uma viso e edio de uma
tabela larga e longa (Figura 27). Veja o exemplo a seguir:
Fig.27. Como ativar o Pivot Table Object
Uma vez pressionado Open, teremos (Figura 28)
Fig28. Tabela a ser editada no Pivot Table
Como usar os Comandos Split e Select:
Estes comandos permitem obter resultados das anlises divididas em categorias, como
sexo masculino e feminino.
18
Comando Split
-Split: vejamos a estratificao da anlise usando uma varivel categrica, por exemplo,
sexo. Selecionar Data>Split>File (Figura 29).
Fig.29. Passos para o uso do Split
Uma vez aberta a caixa de dilogo Split File, marcar Compare groups e colocar a
varivel sexo na caixa Groups Based on e clicar [OK] (Figura 30).
Fig.30. Caixa de dilogo Split File
19
Selecionar agora Analyze>Descriptive Statistics. Descritives...Options (Mean, Std
Desviation, Minimum e Maximum)....variveis peso e estatura (Figura 31). Observem
que os resultados na janela Output Viewer vo aparecer agrupados pela varivel sexo.
Fig.31. Caixa de dilogo Descriptives
Clicar em [OK] e no Output Viewer (Figura 32), vai aparecer
Fig.32. Resultados do comando Split File>Compare groups
Se no Split File voc marcar Organize output by groups, vamos ter os resultados de um
grupo e de outro grupo (Figura 33).
Fig.33. Caixa de dilogo Split Fire
Veja o resultado no Output Viewer (Figura 34).
20
Fig.34. Resultados do comando Split File>Organize output by group
Para retornar condio anterior, ou seja, anlises no agrupadas, selecione Data>Split

File e marcar Analyze all cases, do not reate grous e clicar [OK] (Figura 35).
Fig.35. Caixa de dilogo Split File
21
Comando Select
Este comando seleciona apenas uma categoria especfica dos casos de um arquivo
de dados. Escolher Data Select Cases, selecione a categoria a ser analisada, por
exemplo, da varivel categrica sexo, sero selecionados somente os casos do sexo
masculino (Figura 36)
Fig.36. Menu Data>Select Cases
Na caixa de dilogo Select Case, marcar IF conditions is satisfied e clicar em [IF]

(Figura 37).
Fig.37. Caixa de dilogo Select Cases
22
Agora, selecione a varivel sexo e usando os sinais no centro da caixa de dilogo, digite
a expresso condicional, clicando no centro da caixa de dilogo (Figura 38)
Fig.38. Caixa de dilogo Select Cases: IF
Clicar [Continue] e em seguida [OK]. No Data Editor, os casos sexo=2 (feminino)

aparecem com um trao sobre o nmero indicador do caso na margem numerada. Estes
casos sero excludos da anlise (Figura 39).
Fig.39. Janela Data Editor com os casos no selecionados assinalados (observem a

seta)
Ao utilizar o comando Select, o SPSS cria automaticamente uma varivel chamada

filter4, na ltima coluna e aparece tambm na barra de ferramentas.
23
Para restaurar os dados do arquivo, escolher Data>Select Case... All cases e clicar
[OK] (Figura 40).
Fig. 40. Caixa de dilogo Select Cases

Assim, os dados originais do arquivo voltam ao estado anterior, sendo usada toda
a amostra para a anlise. No fazendo isto, voc pode salvar os seus dados modificados
do original. Ento, para evitar, salvar sempre para outro arquivo ou voc poder vir a
perder o banco de dados original.
V-ESTATSTICA ANALTICA
A Estatstica Analtica trabalha com os dados de forma a estabelecer hipteses,
procede a sua comprovao e no final, elabora concluses cientficas
Teste de Hiptese e Tamanho da Amostra para melhor compreenso da significncia
estatstica
Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo
examinado apenas parte desta populao (amostra). Este processo chama-se de
inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos.
Para a compreenso de um teste estatstico preciso que entendamos o que vem
a ser Hiptese Nula (H0) e Hiptese Alternativa (H1).
Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo
com certos critrios, ser ou no rejeitada.
Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena
entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do
fenmeno ou resultado observado.
Hiptese Alternativa ou experimental (H 1): aquela que afirma que h
diferena entre os grupos estudados.
O principal objetivo de testar uma hiptese responder seguinte questo:
dadas duas amostras, so elas realmente diferentes ou pertencem a uma mesma
24
populao, ou em outras palavras, as diferenas encontradas entre duas ou mais
amostras so verdadeiras ou podem ser explicadas pelo acaso.
O processo de testar hiptese consiste em seis etapas:
1. Estabelecer a H1 ( se l ag 1)
2. Estabelecer a H0 ( se l ag zero)
3. Determinar o tamanho da amostra
4. Colher os dados
5. Realizar teste estatstico para verificar a probabilidade
de que a H0 seja verdadeira
6. Rejeitar ou no a H0
Ao afastar a hiptese nula, estamos afirmando a validez da hiptese alternativa.

Todo experimento realizado para testar uma hiptese. O pesquisador formula
uma hiptese, observa, analisa e em seguida conclui. Aps observar, o pesquisador
descreve e mede.
Jamais atribuindo juzos de valor ao que est sendo visto, o pesquisador pode
decidir erroneamente e rejeitar a hiptese nula sendo ela verdadeira (Erro tipo I). Assim,
o pesquisador aceita como verdade uma diferena que na realidade no existe e que na
verdade, se deve variabilidade das amostras. Quando a hiptese H 0 falsa e o
pesquisador no a rejeita, dizemos que ele cometeu um Erro tipo II, significando que
existia, de fato, uma diferena que no foi reconhecida.
Assim:
Erro tipo I: rejeita a H0 sendo verdadeira (fato obtido por azar: rara
ocorrncia estatstica): erro alfa
Erro tipo II : aceita a H0 sendo falsa (erro mais freqente):erro beta
A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que

chamamos de nvel de significncia do teste. O estatstico no sabe quando rejeita a
H0, se est ou no cometendo erro, mas sabe a probabilidade de cometer este tipo de
erro. Se a probabilidade for suficientemente pequena (<= 5%), a deciso de rejeitar a H 0
est bem fundamentada. O nvel de significncia representado pela letra grega (l-se
alfa). O nvel de significncia o nome com que se designa a probabilidade .
Vejamos o exemplo:
Feito um experimento com duas drogas (A, B), o pesquisador pergunta se a
droga A cura tanto quanto a droga B.
O estatstico v a pergunta do pesquisador como duas hipteses:
a) H0: a proporo de pacientes curados com a droga A igual proporo de
pacientes curados com a droga B
b) H1: a proporo de pacientes curados com a droga A diferente da proporo de
pacientes curados com a droga B.
25
Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O
nvel de significncia seria a probabilidade (p) de afirmar que uma das drogas determina
maior proporo de curas, quando na verdade, a proporo de pacientes curados a
mesma, seja a droga A ou B. usual manter o nvel de significncia de 1% e 5%; um
de 5% (0.05) significa que cometemos um erro (tipo I) de 5% em rejeitar a H0 (sendo
verdadeira) e aceitar H1 (1 em cada 20 se comete o Erro tipo I ao rejeitar a H0). Um de
1% (0,01), significa que ao rejeitar a H0 e aceitar a H1, o risco de estarmos errando, ou
seja, cometendo um erro tipo I de 1%. O nvel de significncia representa a mxima
probabilidade de tolerar um erro tipo I.
O erro tipo I ocorre quando se acredita que existe um efeito verdadeiro na
populao e de fato no h. Usando o critrio de Fisher, a probabilidade de erro 0.05
(ou 5%) quando no existe efeito na populao. Segundo Fisher devemos somente
acreditar que o resultado verdadeiro quando tivermos 95% de confiana de que ele
ou quando houver somente 5% de chance de que os resultados possam ocorrer ao
acaso.
O oposto o erro tipo II que ocorre quando acredita-se que no exista um efeito
na populao, mas na realidade ele existe. O ideal que a probabilidade deste erro seja
bem pequena (se existe um efeito na populao importante que possamos detect-lo).
Cohen sugere que a probabilidade mxima aceitvel para um erro tipo II seria
0,2 (20%), definvel como beta (). Se tomarmos 100 amostras de dados da populao
na qual um efeito existe, vamos falhar em detectar este efeito em 20 destas amostras
(perderamos 1 em 5 dos efeitos verdadeiros).
Portanto, para fazer um erro tipo I no deve haver efeito na populao, enquanto
para fazer um erro tipo II vale o contrrio, ou seja, deve haver um efeito que perdemos.
A probabilidade de cometer um erro tipo I diminui medida que a aumenta
probabilidade de cometer um erro tipo II.
Assim:
Os erros ocorrem ao testar hipteses por diferentes motivos:
- Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto
menores forem; numa amostra maior, estas diferenas se diluiriam).
- Erro tipo II: amostras pequenas
grande quantidade de amostras
Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa,
considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente 10 -
20%.
Tamanho da Amostra
conveniente planejar o tamanho da amostra para que se possa ter amostras
grandes o suficiente para detectar diferenas importantes. Por outro lado, amostras
exageradamente grande alm de elevar o custo do estudo, podem tornar diferenas
irrelevantes em estatisticamente significativas.
Para determinar o tamanho da amostra preciso estabelecer qual a diferena
deve ser considerada significativa. Esta uma deciso arbitrria do pesquisador,
baseada na experincia, na literatura e/ou na relevncia clnica.
Para determinar o tamanho da amostra, deve-se considerar o nvel de
significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira.
26
Geralmente considera-se uma probabilidade menor ou igual a 5% como adequada (p
0,05). Poder do teste: a probabilidade que um determinado teste ir encontrar um
efeito assumindo que um j existia; lembrem-se que corresponde probabilidade de
falha em detectar um efeito que realmente existe (erro tipo I). Assim, a probabilidade de
detectar um efeito, se um existe, deve ser o oposto da probabilidade de no detectar
aquele efeito, isto , 1-. Como j vimos, Cohen sugere que deveramos esperar uma
probabilidade de 0.2 na falha em detectar um efeito verdadeiro e assim, o nvel
corresponde do poder recomendado por ele que foi de 1.0-0.2=0.8. Portanto o objetivo
alcanar um poder de 0,8 ou 80% de probabilidade de detectar um efeito se ele
realmente existe. Por exemplo, um poder de 80% significa que, se de fato houver
alguma diferena, haver uma probabilidade de 80% de detect-la.
Uma vez conhecido o valor de alfa e beta, podemos usar pesquisas anteriores ou
experimentos similares para estimar o tamanho do efeito que se espera detectar com um
experimento. Assim, podemos usar esse tanto de efeito estimado para calcular quantos
participantes necessitamos para detectar este efeito, com base nos valores de alfa e beta
que escolhemos.
Os clculos exatos so volumosos, devendo ser usados programas de
computador. Entre estes, citamos o G*Power (grtis) e o nQuery Adviser (pago), o
disponvel no Epiinfo e no Laboratrio der Epidemiologia e Estatstica.
Utilizando o site Lee - Laboratrio de Epidemiologia e

Estatstica, clicar em Pesquisa e entrar a seguinte caixa:
Clicar Clculo de tamanho de amostra
27
Prosseguindo com o exemplo, vamos clicar em Estudo de coorte (estudo de coorte:
comparao entre um grupo exposto a um fator de risco e outro grupo no exposto. Visa
verificar se indivduos expostos ao fator de risco desenvolvem a doena em questo, em
maior ou menor proporo, do que um grupo de indivduos no expostos) e teremos:
28
Explicaes:
Proporo de casos entre os expostos: equivale proporo de pessoas expostas ao fator de

risco que desenvolveram a doena
Proporo de casos entre os no expostos: equivale proporo de pessoas que no

foram expostas ao fator de risco, mas que desenvolveram a doena
Risco relativo: proporo de pessoas expostas ao fator de risco que desenvolveram a

doena sobre a proporo de pessoas no expostas que desenvolveram a doena. Vale 1
se as pessoas expostas e no expostas desenvolveram a doena na mesma proporo.
Nvel de significncia: indica a probabilidade de cometer um erro do tipo I, ou seja,

rejeitar a hiptese nula quando esta for verdadeira. Em outras palavras, a chance de
dizer que existe diferena entre as propores quando na realidade elas so iguais.
Poder do teste: indica a probabilidade de deciso correta baseada na hiptese

alternativa. Geralmente interpretado como a chance de detectar uma real diferena
entre as propores, ou seja, detectar a diferena se ela realmente existir.
Teste de hiptese:
teste monocaudal: teste cuja hiptese alternativa uma desigualdade. Em estudos de

coorte o teste monocaudal equivale ao teste em que o interesse saber se o risco relativo
maior ou menor que 1, ou seja, se a proporo de doentes maior (ou menor) entre os
expostos ao fator de risco.
teste bicaudal: teste cujo objetivo testar apenas se as propores so iguais ou

diferentes e no estabelecer qual delas maior ou menor. Em estudos de coorte o teste
bicaudal equivale ao teste em que o interesse saber somente se o risco relativo
diferente de 1, ou seja, se a chance de doena entre expostos e no expostos ao fator de
risco a mesma ou no.
29
Para calcularmos a mostra esperando uma incidncia de 10% de hemorragia
intraventricular no grupo com corticosteride e 20% no grupo sem corticosteride,
fazemos:
Clicar em envia e teremos:
Portanto, em um estudo de coorte de gestantes que usaram e no usaram

corticosteride no pr-natal, com um nvel de significncia de 5%, com um poder do
teste de 75%, para detectar uma diferena de proporo de 10% e 20% entre os grupos,
30
expostos e no expostos a corticoterapia, POSSIVELMENTE necessitaramos de 135
mes para cada grupo, num total de 270 gestantes.
No entanto, devemos ter em mente o que cita os autores do Laboratrio de

Epidemiologia e Estatstica citam: importante ressaltar que os clculos feitos aqui
devem servir apenas como orientao para o planejamento do estudo e no serem
tomados como deciso final.
Para fins prticos, segundo Cohen: participantes para detectar efeito mdio
(r=0.3), so necessrios 85 e para efeito grande (r=0,5), so necessrios 28; para efeito
pequeno (r-0,1), precisamos de 783.
- Amostras grandes: n > 100
- Amostras mdias: n > 30
- Amostras pequenas: n < 30
- Amostras muito pequenas: n < 12
Lembrar que: quanto menor a diferena a ser detectada, maior dever ser o
tamanho da amostra; quando menor o nvel de significncia (p), maior deve ser o
tamanho da amostra.
A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam
igualmente a ms concluses. Segundo Field, procedimentos estatsticos so uma forma
de processar nmeros e, portanto, se voc colocar baboseiras em uma anlise, mesmo
assim obter concluses com significado estatstico, mas que provavelmente no tero
sentido emprico (prtico). A estatstica no uma forma milagrosa, apenas um
recurso. Na determinao da verdade. Na anlise estatstica no existe um substituto
para o pensamento emprico.
Uma vez obtidos os dados, faz-se a anlise estatstica aplicando-se testes
escolhidos em funo do tipo de dados disponveis.
V-1-Teste t de Student
Este teste usado para avaliar a hiptese de que duas mdias so iguais ou no.
O valor do t calculado (tc) tanto maior quanto maior for a diferenas entre as mdias. O
nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a
companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua
pesquisa usando seu prprio nome e assim publicou com o nome Student.
importante para a aplicao do Teste t que a varivel em estudo tenha
distribuio normal ou aproximadamente normal.
O SPSS pode executar trs aplicaes do teste t em mdias: para uma amostra,
amostras independentes e amostras emparelhadas.
-para uma amostra: o objetivo verificar se a diferena entre o valor mdio,
que representamos por X obtido em uma amostra difere ou no significativamente da
populao referncia. Ou seja, testar se Ho: o = X onde o a mdia da populao
onde a amostra foi retirada. No se conhece o desvio padro () )da populao.
No menu SPSS, abrir os comandos File>Open>Data... e na e na caixa de

dilogo selecionar o arquivo corticosteride pr-natal.sav. importante verificar se a
distribuio dos dados segue uma distribuio normal (teste de Kolmogorov-Smirnov e
31
Shapiro-Wilk). Na janela Data Editor, selecionar Analyze>Compare means>One
Sample T-test (Figura 41).
Fig.41. Menu Analyze>Compare Mean>One-Sample T-test
-selecionar altura como Test Variable(s). -Em Test Value escreva o valor de 50 cm
(parmetro de referncia) (Figura 42).
Fig42. Caixa de dilogo One-Sample T-test
-Clicar em [OK] e teremos na tela do Output Viewer (Figura 43).

T-test
Fig.43. Resultados da janela Output Viewer
32
Interpretao: Na tabela One-Sample temos o valor do teste t (-40,627) e a
significncia do teste (Sig. 0,0000 (p<0,001) que permite rejeitar a hiptese nula (H o)
para o nvel de significncia de alfa<=0,05. Podemos ento dizer que a amostra de 218
recm-nascidos estudados vem de uma populao cuja mdia diferente (neste caso
menor) do que 50 cm.
-amostras independentes: sero comparadas duas mdias; as variveis devem ter
distribuio normal.
-Selecionar Analyze>Compare Means>Independent-Samples T-test (Figura 44).
Figura 44. Menu Analyze>Compare Means>Independent-Samples T-test
-Selecionar Estatura como Test Variable (s)

-Selecionar a varivel que vai definir o s grupos de casos (ex. sexo) como Grouping
Variable (varivel de agrupamento) (Figura 45).
Fig.45. Caixa de dilogo Independent-Sample T-test
-Clicar em [Define Groups] para definirmos grupos (Figura 46)
Fig.46. Caixa de dilogo Independent Sample T-test
33
-Digite os valores correspondentes usados para a varivel sexo: 1 e 2
-Clique em [Continue] (Figura 47)
Fig.47. Caixa de dilogo Independent Sample T-test
-Clicar em [OK]. Na tela de sada do Output Viewer ser mostrado (Figura 48):
Group Statistics
Fig.48. Resultado do Test t para amostras independentes
Na tabela Independent Samples test, temos os resultados do teste estatstico

escolhido, calculado de duas formas distintas:
-Equal variances assumed (assumindo igualdade de varincias)
-Equal variances not assumed (assumindo que as varincias so desiguais)
Para decidirmos sobre quais destes resultados vamos utilizar, o SPSS

disponibiliza o teste de Levene que testa a hiptese de igualdade das varincias.
34
Se a significncia do teste for <=0.05: rejeita-se a igualdade das varincias; se a
significncia do teste for >0.05, as varincias so iguais
No nosso exemplo, a significncia do teste de Levene foi 0,75 e assim usamos o
teste t para varincias iguais (Equal variances assumed). Neste caso, o valor do teste a
ser interpretado ser t=-1,568. Como a significncia maior que 0.05, no rejeitamos a
hiptese nula, ou seja, no h uma diferena estaticamente significativa entre as mdias
de estatura dos RN submetidos corticoterapia pr-natal em relao aos RN no
submetidos corticoterapia pr-natal.
Para determinar se existe diferena entre pesos nos dois grupos, usamos o teste
no paramtrico de Mann-Whitney (veja adiante), uma vez que o peso ao nascer no
segue os pressupostos da distribuio normal, como determinado pelo teste de
Normalidade Kolmogorov-Smirnov -Test t para amostras emparelhadas
s vezes os pesquisadores estudam os efeitos de um tratamento comparando-se:
-pares de indivduos (um gmeo recebe um tratamento e o outro, no).
-dois lados de um mesmo indivduo (aplicao de um tratamento para a
preveno de cries em um lado da arcada dentria e o outro lado sem tratamento-
controle).
-mesmo indivduo duas vezes (presso arterial antes e aps o tratamento em um
mesmo indivduo; diferena entre o peso mdio dos indivduos antes e depois da dieta).
-diferenas entre as mdias das hemoglobinas antes e depois da cirurgia
Ou seja: medidas feitas em dois pontos distintos no tempo
Ao usar o SPSS, temos que ter a certeza de que os dados foram digitados no
formato de duas variveis diferentes para cada caso.
No nosso banco de dados no temos amostras emparelhadas, ou seja, no temos
varivel de cada indivduo medida antes de depois de uma interveno. Citando o
exemplo de Wagner e cl: a diferena entre as mdias de hemoglobina antes e depois da
cirurgia atribuda ao acaso? Importante: como so amostras emparelhadas,
necessrio que os dados sejam digitados no formato de duas variveis diferentes para
cada caso, como hb1 e hb2 (pr-operatrio e ps-operatrio).
-Selecione Analyze>Compare Means>Paired-Simples T-test (Figura 49)
Fig. 49: Menu Analyze>Compare Means>Paired-Simples T-test
35
-Selecione as duas variveis emparelhadas e coloquem-nas no Paired Variables(s)
(Figura 50)
Fig.50. Caixa de dilogo Paired-Samples T-test

Clicar [OK] a seguir
A tabela do Output Viewer mostrar (Figura 51)
Fig. 51. Resultado do teste t para amostras emparelhadas

A tabela Paired Samples Correlations mostra o valor do coeficiente de correlao
de Pearson (vide adiante), assim como o valor da significncia para o coeficiente.
Devido s duas variveis representarem o mesmo grupo medido em momentos
diferentes (ou dois grupos emparelhados), o valor do coeficiente de correlao de
Pearson dever ser alto e o valor de significncia dever ser inferior a 0,05.
A tabela Paired Samples Test mostra diversas estatsticas, como mdia da
diferena entre os pares, desvio padro, erro padro da mdia, o valor do teste t, o
nmero dos graus de liberdade (df) e o valor da significncia do teste. A hiptese de que
no h diferena entre as hemoglobinas no pr e ps-operatrio (H o) rejeitada, pois o
teste de significncia (2-tailed) <0,05) (Figura 52)
Paired Samples Test
36
Fig. 52 Resultado do teste t para amostras emparelhadas
V-2. Anlise de Varincia, Teste F ou Teste de Tukey

At o presente momento discutimos formas de comparar dois grupos de pacientes
ou duas amostras. Muitas vezes torna-se necessrio comparar mdias de mais de duas
populaes.
Suponhamos que queiramos testar quatro drogas diferentes ao mesmo tempo
(quatro diurticos diferentes A, B, C, D) e que desejamos avaliar o efeito de cada uma
das drogas sobre o dbito urinrio em 16 voluntrios.
Para sabermos se os grupos so significativamente diferentes uns dos outros, se
algum dos diurticos testados tem um efeito diurtico importante, utilizando o teste t,
podemos comparar os grupos dois a dois, por meio de 6 testes t separados, o que poder
revelar uma diferena significativa entre os diurticos. Alm da perda de tempo com
este procedimento, poderamos estar incorrendo num erro tipo I, pois ao aceitar 5% de
erro em cada uma das 6 anlises separadas, haveria uma chance de 30% ( 6 x 5%) de
encontrar, por mero acaso, uma diferena estatisticamente significativa.
O uso da anlise da varincia (ANOVA: abreviao proposta por Tukey para
Analysis of Variance) indicar a probabilidade de que a hiptese nula seja verdadeira, ou
seja, probabilidade de que nenhuma diferena existe entre quaisquer dos grupos. Se a
hiptese nula (H0) for rejeitada, ser o indcio de que h diferena de potncia em algum
dos diurticos testados. Para localizar o diurtico envolvido, ser necessrio um teste
ANOVA de comparao de pares. Os testes de ANOVA se apiam na hiptese de que se
os grupos so semelhantes, a varincia em cada um (dentro) dos grupos semelhante
quela entre os grupos; o que estes fazem comparar a variabilidade das mdias de
todas as amostras com a variabilidade dentro das amostras.
Assim, o teste precisa determinar a variabilidade dentro de cada amostra, bem
como a variabilidade que existe entre mdias das amostras. Ao fazermos isto, geramos
uma estatstica chamada F, cuja frmula :
F = estimao da varincia ENTRE os grupos
estimao da varincia DENTRO dos grupos
F: distribuio F de R.A Fischer; o F observado ao F crtico, rechaa a hiptese nula
de que no h diferena entre as varincias.
Lembrem-se sempre que:
H0 (hiptese nula): no h diferena entre os grupos
37
H1 (hiptese experimental): h diferena entre os grupos
Com relao ao tipo de dados a ser introduzido no SPSS, a varivel dependente

dever ser quantitativa. A varivel independente (conhecida como Factor no
comando One-Way ANOVA-ANOVA com um fator: nico critrio de classificao),
dever ser numrica discreta (ou seja, nmeros inteiros) na definio das categorias
a serem comparadas.
As amostras devem ter uma distribuio normal (gaussiana); tambm assume a
igualdade de varincia entre os grupos das amostras a serem comparadas (o teste de
Levene verifica a homogeneidade de varincias).
Procedimento de anlise: Na janela Data Editor do SPSS, escolha:
Analyze>Compare Means> One-Way ANOVA (Figura 53)
Fig. 53.Menu Analyze>Compare Means> One-Way ANOVA

Na caixa de dilogo One-Way ANOVA, colocar idade gestacional como
Dependente List e Apgar como Factor. A seguir, clicar em [Options] (Figura 54)
Fig.54. Caixa de dilogo One-Way ANOVA

Na caixa de dilogo One-Way ANOVA Options, selecionar Descriptives,
Homogeneity of variances, Means plot e Exclude cases analysis by analysis e em
38
seguida, clicar em [Continue] para voltar janela anterior e finalize clicando em [OK]
(Figura 62)
Fig.55. Caixa de dilogo One-Way ANOVA: Options

Na janela Output Viewer, vai aparecer (Figura 56):
Fig. 56. Resultados do comando One-Way-ANOVA

Como interpretar? Esta primeira tabela mostra resultados de estatsticas
descritivas, como j vimos (nmero de observaes, mdia, desvio-padro, etc para
cada grupo e para o total de observaes.
A segunda tabela do Output Viewer mostra os resultados do teste de Levene (Figura 57):
Test of Homogeneity of Variances
Idade Gestacional
Levene
Statistic df1 df2 Sig.
1,390 8 209 ,203
Fig. 57. Resultados do comando One-Way-ANOVA
Como o valor de sig. >0,05, aceita-se H o, que mostra a igualdade de varincias

entre os 10 grupos.
39
A ltima tabela corresponde tpica tabela de apresentao do teste de ANOVA (Figura
58).
ANOVA
Idade Gestacional
Sum of
Squares df Mean Square F Sig.
Between Groups 211,110 8 26,389 5,908 ,000
Within Groups 933,501 209 4,467
Total 1144,612 217
Fig.58. Resultados do comando One-Way-ANOVA
Nesta tabela vemos o nome da varivel dependente (Idade Gestacional), a soma

dos quadrados (Sum of Squares), quadrado mdios (Mean Square), Valor do teste de F
(F), a significncia (Sig) que representa a probabilidade de afastar (F obtido superior ou
igual ao F crtico) ou aceitar a Ho (F obtido inferior ao F crtico). Consulte Margotto,
Entendendo Bioestatstica Bsica (www.paulomargotto.com.br em Entendendo
Bioestatstica Bsica). F crtico o valor de F encontrado nas tabelas dos valores de F.
A variao total dividida em dois componentes:
1-Between Groups (entre os grupos): significa variao das mdias dos quatro grupos
em torno da mdia geral para 95 observaes)
2-Within groups (dentro dos grupos): representa a variao das observaes individuais
em torno da mdia do respectivo grupo
Valores de significncia baixos indicam diferenas entre as mdias dos grupos.
Como a significncia foi 0,000 (valor de p<0,05), indica que h , pelo menos, uma
diferena entre os grupos analisados. Assim, rejeitamos a hiptese nula (a variabilidade
ENTRE os grupos foi suficientemente grande face variabilidade DENTRO dos
grupos). Portanto, podemos dizer que a idade gestacional mdia no igual entre os 10
grupos de Apgar no 5 minuto. No grfico das mdias para os 10 grupos de Apgar no 5
minuto, o grupo 3 (menor idade gestacional) destaca-se dos demais grupos (Figura 59).
Fig.59. Grfico das mdias para os 10 grupos de Apgar no 5 minuto. O grupo 3

destaca-se dos demais.
Testes de comparaes de mltiplas mdias
40
Na anlise de varincia, quando a diferena entre os grupos no significante,
no necessrio nenhum outro teste mais. No entanto havendo diferena significante
pelo F-teste, isto no quer dizer que todos os grupos difiram entre si. A ANOVA informa
somente se h ou no diferena estatisticamente significativa entre dois ou mais grupos,
mas no informa quais os grupos envolvidos. Vejam que aplicando a ANOVA no
exemplo que estamos estudando, as mdias dos 10 grupos no so estatisticamente
iguais. Mas qual ou quais so as mdias diferentes entre si?
Para identificar os grupos, deve-se realizar uma comparao entre os pares - pair
wise comparision test - que ir comparar cada grupo com cada um dos outros. Para
saber onde est a diferena, so necessrios testes de comparaes mltiplas de mdias
(Post Hoc). , pois comparam todos os grupos dois a dois. Um dos testes mais utilizados
o Teste de Tukey.
Como anteriormente, escolha na janela Data Editor do SPSS
Analyze>Compare>Means>One-Way ANOVA.
Na caixa de dilogo One-Way ANOVA, alm das opes que foram escolhidas no
procedimento anterior, clicar n em [Post Hoc].Veja na figura 60.
Fig.60. Caixa de dilogo do comando One-Way ANOVA

Na caixa de dilogo One-Way ANOVA: Pos Hoc, selecionar a opo Tukey e
clicar no boto [Continue] para voltar janela e em seguida, clicar [OK] (Figura 61).
Fig.61. Caixa de dilogo do comando One-Way ANOVA: Post Hoc Multiple

Comparisons
41
Alm das tabelas anteriores, surgira a tabela Post Hoc Multiple comparisons, onde se
encontram as comparaes entre as mdias dos dois grupos (Figura 62).
Fig.62. Resultados do comando One-Way ANOVA
42
-As diferenas significativas so mostradas com asteriscos (*).
-A coluna Sig mostra a significncia estatstica (p) para a diferena entre as mdias das
amostras (significante se p<0,05).
-A prxima coluna mostra os limites dos intervalos de confiana de 95% para as
diferenas entre as mdias das amostras.
Interpretao:Vejam que o Grupo 3 apresentou diferena significativa em relao
aos grupos 4,7 9 e 10, mas no em relao aos grupos 1 e 8.
Obtendo o grfico Boxplot como j vimos anteriormente (obtido com o comando
Explore,) d uma melhor viso do que o Means Plot, a distribuio da idade gestacional
no grupos de Apgar ao 5 minuto (Figura 63).Vejam:
Fig. 63.Grfico Boxplot de idade gestacional e Apgar no 5

Para verificar a existncia de diferenas estatisticamente significativas entre mdias
de mais de duas amostras ou medidas relacionadas (trs medidas feitas nos mesmos
indivduos, uma antes, uma durante e outra depois de uma determinada interveno ou
tratamento (medias feitas em trs pontos distintos no tempo), usamos o teste conhecido
como Anlise de Varincia para Medidas Repetidas ou ANOVA para Medidas
Repetidas. No SPSS: Analyze>General Linear Model>Repeated Measures. No
exemplificaremos por no dispor, no momento, de uma base de dados para esta anlise.
V-3.Qui-quadrado
A estatstica do qui-quadrado (Chi-square) adequada para variveis
qualitativas, com duas ou mais categorias, ou seja dados nominais (aqueles
distribudos em categorias nominais sem qualquer ordem, como sexo, raa, via de
43
parto,cor dos cabelos). A prova do qui-quadrado (X2) utilizada para comprovar se
existem diferenas estatisticamente significativas entre duas distribuies: mede o grau
de discrepncia entre um conjunto de freqncias observadas e um conjunto de
freqncias esperadas; o seu valor ser zero quando no houver diferena entre os
nmeros observados e os esperados.
O qui-quadrado quantifica a associao entre variveis qualitativas, comparando
as diferenas entre os valores observados e os esperados. Quanto maior for o valor da
estatstica X2, maior ser o grau de associao existente entre as duas variveis.
O qui-quadrado tambm pode ser usado para variveis quantitativas, uma vez
que possvel criar categorias para estas variveis, como, durao da internao,
categorizadas nas classes at 2 dias e mais de 2 dias.
Na aplicao do qui-quadrado, as freqncias tericas para cada casinha devem
ser iguais ou superiores a 5.
Os principais testes so o Teste Qui-quadrado para uma amostra e o Qui-
quadrado de independncia. Todas as frequncias esperadas devem ser maiores que 1
e no mximo 20% das frequncias esperadas podem ser menores que 5.A amostra total
deve ser maior que 20.
Teste Qui-quadrado para uma amostra
Nesta amostra que estamos trabalhando (uso de corticosteride pr-natal na
Maternidade do Hospital Regional da Asa Sul), as mes so igualmente distribudas
quanto ao tipo de parto, hipertenso, sexo e gemelaridade?
Para isto fazemos:
Analyze >Nonparametric Test>Legacy dialogs>Chi-Square (figura 64)(SPSS-18)
Fig.64. Analyze >Nonparametric Test>Legacy dialogs>Chi-Square
Em Test Variable List, selecione as variveis em estudo. Em Expexted Values

marque All categories equal (figura 65)
Fig.65. Chi-Square test
44
Clicar em OK e a sada do SPSS mostrar (figura 66)
Fig. 66. Sada do SPSS

Podemos observa em Test Statistics que as propores de mes no so iguais
quanto ao tipo de parto (p<0,002) e gemelaridade (p<0,001). No entanto, so iguais para
hipertenso materna e sexo dos recm-nascidos. Observem que para cada categoria da
varivel, o nmero de casos observados (Observed N), o nmero de casos esperados se
as propores fossem iguais (Expected N) e a diferena entre eles (Resdual).Observem
tambm que teste qui-quadrado compara as freqncias observadas com as frequncias
esperadas, considerando que a hiptese nula seja verdadeira.
45
Teste Qui-quadrado de independncia
Este verifica a existncia de associao estatisticamente significante entre duas

variveis categricas, medidas em escala nominal ou ordinal. No havendo
associao,dizemos que as variveis so independentes.
Como obter o qui-quadrado no SPSS: Analyze> Descritives> Crosstabs (Figura 67)
Fig.67. Menu Analyze> Descritives> Crosstabs
Na caixa de dilogo Crosstabs, selecionar uso sexo nas Row (s) (linhas) e uso
de corticosteride nas Column(s) (colunas) (Figura 65)
Fig.68. Caixa de dilogo do Crosstabs
Clicar em Cells e selecionar em Counts: Observed e em Percentages: Row (Figura 69)
46
Fig.69.Caixa de dilogo Crosstabs: Cell Display
Clicar [Continue]
Selecionar [Statistics] e selecionar Chi-Square, pressionar [Continue] (Figura 70)
Fig.70. Caixa de dilogo do Crosstabs:Statistics
Clicar [OK]
No Output Viewer sero mostradas a seguintes tabelas (Figura 71).
47
Fig.71. Resultados do teste do qui-quadrado utilizando o Crosstabs para o
uso de corticosteride pr-natal e sexo.
Entendendo melhor o resultado do Qui-quadrado
-Pearson Chi-Square: o valor calculado do teste (value=,0191), os graus de

liberdade (df=1) e a significncia ou valor-p (0,662). Este o resultado que
normalmente se utiliza ao realizar o teste do qui-quadrado.
-Continuity corection: uma correo no valor do qui-quadrado, utilizado no
caso de amostras pequenas (uma das clulas da tabela com n<5 ou n<20); tem o
objetivo de superestimar a significncia do teste. usado somente nas tabela 2 x 2
-Likehood ratio: constitui um teste alternativo ao qui-quadrado na verificao da
associao entre duas variveis medidas em escala nominal.Quando as amostras so
grandes,o seu resultado prximo ao qui-quadrado.
-Fishers Exact Test: o teste exato deFisher usado quando a amostra muito
pequena para permitir a utilizado do qui-quadrado (quando alguma freqncia
esperada<1 ou mais de 20% das frequncias esperadas <5 ou amostra total<20)
-Linear by-Linear Association: um teste para a verificao da existncia de
relao linear entre duas variveis medidas em escala ordinal. No apropriado para
variveis que foram medidas em escala nominal.
Podemos observar que no existe relao entre o uso de corticosteride no pr-
natal e sexo dos recm-nascidos, pois o valor do X2 pequeno (veja que o valor de p
-asymp.sig- maior que 0,05). Assim, so variveis independentes.
48
V-4- Risco Relativo e Odds Ratio
O Risco Relativo (RR) e Odds Ratio (OD) so medidas de fora de associao
(medidas de efeito), ou seja, medem a associao da varivel de desfecho com a
varivel de exposio: quanto da probabilidade de ocorrncia da varivel dependente
deve-se sua relao com a varivel independente. Os termos associao e efeito
referem-se ao fato de que uma varivel teria uma relao ou exerceria um efeito sobre
outra varivel. Como os resultados so decorrentes de uma razo, o valor de nulidade
para esses de 1 (um).
Selecionar Analyze>Descriptives Statistics>Crosstabs
Na caixa de dilogo do Crosstabs, selecionar PNIU (pneumonia) nas Column(s)
(coluna (s), e uso do corticosteride pr-natal nas Row (s) (linhas). Clicar em [Cells] e
selecionar Counts: Observed e Percentages: Row (Figura 72)
Fig.72. Caixa de dilogo Crosstabs: Statistics
Clicar [Continue]
Na caixa de dilogo Crosstabs, pressionar [Statistics]. Na caixa Crosstabs: Statistics

assinalar Chi-Square e Risk. Pressionar [Continue] (Figura 70)
49
Fig.73. Caixa de dilogo Crosstabs:Statistics
Clicar [OK]
No Output viewer teremos as tabelas. (Figura 74)
Fig.74.Resultados do X2
50
Interpretao: observamos que a pneumonia ocorreu significativamente menos nos
RN cujas mes receberam corticosteride pr-natal (OR: 0,31, com intervalo de
confiana de 0,12-0,77)ou seja, houve diminuio da pneumonia intra-uterina em 69%
(1-0,31=0,69 x 100= 69%) nos RN expostos ao corticosteride pr-natal em relao aos
RN no expostos e a estimativa da variabilidade foi de 23% a 88% (1-0,77=0,23 x
100=23% e 1-0,12=0,88 x 100= 88%). Esta associao significativa por no conter a
unidade no intervalo de confiana. Observe da significncia no Pearson Chi-Square em
Asymp.Sig (2-sided) que foi de 0,009
O Risco Relativo (RR) a medida da fora da associao entre a exposio e o
evento (resultado). A razo das chances (odds ratio - OR) definida como a
probabilidade de que um evento ocorra dividido pela probabilidade de que ele no
ocorra, ou seja o quociente entre a quantidade de eventos e a quantidade livre de
eventos (o mesmo modo que o RR avalia-se a variabilidade amostral da OR atravs do
clculo do intervalo de confiana e a interpretao a mesma do RR, ou seja, se o
intervalo de confiana da OR contiver a unidade, significa ausncia de associao). A
OR pode ser estimada em estudo tipo coorte (populao seguida da causa para o efeito)
e em estudo tipo caso- controle (populao seguida do efeito para causa). J o RR s
pode estimado em estudos tipo coorte e no em estudos tipo caso-controle, porque este
tipo de estudo no permite estimativa da taxa populacional do evento nos grupos
estudados.
Quando o RR ou a OR igual a 1, significa que no h efeito com o tratamento,
ou seja, o efeito do tratamento o mesmo nos dois grupos. Se o RR/OR < 1, significa
que o risco do evento menor no grupo tratado que no controle. A variabilidade
amostral do estudo pode ser avaliada atravs de testes de significncia ou via intervalo
de confiana. Aqui daremos preferncia segunda abordagem. Para um dado nvel de
significncia (p<= 0,05), o intervalo de confiana representa o intervalo onde deve estar
o parmetro, ou seja, o risco relativo verdadeiro. Se o valor 1, que se refere nulidade
da associao, no estiver contido no intervalo, temos uma confiana que na populao
de onde nossa amostra foi extrada, o RR diferente de 1, sendo, portanto significativo
o achado da amostra. Para a realizao dos clculos do risco relativo e o intervalo de
95% de confiana, assim como o seu significado, consulte www.paulomargotto.com.br,
em Entendendo Bioestatstica e Exerccio da Medicina Baseado em Evidncias.
O intervalo de confiana mostra o limite dentro do qual existe a certeza do

verdadeiro efeito do tratamento; estima a magnitude da associao e informa a
variabilidade da estimativa, atravs dos limites inferior e superior.
A seguir, planilhas para o clculo do Risco Relativo, Odds Ratio e Teste
Diagnstico( Braile DM e Godoy MF).
Clicar duas vezes nas figuras e elas transformam-se em planilhas!
Vejamos um exemplo: Uso de drogas na Sala de Parto e Uso do corticosteride pr-

natal
51
Digite APENAS nas caselas de cor laranja e NUNCA nas caselas azuis.
Juntamente com o resultado da odds ratio temos o intervalo de confiana.

Interpretao: houve diminuio do uso de drogas na sala de parto em 48% (1-
0,52=0,48 x 100) no grupo do corticosteride, porm no foi significativo, pois no
intervalo de confiana contem a unidade.
Voc pode tambm usar este site para realizar clculos estatsticos em Testes
Diagnsticos, obtendo a sensibilidade, especificidade, valor preditivo positivo e o valor
preditivo negativo, alm de poder obter a Estatstica Kappa, descrita por Cohen, o
chamado ndice Kappa para avaliar o grau de acerto do procedimento, ou seja, para
avaliar o quanto o resultado do procedimento escapa do azar. Temos usado a seguinte
escala de interpretao: 0,75 - 1: muito bom; 0,4< 0,74: regular a bom; 0,35:
ruim (o diagnstico no explicado pelo procedimento e sim pelo azar em 95% das
vezes). .Outros usam:
52
(<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa)
importante conhecer o intervalo de confiana a 95% do ndice Kappa para dar-lhe

mais peso ao resultado achado. A significncia dar-se- pela ausncia da unidade no intervalo de
confiana.
No item XI, discutimos a realizao da Estatstica k no SPSS na avaliao intra e entre-
observadores.
VI-CORRELAO E REGRESSO LINEAR SIMPLES

O termo correlao descreve a associao entre duas variveis numricas
(quantitativas); quantifica a fora da associao entre estas duas variveis. Uma
correlao expressa uma medida do relacionamento linear entre variveis. No
exemplo, peso e altura, em quanto aumenta o peso medida que a estatura aumenta? O
comportamento conjunto de duas variveis quantitativas pode ser observado atravs de
um grfico denominado Diagrama de Disperso e medido atravs do Coeficiente de
correlao.
Diagrama de Disperso:
Na representao grfica, importante sempre colocar no eixo das abscissas
(horizontal) a varivel independente ou explanatria ou preditora (X) e no eixo das
ordenadas (vertical), a varivel dependente ou desfecho. A correlao quantifica quo
bem X e Y variam em conjunto
Correlao linear de Pearson

O coeficiente de correlao (r de Pearson) expressa quantitativamente as
relaes entre duas variveis. um nmero puro, usado para classificar a correlao
em: r = 1: perfeita; r = 0,80 - <1: muito alta; r = 0.60 - <0,80: alta; r = 0.40 - <60:
53
moderada; r = 0,20 - <0.40: baixa; r = 0 - <0.20 muito baixa; r = 0: nula forte. O
coeficiente de correlao um ndice de magnitude na qual se associam duas variveis.
Antes de se realizar uma anlise de correlao, devemos fazer um grfico de
disperso (Scatterplot) para a verificao do comportamento das variveis.
No menu Graphs, selecionar Scatter (Figura 75).
Fig.75. Menu Graphs>Scatter
Na caixa de dilogo com representaes grficas para Scatterplot, escolher Simple

(Figura 76).
Fig.76 Caixa de dilogo Scatterplot

Na janela Simple Scatterplot, colocar no Y Axis (eixo Y) a varivel peso e no X Axis
(eixo X) a varivel altura e clicar [OK] (Figura 77).
54
Fig.77. Caixa de dilogo Simple Scatterplot
Na janela Output Viewer vai aparecer a seguinte figura (Figura 78)
Fig.78. Resultado do Scatterplot para as variveis peso e estatura
55
Dando um clik duplo com o mouse sobre o grfico, ser aberta a janela Chart
Editor, podendo assim ser editado o grfico. Selecionar Elements e Ft Line at total
(Figura 79).
Fig.79. Janela Chart Editor

Assim ser possvel a colocao da reta de regresso representando a associao
linear entre as duas variveis(Figura 80).
Reta de Regresso
r2
Fig.80. Scatterplot com a reta de regresso, representando a associao linear entre

as duas variveis
56
Observem que no canto direto do grfico aparece o R sq Linear, que
representa o coeficiente de Pearson ao quadrado (r2) (veja mais adiante)
Aps a avaliao do Scatterplot, solicita-se a anlise de correlao propriamente
dita: Analyze>Correlate>Bivariate e ser aberta a caixa de dilogo Bivariate
Correlations (Figura 81).
Fig.81. Menu Analyze>Correlate>Bivariate
Selecionar peso e estatura e transferir para a caixa Variables. As opes Pearson e

Two-tailed so selecionadas como padro (Figura 82)
Fig.82.Caixa de dilogo Bivariate Correlations onde se obtm o coeficiente de

correlao de Pearson
A seguir, clicar [OK]. Na janela do Output Viewer ser apresentada uma matriz
simtrica com o coeficiente de correlao de Pearson, alm do valor da significncia e
o nmero de casos vlidos (Correlations) (Figura 83)
57
r
Fig. 83.Resultado do clculo do coeficiente de correlao linear de Pearson com a

sua significncia
Assim, vemos que h uma correlao significativa (veja o Sig. (2-tailed:<0.05)
entre estatura e peso 0,44.
Correlao Parcial
A correlao parcial consiste na relao existente entre duas variveis,
eliminando a influncia de outras. No exemplo anterior, vamos controlar a idade
gestacional.
Analyze>Correlate>Partial (Figura 84)
Fig.84.Menu Analyze>Corelate>Partial
Na caixa de dilogo Partial Correlations, escolhemos controlar (Controlling for)
a idade gestacional. Clicar em [OK] (Figura 84).
58
Fig.84. Caixa de dilogo Partial Correlations
A janela do Output Viewer mostrar (Figura 85):
Fig.85. Output da anlise de Partial Correlations

Podemos ver que a correlao entre a estatura e o peso continua significativa
(p<0,001) e a correlao de 0,39. O r 2 (coeficiente de determinao) de 0,15 (a
estatura explica a variabilidade do peso do RN em 15%, quando controlamos a idade
gestacional).
Regresso linear simples

Como vimos, a correlao indica o grau de associao entre duas variveis, ao
passo que a regresso diz respeito capacidade de prever um valor baseado no
conhecimento do outro (de prever Y dado que X seja conhecido). A regresso tem como
objetivo quantificar o efeito do X sobre o Y. A essncia da anlise de regresso a
previso de algum tipo de sada (resultado) a partir de uma (regresso simples) ou mais
variveis previsoras (regresso mltipla). O conceito de regresso deve-se a Galton e
consiste em aproximar uma linha reta (reta de regresso) de uma nuvem de pontos de
um diagrama de disperso, ou seja, representa mediante uma reta a nuvem de pontos.
O mtodo dos mnimos quadrados uma forma de encontrar a linha que melhor
se ajusta aos dados (linha que passe entre ou o mais prximo possvel do maior
nmero de pontos de dados). Esta linha de melhor ajuste ou aderncia chamada de
linha de regresso.
O conceito de linearidade refere-se ao fato de que a relao entre duas variveis
possa ser representada mediante uma funo linear, ou seja, o incremento de uma
varivel produz o mesmo na outra varivel, de forma linear e constante
59
Como j citamos, quando a anlise de regresso linear envolve somente uma
varivel explanatria (X), a tcnica denominada Regresso Linear Simples. Quando
so envolvidas duas ou mais variveis explicativas, emprega-se a expresso Regresso
Linear Mltipla.
A seguir vamos realizar uma regresso simples com peso como varivel
dependente e a estatura como varivel independente (a que explica).
Analyze>Regression>Linear. Vai aparecer a caixa de dilogo de regresso linear.
Escolha o peso como varivel dependente e a estatura como varivel independente
(Figura 86).
Fig.86. Caixa de dilogo Linear Regression

Clicar em [Statistics] e selecionar Estimates, Model Fit, R squared chance e
Descriptives (Figura 87).
Fig.87. Caixa de dilogo Linear Regression: Statistics

Clicar [Continue] e em seguida, [OK]. Na janela do Output Viewer ser
mostrado (Figura 88).
60
Fig.88.Output viewer da anlise de regresso linear simples
Como j descrevemos existe uma correlao entre peso e estatura (r=0.44), ou
seja certa proporo da variabilidade do peso pode ser explicada pelo estatura. No
havendo correlao entre duas variveis, dizemos que elas so variveis independentes.
Na tabela Model Summary, vemos o r Squared (r2) igual a 0,193. O r2 conhecido
como coeficiente de determinao (deve ser interpretado como a proporo da variao
total que explicada) e estima que 19,3% (0,19) da variabilidade do peso explicada
pela estatura (tal como mostramos o grfico com a reta de regresso obtida no Chart
Editor, selecionando Elements e Ft Line at total(consulte a Figura 77).
J o Coeficiente de Alienao calculado 1- r2, sendo interpretado como a
proporo da variabilidade de Y que no explicada pela variabilidade de X. No
presente exemplo, 80,7% do peso no explicada pela estatura do recm-nascido.
Observando a tabela ANOVA vemos a significncia da razo F (p<0.0001),
indicando que o modelo de regresso (estatura) prev o peso bastante bem. No entanto
a ANOVA no informa a contribuio individual das variveis no modelo (neste caso,
61
como s h uma varivel no modelo, podemos inferior que esta varivel um bom
previsor).
Vamos agora interpretar a tabela Coeficients (os parmetros bo e b1 so
conhecidos como coeficientes de regresso): na equao de regresso bo representa o
intercepto y, ou seja, ponto onde a linha corta o eixo Y (Consulte Margotto
PR:Correlao em Entendendo Bioestatstica Bsica www.paulomargotto.com.br ) e
este o valor B na tabela. Podemos tambm ver o valor b1 da tabela e este valor
representa o gradiente (inclinao) da linha de regresso. O seu valor 38,572. Este
valor representa a mudana da varivel de sada para cada alterao de uma
unidade no previsor. Assim, se a varivel previsora (estatura) aumentada em uma
unidade , o modelo prev um aumento de 38,572g no peso. Para que a varivel
previsora tenha um impacto significativo na habilidade de prever o resultado, este b
deve ser diferente de zero e grande,quando comparado ao erro padro. Para estes dois
valores, as probabilidade (teste t) so de 0,000 e assim podemos afirmar que a estatura
tem uma contribuio significativa (p<0.001) para prever o peso ao nascer.
Portanto, a Equao da reta fica:
Peso ao nascer = bo (-251,117) +b1(38,572) x Estatura ao nascer
Exemplo:RN com estatura de 38,52cm,a previso do peso :1235g
REGRESSO MLTIPLA
Havendo vrios previsores, estaremos realizando uma Regresso Mltipla (esta

uma extenso lgica dos princpios da regresso linear simples quando h vrios
previsores). Os princpios bsicos so os mesmos da regresso simples, isto , procura-
se encontrar uma combinao linear de previsores que se correlacionam de forma
mxima com a varivel de sada. Para maiores informaes, sugiro consultar Andy
Field-Descobrindo a Estatstica usando o SPSS, 2009.
J a Regresso Logstica, que veremos a seguir, uma regresso mltipla, mas
com uma varivel de sada categrica dicotmica (dependente) e variveis previsoras
(explicativas ou independentes) contnuas ou categricas. Assim podemos prever a qual
de duas categorias provvel que esta varivel pertena, dada certas informaes.
Quando a varivel de sada dicotmica (como sim/no), no podemos usar a regresso
linear a despeito da semelhana entre a regresso linear e a logstica. Para uma
regresso linear ser vlida, os dados observados devem ter uma relacionamento linear.
Quando a varivel de sada dicotmica, esta hiptese normalmente violada. Atravs
de uma transformao logartmica voc pode contornar este problema, mantendo a
forma do relacionamento linear enquanto o prprio relacionamento em si no linear.
VII - REGRESO LOGSTICA BINRIA: Noes bsicas

A regresso logstica vem sendo utilizada em diversas reas. Este mtodo, tal
como as regresses linear e mltipla, estuda a relao entre uma varivel resposta e uma
ou mais variveis independentes. A diferena entre estas tcnicas de regresso se deve
ao fato de que na regresso logstica as variveis dependentes esto dispostas em
categorias (sim/no/alto/baixo/bom/ruim), enquanto na regresso linear estas variveis
so contnuas. A resposta na regresso logstica expressa por meio de uma
probabilidade de ocorrncia, enquanto na regresso simples, obtm-se um valor
numrico. Portanto, a regresso logstica apresenta-se como um mtodo na
determinao da probabilidade de ocorrncia dos valores preditos de uma varivel
dicotmica. Na regresso logstica as variveis independentes podem ser tanto fatores
62
quanto covariantes (dados contnuos) e as variveis dependentes podero estar dispostas
em duas ou mais categorias. Assim, temos a Regresso Logstica Binria (duas
Categorias), Ordinria e Nominal. A escolha de qual mtodo a ser utilizado depende do
nmero de categorias e das caractersticas da varivel resposta. Veja a tabela 3, a seguir:
Tabela 3: Tipos de varivel resposta (Penha RN, 2002)
Uma varivel binria aquela que aceita apenas dois nveis de resposta, como
sim ou no. J uma varivel ordinria segue uma ordenao natural das coisas, como
pequeno, mdio e grande ou classificao como ruim, bom ou excelente. A varivel
nominal tem mais de trs nveis sem nenhuma ordenao (objeto azul, preto, amarelo e
vermelho ou na previso do tempo, ensolarado, nublado, chuvoso).
Em resumo, a regresso logstica uma regresso mltipla, mas com uma
varivel de sada categrica dicotmica e variveis previsoras contnuas ou categricas.
No exemplo a seguir vamos realizar uma Regresso Logstica Binria
utilizando o SPSS. No exemplo, a varivel resposta ser a ocorrncia de Apgar<= 3 no
5 minuto (sim ou no), caracterizando uma varivel binria. As variveis independentes
escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5
minuto: corticide, hipertenso materna, tipo de parto e pr-natal.
Analyze>Regression>Binary Logistic (Figura 89)
Fig.89. Menu Analyze>Regression>Binary Logistic

Na caixa de dilogo Logistic Regression, selecionamos apgar5minmenor3
(Apgar <=3: sim e >3: no no 5 minuto) como varivel dependente (binria),que
varivel de sada e corticosteride pr-natal (cortico), hipertenso, parto e pr-natal em
Covariates (covariveis), que sero as variveis previsoras. Clicar em Options e
selecionar Cl for exp(B(Figura 90).
63
Fig. 90. Caixa de dilogo principal da regresso logstica
Como na regresso mltipla, existem vrios mtodos diferentes que podem ser
utilizados na regresso logstica. Selecionar o mtodo clicando na seta que aponta para
baixo prximo ao quadro denominado em [Method]. O mtodo padro de conduzir esta
regresso o enter, o mesmo da entrada forada da regresso mltipla em que todas as
covariveis so colocadas no mesmo modelo de regresso em um nico bloco e as
estimativas dos parmetros so calculadas para cada bloco. Sendo assim, optamos por
Enter (Figura 91).
Fig.91. Mtodos de regresso

Neste nosso exemplo, existem 3 variveis independentes (previsoras) categricas
que so o parto (cesrea ou normal), hipertenso (sim ou no) e corticosteride (sim ou
no). Uma das qualidades da regresso logstica que ela aceita previsores categricos.
Assim, necessrio indicar ao SPSS quais variveis so categricas, clicando em
[Categorical] na caixa de dilogo da regresso logstica para ativar uma nova caixa de
dilogo Define Categorical Variables e envie para a direita a varivel categrica
cortico, como est na Figura 92.A seguir pressione [Continue].
64
Fig.92. Definindo as variveis categricas na regresso logstica
Retornando a Caixa de dilogo principal da regresso logstica, pressionar
[Save] e selecionar toas as opes disponveis, como mostra a Figura 93. O exame dos
resduos extremamente importante para verificar a qualidade do ajuste do modelo aos
dados observados.
Fig 93. Caixa de dilogo para a determinao de resduos de regresso.

A seguir, na caixa de dilogo principal da regresso logstica, clicar em
[Options]. (Figura 94). Em geral as opes padres so suficientes. Nesta caixa de
dilogo voc pode solicitar ao SPSS que apresente um intervalo de confiana para a
estatstica exp b. Voc tambm pode solicitar a estatstica de aderncia de Hosmer-
Lemeshow que pode ser utilizada para avaliar quo bem o modelo escolhido se ajusta
aos dados, comparando as freqncias observadas e as esperadas. Pressionar [Continue]
para retornar a caixa de dilogo principal da regresso logstica.
65
Fig. 94. Caixa de dilogo para as opes da regresso logstica
Pressionar [Continue] para retornar a caixa de dilogo principal da regresso logstica e
seguir, clicar em [OK]) e o Output Viewer mostrar (Figuras 95).
-codificao da varivel dependente - codificao das variveis previsoras
Fig.95. Output viewer da regresso logstica

A ltima linha desta tabela apresenta a estatstica qui-quadrado dos resduos
como 14,019 que significante (p<0,05) ( chamada de Overal Statistics-estatstica
global). Esta estatstica informa que os coeficientes para as variveis que no esto no
modelo so significativamente diferentes de zero, ou seja, que a adio de uma ou mais
destas variveis ao modelo ir afetar significativamente o seu modelo de previso; se o
p fosse >0.05, isto significaria que nenhuma das variveis excludas do modelo
contribuiria de forma significativa para o poder preditivo do modelo e assim, a anlise
terminaria neste estgio.
66
A coluna Score mostra o valor da estatstica do escore eficiente de Roa.
Observem que a hipertenso, seguida pelo corticosteride e o tipo de parto apresentam
maior escore eficiente de Roa significativos.
Estimativa dos coeficientes dos previsores includos no modelo: fornece os coeficientes
e estatsticas para as variveis que foram includas no modelo (figura 96):
Fig.96.Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
Uma estatstica importante a estatstica de Wald que tem uma distribuio qui-
quadrado e nos informa se o coeficiente b para um dado previsor difere
significativamente de zero. Se isto ocorrer, podemos dizer que o previsor est
contribuindo de modo significativo para a previso da sada. Assim , com relao a
estes dados, podemos dizer que o uso do corticosteride pr-natal um previsor
significativo para a no ocorrncia de Apgar <= 3 e que a hipertenso materna
representa um fator de risco. A exp b(Exp (b) interpretada como uma mudana nas
chances: se o valor for maior que 1, ele indica que medida que o previsor aumenta,
aumentam as chances de uma sada ocorrer; j um valor menor que 1, indica que
medida que o previsor aumenta, as chances de uma sada ocorrer diminuem. Neste
exemplo, podemos afirmar que as chances do RN cuja me recebeu esteride pr-natal
de apresentar um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 1- 0,427=0,573 x
100= 57,3%) em relao ao RN no exposto ao esteride pr-natal. J a hipertenso
materna constituiu um fator de risco, aumentando em 2,3 vezes mais o risco de do RN
cuja me teve hipertenso de apresentar um Apgar <= 3 em relao ao RN cuja me
no teve hipertenso. Observe que no intervalo de confiana de ambas variveis
previsora includas no modelo NO contm a unidade).
Vejamos a interpretao de outro exemplo: Regresso logstica para a Sepse. As
variveis individualmente associadas significativamente com a sepse (corticoide, Apgar
no 1 minuto, Apgar no 5 minuto, reanimao, uso do CFR, necessidade de intubao,
uso de drogas para a reanimao, Apgar <=3 no 5 minuto) entraram no modelo de
regresso logstica. Aps realizar os passos anteriormente explicados, obtemos as
estimativas dos coeficientes dos previsores includos no modelo (Figura 97)
Fig.97. Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
Como interpretar: A regresso logstica binria apresenta-se um mtodo para

determinar a probabilidade de ocorrncia dos valores preditos de uma varivel
67
dicotmica. A apresentao tem como componentes chaves o P-value, o valor dos
coeficientes e as odds ratio (Exp (B). A interpretao dos resultados est focalizada
nestes componentes. Assim, vejam que as duas variveis que permaneceram no modelo
foram o corticosteride pr-natal (Exp(B) de 0,545 (Odds ratio ajustada), que traduz
uma diminuio da sepse nos RN expostos ao esteride pr-natal de 46% (1-0,545=0,46
x100=46%) e a Intubao que constituiu um fator de risco (aumento de 2,78 vezes a
sepse nos RN intubados em relao aos no intubados).
Veja outro exemplo da aplicao da regresso logstica: o estudo de Whelan B
et al avaliaram o sdio srico como um fator de risco para a mortalidade intrahospitalar
em pacientes grave admisso. A Odds ratio para a morte dentro de 30 dias da
admisso foi de 4,07 (IC a 95%%: 2,95-5,63) quando o paciente apresentava
hipernatremia e 3,36 (IC a 95% de 2,59-4,36) quando apresentava hiponatremia. A
regresso logstica foi usada para calcular a Odds ratio ajustada: fatores que foram
includos neste ajuste foram o escore de severidade da doena, permanncia na UTI,
efeito da idade, sexo, transfuso de sangue e sepse. Aps o ajuste, para hipernatremia, a
Odds ratio (ajustada) para a morte passou para 1,41 (Intervalo de confiana de 0,97-
2,07: no alcanou a significncia, pois no intervalo de confiana contm a unidade) e a
Odds ratio (ajustada) para hiponatremia passou para 2,00 (Intervalo de confiana a
95% de 1,44-2,77, ou seja, foi menor, porm continuou significativa, pois no intervalo
de confiana no contm a unidade). Assim, o sdio srico um poderoso marcador
inicial para a mortalidade, mas a mortalidade no grupo hipernatrmico primariamente
um fator de severidade da doena. J para a hiponatremia o aumento da mortalidade
independente de outras variveis. Portanto, os dados deste estudo nos informam que o
sdio srico na admisso um importante determinante da mortalidade intrahospitalar
em todos os pacientes. O sdio na admisso pode ser usado para estratificar os pacientes
que vo necessitar de uma terapia mais agressiva e maior monitorizao e em particular
a hiponatremia que necessita de tratamento cuidadoso para evitar um excesso de
mortalidade que independentemente associada com anormalidade deste distrbio.
Quanto multicolinearidade, apenas a ttulo de informao: a
multicolinearidade existe quando observamos uma forte correlao entre dois ou mais
previsores (variveis explicativas) em um modelo de regresso; este fato dificulta a
avaliao da importncia individual de um previsor (se ambos previsores so altamente
correlacionados e cada um responsvel por uma varincia similar dos resultados,
como vamos poder dizer qual entre as duas variveis a mais importante? Na verdade
no podemos dizer, pois o modelo pode incluir qualquer uma delas de forma
intercambivel. Na regresso mltipla, o SPSS produz vrios diagnsticos de
colinearidade, entre eles o VIF (Fator de Inflao da Varincia). O FIV indica se um
previsor tem um relacionamento linear forte com outro(s) previsor (es): um valor acima
de 10 leva-nos a preocupao. Tal preocupao da colinearidade com a regresso
mltipla, ocorre tambm com a regresso logstica, sendo ento essencial testar a
colinearidade numa anlise de regresso logstica. Como o SPSS no tem opo para
fazer um diagnstico de colinearidade na regresso logstica, podemos obter estatsticas
tais como as de tolerncia (Valor menor que 0,1 indica um problema srio de
colinearidade) e VIF simplesmente executando uma anlise de regresso linear
utilizando as mesmas variveis de sada e os mesmos previsores.
Em Analyze >Regression>Linear. Clicar em Statistics e depois selecione
Colinearity diagnostics (diagnstico de colinearidade) e desmarque todas as opes
padres e clicar em [Continue] para volta caixa de regresso linear e pressionar [OK].
No Output viewer (sada do SPSS), vamos ter a Tolerance (tolerncia) e a VIF.
(Consultem as Figuras 98, 99 e 100).Vejamos um exemplo: aps identificar as variveis
68
associadas individualmente com o bito, realizamos uma regresso logstica e no
modelo, as variveis que persistiram foram a ventilao mecnica e o tipo de parto
(tanto a ventilao mecnica como o parto normal aumentaram significativamente o
bito:OR de 5,63, com IC a 95% de 2,37-13,37 e OR de 2,22 com IC a 95% de 1,02-
4,85). Vejamos a colinearidade da regresso logstica que realizamos entre Ventilao
Mecnica e Tipo de Parto
Fig. 98: Caixa de dilogo para a regresso linear para os dados de bito
Fig. 99: Caixa de dilogo para a Statistics da regresso linear selecionando Colinearity diagnostics
Fig.100: Output viewer do diagnstico de colinearidade para os dados do bito

Como podemos observar podemos concluir com segurana que no existe colinearidade
entre as variveis previsoras, uma vez que a tolerncia (Tolerance) e o Fator de Inflao da
Varincia (VIF) das variveis previsoras so >0,1 e <10, respectivamente. Assim, o segundo
previsor tem uma probabilidade maior de ser responsvel por uma varincia dos resultados do
que quando existia um nico previsor.
69
VIII- TESTES NO PARAMTRICOS
Os estatsticos escolhem um teste paramtrico (a maioria dos testes de hipteses
vistos anteriormente) quando esto seguros de que a distribuio normal no foi violada
e testes no paramtricos porque no esto seguros de que a distribuio normal foi
encontrada (estes ltimos no so to eficientes quanto aos paramtricos para detectar
diferenas na populao).
Estes testes no requerem a estimao da varincia e da mdia da populao.
So testes que podem ser usados tanto para variveis nominais como para variveis
ordinais ou quantitativa
Entre os testes no paramtricos, vamos comentar sobre os mais usados
-Teste do Qui-quadrado (j estudado)
-Teste Binomial
-Teste U de Mann-Whitney
-Teste de Wilcoxon
-Teste de McNemar
-Teste de Kruskal-Wallis
-Teste de Friedman
O Teste de Kolmogorov-Smirnov, como j comentamos, avalia a normalidade de
variveis quantitativas, como exemplo, o peso, permetro ceflico e estatura
Analyze>Nonparametric Test e realizamos como j comentamos anteriormente (Figura
98) e selecionar 1.Sample K-S (Figura 101).
Fig.101. Menu Analyze>Nonparametric Test
Fig.102. Caixa de dilogo One-Sample Kolmogorov-Smirnov Test

Clicar em [OK] e o Output viewer mostrar (Figura 103).
70
Fig. 103. Output viewer do One-Sample Kolmogorov-Smirnov Test
Como podemos ver, as varivel estatura e permetro ceflico (PC)
mostraram-se com caractersticas de variveis que seguem a distribuio normal
(p=0,29 e 010), o que no ocorreu com a varivel peso (p<0.05). Toda vez que o teste
de Kolmogorov-Smirnov apresentar p <0.05, significa fuga de normalidade.
VIII-1-Teste Binomial
Este teste usado para testar propores em uma varivel dicotmica (sim/no,
doente/no doente/parto normal/sexo masculino, etc). Testa se a proporo de uma das
respostas igual ou diferente a uma determinada proporo ou para testar se as
propores das duas categorias de resposta so iguais ou diferentes (por
exemplo,percentual de uso de corticosteride pr-natal= percentual de no uso, ou
percentual de parto normal igual ao percentual de cesariana).
No exemplo a seguir, usando a base de dados Uso de Corticosteride Pr-Natal na
Maternidade do Hospital Regional da Asa Sul, vamos testar se o percentual de parto
normal igual a 50% (hiptese nula) ou diferente de 50% (hiptese alternativa).
Selecionar Analyze>NonparametricTest>Legacy >Legacy Dialogs(SPSS 18).Veja
na figura 104.
Fig.104. >NonparametricTest>Legacy >Legacy Dialogs

A seguir, selecione a varivel que estamos testando, Tipo de Parto, coloque na caixa
de dilogo Test Variable List (figura 105).
71
Fig.105. Caixa de dilogo Binomial Test
Clicar em OK e a sada do SPSS mostrar (figura 106).
Fig.106. Resultados do Teste Binomial (Binomial Test)
Interpretao: o resultado do Teste Binomial neste caso indica que o percentual do

de ocorrncia de parto normal diferente de 50% (p=0.003) e assim, aceitamos a
hiptese alternativa. Neste resultado observamos: o nmero (N) de casos de cesariana
(132) e de parto normal (87%); a proporo observada (Observed Prop) para cesariana
(60%) e parto normal (40%), a proporo a ser testada (Test Prop) que 50% e a
significncia ou valor-p (p-0.003).
VIII-2-Teste U de Mann-Whitney
Usado para a comparao de variveis ordinais ou quantitativas entre dois
grupos independentes,quando a distribuio no simtrica (normal), ou seja quando h
ruptura dos pressupostos paramtricos; corresponde ao teste t de Student para amostras
independentes.
Quando a amostra tiver mais de 20 observaes, a estatstica U tende a uma
distribuio normal; no Output Viewer ser apresentado o resultado da estatstica z,
alm do resultado do teste U, mas a significncia pelo valor p, ser a mesma.
Selecionar Analyze>Nomparametric Test>2 Independent Samples (Figura 107)
72
Fig.107.Menu Analyze>Nomparametric Test>2 Independent Samples
Vamos utilizar as variveis peso e uso do corticosteride pr-natal para calcular o
teste de Mann-Whitney. Na caixa de dilogo Two-Independent-Samples Test, selecionar
as variveis peso em Test Variable List e uso do corticosteride pr-natal com Grouping
Variable. Pressionar Define Groups e definir Group 1 como 1 e Group 2 como 2.
Neste exemplo estamos usando uma varivel quantitativa que no tem a
distribuio gaussiana (NORMAL) que o peso (veja anteriormente o Teste de
Kolmogorov-Smirnov) e vamos comparar com os RN cujas mes receberam
corticosteride pr-natal (cortico-1) e mes que no receberam corticosteride pr-natal
(cortico-2) (Figura 108)
Fig.108. Caixa de dilogo Two-Independent-Samples Test

Clicar em [OK] e o Output viewer mostrar (Figura 109)
73
Fig. 109. Output viewer do teste U de Mann-Whitney
O teste de Mann-Whitney cria um ranking (ordenao) de todos os casos
(independente do grupo) e depois compara estes ranking entre cada grupo. Observamos
o rank mdio e a soma dos rankings de cada grupo (havendo diferena significativa
entre os grupos, espera-se que os rankings mdios sejam bem diferentes). Em Test
Statistics, podemos observar que no h diferena entre os pesos dos RN das mes
que receberam corticosteride pr-natal e dos RN cujas mes no receberam
(p>0.05).
VIII-3- Teste T de Wilcoxon

Este teste substitui o teste t de Student para amostras emparelhadas, quando os
dados so medidos em escala ordinal ou quando no seguem a distribuio normal.
Baseia-se nos postos (ranks) das diferenas intrapares. Como na nossa base de dados
no temos amostras emparelhadas, vamos dar o exemplo de Wagner MB e cl;
hemoglobina no pr-operatrio e hemoglobina no ps-operatrio.
Na caixa de dilogo Two-Related-Samples Test>2 Related Samples (Figura 110)
Fig.110. Caixa de dilogo Two-Related-Samples Test
74
Na caixa de dilogo Two-Related-Samples Tests, selecionar o par de variveis a
ser comparado, colocando-os na lista de pares de variveis (Test Pair(s) List). Em Test
List, escolher o teste de Wilcoxon (Figura 111).
Fig.111. Caixa de dilogo Two-Related-Samples Test, de onde pode ser obtido o teste
de Wilcoxon
Clicar em [OK] e o Output viewer mostrar (Figura 112).
Fig. 112. Resultado do Teste de Wilcoxon.
75
Nos resultados observamos que o Teste de Wilcoxon calcula as diferenas entre
os valores das duas variveis e cria um ranking (ordenao) destas diferenas,
classificando-as em diferenas negativas, positivas e empates (ties). A seguir, mostra a
mdia e a soma dos rankings das diferenas negativas e positivas. Observem que h 82
diferenas negativas (o valor da hemoglobina no ps-operatrio foi menor do que no
pr-operatrio),13 positivas (o valor da hemoglobina no ps-operatrio foi maior do que
no pr-operatrio) e em 5 casos, houve empate, ou seja,os valores da hemoglobina pr e
ps-operatrio foram iguais. Em Test Statistics, temos os resultados da estatstica de
teste (Z):considerando o nvel de significncia (p<0.001), podemos afirmar que a
hemoglobina do ps-operatrio significantemente menor que a hemoglobina do pr-
operatrio
VIII-4-Teste H de Kruskal-Wallis
Este teste uma alternativa no paramtrica para a anlise de varincia de um
critrio de classificao (One-Way ANOVA). Pode ser usado para comparar vrias
amostras independentes. Ao ser usado 2 grupos para comparao, os resultados so os
mesmos dos teste de U de Mann-Whitney. Como ocorre no teste F de uma NOVA
paramtrica, um valor significativo de F no indica onde se encontra a diferena,
devendo ser realizado o teste de Tukey. J no teste H de Kruskal-Wallis, para identificar
a diferena, deve ser realizado o teste de Dunn, no disponvel no SPSS.
Selecionar Analyze>Nonparametrics Test>K Independent Samples (Figura 113)
Fig.113. Menu Analyze>Nonparametrics Test>K Independent Samples

Na caixa de dilogo Test for Several Independent Samples, selecionar as variveis
a testar (idade gestacional, Apgar no 5 minuto e peso, variveis assimtricas, como
demonstrado pelo teste de Kolmogorov-Smirnov) em Test Variable List. Selecionar a
varivel que define os grupos em Grouping Variable. Pressionar Define Range e indicar
os cdigos dos grupos (Figura 114).
76
Fig. 114. Caixa de dilogo Test for Several Independent Samples de onde se obtm o
teste H de Kruskal-Wallis
Na janela do Output Viewer, vamos ter (Figura 115):
Fig. 115. Resultado do teste H de Kruskal-Wallis

Inicialmente vemos o nmero de casos e o ranking (ordenao) mdio dcada
grupo.No havendo diferena significativa entre si,espera-se que os rankings mdios
sejam prximos. Podemos observar que no h diferena significativa entre a idade
gestacional e o peso ao nascer dos RN de mes que receberam corticosteride em
relao aos RN das mes que no receberam, o que NO ocorre com o Apgar no 5
minuto (os RN das mes que receberam corticosteride no pr-natal tiveram
significativamente maior Apgar no 5 minuto).
77
VI-5- Teste de Friedman
Este teste uma extenso do teste de Wilcoxon; usado para o caso de diversas
amostras emparelhadas, quando os dados so medidos em escala ordinal ou tem
distribuio assimtrica. Ao usar 2 grupos, os resultados so semelhantes ao teste de T
de Wilcoxon.
Como no nosso arquivo no temos dados para esta situao especfica, vamos
usar o exemplo de Wagner MB e cl: Hb antes e aps a cirurgia. Veremos a semelhana,
ao examinar os resultados na janela do Output viewer, com o teste T de Wilcoxon.
Analyze>Nonparametrics Test>K Related Samples (Figura 116)
Fig.116. Menu Analyze>Nonparametrics Test>K Related Samples

Na caixa de dilogo Test for several Related Samples, adicionar as variveis hb1 e
hb2 (Figura 117)
Fig.117. Caixa de dilogo Test for several Related Samples, de onde se obtm o teste
de Friedman
Clicar em [OK] e a janela do Output Viewer mostrar (Figura 118)
78
Fig.118. Resultado do teste de Friedman
Observamos haver diferenas significativas nos nveis de hemoglobina no ps-
operatrio (menor) do que no pr-operatrio. Podemos observar as semelhanas dos
dois testes, Wilcoxon e Friedman.
VIII-6- Coeficiente de correlao de Spearman

Este coeficiente o substituto do coeficiente de Pearson, sendo empregado
quando as variveis quantitativas forem assimtricas. Exige que as variveis tenham
sido medidas em escala ordinal. Apresenta a mesma amplitude no resultado do
coeficiente de Pearson, variando de -1 (correlao negativa perfeita) a + 1 (correlao
positiva perfeita), passando por zero (ausncia de correlao). A interpretao
semelhante ao coeficiente de Pearson, porm o coeficiente de Spearman indica a
correlao entre os postos e no entre os valores efetivamente medidos.
Para exemplificar, vamos fazer uma correlao entre peso ao nascer e idade
gestacional
Analyze>Correlate>Bivariate (Figura 119)
Fig.119. Menu Analyze>Correlate>Bivariate
79
Na caixa de dilogo Bivariate Correlations, colocar as variveis em estudo, peso e
idade gestacional (apresentam distribuio assimtrica como comprovamos com o teste
de Komogorov-Smirnov) e marcar Spearman em Correlation Coefficients (Figura 120)
Fig. 120. Caixa de dilogo Bivariate Correlations, de onde se obtm o coeficiente de

Spearman
Pode-se obter estatstica descritiva se for pressionado [Options] e marcado
means and stardard desviation, na caixa de dilogo Bivariate Correlations (Figura
121).
Fig.121. Caixa de dilogo Bivariate Correlations: Options

Na janela Output Viewer, vamos observar (Figura 122 e 123).
Fig.122. Resultado do coeficiente de Spearman entre peso e altura.
Fig.123. Resultado do coeficiente de Spearman entre peso e altura.
80
O coeficiente de correlao de Spearman entre idade gestacional e o peso foi de
0,22, uma correlao fraca.
Outros coeficientes de correlao no paramtricos podem ser obtidos no SPSS,
como os coeficientes propostos por Kendall (tau-veja adiante), Goodman-Kruskal
(gamma) e Somers (d). Estes coeficientes no so encontrados no menu de testes no
paramtricos. Os coeficientes de Spearman e Kendal, alm do paramtrico Pearson, so
encontrados em Analyze>Correlate Bivariate. J os demais podem ser encontrados
dentro das opes (Statistics) do comando Crosstabs (Analyze>Descriptive Crosstabs).
VIII-7- Teste de McNemar

Este teste utilizado para verificar as diferenas entre duas amostras relacionadas,
porm a varivel testada deve ser dicotmica, como sim/no; presena/ausncia. O
teste verifica a existncia de diferenas entre propores para amostras relacionadas.
Este teste til quando tivermos dados nominais em vez de ordinais Em
Analyze>Nonparametrics Test>Legacy Dialogs>Related Samples (SPSS 18) (figura
124).
Fig.124. Analyze>Nonparametrics Test>Related Samples

Para exemplificar a realizao deste teste no SPSS, usamos usar o arquivo
ambiente.sav, retirado do site da MEDBOOK-Editora Cientfica Ltda, 2009
(www.medbookeditora.com.br, do livro SPSS-Anlise de Dados Biomdicos.
Mota,VT e Oliveira FP
Este arquivo apresenta resultados da aplicao de dois questionrios com 92 pais
de crianas adolescentes asmticos, um aplicado antes e outro, 100 dias aps a
realizao de um programa de esclarecimento de adoo de medidas que visam
controlar o ambiente. Foi perguntado aos pais se havia conhecimento das medidas de
controle ambiental e eles aplicavam-nas.
81
A pergunta : podemos concluir (hiptese alternativa, a H 1) ou no (hiptese nula
ou H0) que a realizao do programa aumentou o conhecimento dos pais em relao s
medidas de controle ambiental?
Na caixa de dilogo Two-Related-Samples Test, selecionar as variveis de teste

(Test Pair(s) List)-Conhecem-Momento 1[Antes] e Conhecem-Momento 2 [Depois].
Em Test type marque McNemar e desmarque Wilcoxon (figura 125).
Fig.125. Caixa de dilogo Two-Related-SamplesTest

Clicar OK e a sada do SPSS mostrar (figura 126):
Fig.126.Resultado do Teste McNemar

Interpretao (NRM-Consultoria Estatstica Ltda, Porto Alegre):Na parte inicial do
Teste de McNemar, 33 pais (27+6) conheciam as medidas antes do programa e 59 pais
(27+32) passaram a conhecer as medidas aps o programa. Em Test Statistics dos
82
resultados, temos o nmero total de casos pesquisados (N), o valor calculado do teste,
que baseado na distribuio do Qui-quadrado (Chi-Square=16,447) e a significncia
do valor-p (p<0.001). Assim, afastamos a hiptese nula e aceitamos a hiptese
alternativa, que nos mostra que o programa de incentivo adoo de medidas de
controle ambiental aumentou o percentual dos pais com o conhecimento destas medidas.
Este percentual que era de 33% (33/92) antes do programa, passou para 64% (59/92)
depois do programa.
O Teste de McNemar tambm pode ser realizado de outra forma: Analyze>Descriptive
Statistics>Crosstab>Statistics, marcando a opo McNemar.
IX- CURVA DE KAPLAN-MEIER
Muitos estudos, em medicina, so planejados para determinar se uma droga,
tratamento ou procedimento novo tem melhor desempenho do que outro normalmente
usado, ou seja, so feitas avaliaes dos efeitos de curto prazo. No entanto tambm
importante a avaliao dos resultados a longo prazo, incluindo a morbimortalidade.
Nos estudos de avaliao das taxas de sobrevivncia entre pacientes submetidos
a certos tratamentos ou a certos procedimentos, o resultado ser binrio-sobrevivncia
ou morte do paciente e o objetivo ser estimar o intervalo de tempo que os pacientes
sobrevivem com tipos especficos de tratamento ou em condies especficas.
Na anlise de sobrevivncia, a varivel dependente (resultado) sempre o
tempo at a ocorrncia de determinado evento (j na anlise estatstica clssica, a
varivel dependente a ocorrncia de determinado evento, como cura, desenvolvimento
da doena, efeito colateral).
Vejam assim que na anlise de sobrevivncia compara-se a rapidez com que os
participantes desenvolvem determinado evento, ao contrrio de comparar as
percentagens de doentes que desenvolvem o evento, ao fim de um determinado perodo
de tempo. O evento final da anlise de sobrevivncia pode no ser somente a morte,
podendo ser outro evento, como recidiva, progresso da doena, efeito colateral.
Quando se fala em tempo de sobrevida na anlise de sobrevivncia no significa que
seja necessariamente o tempo at a morte e sim o tempo at a ocorrncia de
determinado evento. Assim, devido diferena do tipo de varivel dependente usada,
todos os mtodos estatsticos que usamos normalmente na anlise clssica, no podem
ser usados quando realizamos anlise de sobrevivncia, devido diferena do tipo de
varivel dependente que utilizada. A anlise clssica e a de sobrevivncia tem mtodos
prprios (consulte a tabela 4)
83
Tabela 4. Tcnicas estatsticas usadas na anlise clssica e na anlise de
sobrevivncia (Botelho F et al)
Nos estudos de seguimento, principalmente aqueles de longa durao, os

pacientes que no atingem o tempo total de seguimento previsto, so excludos. J na
anlise de sobrevivncia, os dados destes pacientes so aproveitados na anlise final,
mesmo que no desenvolvam o evento em estudo. Quando isto ocorre, designa-se o
indivduo como censurado. Portanto, a anlise de sobrevivncia permite usar a
informao de todos os participantes at o momento em que desenvolveram o evento ou
foram censurados, constituindo uma tcnica ideal para analisar respostas binrias (ter ou
no ter o evento) em estudos longitudinais que se caracterizam por tempo de
seguimento diferente entre os indivduos e perdas de segmento.
Como feita a anlise dos dados na anlise de sobrevivncia/aparecimento de
eventos? O mtodo de Kaplan-Meier consiste em dividir o tempo de seguimento em
intervalos, cujos limites correspondem ao tempo de seguimento em que houve eventos.
Este mtodo calcula a sobrevivncia cada vez que um paciente morre, o mtodo mais
usado. Observem a Curva de Kaplan-Meier do estudo de Been JV et al sobre o Papel da
corioamnionite na resposta ao surfactante nos recm-nascidos pr-termos
(Chorioamnionitis Alters the Response to Surfactant in Preterm Infants. J Pediatr
2010;156:10-5) (Figura 127).
84
Fig. 127. Curvas de Kaplan-Meier analisando o tempo at a extubao aps
primeira dose (A) e segunda (B) dose de surfactante exgeno para os grupos com
base na histologia da placenta
Observamos pela Curva de Kaplan-Meier apresentada, que com 12 horas aps o

uso da primeira dose do surfactante pulmonar exgeno, no havia diferena entre os 3
grupos estudados (corioamnionite fetal, corioamnionite sem envolvimento fetal e sem
corioamnionite) quanto ao tempo de extubao, o que no ocorreu com 24, 36 e 48
horas de vida, em que se observa o prolongamento do tempo de extubao com a
gravidade da corioamnionite, ou seja, aquela com envolvimento fetal (com 486 horas,
aqueles com grave corioamnionite, 85% estavam intubados, versus 60% daqueles
aqueles com corioamnionite menos grave ou ausncia de corioamnionite) (p<0,047,
determinado pela estatstica do logrank de Cox-Mantel-veja adiante).
Vejam ento que esta anlise de Kaplan-Meier permite avaliar corretamente o
ritmo em que os eventos vo ocorrendo nos diferentes grupos em estudo.
Dos grficos com as curvas de Kaplan-Meier pode-se estimar diretamente o
percentual de evento ao final de qualquer intervalo temporal, Para isto, trace uma linha
vertical ao nvel temporal que se pretende apurar o nvel de ocorrncia de evento, que
no nosso caso a extubao. Vejam que no exemplo anterior, com 42 horas aps o uso
do surfactante exgeno, 65% dos RN nos grupos com corioamnionite leve e sem
corioamnionite estavam intubados, versus 85% dos RN com histria de mes com
corioamnionite severa.
Para avaliar a significncia estatstica procedemos tal como na anlise clssica,
analisando o valor de p ou o intervalo de confiana. Para o clculo deste p, o teste de
significncia mais utilizado o Logrank test (tambm conhecido por estatstica do
logrank de Mantel, estatstica do logrank de Cox-Mantel). Este teste compara o
nmero de eventos observados em cada grupo com o nmero de eventos que seria
esperado com base no nmero de eventos dos dois grupos combinados, ou seja, no
importa a que grupo pertence o indivduo. Um teste do qui-quadrado aproximado
usado para testar a significncia de uma expresso matemtica envolvendo o nmero de
eventos esperados e observados.
Para a determinao de um efeito independente de um fator, temos que realizar
uma anlise multivariada, que no caso de anlise de sobrevida geralmente implica na
85
utilizao da Regresso de Cox; uma tcnica estatstica que utilizada para
determinar a relao entre sobrevivncia e vrias variveis independentes exploratrias;
fornece uma estimativa do tratamento sobre a taxa de sobrevivncia, aps o ajuste da
varivel exploratria. Esta regresso permite obter resultados ajustados para possveis
variveis de confundimento.
No estudo assinalado anteriormente a respeito da alterao da resposta ao
surfactante nos RN cujas mes tiveram corioamnionite com envolvimento fetal, os
autores tambm realizaram uma anlise de regresso de Cox para anlise multivariada
para identificar se a idade gestacional poderia explicar a menor chance de extubao
aps corioamnionite. A regresso de Cox foi realizada com ajuste para a idade
gestacional e peso. Os autores evidenciaram assim, que os RN do grupo corioamnionite
com comprometimento fetal teve significativamente menor probabilidade de extubao
48 horas aps o uso da primeira dose surfactante exgeno (hazard rate-HR- de 0,12 com
intervalo de confiana de 0,01-0,06 p=0,46), demonstrando um efeito independente da
corioamnionite no prolongamento da intubao destes RN com corioamnionite grave
(Figura 128).
Fig. 128. Regresso de Cox estimando o tempo de extubao aps a segunda

dose de surfactante exgeno, ajustado para a idade gestacional e peso nos grupos
de acordo com a histologia da placenta, p <0,05 HC+F VS HC-
86
Podemos observar que o tamanho da amostra diminui ao longo do tempo de
observao e assim, as estimativas nos perodos finais de observao (parte direita da
curva) so bastante imprecisas. Tambm vale a pena ressaltar que a censura dos
participantes (aqueles que no completaram o estudo ou porque abandonaram o estudo,
ou foram perdidos no seguimento). no est relacionada com o seu prognstico e que
semelhante para os participantes recrutados no incio e no fim do estudo. Quando o
nmero total de censurados antes do trmino do estudo pequeno, evidentemente o vis
de seguimento ser pequeno.
Anlise de Sobrevivncia usando o SPSS para Windows, usando o mtodo

de Kaplan-Meier e obteno de Curvas de Sobrevivncia e compar-las mediante a
realizao do teste logrank
Para fazer este tipo de estudo necessrio que se defina a data de incio
(diagnstico da doena, internao no hospital, incio do tratamento) e a data de
finalizao do seguimento (determinado pelo investigador), para que se possa calcular
posteriormente os tempos de sobrevivncia (data do incio do seguimento at a data do
ltimo contato) dos pacientes. No seguimento, pode ser que os pacientes ou morram,
continuem com vida na data da finalizao do estudo ou so perdidos (casos censurados,
como discutido anteriormente). O mtodo de Kaplan-Meier um mtodo no
paramtrico, sendo o nico que supe que os indivduos censurados comportaram do
mesmo modo dos indivduos seguidos at que ocorra o evento. Para cada perodo de
tempo se calcula a probabilidade de sobreviver.
O tempo de seguimento uma varivel quantitativa (expressa em dias, meses,
anos) e expressa a diferena entre as datas de incio e de finalizao do estudo.
O estado do paciente ao final do seguimento uma varivel categrica
dicotmica (1: evento que pode ser morte, recada, etc e 0: no ocorreu evento, casos
censurados ou apresentaram um evento aps o trmino do estudo).
Vejamos como proceder no SPSS-18 (vamos usar uma base de dados de Aguayo
Canela M e Lora Monge E, do Hospital Universitrio Virgem Macarena, Sevilla, com
informao de 56 pacientes com cncer coloretal, includos no seguimento (data de
entrada ou inicial) no momento de ser submetidos radioterapia pr-operatria e
seguidos at o seu falecimento. Da mesma base de dados, vamos calcular o teste
estatstico logrank para comparar duas curvas de sobrevivncia (dois grupos de
pacientes, um grupo que recebeu menos de 5000 rads e outro grupo que recebeu >=5000
rads no pr-operatrio). H diferenas na sobrevivncia de ambos os grupos ou a dose
de radioterapia pr-operatria influenciou significativamente na sobrevivncia destes
pacientes?
Analyze>Survival e selecionar Kaplan-Meier (Figura 129)
87
Fig.129. Menu Analyse>Survival>Kaplan-Meier
E ser aberto uma nova caixa de dilogo (Kaplan-Meyer) (Figura 130)
Fig. 130 Caixa de dilogo Kaplan-Meier
88
Selecionar a varivel que mede o tempo de seguimento e coloc-la em Time
(Tempo). Em Status (Estado) colocar a varivel categrica dicotmica que define o
estado individual durante o seguimento; esta varivel tem duas opes: valor
censurado/valor morte ou outro evento que se avalia). O programa pede para definir o
evento (Define Event), devendo especificar o valor que mostra o resultado que se avalia
(neste caso, o valor 1=morte) (Figuras 131 e 132).
Fig. 131. Caixa de dilogo Kaplan-Meier
Fig. 132. Kaplan-Meier:Define Event
89
A seguir, clicar em Options e marcar Survival table(s) (tabela(s) de
sobrevivncia) e Mean and median survival (mdia e mediana de sobrevivncia) e
Quartilies (Figura 133). Em Plots, marcar Survival (sobrevivncia) para gerar a Curva
de Kaplan-Meier
Fig. 133- Kaplan-Meier : Options
A seguir, clicar em [OK] e o Output Viewer (sada do SPSS), mostrar uma

tabela (Tabela 5-reproduo parcial) que contm na primeira coluna da esquerda (Time)
o tempo durante o qual diferentes indivduos esto em seguimento, ordenados por
tempos crescentes. A segunda coluna (Status) indica se tem produzido o efeito avaliado
ou no (morte, censurado). A coluna seguinte (Cumulative survival) a sobrevivncia
acumulada, ou a proporo de casos para os quais no ocorreu o evento em cada tempo.
A coluna seguinte (Standard Error) o erro padro correspondente a estimao pontual
de Kaplan-Meier em cada tempo. A quinta coluna (Cumulative events) contem os
eventos acumulados, isto , os que morreram at este tempo. A ltima coluna (Number
remaining) o nmero de pessoas que permanecem em cada momento sem que haja
ocorrido com eles o evento final ou o desenlace avaliado e representa os indivduos que
esto em risco no prximo perodo.
90
Tabela 5 Tabela de sobrevivncia
O SPSS tambm informa o nmero total de pacientes avaliados (Number of

cases), o nmero de censurados (Censored) e o nmero de eventos ocorridos (Events).
Vamos observar os valores do tempo de sobrevivncia (Survival Time) e a mediana
(Median) da sobrevivncia (o tempo em que 50% dos pacientes seguem sem apresentar
o evento), com os seus correspondentes erros padres (Standard Error) e os intervalos
de confiana a 95% (95% Confidence Interval) (Figura 134)
91
Fig. 134. Mdias e mediana da sobrevivncia e percentis.
A seguir o programa mostra a Curva de Sobrevivncia de Kaplan-Meyer (Figura

135).
Fig.135. Curva de Sobrevivncia (Curva de Kaplan-Meier).
Observamos que na ordenada, fica a Sobrevivncia Acumulada (Cum Survival)

em termos de probabilidade (entre 0 e 1) e no eixo da abscissa, o tempo de
92
sobrevivncia. Este grfico pode ser editado clicando sobre ele com o boto esquerdo
do mouse (Editar). Assim, podemos responder a seguinte pergunta: quantos pacientes
com cncer coloretal sobrevivem mais de dois anos?. Traando uma linha vertical no
tempo de 25 meses, vamos observar que a sobrevivncia seriam aproximadamente 75%
(Figura 136)
Fig.136. Curva de Kaplan-Meier editada.
Passos para comparar duas ou mais curvas de sobrevivncia.
A seguir, vamos comparar duas ou mais curvas de sobrevivncia. A hiptese nula

que os grupos que se compararam tem uma sobrevivncia igual, sendo o teste de
hiptese mais empregado, como j vimos o logrank test que leva em conta as
diferenas de sobrevivncia entre os grupos em todos os pontos que dura o seguimento.
No exemplo a seguir, usando a mesma base de dados do exemplo anterior, vamos
responder a pergunta: a sobrevivncia foi diferente entre os que receberam o
tratamento radioterpico com menos de 5000 rads e os que 5000 ou mais rads? Ou o
93
mesmo, h diferena significativa na sobrevivncia entre os que receberam menos e
mais radioterapia pr-operatria?
Na caixa de dilogo Kaplan-Meier (figura 130), selecionamos a varivel que vai

separar os grupos de pacientes e colocar em Factor uma varivel categrica (no
presente exemplo, vamos colocar a varivel dose de radioterapia pr-operatria.).
(Figura 137).
Fig. 137. Caixa de dilogo Kaplan-Meier
Clicar em Compare Factor... (Comparar Fator...), selecionar o estatstico

Logrank e logo se ativar a opo Pooled trend factor levels (Combinada sobre os
estratos) (Figura 138)
Fig. 138. Kaplan-Meier: Compare Factor Levels
94
Clicar em [Continue] e em [OK] e o Output Viewer mostrar (Figura 139 e 140).
Fig. 139. Resultado do teste estatstico Logrank, mostrando no haver

diferena entre os grupos (p<0.102).
Fig. 140. Curva de sobrevivncia de Kaplan-Meier de ambos os grupos
Interpretao: como podemos observar o valor do estatstico logrank foi de

2,67, com 1 grau de liberdade (neste exemplo se compararam dois grupos) e o valor p
associado foi de 0,10, o que NO nos permiti afastar a hiptese nula, isto , NO H
DIFERENA ESTATISTICAMENTE SIGNIFICATIVA NA SOBREVIVNCIA
ENTRE OS DOIS GRUPOS. Observando as curvas de sobrevivncia de ambos os
grupos (Figura 140), o grupo de maior dose de radioterapia parece sobreviver mais,
porm o estatstico logrank no alcana valor crtico que nos permite afastar a hiptese
nula.
95
X- CURVA ROC
Muitos exames dos nossos pacientes tem valores medidos numa escala numrica
e assim a sensibilidade e a especificidade dependem de onde se coloca o ponto de corte
(cut off) entre os resultados positivos e negativos.
Uma forma mais eficiente de demonstrar a relao normalmente antagnica
entre a sensibilidade e a especificidade dos exames que apresentam resultados
contnuos so as Curvas de Caractersticas de Operao do Receptor (Curvas ROC-
Receiver Operating Characteristic). A Curva ROC uma ferramenta poderosa para
medir e especificar problemas no desempenho do diagnstico em medicina por permitir
estudar a variao da sensibilidade e especificidade para diferentes valores de corte.
A Curvas ROC foram desenvolvidas no campo das comunicaes como
uma forma de demonstrar as relaes entre sinal-rudo. Interpretando o sinal como os
verdadeiros positivos (sensibilidade) e o rudo, os falsos positivos (1-especificidade),
podemos entender como este conceito pode ser aplicado em medicina.
A Curva ROC um grfico de sensibilidade (ou taxa de verdadeiros
positivos) versus taxa de falsos positivos (Figura 141)
Fig.141.Curva de Caracterstica de Operao

do Receptor (Curva ROC)
96
A linha diagonal pontilhada corresponde a um teste que positivo ou negativo,
aleatoriamente. A Curva ROC Permite evidenciar os valores para os quais existe maior
otimizao da sensibilidade em funo da especificidade que corresponde ao ponto em
que se encontra mais prxima do canto superior esquerdo do diagrama, uma vez que o
ndice de positivos verdadeiro 1 e o de falsos positivos zero.
A medida que um critrio para o teste positivo torna-se mais rigoroso, o ponto
da curva correspondente a sensibilidade e a especificidade (ponto A) movimenta-se
para baixo e para a esquerda (sensibilidade menor e especificidade maior). Se adotar um
critrio menos evidente, para identificar os positivos, o ponto da curva (ponto B)
movimenta-se para cima e para a direita (sensibilidade maior, especificidade menor).
A Curva ROC permite comparar dois ou mais exames diagnsticos e constitui
uma das maiores virtudes das curvas ROC. No exemplo (Figura 142) a seguir, o Teste
A- tem melhor acurcia que o teste B (teste invlido: os seus resultados no so
melhores do que os da chance). O ponto 1confere maior valor de sensibilidade e
especificidade; o ponto 2 confere maior sensibilidade, porem menor especificidade e j
o ponto 3, maior especificidade, porm, menor sensibilidade
Falso- positivo (1-especificidade)
Fig.142 Curva ROC (diferentes pontos de cortes)
O exemplo a seguir (Figura 136) de Maulik et al que compararam 4 ndices

correspondentes nos traados Doppler da artria umbilical, no que se refere a uma
preciso para prever a evoluo perinatal desfavorvel. Podemos observas que 3
ndices so praticamente semelhantes , mas um deles, o IP (ndice de pulsatilidade) era
muito menos preciso.
97
Fig. 142. Curvas de caractersticas de operao do receptor para os ndices
Doppler da artria umbilical. Os pontos de dados so os valores medidos dos
ndices. IR: ndice de resistncia; D/A: relao diastlica mdia; IP: ndice de
pulsatilidade (Maulik et al).
A Curva ROC descrimina entre dois estados, onde cada ponto da curva
representa um compromisso diferente entre a sensibilidade e o falso positivo que pode
ser definido pela adoo de um diferente valor do ponto de corte de anormalidade.
Assim, podemos ter diferentes correspondncias na curva. Um critrio restrito (paciente
positivo quando a evidncia da doena muito forte) aquele que traduz uma pequena
frao de falsos positivos e tambm uma pequena frao de verdadeiros positivos
(canto inferior esquerdo da Curva ROC. O uso de critrios menos restritos, conduzem a
maiores fraes de ambos os tipos (pontos colocados no canto direito da curva (Figura
143)
98
S
a
1-especificidade (falsos positivos)
Fig.143. Curva ROC para uma dada capacidade de discriminao, com a

variao do ponto de corte (critrio de deciso) (Braga ACS, 2003)
O valor do ponto de corte definido com um valor que pode ser selecionado
arbitrariamente pelo pesquisador entre os valores possveis para a varivel de deciso,
acima do qual o paciente classificado como positivo (teste positivo, paciente com a
doena) e abaixo do qual classificado como negativo (teste de diagnstico negativo,
ausncia de doena).
Para cada ponto de corte so calculados valores de sensibilidade e
especificidade, que podem ento serem dispostos no grfico. Um classificador perfeito
corresponderia a uma linha horizontal no topo do grfico, porm esta dificilmente ser
alcanada. Na prtica, curvas consideradas boas estaro entre a linha diagonal e a linha
perfeita, onde quanto maior a distncia da linha diagonal, melhor o sistema. A linha
diagonal indica uma classificao aleatria, ou seja, um sistema que aleatoriamente
seleciona sadas como positivas ou negativas, como jogar uma moeda para cima e
esperar cara ou coroa. Finalmente, a partir de uma curva ROC, devemos poder
selecionar o melhor limiar de corte para obtermos o melhor desempenho possvel.
Para a determinao se duas ou mais Curvas ROC so significativamente
diferentes, a avaliao feita atravs da determinao da rea sob a curva, usando uma
modificao do teste da soma de ordens de Wilcoxon para esta comparao. Assim
99
possvel quantificar a exatido de um teste diagnstico (proporcional rea sob a
curva), alm da possibilidade de comparar testes diagnsticos.
Como realizar a Curva ROC pelo SPSS
Vamos usar o exemplo disponvel no programa SPSS 18: hivassay.
Um laboratrio farmacutico est desenvolvendo um teste rpido para deteco

de infeco pelo HIV. O atraso na obteno de resultados de testes tradicional reduz a
sua eficcia, porque muitos pacientes no retornam para saber os resultados. O desafio
desenvolver um teste que fornea resultados em 10 a 15 minutos e to preciso quanto
os testes tradicionais. Os resultados do ensaio so oito tons de vermelho, com tons mais
profundos, indicando maior probabilidade de infeco. O teste rpido, mas preciso?
Para ajudar a responder esta pergunta, um ensaio laboratorial foi realizado em 2.000
amostras de sangue, metade dos quais estavam infectadas com o HIV e metade, no. Os
resultados esto em hivassay.sav. Vamos usar a Curva ROC para determinar em que
tom de vermelho o mdico deve assumir que o paciente HIV-positivo.
Em Analyse escolha Roc Curve (Figura 144) e ser aberta a caixa de dilogo
Roc Curve (Figura 145)
Fig.144. Analyse>ROC Curve
100
Fig. 145.Caixa de dilogo ROC Curve
Na caixa de dilogo ROC Curve, selecione assay result como Test variai e em
State variabele, selecione actual satate e o tipo 1, como seu valor positivo. No Display,
selecione With diagonal reference line, Standard error and confidence interval e
Coordinate points of the ROC (Figura 146)
Fig.146.Caixa de dilogo ROC Curve
101
A seguir, clicar em [ OK] e teremos a Curva ROC, que um ndice visual da preciso
do ensaio (Figura 147)
Fig.147 Curva ROC
A Curva est difcil de visualizar porque est muito prximo ao eixo vertical,
ou seja, maior sensibilidade na deteco dos pacientes com HIV positivo e com baixo
falso positivo.
O conhecimento da rea sob a curva possibilita quantificar exatido de um teste
diagnstico (proporcional rea sob a curva), alm de possibilitar a comparao de
testes diagnsticos. A rea sob a curva ROC constitui um dos ndices mais usados para
sumarizar a qualidade da curva.
A rea sob a curva ROC uma medida do desempenho de um teste (ndice de
exatido do teste). Um teste totalmente incapaz de discriminar indivduos doentes e no
doentes, teria uma rea sob a curva de 0.5 (seria a hiptese nula).Acima de 0,70
considerado desempenho satisfatrio. Vejam o clculo da rea sob curva do presente
exemplo (Figura 148)
102
Area Under the Curve (rea sob a Curva)
Test Result Variable(s):Assay result
Asymptotic 95% Confidence

Interval
Asymptotic
a
Area Std. Error Sig.b Lower Bound Upper Bound
,996 ,001 ,000 ,994 ,999
Figura 148. Clculo da rea sob a curva

A rea sob a curva um resumo estatstico til para a determinao da acurcia
do teste. A seguir, precisamos escolher um critrio especfico um critrio especfico em
que as amostras de sangue so classificadas e estimar a sensibilidade e a especificidade
do ensaio nesse critrio. Vejam as coordenadas da curva para comparar diferentes
pontos de corte (Figura 149).
Coordinates of the Curve
Test Result Variable(s):Assay result
A varivel resultado do teste (s)
Positive if
Greater Than Sensitivit 1-
or Equal Toa y Specificity
Fig.149.
Coordenadas da ,00 1,000 1,000
Curva ROC:
A varivel resultado 1,50 ,997 ,058
do (s) teste(s)
2,50 ,995 ,040
3,50 ,993 ,024
4,50 ,988 ,017
5,50 ,978 ,015
6,50 ,973 ,012
7,50 ,965 ,003
9,00 ,000 ,000
103
Esta tabela relata a sensibilidade e 1- especificidade para cada ponto de corte
possvel para a classificao positiva. A sensibilidade a proporo de amostras de
HIV-positivos com os resultados do teste maior que o corte e 1-especificidade a
proporo de amostras de HIV-negativo com os resultados do teste maior que o de corte.
No ponto de corte 0 equivalente a assumir que todos so HIV-positivos. No ponto de
corte 9 equivalente a assumir que todos HIV-negativos. Vejam assim, que ambos os
extremos so insatisfatrios, o desafio escolher um corte que devidamente equilibrar
as necessidades de sensibilidade e especificidade.
Por exemplo, considere o ponto de corte 5.5. Usando este ponto de corte vamos
ter uma sensibilidade de 0,978 e 1-especificidade de 0,015. Assim, aproximadamente
97,8% de todas as amostras do HIV-positivos seriam corretamente identificadas como
tal, e 1,5% de todas as amostras do HIV-negativo poderiam ser incorretamente
identificadas como positivas.
Se usarmos o ponto de corte 2,52, 99,5% de todas as amostras do HIV-positivos
seriam corretamente identificados como tal e 4,0% de todas as amostras de HIV-
negativo poderiam ser incorretamente identificadas como positivas.
A escolha do ponto de corte ser decidida pela necessidade de aumentar a
sensibilidade ou a especificidade e vai depender do pesquisador. Devemos notar que os
valores desta tabela representam as melhores orientaes para os quais devemos
considerar os pontos de cortes. Esta tabela no inclui as estimativas de erro, portanto,
no h garantia da exatido da sensibilidade ou especificidade para um dado ponto de
corte na tabela.
O uso da Curva ROC possibilitou-nos avaliar a acurcia deste teste. A rea sob a
curva mostrou que a utilizao do teste melhor do que a chance, mas, alm disto, as.
coordenadas da curva foi muito til porque forneceu algumas orientaes para
determinar qual o melhor ponto de corte para a determinao os resultados do teste
positivo e negativo.
Vejamos agora, exemplo de estudos com o uso da Curva ROC na neonatologia,
comparando ndices Prognsticos CRIB (clinical risk index for babies), CRIB II e
SNAPPE-II (score for neonatal acute physiology-perinatal extension).
Parry G et al desenvolveram o CRIB-II para RN de 32 semanas aps 1 hora de
admisso na UTI sendo excluda a FiO2 uma vez que esta no representa uma medida
fisiolgica verdadeira por ser determinada pelo cuidador. Assim, o CRIB II foi
calculado a partir de 5 itens: sexo, peso ao nascer, idade gestacional, pior base excess e
temperatura na admisso A rea sob a curva ROC para morte ou graves anormalidades
cerebrais foi de 0,82, de 0,79 pra o CRIB, 0,80 para a idade gestacional e 0,77 para o
peso ao nascer . Portanto, o CRIB II mostrou maior acurcia em relao ao CRIB, a
idade gestacional e o peso ao nascer para a morte ou graves anormalidades cerebrais.
Gagliardi I et al, comparando CRIB, CRIB-II e SNAPE-II, relataram maior grau
de descriminao para o CRIB e CRIB II em relao ao SNAPPE-II (rea sob a Curva
ROC de 0,90 e 0,91 versus 0,84-p <0,0004). Vejamos a Curva ROC deste estudo (Fig.
150)
104
Fig. 150. Curva ROC para o CRIB, CRIB II e SNAPPE-PE. A rea sob a
curva foi: CRIB, 0,903; CRIB-II, 0,907; SNAPPE-II, 0,837.
Observem que as Curva do CRIB e CRIB-II esto mais prximas do canto

superior esquerdo do diagrama, o que confere maior rea sob a curva e, portanto, maior
poder de discriminao em relao ao SNAPPE-II.
XI NDICE DE CONCORDNCIA INTRA E ENTRE-OBSERVADORES

Estatstica k / Coeficiente (tau) de Kendall
O ndice de concordncia intra e entre-observadores constitui uma medida

utilizada para analisar o acordo entre dois intervalos de observao (intraobservadores)
e entre avaliadores (entre-observadores) na atribuio de categorias de uma varivel
categrica. Em ingls este procedimento geralmente designado por interjudge
reliability ou interobserver reliability. uma importante medida para determinar o quo
bem funciona uma aplicao de alguma medio.
A medida estatstica de confiabilidade o kappa de Cohen, descrito em 1960.
O kappa uma medida de concordncia intra e entre-observador e mede o grau de
concordncia alm do que seria esperado to somente pelo acaso e varia geralmente de
0-1 (embora os nmeros negativos sejam possveis) onde um grande nmero significa
maior confiabilidade, valores prximos ou menores que zero sugerem que o acrdo
atribuvel ao acaso.
Como interpetar o kappa:
O Kappa varia de +1 a -1
+1: significa que os dois observadores concordaram perfeitamente. Eles

classificaram a todos exatamente da mesma forma
105
0: significa que no existe nenhuma relao entre as classificaes dos dois
observadores, acima da concordncia de acasos que seriam esperadas.
-1 significa que os dois observadores classificaram exatamente o oposto. Se um

observador diz SIM, o outro sempre diz NO
A magnitude da Estatstica k uma medida de concordncia bastante mais
significativa do que a sua prpria significncia estatstica. O erro padro da estatstica k
permite-nos estimar a sua significncia estatstica e tambm o seu intervalo de confiana
de 95%. (Pinto et al). Por exemplo, um ndice kappa de 0,77 com erro padro de 0,03, o
seu intervalo de confiana ser: multiplique 0,03 por 1,96=0,058 que semelhante a
0,06 e agora subtraia e some ao ndice kappa e teremos: 0,77 -0,06=0,71 e 0,77 +
0,06=0,82 e o intervalo de confiana ser: 0,71-0,82). significativo por no conter a
unidade) (Fescina, 23/6/1988).
Segundo Pinto, a sua interpretao considerada sempre subjetiva e se d por
comparao dos valores obtidos s faixas de valores para verificao da concordncia.
Vamos fornecer dois guias para o uso do ndice kappa em epidemiologia e
medicina(tabelas 4 e 5)
Nigel Paneth:
kappa > 0,80 : considerado excelente.
kappa 0,60 0,80 : considerado bom.
kappa 0,40 0,60 : considerado regular.
kappa < 0,40 : considerado ruim
Tabela 5. ndice kappa
Landis & Koch, 1977: Valores de Concordncia-ndice Kappa
Tabela 6. ndice kappa

A tabela 5 considerada por demais otimista por alguns autores. Como regra,
valores de kappa 0,40-0,59 so considerados moderados, 60-0,79 substancial, e
0,80 excepcional. A maioria dos estatsticos prefere que os valores kappa sejam
maiores que 0,6 e na maioria das vezes, superiores a 0,7, antes de reivindicar um bom
nvel deconcordncia.
importante que se conhea a prevalncia da patologia em estudo na avaliao

da concordncia entre-observadores. O valor de k depende da prevalncia da patologia
em estudo. Uma grande prevalncia resulta num alto nvel de concordncia esperada
pelo acaso, o que resultar num valor de k mais baixo. Por sua vez, uma patologia de
baixa prevalncia dar origem valores de k mais altos . Assim, possvel cometer erro ao
se basear neste ndice na comparao de dois estudos com prevalncias distintas (Pinto
et al).
Vejamos exemplos:
1-Variabilidade interobservadores na graduao do tempo de enchimento capilar

por enfermeiras e assistentes de enfermeiras. Estudo realizado por Brabrand et al, em
106
2010 na Dinamarca. O tempo de enchimento capilar influenciado por muitos fatores.
Estudos anteriores de variablidade interobservadores envolveram muitos pacientes, mas
poucos observadores. O objetivo do estudo foi determinar como um grande grupo de
enfermeiras (9) e assistentes de enfermeiras (37) graduariam o etempo de enchimento
capilar.O ndice kappa para o valor de normalidade foi de 0,56 e entre classes, 0,62. Os
autores consideraram que houve somente um regular acrdo para o valor exato do
tempo de enchimento capilar, assim como para a normalidade. Os autores acreditam
que o tempo de enchimento capilar deveria ser usado com cuidado na prtica clnica.
2- Avaliao nutricional (descrio da concordncia entre os avaliadores), do

estudo de Beghetto et al. Quando avaliada a concordncia entre o observador de
referncia e o segundo observador, considerando-se 4 categorias para o percentual de
perda de peso, segundo os autores, foi identificada moderada concordncia entre os
observadores (kappa = 0,74; IC95%: 0,63-0,85; p<0,001) e plena concordncia nas duas
categorias que agruparam pacientes que perderam > 5% do peso corporal em 6 meses.
Considerando-se a classificao do IMC tambm em 4 categorias , foi identificada
excelente concordncia entre os observadores (kappa = 0,98; IC95%: 0,95-1,0;
p<0,001), quando somente um paciente foi classificado de modo discordante
(classificado como eutrfico pelo avaliador de referncia e como sobrepeso pelo
avaliador 2). Em relao Avaliao Nutricional subjetiva global (ANSG), avaliada em
3 categorias, foi obtida discreta concordncia entre os observadores (kappa = 0,46;
IC95%: 0,31-0,60; p<0,001).
3-Concordncia entre avaliadores, na seleo inicial de artigos em estudo de

reviso sistemtica com ou sem metanlise (estudo de Oliveira et al). Os autores
usaram como exemplo dados da fase inicial do estudo Suplementao de vitamina A
em lactantes: reviso sistemtica. Estes constituem o resultado da leitura, realizada por
dois avaliadores, de resumos de artigos selecionados, criteriosamente, em bases
bibliogrficas eletrnicas. Para cada resumo, foram respondidas as questes: O estudo
envolve mulheres no ps-parto?; Trata-se de um estudo com suplementao de
vitamina A?; O estudo ensaio clnico?; seguidas da deciso (incluso/excluso) do
trabalho. Os dados foram inseridos em planilha Excel, com dupla digitao e uso de
procedimento de validao. Utilizou-se o ndice de concordncia kappa para os
aspectos: populao, interveno, tipo de estudo e deciso. Foram identificados 2.553
trabalhos. Os ndices de concordncia kappa foram, quanto adequao da populao
de estudo: k=0,46; do tipo de interveno: k=0,59; do tipo de estudo: k=0,59 e, sobre a
deciso pela incluso/excluso: k=0,44. Com base nas concordncias razovel (tipo de
estudo e interveno) e ruim (populao de estudo) observadas entre avaliadores,
enfatiza-se a necessidade da leitura inicial dos trabalhos por pelo menos dois
avaliadores. Para os casos discordantes, foram realizadas reunies de consenso na busca
de diferenas de interpretao entre os avaliadores, visando a diminuio da chance de
excluso um artigo que deveria ser includo
4-Do estudo de Jodas et al a respeito da concordncia intra e entre-observadores na

deteco das fraturas da face por meio da tomografia computadorizada de
pacientes vtimas de traumatismos faciais. Na figura 151, esto os valores dos ndices
kappa para cada observador, com uma mdia geral de 0,472 (concordncia moderada).
107
Analisando a concordncia em diferentes regies, os autores relataram que as fraturas
observadas nas regies de etmide, corpo mandibular, parede anterior de seio frontal e
esfenide, apresentaram ndice de concordncia excelente; as regies de maxila, cndilo
mandibular e pirmide nasal, ndice de concordncia substancial; para as regies de
parede medial de rbita, parassnfise e ngulo mandibular, soalho e parede lateral de
rbitas, ndice de concordncia moderada; para a regio de arco zigomtico, ndice de
concordncia considervel; para regio fronto-zigomtica, ndice de concordncia
ligeira; para as regies de palato duro, snfise, ramo e processo coronide de mandbula,
ndice de concordncia pobre.
Fig.151. ndice de Concordncia Kappa (k) entre-observadores (Jodas et al)
-Corte LMD e cl analisaram a concordncia entre-observadores em exames de

Papanicolaou (Anlise da Concordncia Interobservadores em Exames de
Papanicolaou): Embora o exame de Papanicolaou seja um mtodo altamente confivel,
ele possui algumas limitaes e tem recebido muita crtica com relao alta taxa de
falsos-negativos. A variabilidade interobservadores descreve a falta de
reprodutibilidade entre dois ou mais observadores e serve para identificar se os
observadores requerem aprimoramento. Para isto, quarenta e sete esfregaos
citolgicos crvico-vaginais corados pelo mtodo de Papanicolaou, previamente
analisados e classificados segundo o Sistema Bethesda de 2001, foram reescrutinados
por sete observadores. Desses, apresentaram um maior grau de concordncia entre os
observadores segundo o ndice kappa (0,902 e 0,84, respectivamente) os diagnsticos
de negativo para malignidade e de leso intra-epitelial escamosa de baixo grau e,
108
apresentaram um fraco grau de concordncia com ndices de 0,378, 0,321 e 0,135, para
o carcinoma de clulas escamosas, as clulas escamosas atpicas de significado
indeterminado e clulas escamosas atpicas, no excluindo leso de alto grau,
respectivamente.
COMO OBTEMOS O CLCULO DO NDICE KAPPA NO SPSS:
Vamos usar a base de dados de Tatiane Melo de Oliveira (Anlise psicofsica da

escala multidimensional de dor Neonatal Pain, Agitation and Sedation Scale (N-PASS).
Os escores da escala N-PASS foram pontuados por 2 observadores (identificados na
base de dados como MV e T) 3 min antes (antes), imediatamente aps o
procedimento doloroso (durante) e 3 min aps (depois). Este estudo foi apresentado
na Residncia Mdica em Pediatria do HRAS como trabalho de concluso de curso,
disponvel em www.paulomargotto.com.br (Monografias-2011). importante que
saibamos que no SPSS ele s calculado em tabelas 2 x 2, ou seja para comparar dois
avaliadores e que apenas atribuam uma classificao dicotmica aos objetos em causa.
Para avaliar a concordncia entre dois avaliadores em uma escala ordinal, o
coeficiente usado o (tau) de Kendall (mede a associao entre duas variveis
medidas por postos). Por exemplo: dois mdicos neonatologistas avaliam o Apgar de
seis recm-nascidos. A H0 (hiptese nula) que no h concordncia entre a avaliao
deste dois mdicos ou seja coeficiente de correlao de Kendall- de Kendall=0 . A
H1(hiptese alternativa) informa que h concordncia entre os mdicos, ou seja de
Kendall 0 O nvel de significncia 0,05. Aps a anlise dos valores inseridos,
digamos que o de Kendall seja igual a 0,78 (p<0,05). Assim, rejeita-se a hiptese nula
e se aceita a H1 que diz que h concordncia entre os mdicos na avaliao do Apgar
destes 6 recm-nascidos.
Segundo Alvarez, o Kendalltau-b leva em conta os empates; j o Kendalltau-c
ignora os empates.
Para avaliao de vrios conjuntos de postos dos mesmos indivduos, cujas variveis
so medidas em escala ordinal, usado o Kendall coefficient of concordance W. Por
exemplo, testar o grau de correlao entre o nvel de desempenho de 3 acadmicos de
medicina (6 Srie) e as respectivas avaliaes foram realizadas por 3 professores. A H 0
diz que no h concordncia entre os 3 professores, ou seja o Coeficiente de Kendall W
= 0 e a H1 diz que h concordncia entre os trs professores, ou seja o Coeficiente de
Kendall W 0. O nvel de significncia 0,05. Aps a anlise dos resultados, o
coeficiente de Kendall W foi de 0,798 (p<0,05) e assim, aceita-se a hiptese alternativa,
ou seja, h concordncia entre os avaliadores.
Para a anlise de dois avaliares numa classificao dicotmica:
Analyse> Descriptive Statistics e escolha Crosstabs (figura 152).
109
Fig.152. Analyse> Descriptive Statistics e Crosstabs
Em Row selecione da base de dados Npass avaliao total antes MV

(observador 1) e em Column selecione Npassavaliao total antes T (observador 2)
(figura 153) e em Statistics, marque kappa(figura 154).
Fig.153.Crosstabs
110
Fig.154. Crosstab stastistics
Aperte continue e OK e a via de sada do SPSS mostrar o valor kappa (figura 155)
Fig.155. Resultado do ndice kappa

Interpretao: a correlao entre os observadores antes (kappa de 0,16), durante
(kappa 0,28) e depois (0,21) foi ruim, apesar da significncia (como j citado
anteriormente, a magnitude da estatstica k uma medida de concordncia bastante mais
significativa do que a sua prpria significncia estatstica) A autora explica este achado
devido grande subjetividade dos componentes presentes das escalas que avaliam a dor.
A melhor concordncia ocorreu no momento durante, pois no momento da presena da
dor no to dependente de fatores externos para ser identificada. Diversas pesquisas
111
vem sendo desenvolvidas para se encontrar um padro-ouro de avaliao da dor
neonatal.
Finalizando, segundo Field A, os procedimentos estatsticos so uma forma de
processar nmeros e, portanto, se voc colocar baboseiras em uma anlise mesmo assim
obter concluses que tem significado estatstico, mais que provavelmente no tero
sentido prtico. Existe uma tentao de ver a estatstica como uma forma milagrosa de
determinar a verdade, mas a estatstica somente um recurso. Se voc entra com lixo,
voc vai obter lixo. Na anlise estatstica no existe um substituto para o pensamento
emprico. A significncia estatstica no implica em importncia clnica (ignorar este
fato um dos erros mais freqentes na rea mdica).Tenha sempre isto em mente.
REFERNCIAS
112
1- Wagner MB, Mota VT, Dornelles CC. SPSS Passo a Passo, Educs, Caxias do Sul,
2004
2- Field A. Descobrindo a Estatstica usando o SPSS, Artmed,2 Edio Porto Alegre,
2009
3-Filho Doria U. Introduo a Bioestatstica (Para simples mortais), Negcio Editora,
So Paulo, 2 Edio,1999
4-Arango HG.Bioestatstica Terica e Computacional, Guanabara Koogan, Rio de
Janeiro,2001
5- Vieira S. Introduo Bioestatstica, Editora Campus, 2 Edio, Rio de Janeiro,
1991
6-Sounis E. Bioestatstica.Princpios fundamentais, metodologia estatstica, Aplicao
s Cincias Biolgicas,Livraria Atheneu
7-Bisquerra R, Sarriera JC, Martinez G. Introduo Estatstica. Enfoque Informtico
com o Pacote Estatstico SPSS, Artmed, Porto Alegre, 2004
8. Margotto PR. Entendendo Bioestatstica Bsica. Boletim Informativo Peditrico
(Enfoque Perinatal), No65, Ano 22, Braslia, p.6-108, 2002. Disponvel em
www.paulomargotto.com.br, em Entendendo Bioestatstica Bsica (Acessado em
30 de outubro de 2009)
9-Margotto PR. Como exercer a Medicina/Neonatologia baseado em evidncias. In.
Margotto PR. Assistncia ao Recm-Nascido de Risco, Hospital Anchieta, 3
Edio, Braslia, no prelo. Disponvel em www.paulomargotto.com.br em
Exerccio da Medicina Baseado em Evidncia (Acessado em 20 de outubro de
2009)
10-Penha RN. Um estudo sobre regresso logstica binria. Universidade de Itajub,
Instituto de Engenharia Mecnica, Departamento de Produo. Disponvel em
UM ESTUDO SOBRE REGRESSO LOGSTICA BINRIA Renata Neves
Penha ... (Acessado em 30 de novembro de 2009)
11.Batistela G C, Rodrigues AS, Bononi JTCM. Estudo sobre a evaso escolar usando
regresso logstica: anlise dos alunos do Curso de Administrao da Fundao
Educacional de Ituverava. Tkhne Lgos, Botucatu, SP, v.1, n.1, p.53-66,
out.2009. Disponvel em ESTUDO SOBRE A EVASO ESCOLAR
USANDO REGRESSO LOGSTICA: ANLISE ...
12- Programas desenvolvidos na Braile Biomdica S/A. Disponvel em Estatistica
(Acessado em 30 de dezembro de 2009)
13-NRM Consultoria Estatstica Ltda. Curso de Estatstica com a Utilizao do SPSS,
ESCS, 2009
14.Whelan B, Bennett K et al. Serum sodium as a risk factor for in-hospital mortality in
acute unselected general medical patients. QJ Med 2009;102:175-182
15-Silva AP. Curso Bsico de Estatstica utilizando o SPSS. ESCS, julho de 2006
16-Laboratrio de Epidemiologia e Estatstica. Lee - Laboratrio de Epidemiologia e
Estatstica (Acessado em 21 de abril de 2010)
17-Botelho F, Silva C, Cruz F. Epidemiologia explicada-anlise de sobrevivncia. Acta
Urolgica 2009;26:4:33-38. Disponvel em Epidemiologia explicada Anlise de
Sobrevivncia (acessado em 14 de maio de 2010)
113
18-Aguayo Canela M, Lora Monge E. Cmo hacer paso a paso um anlisis de
supervivncia com SPSS para Windows. Fabis (Fundacion Andaluza Beturia
para La investigation em salud). Disponvel em Cmo hacer paso a paso un
Anlisis de Supervivencia con SPSS ... (acessado em 15 de maio de 2010)
19-Dawson B, Trapp RG. Anlise dos temas de pesquisa sobre sobrevivncia. In.
Dawson B, Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3
Edio, 2003, p.187-205
20-Bee JV, Rours IG et al. Chorioamnionitis alters the response to surfactant in preterm
infants. J Pediatr 2010;156:10-5
21-Martinez EZ, Lozada-Neto F, Pereira BB. Cadernos Sade Coletiva, Rio de Janeiro
2003;11:7-31 (disponvel em [PDF] A curva ROC para testes diagnsticos
22- Braga ACS. Curvas ROC: Aspectos funcionais e aplicaes. Tese de Doutorado,
Universidade do Minho, dezembro de 2003, Portugal
23- Dawson B, Trapp RG. Mtodos da medicina baseada em evidncias. In. Dawson B,
Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3 Edio, 2003,
p.233-249
24- Maulik D, Yarlagadda P, Youngblood JP, Ciston P. Comparative efficacy of
umbilical arterial Doppler ndices for predicting adverse perinatal outcome. Am J Obstet
Gynecol 1991;164:1434-1440
21-Parry G, Tucker J et al. CRIB II: an update of the clinical risk index for babies score.
Lancet 361:1789, 2003
22- Gagliardi L, Cavazza A, et al. Assessing mortality risk in very low birthweight
infants: a comparison of CRIB, CRIB-II, and SNAPPE-II. Arch Dis Child Fetal
Neonatal Ed. 89:F419, 2004
23-Nigel Panet. Validao, integridade e monitoramento das doenas. Disponvel
em: Apresentao do PowerPoint - fosjc.unesp.br. Visualizao rpida .
Acesso 24/11/2011
24- Pinto JS, Lopes JM, Oliveira JV, Amaro JP, Costa LD. Mtodos para estimao de
reprodutibilidade de medidas [home Page]. Porto Portugal: Faculdade de Medicina
do Porto; 2008. D i s p o n v e l e m : ndices::Estatstica Kappa. Acesso em
23/11/2011
25- Jodas CRP, Rapoport A, de Souza RP et al. Anlise da concordncia intra e inter-
observadores na deteco das fraturas da face por meio da tomografia computadorizada.
Rev Bras Cir Cabea Pescoo 2009; 38 26 33. Disponvel em:
ArtigoOriginal. Acesso em 20/11/2011
26- Mariur Gomes Beghetto, MG, Luft VC, Mello ED, Polanczyk CA. Avaliao
nutricional: descrio da concordncia entre avaliadores. Rev Bras Epidemiol 2007; 10:
506-16. Disponvel em: PDF] Avaliao nutricional: descrio da concordncia entre
avaliadores ... Acesso em 18/11/2011
27- Oliveira NS, de Oliveira JM, Bergamaschi DP. Concordncia entre avaliadores na
seleo de artigos em revises sistemticas. Rev Bras Epidemiol 2006; : 309-15.
Disponvel em: PDF] Concordncia entre avaliadores na seleo de artigos em
revises ... Acesso em 21/11/2011
28- Interrater reliability (Kappa) using SPSS . Acesso em 18/11/2011
29- Ludbrook J. Statistical techniques for comparing measurers and methods of
measurement: a critical review. Clin Exp Pharmacol Physiol. 2002 ;29:527-36
30-Oliveira TM. Anlise psicofsica da escala multidimensional de dor Neonatal Pain,
Agitation and Sedation Scale (N-PASS). Monografia apresentada ao Programa de
Residncia Mdica em Pediatria do Hospital Regional da Asa Sul HRAS SES/DF.
114
Disponvel em www.paulomargotto.com.br em Monografias-2011. Acesso em
24/11/2011
31-Fescina. H. Tecnologias perinatales. Centro Latinoamericano de Perinatologia y
Desarrollo Humano (CLAP). Pub Cient CLAP No 1166, 1988
10- Laboratrio de Epidemiologia e Estatstica. Lee - Anlise de Concordncia Kappa.
Acesso em 20/11/2011
32-Braband M, Hosbond S, Folkestad L. Capillary refill time: a study of interobserver
reliability among nurses and nurse assistants. Eur J Emerg Med 2010, May 27
33- Ajuda do BioEstat 3.0 Ayres , Jr.Aires M, Ayres DL, dos Santos AAS. BioEstat, Belm,
Par, 2007. Acesso em 18/12/2011
34- [PDF] Tema 3 Tablas lvarez MMR. UNIVERSIDAD DE JAN. Material del
curso Anlisis de datos procedentes de investigaciones mediante programas
informticos. Acesso em 15/12/2011
35- Anlise da Concordncia Interobservadores em Exames de ...Corte MD, Gonalves
JC, Silva CS et al. Anlise da concordncia interobservadores em exames de
Papanicolaou.NewLab, Edio 80, 2007
36.NRM Consultoria Estatstica Ltda. Curso de Estatstica com a utilizao do
SPSS,Porto Alegre, 2010
37.Motta VT Oliveira FPF. SPSS-Anlise de dados biomdicos, Editora Cientfica Ltda,
2009 (arquivos retirados do site www.medbooeditora.com.br). Acesso em, 31/12/2011
Torture os nmeros e eles admitiro qualquer coisa
Nota: este texto ser continuamente revisado e ampliado medida quer for sendo
discutido com os estudantes do 6 Ano da Escola Superior de Cincias da Sade
(ESCS) /SES/DF (Faculdade de Medicina da Secretaria de Estado de Sade do
Distrito Federal).
Pesquisado, digitado, revisado por Paulo R. Margotto

www.paulomargotto.com.br
pmargotto@gmail.com.br
Braslia, 01 de janeiro de 2012
115

SPSS o Essencial Paulo Margotto Manual-Pratico

Enviado por

Direitos autorais:

Formatos disponíveis

SPSS o Essencial Paulo Margotto Manual-Pratico

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

SPSS o Essencial Paulo Margotto Manual-Pratico

Enviado por

Direitos autorais:

Formatos disponíveis

ESTATSTICA COMPUTACIONAL

Professor do Curso de Medicina da Escola Superior de Cincias da Sade

Torture os nmeros e eles admitiro qualquer coisa

Fig. 1-Janela SPSS for Windows com a Caixa de Dilogos

Fig.2. Janela Editor de Dados (Data Editor)

Tabela 1. Opes nas definies das variveis (Wagner MB e cl, 2004)

Fig. 5. Seleo do comando Compute

Figura 6.Caixa de dilogo Save Data As

III- ESTATSTICAS DESCRITIVAS

-nominal: diferentes categorias sem valores numricos. Os dados podem ser

Fig. 7.Construo de Tabelas de Freqncias (observem a caixa de dilogo de

Figura 8-Resultado da tabela de freqncias para as variveis solicitadas

Fig. 9. Seleo das variveis

Fig.10. Caixa de dilogo Frequencies:Statistics

Figura 11.Janela de Output Viewer com os resultados do comando Frequencies para as

Fig.12. Passos para o Comando Descriptive

Figura 13. Caixa de dilogo para seleo de variveis no comando Descriptive

Fig.14.Estatstica do Comando Descriptive

A seguir, pressionar [Continue] e em seguida, [OK]. Os resultados vo aparecer da

Fig. 15. Output viewer do comando Descriptives

Fig.16.Caixa de dilogo para seleo de variveis no comando Explore

Fig.17. Caixa de dilogo Statistics

Fig.18.Caixa de dilogo Plots

Fig.19. Output viewer do comando Explore

Fig.20. Output viewer do comando Explore

Fig.21. Output viewer do comando Explore

Fig.22. Grfico Boxplot de idade gestacional e uso de corticosteride pr-natal

IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS

Fig.23. Menu Transform em detalhe

Fig.24. Seleo do comando Compute

Fig.25. Definio da expresso numrica

Fig.26. Resultado do clculo da nova varivel IP

Fig.27. Como ativar o Pivot Table Object

Uma vez pressionado Open, teremos (Figura 28)

Fig28. Tabela a ser editada no Pivot Table

Como usar os Comandos Split e Select:

Fig.29. Passos para o uso do Split

Fig.30. Caixa de dilogo Split File

Fig.31. Caixa de dilogo Descriptives

Clicar em [OK] e no Output Viewer (Figura 32), vai aparecer

Fig.32. Resultados do comando Split File>Compare groups

Fig.33. Caixa de dilogo Split Fire

Veja o resultado no Output Viewer (Figura 34).

Para retornar condio anterior, ou seja, anlises no agrupadas, selecione Data>Split

Fig.35. Caixa de dilogo Split File

Fig.36. Menu Data>Select Cases

Na caixa de dilogo Select Case, marcar IF conditions is satisfied e clicar em [IF]

Fig.37. Caixa de dilogo Select Cases

Fig.38. Caixa de dilogo Select Cases: IF

Clicar [Continue] e em seguida [OK]. No Data Editor, os casos sexo=2 (feminino)

Fig.39. Janela Data Editor com os casos no selecionados assinalados (observem a

Ao utilizar o comando Select, o SPSS cria automaticamente uma varivel chamada

Fig. 40. Caixa de dilogo Select Cases

Ao afastar a hiptese nula, estamos afirmando a validez da hiptese alternativa.

A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que

Utilizando o site Lee - Laboratrio de Epidemiologia e

Clicar Clculo de tamanho de amostra

Proporo de casos entre os expostos: equivale proporo de pessoas expostas ao fator de