SPSS o Essencial Paulo Margotto Manual-Pratico
SPSS o Essencial Paulo Margotto Manual-Pratico
SPSS o Essencial Paulo Margotto Manual-Pratico
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com
1
ESCOLA SUPERIOR DE CINCIAS DA SADE
SECRETARIA DE ESTADO DE SADE DO DISTRITO FEDERAL
ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
(utilizamos os conceitos de Wagner MB, Motta VT e Dornelles C em SPSS-Passo a Passo, Editora
da Universidade de Caxias do Sul, 2004., com exemplo na base de dados do estudo de Margotto PR e cl,
ainda no publcado sobre Uso do Corticosteride Pr-natal na Maternidade do Hospital Regional da
Asa Sul)
I- INTRODUO
Como iniciar o SPSS
Ao clicar no programa (SPSS for Windows) ser aberta a janela SPSS for Windows,
contendo no centro, a Caixa de Dilogo (Fig.1)
2
A partir desta caixa de dilogos, escolha o que voc deseja fazer e clicar em [OK].
-run the tutorial: iniciar o tutorial
-type in data: digitar os dados, criando assim um novo arquivo de dados
-run na existing query: importar dados a partir de uma base de dados
-open an existing data source: abrir um arquivo de dados j existentes
-open another type of file: abrir outro tipo de arquivo
Com o melhor conhecimento do programa podemos usar um maior nmero de opes que
esto disponveis por meio de acesso s janelas e aos menus do SPSS. Na barra de tarefas do SPSS
encontram-se os seguintes menus:
File: comanda todo o gerenciamento de arquivos (criar, abrir, ler, salvar e imprimir arquivos)
Edit: utilizado para copiar ou colar informaes, bem como apagar as informaes das clulas; a
opo option permite configurar as sadas do output (tamanho da fonte, bordas das tabelas,
definio do padro dos tipos de variveis)
View: possibilita a visualizao ou no de barras de ferramentas (Toolbars) e barra de estado
(Status Bar) nas janelas; ativa e desativa linhas de grade; mostra os tipos de fontes utilizadas;
estabelece a apresentao de rtulos de variveis e valores (variable and value labels)
Data: permite a definio de variveis, ordenar os dados segundo algum critrio escolhido, inserir
ou retirar observaes ou variveis, unir arquivos (merge files), criar subgrupos para anlise (split
file), selecionar casos especficos (select cases). As mudanas so temporrias, a no ser que sejam
salvas
Transform: cria novas variveis a partir das existentes, modifica dados e variveis por meio de
clculos. As mudanas so temporrias a no ser que sejam salvas.
Analyze: aqui encontramos os diversos procedimentos estatsticos realizados pelo SPSS
(regresso, anlises descritivas, testes de comparao). A cada nova verso do SPSS novos testes
so agregados, aumentando o alcance do SPSS.
Graphs: usado para criar e modificar grficos; h vrias opes de grficos, como barra, linha,
coluna, torta, histograma, disperso, etc, devendo ser escolhido aquele que melhor representa os
dados e as variveis em estudo. Um duplo clique no mouse sobre o objeto abrir a janela Chart
Editor, onde possvel modificar as fontes, cores, escalas e tamanho dos diversos elementos do
grfico.
Utilities: permite a obteno de informaes sobre as variveis e o banco de dados (opo
variables)
Window: mostra as janelas que esto em execuo no SPSS
Help: contem uma janela de ajuda que contem informaes como usar o SPSS
Mostra denominaes
atribudas aos valores
de uma varivel
Insere dados
Vai at o caso
Descreve variveis Insere casos
3
II - COMO CRIAR UM BANCO DE DADOS
No SPSS os dados podem ser tanto digitados no teclado como lidos de um arquivo externo.
O formato do SPSS *.sav.Os dados no SPSS so digitados diretamente na janela Editor de
Dados (Data Editor), como numa planilha eletrnica .Assim possvel criar um arquivo no SPSS
(*.sav) (Figura 2) As variveis podem ser quantitativas (altura, peso), categricas (sexo), de data
9tipo calendrio) ou alfanumricas (letra).
4
Seja o exemplo: digitar na primeira coluna o nome das variveis que esto apresentadas na Tabela
2
Sexo: (1)feminino; (2) masculino; peso em kg; altura em cm; glicemia em mg%
Tabela 2.Dados de cinco sujeitos de um estudo (Wagner MB e cl, 2004
Aps digitar cada varivel, pressionar Enter e o SPSS automaticamente assume o tipo de
varivel. No final, a tela Data Editor na opo Variable View, dever ficar como na Figura 3.
Figura 3. Visualizao da tela do Data Editor na opo Variable View para as variveis do
Exemplo 1 (Tabela 1)
A seguir, ir para o Data Editor na opo Data View para inserir os dados da Tabela 2. As
informaes devem ser digitadas conforme apresentadas na Figura 4.
Fig. 4.Opo Data View da janela Data Editor com os nomes das variveis no cabealho e os
dados do exemplo da Tabela 2
5
possvel corrigir os dados depois de inseridos na tabela, assim como apagar clulas.
possvel tambm inserir novos casos: escolher Data>Insert Cases, assim como inserir novas
variveis: escolher Data>Insert Variable.
Dependendo do interesse do pesquisador, novas variveis podem ser criadas a partir das j
existentes.Para isto, basta ir ao menu Transform e escolha o comando compute. Suponhamos que
queiramos inserir presso arterial (PA)(Figura 5);
6
Varivel qualitativa:
7
Na caixa de dilogo de Frequencies, selecione as variveis uso de corticide, uso do O 2
com 36 semanas de idade gestacional ps-concepo e tipo de parto e movam-nas para a caixa
Variable(s), clicando no boto []. importante que a opo Dispaly frequency tables esteja
marcada para a obteno da tabela de freqncias. Em seguida, pressionar [OK]. Vejam que as
variveis que enviamos para a direita, desaparece na esquerda. Ao mover a varivel da esquerda
para a direita, selecione-a e pressione [].
Na janela Ouput Viewer vamos ter uma tabela de freqncias para as variveis
selecionadas (Figura 8)
Frequencies
Frequency Table
8
A seguir pressionar[Statistics]: na caixa de dilogo Frequencies: Statistics escolha
Quartiles (quartis), Mean (mdia), Std Desviation (devio-padro), Minimum (mnimo), Mximum
(mximo) e S.E. mean (erro-padro mdia) e pressione [Continue] para voltar a caixa de dilogo
Frequencies (Figura 10).
9
3-2- Comando Descriptive
Este comando mais usado para variveis quantitativas. No menu escolha
Analyze>Descriptive Statistics>Descriptives (Figura 12)
10
A seguir pressionar [0ptions] e selecionar as estatsticas e as opes desejadas.
Neste comando j esto selecionadas previamente as estatsticas Mean (mdia), Std
.Desviation (desvio padro), Minimum (mnimo) e Mximum (mximo). Este comando
permite classificar os resultados segundo critrios de ordem de seleo, como ordem
crescente de mdias (Ascending means) (Figura 14).
3-3-Comando Explore
Este comando apresenta maiores opes de estatsticas descritivas, alm de dispor de testes
estatsticos para normalidade e grficos especiais. utilizado exclusivamente com variveis
quantitativas e permite comparar tipo de dados entre dois ou mais grupos. Podemos obter:
-medidas de tendncia central:mdia, moda, mediana
-medidas de disperso: desvio-padro, varincia, amplitude e quartis
-outliers: anlise de valores discrepantes
-testes especficos para avaliar a normalidade (Kolmogorov-Smirnov e Shapiro-Wilk
-boxplot
-medidas descritivas adicionais, como assimetria, curtose e outras
Como usar este comando: no menu Analyze Descriptive>Statistics>Explore
11
Exemplo: Na caixa de dilogo Explore, escolha a varivel que se pretende explorar,
colocando-a na lista de variveis dependentes (Dependent List). Na varivel classificatria (Factor
List) coloca-se, geralmente, uma varivel categrica. No nosso exemplo, vamos explorar a
varivel idade gestacional com o uso de corticosteride pr-natal (Figura 16)
12
Prosseguindo, pressionar o boto [Continue] para voltar caixa Explore. Nesta caixa, clicar
no boto [Continue]. Os resultados da anlise surgiro na janela Output Viewer (Figuras 19). O
comando Explorer produz uma tabela chamada Case Processem Somar que contm os casos
vlidos e omissos includos na anlise para a varivel Apgar trs no 5 minuto estratificada por uso
de corticosteride.
13
Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5 maiores
e os 5 menores)
A tabela Test of Normality mostra o resultado de dois testes de normalidade: Kolmogorov-
Smirnov e o Shapiro-Wilk. Os dois testes testam a hiptese de que os dados apresentam uma
distribuio normal. No caso de amostras menores (<50 casos), o teste Shapiro-Wilk mais
poderoso. Um valor abaixo da significncia indica um desvio na distribuio dos dados em relao
Curva Normal (de preferncia deve estar abaixo de 0,05 ou mesmo 0,01) (Figura 21)
14
No observamos nenhum valor discrepante e extremo. Ao se detectar estes valores,
podemos retornar ao Data Editor para consultar o caso assinalado.
3-4- Comando Crosstabs Este comando est relacionado diretamente com a obteno
de testes estatsticos (qui-quadrado e exato de Fischer) e de medidas de fora de associao, que
sero estudados mais adiante (Estatstica Analtica). Antes, vejamos a Manipulao e Criao de
Novas Variveis
15
Compute: realiza clculos; o SPSS disponibiliza mais de 70 funes matemticas (raiz
quadrada, logaritmo, coseno, etc)
Recode: reclassifica variveis, tanto quantitativas como categricas
Visual Bander: permite a criao de novas variveis com base no agrupamento de valores
contnuos de variveis existentes em categorias distintas)
Count: possibilita contar quantas vezes determinado valor aparece
Rank Cases: classifica as observaes em ordem crescente ou decrescente, obtendo assim
os ranks (postos)
Automatic recode: transforma automaticamente valores descontnuos e afastados entre si
em uma srie de valores numricos inteiros e contguos. til para transformar uma varivel
alfanumrica (string) em uma varivel numrica para poder ser utilizada em anlises estatsticas
que requerem categorias numricas
Create time series: cria variveis novas baseado em funes de variveis numricas de
sries temporais
Replace missing values: permite substituir os dados omissos (missing) por valores
numricos vlidos a serem usados em anlises estatsticas. Indicado quando a proporo de
omissos pequena (<10%) e quando a varivel quantitativa.
Randon Number Seed: gera nmeros pseudo-aleatrios, sendo possvel, assim, determinar
o ponto de partida para a gerao automtica destes nmeros pelo SPSS.
COMANDO COMPUTE|:
Vamos criar uma varivel a partir da existente, como: Calcular o ndice ponderal (IP=
peso/altura3).
-Na janela Data Editor, escolha: Transform> Compute e surgir( Figura 24):
16
No campo Target Variable (Varivel destino), escrever o nome da varivel que ser
transformada. No exemplo ser criada a varivel IP (ndice ponderal). Digitar IP no campo Target
Variable; clicar a seguir na opo Type&Label e adicionar o rtulo (label) ndice ponderal.
Observe que o SPSS assume tratar-se de uma varivel numrica com duas casas decimais. A
seguir, desloque para o campo Numeric Expression as variveis envolvidas, usando [],
adicionando as operaes matemticas necessrias.; para a exponenciao use asterisco duplo
multiplicado 3 vezes por ela mesma, como na Figura 25.
Pressione [OK] e o resultado aparece imediatamente na janela Data Editor, como mostrado
na Figura 26:
17
em que foram realizados. Voc pode copiar a tabela clicando o boto direito do mouse e
selecionando copy e cole onde for necessrio.
Voc tambm pode manipular tabelas, como por exemplo, traduz-las. Para isto, basta ativar
o Pivot Table Editor, clicando o boto direito do mouse na tabela e assim, a tabela fica pronta para
ser editada na prpria janela Pivot Table Editor. Possibilita tambm uma viso e edio de uma
tabela larga e longa (Figura 27). Veja o exemplo a seguir:
Estes comandos permitem obter resultados das anlises divididas em categorias, como
sexo masculino e feminino.
18
Comando Split
-Split: vejamos a estratificao da anlise usando uma varivel categrica, por exemplo,
sexo. Selecionar Data>Split>File (Figura 29).
Uma vez aberta a caixa de dilogo Split File, marcar Compare groups e colocar a
varivel sexo na caixa Groups Based on e clicar [OK] (Figura 30).
19
Selecionar agora Analyze>Descriptive Statistics. Descritives...Options (Mean, Std
Desviation, Minimum e Maximum)....variveis peso e estatura (Figura 31). Observem
que os resultados na janela Output Viewer vo aparecer agrupados pela varivel sexo.
Se no Split File voc marcar Organize output by groups, vamos ter os resultados de um
grupo e de outro grupo (Figura 33).
20
Fig.34. Resultados do comando Split File>Organize output by group
21
Comando Select
Este comando seleciona apenas uma categoria especfica dos casos de um arquivo
de dados. Escolher Data Select Cases, selecione a categoria a ser analisada, por
exemplo, da varivel categrica sexo, sero selecionados somente os casos do sexo
masculino (Figura 36)
22
Agora, selecione a varivel sexo e usando os sinais no centro da caixa de dilogo, digite
a expresso condicional, clicando no centro da caixa de dilogo (Figura 38)
23
Para restaurar os dados do arquivo, escolher Data>Select Case... All cases e clicar
[OK] (Figura 40).
V-ESTATSTICA ANALTICA
A Estatstica Analtica trabalha com os dados de forma a estabelecer hipteses,
procede a sua comprovao e no final, elabora concluses cientficas
Teste de Hiptese e Tamanho da Amostra para melhor compreenso da significncia
estatstica
Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo
examinado apenas parte desta populao (amostra). Este processo chama-se de
inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos.
Para a compreenso de um teste estatstico preciso que entendamos o que vem
a ser Hiptese Nula (H0) e Hiptese Alternativa (H1).
Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo
com certos critrios, ser ou no rejeitada.
Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena
entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do
fenmeno ou resultado observado.
Hiptese Alternativa ou experimental (H 1): aquela que afirma que h
diferena entre os grupos estudados.
O principal objetivo de testar uma hiptese responder seguinte questo:
dadas duas amostras, so elas realmente diferentes ou pertencem a uma mesma
24
populao, ou em outras palavras, as diferenas encontradas entre duas ou mais
amostras so verdadeiras ou podem ser explicadas pelo acaso.
O processo de testar hiptese consiste em seis etapas:
1. Estabelecer a H1 ( se l ag 1)
2. Estabelecer a H0 ( se l ag zero)
3. Determinar o tamanho da amostra
4. Colher os dados
5. Realizar teste estatstico para verificar a probabilidade
de que a H0 seja verdadeira
6. Rejeitar ou no a H0
25
Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O
nvel de significncia seria a probabilidade (p) de afirmar que uma das drogas determina
maior proporo de curas, quando na verdade, a proporo de pacientes curados a
mesma, seja a droga A ou B. usual manter o nvel de significncia de 1% e 5%; um
de 5% (0.05) significa que cometemos um erro (tipo I) de 5% em rejeitar a H0 (sendo
verdadeira) e aceitar H1 (1 em cada 20 se comete o Erro tipo I ao rejeitar a H0). Um de
1% (0,01), significa que ao rejeitar a H0 e aceitar a H1, o risco de estarmos errando, ou
seja, cometendo um erro tipo I de 1%. O nvel de significncia representa a mxima
probabilidade de tolerar um erro tipo I.
O erro tipo I ocorre quando se acredita que existe um efeito verdadeiro na
populao e de fato no h. Usando o critrio de Fisher, a probabilidade de erro 0.05
(ou 5%) quando no existe efeito na populao. Segundo Fisher devemos somente
acreditar que o resultado verdadeiro quando tivermos 95% de confiana de que ele
ou quando houver somente 5% de chance de que os resultados possam ocorrer ao
acaso.
O oposto o erro tipo II que ocorre quando acredita-se que no exista um efeito
na populao, mas na realidade ele existe. O ideal que a probabilidade deste erro seja
bem pequena (se existe um efeito na populao importante que possamos detect-lo).
Cohen sugere que a probabilidade mxima aceitvel para um erro tipo II seria
0,2 (20%), definvel como beta (). Se tomarmos 100 amostras de dados da populao
na qual um efeito existe, vamos falhar em detectar este efeito em 20 destas amostras
(perderamos 1 em 5 dos efeitos verdadeiros).
Portanto, para fazer um erro tipo I no deve haver efeito na populao, enquanto
para fazer um erro tipo II vale o contrrio, ou seja, deve haver um efeito que perdemos.
A probabilidade de cometer um erro tipo I diminui medida que a aumenta
probabilidade de cometer um erro tipo II.
Assim:
Os erros ocorrem ao testar hipteses por diferentes motivos:
- Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto
menores forem; numa amostra maior, estas diferenas se diluiriam).
- Erro tipo II: amostras pequenas
grande quantidade de amostras
Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa,
considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente 10 -
20%.
Tamanho da Amostra
conveniente planejar o tamanho da amostra para que se possa ter amostras
grandes o suficiente para detectar diferenas importantes. Por outro lado, amostras
exageradamente grande alm de elevar o custo do estudo, podem tornar diferenas
irrelevantes em estatisticamente significativas.
Para determinar o tamanho da amostra preciso estabelecer qual a diferena
deve ser considerada significativa. Esta uma deciso arbitrria do pesquisador,
baseada na experincia, na literatura e/ou na relevncia clnica.
Para determinar o tamanho da amostra, deve-se considerar o nvel de
significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira.
26
Geralmente considera-se uma probabilidade menor ou igual a 5% como adequada (p
0,05). Poder do teste: a probabilidade que um determinado teste ir encontrar um
efeito assumindo que um j existia; lembrem-se que corresponde probabilidade de
falha em detectar um efeito que realmente existe (erro tipo I). Assim, a probabilidade de
detectar um efeito, se um existe, deve ser o oposto da probabilidade de no detectar
aquele efeito, isto , 1-. Como j vimos, Cohen sugere que deveramos esperar uma
probabilidade de 0.2 na falha em detectar um efeito verdadeiro e assim, o nvel
corresponde do poder recomendado por ele que foi de 1.0-0.2=0.8. Portanto o objetivo
alcanar um poder de 0,8 ou 80% de probabilidade de detectar um efeito se ele
realmente existe. Por exemplo, um poder de 80% significa que, se de fato houver
alguma diferena, haver uma probabilidade de 80% de detect-la.
Uma vez conhecido o valor de alfa e beta, podemos usar pesquisas anteriores ou
experimentos similares para estimar o tamanho do efeito que se espera detectar com um
experimento. Assim, podemos usar esse tanto de efeito estimado para calcular quantos
participantes necessitamos para detectar este efeito, com base nos valores de alfa e beta
que escolhemos.
Os clculos exatos so volumosos, devendo ser usados programas de
computador. Entre estes, citamos o G*Power (grtis) e o nQuery Adviser (pago), o
disponvel no Epiinfo e no Laboratrio der Epidemiologia e Estatstica.
27
Prosseguindo com o exemplo, vamos clicar em Estudo de coorte (estudo de coorte:
comparao entre um grupo exposto a um fator de risco e outro grupo no exposto. Visa
verificar se indivduos expostos ao fator de risco desenvolvem a doena em questo, em
maior ou menor proporo, do que um grupo de indivduos no expostos) e teremos:
28
Explicaes:
Teste de hiptese:
29
Para calcularmos a mostra esperando uma incidncia de 10% de hemorragia
intraventricular no grupo com corticosteride e 20% no grupo sem corticosteride,
fazemos:
30
expostos e no expostos a corticoterapia, POSSIVELMENTE necessitaramos de 135
mes para cada grupo, num total de 270 gestantes.
Para fins prticos, segundo Cohen: participantes para detectar efeito mdio
(r=0.3), so necessrios 85 e para efeito grande (r=0,5), so necessrios 28; para efeito
pequeno (r-0,1), precisamos de 783.
- Amostras grandes: n > 100
- Amostras mdias: n > 30
- Amostras pequenas: n < 30
- Amostras muito pequenas: n < 12
Lembrar que: quanto menor a diferena a ser detectada, maior dever ser o
tamanho da amostra; quando menor o nvel de significncia (p), maior deve ser o
tamanho da amostra.
A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam
igualmente a ms concluses. Segundo Field, procedimentos estatsticos so uma forma
de processar nmeros e, portanto, se voc colocar baboseiras em uma anlise, mesmo
assim obter concluses com significado estatstico, mas que provavelmente no tero
sentido emprico (prtico). A estatstica no uma forma milagrosa, apenas um
recurso. Na determinao da verdade. Na anlise estatstica no existe um substituto
para o pensamento emprico.
Uma vez obtidos os dados, faz-se a anlise estatstica aplicando-se testes
escolhidos em funo do tipo de dados disponveis.
V-1-Teste t de Student
Este teste usado para avaliar a hiptese de que duas mdias so iguais ou no.
O valor do t calculado (tc) tanto maior quanto maior for a diferenas entre as mdias. O
nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a
companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua
pesquisa usando seu prprio nome e assim publicou com o nome Student.
importante para a aplicao do Teste t que a varivel em estudo tenha
distribuio normal ou aproximadamente normal.
O SPSS pode executar trs aplicaes do teste t em mdias: para uma amostra,
amostras independentes e amostras emparelhadas.
-para uma amostra: o objetivo verificar se a diferena entre o valor mdio,
que representamos por X obtido em uma amostra difere ou no significativamente da
populao referncia. Ou seja, testar se Ho: o = X onde o a mdia da populao
onde a amostra foi retirada. No se conhece o desvio padro () )da populao.
31
Shapiro-Wilk). Na janela Data Editor, selecionar Analyze>Compare means>One
Sample T-test (Figura 41).
-selecionar altura como Test Variable(s). -Em Test Value escreva o valor de 50 cm
(parmetro de referncia) (Figura 42).
32
Interpretao: Na tabela One-Sample temos o valor do teste t (-40,627) e a
significncia do teste (Sig. 0,0000 (p<0,001) que permite rejeitar a hiptese nula (H o)
para o nvel de significncia de alfa<=0,05. Podemos ento dizer que a amostra de 218
recm-nascidos estudados vem de uma populao cuja mdia diferente (neste caso
menor) do que 50 cm.
-amostras independentes: sero comparadas duas mdias; as variveis devem ter
distribuio normal.
-Selecionar Analyze>Compare Means>Independent-Samples T-test (Figura 44).
33
-Digite os valores correspondentes usados para a varivel sexo: 1 e 2
-Clicar em [OK]. Na tela de sada do Output Viewer ser mostrado (Figura 48):
Group Statistics
34
Se a significncia do teste for <=0.05: rejeita-se a igualdade das varincias; se a
significncia do teste for >0.05, as varincias so iguais
No nosso exemplo, a significncia do teste de Levene foi 0,75 e assim usamos o
teste t para varincias iguais (Equal variances assumed). Neste caso, o valor do teste a
ser interpretado ser t=-1,568. Como a significncia maior que 0.05, no rejeitamos a
hiptese nula, ou seja, no h uma diferena estaticamente significativa entre as mdias
de estatura dos RN submetidos corticoterapia pr-natal em relao aos RN no
submetidos corticoterapia pr-natal.
Para determinar se existe diferena entre pesos nos dois grupos, usamos o teste
no paramtrico de Mann-Whitney (veja adiante), uma vez que o peso ao nascer no
segue os pressupostos da distribuio normal, como determinado pelo teste de
Normalidade Kolmogorov-Smirnov -Test t para amostras emparelhadas
s vezes os pesquisadores estudam os efeitos de um tratamento comparando-se:
-pares de indivduos (um gmeo recebe um tratamento e o outro, no).
-dois lados de um mesmo indivduo (aplicao de um tratamento para a
preveno de cries em um lado da arcada dentria e o outro lado sem tratamento-
controle).
-mesmo indivduo duas vezes (presso arterial antes e aps o tratamento em um
mesmo indivduo; diferena entre o peso mdio dos indivduos antes e depois da dieta).
-diferenas entre as mdias das hemoglobinas antes e depois da cirurgia
Ou seja: medidas feitas em dois pontos distintos no tempo
Ao usar o SPSS, temos que ter a certeza de que os dados foram digitados no
formato de duas variveis diferentes para cada caso.
No nosso banco de dados no temos amostras emparelhadas, ou seja, no temos
varivel de cada indivduo medida antes de depois de uma interveno. Citando o
exemplo de Wagner e cl: a diferena entre as mdias de hemoglobina antes e depois da
cirurgia atribuda ao acaso? Importante: como so amostras emparelhadas,
necessrio que os dados sejam digitados no formato de duas variveis diferentes para
cada caso, como hb1 e hb2 (pr-operatrio e ps-operatrio).
-Selecione Analyze>Compare Means>Paired-Simples T-test (Figura 49)
35
-Selecione as duas variveis emparelhadas e coloquem-nas no Paired Variables(s)
(Figura 50)
36
Fig. 52 Resultado do teste t para amostras emparelhadas
37
H1 (hiptese experimental): h diferena entre os grupos
38
seguida, clicar em [Continue] para voltar janela anterior e finalize clicando em [OK]
(Figura 62)
Idade Gestacional
Levene
Statistic df1 df2 Sig.
1,390 8 209 ,203
39
A ltima tabela corresponde tpica tabela de apresentao do teste de ANOVA (Figura
58).
ANOVA
Idade Gestacional
Sum of
Squares df Mean Square F Sig.
Between Groups 211,110 8 26,389 5,908 ,000
Within Groups 933,501 209 4,467
Total 1144,612 217
40
Na anlise de varincia, quando a diferena entre os grupos no significante,
no necessrio nenhum outro teste mais. No entanto havendo diferena significante
pelo F-teste, isto no quer dizer que todos os grupos difiram entre si. A ANOVA informa
somente se h ou no diferena estatisticamente significativa entre dois ou mais grupos,
mas no informa quais os grupos envolvidos. Vejam que aplicando a ANOVA no
exemplo que estamos estudando, as mdias dos 10 grupos no so estatisticamente
iguais. Mas qual ou quais so as mdias diferentes entre si?
Para identificar os grupos, deve-se realizar uma comparao entre os pares - pair
wise comparision test - que ir comparar cada grupo com cada um dos outros. Para
saber onde est a diferena, so necessrios testes de comparaes mltiplas de mdias
(Post Hoc). , pois comparam todos os grupos dois a dois. Um dos testes mais utilizados
o Teste de Tukey.
Como anteriormente, escolha na janela Data Editor do SPSS
Analyze>Compare>Means>One-Way ANOVA.
Na caixa de dilogo One-Way ANOVA, alm das opes que foram escolhidas no
procedimento anterior, clicar n em [Post Hoc].Veja na figura 60.
41
Alm das tabelas anteriores, surgira a tabela Post Hoc Multiple comparisons, onde se
encontram as comparaes entre as mdias dos dois grupos (Figura 62).
42
-As diferenas significativas so mostradas com asteriscos (*).
-A coluna Sig mostra a significncia estatstica (p) para a diferena entre as mdias das
amostras (significante se p<0,05).
-A prxima coluna mostra os limites dos intervalos de confiana de 95% para as
diferenas entre as mdias das amostras.
Interpretao:Vejam que o Grupo 3 apresentou diferena significativa em relao
aos grupos 4,7 9 e 10, mas no em relao aos grupos 1 e 8.
Obtendo o grfico Boxplot como j vimos anteriormente (obtido com o comando
Explore,) d uma melhor viso do que o Means Plot, a distribuio da idade gestacional
no grupos de Apgar ao 5 minuto (Figura 63).Vejam:
V-3.Qui-quadrado
A estatstica do qui-quadrado (Chi-square) adequada para variveis
qualitativas, com duas ou mais categorias, ou seja dados nominais (aqueles
distribudos em categorias nominais sem qualquer ordem, como sexo, raa, via de
43
parto,cor dos cabelos). A prova do qui-quadrado (X2) utilizada para comprovar se
existem diferenas estatisticamente significativas entre duas distribuies: mede o grau
de discrepncia entre um conjunto de freqncias observadas e um conjunto de
freqncias esperadas; o seu valor ser zero quando no houver diferena entre os
nmeros observados e os esperados.
O qui-quadrado quantifica a associao entre variveis qualitativas, comparando
as diferenas entre os valores observados e os esperados. Quanto maior for o valor da
estatstica X2, maior ser o grau de associao existente entre as duas variveis.
O qui-quadrado tambm pode ser usado para variveis quantitativas, uma vez
que possvel criar categorias para estas variveis, como, durao da internao,
categorizadas nas classes at 2 dias e mais de 2 dias.
Na aplicao do qui-quadrado, as freqncias tericas para cada casinha devem
ser iguais ou superiores a 5.
Os principais testes so o Teste Qui-quadrado para uma amostra e o Qui-
quadrado de independncia. Todas as frequncias esperadas devem ser maiores que 1
e no mximo 20% das frequncias esperadas podem ser menores que 5.A amostra total
deve ser maior que 20.
Teste Qui-quadrado para uma amostra
Nesta amostra que estamos trabalhando (uso de corticosteride pr-natal na
Maternidade do Hospital Regional da Asa Sul), as mes so igualmente distribudas
quanto ao tipo de parto, hipertenso, sexo e gemelaridade?
Para isto fazemos:
Analyze >Nonparametric Test>Legacy dialogs>Chi-Square (figura 64)(SPSS-18)
44
Clicar em OK e a sada do SPSS mostrar (figura 66)
45
Teste Qui-quadrado de independncia
Na caixa de dilogo Crosstabs, selecionar uso sexo nas Row (s) (linhas) e uso
de corticosteride nas Column(s) (colunas) (Figura 65)
46
Fig.69.Caixa de dilogo Crosstabs: Cell Display
Clicar [Continue]
Clicar [OK]
47
Fig.71. Resultados do teste do qui-quadrado utilizando o Crosstabs para o
uso de corticosteride pr-natal e sexo.
Entendendo melhor o resultado do Qui-quadrado
48
V-4- Risco Relativo e Odds Ratio
O Risco Relativo (RR) e Odds Ratio (OD) so medidas de fora de associao
(medidas de efeito), ou seja, medem a associao da varivel de desfecho com a
varivel de exposio: quanto da probabilidade de ocorrncia da varivel dependente
deve-se sua relao com a varivel independente. Os termos associao e efeito
referem-se ao fato de que uma varivel teria uma relao ou exerceria um efeito sobre
outra varivel. Como os resultados so decorrentes de uma razo, o valor de nulidade
para esses de 1 (um).
Selecionar Analyze>Descriptives Statistics>Crosstabs
Na caixa de dilogo do Crosstabs, selecionar PNIU (pneumonia) nas Column(s)
(coluna (s), e uso do corticosteride pr-natal nas Row (s) (linhas). Clicar em [Cells] e
selecionar Counts: Observed e Percentages: Row (Figura 72)
Clicar [Continue]
49
Fig.73. Caixa de dilogo Crosstabs:Statistics
Clicar [OK]
Fig.74.Resultados do X2
50
Interpretao: observamos que a pneumonia ocorreu significativamente menos nos
RN cujas mes receberam corticosteride pr-natal (OR: 0,31, com intervalo de
confiana de 0,12-0,77)ou seja, houve diminuio da pneumonia intra-uterina em 69%
(1-0,31=0,69 x 100= 69%) nos RN expostos ao corticosteride pr-natal em relao aos
RN no expostos e a estimativa da variabilidade foi de 23% a 88% (1-0,77=0,23 x
100=23% e 1-0,12=0,88 x 100= 88%). Esta associao significativa por no conter a
unidade no intervalo de confiana. Observe da significncia no Pearson Chi-Square em
Asymp.Sig (2-sided) que foi de 0,009
O Risco Relativo (RR) a medida da fora da associao entre a exposio e o
evento (resultado). A razo das chances (odds ratio - OR) definida como a
probabilidade de que um evento ocorra dividido pela probabilidade de que ele no
ocorra, ou seja o quociente entre a quantidade de eventos e a quantidade livre de
eventos (o mesmo modo que o RR avalia-se a variabilidade amostral da OR atravs do
clculo do intervalo de confiana e a interpretao a mesma do RR, ou seja, se o
intervalo de confiana da OR contiver a unidade, significa ausncia de associao). A
OR pode ser estimada em estudo tipo coorte (populao seguida da causa para o efeito)
e em estudo tipo caso- controle (populao seguida do efeito para causa). J o RR s
pode estimado em estudos tipo coorte e no em estudos tipo caso-controle, porque este
tipo de estudo no permite estimativa da taxa populacional do evento nos grupos
estudados.
Quando o RR ou a OR igual a 1, significa que no h efeito com o tratamento,
ou seja, o efeito do tratamento o mesmo nos dois grupos. Se o RR/OR < 1, significa
que o risco do evento menor no grupo tratado que no controle. A variabilidade
amostral do estudo pode ser avaliada atravs de testes de significncia ou via intervalo
de confiana. Aqui daremos preferncia segunda abordagem. Para um dado nvel de
significncia (p<= 0,05), o intervalo de confiana representa o intervalo onde deve estar
o parmetro, ou seja, o risco relativo verdadeiro. Se o valor 1, que se refere nulidade
da associao, no estiver contido no intervalo, temos uma confiana que na populao
de onde nossa amostra foi extrada, o RR diferente de 1, sendo, portanto significativo
o achado da amostra. Para a realizao dos clculos do risco relativo e o intervalo de
95% de confiana, assim como o seu significado, consulte www.paulomargotto.com.br,
em Entendendo Bioestatstica e Exerccio da Medicina Baseado em Evidncias.
51
Digite APENAS nas caselas de cor laranja e NUNCA nas caselas azuis.
52
(<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa)
53
moderada; r = 0,20 - <0.40: baixa; r = 0 - <0.20 muito baixa; r = 0: nula forte. O
coeficiente de correlao um ndice de magnitude na qual se associam duas variveis.
Antes de se realizar uma anlise de correlao, devemos fazer um grfico de
disperso (Scatterplot) para a verificao do comportamento das variveis.
No menu Graphs, selecionar Scatter (Figura 75).
54
Fig.77. Caixa de dilogo Simple Scatterplot
Na janela Output Viewer vai aparecer a seguinte figura (Figura 78)
55
Dando um clik duplo com o mouse sobre o grfico, ser aberta a janela Chart
Editor, podendo assim ser editado o grfico. Selecionar Elements e Ft Line at total
(Figura 79).
Reta de Regresso
r2
56
Observem que no canto direto do grfico aparece o R sq Linear, que
representa o coeficiente de Pearson ao quadrado (r2) (veja mais adiante)
Aps a avaliao do Scatterplot, solicita-se a anlise de correlao propriamente
dita: Analyze>Correlate>Bivariate e ser aberta a caixa de dilogo Bivariate
Correlations (Figura 81).
57
r
Fig.84.Menu Analyze>Corelate>Partial
Na caixa de dilogo Partial Correlations, escolhemos controlar (Controlling for)
a idade gestacional. Clicar em [OK] (Figura 84).
58
Fig.84. Caixa de dilogo Partial Correlations
A janela do Output Viewer mostrar (Figura 85):
59
Como j citamos, quando a anlise de regresso linear envolve somente uma
varivel explanatria (X), a tcnica denominada Regresso Linear Simples. Quando
so envolvidas duas ou mais variveis explicativas, emprega-se a expresso Regresso
Linear Mltipla.
A seguir vamos realizar uma regresso simples com peso como varivel
dependente e a estatura como varivel independente (a que explica).
Analyze>Regression>Linear. Vai aparecer a caixa de dilogo de regresso linear.
Escolha o peso como varivel dependente e a estatura como varivel independente
(Figura 86).
60
Fig.88.Output viewer da anlise de regresso linear simples
Como j descrevemos existe uma correlao entre peso e estatura (r=0.44), ou
seja certa proporo da variabilidade do peso pode ser explicada pelo estatura. No
havendo correlao entre duas variveis, dizemos que elas so variveis independentes.
Na tabela Model Summary, vemos o r Squared (r2) igual a 0,193. O r2 conhecido
como coeficiente de determinao (deve ser interpretado como a proporo da variao
total que explicada) e estima que 19,3% (0,19) da variabilidade do peso explicada
pela estatura (tal como mostramos o grfico com a reta de regresso obtida no Chart
Editor, selecionando Elements e Ft Line at total(consulte a Figura 77).
J o Coeficiente de Alienao calculado 1- r2, sendo interpretado como a
proporo da variabilidade de Y que no explicada pela variabilidade de X. No
presente exemplo, 80,7% do peso no explicada pela estatura do recm-nascido.
Observando a tabela ANOVA vemos a significncia da razo F (p<0.0001),
indicando que o modelo de regresso (estatura) prev o peso bastante bem. No entanto
a ANOVA no informa a contribuio individual das variveis no modelo (neste caso,
61
como s h uma varivel no modelo, podemos inferior que esta varivel um bom
previsor).
Vamos agora interpretar a tabela Coeficients (os parmetros bo e b1 so
conhecidos como coeficientes de regresso): na equao de regresso bo representa o
intercepto y, ou seja, ponto onde a linha corta o eixo Y (Consulte Margotto
PR:Correlao em Entendendo Bioestatstica Bsica www.paulomargotto.com.br ) e
este o valor B na tabela. Podemos tambm ver o valor b1 da tabela e este valor
representa o gradiente (inclinao) da linha de regresso. O seu valor 38,572. Este
valor representa a mudana da varivel de sada para cada alterao de uma
unidade no previsor. Assim, se a varivel previsora (estatura) aumentada em uma
unidade , o modelo prev um aumento de 38,572g no peso. Para que a varivel
previsora tenha um impacto significativo na habilidade de prever o resultado, este b
deve ser diferente de zero e grande,quando comparado ao erro padro. Para estes dois
valores, as probabilidade (teste t) so de 0,000 e assim podemos afirmar que a estatura
tem uma contribuio significativa (p<0.001) para prever o peso ao nascer.
Portanto, a Equao da reta fica:
Peso ao nascer = bo (-251,117) +b1(38,572) x Estatura ao nascer
Exemplo:RN com estatura de 38,52cm,a previso do peso :1235g
REGRESSO MLTIPLA
62
quanto covariantes (dados contnuos) e as variveis dependentes podero estar dispostas
em duas ou mais categorias. Assim, temos a Regresso Logstica Binria (duas
Categorias), Ordinria e Nominal. A escolha de qual mtodo a ser utilizado depende do
nmero de categorias e das caractersticas da varivel resposta. Veja a tabela 3, a seguir:
Uma varivel binria aquela que aceita apenas dois nveis de resposta, como
sim ou no. J uma varivel ordinria segue uma ordenao natural das coisas, como
pequeno, mdio e grande ou classificao como ruim, bom ou excelente. A varivel
nominal tem mais de trs nveis sem nenhuma ordenao (objeto azul, preto, amarelo e
vermelho ou na previso do tempo, ensolarado, nublado, chuvoso).
Em resumo, a regresso logstica uma regresso mltipla, mas com uma
varivel de sada categrica dicotmica e variveis previsoras contnuas ou categricas.
No exemplo a seguir vamos realizar uma Regresso Logstica Binria
utilizando o SPSS. No exemplo, a varivel resposta ser a ocorrncia de Apgar<= 3 no
5 minuto (sim ou no), caracterizando uma varivel binria. As variveis independentes
escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5
minuto: corticide, hipertenso materna, tipo de parto e pr-natal.
Analyze>Regression>Binary Logistic (Figura 89)
63
Fig. 90. Caixa de dilogo principal da regresso logstica
Como na regresso mltipla, existem vrios mtodos diferentes que podem ser
utilizados na regresso logstica. Selecionar o mtodo clicando na seta que aponta para
baixo prximo ao quadro denominado em [Method]. O mtodo padro de conduzir esta
regresso o enter, o mesmo da entrada forada da regresso mltipla em que todas as
covariveis so colocadas no mesmo modelo de regresso em um nico bloco e as
estimativas dos parmetros so calculadas para cada bloco. Sendo assim, optamos por
Enter (Figura 91).
64
Fig.92. Definindo as variveis categricas na regresso logstica
Retornando a Caixa de dilogo principal da regresso logstica, pressionar
[Save] e selecionar toas as opes disponveis, como mostra a Figura 93. O exame dos
resduos extremamente importante para verificar a qualidade do ajuste do modelo aos
dados observados.
65
Fig. 94. Caixa de dilogo para as opes da regresso logstica
Pressionar [Continue] para retornar a caixa de dilogo principal da regresso logstica e
seguir, clicar em [OK]) e o Output Viewer mostrar (Figuras 95).
-codificao da varivel dependente - codificao das variveis previsoras
66
A coluna Score mostra o valor da estatstica do escore eficiente de Roa.
Observem que a hipertenso, seguida pelo corticosteride e o tipo de parto apresentam
maior escore eficiente de Roa significativos.
Estimativa dos coeficientes dos previsores includos no modelo: fornece os coeficientes
e estatsticas para as variveis que foram includas no modelo (figura 96):
Uma estatstica importante a estatstica de Wald que tem uma distribuio qui-
quadrado e nos informa se o coeficiente b para um dado previsor difere
significativamente de zero. Se isto ocorrer, podemos dizer que o previsor est
contribuindo de modo significativo para a previso da sada. Assim , com relao a
estes dados, podemos dizer que o uso do corticosteride pr-natal um previsor
significativo para a no ocorrncia de Apgar <= 3 e que a hipertenso materna
representa um fator de risco. A exp b(Exp (b) interpretada como uma mudana nas
chances: se o valor for maior que 1, ele indica que medida que o previsor aumenta,
aumentam as chances de uma sada ocorrer; j um valor menor que 1, indica que
medida que o previsor aumenta, as chances de uma sada ocorrer diminuem. Neste
exemplo, podemos afirmar que as chances do RN cuja me recebeu esteride pr-natal
de apresentar um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 1- 0,427=0,573 x
100= 57,3%) em relao ao RN no exposto ao esteride pr-natal. J a hipertenso
materna constituiu um fator de risco, aumentando em 2,3 vezes mais o risco de do RN
cuja me teve hipertenso de apresentar um Apgar <= 3 em relao ao RN cuja me
no teve hipertenso. Observe que no intervalo de confiana de ambas variveis
previsora includas no modelo NO contm a unidade).
Vejamos a interpretao de outro exemplo: Regresso logstica para a Sepse. As
variveis individualmente associadas significativamente com a sepse (corticoide, Apgar
no 1 minuto, Apgar no 5 minuto, reanimao, uso do CFR, necessidade de intubao,
uso de drogas para a reanimao, Apgar <=3 no 5 minuto) entraram no modelo de
regresso logstica. Aps realizar os passos anteriormente explicados, obtemos as
estimativas dos coeficientes dos previsores includos no modelo (Figura 97)
Fig.97. Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
67
dicotmica. A apresentao tem como componentes chaves o P-value, o valor dos
coeficientes e as odds ratio (Exp (B). A interpretao dos resultados est focalizada
nestes componentes. Assim, vejam que as duas variveis que permaneceram no modelo
foram o corticosteride pr-natal (Exp(B) de 0,545 (Odds ratio ajustada), que traduz
uma diminuio da sepse nos RN expostos ao esteride pr-natal de 46% (1-0,545=0,46
x100=46%) e a Intubao que constituiu um fator de risco (aumento de 2,78 vezes a
sepse nos RN intubados em relao aos no intubados).
Veja outro exemplo da aplicao da regresso logstica: o estudo de Whelan B
et al avaliaram o sdio srico como um fator de risco para a mortalidade intrahospitalar
em pacientes grave admisso. A Odds ratio para a morte dentro de 30 dias da
admisso foi de 4,07 (IC a 95%%: 2,95-5,63) quando o paciente apresentava
hipernatremia e 3,36 (IC a 95% de 2,59-4,36) quando apresentava hiponatremia. A
regresso logstica foi usada para calcular a Odds ratio ajustada: fatores que foram
includos neste ajuste foram o escore de severidade da doena, permanncia na UTI,
efeito da idade, sexo, transfuso de sangue e sepse. Aps o ajuste, para hipernatremia, a
Odds ratio (ajustada) para a morte passou para 1,41 (Intervalo de confiana de 0,97-
2,07: no alcanou a significncia, pois no intervalo de confiana contm a unidade) e a
Odds ratio (ajustada) para hiponatremia passou para 2,00 (Intervalo de confiana a
95% de 1,44-2,77, ou seja, foi menor, porm continuou significativa, pois no intervalo
de confiana no contm a unidade). Assim, o sdio srico um poderoso marcador
inicial para a mortalidade, mas a mortalidade no grupo hipernatrmico primariamente
um fator de severidade da doena. J para a hiponatremia o aumento da mortalidade
independente de outras variveis. Portanto, os dados deste estudo nos informam que o
sdio srico na admisso um importante determinante da mortalidade intrahospitalar
em todos os pacientes. O sdio na admisso pode ser usado para estratificar os pacientes
que vo necessitar de uma terapia mais agressiva e maior monitorizao e em particular
a hiponatremia que necessita de tratamento cuidadoso para evitar um excesso de
mortalidade que independentemente associada com anormalidade deste distrbio.
Quanto multicolinearidade, apenas a ttulo de informao: a
multicolinearidade existe quando observamos uma forte correlao entre dois ou mais
previsores (variveis explicativas) em um modelo de regresso; este fato dificulta a
avaliao da importncia individual de um previsor (se ambos previsores so altamente
correlacionados e cada um responsvel por uma varincia similar dos resultados,
como vamos poder dizer qual entre as duas variveis a mais importante? Na verdade
no podemos dizer, pois o modelo pode incluir qualquer uma delas de forma
intercambivel. Na regresso mltipla, o SPSS produz vrios diagnsticos de
colinearidade, entre eles o VIF (Fator de Inflao da Varincia). O FIV indica se um
previsor tem um relacionamento linear forte com outro(s) previsor (es): um valor acima
de 10 leva-nos a preocupao. Tal preocupao da colinearidade com a regresso
mltipla, ocorre tambm com a regresso logstica, sendo ento essencial testar a
colinearidade numa anlise de regresso logstica. Como o SPSS no tem opo para
fazer um diagnstico de colinearidade na regresso logstica, podemos obter estatsticas
tais como as de tolerncia (Valor menor que 0,1 indica um problema srio de
colinearidade) e VIF simplesmente executando uma anlise de regresso linear
utilizando as mesmas variveis de sada e os mesmos previsores.
Em Analyze >Regression>Linear. Clicar em Statistics e depois selecione
Colinearity diagnostics (diagnstico de colinearidade) e desmarque todas as opes
padres e clicar em [Continue] para volta caixa de regresso linear e pressionar [OK].
No Output viewer (sada do SPSS), vamos ter a Tolerance (tolerncia) e a VIF.
(Consultem as Figuras 98, 99 e 100).Vejamos um exemplo: aps identificar as variveis
68
associadas individualmente com o bito, realizamos uma regresso logstica e no
modelo, as variveis que persistiram foram a ventilao mecnica e o tipo de parto
(tanto a ventilao mecnica como o parto normal aumentaram significativamente o
bito:OR de 5,63, com IC a 95% de 2,37-13,37 e OR de 2,22 com IC a 95% de 1,02-
4,85). Vejamos a colinearidade da regresso logstica que realizamos entre Ventilao
Mecnica e Tipo de Parto
Fig. 98: Caixa de dilogo para a regresso linear para os dados de bito
Fig. 99: Caixa de dilogo para a Statistics da regresso linear selecionando Colinearity diagnostics
69
VIII- TESTES NO PARAMTRICOS
Os estatsticos escolhem um teste paramtrico (a maioria dos testes de hipteses
vistos anteriormente) quando esto seguros de que a distribuio normal no foi violada
e testes no paramtricos porque no esto seguros de que a distribuio normal foi
encontrada (estes ltimos no so to eficientes quanto aos paramtricos para detectar
diferenas na populao).
Estes testes no requerem a estimao da varincia e da mdia da populao.
So testes que podem ser usados tanto para variveis nominais como para variveis
ordinais ou quantitativa
Entre os testes no paramtricos, vamos comentar sobre os mais usados
-Teste do Qui-quadrado (j estudado)
-Teste Binomial
-Teste U de Mann-Whitney
-Teste de Wilcoxon
-Teste de McNemar
-Teste de Kruskal-Wallis
-Teste de Friedman
O Teste de Kolmogorov-Smirnov, como j comentamos, avalia a normalidade de
variveis quantitativas, como exemplo, o peso, permetro ceflico e estatura
Analyze>Nonparametric Test e realizamos como j comentamos anteriormente (Figura
98) e selecionar 1.Sample K-S (Figura 101).
70
Fig. 103. Output viewer do One-Sample Kolmogorov-Smirnov Test
Como podemos ver, as varivel estatura e permetro ceflico (PC)
mostraram-se com caractersticas de variveis que seguem a distribuio normal
(p=0,29 e 010), o que no ocorreu com a varivel peso (p<0.05). Toda vez que o teste
de Kolmogorov-Smirnov apresentar p <0.05, significa fuga de normalidade.
VIII-1-Teste Binomial
Este teste usado para testar propores em uma varivel dicotmica (sim/no,
doente/no doente/parto normal/sexo masculino, etc). Testa se a proporo de uma das
respostas igual ou diferente a uma determinada proporo ou para testar se as
propores das duas categorias de resposta so iguais ou diferentes (por
exemplo,percentual de uso de corticosteride pr-natal= percentual de no uso, ou
percentual de parto normal igual ao percentual de cesariana).
No exemplo a seguir, usando a base de dados Uso de Corticosteride Pr-Natal na
Maternidade do Hospital Regional da Asa Sul, vamos testar se o percentual de parto
normal igual a 50% (hiptese nula) ou diferente de 50% (hiptese alternativa).
Selecionar Analyze>NonparametricTest>Legacy >Legacy Dialogs(SPSS 18).Veja
na figura 104.
71
Fig.105. Caixa de dilogo Binomial Test
Clicar em OK e a sada do SPSS mostrar (figura 106).
VIII-2-Teste U de Mann-Whitney
Usado para a comparao de variveis ordinais ou quantitativas entre dois
grupos independentes,quando a distribuio no simtrica (normal), ou seja quando h
ruptura dos pressupostos paramtricos; corresponde ao teste t de Student para amostras
independentes.
Quando a amostra tiver mais de 20 observaes, a estatstica U tende a uma
distribuio normal; no Output Viewer ser apresentado o resultado da estatstica z,
alm do resultado do teste U, mas a significncia pelo valor p, ser a mesma.
Selecionar Analyze>Nomparametric Test>2 Independent Samples (Figura 107)
72
Fig.107.Menu Analyze>Nomparametric Test>2 Independent Samples
Vamos utilizar as variveis peso e uso do corticosteride pr-natal para calcular o
teste de Mann-Whitney. Na caixa de dilogo Two-Independent-Samples Test, selecionar
as variveis peso em Test Variable List e uso do corticosteride pr-natal com Grouping
Variable. Pressionar Define Groups e definir Group 1 como 1 e Group 2 como 2.
Neste exemplo estamos usando uma varivel quantitativa que no tem a
distribuio gaussiana (NORMAL) que o peso (veja anteriormente o Teste de
Kolmogorov-Smirnov) e vamos comparar com os RN cujas mes receberam
corticosteride pr-natal (cortico-1) e mes que no receberam corticosteride pr-natal
(cortico-2) (Figura 108)
73
Fig. 109. Output viewer do teste U de Mann-Whitney
O teste de Mann-Whitney cria um ranking (ordenao) de todos os casos
(independente do grupo) e depois compara estes ranking entre cada grupo. Observamos
o rank mdio e a soma dos rankings de cada grupo (havendo diferena significativa
entre os grupos, espera-se que os rankings mdios sejam bem diferentes). Em Test
Statistics, podemos observar que no h diferena entre os pesos dos RN das mes
que receberam corticosteride pr-natal e dos RN cujas mes no receberam
(p>0.05).
74
Na caixa de dilogo Two-Related-Samples Tests, selecionar o par de variveis a
ser comparado, colocando-os na lista de pares de variveis (Test Pair(s) List). Em Test
List, escolher o teste de Wilcoxon (Figura 111).
Fig.111. Caixa de dilogo Two-Related-Samples Test, de onde pode ser obtido o teste
de Wilcoxon
Clicar em [OK] e o Output viewer mostrar (Figura 112).
75
Nos resultados observamos que o Teste de Wilcoxon calcula as diferenas entre
os valores das duas variveis e cria um ranking (ordenao) destas diferenas,
classificando-as em diferenas negativas, positivas e empates (ties). A seguir, mostra a
mdia e a soma dos rankings das diferenas negativas e positivas. Observem que h 82
diferenas negativas (o valor da hemoglobina no ps-operatrio foi menor do que no
pr-operatrio),13 positivas (o valor da hemoglobina no ps-operatrio foi maior do que
no pr-operatrio) e em 5 casos, houve empate, ou seja,os valores da hemoglobina pr e
ps-operatrio foram iguais. Em Test Statistics, temos os resultados da estatstica de
teste (Z):considerando o nvel de significncia (p<0.001), podemos afirmar que a
hemoglobina do ps-operatrio significantemente menor que a hemoglobina do pr-
operatrio
VIII-4-Teste H de Kruskal-Wallis
Este teste uma alternativa no paramtrica para a anlise de varincia de um
critrio de classificao (One-Way ANOVA). Pode ser usado para comparar vrias
amostras independentes. Ao ser usado 2 grupos para comparao, os resultados so os
mesmos dos teste de U de Mann-Whitney. Como ocorre no teste F de uma NOVA
paramtrica, um valor significativo de F no indica onde se encontra a diferena,
devendo ser realizado o teste de Tukey. J no teste H de Kruskal-Wallis, para identificar
a diferena, deve ser realizado o teste de Dunn, no disponvel no SPSS.
Selecionar Analyze>Nonparametrics Test>K Independent Samples (Figura 113)
76
Fig. 114. Caixa de dilogo Test for Several Independent Samples de onde se obtm o
teste H de Kruskal-Wallis
Na janela do Output Viewer, vamos ter (Figura 115):
77
VI-5- Teste de Friedman
Este teste uma extenso do teste de Wilcoxon; usado para o caso de diversas
amostras emparelhadas, quando os dados so medidos em escala ordinal ou tem
distribuio assimtrica. Ao usar 2 grupos, os resultados so semelhantes ao teste de T
de Wilcoxon.
Como no nosso arquivo no temos dados para esta situao especfica, vamos
usar o exemplo de Wagner MB e cl: Hb antes e aps a cirurgia. Veremos a semelhana,
ao examinar os resultados na janela do Output viewer, com o teste T de Wilcoxon.
Analyze>Nonparametrics Test>K Related Samples (Figura 116)
Fig.117. Caixa de dilogo Test for several Related Samples, de onde se obtm o teste
de Friedman
Clicar em [OK] e a janela do Output Viewer mostrar (Figura 118)
78
Fig.118. Resultado do teste de Friedman
Observamos haver diferenas significativas nos nveis de hemoglobina no ps-
operatrio (menor) do que no pr-operatrio. Podemos observar as semelhanas dos
dois testes, Wilcoxon e Friedman.
79
Na caixa de dilogo Bivariate Correlations, colocar as variveis em estudo, peso e
idade gestacional (apresentam distribuio assimtrica como comprovamos com o teste
de Komogorov-Smirnov) e marcar Spearman em Correlation Coefficients (Figura 120)
80
O coeficiente de correlao de Spearman entre idade gestacional e o peso foi de
0,22, uma correlao fraca.
Outros coeficientes de correlao no paramtricos podem ser obtidos no SPSS,
como os coeficientes propostos por Kendall (tau-veja adiante), Goodman-Kruskal
(gamma) e Somers (d). Estes coeficientes no so encontrados no menu de testes no
paramtricos. Os coeficientes de Spearman e Kendal, alm do paramtrico Pearson, so
encontrados em Analyze>Correlate Bivariate. J os demais podem ser encontrados
dentro das opes (Statistics) do comando Crosstabs (Analyze>Descriptive Crosstabs).
81
A pergunta : podemos concluir (hiptese alternativa, a H 1) ou no (hiptese nula
ou H0) que a realizao do programa aumentou o conhecimento dos pais em relao s
medidas de controle ambiental?
82
resultados, temos o nmero total de casos pesquisados (N), o valor calculado do teste,
que baseado na distribuio do Qui-quadrado (Chi-Square=16,447) e a significncia
do valor-p (p<0.001). Assim, afastamos a hiptese nula e aceitamos a hiptese
alternativa, que nos mostra que o programa de incentivo adoo de medidas de
controle ambiental aumentou o percentual dos pais com o conhecimento destas medidas.
Este percentual que era de 33% (33/92) antes do programa, passou para 64% (59/92)
depois do programa.
O Teste de McNemar tambm pode ser realizado de outra forma: Analyze>Descriptive
Statistics>Crosstab>Statistics, marcando a opo McNemar.
IX- CURVA DE KAPLAN-MEIER
Muitos estudos, em medicina, so planejados para determinar se uma droga,
tratamento ou procedimento novo tem melhor desempenho do que outro normalmente
usado, ou seja, so feitas avaliaes dos efeitos de curto prazo. No entanto tambm
importante a avaliao dos resultados a longo prazo, incluindo a morbimortalidade.
Nos estudos de avaliao das taxas de sobrevivncia entre pacientes submetidos
a certos tratamentos ou a certos procedimentos, o resultado ser binrio-sobrevivncia
ou morte do paciente e o objetivo ser estimar o intervalo de tempo que os pacientes
sobrevivem com tipos especficos de tratamento ou em condies especficas.
Na anlise de sobrevivncia, a varivel dependente (resultado) sempre o
tempo at a ocorrncia de determinado evento (j na anlise estatstica clssica, a
varivel dependente a ocorrncia de determinado evento, como cura, desenvolvimento
da doena, efeito colateral).
Vejam assim que na anlise de sobrevivncia compara-se a rapidez com que os
participantes desenvolvem determinado evento, ao contrrio de comparar as
percentagens de doentes que desenvolvem o evento, ao fim de um determinado perodo
de tempo. O evento final da anlise de sobrevivncia pode no ser somente a morte,
podendo ser outro evento, como recidiva, progresso da doena, efeito colateral.
Quando se fala em tempo de sobrevida na anlise de sobrevivncia no significa que
seja necessariamente o tempo at a morte e sim o tempo at a ocorrncia de
determinado evento. Assim, devido diferena do tipo de varivel dependente usada,
todos os mtodos estatsticos que usamos normalmente na anlise clssica, no podem
ser usados quando realizamos anlise de sobrevivncia, devido diferena do tipo de
varivel dependente que utilizada. A anlise clssica e a de sobrevivncia tem mtodos
prprios (consulte a tabela 4)
83
Tabela 4. Tcnicas estatsticas usadas na anlise clssica e na anlise de
sobrevivncia (Botelho F et al)
84
Fig. 127. Curvas de Kaplan-Meier analisando o tempo at a extubao aps
primeira dose (A) e segunda (B) dose de surfactante exgeno para os grupos com
base na histologia da placenta
85
utilizao da Regresso de Cox; uma tcnica estatstica que utilizada para
determinar a relao entre sobrevivncia e vrias variveis independentes exploratrias;
fornece uma estimativa do tratamento sobre a taxa de sobrevivncia, aps o ajuste da
varivel exploratria. Esta regresso permite obter resultados ajustados para possveis
variveis de confundimento.
No estudo assinalado anteriormente a respeito da alterao da resposta ao
surfactante nos RN cujas mes tiveram corioamnionite com envolvimento fetal, os
autores tambm realizaram uma anlise de regresso de Cox para anlise multivariada
para identificar se a idade gestacional poderia explicar a menor chance de extubao
aps corioamnionite. A regresso de Cox foi realizada com ajuste para a idade
gestacional e peso. Os autores evidenciaram assim, que os RN do grupo corioamnionite
com comprometimento fetal teve significativamente menor probabilidade de extubao
48 horas aps o uso da primeira dose surfactante exgeno (hazard rate-HR- de 0,12 com
intervalo de confiana de 0,01-0,06 p=0,46), demonstrando um efeito independente da
corioamnionite no prolongamento da intubao destes RN com corioamnionite grave
(Figura 128).
86
Podemos observar que o tamanho da amostra diminui ao longo do tempo de
observao e assim, as estimativas nos perodos finais de observao (parte direita da
curva) so bastante imprecisas. Tambm vale a pena ressaltar que a censura dos
participantes (aqueles que no completaram o estudo ou porque abandonaram o estudo,
ou foram perdidos no seguimento). no est relacionada com o seu prognstico e que
semelhante para os participantes recrutados no incio e no fim do estudo. Quando o
nmero total de censurados antes do trmino do estudo pequeno, evidentemente o vis
de seguimento ser pequeno.
Para fazer este tipo de estudo necessrio que se defina a data de incio
(diagnstico da doena, internao no hospital, incio do tratamento) e a data de
finalizao do seguimento (determinado pelo investigador), para que se possa calcular
posteriormente os tempos de sobrevivncia (data do incio do seguimento at a data do
ltimo contato) dos pacientes. No seguimento, pode ser que os pacientes ou morram,
continuem com vida na data da finalizao do estudo ou so perdidos (casos censurados,
como discutido anteriormente). O mtodo de Kaplan-Meier um mtodo no
paramtrico, sendo o nico que supe que os indivduos censurados comportaram do
mesmo modo dos indivduos seguidos at que ocorra o evento. Para cada perodo de
tempo se calcula a probabilidade de sobreviver.
O tempo de seguimento uma varivel quantitativa (expressa em dias, meses,
anos) e expressa a diferena entre as datas de incio e de finalizao do estudo.
O estado do paciente ao final do seguimento uma varivel categrica
dicotmica (1: evento que pode ser morte, recada, etc e 0: no ocorreu evento, casos
censurados ou apresentaram um evento aps o trmino do estudo).
Vejamos como proceder no SPSS-18 (vamos usar uma base de dados de Aguayo
Canela M e Lora Monge E, do Hospital Universitrio Virgem Macarena, Sevilla, com
informao de 56 pacientes com cncer coloretal, includos no seguimento (data de
entrada ou inicial) no momento de ser submetidos radioterapia pr-operatria e
seguidos at o seu falecimento. Da mesma base de dados, vamos calcular o teste
estatstico logrank para comparar duas curvas de sobrevivncia (dois grupos de
pacientes, um grupo que recebeu menos de 5000 rads e outro grupo que recebeu >=5000
rads no pr-operatrio). H diferenas na sobrevivncia de ambos os grupos ou a dose
de radioterapia pr-operatria influenciou significativamente na sobrevivncia destes
pacientes?
Analyze>Survival e selecionar Kaplan-Meier (Figura 129)
87
Fig.129. Menu Analyse>Survival>Kaplan-Meier
88
Selecionar a varivel que mede o tempo de seguimento e coloc-la em Time
(Tempo). Em Status (Estado) colocar a varivel categrica dicotmica que define o
estado individual durante o seguimento; esta varivel tem duas opes: valor
censurado/valor morte ou outro evento que se avalia). O programa pede para definir o
evento (Define Event), devendo especificar o valor que mostra o resultado que se avalia
(neste caso, o valor 1=morte) (Figuras 131 e 132).
89
A seguir, clicar em Options e marcar Survival table(s) (tabela(s) de
sobrevivncia) e Mean and median survival (mdia e mediana de sobrevivncia) e
Quartilies (Figura 133). Em Plots, marcar Survival (sobrevivncia) para gerar a Curva
de Kaplan-Meier
90
Tabela 5 Tabela de sobrevivncia
91
Fig. 134. Mdias e mediana da sobrevivncia e percentis.
92
sobrevivncia. Este grfico pode ser editado clicando sobre ele com o boto esquerdo
do mouse (Editar). Assim, podemos responder a seguinte pergunta: quantos pacientes
com cncer coloretal sobrevivem mais de dois anos?. Traando uma linha vertical no
tempo de 25 meses, vamos observar que a sobrevivncia seriam aproximadamente 75%
(Figura 136)
93
mesmo, h diferena significativa na sobrevivncia entre os que receberam menos e
mais radioterapia pr-operatria?
94
Clicar em [Continue] e em [OK] e o Output Viewer mostrar (Figura 139 e 140).
95
X- CURVA ROC
Muitos exames dos nossos pacientes tem valores medidos numa escala numrica
e assim a sensibilidade e a especificidade dependem de onde se coloca o ponto de corte
(cut off) entre os resultados positivos e negativos.
Uma forma mais eficiente de demonstrar a relao normalmente antagnica
entre a sensibilidade e a especificidade dos exames que apresentam resultados
contnuos so as Curvas de Caractersticas de Operao do Receptor (Curvas ROC-
Receiver Operating Characteristic). A Curva ROC uma ferramenta poderosa para
medir e especificar problemas no desempenho do diagnstico em medicina por permitir
estudar a variao da sensibilidade e especificidade para diferentes valores de corte.
A Curvas ROC foram desenvolvidas no campo das comunicaes como
uma forma de demonstrar as relaes entre sinal-rudo. Interpretando o sinal como os
verdadeiros positivos (sensibilidade) e o rudo, os falsos positivos (1-especificidade),
podemos entender como este conceito pode ser aplicado em medicina.
A Curva ROC um grfico de sensibilidade (ou taxa de verdadeiros
positivos) versus taxa de falsos positivos (Figura 141)
96
A linha diagonal pontilhada corresponde a um teste que positivo ou negativo,
aleatoriamente. A Curva ROC Permite evidenciar os valores para os quais existe maior
otimizao da sensibilidade em funo da especificidade que corresponde ao ponto em
que se encontra mais prxima do canto superior esquerdo do diagrama, uma vez que o
ndice de positivos verdadeiro 1 e o de falsos positivos zero.
A medida que um critrio para o teste positivo torna-se mais rigoroso, o ponto
da curva correspondente a sensibilidade e a especificidade (ponto A) movimenta-se
para baixo e para a esquerda (sensibilidade menor e especificidade maior). Se adotar um
critrio menos evidente, para identificar os positivos, o ponto da curva (ponto B)
movimenta-se para cima e para a direita (sensibilidade maior, especificidade menor).
A Curva ROC permite comparar dois ou mais exames diagnsticos e constitui
uma das maiores virtudes das curvas ROC. No exemplo (Figura 142) a seguir, o Teste
A- tem melhor acurcia que o teste B (teste invlido: os seus resultados no so
melhores do que os da chance). O ponto 1confere maior valor de sensibilidade e
especificidade; o ponto 2 confere maior sensibilidade, porem menor especificidade e j
o ponto 3, maior especificidade, porm, menor sensibilidade
97
Fig. 142. Curvas de caractersticas de operao do receptor para os ndices
Doppler da artria umbilical. Os pontos de dados so os valores medidos dos
ndices. IR: ndice de resistncia; D/A: relao diastlica mdia; IP: ndice de
pulsatilidade (Maulik et al).
A Curva ROC descrimina entre dois estados, onde cada ponto da curva
representa um compromisso diferente entre a sensibilidade e o falso positivo que pode
ser definido pela adoo de um diferente valor do ponto de corte de anormalidade.
Assim, podemos ter diferentes correspondncias na curva. Um critrio restrito (paciente
positivo quando a evidncia da doena muito forte) aquele que traduz uma pequena
frao de falsos positivos e tambm uma pequena frao de verdadeiros positivos
(canto inferior esquerdo da Curva ROC. O uso de critrios menos restritos, conduzem a
maiores fraes de ambos os tipos (pontos colocados no canto direito da curva (Figura
143)
98
S
a
1-especificidade (falsos positivos)
O valor do ponto de corte definido com um valor que pode ser selecionado
arbitrariamente pelo pesquisador entre os valores possveis para a varivel de deciso,
acima do qual o paciente classificado como positivo (teste positivo, paciente com a
doena) e abaixo do qual classificado como negativo (teste de diagnstico negativo,
ausncia de doena).
Para cada ponto de corte so calculados valores de sensibilidade e
especificidade, que podem ento serem dispostos no grfico. Um classificador perfeito
corresponderia a uma linha horizontal no topo do grfico, porm esta dificilmente ser
alcanada. Na prtica, curvas consideradas boas estaro entre a linha diagonal e a linha
perfeita, onde quanto maior a distncia da linha diagonal, melhor o sistema. A linha
diagonal indica uma classificao aleatria, ou seja, um sistema que aleatoriamente
seleciona sadas como positivas ou negativas, como jogar uma moeda para cima e
esperar cara ou coroa. Finalmente, a partir de uma curva ROC, devemos poder
selecionar o melhor limiar de corte para obtermos o melhor desempenho possvel.
Para a determinao se duas ou mais Curvas ROC so significativamente
diferentes, a avaliao feita atravs da determinao da rea sob a curva, usando uma
modificao do teste da soma de ordens de Wilcoxon para esta comparao. Assim
99
possvel quantificar a exatido de um teste diagnstico (proporcional rea sob a
curva), alm da possibilidade de comparar testes diagnsticos.
100
Fig. 145.Caixa de dilogo ROC Curve
Na caixa de dilogo ROC Curve, selecione assay result como Test variai e em
State variabele, selecione actual satate e o tipo 1, como seu valor positivo. No Display,
selecione With diagonal reference line, Standard error and confidence interval e
Coordinate points of the ROC (Figura 146)
101
A seguir, clicar em [ OK] e teremos a Curva ROC, que um ndice visual da preciso
do ensaio (Figura 147)
A Curva est difcil de visualizar porque est muito prximo ao eixo vertical,
ou seja, maior sensibilidade na deteco dos pacientes com HIV positivo e com baixo
falso positivo.
O conhecimento da rea sob a curva possibilita quantificar exatido de um teste
diagnstico (proporcional rea sob a curva), alm de possibilitar a comparao de
testes diagnsticos. A rea sob a curva ROC constitui um dos ndices mais usados para
sumarizar a qualidade da curva.
A rea sob a curva ROC uma medida do desempenho de um teste (ndice de
exatido do teste). Um teste totalmente incapaz de discriminar indivduos doentes e no
doentes, teria uma rea sob a curva de 0.5 (seria a hiptese nula).Acima de 0,70
considerado desempenho satisfatrio. Vejam o clculo da rea sob curva do presente
exemplo (Figura 148)
102
Area Under the Curve (rea sob a Curva)
Positive if
Greater Than Sensitivit 1-
or Equal Toa y Specificity
Fig.149.
Coordenadas da ,00 1,000 1,000
Curva ROC:
A varivel resultado 1,50 ,997 ,058
do (s) teste(s)
2,50 ,995 ,040
103
Esta tabela relata a sensibilidade e 1- especificidade para cada ponto de corte
possvel para a classificao positiva. A sensibilidade a proporo de amostras de
HIV-positivos com os resultados do teste maior que o corte e 1-especificidade a
proporo de amostras de HIV-negativo com os resultados do teste maior que o de corte.
No ponto de corte 0 equivalente a assumir que todos so HIV-positivos. No ponto de
corte 9 equivalente a assumir que todos HIV-negativos. Vejam assim, que ambos os
extremos so insatisfatrios, o desafio escolher um corte que devidamente equilibrar
as necessidades de sensibilidade e especificidade.
Por exemplo, considere o ponto de corte 5.5. Usando este ponto de corte vamos
ter uma sensibilidade de 0,978 e 1-especificidade de 0,015. Assim, aproximadamente
97,8% de todas as amostras do HIV-positivos seriam corretamente identificadas como
tal, e 1,5% de todas as amostras do HIV-negativo poderiam ser incorretamente
identificadas como positivas.
Se usarmos o ponto de corte 2,52, 99,5% de todas as amostras do HIV-positivos
seriam corretamente identificados como tal e 4,0% de todas as amostras de HIV-
negativo poderiam ser incorretamente identificadas como positivas.
A escolha do ponto de corte ser decidida pela necessidade de aumentar a
sensibilidade ou a especificidade e vai depender do pesquisador. Devemos notar que os
valores desta tabela representam as melhores orientaes para os quais devemos
considerar os pontos de cortes. Esta tabela no inclui as estimativas de erro, portanto,
no h garantia da exatido da sensibilidade ou especificidade para um dado ponto de
corte na tabela.
O uso da Curva ROC possibilitou-nos avaliar a acurcia deste teste. A rea sob a
curva mostrou que a utilizao do teste melhor do que a chance, mas, alm disto, as.
coordenadas da curva foi muito til porque forneceu algumas orientaes para
determinar qual o melhor ponto de corte para a determinao os resultados do teste
positivo e negativo.
Vejamos agora, exemplo de estudos com o uso da Curva ROC na neonatologia,
comparando ndices Prognsticos CRIB (clinical risk index for babies), CRIB II e
SNAPPE-II (score for neonatal acute physiology-perinatal extension).
Parry G et al desenvolveram o CRIB-II para RN de 32 semanas aps 1 hora de
admisso na UTI sendo excluda a FiO2 uma vez que esta no representa uma medida
fisiolgica verdadeira por ser determinada pelo cuidador. Assim, o CRIB II foi
calculado a partir de 5 itens: sexo, peso ao nascer, idade gestacional, pior base excess e
temperatura na admisso A rea sob a curva ROC para morte ou graves anormalidades
cerebrais foi de 0,82, de 0,79 pra o CRIB, 0,80 para a idade gestacional e 0,77 para o
peso ao nascer . Portanto, o CRIB II mostrou maior acurcia em relao ao CRIB, a
idade gestacional e o peso ao nascer para a morte ou graves anormalidades cerebrais.
Gagliardi I et al, comparando CRIB, CRIB-II e SNAPE-II, relataram maior grau
de descriminao para o CRIB e CRIB II em relao ao SNAPPE-II (rea sob a Curva
ROC de 0,90 e 0,91 versus 0,84-p <0,0004). Vejamos a Curva ROC deste estudo (Fig.
150)
104
Fig. 150. Curva ROC para o CRIB, CRIB II e SNAPPE-PE. A rea sob a
curva foi: CRIB, 0,903; CRIB-II, 0,907; SNAPPE-II, 0,837.
O Kappa varia de +1 a -1
105
0: significa que no existe nenhuma relao entre as classificaes dos dois
observadores, acima da concordncia de acasos que seriam esperadas.
Nigel Paneth:
kappa > 0,80 : considerado excelente.
kappa 0,60 0,80 : considerado bom.
kappa 0,40 0,60 : considerado regular.
kappa < 0,40 : considerado ruim
Tabela 5. ndice kappa
106
2010 na Dinamarca. O tempo de enchimento capilar influenciado por muitos fatores.
Estudos anteriores de variablidade interobservadores envolveram muitos pacientes, mas
poucos observadores. O objetivo do estudo foi determinar como um grande grupo de
enfermeiras (9) e assistentes de enfermeiras (37) graduariam o etempo de enchimento
capilar.O ndice kappa para o valor de normalidade foi de 0,56 e entre classes, 0,62. Os
autores consideraram que houve somente um regular acrdo para o valor exato do
tempo de enchimento capilar, assim como para a normalidade. Os autores acreditam
que o tempo de enchimento capilar deveria ser usado com cuidado na prtica clnica.
107
Analisando a concordncia em diferentes regies, os autores relataram que as fraturas
observadas nas regies de etmide, corpo mandibular, parede anterior de seio frontal e
esfenide, apresentaram ndice de concordncia excelente; as regies de maxila, cndilo
mandibular e pirmide nasal, ndice de concordncia substancial; para as regies de
parede medial de rbita, parassnfise e ngulo mandibular, soalho e parede lateral de
rbitas, ndice de concordncia moderada; para a regio de arco zigomtico, ndice de
concordncia considervel; para regio fronto-zigomtica, ndice de concordncia
ligeira; para as regies de palato duro, snfise, ramo e processo coronide de mandbula,
ndice de concordncia pobre.
108
apresentaram um fraco grau de concordncia com ndices de 0,378, 0,321 e 0,135, para
o carcinoma de clulas escamosas, as clulas escamosas atpicas de significado
indeterminado e clulas escamosas atpicas, no excluindo leso de alto grau,
respectivamente.
109
Fig.152. Analyse> Descriptive Statistics e Crosstabs
Fig.153.Crosstabs
110
Fig.154. Crosstab stastistics
Aperte continue e OK e a via de sada do SPSS mostrar o valor kappa (figura 155)
111
vem sendo desenvolvidas para se encontrar um padro-ouro de avaliao da dor
neonatal.
Finalizando, segundo Field A, os procedimentos estatsticos so uma forma de
processar nmeros e, portanto, se voc colocar baboseiras em uma anlise mesmo assim
obter concluses que tem significado estatstico, mais que provavelmente no tero
sentido prtico. Existe uma tentao de ver a estatstica como uma forma milagrosa de
determinar a verdade, mas a estatstica somente um recurso. Se voc entra com lixo,
voc vai obter lixo. Na anlise estatstica no existe um substituto para o pensamento
emprico. A significncia estatstica no implica em importncia clnica (ignorar este
fato um dos erros mais freqentes na rea mdica).Tenha sempre isto em mente.
REFERNCIAS
112
1- Wagner MB, Mota VT, Dornelles CC. SPSS Passo a Passo, Educs, Caxias do Sul,
2004
2- Field A. Descobrindo a Estatstica usando o SPSS, Artmed,2 Edio Porto Alegre,
2009
3-Filho Doria U. Introduo a Bioestatstica (Para simples mortais), Negcio Editora,
So Paulo, 2 Edio,1999
4-Arango HG.Bioestatstica Terica e Computacional, Guanabara Koogan, Rio de
Janeiro,2001
5- Vieira S. Introduo Bioestatstica, Editora Campus, 2 Edio, Rio de Janeiro,
1991
6-Sounis E. Bioestatstica.Princpios fundamentais, metodologia estatstica, Aplicao
s Cincias Biolgicas,Livraria Atheneu
7-Bisquerra R, Sarriera JC, Martinez G. Introduo Estatstica. Enfoque Informtico
com o Pacote Estatstico SPSS, Artmed, Porto Alegre, 2004
8. Margotto PR. Entendendo Bioestatstica Bsica. Boletim Informativo Peditrico
(Enfoque Perinatal), No65, Ano 22, Braslia, p.6-108, 2002. Disponvel em
www.paulomargotto.com.br, em Entendendo Bioestatstica Bsica (Acessado em
30 de outubro de 2009)
9-Margotto PR. Como exercer a Medicina/Neonatologia baseado em evidncias. In.
Margotto PR. Assistncia ao Recm-Nascido de Risco, Hospital Anchieta, 3
Edio, Braslia, no prelo. Disponvel em www.paulomargotto.com.br em
Exerccio da Medicina Baseado em Evidncia (Acessado em 20 de outubro de
2009)
10-Penha RN. Um estudo sobre regresso logstica binria. Universidade de Itajub,
Instituto de Engenharia Mecnica, Departamento de Produo. Disponvel em
UM ESTUDO SOBRE REGRESSO LOGSTICA BINRIA Renata Neves
Penha ... (Acessado em 30 de novembro de 2009)
11.Batistela G C, Rodrigues AS, Bononi JTCM. Estudo sobre a evaso escolar usando
regresso logstica: anlise dos alunos do Curso de Administrao da Fundao
Educacional de Ituverava. Tkhne Lgos, Botucatu, SP, v.1, n.1, p.53-66,
out.2009. Disponvel em ESTUDO SOBRE A EVASO ESCOLAR
USANDO REGRESSO LOGSTICA: ANLISE ...
12- Programas desenvolvidos na Braile Biomdica S/A. Disponvel em Estatistica
(Acessado em 30 de dezembro de 2009)
13-NRM Consultoria Estatstica Ltda. Curso de Estatstica com a Utilizao do SPSS,
ESCS, 2009
14.Whelan B, Bennett K et al. Serum sodium as a risk factor for in-hospital mortality in
acute unselected general medical patients. QJ Med 2009;102:175-182
15-Silva AP. Curso Bsico de Estatstica utilizando o SPSS. ESCS, julho de 2006
16-Laboratrio de Epidemiologia e Estatstica. Lee - Laboratrio de Epidemiologia e
Estatstica (Acessado em 21 de abril de 2010)
17-Botelho F, Silva C, Cruz F. Epidemiologia explicada-anlise de sobrevivncia. Acta
Urolgica 2009;26:4:33-38. Disponvel em Epidemiologia explicada Anlise de
Sobrevivncia (acessado em 14 de maio de 2010)
113
18-Aguayo Canela M, Lora Monge E. Cmo hacer paso a paso um anlisis de
supervivncia com SPSS para Windows. Fabis (Fundacion Andaluza Beturia
para La investigation em salud). Disponvel em Cmo hacer paso a paso un
Anlisis de Supervivencia con SPSS ... (acessado em 15 de maio de 2010)
19-Dawson B, Trapp RG. Anlise dos temas de pesquisa sobre sobrevivncia. In.
Dawson B, Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3
Edio, 2003, p.187-205
20-Bee JV, Rours IG et al. Chorioamnionitis alters the response to surfactant in preterm
infants. J Pediatr 2010;156:10-5
21-Martinez EZ, Lozada-Neto F, Pereira BB. Cadernos Sade Coletiva, Rio de Janeiro
2003;11:7-31 (disponvel em [PDF] A curva ROC para testes diagnsticos
22- Braga ACS. Curvas ROC: Aspectos funcionais e aplicaes. Tese de Doutorado,
Universidade do Minho, dezembro de 2003, Portugal
23- Dawson B, Trapp RG. Mtodos da medicina baseada em evidncias. In. Dawson B,
Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3 Edio, 2003,
p.233-249
24- Maulik D, Yarlagadda P, Youngblood JP, Ciston P. Comparative efficacy of
umbilical arterial Doppler ndices for predicting adverse perinatal outcome. Am J Obstet
Gynecol 1991;164:1434-1440
21-Parry G, Tucker J et al. CRIB II: an update of the clinical risk index for babies score.
Lancet 361:1789, 2003
22- Gagliardi L, Cavazza A, et al. Assessing mortality risk in very low birthweight
infants: a comparison of CRIB, CRIB-II, and SNAPPE-II. Arch Dis Child Fetal
Neonatal Ed. 89:F419, 2004
23-Nigel Panet. Validao, integridade e monitoramento das doenas. Disponvel
em: Apresentao do PowerPoint - fosjc.unesp.br. Visualizao rpida .
Acesso 24/11/2011
24- Pinto JS, Lopes JM, Oliveira JV, Amaro JP, Costa LD. Mtodos para estimao de
reprodutibilidade de medidas [home Page]. Porto Portugal: Faculdade de Medicina
do Porto; 2008. D i s p o n v e l e m : ndices::Estatstica Kappa. Acesso em
23/11/2011
25- Jodas CRP, Rapoport A, de Souza RP et al. Anlise da concordncia intra e inter-
observadores na deteco das fraturas da face por meio da tomografia computadorizada.
Rev Bras Cir Cabea Pescoo 2009; 38 26 33. Disponvel em:
ArtigoOriginal. Acesso em 20/11/2011
26- Mariur Gomes Beghetto, MG, Luft VC, Mello ED, Polanczyk CA. Avaliao
nutricional: descrio da concordncia entre avaliadores. Rev Bras Epidemiol 2007; 10:
506-16. Disponvel em: PDF] Avaliao nutricional: descrio da concordncia entre
avaliadores ... Acesso em 18/11/2011
27- Oliveira NS, de Oliveira JM, Bergamaschi DP. Concordncia entre avaliadores na
seleo de artigos em revises sistemticas. Rev Bras Epidemiol 2006; : 309-15.
Disponvel em: PDF] Concordncia entre avaliadores na seleo de artigos em
revises ... Acesso em 21/11/2011
28- Interrater reliability (Kappa) using SPSS . Acesso em 18/11/2011
29- Ludbrook J. Statistical techniques for comparing measurers and methods of
measurement: a critical review. Clin Exp Pharmacol Physiol. 2002 ;29:527-36
30-Oliveira TM. Anlise psicofsica da escala multidimensional de dor Neonatal Pain,
Agitation and Sedation Scale (N-PASS). Monografia apresentada ao Programa de
Residncia Mdica em Pediatria do Hospital Regional da Asa Sul HRAS SES/DF.
114
Disponvel em www.paulomargotto.com.br em Monografias-2011. Acesso em
24/11/2011
31-Fescina. H. Tecnologias perinatales. Centro Latinoamericano de Perinatologia y
Desarrollo Humano (CLAP). Pub Cient CLAP No 1166, 1988
10- Laboratrio de Epidemiologia e Estatstica. Lee - Anlise de Concordncia Kappa.
Acesso em 20/11/2011
32-Braband M, Hosbond S, Folkestad L. Capillary refill time: a study of interobserver
reliability among nurses and nurse assistants. Eur J Emerg Med 2010, May 27
33- Ajuda do BioEstat 3.0 Ayres , Jr.Aires M, Ayres DL, dos Santos AAS. BioEstat, Belm,
Par, 2007. Acesso em 18/12/2011
34- [PDF] Tema 3 Tablas lvarez MMR. UNIVERSIDAD DE JAN. Material del
curso Anlisis de datos procedentes de investigaciones mediante programas
informticos. Acesso em 15/12/2011
35- Anlise da Concordncia Interobservadores em Exames de ...Corte MD, Gonalves
JC, Silva CS et al. Anlise da concordncia interobservadores em exames de
Papanicolaou.NewLab, Edio 80, 2007
36.NRM Consultoria Estatstica Ltda. Curso de Estatstica com a utilizao do
SPSS,Porto Alegre, 2010
37.Motta VT Oliveira FPF. SPSS-Anlise de dados biomdicos, Editora Cientfica Ltda,
2009 (arquivos retirados do site www.medbooeditora.com.br). Acesso em, 31/12/2011
Nota: este texto ser continuamente revisado e ampliado medida quer for sendo
discutido com os estudantes do 6 Ano da Escola Superior de Cincias da Sade
(ESCS) /SES/DF (Faculdade de Medicina da Secretaria de Estado de Sade do
Distrito Federal).
115