sebenta de estatística clínica
TRANSCRIPT
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 1/29
Página 1 de 29
Mestrado em Nutrição Clínica 1º semestre 2011/2012
Cadeira: Estatística Clínica
Tânia Carreira
Aula 1 – Introdução à Estatística e ao SPSS Infos:- site: http://sites.google.com/site/ecmnc5/ - mail: [email protected]
Conceitos
Comparação: comparar sujeitos (e não variáveis) com base num oumais critérios. Pode ser feito com um grupo, comparando valores dogrupo com valores de referência.
≠
Associação: associar variáveis e não sujeitos.
Em estatística, um grupo ser grande ou não depende do teste: T-student: se a amostra tem mais de 30 elementos é grande,
devendo ser simétrica. Se a amostra é pequena, esta tem de ter distribuição normal: se
sim, usamos t-student; se não ou transformamos os dados para t-student ou utilizamos testes não paramétricos.
Hipótese estatística: Ho: hipótese nula, sob a qual aplicamos o teste HÁ: hipótese alternativa
Podemos rejeitar ou não rejeitar Ho. Se rejeitarmos, não significa que Hoé falso, mas sim que com os dados que temos rejeitamos Ho.
Nível de significância: Do teste: α=0,05 Do resultado do teste: P(|teste|› resultado) p-value
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 2/29
Página 2 de 29
Testes
1. Testes à normalidade da amostra
Teste de Kolmogorov-Smirnov
Ho: X tem distribuição normal HA: X não tem distribuição normal Estatística de teste: D
Este teste aplica-se melhor em populações grandes, não podendo ser utilizado em populações com menos de 200 elementos. Além disso,para se utilizar este teste é necessário saber-se a variância exacta dapopulação.
Teste de Shapiro-Wilk
Ho: X tem distribuição normal HA: X não tem distribuição normal Estatística de teste: W
Rejeita-se Ho se p-value ≤ 0,05. É um teste muito potente mesmo emamostras pequenas.
2. Teste de homogeneidade de variâncias
Teste de Levene
Ho: as variâncias são todas iguais HA: pelo menos duas variâncias são diferentes Estatística de teste, sob Ho: W ~ F(k-1, N-k )
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 3/29
Página 3 de 29
Introdução ao SPSS
Abrir o ficheiro “health_I”.
Para sabermos características como média e mediana, tomamos oseguinte caminho:
Analyze descriptive statistics frequencies escolhemos a variável statistics escolhemos as características que queremos.
Para a pressão sistólica, obtemos, na janela de Output:
Kurtosis: Curtose – achatamento dos dadosSkewness: coeficiente de assimetria – como é que os dados sedistribuem em torno de uma medida central.
Através do coeficiente de assimetria, como saber se os dados sãoassimétricos?S= 1,451
εS= 0,269
Para saber a simetria, calcula-se S/ εS : Se o valor inteiro for maior que 2,a distribuição dos dados é assimétrica, se for menor ou igual a 2 a
distribuição é simétrica.
Statistics
Systolic blood pressure (mmHg)
NValid 80
Missing 0
Mean 114,85
Median 113,00
Mode 110a
Std. Deviation 14,671
Variance 215,243
Skewness 1,451
Std. Error of Skewness ,269
Kurtosis 4,786
Std. Error of Kurtosis ,532
Minimum 89
Maximum 181
Percentiles
25 107,00
50 113,00
75 124,00
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 4/29
Página 4 de 29
Em termos de curtose, temos:K= 4,786
εK= 0,532
Calcula-se K/ εK : se o valor inteiro for maior que 2, a distribuição éleptocúrtica, se for menor ou igual a 2 a distribuição é mesocúrtica.
Para uma distribuição ser normal, tem de ser simétrica e mesocúrtica.Basta falhar um destes critérios para que a distribuição não seja normal.Estes dois “testes” serem menor que 2 não garante a normalidade, massão um forte argumento a favor.
Testes à normalidade
Por defeito, quando pedimos um teste à normalidade, o SPSS aplica osdois, cabe ao utilizador escolher o que melhor se adequa aos seusdados.Para pedir o teste:
Analyze descriptive statistics explore escolhemos a variável paraa “Dependent List” colocamos a bolinha no “Plots” (em baixo) clicamos no botão “Plots” (ao lado) seleccionamos apenas “None”para os Boxplots e “Normality plots with test”, tudo o resto desmarcamos. continue OK.
O resultado, para a pressão sistólica, é este:
Tests of Normality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Systolic blood pressure
(mmHg)
,106 80 ,026 ,907 80 ,000
Como a amostra não tem mais de 200 indivíduos, escolhemos o teste deShapiro-Wilk. Para sabermos o valor exacto de Sig.: duplo clique emcima da tabela, para activar e depois duplo clique na célula do valor.Neste caso, o valor aproximadamente é 2.38 E-5. Isto é o p-value ecomo é menor que 0,05 rejeitamos Ho, ou seja, admitimos que adistribuição dos dados não é normal.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 5/29
Página 5 de 29
Caixa com bigodes
Para fazer uma caixa com bigodes, o caminho é:
Analyze descriptive statistics explore escolhemos a variável para
a “Dependent List” colocamos a bolinha no “Plots” (em baixo) clicamos no botão “Plots” (ao lado) escolhemos a opção“dependentes together” na parte do boxplot e desmarcamos todas asoutras continue OK
O resultado é:
As bolinhas com os números são outliers ligeiros, enquanto que a estrelaé um outlier severo ou grave. Para retirarmos os outliers (em casos emque se possa fazer isso), como o exemplo do 55:
Data select cases marcamos "If condition is satisfied” e clicamosem “If” seleccionamos a variável em causa no “function group”
marcamos “all” e em baixo seleccionamos “$Casenum” e clicamos nasetinha ao lado escrevemos o resto até ficar “$Casenum~=55”
Se quisermos retirar mais do que um outlier fazemos o mesmoprocedimento, mas no fim ficará: “$Casenum~=55 & $Casenum~=62”
Para ver a caixa-com-bigodes sem o outlier basta, depois deste
processo, voltar a fazer o gráfico. Sem os dois outliers, a caixa-com-bigodes fica assim:
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 6/29
Página 6 de 29
O perigo de se retirar os outliers, é que em alguns casos os outliers nãosão observações erróneas, mas sim observações naturais da populaçãoe que, ao retirarmos, podemos estar a diminuir o nível de significânciados resultados.Assim, se fizermos de novo o teste à normalidade, obtemos:
Tests of Normality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Systolic blood pressure
(mmHg)
,070 78 ,200*
,981 78 ,288
O p-value é agora bem diferente daquele que se obteve com todos osindivíduos da amosta, e neste caso, como é maior que 0.05 nãorejeitaríamos Ho. Assim, para se retirar um outlier é preciso saber se esteé mesmo fruto de um erro ou não.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 7/29
Página 7 de 29
Mesmo retirando apenas o 55, aproximamo-nos perigosamente do limite0,05:
Tests of Normality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Systolic blood pressure
(mmHg)
,083 79 ,200*
,967 79 ,037
Aula 2 – Teste de Levene, Teste T-student
Continuando com o ficheiro “health_I” e com os testes à normalidade,podemos ter uma ideia a partir de gráficos. Para isso:
Analyse descriptive statistics P-P plots escolhe-se a variável e o tipo
de distribuição OK.
O que obtemos para a pressão sistólica é:
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 8/29
Página 8 de 29
Como os pontos não se situam na linha, desconfiamos que não se trata deuma distribuição normal.
Testes à normalidade separando por sexo
Para que o programa faça o teste à normalidade relativamente aosdados da pressão arterial sistólica para homens e para mulheres emseparado, tem de primeiro indicar-se que queremos separar os dadosdessa forma. Para isso:
Data split file marcar “organize output by groups” escolher avariável (“sex” neste caso)
Após este passo concluído procede-se à realização do teste ànormalidade como anteriormente.
Para desactivar: Data split file marcar “analyse all cases, do notcreat groups” OK
Atenção: após activar o split file tudo o que se fizer daí em diantefica com split file até cancelarmos essa indicação.
Uma forma alternativa é:Analyse descriptive statistics explore seleccionar a variável (“sex”neste caso) para a “Factor list” seleccionar os dados a analisar para“dependente list” (neste caso “Systolic…”) seleccionar “plots” embaixo e clicar no botão “plots” em cima normality plots with tests ok
Teste de Levene
O teste de Levene utiliza-se para aferir sobre a homogeneidade dasvariâncias da amostra. Para lançar o teste o teste de Levene por sexos,para a pressão sistólica:
H0: a variância é homogénea entre os sexos.H1: a variância não é homogénea entre os sexos.
Analyse descriptive statistics explore marcar “Plots” escolher avariável cuja homogeneidade de variências se quer testar para“Dependent list” coloca-se a variável sex para “factor list” Plot em “spread vs level with levene test” marcar “untransformed” Ok
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 9/29
Página 9 de 29
O teste mais potente é o “Based on Mean”.Obtem-se:
Uma vez que sig > 0,05 não se rejeita a hipótese nula a variância éhomogénea entre sexos.
Teste de T-student
O teste de t-student baseia-se na comparação de médias. Para isso,tem de se cumprir alguns pressupostos:
Normalidade das amostras. Homogeneidade de variâncias entre os grupos.
No caso do teste T, que se utiliza quando não se conhece a variância,se a amosta for menor que trinta elementos, a distribuição tem de ser
normal; se a amostra for menor for igual ao maior que trinta elementos adistribuição tem de ser, no mínimo, simétrica (com assimetria é muitoarriscado usar o teste T).O teste aplicado deve de ser sempre bilateral, que aliás é o único que oSPSS oferece.
Exemplo 1
Suponha que nos EUA, na população feminina, a pressão arterial média
é 130.7 mmHg.
Para comparar o grupo do sexo feminino do nosso ficheiro com estedado, procedemos da seguinte forma:
H0: μ=130,7 mmHgH1: μ≠130,7 mmHg
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 10/29
Página 10 de 29
Escolher só o sexo feminino:Data select cases if “sex= código”* *o código é atribuido pelo utilizador previamente, neste caso, 1 paramasculino e 0 para feminino.
Para lançar o teste de T-student:
Analyse Compare Means One-sample T-test seleccionar variávela testar indicar o “test value” (μo) Ok
Obtém-se:
Como sig < 0,05 rejeitamos H0.
Se existirem outliers, devemos repetir o teste T mas excluindo os outliers.Se a conclusão é igual, rejeitamos H0, se a conclusão for diferente
devemos de indicar isso no relatório.
Teste T-student entre médias
Para exemplificar este teste, vamos testar a diferença do BMI entrehomens e mulheres.Neste caso:H0: μ0 = μ1 ; H1: μ0 ≠ μ1
1. Testar a normalidade das amostras: Masculino: normal Feminino: não normal
2. Ver a simetria para a amostra não normal: Não é simétrico
3. Retirar o outlier (22) e ver a simetria: Sk/εk = 2,30 é perto de 2, aceita-se
4. Aplicar o teste T sem o outlier e depois com o outlier. Para isso:
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 11/29
Página 11 de 29
Analyse compare means independent samples T test coloca-se BMI em “test variables” e sex em “grouping variables” colocar os códigos Ok
Como assinalado a verde, o SPSS lança também o teste de Levene.Como se pode ver, como sig < 0,02 rejeita-se a hipótese nula do teste, o
que leva à conclusão que não há homogeneidade de variância.Tendo em conta o que o teste de Levene nos indica, devemos guiar-nospela linha de baixo (“equal variances not assumed”). Assim, comosig > 0,05 não rejeitamos a hipótese nula.
Abrir o ficheiro “SysBP”
Podemos querer medir a pressão sistólica em diferentes situações, masnos mesmos sujeitos. Nesse caso, diz-se que estamos perante amostras
emparelhadas.Como proceder?H0: não há diferenças entre a média de pressão sistólica antes e depoisdo exercício.H1: há diferença entre a média de pressão sistólica antes e depois doexercício.
1. Ver a normalidade: tudo igual ao que já foi feito masseleccionamos duas variáveis para “dependente list”.
Ambas são normais (PréExercise No Stress e PosExercise Nostress)
2. Aplicar o teste T: Analyse compare means paired-sample T test
selecionar as duas variáveis (que ficam lado a lado no “Pair 1”)
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 12/29
Página 12 de 29
Obtemos:
Como sig > 0,05 não se rejeita H0.
Aula 3 – ANOVA paramétrica e não paramétrica
ANOVA
A ANOVA utiliza-se para comparar médias quando temos três ou maisgrupos.Condições:
A distribuição tem de ser normal em todos os grupos. As variâncias têm de ser homogéneas
Mas:- se não houver normalidade, o teste pode prosseguir desde que nãoexista um grande enviesamento.
- se as variâncias não forem homogéneas, o teste pode prosseguir se ascomposições dos grupos forem semelhantes. Regra: não pode haver grupos com discrepância de membros maior que 50%. Se houver omesmo número de indivíduos nos grupos, melhor.
No caso da ANOVA:H0: a média é igual em todos os grupos.H1: pelo menos dois grupos têm média diferente.
No caso de se rejeitar a hipótese nula fazem-se testes à posteriori. Senão se rejeitar nunca se deve fazer esses testes, pois podem colocar-nosem dúvida. Em caso disso, confiar sempre na ANOVA.
Para exemplificar a ANOVA abrir o ficheiro “FEF”
Será que o hábito tabágico influencia a FEF?
Analyse
compare means
One way ANOVA
colocamos os gruposna “factor list” colocamos a variável para “dependente list” Ok
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 13/29
Página 13 de 29
Como sig < 0,05 rejeitamos H0.Então fazemos testes Post-Hoc para saber quais os grupos diferentes:
Analyse compare means One way ANOVA clicar em “Post-Hoc”
escolher LSD ou Tukey (o melhor).
No quadro lançado, quando comparamos, sabemos que há diferençase sig < 0,05.
Nota: para comparar não fumadores com todo o tipo de fumadorestemos de colocar na janela:
Fumadores: 5 Nos restantes grupos: -1
Se fosse fumadores passivos com o resto: -1 5 -1 …
ANOVA não paramétrica
Em testes não paramétricos não se fala em médias. O conceito é
comparar se os dados foram retirados da mesma população ou não.Assim:H0: os dados foram extraídos da mesma população.H1: os dados foram extraídos de populações diferentes.A medida de tendência mais adequada no caso deste tipo de testes éa mediana.
Para lançar a ANOVA não paramétrica:
Analyse Non-parametric tests legacy dialogs k-independentsamples colocamos a variável em “test variable list” e os grupos em“group list” definimos o mínimo e o máximo Ok
Com assimptota sig < 0,05 rejeitamos H0
Neste caso não há testes Post-Hoc para saber entre que grupos é adiferença. Só se consegue saber, comparando através de testes não
paramétricos semelhantes ao T-student.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 14/29
Página 14 de 29
Teste de Mann-Witney
Analyse non-parametric tests legacy dialogs 2 independentsamples
Para corrigir o α :
α*= 0,05/ nº gruposC2 correcção de Bonferroni
Se sig < α* rejeita-se H0.
Aula 4 – Regressão Linear
A regressão linear prova que existe uma associação, mas não provaque há causalidade!Na regressão linear, a ANOVA serve para saber se existe um factor preditivo, no entanto não diz qual.H0: nenhum factor é preditivoH1: pelo menos um factor é preditivoRejeita-se H0 quando sig < 0,05
Teste de Durbin-Watson
Testa a correlação entre resíduos sucessivos.H0: os resíduos não são independentes entre si.H1: os resíduos são independentes entre si.Não se rejeita H0 se d ≈ 2 ± 0,2
Multicolinearidade
Calcula-se o ViF de cada dado. Se ViF < 5 mantemos, se ViF > 5retiramos o dado.
Utilizamos o ficheiro “HeartData.sav”
Relação entre idade, sexo, BMI e cigarros/dia com Sys BP – qual é apercentagem de variância que o modelo explica?
Analyse
regression
Linear
colocamos SysBP em “dependent” ecoloca-se sex, age, BMI, CIGPDAY e BPMed em “independents”
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 15/29
Página 15 de 29
R – coeficiente de correlação múltiplaR square – coeficiente de determinação
Uma vez que R2aj é pequeno, o modelo não é explicativo. Para tal, oR2aj ≥ 0,8 no mínimo.
Quando a ANOVA indica que existe pelo menos um que é preditivo,qual é o mais significativo? O que apresentar um β maior.
Se todas as outras variáveis estiverem iguais então as mulheres tem maisSysBP. Como sabemos? B = 2,887 é uma relação positiva, se o sinalfosse negativo, então SysBP diminuía.
MASTem de se verificar os pressupostos:
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 16/29
Página 16 de 29
Analyse regression linear statistics marcar “Durbin-Watson” e“colinearity diagnostics” continue plots marcar “Normalprobability plot” coloca-se “ADJPRED” em X e “SDRESID” em Y continue Ok.
Uma vez que Leverage < 2 não se remove nenhum dado: não háoutliers.
Para ver qual o melhor modelo:
Analyse regression linear coloca-se todas as variáveis em
“dependent” excepto SysBP e RAD.
Aula 5 – Tabelas de Contingência e Teste de Qui-
Quadrado
Tabelas de Contingência 2x2
Diabético Não diabético Total
Obeso a b a + bNão-obeso c d c + d
Total a + c b + d a + b + c + d
Para se fazer o qui-quadrado tem de se verificar os pressupostosprimeiro:
N > 20 Todos os Eij > 1
Pelo menos 80% dos Eij ≥ 5Se estes pressupostos forem violados tem de se recorrer ao teste exactode Fisher.
Quando as tabelas são 2x2 tem de se fazer a correcção decontinuidade: -0,5 em cada numerador
Utilizar o ficheiro Heartdata.sav
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 17/29
Página 17 de 29
Analyse descriptive statistics crosstabs coloca-se sex em “rows” ediabetes em “colums” statistics marcar “chi-square continue Ok
Se quisermos refinar a tabela vamos a “cells”
Na linha de “Pearson Chi-Square”: - Value: 1,222- Assymp. Sig: 0,269 com correcção, Assymo. Sig: 0,311 não serejeita H0 pois Assymp. Sig > 0,05- Se existirem violações: usar a linha “Fisher’s exact test” neste caso,exactSig(2-sided) = 0,307 e por isso não se rejeita H0.
Se sig do resultado > sig do teste
não se rejeita H0.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 18/29
Página 18 de 29
E se quiser comparar diabetes com BMI?O BMI é uma variável contínua, por isso tem de se transformar emvariável nominal.
BMI_code: 1 (baixo peso ≤ 18) 2 (peso normal < 18 ≤ 25) 3 (obeso > 25)
Transform compute variable target variable: BMI_code numérica
expression: (BMI<=18)*1+(BMI>18&BMI≤25)*2+(BMI>25)*3
E agora atribui-se o código:
Variable view seleccionar a célula “value” do BMI_code clicar nasreticências value: 1, label: baixo peso e clicar “add” voltar para“data view” view marcar “value labels”
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 19/29
Página 19 de 29
Temos uma tabela 3x2 3 tabelas 2x2 sig = α/3 = 0,05/3
Data select cases “if condition is satisfied” BMI_code~= 1 Ok
Agora pede-se o crosstabs
Com baixo peso e obeso:p>0,05 não rejeitamos H0, logo não há prevalência de diabetes em
indivíduos de baixo peso e indivíduos obesos não existem diferençassignificativas na prevalência de diabetes destes dois grupos.
Peso normal/obesos:Obeso com diabetes: 3,6%Normal com diabetes: 1,6%Os obesos têm mais do dobro de percentagem de prevalência dediabetes.
Aula 6 – Regressão Logística, ANOVA factorial e
MANOVA
Regressão Logística
Objectivo: predizer um de dois estados. Ex.: tem doença/não tem
doença
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 20/29
Página 20 de 29
Terminologia em Regressão Logística
- Probabilidade do evento de interesse: P(Y=1) ‘(ter a doença)’ - Tendência para o evento de interesse (eZ) e logaritmo da tendência
(Z): Z = log(PZ/1-PZ)- Taxa de tendência para evento de interesse, dados Z1 e Z2: OR = eZ1-Z2
Teste à significância da RL
Testar se pelo menos um dos preditores tem associação com ter adoença.
Estatística de Teste: G Qui-quadrado tabela SPSS “Omnibus testo f model
coefficients” Se nenhum dos preditores tiver associação, o teste não serve Queremos rejeitar H0 (H0: nenhuma variável tem associação) Na tabela queremos valores de p baixos para rejeitar H0. Depois de sabermos que há pelo menos uma associação: teste à
estatística dos coeficientes teste de Wald. No SPSS tabela“variable in the equations” p > 0,05 conseguimos identificar quais as variáveis que têm associação com a variáveldependente.
Qualidade do Ajustamento
Utiliza-se para saber se o modelo se ajusta bem aos dados.Usa-se o teste de Hosmer-Lemeshow. Quando não se rejeita H0 temosum bom ajustamento, para isso queremos um valor de p elevado, poisquanto maior o p, melhor o modelo.Faz-se gráficos dos resíduos:
1. Change in deviance (calculada a partir dos resíduosestudantizados, calculando o quadrado sre2) vs. Predictedprobabilities
2. Cook’s distance vs predicted probabilities
Regressão logística no SPSS predizer a probabilidade ter a doençacoronária em função da idade.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 21/29
Página 21 de 29
Utiliza-se o ficheiro “CHDRL.sav”
Analyse regression BinaryLogistic Save, marcar “probabilities”,“cook’s” e “studentized” options, marcar “Hasmer -Lemeshow”
Block 1:- 1ª tabela: saber se o modelo é significativo – saber se pelo menos
uma variável tem influência sig. sig (ou p) < 0,05 : há pelomenos um preditor com influência rejeita-se H0.
- 3ª tabela: saber se o modelo serve mede a qualidade do modelo.Quanto mais alto o valor de p, melhor o modelo
- 5ª tabela: variar o valor de cut-off altera a percentagem de indivíduosbem ou mal classificados.
São classificados correctamente 74% dos casos. Tem uma sensibilidade
de [29/(12+29)*100] e uma especificidade de [45/(45+14)*100].
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 22/29
Página 22 de 29
E se alterar o cut-off para 0,74?
Curva de ROC
A Curva ROC é um gráfico de sensibilidade (ou taxa de verdadeirospositivos) versus taxa de falsos positivos.
Para lançar a Curva ROC:
Analyse ROC curve em display marcar todas as opções em“Value of state variable” colocar 1 Ok.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 23/29
Página 23 de 29
Na tabela, vemos a área debaixo da curva. Quanto maior, melhor oteste.
Anova Factorial
ANOVA tow-way: serve para comparar sujeitos entre si com duas
variáveis. Existem três hipóteses estatísticas a testar: duas delas são paraos dois factores e uma é “H0: os factores não interagem”.
Pressupostos: Distribuição normal em cada uma das células (teste de Shapiro-
wilk ou de Kolmogorov-Smirnov) Variâncias homogéneas (teste de levene)
Se os pressupostos falharem , mas os grupos tiverem composiçõescomparáveis, pode usar-se ANOVA.
Se o efeito interactivo não é significativo, interpreta-se os efeitosisolados
Se o efeito interactivo é significativo, procede-se à comparaçãoplaneada (contrastes)
Primeiro criamos o BMI_code
H01: o factor sex não tem efeito sobre a pressão arterial sistólicaH02: o factor BMI não tem efeito sobre a pressão arterial sistólicaH03: não há interacção entre os dois factores
Divide-se a amostra por sexo (split file), testa-se a normalidade edesactiva-se o split file. Lançamos a ANOVA factorial:
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 24/29
Página 24 de 29
Analyse general linear model univariate em dependent variablecolocamos “Systolic blood pressure” e em fixed factors colocamos “sex” e “BMI_code” options marcar “homogeneity” e “observed power ” plots no horizontal axis colocamos “sex” e em separate lines
“BMI_code” add Continue Ok.
2ª tabela: teste de levene sig < 0,05 falha
3ª tabela:
Sex sig < 0,05 rejeita-se H01BMI_code sig < 0,05 rejeita-se H02Sex*BMI_code sig > 0,05 não se rejeita H03
.Conclusão:
Sexo tem influência na pressão arterial sistólica BMI tem influência na pressão arterial sistólica Os dois factores não têm interacção entre si
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 25/29
Página 25 de 29
MANOVA
Este teste só se utiliza se as variáveis estiverem associadas entre si.As hipóteses são:
- H0: as médias de cada uma das variáveis são todas iguais entre osvários grupos.- H1: há pelo menos uma média diferente
Condições: Homogeneidade da matriz da variância (covariância)
Vamos comparar homens e mulheres em relação ao colesterol, BMI,pressão sistólica, pressão diastólica.
1º Analisar se é necessário aplicar a MANOVA teste de esfericidade
de Bartlet
Analyse dimension reduction factor colocar colesterol, BMI,pressão sistólica e pressão diastólica em “variables” e sex em “selectionvariable”, atribuindo o valor 1 descriptives marcar initial solution eKMO.
1ª tabela:
Relativamente ao teste de Bartlet, sig < 0,05 não se rejeita H0
2º Fazer a MANOVA
Analyse general linear model multivariate options marcar “homogeneity test”
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 26/29
Página 26 de 29
2ª tabela:se o valor de Box’s M é mmaior do que 0,05, háviolação e não se pode
usar Wilks lambda.
3ª tabela:
Como sig < 0,05 rejeita-se H0 há diferenças entre os grupos.
Pressão sistólica: sig < 0,05 rejeitar H0 há diferençasPressão diastólica: sig < 0,05 rejeitar H0 há diferençasColesterol: sig < 0,05 rejeitar H0 há diferençasBMI: sig > 0,05 não rejeitar H0 não há diferenças
Aula 7–ANOVA de medições repetidas
É utilizada para situações em que medimos as mesmas pessoas váriasvezes ou em situações experimentais diferentes. O objectivo é comparar média.
Pressupostos:- normalidade da variável dependente.- esfericidade: teste de Bartlet ou de Mauchly
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 27/29
Página 27 de 29
Utilizamos o ficheiro SysBP
Se não quero saber do sexo, posso utilizar ANOVA de mediçõesrepetidas.
1º testar os pressupostos (para todos os pré)- distribuição é normal porque sig > 0,05
2º testar a esfericidade com o teste de Mauchly e lançar a ANOVA
Analyse general linear model repeated measures nº de níveis(quantos registos?):3 add define escolher todos os “prés” para osfactores options factor para “display means for ” marcar “compare main effect” LSDmarcar “observed power ” Ok.
Porque aparece primeiro o quadro de MANOVA?É muito provável que a esfericidade seja violada e, nesse caso, faz-seMANOVA. “À cautela”, o SPSS oferece também automaticamente aMANOVA.
H0: há esfericidade.
Como sig > 0,05 não se rejeita H0.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 28/29
Página 28 de 29
No quadro “Tests of Within Subjects-Effects”:
Na linha “sphericity assumed”, sig < 0,05 rejeita-se H0, logo hádiferenças.
Vamos agora analisar os Post-Hoc: Pairwise
Há influência e é devido ao factor 2.
E se quiséssemos fazer para os 6 factores? Fazemos os passos iguais
Teste de Mauchly:
Como sig < 0,05 rejeita-se H0 não há esfericidade.
5/17/2018 Sebenta de Estatística Clínica - slidepdf.com
http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 29/29
Página 29 de 29
Então escolhemos uma das correlações do quadro da MANOVA aque tiver maior potência.
Para fazer o mesmo mas por sexos:
Analyse general linear models repeated measures nº de níveis:3 todos os prés para “within subject variables” e sex para “Betweensubject factor ” Post-Hoc Tukey continue options marcar
observed power e homogeneity tests.
No teste de Mauchly, não se rejeita H0 porque sig > 0,05.
Usamos a linha da esfericidade assumida, e temos sig > 0,05 não serejeita H0, logo não há diferenças.
E assim, tem-se este quadro de Post-Hocs, onde podemos comparar osvários factores.