spss manual de utilização
TRANSCRIPT
-
5/26/2018 SPSS Manual de Utiliza o
1/151
ESCOLA SUPERIOR AGRRIAINSTITUTO POLITCNICO DE CASTELO BRANCO
SPSS- MANUAL DE UTILIZAO
ARMANDO MATEUS FERREIRA
Escola Superior Agrria de Castelo Branco, 1999
-
5/26/2018 SPSS Manual de Utiliza o
2/151
SPSS ndice
ESACB i
NDICE
1 - INTRODUO .......................................................................................... 1
2 - EDITOR DE DADOS .............................................................................. 3
2.1 - CRIAR UM FICHEIRO DE DADOS .................................................. 52.1.1 - DEFINIO DE VARIVEIS.................................................................... 52.1.2 - INTRODUO DOS VALORES................................................................ 92.1.3 - GRAVAR O FICHEIRO DE DADOS........................................................ 11
2.1.4 - ABRIR UM FICHEIRO DE DADOS EXISTENTE.................................... 122.1.5 - ACESCENTAR NOVOS CASOS A UM FICHEIRO DE DADOS............... 132.1.6 - ACRESCENTAR NOVAS VARIVEIS...................................................... 142.1.7 - DEFINIR UMA VARIVEL EM FUNO DE OUTRAS......................... 152.1.8 - ELIMINAR LINHAS E VARIVEIS.......................................................... 16
2.2 - IMPORTAO DE FICHEIROS EXTERNOS .............................. 172.2.1 - IMPORTAO DE FICHEIROS LOTUS E EXCEL 4.0 ........................... 172.2.2 - IMPORTAO DE FICHEIROS DE DBASE........................................... 182.2.3 - IMPORTAO DE FICHEIROS EXCEL ................................................. 192.2.4 - IMPORTAO DE FICHEIROS ACCESS............................................... 22
2.2.5 - RECODIFICAO DE VALORES........................................................... 222.2.6 - SELECO DE CASOS........................................................................... 25
3 - ANLISE DE DADOS ......................................................................... 29
3.1 - OBTER ESTATSTICAS DESCRITIVAS ....................................... 293.1.1 - PROCEDIMENTO DESCRIPTIVES........................................................ 293.1.2 - PROCEDIMENTO EXPLORE................................................................. 323.1.3 - PROCEDIMENTO EXPLORE COM FACTORES.................................... 363.1.4 - PROCEDIMENTO FREQUENCIES........................................................ 39
4 - GRFICOS................................................................................................. 44
4.1 - GRFICOS STANDARDIZADOS .................................................... 444.1.1 - GRFICO DE BARRAS........................................................................... 454.1.2 - HISTOGRAMA ........................................................................................ 504.1.3 - GRFICO DE EXTREMOS-E-QUARTIS................................................. 524.1.4 - GRFICO DE BARRA DE ERROS.......................................................... 544.1.5 - GRFICOS DE PROBABILIDADES........................................................ 564.1.6 - GRFICO DE DISPERSO..................................................................... 59
4.2 - EDIO DOS GRFICOS STANDARDIZADOS........................ 624.3 - GRFICOS INTERACTIVOS ............................................................ 65
4.3.1 - GRFICO DE BARRAS........................................................................... 66
4.3.2 - GRFICO DE DISPERSO..................................................................... 704.4 - EDIO DE GRFICOS INTERACTIVOS ................................... 75
-
5/26/2018 SPSS Manual de Utiliza o
3/151
SPSS ndice
ESACB ii
5 - TESTES T ......................................................................................................... 79
5.1 - TESTE T PARA A MDIA DE UMA AMOSTRA...................................... 825.2 - TESTE T PARA DUAS AMOSTRAS INDEPENDENTES......................... 835.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS......................... 86
6 - ANLISE DE VARINCIA ........................................................................... 906.1 - ENSAIOS UNI-FACTORIAIS ...................................................................... 90
6.1.1 - PROCEDIMENTO ONE-WAY ANOVA ................................................. 916.1.2 - PROCEDIMENTO MEANS.................................................................... 96
6.2 - ENSAIOS MULTI-FACTORIAIS................................................................. 99
7 - REGRESSO LINEAR................................................................................. 111
7.1 - INTRODUO............................................................................................ 1117.2 - REGRESSO LINEAR SIMPLES.............................................................. 1157.3 - REGRESSO LINEAR MLTIPLA.......................................................... 1217.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS................................ 131
8 - MANUSEAR OS RESULTADOS................................................................. 136
ANEXOS ..................................................................................................................... 143
-
5/26/2018 SPSS Manual de Utiliza o
4/151
SPSS 1 - Introduo
ESACB 1
1 - INTRODUO
O pakage estatstico SPSS para Windows um poderoso sistema de anlises estatsticas emanuseamento de dados, num ambiente grfico, em que a utilizao mais frequente, para a
maioria das anlises a efectuar, se resume seleco das respectivas opes em menus ecaixas de dilogo. Contudo, o sistema dispe de um editor de comandos, a que o utilizadormais avanado poder recorrer a fim de realizar determinado tipo de anlises maiscomplexas e elaboradas.
De um modo muito sucinto, o sistema SPSS dispe de:
Data Editor: Editor de Dados: uma verstil folha de clculo, que permite definir,introduzir, modificar, corrigir e visualizar a informao. O Data Editor abreautomaticamente quando se entra no SPSS.
Viewer: Janela de Resultados: Todos os resultados estatsticos, tabelas, grficos, sovisualizados numa janela designada por Viewer. Uma janela Viewer abreautomaticamente na primeira vez que o utilizador executar uma tarefa quegera output.
Na figura seguinte apresenta-se o aspecto da janela de resultados referentesao clculo das estatsticas elementares um conjunto de dados (varivel como nome fosfo). O Viewer composto por duas janelas: esquerda est umorganigrama do output; direita esto os resultados propriamente ditos.
Neste exemplo, os resultados incluem as instrues necessrias execuo
-
5/26/2018 SPSS Manual de Utiliza o
5/151
SPSS 1 - Introduo
ESACB 2
da tarefa: o que se designa por Log1, e que composto pelas seguinteslinhas de instrues:
DESCRI PTI VESVARI ABLES=f osf o/ STATI STI CS=MEAN SUM STDDEV VARI ANCE RANGE MI N MAX SEMEAN KURTOSI S SKEWNESS .
Estas instrues foram geradas, no caso, pela seleco de opes nos menusdo programa; contudo, podem ser digitadas, como se de uma linguagem de
programao se tratasse2.
Pivot Tables: Tabelas Dinmicas: O programa dispe de uma potente rotina de gerao detabelas dinmicas (ou pivot tables), que permitem que o utilizador exploreos dados, com o re-arranjo de colunas e linhas.
Grficos: O SPSS permite realizar todos os tipos de grficos usuais em estatstica, afim de realar as anlises efectuadas.
Acesso a Bases de Dados: O SPSS permite o acesso s bases de dados mais usuais, emformato SQL e ODBC, tais como ficheiros de dados criados em dBase,Access, Excel, Lotus, etc. A importao de ficheiros de texto, Access,Excel, feita atravs de um assistente de importao (wizard).
1 O Log pode no estar visvel; s aparece na janela Viewer se se tiver configurado o programa para
mostrar este item.2 O utilizador pode escrever as suas prprias rotinas de anlise; para tal, deve abrir o SPSS Syntax
Editor, janela de edio de comandos do SPSS.
-
5/26/2018 SPSS Manual de Utiliza o
6/151
SPSS 2 - Edio de Dados
ESACB 3
2 - EDITOR DE DADOS
O Data Editor do SPSS um programa do tipo de folha de clculo que permite facilmente
criar ou editar ficheiros de dados. O Data Editor abre automaticamente quando se entra noSPSS.
O aspecto inicial do editor o seguinte:
Muitas das caractersticas do data editor do SPSS so similares s de qualquer folha declculo em ambiente Windows, tal como o Excel.
As colunas correspondem s variveis. Inicialmente, todas as colunas, ou variveis, tem omesmo nome genrico, var, tal como mostrado na imagem. O utilizador ir dar os nomess variveis que definir.
As linhas correspondem aos casos, ou indivduos.
Cada clula contm um valor ou observao de um indivduo, em relao a umadeterminada caracterstica ou varivel. As clulas podem apenas conter valores (numricosou alfanumricos); no possvel, tal como se faz nas folhas de clculo, definir frmulasem clulas. O SPSS permite definir frmulas, mas que afectam integralmente toda umavarivel ou coluna.
O ficheiro de dados rigorosamente rectangular, sendo o seu tamanho definido pelonmero de casos e de variveis. O utilizador pode introduzir valores em clulas fora das
-
5/26/2018 SPSS Manual de Utiliza o
7/151
SPSS 2 - Edio de Dados
ESACB 4
fronteiras actuais da folha de clculo; contudo, o SPSS automaticamente acrescenta linhase/colunas de modo a que essa nova observao fique includa dentro da estruturarectangular. A fim de ilustrar este aspecto, considere a seguinte imagem referente a umfolha de dados do SPSS, em que existem duas variveis (com os nomes xe y), com 6 casosou observaes. Repare na posio da clula activa.
Se se introduzir um valor (por exemplo, 25) para esta clula, fora dos limites do ficheirorectangular, o SPSS cria duas novas variveis numricas atribuindo-lhes automaticamenteos nomes var00002 e var00003, e introduz valores em branco para as clulas, de modo aficar um ficheiro rectangular, com 4 variveis e 7 casos (repare que estas clulas tm o
ponto decimal):
Estas clulas, aparentemente vazias, so assumidas pelo SPSS como missing values, isto, observaes em falta para algumas variveis. Contudo, e para j, estas clulas noafectam os clculos estatsticos, caso se se trate de variveis numricas. Por exemplo,calculando a mdia da varivel xobter-se- o valor de 15, como lgico, para os valores
apresentados.
-
5/26/2018 SPSS Manual de Utiliza o
8/151
SPSS 2 - Edio de Dados
ESACB 5
2.1 - CRIAR UM FICHEIRO DE DADOS
Vamos usar os seguintes dados a fim de ilustrar como se cria um ficheiro com o Data Editordo SPSS. Trata-se dos resultados de um ensaio, em que se registaram as produes (kg/ha)de arroz, em funo da variedade (V1: IR8; V2: IR5; V3: C4-63) e de 5 nveis de adubaoazotada (N0: 0 kg/ha; N1: 60 kg/ha; N2: 90 kg/ha; N3: 120 kg/ha; N4: 150 kg/ha). Paracada tratamento fizeram-se 4 repeties.
Na imagem seguinte, capturada do Excel, estes dados esto perceptveis para o leitor, eesto estruturados para algumas possveis anlises a executar na folha de clculo; contudo,ao serem introduzidos para um ficheiro SPSS, dever-se-o respeitar as normas deste
programa, de modo a que os dados possam ser analisados.
Variedade Azoto 1 2 3 4N0 3852 2606 3144 2894N1 4788 4936 4562 4608
V1 N2 4576 4454 4884 3924N3 6034 5276 5906 5652N4 5874 5916 5984 5518N0 2846 3794 4108 3444N1 4956 5128 4150 4990
V2 N2 5928 5698 5810 4308N3 5664 5362 6458 5474N4 5458 5546 5786 5932N0 4192 3754 3738 3428N1 5250 4582 4896 4286
V3 N2 5822 4848 5678 4932N3 5888 5524 6042 4756N4 5864 6264 6056 5362
Repetio
Como se referiu atrs, os dados devero ser introduzidos para uma matriz rectangular, emque as colunas so as variveis e as linhas os casos. Neste caso, as variveis so aVariedade, o Azoto, a Repetio e a Produo.
2.1.1 - DEFINIO DE VARIVEIS
Vamos comear por definir estas variveis no SPSS dando-lhes nomes vlidos; as regraspara os nomes das variveis so:
! nome da varivel tem no mximo, 8 caracteres;! nome da varivel deve comear por uma letra; os restantes caracteres podem ser
letras (maisculas ou minsculas so iguais), algarismos, ou os smbolos @, #, _, $.No se podem usar espaos em branco, nem os seguintes caracteres: !, ?, , , *, +, -,%, vrgula, ponto e vrgula, \, /, >, *=5%,concluindo-se assim que os ritmos cardacos em repouso, destas duas amostras, soestatisticamente iguais, para um nvel de significncia de 5%.
O intervalo de confiana a 95% para a diferena entre as mdias [-5.67 , 8.34],podendo teoricamente a diferena ser nula.
5.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS
Pretende-se verificar se existem ou no diferenas significativas entre os ritmoscardacos antes e depois de realizao do exerccio fsico, isto :
0:0:
::
mod1mod0
mod1mod0
-&
.
-#
ritritmoaritritmoa
ritritmoaritritmoa
xxHxxH
xxHxxH
Como anteriormente se fez notar, este teste dever ser efectuando, sem incluir oindivduo n 6, por se suspeitar que o respectivo registo do ritmo cardaco aps
exerccio est errado. Para tal, fazer:
DataSelect Cases...
-
5/26/2018 SPSS Manual de Utiliza o
89/151
SPSS 5 - Testes T
ESACB 87
Pretende-se excluir o caso n 6 da anlise, isto , incluir na anlise todos os casos com
excepo do caso n 6. Para tal, na caixa de dilogo seleccionar , edefinir que se seleccionam para anlise todos os cados diferenntes do caso n 6:
A indicao caso ~= 6 significa todos os casos excepto o caso 6.
O Data Editor do SPSS criou automaticamente uma varivel designada filter_$, em queindica quais os casos seleccionados e os no includos. Repare-se que a linha 6 esttraada, indicando que este caso est excludo de futuras anlises:
Note-se que este procedimento de seleccionar casos no exclusivo nem obrigatrio doprocedimento da comparao de mdias de duas amostras emparelhadas. umprocedimento geral a efectuar previamente a qualquer anlise em que haja necessidadede seleccionar ou excluir casos.
De seguida, passa-se ento comparao das mdias das duas amostras emparelhadas.Tal como o nome indica, deve haver pares de observaes, de modo que ambas asamostras tm o mesmo nmero de observaes.
Para tal, fazer Statistics Compare Means Paired Samples T Test...:
-
5/26/2018 SPSS Manual de Utiliza o
90/151
SPSS 5 - Testes T
ESACB 88
Na caixa de dilogo seguinte, seleccionar as duas variveis emparelhadas cujas mdiasse pretendem comparar:
O boto serve para definir o intervalo de confiana para a diferena entre asduas mdias (por defeito, (1-*)=0.95).
Os resultados so os seguintes:
Paired Samples Statistics
75.44 39 9.08 1.45
137.31 39 12.56 2.01
RITMOA
RITMOD
Pair1
Mean NStd.
DeviationStd. Error
Mean
-
5/26/2018 SPSS Manual de Utiliza o
91/151
SPSS 5 - Testes T
ESACB 89
Paired Samples Correlations
39 .544 .000RITMOA & RITMODPair 1N Correlation Sig.
Paired Samples Test
-61.87 10.78 1.73 -65.36 -58.38 -35.858 38 .000RITMOA - RITMODPair 1Mean
Std.Deviation
Std. ErrorMean Lower Upper
95% ConfidenceInterval of the
Difference
Paired Differences
t dfSig.
(2-tailed) No primeiro quadro so apresentados alguns parmetros estatsticos de cada uma dasamostras. Repare-se que foram s levados em conta 39 observaes em cada amostra.
O quadro seguinte apresenta o valor do coeficiente de correlao de Pearson entre asduas variveis (r=0.544).
No ltimo quadro apresentado o valor de 87.61mod & ritritmoa xx , o intervalo de
confiana para a diferena entre mdias ([-65.36 , -58.38]) e o valor da estatstica deteste t-Student t= -35.858, bem como os graus de liberdade do teste e o valor p-value ouverdaddeiro nvel de significncia (0.000). Como |tcalc| = 35.858 > t(0.05,38)=2.025 (ou p-value=0.000 < *=5%) conclui-se que as mdias so significativamente diferentes.
-
5/26/2018 SPSS Manual de Utiliza o
92/151
SPSS 6 - Anova
ESACB 90
6 - ANLISE DE VARINCIA
6.1 - ENSAIOS UNI-FACTORIAIS
A anlise de varincia uma metodologia estatstica cujo objectivo decidir se existemou no diferenas significativas entre as mdias de vrias amostras de uma varivelnumrica, definidas por diferentes tratamentos ou nveis de influncia de um factor. Estametodologia uma extenso do teste t-Student para duas amostras independentes.
Isto :
mdiasasentreivassignificatdiferenasExistem:... 1321:0 HxxxxH T ,#####
De um modo muito resumido, a metodologia anova calcula a variabilidade totalexistente na caracterstica ou varivel em anlise, e particiona esta variabilidade comosendo devida fundamentalmente a duas causas: uma causa determinista, que o facto deas amostras serem sujeitas a tratamentos distintos (variabilidade entre tratamentos);causas aleatrias ou erro experimental, que engloba todas as restantes fontes devariabilidade, com excepo dos diferentes tratamentos (variabilidade residual ou erroexperimental). Estas variabilidades so estimativas de varincia (entre tratamentos, eresidual, respectivamente). Isto :
Variabilidade Total = Variabilidade entre Tratamentos + Erro Experimental
A estatstica de teste a estatstica F, que uma razo entre varincias, que sob opressuposto de que as observaes tm distribuio normal, segue uma distribuio F deSnedecor:
);;(~Re dennum glglF
sidualVarincia
sTratamentoentreVarinciaF
*#
Se a estatstica F demasiado grande, ento porque a varincia entre tratamentos preponderante em relao varincia residual, isto , os diferentes tratamentos a que aamostra foi sujeita conduz a resultados estatisticamente diferentes.
Na sequncia de uma anlise de varincia em que se conclua que existem diferenassignificativas entre as mdias dos diversos tratamentos em anlise, faz-se um testesuplementar a fim de identificar quais so as mdias estatisticamente diferentes. Osmais usuais so os testes LSD (Least Significant Difference, Diferena MnimaSignificativa), HSD-Tuckey (Honnestly Significant Difference), Scheff, Duncan.
Vamos ilustrar a metodologia de anlise de varincia, usando os valores apresentadosno quadro seguinte, referentes s produes obtidas num ensaio em que se pretende
-
5/26/2018 SPSS Manual de Utiliza o
93/151
SPSS 6 - Anova
ESACB 91
estudar o efeito da densidade de sementeira, na cultura de arroz (variedade IR8).Definiram-se 6 densidades de sementeira (kg/ha de semente). Para cada densidade defizeram-se 4 repeties. Todos os restantes factores de produo foram mantidosconstantes no ensaio (adaptado de GOMEZ & GOMEZ, 1984).
Densidade Repeties25 5113 5398 5307 467850 5346 5952 4719 526475 5272 5713 5483 5049100 5164 4831 4986 4410125 4804 4848 4432 4748150 4254 4542 4919 4098
A anova simples (ensaios uni-factoriais) pode ser executada no SPSS com doisprocedimentos:
6.1.1 - PROCEDIMENTO ONE-WAY ANOVA
Este o procedimento que conduz elaborao tpica da anlise de varincia, e no qual possvel definir a obteno de mais resultados no mbito desta metodologia estatstica.
A partir do menu principal do SPSS, seleccionar:
StatisticsCompare Means...One-Way ANOVA...
Seleccionar para o campo o nome da varivel que contm os valores davarivel que contm os resultados a analisar (no exemplo, producao); no camposelecciona-se a varivel que identifica os diferentes tratamentos (densidad).
Seleccionar a opo para definir qual ou quais os testes de comparao demdias a efectuar na sequncia da anova. Pode seleccionar-se apenas um ou mais testes.
-
5/26/2018 SPSS Manual de Utiliza o
94/151
SPSS 6 - Anova
ESACB 92
No exemplo, pediram-se os testes LSD e Tuckey. O nvel de significncia , por defeito,*=5%, podendo este valor ser definido pelo utilizador:
Fazer , voltando janela One-Way ANOVA, onde se pode seleccionar o boto
a fim de definir clculos adicionais; no caso, pediram-se o clculo dosparmetros estatsticos, a realizao do teste de Levene para verificar se as varinciasdos diferentes tratamentos so homogneas e representar graficamente as mdias dosdiferentes tratamentos:
Os resultados so os seguintes:
-
5/26/2018 SPSS Manual de Utiliza o
95/151
SPSS 6 - Anova
ESACB 93
OnewayDescriptives
Produo (kg/ha)
4 5124.0000 320.2093 160.1047 4614.4755 5633.5245 4678.00 5398.00
4 5320.2500 504.7893 252.3947 4517.0176 6123.4824 4719.00 5952.00
4 5379.2500 284.4414 142.2207 4926.6402 5831.8598 5049.00 5713.00
4 4847.7500 321.9900 160.9950 4335.3920 5360.1080 4410.00 5164.00
4 4708.0000 188.4958 94.2479 4408.0611 5007.9389 4432.00 4848.00
4 4453.2500 360.8798 180.4399 3879.0097 5027.4903 4098.00 4919.00
24 4972.0833 455.9256 93.0654 4779.5628 5164.6038 4098.00 5952.00
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
Total
N MeanStd.
Deviation Std. Error LowerBound
UpperBound
95% Confidence Intervalfor Mean
Minimum Maximum
Test of Homogeneity of Variances
Produo (kg/ha)
.418 5 18 .830
LeveneStatistic df1 df2 Sig.
ANOVA
Produo (kg/ha)
2657880.8 5 531576.167 4.507 .008
2123087.0 18 117949.278
4780967.8 23
Between Groups
Within Groups
Total
Sum ofSquares df
MeanSquare F Sig.
-
5/26/2018 SPSS Manual de Utiliza o
96/151
SPSS 6 - Anova
ESACB 94
Post Hoc TestsMultiple Comparisons
Dependent Variable: Produo (kg/ha)
-196.2500 242.8469 .962 -968.0352 575.5352
-255.2500 242.8469 .894 -1027.0352 516.5352
276.2500 242.8469 .859 -495.5352 1048.0352
416.0000 242.8469 .541 -355.7852 1187.7852
670.7500 242.8469 .111 -101.0352 1442.5352
196.2500 242.8469 .962 -575.5352 968.0352
-59.0000 242.8469 1.000 -830.7852 712.7852
472.5000 242.8469 .408 -299.2852 1244.2852
612.2500 242.8469 .170 -159.5352 1384.0352
867.0000* 242.8469 .023 95.2148 1638.7852
255.2500 242.8469 .894 -516.5352 1027.0352
59.0000 242.8469 1.000 -712.7852 830.7852
531.5000 242.8469 .290 -240.2852 1303.2852
671.2500 242.8469 .110 -100.5352 1443.0352
926.0000* 242.8469 .014 154.2148 1697.7852
-276.2500 242.8469 .859 -1048.0352 495.5352
-472.5000 242.8469 .408 -1244.2852 299.2852
-531.5000 242.8469 .290 -1303.2852 240.2852
139.7500 242.8469 .991 -632.0352 911.5352
394.5000 242.8469 .594 -377.2852 1166.2852
-416.0000 242.8469 .541 -1187.7852 355.7852
-612.2500 242.8469 .170 -1384.0352 159.5352
-671.2500 242.8469 .110 -1443.0352 100.5352
-139.7500 242.8469 .991 -911.5352 632.0352
254.7500 242.8469 .895 -517.0352 1026.5352
-670.7500 242.8469 .111 -1442.5352 101.0352
-867.0000* 242.8469 .023 -1638.7852 -95.2148
-926.0000* 242.8469 .014 -1697.7852 -154.2148
-394.5000 242.8469 .594 -1166.2852 377.2852
-254.7500 242.8469 .895 -1026.5352 517.0352-196.2500 242.8469 .430 -706.4525 313.9525
-255.2500 242.8469 .307 -765.4525 254.9525
276.2500 242.8469 .270 -233.9525 786.4525
416.0000 242.8469 .104 -94.2025 926.2025
670.7500* 242.8469 .013 160.5475 1180.9525
196.2500 242.8469 .430 -313.9525 706.4525
-59.0000 242.8469 .811 -569.2025 451.2025
472.5000 242.8469 .067 -37.7025 982.7025
612.2500* 242.8469 .021 102.0475 1122.4525
867.0000* 242.8469 .002 356.7975 1377.2025
255.2500 242.8469 .307 -254.9525 765.4525
59.0000 242.8469 .811 -451.2025 569.2025
531.5000* 242.8469 .042 21.2975 1041.7025
671.2500* 242.8469 .013 161.0475 1181.4525
926.0000* 242.8469 .001 415.7975 1436.2025-276.2500 242.8469 .270 -786.4525 233.9525
-472.5000 242.8469 .067 -982.7025 37.7025
-531.5000* 242.8469 .042 -1041.7025 -21.2975
139.7500 242.8469 .572 -370.4525 649.9525
394.5000 242.8469 .122 -115.7025 904.7025
-416.0000 242.8469 .104 -926.2025 94.2025
-612.2500* 242.8469 .021 -1122.4525 -102.0475
-671.2500* 242.8469 .013 -1181.4525 -161.0475
-139.7500 242.8469 .572 -649.9525 370.4525
254.7500 242.8469 .308 -255.4525 764.9525
-670.7500* 242.8469 .013 -1180.9525 -160.5475
-867.0000* 242.8469 .002 -1377.2025 -356.7975
-926.0000* 242.8469 .001 -1436.2025 -415.7975
-394.5000 242.8469 .122 -904.7025 115.7025
-254.7500 242.8469 .308 -764.9525 255.4525
(J) Densidade desementeira50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha25 kg/ha
50 kg/ha
75 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
(I) Densidade desementeira25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
125 kg/ha
150 kg/ha
Tukey HSD
LSD
Mean
Difference(I-J) Std. Error Sig.
LowerBound
UpperBound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
-
5/26/2018 SPSS Manual de Utiliza o
97/151
SPSS 6 - Anova
ESACB 95
Homogeneous SubsetsProduo (kg/ha)
4 4453.25004 4708.0000 4708.0000
4 4847.7500 4847.7500
4 5124.0000 5124.0000
4 5320.2500
4 5379.2500
.111 .110
Densidade desementeira
150 kg/ha125 kg/ha
100 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
Sig.
Tukey HSDa
N 1 2
Subset for alpha = .05
Means for groups in homogeneous subsets are displayed.
Uses Harmonic Mean Sample Size = 4.000.a.
Means Plots
Densidade de sementeira
150 kg/ha125 kg/ha100 kg/ha75 kg/ha50 kg/ha25 kg/haMeanofProduo(kg/ha)
5600
5400
5200
5000
4800
4600
4400
O primeiro quadro de resultados contm a mdias, desvio padro e erro padro da mdiae intervalo de confiana da mdia, mnimo e mximo para cada tratamento.
De seguida apresentado o teste de homogeneidade de varincias de Levene:
homogneassonovarinciasAs:: 124
23
22
210 HssssH ###
Como F=0.418 < F(0.05;5;18) =2.77, ou p-value=0.83 > *=0.05, conclui-se que as
varincias so homogneas, isto , dentro de cada um dos tratamentos a variabilidade apenas devida a causas aleatrias.
O quadro que se segue a tabela da anlise de varincia, apresentando a variabilidadeparticionada entre os tratamentos (betwen groups) e residual (within groups). ComoF=4.507 > F(0.05;5;18) =2.77, ou p-value=0.008 < *=0.05, conclui-se que existemdiferenas significativas entre as produes mdias das 6 densidades de sementeira, comum nvel de significncia de 5%.
Contudo, este resultado no nos permite concluir qual ou quais densidades conduzem aprodues mdias significativamente diferentes de outras. Para concluir tal, h queproceder comparao da mdia de cada um dos tratamentos com todas as restantes.esta comparao feita em termos do valor absoluto das diferenas entre mdias: se esta
-
5/26/2018 SPSS Manual de Utiliza o
98/151
SPSS 6 - Anova
ESACB 96
diferena entre duas mdias pequena, ento as mdias no diferem; se a diferena grande, ento as duas mdias so estatisticamente distintas. Este o princpio dequalquer teste de comparaes mltiplas.
Contudo, h que fixar um critrio que defina a fronteira entre o que uma diferena
grande e uma diferena pequena. Este critrio estabelecido por cada um dos testes(LSD, Scheff, Tukey, etc), com base em expresses que relacionam a mdia das somasdos quadrados residual (calculada na tabela anova) e com base em funes dedistribuio de probabilidades.
No quadro dos resultados dos testes de comparaes mltiplas so identificados com osmbolo * quais os tratamentos cujas mdias diferem significativamente. Repare-se queambos os testes acusam como conduzindo a produes mdias diferentes densidades de50 kg/ha e 150 kg/ha (diferena de 867 kg) e 75 kg/ha e 150 kg/ha (diferena de 926kg). Contudo apenas o teste LSD acusa existirem diferenas entre as produesalcanadas com 25 e 150 kg/ha (diferena de 670.75 kg), 50 e 125 kg/ha (diferena de
612.25 kg), 75 e 100 kg/ha (diferena de 531.5 kg).
Isto , o teste LSD acusa como diferentes tratamentos cujas mdias esto menosafastadas do que o teste Tuckey, que d, por assim dizer, maior margem de dvida antesde imputar essas diferenas aos efeitos dos tratamentos.
De seguida aparece um quadro complementar do teste Tukey em que agrupa ostratamentos em grupos homogneos, sendo o critrio de agrupamento o facto de noexistirem diferenas significativas entre os mdias dos tratamentos includos no mesmogrupo. O mesmo tratamento pode pertencer a mais do que um grupo, desde que nodifira dos restantes tratamentos desse grupo. Assim, as densidades de sementeira de150, 125, 100, 25 constituem um grupo de tratamentos, cujas produes mdias so asmais baixas; as densidades de 125, 100, 25, 50, 75 constituem outro grupo, cujas
produes so as mais altas. claro que alguns dos tratamentos densidades de 125, 100,25) pertencem aos dois grupos6.
Em termos absolutos, a densidade de sementeira que conduz a maior produo adensidade de 75 kg/ha; contudo, a produo obtida com a densidade de 50 kg/ha nodifere significativamente da anterior, e pode haver vantagens econmicas em usar estadensidade. Contudo, estas so algumas reflexes de ndole tcnica que competem aoanalista desenvolver, no cabendo propriamente no mbito deste manual.
No final aparece um grfico representado as mdias dos tratamentos, que pode ser tilexplorar no sentido de compreender os resultados, e deles tirar o proveito no mbito daaplicabilidade da Estatstica ao delineamento de ensaios agrcolas.
6.1.2 - PROCEDIMENTO MEANS
A partir do menu principal do SPSS, seleccionar:
6 Deixa-se ao cuidado do leitor a explicao agronmica destas concluses.
-
5/26/2018 SPSS Manual de Utiliza o
99/151
SPSS 6 - Anova
ESACB 97
StatisticsCompare Means...
Means...
Seleccionar para o campo o nome da varivel que contm os valores davarivel a analisar (no exemplo, producao); no campo selecciona-se avarivel que identifica os diferentes tratamentos (densidad).
Seleccionar o boto a fim de pedir a elaborao da tabela da anlise devarincia. Por defeito, so calculados os parmetros mdia e desvio padro; o utilizador
pode seleccionar outras estatsticas a calcular:
Os resultados so os seguintes:
-
5/26/2018 SPSS Manual de Utiliza o
100/151
SPSS 6 - Anova
ESACB 98
MeansCase Processing Summary
24 100.0% 0 .0% 24 100.0%Produo (kg/ha) *Densidade desementeira
N Percent N Percent N Percent
Included Excluded Total
Cases
Report
Produo (kg/ha)
5124.0000 4 320.2093
5320.2500 4 504.7893
5379.2500 4 284.44144847.7500 4 321.9900
4708.0000 4 188.4958
4453.2500 4 360.8798
4972.0833 24 455.9256
Densidade desementeira25 kg/ha
50 kg/ha
75 kg/ha100 kg/ha
125 kg/ha
150 kg/ha
Total
Mean NStd.
Deviation
ANOVA Table
2657880.8 5 31576.167 4.507 .008
2123087.0 18 17949.278
4780967.8 23
(Combined)Between
Within Groups
Total
Produo (kg/ha) *Densidade desementeira
Sum ofSquares df
MeanSquare F Sig.
Measures of Association
.746 .556Produo (kg/ha) *Densidade desementeira
EtaEta
Squared
A tabela da anova idntica obtida no procedimento anterior. Contudo, esteprocedimento no permite a obteno dos testes subsequentes que foram obtidos
previamente.
A estatstica Eta-Squared a proporo de varincia da varivel dependente que
explicada pelas diferenas entre os tratamentos; dado pela expressoT
H
SS
SS(isto ,
razo entre Soma dos Quadrados entre tratamentos (SSH) e a Soma dos Quadrados total(SST). A designao de Eta adoptada pelo SPSS no contexto da anova destina-se a nofazer confuso com o coeficiente de determinao, R2, usado no contexto da regressolinear, e que pode ser obtido a partir da tabela da anova da regresso pela expressoanterior.
-
5/26/2018 SPSS Manual de Utiliza o
101/151
SPSS 6 - Anova
ESACB 99
6.2 - ENSAIOS MULTI-FACTORIAIS
Os organismos biolgicos esto simultaneamente expostos a muitos factores decrescimento. A resposta de um organismo a um nico factor de crescimento pode variar
com o nvel de outros factores; assim, os delineamentos uni-factoriais so criticadospelo seu pequeno leque de aplicabilidade. Na realidade, os resultados dos delineamentosuni-factoriais so apenas vlidos para o caso particular (e extremamente difceis deconseguir) de todos os restantes factores serem mantidos constantes.
Neste sentido, quando se espera que a resposta a um factor de interesse varie sobdiferentes nveis de outros factores, devem evitar-se os delineamentos uni-factoriais, econsiderar um delineamento multi-factorial que permita estudar em simultneo dois oumais factores.
Em ensaios factoriais, h a considerar os efeitos de cada um dos nveis de um dos
factores, mantendo os nveis dos outros factores constantes (efeitos simples), os efeitosde cada um dos factores, abstraindo da presena dos outros factores (efeitos principais)e interaco entre os nveis dos diversos factores (interaco entre factores).
Diz-se que existe interaco entre dois factores se a resposta a um dos factores variaconsoante os nveis do outro factor.
A fim de ilustrar o procedimento de clculo da anlise de varincia multi-factorial,vamos usar o ficheiro arroz.sav, em que se pretende verificar a influncia de trsvariedades (IR8, IR5, CA-63) e 5 nveis de adubao azotada (0, 60, 90, 120, 150 kg/ha)na produo de arroz.
StatisticsGeneral Linear Model
GLM General Factorial ...
Na caixa de dilogo seguinte, seleccionar a varivel dependente a analisar (producao) eos factores de produo cuja influncia se pretende analisar (variedade adubacao):
-
5/26/2018 SPSS Manual de Utiliza o
102/151
SPSS 6 - Anova
ESACB 100
De seguida, seleccionar a opo a fim de definir o modelo de anova a
calcular. Por defeito, est seleccionada a opo , que especifica que a tabelada anova apresentar a os efeitos principais de cada factor, bem como as interaces
entre factores. a situao mais usual. Optando por o utilizador pode definirque a anova apresente apenas os efeitos principais, ou apenas algumas das interaces a
definir.
Por defeito, est definido o mtodo de clculo da soma de quadrados (tipo III); para
delineamentos em que no haja missing-values deve definir-se esta metodologia declculo.
-
5/26/2018 SPSS Manual de Utiliza o
103/151
SPSS 6 - Anova
ESACB 101
A opo deve ser seleccionada (por defeito, est activada). Casose assuma que os dados passam pela origem dos eixos (isto , caso a ausncia dosfactores em anlise conduzam a valor zero da varivel dependente), pode omitir-se estaopo. Da sua incluso no modelo resulta a apresentao de mais uma linha inusitada natabela da anova, que traduz a variabilidade associada varivel dependente para osnveis zero dos factores. As restantes linhas da tabela so as usuais.
Fazer para regressar janela GLM General factorial, onde se deve
seleccionar para representar graficamente as mdias de cada um dosfactores e das interaces de factores:
Para seleccionar o grfico das mdias de um factor, definir esse factor em
; fazer para adicionar esse grfico; para definir o grfico dasinteraces, seleccionar um factor para Horizontal Axis e outro factor para Separate
Lines. Fazer para continuar.
Optar por para definir os testes de comparaes mltiplas:
-
5/26/2018 SPSS Manual de Utiliza o
104/151
SPSS 6 - Anova
ESACB 102
Fazer para continuar. Seleccionar para seleccionar o clculo deparmetros estatsticos, teste de Levene de homogeneidade de varincias e os intervalosde confiana para as mdias:
Os resultados deste procedimento so os seguintes:
Univariate Analysis of Variance
-
5/26/2018 SPSS Manual de Utiliza o
105/151
SPSS 6 - Anova
ESACB 103
Between-Subjects Factors
IR8 20
IR5 20
C4-63 20
0 kg/ha 12
60 kg/ha 12
90 kg/ha 12
120 kg/ha 12
150 kg/ha 12
1
2
3
Variedade
0
1
2
3
4
Adubao
ValueLabel N
Descriptive Statistics
Dependent Variable: Produo
3124.0000 532.7939 4
4723.5000 171.9874 4
4459.5000 400.2345 4
5717.0000 334.1237 4
5823.0000 208.3235 4
4769.4000 1054.8145 20
3548.0000 540.9054 4
4806.0000 443.6124 4
5436.0000 757.8408 4
5739.5000 494.9542 4
5680.5000 217.5462 45042.0000 957.4259 20
3778.0000 314.1507 4
4753.5000 414.2411 4
5320.0000 501.1640 4
5552.5000 573.7000 4
5886.5000 385.9374 4
5058.1000 855.9827 20
3483.3333 513.9808 12
4761.0000 331.3680 12
5071.8333 689.7728 12
5669.6667 441.1381 12
5796.6667 271.0335 12
4956.5000 952.5245 60
Adubao0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/haTotal
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Total
VariedadeIR8
IR5
C4-63
Total
Mean
Std.
Deviation N
Levene's Test of Equality of Error Variancesa
Dependent Variable: Produo
1.044 14 45 .430F df1 df2 Sig.
Tests the null hypothesis that the error variance of thedependent variable is equal across groups.
Design: Intercept+VARIEDAD+AZOTO+VARIEDAD *AZOTO
a.
-
5/26/2018 SPSS Manual de Utiliza o
106/151
SPSS 6 - Anova
ESACB 104
Tests of Between-Subjects Effects
Dependent Variable: Produo
44578256a 14 3184161.1 16.005 .000
1.47E+09 1 1.47E+09 7409.078 .000
1052784.4 2 526392.200 2.646 .082
41234745 4 10308686 51.816 .000
2290726.3 8 286340.783 1.439 .207
8952613.0 45 198946.956
1.53E+09 60
53530869 59
SourceCorrected Model
Intercept
VARIEDAD
AZOTO
VARIEDAD * AZOTO
Error
Total
Corrected Total
Type IIISum of
Squares df Mean
Square F Sig.
R Squared = .833 (Adjusted R Squared = .781)a.
Estimated Marginal Means1. VariedadeEstimates
Dependent Variable: Produo
4769.400 99.736 4568.521 4970.279
5042.000 99.736 4841.121 5242.879
5058.100 99.736 4857.221 5258.979
VariedadeIR8
IR5
C4-63
Mean Std. Error LowerBound
UpperBound
95% Confidence Interval
Pairwise Comparisons
Dependent Variable: Produo
-272.600 141.049 .060 -556.686 11.486
-288.700* 141.049 .047 -572.786 -4.614
272.600 141.049 .060 -11.486 556.686
-16.100 141.049 .910 -300.186 267.986288.700* 141.049 .047 4.614 572.786
16.100 141.049 .910 -267.986 300.186
(J) VariedadeIR5
C4-63
IR8
C4-63IR8
IR5
(I) VariedadeIR8
IR5
C4-63
MeanDifference
(I-J) Std. Error Sig.aLowerBound
UpperBound
95% Confidence Intervalfor Differencea
Based on estimated marginal means
The mean difference is significant at the .05 level.*.
Adjustment for multiple comparisons: Least Significant Difference (equivalent to noadjustments).
a.
-
5/26/2018 SPSS Manual de Utiliza o
107/151
SPSS 6 - Anova
ESACB 105
Univariate Tests
Dependent Variable: Produo
1052784.4 2 526392.200 2.646 .082
8952613.0 45 198946.956
Contrast
Error
Sum ofSquares df
MeanSquare F Sig.
The F tests the effect of Variedade. This test is based on the linearlyindependent pairwise comparisons among the estimated marginal means.
2. Adubao
Estimates
Dependent Variable: Produo
3483.333 128.759 3223.999 3742.6684761.000 128.759 4501.666 5020.334
5071.833 128.759 4812.499 5331.168
5669.667 128.759 5410.332 5929.001
5796.667 128.759 5537.332 6056.001
Adubao
0 kg/ha60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Mean Std. Error LowerBound
UpperBound
95% Confidence Interval
-
5/26/2018 SPSS Manual de Utiliza o
108/151
SPSS 6 - Anova
ESACB 106
Pairwise Comparisons
Dependent Variable: Produo
-1277.667* 182.093 .000 -1644.421 -910.913
-1588.500* 182.093 .000 -1955.254 -1221.746
-2186.333* 182.093 .000 -2553.087 -1819.579
-2313.333* 182.093 .000 -2680.087 -1946.579
1277.667* 182.093 .000 910.913 1644.421
-310.833 182.093 .095 -677.587 55.921
-908.667* 182.093 .000 -1275.421 -541.913
-1035.667* 182.093 .000 -1402.421 -668.913
1588.500* 182.093 .000 1221.746 1955.254
310.833 182.093 .095 -55.921 677.587
-597.833* 182.093 .002 -964.587 -231.079
-724.833* 182.093 .000 -1091.587 -358.079
2186.333* 182.093 .000 1819.579 2553.087
908.667* 182.093 .000 541.913 1275.421
597.833* 182.093 .002 231.079 964.587
-127.000 182.093 .489 -493.754 239.754
2313.333* 182.093 .000 1946.579 2680.087
1035.667* 182.093 .000 668.913 1402.421
724.833* 182.093 .000 358.079 1091.587
127.000 182.093 .489 -239.754 493.754
(J) Adubao60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
(I) Adubao0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
MeanDifference(I-J) Std. Error Sig.
aLowerBound
UpperBound
95% Confidence Intervalfor Difference
a
Based on estimated marginal means
The mean difference is significant at the .05 level.*.
Adjustment for multiple comparisons: Least Significant Difference (equivalent to noadjustments).
a.
Univariate Tests
Dependent Variable: Produo
41234745 4 10308686 51.816 .000
8952613.0 45 198946.956
Contrast
Error
Sum ofSquares df
MeanSquare F Sig.
The F tests the effect of Adubao. This test is based on the linearlyindependent pairwise comparisons among the estimated marginal means.
-
5/26/2018 SPSS Manual de Utiliza o
109/151
SPSS 6 - Anova
ESACB 107
3. Variedade * Adubao
Dependent Variable: Produo
3124.000 223.017 2674.820 3573.180
4723.500 223.017 4274.320 5172.680
4459.500 223.017 4010.320 4908.680
5717.000 223.017 5267.820 6166.180
5823.000 223.017 5373.820 6272.180
3548.000 223.017 3098.820 3997.180
4806.000 223.017 4356.820 5255.180
5436.000 223.017 4986.820 5885.180
5739.500 223.017 5290.320 6188.680
5680.500 223.017 5231.320 6129.680
3778.000 223.017 3328.820 4227.1804753.500 223.017 4304.320 5202.680
5320.000 223.017 4870.820 5769.180
5552.500 223.017 5103.320 6001.680
5886.500 223.017 5437.320 6335.680
Adubao0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
VariedadeIR8
IR5
C4-63
Mean Std. Error
Lower
Bound
Upper
Bound
95% Confidence Interval
Post Hoc TestsVariedade
Multiple Comparisons
Dependent Variable: Produo
Tukey HSD
-272.6000 141.0486 .141 -614.4488 69.2488
-288.7000 141.0486 .113 -630.5488 53.1488
272.6000 141.0486 .141 -69.2488 614.4488
-16.1000 141.0486 .993 -357.9488 325.7488
288.7000 141.0486 .113 -53.1488 630.5488
16.1000 141.0486 .993 -325.7488 357.9488
(J) VariedadeIR5
C4-63
IR8
C4-63
IR8
IR5
(I) VariedadeIR8
IR5
C4-63
MeanDifference
(I-J) Std. Error Sig.LowerBound
UpperBound
95% Confidence Interval
Based on observed means.
-
5/26/2018 SPSS Manual de Utiliza o
110/151
SPSS 6 - Anova
ESACB 108
Homogeneous SubsetsProduo
Tukey HSDa,b
20 4769.4000
20 5042.0000
20 5058.1000
.113
VariedadeIR8
IR5
C4-63
Sig.
N 1
Subset
Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 198946.956.
Uses Harmonic Mean Sample Size = 20.000.a.
Alpha = .05.b.
AdubaoMultiple Comparisons
Dependent Variable: Produo
Tukey HSD
-1277.6667* 182.0929 .000 -1795.0797 -760.2536
-1588.5000* 182.0929 .000 -2105.9131 -1071.0869
-2186.3333* 182.0929 .000 -2703.7464 -1668.9203
-2313.3333* 182.0929 .000 -2830.7464 -1795.9203
1277.6667* 182.0929 .000 760.2536 1795.0797
-310.8333 182.0929 .440 -828.2464 206.5797
-908.6667* 182.0929 .000 -1426.0797 -391.2536
-1035.6667* 182.0929 .000 -1553.0797 -518.2536
1588.5000* 182.0929 .000 1071.0869 2105.9131
310.8333 182.0929 .440 -206.5797 828.2464
-597.8333* 182.0929 .016 -1115.2464 -80.4203
-724.8333* 182.0929 .002 -1242.2464 -207.4203
2186.3333* 182.0929 .000 1668.9203 2703.7464
908.6667* 182.0929 .000 391.2536 1426.0797
597.8333* 182.0929 .016 80.4203 1115.2464
-127.0000 182.0929 .956 -644.4131 390.4131
2313.3333* 182.0929 .000 1795.9203 2830.7464
1035.6667* 182.0929 .000 518.2536 1553.0797
724.8333* 182.0929 .002 207.4203 1242.2464
127.0000 182.0929 .956 -390.4131 644.4131
(J) Adubao60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
120 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
150 kg/ha
0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
(I) Adubao0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
MeanDifference
(I-J) Std. Error Sig.LowerBound
UpperBound
95% Confidence Interval
Based on observed means.
The mean difference is significant at the .05 level.*.
-
5/26/2018 SPSS Manual de Utiliza o
111/151
SPSS 6 - Anova
ESACB 109
Homogeneous SubsetsProduo
Tukey HSDa,b
12 3483.3333
12 4761.0000
12 5071.8333
12 5669.6667
12 5796.6667
1.000 .440 .956
Adubao0 kg/ha
60 kg/ha
90 kg/ha
120 kg/ha
150 kg/ha
Sig.
N 1 2 3
Subset
Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 198946.956.
Uses Harmonic Mean Sample Size = 12.000.a.
Alpha = .05.b.
Profile Plots
Estimated Marginal Means of Produo
Variedade
C4-63IR5IR8EstimatedMarginalMeans
5100
5000
4900
4800
4700
-
5/26/2018 SPSS Manual de Utiliza o
112/151
SPSS 6 - Anova
ESACB 110
Estimated Marginal Means of Produo
Adubao
150 kg/ha120 kg/ha90 kg/ha60 kg/ha0 kg/haEst
imatedMarginalMeans
6000
5000
4000
3000
Estimated Marginal Means of Produo
Adubao
150 kg/ha120 kg/ha90 kg/ha60 kg/ha0 kg/haEstimatedMarginalMeans
7000
6000
5000
4000
3000
2000
Variedade
IR8
IR5
C4-63
-
5/26/2018 SPSS Manual de Utiliza o
113/151
SPSS 7 - Regresso Linear
ESACB 111
7 - REGRESSO LINEAR
7.1 - INTRODUO
Muitos estudos estatsticos tm como objectivo estabelecer uma relao, traduzida poruma equao, que permite estimar o valor de uma varivel, em funo de outra ououtras variveis.
O caso mais simples traduzir esta relao pela equao de uma recta, quando oacrscimo de uma varivel, designada por dependente e usualmente representada por y,varia linearmente com os acrscimos provocados noutra varivel, designada porindependente, representada por x.
A equao que traduz esta relao bxay (# ou xbby 10(# , em que os parmetros
ou coeficientes so a ordenada na origem, a (ou bo), e o declive, b (ou b1).
Como regra, previamente ao clculo da regresso linear, deve fazer-se uma anlisegrfica aos dados (grfico de disperso ou scatterplot), a fim de ter uma percepovisual da existncia ou no de uma tendncia de dependncia entre as variveis, e comomtodo de detectar possveis observaes outliers ou influentes, que distoram osresultados.
A representao grfica dos dados, num grfico de pontos (scatterplot) ajuda aidentificar algumas situaes em que a equao de regresso linear simples no tem umajustamento perfeito. De seguida, ilustram-se algumas destas situaes.
Na situao 1, a observao assinalada um outlier bi-variado, muito embora no o sejaem relao a cada uma das variveis, j que no observao extrema. Contudo, o par(x,y) est deslocado do contexto geral das restantes observaes. Em relao srestantes observaes, o grfico evidencia uma tendncia segundo uma recta crescente.O utilizador dever verificar os dados e corrigir eventuais registos errneos, ousimplesmente desprezar esta observao e efectuar a regresso com os dados restantes.
Note-se que a incluso desta observao ir provocar uma acentuada variao nodeclive da recta.
-
5/26/2018 SPSS Manual de Utiliza o
114/151
SPSS 7 - Regresso Linear
ESACB 112
Situao 1
0
50
10
Na situao 2 existe uma observao igualmente muito influente em termos do decliveda recta ajustada. Neste caso, a observao assinalada tem tendncia a ser outlier, quer
bi-variado, quer em relao a cada uma das variveis. Alm disso, eliminando estaobservao, resta uma nuvem de pontos, em que no ntida qualquer tendncia derelao entre as variveis.
Situao 2
0
60
10
Na situao 3, a varincia da varivel y no uniforme, ao longo dos valores em x, isto, tomando fatias verticais ao longo do eixo dos xx, a disperso dos valores y vaiaumentando para valores mais elevados de y. Muito embora a normalidade dos dados
no seja um pressuposto obrigatrio para a estimativa da regresso linear, contudonecessrio que os resduos (yobs yest) tenham distribuio normal e varincia constante.
Nesta situao, estes pressupostos so violados, invalidando as inferncias que se faama partir da equao estimada.
-
5/26/2018 SPSS Manual de Utiliza o
115/151
SPSS 7 - Regresso Linear
ESACB 113
Situao 3
0
50
10
A situao 4 ilustra uma forte relao entre x e y, mas no de tipo linear, pelo que oajustamento de uma recta para traduzir esta funo de dependncia errada e semsignificado.
Situao 4
0
12
0 16
Na situao 5 recolheram-se observaes apenas nas zonas extremas do intervalo devariao de x, no existindo dados para valores intermdios da varivel x. A funo deregresso linear nesta situao fortemente influenciada pelos valores extremos, masno traduz a relao que existe para todo o intervalo de x. Na recolha de dados, devehaver a preocupao de que a amostragem cubra todo o intervalo de variao de x, demodo a evidenciar o comportamento da relao no interior desse intervalo.
Situao 5
0
20
0 10
-
5/26/2018 SPSS Manual de Utiliza o
116/151
SPSS 7 - Regresso Linear
ESACB 114
O objectivo da regresso linear estabelecer a funo bxay (# desta recta, que de ummodo muito aproximado permite estimar o valor de y para dado valor de x. O clculodos coeficientes de regresso faz-se pelo mtodo dos mnimos quadrados, que minimiza
a soma dos quadrados dos resduos, isto , minimiza a funo $ %8 & 2yyobs , em quey representa o valor estimado pela equao para dado valor x.
No grfico seguinte representam-se os valores de 24 pares de valores do tipo (x,y), emque no eixo dos xx est representada a varivel % de slidos insolveis em gua e nosyy se representa a % total de slidos, duas caractersticas importantes em molho detomate (adaptado de DERECK PIKE, 19??; os dados so apresentados em anexo):
% insolveis em gua
181716151413121110%s
lidos
nomolho
60
50
40
30
20
evidente a tendncia do decrscimo da % de slidos no molho com o aumento da %de insolveis em gua, segundo uma relao aproximadamente linear. Pretende-seestabelecer esta relao entre as duas variveis, com os objectivos de (i) descrever a
relao entre as caractersticas para este tipo de molho, e (ii) poder estimar ou prever a% de slidos do molho (caracterstica bastante difcil de quantificar) mediante a % deinsolveis em gua que o molho contm (caracterstica relativamente fcil dedeterminar).
A equao de regresso linear uma estatstica, e como tal, tem inerente a componentede erro estatstico. A fim de interpretar a equao estimada, so apresentados uma sriede coeficientes e estatsticas suplementares, que de um modo geral permitem analisar omaior ou menor grau de rigor com que a equao de regresso traduz a relao entre asvariveis em estudo.
Um dos coeficientes associados equao o coeficiente de correlao linear,representado por r, que representa, na escala ]-1, 1[, a correlao ou associao entre as
-
5/26/2018 SPSS Manual de Utiliza o
117/151
SPSS 7 - Regresso Linear
ESACB 115
duas variveis; o quadrado deste coeficiente constitui o coeficiente de correlao total,ou coeficiente de determinao, representado por R2, que traduz, a % de variabilidadeda varivel dependente (y) que explicada pela varivel independente (x).
apresentado o coeficiente de determinao ajustado, que um estimador no
enviezado de R2
(que tende a ser um estimador sobre-avaliado) definido a partir de R2
pela expresso:
1
)1( 222&&
&
pN
RpRRa
em que p o nmero de variveis independentes; no caso da equao de regressolinear simples bxay (# , p=1.
So apresentados os intervalos de confiana para os coeficientes a e b, bem como os
erros-padro e as estatsticas dos seguintes testes de hipteses:
teste referente ao coeficiente a: 0:0: 10 -# aHaH
teste referente ao coeficiente b: 0:0: 10 -# bHbH
O output do procedimento do clculo da equao de regresso apresenta a tabela daanova, que constitui um teste de hipteses existncia ou no de uma relao dedependncia:
0:0:
::
10
10
-#.
bHbH
xdedependeyHxdedependenoyH
A estatstica F tem um valor alto quando a varivel independente ajuda a explicar avariabilidade da varivel dependente.
Alm disso, a tabela da anlise de varincia fornece a mdia da soma dos quadradosdos resduos, cuja raz quadrada o erro padro da estimativa. A equao de regresso to mais ajustada aos dados, quanto menor for o erro padro da estimativa,comparativamente com o desvio padro da varivel dependente.
7.2 - REGRESSO LINEAR SIMPLES
Para proceder ao clculo da equao de regresso linear, executar o seguinteprocedimento7:
StatisticsRegression
7 No exemplo usam-se os dados das caractersticas do molho de tomate, em que as variveis soinsoluve(% de insolveis em gua) e solidos(% total de slidos no molho).
-
5/26/2018 SPSS Manual de Utiliza o
118/151
SPSS 7 - Regresso Linear
ESACB 116
No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,onde se define a varivel dependente (solidos) e a varivel independente (insoluve) paraos respectivos campos:
Seleccionar o boto , que abre a seguinte caixa de dilogo, onde seseleccionam as opes Confidence intervals e Descriptives; as opes Estimates eModel fit esto activadas por defeito:
-
5/26/2018 SPSS Manual de Utiliza o
119/151
SPSS 7 - Regresso Linear
ESACB 117
Fazer a fim de regressar janela Linear Regression, onde se selecciona:
Nesta caixa de dilogo, deve seleccionar e para obtero histograma e o grfico do ajustamento normal dos resduos, a fim de verificar se osresduos seguem distribuio normal (pressuposto para a validade da regresso linear)
para verificar a linearidade e a igualdade de varincia dos resduos, efectuar o grficodos resduos, com os valores estimados standardizados (ZPRED) no eixo dos xx, e os
resduos standardizados (ZRESID) no eixo dos yy. No final, fazer a fim deregressar janela Linear Regression.
O boto d acesso seguinte caixa de dilogo, onde se podem definir critriosde selecco ou remoo de variveis independentes (s tm efeito em regressomltipla):
-
5/26/2018 SPSS Manual de Utiliza o
120/151
SPSS 7 - Regresso Linear
ESACB 118
Os resultados do procedimento so os seguintes:
RegressionDescriptive Statistics
39.7292 5.1826 24
13.7775 1.8995 24
% slidos no molho
% insolveis em gua
MeanStd.
Deviation N
Correlations
1.000 -.970
-.970 1.000
. .000
.000 .
24 24
24 24
% slidos no molho
% insolveis em gua
% slidos no molho
% insolveis em gua
% slidos no molho
% insolveis em gua
Pearson Correlation
Sig. (1-tailed)
N
% slidosno molho
%insolveisem gua
Variables Entered/Removedb
% insolveis em guaa . Enter Model1
Variables EnteredVariablesRemoved Method
All requested variables entered.a.
Dependent Variable: % slidos no molhob.
-
5/26/2018 SPSS Manual de Utiliza o
121/151
SPSS 7 - Regresso Linear
ESACB 119
Model Summaryb
.970a .941 .938 1.2880Model1
R R SquareAdjusted R
Square
Std. Errorof the
Estimate
Predictors: (Constant), % insolveis em guaa.
Dependent Variable: % slidos no molhob.
ANOVAb
581.272 1 581.272 350.378 .000a
36.498 22 1.659
617.770 23
Regression
Residual
Total
Model1
Sum ofSquares df
MeanSquare F Sig.
Predictors: (Constant), % insolveis em guaa.
Dependent Variable: % slidos no molhob.
Coefficientsa
76.193 1.966 38.761 .000 72.117 80.270
-2.647 .141 -.970 -18.718 .000 -2.940 -2.353
(Constant)
% insolveis em gua
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig.LowerBound
UpperBound
95% Confidence Intervalfor B
Dependent Variable: % slidos no molhoa.
Residuals Statisticsa
27.9714 47.8478 39.7292 5.0272 24
-1.5871 3.1522 -3.70E-15 1.2597 24
-2.339 1.615 .000 1.000 24
-1.232 2.447 .000 .978 24
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum MeanStd.
Deviation N
Dependent Variable: % slidos no molhoa.
-
5/26/2018 SPSS Manual de Utiliza o
122/151
SPSS 7 - Regresso Linear
ESACB 120
Charts
Regression Standardized Residual
2.502.001.501.00.500.00-.50-1.00
Histogram
Dependent Variable: % slidos no molho
Freque
ncy
7
6
5
4
3
2
1
0
Std. Dev = .98
Mean = 0.00
N = 24.00
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: % slidos no molho
Observed Cum Prob
1.00.75.50.250.00ExpectedCum
Prob
1.00
.75
.50
.25
0.00
-
5/26/2018 SPSS Manual de Utiliza o
123/151
SPSS 7 - Regresso Linear
ESACB 121
Scatterplot
Dependent Variable: % slidos no molho
Regression Standardized Predicted Value
210-1-2-3RegressionStandardizedResidual
3
2
1
0
-1
-2
A equao da recta estimada xy 647.2193.76 , em que x a % de insolveis emgua e y a % de slidos no molho.
A anlise e interpretao pormenorizadas dos resultados deixam-se a cargo do leitor.Chama-se apenas a ateno para o facto de os resduos estarem ligeiramente
desajustados da distribuio normal, como est evidenciado no histograma (nota-se umacentuado enviezamento esquerda, bem como a falta de resduos numa das classescentrais) e no grfico de ajustamento normal (um perfeito ajustamento traduzido
pela diagonal do grfico; neste caso, os resduos situam-se sistematicamente acima ouabaixo desta linha, em diferentes zonas do grfico). No grfico dos resduosstandardizados versusvalores previstos standardizados nota-se uma tendncia para queos resduos se distribuam segundo uma curva ligeiramente cncava.
Estas anlise dos resduos sugerem que o modelo linear ajustado (equao de uma recta)no o melhor modelo para traduzir a relao entre estas variveis; a distribuio dosresduos indica que o ajustamento de um modelo linear polinomial de 2 ordem, comuma equao do tipo 2cxbxay ((# aumentar a preciso da estimativa (que traduzida pelo coeficiente de determinao R2=0.941).
O ajustamento a uma equao de segundo grau ser abordado no pargrafo seguinte.
7.3 - REGRESSO LINEAR MLTIPLA
Neste pargrafo ser abordada a metodologia de clculo da equao de regresso linear
mltipla, do tipo xnxbxbxbxbby (((((# ...3322110 , em que a varivel resposta oudependente funo de vrias variveis independentes.
-
5/26/2018 SPSS Manual de Utiliza o
124/151
SPSS 7 - Regresso Linear
ESACB 122
Os coeficientes de regresso b1, b2, ..., bntraduzem o declive ou acrscimo na variveldependente provocado pelo acrscimo unitrio de cada uma das variveisindependentes, x1, x2, ..., xn, respectivamente.
A metodologia que se vai abordar serve igualmente para estimar uma equao deregresso linear polinomial, do tipo nnxbxbxbxbby (((((# ...
33
2210 , em que y
depende, no de diversas variveis independentes x1, x2, ..., xn, mas de um polinmio damesma varivel independente x. Neste caso, previamente a efectuar o procedimento daregresso linear, devem gerar-se as variveis correspondentes s potncias x2, x3, ..., xnaincluir no modelo. No pargrafo seguinte ser abordada uma metodologia diferente que
permite o ajustamento de equaes de curvas polinomiais a uma amostra de dados (x,y).
Quando se ajusta um modelo de regresso mltipla, pode acontecer que se justifiqueestatisticamente incluir na equao de regresso todas as variveis independentes, ou
que se incluam apenas algumas destas variveis explanatrias. Esta deciso tomadaem funo da significncia do parmetro de regresso de cada uma das variveis, oupelo acrscimo do coeficiente de determinao, R2, provocado pela incluso dessasvariveis.
De um modo geral, existem duas estratgias a seguir:
(i) comear por incluir todas as variveis, e analisar a contribuio ousignificncia dos coeficientes de regresso de cada uma das variveisindependentes no modelo; eliminar a varivel independente menossignificativa, desde que a sua contribuio seja inferior a determinado limite
(normalmente analisado em termos da estatstica F associada a essa varivelna tabela da anova); recalcular de novo o modelo sem esta varivel e, se forcaso disso, eliminar nova varivel, e assim sucessivamente, at que todas asrestantes variveis independentes sejam significativas para a preciso domodelo. Este tipo de estratgia designa-se por processo backward oustepback.
(ii) comear por calcular um modelo de regresso simples, xbby 10(# ,
incluindo, se for caso disso, apenas a varivel independente cujo coeficientede regresso mais significativo em termos de preciso; analisar asignificncia da prxima varivel independente mais significativa, e inclu-la, se for caso disso; recalcular de novo o modelo; analisar a significncia da
prxima varivel independente mais significativa, e inclu-la, se for casodisso, e assim sucessivamente at que mais nenhuma das variveisindependentes seja significativa. Este tipo de metodologia designa-se por
processo stepwise ou forward.
Pode acontecer que os modelos obtidos por estes dois tipos de metodologias, para amesma amostra de valores, no sejam inteiramente coincidentes, nomeadamente quandoalguma ou algumas das variveis independentes esto muito prximas do limite quedefine a significncia da sua incluso ou no incluso no modelo.
Chama-se a ateno que, por vezes, a incluso de muitas variveis explanatrias nomodelo pouco acrscimo trazem em termos de preciso do modelo, e este fica muito
-
5/26/2018 SPSS Manual de Utiliza o
125/151
SPSS 7 - Regresso Linear
ESACB 123
pouco funcional e muito fictcio ou artificial, isto , muito bem ajustado amostraparticular de valores usados para o clculo da equao, mas pouco adaptvel populao.
Para ilustrar o ajustamento de uma equao de regresso linear mltipla, vamos usar o
seguinte conjunto de dados (adaptado de DRAPPER & SMITH, 1981), em que asvariveis independentes so a temperatura mdia mensal (graus Fahrenheit), a produomensal (toneladas), o nmero de dias teis de trabalho por ms e o nmero deempregados, e a varivel dependente o consumo de gua (m3), observados numadeterminada empresa fabril:
Temperatura(F)
Produomensal
Dias teis doms
Nmero deoperrios
Consumo degua (m3)
58.80 7107.00 20.00 129.00 2967.0065.20 8373.00 20.00 141.00 2828.0070.90 9796.00 20.00 153.00 2891.0077.40 9208.00 20.00 166.00 2994.0079.30 14792.00 22.00 193.00 3282.0081.00 14564.00 23.00 189.00 3498.0071.90 11964.00 21.00 175.00 3302.0063.90 13526.00 22.00 186.00 3260.0054.50 12656.00 21.00 190.00 3211.0039.50 14119.00 21.00 187.00 3286.0044.50 15691.00 22.00 195.00 3432.0043.60 14571.00 23.00 206.00 3425.0056.00 13619.00 22.00 198.00 3256.00
64.70 14575.00 22.00 192.00 3422.0073.00 14556.00 21.00 191.00 3250.0078.90 16573.00 22.00 200.00 3464.0079.40 15618.00 22.00 200.00 3495.0068.40 14346.00 23.00 185.00 3568.00
Pretende-se ajustar uma equao do tipo 443322110 xbxbxbxbby ((((# que permita
estimar o consumo mensal de gua nesta empresa, em funo das variveisindependentes observadas.
Para estimar uma equao de regresso mltipla executar o seguinte procedimento:
StatisticsRegression
-
5/26/2018 SPSS Manual de Utiliza o
126/151
SPSS 7 - Regresso Linear
ESACB 124
No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,onde se definem a varivel dependente e as todas as variveis independentes:
No campo das variveis independentes esto includas todas as variveis explanatrias.O mtodo de clculo seleccionado Enter, que obriga incluso de todas as variveisindependentes no modelo, sejam ou no significativas. Os outros mtodos de clculoso Stepwise e Forward (mtodos de incluso progressiva de variveis independentes),Backward (mtodo de eliminao progressiva de variveis independentes) e Remove(mtodo que calcula o modelo sem incluso de qualquer varivel independente, isto , omodelo resume-se a yy# ):
A fim de comparar diversos modelos de regresso, vamos comear por incluir todas asvariveis independentes, optando pelo mtodo Enter; seguidamente, deve repetir-se ametodologia, e optar por outros mtodos de clculo, nomeadamente Stepwise eBackward.
Seleccionar o boto , e tal como descrito para a regressolinear simples.
Os resultados so os seguintes:
-
5/26/2018 SPSS Manual de Utiliza o
127/151
SPSS 7 - Regresso Linear
ESACB 125
RegressionDescriptive Statistics
3268.3889 218.9502 18
65.0500 13.1334 18
13091.89 2716.3310 18
21.5000 1.0432 18
182.0000 21.3514 18
Consumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
MeanStd.
Deviation N
Correlations
1.000 .013 .894 .901 .831
.013 1.000 -.005 -.022 -.080
.894 -.005 1.000 .811 .939
.901 -.022 .811 1.000 .784
.831 -.080 .939 .784 1.000
. .480 .000 .000 .000
.480 . .493 .466 .377
.000 .493 . .000 .000
.000 .466 .000 . .000
.000 .377 .000 .000 .
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
Consumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal de
gua (m3)Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Pearson Correlation
Sig. (1-tailed)
N
Consumomensal degua (m3)
Temperaturamdia
mensal (F)
Produomensal(Ton)
Dias teisno ms
Nmero deoperrios
Variables Entered/Removedb
Nmero de operrios,Temperatura mdia mensal (F),
Dias teis no ms, Produomensal (Ton)a. Enter
Model1
Variables EnteredVariablesRemoved Method
All requested variables entered.a.
Dependent Variable: Consumo mensal de gua (m3)b.
Model Summaryb
.945a .893 .860 81.8974 .893 27.127 4 13 .000Model1
R R SquareAdjusted R
Square
Std. Errorof the
EstimateR SquareChange F Change df1 df2
Sig. FChange
Change Statistics
Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F), Dias teis no ms, Produo mensal (Ton)
a.
Dependent Variable: Consumo mensal de gua (m3)b.
-
5/26/2018 SPSS Manual de Utiliza o
128/151
SPSS 7 - Regresso Linear
ESACB 126
ANOVAb
727772.930 4 181943.232 27.127 .000a
87193.348 13 6707.181
814966.278 17
Regression
Residual
Total
Model1
Sum ofSquares df
MeanSquare F Sig.
Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F),Dias teis no ms, Produo mensal (Ton)
a.
Dependent Variable: Consumo mensal de gua (m3)b.
Coefficientsa
531.302 619.067 .858 .406 -806.111 1868.714
.232 1.550 .014 .150 .883 -3.117 3.581 .013 .041 .014
5.027E-02 .023 .624 2.166 .049 .000 .100 .894 .515 .197
110.460 32.724 .526 3.376 .005 39.765 181.156 .901 .683 .306
-1.709 2.801 -.167 -.610 .552 -7.759 4.342 .831 -.167 -.055
(Constant)
Temperatura mdia
mensal (F)Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig.LowerBound
UpperBound
95% Confidence Intervalfor B
Zero-order Partial Part
Correlations
Dependent Variable: Consumo mensal de gua (m3)a.
Residuals Statisticsa
2890.9719 3499.8154 3268.3889 206.9062 18
-111.5868 131.9858 1.011E-13 71.6172 18
-1.824 1.119 .000 1.000 18
-1.363 1.612 .000 .874 18
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum MeanStd.
Deviation N
Dependent Variable: Consumo mensal de gua (m3)a.
Charts
Regression Standardized Residual
1.501.00.500.00-.50-1.00-1.50
Histogram
Dependent Variable: Consumo mensal de gua
Frequency
5
4
3
2
1
0
Std. Dev = .87
Mean = 0.00
N = 18.00
-
5/26/2018 SPSS Manual de Utiliza o
129/151
SPSS 7 - Regresso Linear
ESACB 127
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Consumo mensal de gua (m3)
Observed Cum Prob
1.00.75.50.250.00Exp
ectedCum
Prob
1.00
.75
.50
.25
0.00
Scatterplot
Dependent Variable: Consumo mensal de gua (m3)
Regression Standardized Predicted Value
1.51.0.50.0-.5-1.0-1.5-2.0RegressionStandardizedResid
ual
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
A equao do modelo ajustado :
consumo=531.302+0.232temperat+0.05027producao+110.46dias-1.709operario
sendo R2=0.893 e 86.02 #ajustadoR .
Repita-se o processo, optando pelo mtodo de clculo Stepwise. Neste caso, chegar-se-ao modelo:
-
5/26/2018 SPSS Manual de Utiliza o
130/151
SPSS 7 - Regresso Linear
ESACB 128
consumo=443.965+0.03842producao+107.976dias
e R2=0.889 e 874.02 #ajustadoR .
Repare-se que se simplificou o modelo, sem contudo prejudicar a preciso deste comoinstrumento de estimativa da varivel dependente.
De seguida apresentam-se os resultados completos obtidos com o mtodo stepwise, demodo a possibilitar a comparao com o modelo que inclui todas as variveisindependentes:
RegressionDescriptive Statistics
3268.3889 218.9502 18
65.0500 13.1334 18
13091.89 2716.3310 18
21.5000 1.0432 18
182.0000 21.3514 18
Consumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Mean
Std.
Deviation N
Correlations
1.000 .013 .894 .901 .831
.013 1.000 -.005 -.022 -.080
.894 -.005 1.000 .811 .939
.901 -.022 .811 1.000 .784
.831 -.080 .939 .784 1.000
. .480 .000 .000 .000
.480 . .493 .466 .377
.000 .493 . .000 .000
.000 .466 .000 . .000
.000 .377 .000 .000 .
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
18 18 18 18 18
Consumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Consumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operriosConsumo mensal degua (m3)
Temperatura mdiamensal (F)
Produo mensal (Ton)
Dias teis no ms
Nmero de operrios
Pearson Correlation
Sig. (1-tailed)
N
Consumomensal de
gua (m3)
Temperaturamdia
mensal (F)
Produomensal
(Ton)
Dias teis
no ms
Nmero de
operrios
-
5/26/2018 SPSS Manual de Utiliza o
131/151
SPSS 7 - Regresso Linear
ESACB 129
Variables Entered/Removeda
Dias teis noms .
Stepwise (Criteria:Probability-of-F-to-e
nter = .100).
Produomensal (Ton)
.
Stepwise (Criteria:Probability-of-F-to-enter = .100).
Model1
2
VariablesEntered
VariablesRemoved Method
Dependent Variable: Consumo mensal de gua (m3)a.
Model Summaryc
.901a .811 .800 98.0273 .811 68.810 1 16 .000
.943b .889 .874 77.5677 .078 10.554 1 15 .005
Model1
2
R R SquareAdjusted R
Square
Std. Errorof the
EstimateR SquareChange F Change df1 df2
Sig. FChange
Change Statistics
Predictors: (Constant), Dias teis no msa.
Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)b.
Dependent Variable: Consumo mensal de gua (m3)c.
ANOVAc
661216.554 1 661216.554 68.810 .000a
153749.724 16 9609.358
814966.278 17
724715.124 2 362357.562 60.225 .000b
90251.154 15 6016.744
814966.278 17
RegressionResidual
Total
Regression
Residual
Total
Model1
2
Sum ofSquares df
MeanSquare F Sig.
Predictors: (Constant), Dias teis no msa.
Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)b.
Dependent Variable: Consumo mensal de gua (m3)c.
Coefficientsa
-796.273 490.549 -1.623 .124 -1836.190 243.643
189.054 22.791 .901 8.295 .000 140.740 237.369 .901 .901 .901
443.965 544.446 .815 .428 -716.494 1604.425
107.976 30.791 .514 3.507 .003 42.346 173.606 .901 .671 .301
3.842E-02 .012 .477 3.249 .005 .013 .064 .894 .643 .279
(Constant)
Dias teis no ms
(Constant)
Dias teis no ms
Produo mensal (Ton)
Model1
2
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig.LowerBound
UpperBound
95% Confidence Intervalfor B
Zero-order Partial Part
Correlations
Dependent Variable: Consumo mensal de gua (m3)a.
-
5/26/2018 SPSS Manual de Utiliza o
132/151
SPSS 7 - Regresso Linear
ESACB 130
Excluded Variablesc
.032a
.290 .776 .075 1.000
.477a 3.249 .005 .643 .343
.323a 2.017 .062 .462 .385
.026b
.296 .772 .079 .999
-.176b -.683 .506 -.179 .116
Temperatura mdiamensal (F)
Produo mensal (Ton)
Nmero de operrios
Temperatura mdiamensal (F)
Nmero de operrios
Model1
2
Beta In t Sig.Partial
Correlation Tolerance
Collinearity
Statistics
Predictors in the Model: (Constant), Dias teis no msa.
Predictors in the Model: (Constant), Dias teis no ms, Produo mensal (Ton)b.
Dependent Variable: Consumo mensal de gua (m3)c.
Residuals Statisticsa
2876.5112 3487.1743 3268.3889 206.4711 18
-105.6879 130.9278 2.274E-13 72.8621 18
-1.898 1.060 .000 1.000 18
-1.363 1.688 .000 .939 18
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum Maximum MeanStd.
Deviation N
Dependent Variable: Consumo mensal de gua (m3)a.
Charts
Regression Standardized Residual
1.501.00.500.00-.50-1.00-1.50
Histogram
Dependent Variable: Consumo mensal de gua (m3)
Frequency
5
4
3
2
1
0
Std. Dev = .94
Mean = 0.00
N = 18.00
-
5/26/2018 SPSS Manual de Utiliza o
133/151
SPSS 7 - Regresso Linear
ESACB 131
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Consumo mensal de gua (m3)
Observed Cum Prob
1.00.75.50.250.00Exp
ectedCum
Prob
1.00
.75
.50
.25
0.00
Scatterplot
Dependent Variable: Consumo mensal de gua (m3)
Regression Standardized Predicted Value
1.51.0.50.0-.5-1.0-1.5-2.0RegressionStandardizedResid
ual
2.0
1.5
1.0
.5
0.0
-.5
-1.0
-1.5
7.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS
O SPSS dispe de uma rotina que permite o ajustamento de vrios modelos pr-
definidos a uma amostra de valores bi-variados (x,y). Tais modelos so:
-
5/26/2018 SPSS Manual de Utiliza o
134/151
SPSS 7 - Regresso Linear
ESACB 132
! Linear: xbby .10(#
! Quadrtico: 2210 .. xbxbby ((#
! Cbico: 332
210 ... xbxbxbby (((#
! Logartmico: xbby ln.10(#
! Inverso:xbby 10(#
! Potncia: 1.0bxby# . xbby ln.lnln 10(#
! Composto (compound): xbby 10 .# . 10 ln.lnln bxby (#
! Sigmoidal (S): xb
bey
10(
# .x
bby 10ln (#
! Logstico:xbb
u
y
10 .1
1
(
# . $ %10 ln.ln11
ln bxbuy
(#//0
1223
4&
(em que u o limite assimpttico superior, u>0, u>ymax)! Crescimento (growth): xbbey .10(# . xbby .ln 10(#
! Exponencial: xbeby .01.# . xbby .lnln 10(#
Muitos destes modelos so frequentemente usados em modelos economtricos, em quea varivel independente ou causal o decurso do tempo. Se for este o caso, no menuapropriado o utilizador pode definir que x o tempo (ver caixa de dilogo seguinte).
Para exemplificar esta metodologia, vamos usar os dados referentes s caractersticas do
molho de tomate (em anexo). Como anteriormente se viu, o grfico denota uma ligeiracurvatura na zona superior dos valores xx, que faz suspeitar que um modelo polinomialtalvez seja melhor ajustado que o modelo linear simples.
Para tal, fazer:
StatisticsRegression
Neste menu, seleccionar a opo Curve Estimation... que d acesso seguinte caixa dedilogo, onde se definem as variveis dependente (solidos) e independente (insoluve) ese seleccionam os modelos que se pretendem obter, e se define para apresentar a tabela
da anova para cada um dos modelos calculados:
-
5/26/2018 SPSS Manual de Utiliza o
135/151
SPSS 7 - Regresso Linear
ESACB 133
Por defeito, os modelos ajustados incluem a constante (coeficiente b0)
, e apresentado o grfico com os modelos calculados
.
O utilizador pode seleccionar um ou mais modelos, com o objectivo de, pela anlise dos
resultados, nomeadamente R2 e anova, seleccionar o modelo melhor ajustado. Noexemplo, foi solicitado para calcular os modelos linear, quadrtico e cbico. Osresultados so os seguintes:
MODEL: MOD_1.
Dependent var i abl e. . SOLI DOS Method. . LI NEAR
Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 97001R Square . 94092
Adj ust ed R Square . 93823St andard Er r or 1. 28802
Anal ysi s of Var i ance:
DF Sum of Squares Mean Square
Regr essi on 1 581. 27190 581. 27190Resi dual s 22 36. 49768 1. 65899
F = 350. 37794 Si gni f F = . 0000
- - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -
-
5/26/2018 SPSS Manual de Utiliza o
136/151
SPSS 7 - Regresso Linear
ESACB 134
Var i abl e B SE B BetaT Si g T
I NSOLUVE - 2. 646653 . 141393 - . 970010 -
18. 718 . 0000( Const ant ) 76. 193433 1. 96570738. 761 . 0000Dependent var i abl e. . SOLI DOS Met hod. . QUADRATI
Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 98637R Square . 97293Adj ust ed R Square . 97035St andard Er r or . 89243
Anal ysi s of Var i ance:
DF Sum of Squares Mean Square
Regr essi on 2 601. 04440 300. 52220Resi dual s 21 16. 72518 . 79644
F = 377. 33322 Si gni f F = . 0000
- - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -
Var i abl e B SE B BetaT Si g T
I NSOLUVE - 8. 288178 1. 136478 - 3. 037655 -7. 293 . 0000I NSOLUVE**2 . 200730 . 040286 2. 0753704. 983 . 0001( Const ant ) 115. 123024 7. 93094914. 516 . 0000
Dependent var i abl e. . SOLI DOS Method. . CUBI C
Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 98637R Square . 97293Adj ust ed R Square . 97035St andard Er r or . 89243
Anal ysi s of Var i ance:
DF Sum of Squares Mean Square
Regr essi on 2 601. 04440 300. 52220Resi dual s 21 16. 72518 . 79644
-
5/26/2018 SPSS Manual de Utiliza o
137/151
SPSS 7 - Regresso Linear
ESACB 135
F = 377. 33322 Si gni f F = . 0000
- - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -
Var i abl e B SE B BetaT Si g T
I NSOLUVE - 8. 288178 1. 136478 - 3. 037655 -7. 293 . 0000I NSOLUVE**2 . 200730 . 040286 2. 0753704. 983 . 0001( Const ant ) 115. 123024 7. 93094914. 516 . 0000
- - - - - - - - - - - - - - - Var i abl es not i n t he Equat i on - - - - - - - - - - - - -- -
Var i abl e Bet a I n Par t i al Mi n Tol er T Si gT
I NSOLUVE**3 - 4. 796852 - . 214795 1. 368E- 05 - . 984. 3371
Not es:9 Tol erance l i mi t s reached; some dependent var i abl es were
not ent er ed.
% slidos no molho
% insolveis em gua
201816141210
60
50
40
30
20
Observed
Linear
Quadratic
-
5/26/2018 SPSS Manual de Utiliza o
138/151
SPSS 7 - Regresso Linear
ESACB 136
Note-se que ao passar do modelo linear y = 76.1934 2.6467x, R2=0.9409 para omodelo quadrtico y = 115.1230 8.2882x + 0.2007x2, R2=0.9729, h um acrscimosignificativo do ajustamento (Tb2=4.983, significativo; F=377.33 significativo);contudo, ao passar para o modelo cbico, a estatstica Tb3=-0.984 no significativa, enem sequer calculado este modelo, sendo apresentados os resultados do modelo
quadrtico, o que significa que o melhor modelo (dos pedidos) o modelo quadrtico.
-
5/26/2018 SPSS Manual de Utiliza o
139/151
SPSS 8 - Manusear os Resultados
ESACB 136
8 - MANUSEAR OS RESULTADOS
medida que se vo executando tarefas com o SPSS, os resultados vo-se acumulandosucessivamente no Viewer do programa.
A janela do organigrama apresenta a sequncia de resultados, que comeam naidentificao ; cada rotina ou tarefa aparece identificada com uma marcaidentificativa dos resultados, e respectivo contedo; por exemplo, os resultadoscorrespondentes obteno das estatsticas descritivas identificado no organigrama
pelo esquema .
Cada conjunto de resultados comea pela identificao da rotina ou tarefa( ) e com o respectivo contedo; esta rotina apresenta um ttulovisvel (repare que o livro est aberto), e que corresponde linhaDescriptives na janela direita, um conjunto de notas que no esto visveisno output (o livro est fechado), e as estatsticas descritivas visveis na janela deoutput (o livro est aberto). Esta organizao mantm-se para
os resultados das tarefas seguintes.
-
5/26/2018 SPSS Manual de Utiliza o
140/151
SPSS 8 - Manusear os Resultados
ESACB 137
Note que cada rotina tem um conjunto de notas, mas que no esto visualizadas; para asver na janela de output, o utilizador s tem que fazer duplo click sobre , demodo a abrir o livro, e aparecerem as notas na janela direita.
Repare que as notas incluem a data e hora de obteno dos resultados, a localizao doficheiro de dados usado, o nmero de linhas ou casos do ficheiro de dados, indicaessobre a existncia e tratamento de missing values, e as instrues que originaram osresultados (o utilizador gerou estas instrues, ou programa, seleccionando cons e
janelas nos menus do programa; contudo, e para utilizaes mais avanadas, o SPSStem um editor de programas, em que o utilizador constri as rotinas de anlise, como se
de uma linguagem de programao de tratasse). A ltima linha das notas indica o tempode processamento que a CPU do computador levou a executar esta rotina (neste caso,0.99 segundos).
Para fechar o livro de notas, isto , para que as notas no sejam visualizadas nooutput, fazer duplo click sobre .
Para condensar a parte de organigrama correspondente a uma rotina de anlise, fazerclick sobre o boto - esquerda da sua identificao; por exemplo, para condensar oorganigrama das estatsticas descritivas, fazer click sobre
O organigrama fica com o seguinte aspecto:
-
5/26/2018 SPSS Manual de Utiliza o
141/151
SPSS 8 - Manusear os Resultados
ESACB 138
Esta condensao do organigrama tem a vantagem de permitir maior rapidez nalocalizao de determinados conjuntos de resultados, pois o utilizador pode condensar
as partes no relevantes do organigrama, ficando apenas aberta a parte relevante doorganigrama.
Para expandir, fazer duplo click sobre o boto + correspondente
Para visualizar resultados subsequentes, o utilizador pode usar a barra de scroll verticalda janela de resultados, ou simplesmente fazer clik no item respectivo do organigrama.Para ter acesso imediato ao diagrama de extremos-e-quartis referente a todos is valores,
fazer click sobre o item
A