spss manual de utilização

5/26/2018 SPSS Manual de Utiliza o

1/151

ESCOLA SUPERIOR AGRRIAINSTITUTO POLITCNICO DE CASTELO BRANCO

SPSS- MANUAL DE UTILIZAO

ARMANDO MATEUS FERREIRA

Escola Superior Agrria de Castelo Branco, 1999


2/151

SPSS ndice

ESACB i

NDICE

1 - INTRODUO .......................................................................................... 1

2 - EDITOR DE DADOS .............................................................................. 3

2.1 - CRIAR UM FICHEIRO DE DADOS .................................................. 52.1.1 - DEFINIO DE VARIVEIS.................................................................... 52.1.2 - INTRODUO DOS VALORES................................................................ 92.1.3 - GRAVAR O FICHEIRO DE DADOS........................................................ 11

2.1.4 - ABRIR UM FICHEIRO DE DADOS EXISTENTE.................................... 122.1.5 - ACESCENTAR NOVOS CASOS A UM FICHEIRO DE DADOS............... 132.1.6 - ACRESCENTAR NOVAS VARIVEIS...................................................... 142.1.7 - DEFINIR UMA VARIVEL EM FUNO DE OUTRAS......................... 152.1.8 - ELIMINAR LINHAS E VARIVEIS.......................................................... 16

2.2 - IMPORTAO DE FICHEIROS EXTERNOS .............................. 172.2.1 - IMPORTAO DE FICHEIROS LOTUS E EXCEL 4.0 ........................... 172.2.2 - IMPORTAO DE FICHEIROS DE DBASE........................................... 182.2.3 - IMPORTAO DE FICHEIROS EXCEL ................................................. 192.2.4 - IMPORTAO DE FICHEIROS ACCESS............................................... 22

2.2.5 - RECODIFICAO DE VALORES........................................................... 222.2.6 - SELECO DE CASOS........................................................................... 25

3 - ANLISE DE DADOS ......................................................................... 29

3.1 - OBTER ESTATSTICAS DESCRITIVAS ....................................... 293.1.1 - PROCEDIMENTO DESCRIPTIVES........................................................ 293.1.2 - PROCEDIMENTO EXPLORE................................................................. 323.1.3 - PROCEDIMENTO EXPLORE COM FACTORES.................................... 363.1.4 - PROCEDIMENTO FREQUENCIES........................................................ 39

4 - GRFICOS................................................................................................. 44

4.1 - GRFICOS STANDARDIZADOS .................................................... 444.1.1 - GRFICO DE BARRAS........................................................................... 454.1.2 - HISTOGRAMA ........................................................................................ 504.1.3 - GRFICO DE EXTREMOS-E-QUARTIS................................................. 524.1.4 - GRFICO DE BARRA DE ERROS.......................................................... 544.1.5 - GRFICOS DE PROBABILIDADES........................................................ 564.1.6 - GRFICO DE DISPERSO..................................................................... 59

4.2 - EDIO DOS GRFICOS STANDARDIZADOS........................ 624.3 - GRFICOS INTERACTIVOS ............................................................ 65

4.3.1 - GRFICO DE BARRAS........................................................................... 66

4.3.2 - GRFICO DE DISPERSO..................................................................... 704.4 - EDIO DE GRFICOS INTERACTIVOS ................................... 75


3/151

SPSS ndice

ESACB ii

5 - TESTES T ......................................................................................................... 79

5.1 - TESTE T PARA A MDIA DE UMA AMOSTRA...................................... 825.2 - TESTE T PARA DUAS AMOSTRAS INDEPENDENTES......................... 835.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS......................... 86

6 - ANLISE DE VARINCIA ........................................................................... 906.1 - ENSAIOS UNI-FACTORIAIS ...................................................................... 90

6.1.1 - PROCEDIMENTO ONE-WAY ANOVA ................................................. 916.1.2 - PROCEDIMENTO MEANS.................................................................... 96

6.2 - ENSAIOS MULTI-FACTORIAIS................................................................. 99

7 - REGRESSO LINEAR................................................................................. 111

7.1 - INTRODUO............................................................................................ 1117.2 - REGRESSO LINEAR SIMPLES.............................................................. 1157.3 - REGRESSO LINEAR MLTIPLA.......................................................... 1217.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS................................ 131

8 - MANUSEAR OS RESULTADOS................................................................. 136

ANEXOS ..................................................................................................................... 143


4/151

SPSS 1 - Introduo

ESACB 1

1 - INTRODUO

O pakage estatstico SPSS para Windows um poderoso sistema de anlises estatsticas emanuseamento de dados, num ambiente grfico, em que a utilizao mais frequente, para a

maioria das anlises a efectuar, se resume seleco das respectivas opes em menus ecaixas de dilogo. Contudo, o sistema dispe de um editor de comandos, a que o utilizadormais avanado poder recorrer a fim de realizar determinado tipo de anlises maiscomplexas e elaboradas.

De um modo muito sucinto, o sistema SPSS dispe de:

Data Editor: Editor de Dados: uma verstil folha de clculo, que permite definir,introduzir, modificar, corrigir e visualizar a informao. O Data Editor abreautomaticamente quando se entra no SPSS.

Viewer: Janela de Resultados: Todos os resultados estatsticos, tabelas, grficos, sovisualizados numa janela designada por Viewer. Uma janela Viewer abreautomaticamente na primeira vez que o utilizador executar uma tarefa quegera output.

Na figura seguinte apresenta-se o aspecto da janela de resultados referentesao clculo das estatsticas elementares um conjunto de dados (varivel como nome fosfo). O Viewer composto por duas janelas: esquerda est umorganigrama do output; direita esto os resultados propriamente ditos.

Neste exemplo, os resultados incluem as instrues necessrias execuo


5/151

SPSS 1 - Introduo

ESACB 2

da tarefa: o que se designa por Log1, e que composto pelas seguinteslinhas de instrues:

DESCRI PTI VESVARI ABLES=f osf o/ STATI STI CS=MEAN SUM STDDEV VARI ANCE RANGE MI N MAX SEMEAN KURTOSI S SKEWNESS .

Estas instrues foram geradas, no caso, pela seleco de opes nos menusdo programa; contudo, podem ser digitadas, como se de uma linguagem de

programao se tratasse2.

Pivot Tables: Tabelas Dinmicas: O programa dispe de uma potente rotina de gerao detabelas dinmicas (ou pivot tables), que permitem que o utilizador exploreos dados, com o re-arranjo de colunas e linhas.

Grficos: O SPSS permite realizar todos os tipos de grficos usuais em estatstica, afim de realar as anlises efectuadas.

Acesso a Bases de Dados: O SPSS permite o acesso s bases de dados mais usuais, emformato SQL e ODBC, tais como ficheiros de dados criados em dBase,Access, Excel, Lotus, etc. A importao de ficheiros de texto, Access,Excel, feita atravs de um assistente de importao (wizard).

1 O Log pode no estar visvel; s aparece na janela Viewer se se tiver configurado o programa para

mostrar este item.2 O utilizador pode escrever as suas prprias rotinas de anlise; para tal, deve abrir o SPSS Syntax

Editor, janela de edio de comandos do SPSS.


6/151

SPSS 2 - Edio de Dados

ESACB 3

2 - EDITOR DE DADOS

O Data Editor do SPSS um programa do tipo de folha de clculo que permite facilmente

criar ou editar ficheiros de dados. O Data Editor abre automaticamente quando se entra noSPSS.

O aspecto inicial do editor o seguinte:

Muitas das caractersticas do data editor do SPSS so similares s de qualquer folha declculo em ambiente Windows, tal como o Excel.

As colunas correspondem s variveis. Inicialmente, todas as colunas, ou variveis, tem omesmo nome genrico, var, tal como mostrado na imagem. O utilizador ir dar os nomess variveis que definir.

As linhas correspondem aos casos, ou indivduos.

Cada clula contm um valor ou observao de um indivduo, em relao a umadeterminada caracterstica ou varivel. As clulas podem apenas conter valores (numricosou alfanumricos); no possvel, tal como se faz nas folhas de clculo, definir frmulasem clulas. O SPSS permite definir frmulas, mas que afectam integralmente toda umavarivel ou coluna.

O ficheiro de dados rigorosamente rectangular, sendo o seu tamanho definido pelonmero de casos e de variveis. O utilizador pode introduzir valores em clulas fora das


7/151


ESACB 4

fronteiras actuais da folha de clculo; contudo, o SPSS automaticamente acrescenta linhase/colunas de modo a que essa nova observao fique includa dentro da estruturarectangular. A fim de ilustrar este aspecto, considere a seguinte imagem referente a umfolha de dados do SPSS, em que existem duas variveis (com os nomes xe y), com 6 casosou observaes. Repare na posio da clula activa.

Se se introduzir um valor (por exemplo, 25) para esta clula, fora dos limites do ficheirorectangular, o SPSS cria duas novas variveis numricas atribuindo-lhes automaticamenteos nomes var00002 e var00003, e introduz valores em branco para as clulas, de modo aficar um ficheiro rectangular, com 4 variveis e 7 casos (repare que estas clulas tm o

ponto decimal):

Estas clulas, aparentemente vazias, so assumidas pelo SPSS como missing values, isto, observaes em falta para algumas variveis. Contudo, e para j, estas clulas noafectam os clculos estatsticos, caso se se trate de variveis numricas. Por exemplo,calculando a mdia da varivel xobter-se- o valor de 15, como lgico, para os valores

apresentados.


8/151


ESACB 5

2.1 - CRIAR UM FICHEIRO DE DADOS

Vamos usar os seguintes dados a fim de ilustrar como se cria um ficheiro com o Data Editordo SPSS. Trata-se dos resultados de um ensaio, em que se registaram as produes (kg/ha)de arroz, em funo da variedade (V1: IR8; V2: IR5; V3: C4-63) e de 5 nveis de adubaoazotada (N0: 0 kg/ha; N1: 60 kg/ha; N2: 90 kg/ha; N3: 120 kg/ha; N4: 150 kg/ha). Paracada tratamento fizeram-se 4 repeties.

Na imagem seguinte, capturada do Excel, estes dados esto perceptveis para o leitor, eesto estruturados para algumas possveis anlises a executar na folha de clculo; contudo,ao serem introduzidos para um ficheiro SPSS, dever-se-o respeitar as normas deste

programa, de modo a que os dados possam ser analisados.

Variedade Azoto 1 2 3 4N0 3852 2606 3144 2894N1 4788 4936 4562 4608

V1 N2 4576 4454 4884 3924N3 6034 5276 5906 5652N4 5874 5916 5984 5518N0 2846 3794 4108 3444N1 4956 5128 4150 4990

V2 N2 5928 5698 5810 4308N3 5664 5362 6458 5474N4 5458 5546 5786 5932N0 4192 3754 3738 3428N1 5250 4582 4896 4286

V3 N2 5822 4848 5678 4932N3 5888 5524 6042 4756N4 5864 6264 6056 5362

Repetio

Como se referiu atrs, os dados devero ser introduzidos para uma matriz rectangular, emque as colunas so as variveis e as linhas os casos. Neste caso, as variveis so aVariedade, o Azoto, a Repetio e a Produo.

2.1.1 - DEFINIO DE VARIVEIS

Vamos comear por definir estas variveis no SPSS dando-lhes nomes vlidos; as regraspara os nomes das variveis so:

! nome da varivel tem no mximo, 8 caracteres;! nome da varivel deve comear por uma letra; os restantes caracteres podem ser

letras (maisculas ou minsculas so iguais), algarismos, ou os smbolos @, #, _, $.No se podem usar espaos em branco, nem os seguintes caracteres: !, ?, , , *, +, -,%, vrgula, ponto e vrgula, \, /, >, *=5%,concluindo-se assim que os ritmos cardacos em repouso, destas duas amostras, soestatisticamente iguais, para um nvel de significncia de 5%.

O intervalo de confiana a 95% para a diferena entre as mdias [-5.67 , 8.34],podendo teoricamente a diferena ser nula.

5.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS

Pretende-se verificar se existem ou no diferenas significativas entre os ritmoscardacos antes e depois de realizao do exerccio fsico, isto :

0:0:

::

mod1mod0

mod1mod0

-&

.

-#

ritritmoaritritmoa

ritritmoaritritmoa

xxHxxH

xxHxxH

Como anteriormente se fez notar, este teste dever ser efectuando, sem incluir oindivduo n 6, por se suspeitar que o respectivo registo do ritmo cardaco aps

exerccio est errado. Para tal, fazer:

DataSelect Cases...


89/151

SPSS 5 - Testes T

ESACB 87

Pretende-se excluir o caso n 6 da anlise, isto , incluir na anlise todos os casos com

excepo do caso n 6. Para tal, na caixa de dilogo seleccionar , edefinir que se seleccionam para anlise todos os cados diferenntes do caso n 6:

A indicao caso ~= 6 significa todos os casos excepto o caso 6.

O Data Editor do SPSS criou automaticamente uma varivel designada filter_$, em queindica quais os casos seleccionados e os no includos. Repare-se que a linha 6 esttraada, indicando que este caso est excludo de futuras anlises:

Note-se que este procedimento de seleccionar casos no exclusivo nem obrigatrio doprocedimento da comparao de mdias de duas amostras emparelhadas. umprocedimento geral a efectuar previamente a qualquer anlise em que haja necessidadede seleccionar ou excluir casos.

De seguida, passa-se ento comparao das mdias das duas amostras emparelhadas.Tal como o nome indica, deve haver pares de observaes, de modo que ambas asamostras tm o mesmo nmero de observaes.

Para tal, fazer Statistics Compare Means Paired Samples T Test...:


90/151

SPSS 5 - Testes T

ESACB 88

Na caixa de dilogo seguinte, seleccionar as duas variveis emparelhadas cujas mdiasse pretendem comparar:

O boto serve para definir o intervalo de confiana para a diferena entre asduas mdias (por defeito, (1-*)=0.95).

Os resultados so os seguintes:

Paired Samples Statistics

75.44 39 9.08 1.45

137.31 39 12.56 2.01

RITMOA

RITMOD

Pair1

Mean NStd.

DeviationStd. Error

Mean


91/151

SPSS 5 - Testes T

ESACB 89

Paired Samples Correlations

39 .544 .000RITMOA & RITMODPair 1N Correlation Sig.

Paired Samples Test

-61.87 10.78 1.73 -65.36 -58.38 -35.858 38 .000RITMOA - RITMODPair 1Mean

Std.Deviation

Std. ErrorMean Lower Upper

95% ConfidenceInterval of the

Difference

Paired Differences

t dfSig.

(2-tailed) No primeiro quadro so apresentados alguns parmetros estatsticos de cada uma dasamostras. Repare-se que foram s levados em conta 39 observaes em cada amostra.

O quadro seguinte apresenta o valor do coeficiente de correlao de Pearson entre asduas variveis (r=0.544).

No ltimo quadro apresentado o valor de 87.61mod & ritritmoa xx , o intervalo de

confiana para a diferena entre mdias ([-65.36 , -58.38]) e o valor da estatstica deteste t-Student t= -35.858, bem como os graus de liberdade do teste e o valor p-value ouverdaddeiro nvel de significncia (0.000). Como |tcalc| = 35.858 > t(0.05,38)=2.025 (ou p-value=0.000 < *=5%) conclui-se que as mdias so significativamente diferentes.


92/151

SPSS 6 - Anova

ESACB 90

6 - ANLISE DE VARINCIA

6.1 - ENSAIOS UNI-FACTORIAIS

A anlise de varincia uma metodologia estatstica cujo objectivo decidir se existemou no diferenas significativas entre as mdias de vrias amostras de uma varivelnumrica, definidas por diferentes tratamentos ou nveis de influncia de um factor. Estametodologia uma extenso do teste t-Student para duas amostras independentes.

Isto :

mdiasasentreivassignificatdiferenasExistem:... 1321:0 HxxxxH T ,#####

De um modo muito resumido, a metodologia anova calcula a variabilidade totalexistente na caracterstica ou varivel em anlise, e particiona esta variabilidade comosendo devida fundamentalmente a duas causas: uma causa determinista, que o facto deas amostras serem sujeitas a tratamentos distintos (variabilidade entre tratamentos);causas aleatrias ou erro experimental, que engloba todas as restantes fontes devariabilidade, com excepo dos diferentes tratamentos (variabilidade residual ou erroexperimental). Estas variabilidades so estimativas de varincia (entre tratamentos, eresidual, respectivamente). Isto :

Variabilidade Total = Variabilidade entre Tratamentos + Erro Experimental

A estatstica de teste a estatstica F, que uma razo entre varincias, que sob opressuposto de que as observaes tm distribuio normal, segue uma distribuio F deSnedecor:

);;(~Re dennum glglF

sidualVarincia

sTratamentoentreVarinciaF

*#

Se a estatstica F demasiado grande, ento porque a varincia entre tratamentos preponderante em relao varincia residual, isto , os diferentes tratamentos a que aamostra foi sujeita conduz a resultados estatisticamente diferentes.

Na sequncia de uma anlise de varincia em que se conclua que existem diferenassignificativas entre as mdias dos diversos tratamentos em anlise, faz-se um testesuplementar a fim de identificar quais so as mdias estatisticamente diferentes. Osmais usuais so os testes LSD (Least Significant Difference, Diferena MnimaSignificativa), HSD-Tuckey (Honnestly Significant Difference), Scheff, Duncan.

Vamos ilustrar a metodologia de anlise de varincia, usando os valores apresentadosno quadro seguinte, referentes s produes obtidas num ensaio em que se pretende


93/151

SPSS 6 - Anova

ESACB 91

estudar o efeito da densidade de sementeira, na cultura de arroz (variedade IR8).Definiram-se 6 densidades de sementeira (kg/ha de semente). Para cada densidade defizeram-se 4 repeties. Todos os restantes factores de produo foram mantidosconstantes no ensaio (adaptado de GOMEZ & GOMEZ, 1984).

Densidade Repeties25 5113 5398 5307 467850 5346 5952 4719 526475 5272 5713 5483 5049100 5164 4831 4986 4410125 4804 4848 4432 4748150 4254 4542 4919 4098

A anova simples (ensaios uni-factoriais) pode ser executada no SPSS com doisprocedimentos:

6.1.1 - PROCEDIMENTO ONE-WAY ANOVA

Este o procedimento que conduz elaborao tpica da anlise de varincia, e no qual possvel definir a obteno de mais resultados no mbito desta metodologia estatstica.

A partir do menu principal do SPSS, seleccionar:

StatisticsCompare Means...One-Way ANOVA...

Seleccionar para o campo o nome da varivel que contm os valores davarivel que contm os resultados a analisar (no exemplo, producao); no camposelecciona-se a varivel que identifica os diferentes tratamentos (densidad).

Seleccionar a opo para definir qual ou quais os testes de comparao demdias a efectuar na sequncia da anova. Pode seleccionar-se apenas um ou mais testes.


94/151

SPSS 6 - Anova

ESACB 92

No exemplo, pediram-se os testes LSD e Tuckey. O nvel de significncia , por defeito,*=5%, podendo este valor ser definido pelo utilizador:

Fazer , voltando janela One-Way ANOVA, onde se pode seleccionar o boto

a fim de definir clculos adicionais; no caso, pediram-se o clculo dosparmetros estatsticos, a realizao do teste de Levene para verificar se as varinciasdos diferentes tratamentos so homogneas e representar graficamente as mdias dosdiferentes tratamentos:



95/151

SPSS 6 - Anova

ESACB 93

OnewayDescriptives

Produo (kg/ha)

4 5124.0000 320.2093 160.1047 4614.4755 5633.5245 4678.00 5398.00

4 5320.2500 504.7893 252.3947 4517.0176 6123.4824 4719.00 5952.00

4 5379.2500 284.4414 142.2207 4926.6402 5831.8598 5049.00 5713.00

4 4847.7500 321.9900 160.9950 4335.3920 5360.1080 4410.00 5164.00

4 4708.0000 188.4958 94.2479 4408.0611 5007.9389 4432.00 4848.00

4 4453.2500 360.8798 180.4399 3879.0097 5027.4903 4098.00 4919.00

24 4972.0833 455.9256 93.0654 4779.5628 5164.6038 4098.00 5952.00

25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

Total

N MeanStd.

Deviation Std. Error LowerBound

UpperBound

95% Confidence Intervalfor Mean

Minimum Maximum

Test of Homogeneity of Variances

Produo (kg/ha)

.418 5 18 .830

LeveneStatistic df1 df2 Sig.

ANOVA

Produo (kg/ha)

2657880.8 5 531576.167 4.507 .008

2123087.0 18 117949.278

4780967.8 23

Between Groups

Within Groups

Total

Sum ofSquares df

MeanSquare F Sig.


96/151

SPSS 6 - Anova

ESACB 94

Post Hoc TestsMultiple Comparisons

Dependent Variable: Produo (kg/ha)

-196.2500 242.8469 .962 -968.0352 575.5352

-255.2500 242.8469 .894 -1027.0352 516.5352

276.2500 242.8469 .859 -495.5352 1048.0352

416.0000 242.8469 .541 -355.7852 1187.7852

670.7500 242.8469 .111 -101.0352 1442.5352

196.2500 242.8469 .962 -575.5352 968.0352

-59.0000 242.8469 1.000 -830.7852 712.7852

472.5000 242.8469 .408 -299.2852 1244.2852

612.2500 242.8469 .170 -159.5352 1384.0352

867.0000* 242.8469 .023 95.2148 1638.7852

255.2500 242.8469 .894 -516.5352 1027.0352

59.0000 242.8469 1.000 -712.7852 830.7852

531.5000 242.8469 .290 -240.2852 1303.2852

671.2500 242.8469 .110 -100.5352 1443.0352

926.0000* 242.8469 .014 154.2148 1697.7852

-276.2500 242.8469 .859 -1048.0352 495.5352

-472.5000 242.8469 .408 -1244.2852 299.2852

-531.5000 242.8469 .290 -1303.2852 240.2852

139.7500 242.8469 .991 -632.0352 911.5352

394.5000 242.8469 .594 -377.2852 1166.2852

-416.0000 242.8469 .541 -1187.7852 355.7852

-612.2500 242.8469 .170 -1384.0352 159.5352

-671.2500 242.8469 .110 -1443.0352 100.5352

-139.7500 242.8469 .991 -911.5352 632.0352

254.7500 242.8469 .895 -517.0352 1026.5352

-670.7500 242.8469 .111 -1442.5352 101.0352

-867.0000* 242.8469 .023 -1638.7852 -95.2148

-926.0000* 242.8469 .014 -1697.7852 -154.2148

-394.5000 242.8469 .594 -1166.2852 377.2852

-254.7500 242.8469 .895 -1026.5352 517.0352-196.2500 242.8469 .430 -706.4525 313.9525

-255.2500 242.8469 .307 -765.4525 254.9525

276.2500 242.8469 .270 -233.9525 786.4525

416.0000 242.8469 .104 -94.2025 926.2025

670.7500* 242.8469 .013 160.5475 1180.9525

196.2500 242.8469 .430 -313.9525 706.4525

-59.0000 242.8469 .811 -569.2025 451.2025

472.5000 242.8469 .067 -37.7025 982.7025

612.2500* 242.8469 .021 102.0475 1122.4525

867.0000* 242.8469 .002 356.7975 1377.2025

255.2500 242.8469 .307 -254.9525 765.4525

59.0000 242.8469 .811 -451.2025 569.2025

531.5000* 242.8469 .042 21.2975 1041.7025

671.2500* 242.8469 .013 161.0475 1181.4525

926.0000* 242.8469 .001 415.7975 1436.2025-276.2500 242.8469 .270 -786.4525 233.9525

-472.5000 242.8469 .067 -982.7025 37.7025

-531.5000* 242.8469 .042 -1041.7025 -21.2975

139.7500 242.8469 .572 -370.4525 649.9525

394.5000 242.8469 .122 -115.7025 904.7025

-416.0000 242.8469 .104 -926.2025 94.2025

-612.2500* 242.8469 .021 -1122.4525 -102.0475

-671.2500* 242.8469 .013 -1181.4525 -161.0475

-139.7500 242.8469 .572 -649.9525 370.4525

254.7500 242.8469 .308 -255.4525 764.9525

-670.7500* 242.8469 .013 -1180.9525 -160.5475

-867.0000* 242.8469 .002 -1377.2025 -356.7975

-926.0000* 242.8469 .001 -1436.2025 -415.7975

-394.5000 242.8469 .122 -904.7025 115.7025

-254.7500 242.8469 .308 -764.9525 255.4525

(J) Densidade desementeira50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha25 kg/ha

50 kg/ha

75 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

(I) Densidade desementeira25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

100 kg/ha

125 kg/ha

150 kg/ha

Tukey HSD

LSD

Mean

Difference(I-J) Std. Error Sig.

LowerBound

UpperBound

95% Confidence Interval

The mean difference is significant at the .05 level.*.


97/151

SPSS 6 - Anova

ESACB 95

Homogeneous SubsetsProduo (kg/ha)

4 4453.25004 4708.0000 4708.0000

4 4847.7500 4847.7500

4 5124.0000 5124.0000

4 5320.2500

4 5379.2500

.111 .110

Densidade desementeira

150 kg/ha125 kg/ha

100 kg/ha

25 kg/ha

50 kg/ha

75 kg/ha

Sig.

Tukey HSDa

N 1 2

Subset for alpha = .05

Means for groups in homogeneous subsets are displayed.

Uses Harmonic Mean Sample Size = 4.000.a.

Means Plots

Densidade de sementeira

150 kg/ha125 kg/ha100 kg/ha75 kg/ha50 kg/ha25 kg/haMeanofProduo(kg/ha)

5600

5400

5200

5000

4800

4600

4400

O primeiro quadro de resultados contm a mdias, desvio padro e erro padro da mdiae intervalo de confiana da mdia, mnimo e mximo para cada tratamento.

De seguida apresentado o teste de homogeneidade de varincias de Levene:

homogneassonovarinciasAs:: 124

23

22

210 HssssH ###

Como F=0.418 < F(0.05;5;18) =2.77, ou p-value=0.83 > *=0.05, conclui-se que as

varincias so homogneas, isto , dentro de cada um dos tratamentos a variabilidade apenas devida a causas aleatrias.

O quadro que se segue a tabela da anlise de varincia, apresentando a variabilidadeparticionada entre os tratamentos (betwen groups) e residual (within groups). ComoF=4.507 > F(0.05;5;18) =2.77, ou p-value=0.008 < *=0.05, conclui-se que existemdiferenas significativas entre as produes mdias das 6 densidades de sementeira, comum nvel de significncia de 5%.

Contudo, este resultado no nos permite concluir qual ou quais densidades conduzem aprodues mdias significativamente diferentes de outras. Para concluir tal, h queproceder comparao da mdia de cada um dos tratamentos com todas as restantes.esta comparao feita em termos do valor absoluto das diferenas entre mdias: se esta


98/151

SPSS 6 - Anova

ESACB 96

diferena entre duas mdias pequena, ento as mdias no diferem; se a diferena grande, ento as duas mdias so estatisticamente distintas. Este o princpio dequalquer teste de comparaes mltiplas.

Contudo, h que fixar um critrio que defina a fronteira entre o que uma diferena

grande e uma diferena pequena. Este critrio estabelecido por cada um dos testes(LSD, Scheff, Tukey, etc), com base em expresses que relacionam a mdia das somasdos quadrados residual (calculada na tabela anova) e com base em funes dedistribuio de probabilidades.

No quadro dos resultados dos testes de comparaes mltiplas so identificados com osmbolo * quais os tratamentos cujas mdias diferem significativamente. Repare-se queambos os testes acusam como conduzindo a produes mdias diferentes densidades de50 kg/ha e 150 kg/ha (diferena de 867 kg) e 75 kg/ha e 150 kg/ha (diferena de 926kg). Contudo apenas o teste LSD acusa existirem diferenas entre as produesalcanadas com 25 e 150 kg/ha (diferena de 670.75 kg), 50 e 125 kg/ha (diferena de

612.25 kg), 75 e 100 kg/ha (diferena de 531.5 kg).

Isto , o teste LSD acusa como diferentes tratamentos cujas mdias esto menosafastadas do que o teste Tuckey, que d, por assim dizer, maior margem de dvida antesde imputar essas diferenas aos efeitos dos tratamentos.

De seguida aparece um quadro complementar do teste Tukey em que agrupa ostratamentos em grupos homogneos, sendo o critrio de agrupamento o facto de noexistirem diferenas significativas entre os mdias dos tratamentos includos no mesmogrupo. O mesmo tratamento pode pertencer a mais do que um grupo, desde que nodifira dos restantes tratamentos desse grupo. Assim, as densidades de sementeira de150, 125, 100, 25 constituem um grupo de tratamentos, cujas produes mdias so asmais baixas; as densidades de 125, 100, 25, 50, 75 constituem outro grupo, cujas

produes so as mais altas. claro que alguns dos tratamentos densidades de 125, 100,25) pertencem aos dois grupos6.

Em termos absolutos, a densidade de sementeira que conduz a maior produo adensidade de 75 kg/ha; contudo, a produo obtida com a densidade de 50 kg/ha nodifere significativamente da anterior, e pode haver vantagens econmicas em usar estadensidade. Contudo, estas so algumas reflexes de ndole tcnica que competem aoanalista desenvolver, no cabendo propriamente no mbito deste manual.

No final aparece um grfico representado as mdias dos tratamentos, que pode ser tilexplorar no sentido de compreender os resultados, e deles tirar o proveito no mbito daaplicabilidade da Estatstica ao delineamento de ensaios agrcolas.

6.1.2 - PROCEDIMENTO MEANS

A partir do menu principal do SPSS, seleccionar:

6 Deixa-se ao cuidado do leitor a explicao agronmica destas concluses.


99/151

SPSS 6 - Anova

ESACB 97

StatisticsCompare Means...

Means...

Seleccionar para o campo o nome da varivel que contm os valores davarivel a analisar (no exemplo, producao); no campo selecciona-se avarivel que identifica os diferentes tratamentos (densidad).

Seleccionar o boto a fim de pedir a elaborao da tabela da anlise devarincia. Por defeito, so calculados os parmetros mdia e desvio padro; o utilizador

pode seleccionar outras estatsticas a calcular:



100/151

SPSS 6 - Anova

ESACB 98

MeansCase Processing Summary

24 100.0% 0 .0% 24 100.0%Produo (kg/ha) *Densidade desementeira

N Percent N Percent N Percent

Included Excluded Total

Cases

Report

Produo (kg/ha)

5124.0000 4 320.2093

5320.2500 4 504.7893

5379.2500 4 284.44144847.7500 4 321.9900

4708.0000 4 188.4958

4453.2500 4 360.8798

4972.0833 24 455.9256

Densidade desementeira25 kg/ha

50 kg/ha

75 kg/ha100 kg/ha

125 kg/ha

150 kg/ha

Total

Mean NStd.

Deviation

ANOVA Table

2657880.8 5 31576.167 4.507 .008

2123087.0 18 17949.278

4780967.8 23

(Combined)Between

Within Groups

Total

Produo (kg/ha) *Densidade desementeira

Sum ofSquares df

MeanSquare F Sig.

Measures of Association

.746 .556Produo (kg/ha) *Densidade desementeira

EtaEta

Squared

A tabela da anova idntica obtida no procedimento anterior. Contudo, esteprocedimento no permite a obteno dos testes subsequentes que foram obtidos

previamente.

A estatstica Eta-Squared a proporo de varincia da varivel dependente que

explicada pelas diferenas entre os tratamentos; dado pela expressoT

H

SS

SS(isto ,

razo entre Soma dos Quadrados entre tratamentos (SSH) e a Soma dos Quadrados total(SST). A designao de Eta adoptada pelo SPSS no contexto da anova destina-se a nofazer confuso com o coeficiente de determinao, R2, usado no contexto da regressolinear, e que pode ser obtido a partir da tabela da anova da regresso pela expressoanterior.


101/151

SPSS 6 - Anova

ESACB 99

6.2 - ENSAIOS MULTI-FACTORIAIS

Os organismos biolgicos esto simultaneamente expostos a muitos factores decrescimento. A resposta de um organismo a um nico factor de crescimento pode variar

com o nvel de outros factores; assim, os delineamentos uni-factoriais so criticadospelo seu pequeno leque de aplicabilidade. Na realidade, os resultados dos delineamentosuni-factoriais so apenas vlidos para o caso particular (e extremamente difceis deconseguir) de todos os restantes factores serem mantidos constantes.

Neste sentido, quando se espera que a resposta a um factor de interesse varie sobdiferentes nveis de outros factores, devem evitar-se os delineamentos uni-factoriais, econsiderar um delineamento multi-factorial que permita estudar em simultneo dois oumais factores.

Em ensaios factoriais, h a considerar os efeitos de cada um dos nveis de um dos

factores, mantendo os nveis dos outros factores constantes (efeitos simples), os efeitosde cada um dos factores, abstraindo da presena dos outros factores (efeitos principais)e interaco entre os nveis dos diversos factores (interaco entre factores).

Diz-se que existe interaco entre dois factores se a resposta a um dos factores variaconsoante os nveis do outro factor.

A fim de ilustrar o procedimento de clculo da anlise de varincia multi-factorial,vamos usar o ficheiro arroz.sav, em que se pretende verificar a influncia de trsvariedades (IR8, IR5, CA-63) e 5 nveis de adubao azotada (0, 60, 90, 120, 150 kg/ha)na produo de arroz.

StatisticsGeneral Linear Model

GLM General Factorial ...

Na caixa de dilogo seguinte, seleccionar a varivel dependente a analisar (producao) eos factores de produo cuja influncia se pretende analisar (variedade adubacao):


102/151

SPSS 6 - Anova

ESACB 100

De seguida, seleccionar a opo a fim de definir o modelo de anova a

calcular. Por defeito, est seleccionada a opo , que especifica que a tabelada anova apresentar a os efeitos principais de cada factor, bem como as interaces

entre factores. a situao mais usual. Optando por o utilizador pode definirque a anova apresente apenas os efeitos principais, ou apenas algumas das interaces a

definir.

Por defeito, est definido o mtodo de clculo da soma de quadrados (tipo III); para

delineamentos em que no haja missing-values deve definir-se esta metodologia declculo.


103/151

SPSS 6 - Anova

ESACB 101

A opo deve ser seleccionada (por defeito, est activada). Casose assuma que os dados passam pela origem dos eixos (isto , caso a ausncia dosfactores em anlise conduzam a valor zero da varivel dependente), pode omitir-se estaopo. Da sua incluso no modelo resulta a apresentao de mais uma linha inusitada natabela da anova, que traduz a variabilidade associada varivel dependente para osnveis zero dos factores. As restantes linhas da tabela so as usuais.

Fazer para regressar janela GLM General factorial, onde se deve

seleccionar para representar graficamente as mdias de cada um dosfactores e das interaces de factores:

Para seleccionar o grfico das mdias de um factor, definir esse factor em

; fazer para adicionar esse grfico; para definir o grfico dasinteraces, seleccionar um factor para Horizontal Axis e outro factor para Separate

Lines. Fazer para continuar.

Optar por para definir os testes de comparaes mltiplas:


104/151

SPSS 6 - Anova

ESACB 102

Fazer para continuar. Seleccionar para seleccionar o clculo deparmetros estatsticos, teste de Levene de homogeneidade de varincias e os intervalosde confiana para as mdias:

Os resultados deste procedimento so os seguintes:

Univariate Analysis of Variance


105/151

SPSS 6 - Anova

ESACB 103

Between-Subjects Factors

IR8 20

IR5 20

C4-63 20

0 kg/ha 12

60 kg/ha 12

90 kg/ha 12

120 kg/ha 12

150 kg/ha 12

1

2

3

Variedade

0

1

2

3

4

Adubao

ValueLabel N

Descriptive Statistics

Dependent Variable: Produo

3124.0000 532.7939 4

4723.5000 171.9874 4

4459.5000 400.2345 4

5717.0000 334.1237 4

5823.0000 208.3235 4

4769.4000 1054.8145 20

3548.0000 540.9054 4

4806.0000 443.6124 4

5436.0000 757.8408 4

5739.5000 494.9542 4

5680.5000 217.5462 45042.0000 957.4259 20

3778.0000 314.1507 4

4753.5000 414.2411 4

5320.0000 501.1640 4

5552.5000 573.7000 4

5886.5000 385.9374 4

5058.1000 855.9827 20

3483.3333 513.9808 12

4761.0000 331.3680 12

5071.8333 689.7728 12

5669.6667 441.1381 12

5796.6667 271.0335 12

4956.5000 952.5245 60

Adubao0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

Total

0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/haTotal

0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

Total

0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

Total

VariedadeIR8

IR5

C4-63

Total

Mean

Std.

Deviation N

Levene's Test of Equality of Error Variancesa


1.044 14 45 .430F df1 df2 Sig.

Tests the null hypothesis that the error variance of thedependent variable is equal across groups.

Design: Intercept+VARIEDAD+AZOTO+VARIEDAD *AZOTO

a.


106/151

SPSS 6 - Anova

ESACB 104

Tests of Between-Subjects Effects


44578256a 14 3184161.1 16.005 .000

1.47E+09 1 1.47E+09 7409.078 .000

1052784.4 2 526392.200 2.646 .082

41234745 4 10308686 51.816 .000

2290726.3 8 286340.783 1.439 .207

8952613.0 45 198946.956

1.53E+09 60

53530869 59

SourceCorrected Model

Intercept

VARIEDAD

AZOTO

VARIEDAD * AZOTO

Error

Total

Corrected Total

Type IIISum of

Squares df Mean

Square F Sig.

R Squared = .833 (Adjusted R Squared = .781)a.

Estimated Marginal Means1. VariedadeEstimates


4769.400 99.736 4568.521 4970.279

5042.000 99.736 4841.121 5242.879

5058.100 99.736 4857.221 5258.979

VariedadeIR8

IR5

C4-63

Mean Std. Error LowerBound

UpperBound


Pairwise Comparisons


-272.600 141.049 .060 -556.686 11.486

-288.700* 141.049 .047 -572.786 -4.614

272.600 141.049 .060 -11.486 556.686

-16.100 141.049 .910 -300.186 267.986288.700* 141.049 .047 4.614 572.786

16.100 141.049 .910 -267.986 300.186

(J) VariedadeIR5

C4-63

IR8

C4-63IR8

IR5

(I) VariedadeIR8

IR5

C4-63

MeanDifference

(I-J) Std. Error Sig.aLowerBound

UpperBound

95% Confidence Intervalfor Differencea

Based on estimated marginal means


Adjustment for multiple comparisons: Least Significant Difference (equivalent to noadjustments).

a.


107/151

SPSS 6 - Anova

ESACB 105

Univariate Tests


1052784.4 2 526392.200 2.646 .082

8952613.0 45 198946.956

Contrast

Error

Sum ofSquares df

MeanSquare F Sig.

The F tests the effect of Variedade. This test is based on the linearlyindependent pairwise comparisons among the estimated marginal means.

2. Adubao

Estimates


3483.333 128.759 3223.999 3742.6684761.000 128.759 4501.666 5020.334

5071.833 128.759 4812.499 5331.168

5669.667 128.759 5410.332 5929.001

5796.667 128.759 5537.332 6056.001

Adubao

0 kg/ha60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

Mean Std. Error LowerBound

UpperBound



108/151

SPSS 6 - Anova

ESACB 106

Pairwise Comparisons


-1277.667* 182.093 .000 -1644.421 -910.913

-1588.500* 182.093 .000 -1955.254 -1221.746

-2186.333* 182.093 .000 -2553.087 -1819.579

-2313.333* 182.093 .000 -2680.087 -1946.579

1277.667* 182.093 .000 910.913 1644.421

-310.833 182.093 .095 -677.587 55.921

-908.667* 182.093 .000 -1275.421 -541.913

-1035.667* 182.093 .000 -1402.421 -668.913

1588.500* 182.093 .000 1221.746 1955.254

310.833 182.093 .095 -55.921 677.587

-597.833* 182.093 .002 -964.587 -231.079

-724.833* 182.093 .000 -1091.587 -358.079

2186.333* 182.093 .000 1819.579 2553.087

908.667* 182.093 .000 541.913 1275.421

597.833* 182.093 .002 231.079 964.587

-127.000 182.093 .489 -493.754 239.754

2313.333* 182.093 .000 1946.579 2680.087

1035.667* 182.093 .000 668.913 1402.421

724.833* 182.093 .000 358.079 1091.587

127.000 182.093 .489 -239.754 493.754

(J) Adubao60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

90 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

(I) Adubao0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

MeanDifference(I-J) Std. Error Sig.

aLowerBound

UpperBound

95% Confidence Intervalfor Difference

a

Based on estimated marginal means


Adjustment for multiple comparisons: Least Significant Difference (equivalent to noadjustments).

a.

Univariate Tests


41234745 4 10308686 51.816 .000

8952613.0 45 198946.956

Contrast

Error

Sum ofSquares df

MeanSquare F Sig.

The F tests the effect of Adubao. This test is based on the linearlyindependent pairwise comparisons among the estimated marginal means.


109/151

SPSS 6 - Anova

ESACB 107

3. Variedade * Adubao


3124.000 223.017 2674.820 3573.180

4723.500 223.017 4274.320 5172.680

4459.500 223.017 4010.320 4908.680

5717.000 223.017 5267.820 6166.180

5823.000 223.017 5373.820 6272.180

3548.000 223.017 3098.820 3997.180

4806.000 223.017 4356.820 5255.180

5436.000 223.017 4986.820 5885.180

5739.500 223.017 5290.320 6188.680

5680.500 223.017 5231.320 6129.680

3778.000 223.017 3328.820 4227.1804753.500 223.017 4304.320 5202.680

5320.000 223.017 4870.820 5769.180

5552.500 223.017 5103.320 6001.680

5886.500 223.017 5437.320 6335.680

Adubao0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

VariedadeIR8

IR5

C4-63

Mean Std. Error

Lower

Bound

Upper

Bound


Post Hoc TestsVariedade

Multiple Comparisons


Tukey HSD

-272.6000 141.0486 .141 -614.4488 69.2488

-288.7000 141.0486 .113 -630.5488 53.1488

272.6000 141.0486 .141 -69.2488 614.4488

-16.1000 141.0486 .993 -357.9488 325.7488

288.7000 141.0486 .113 -53.1488 630.5488

16.1000 141.0486 .993 -325.7488 357.9488

(J) VariedadeIR5

C4-63

IR8

C4-63

IR8

IR5

(I) VariedadeIR8

IR5

C4-63

MeanDifference

(I-J) Std. Error Sig.LowerBound

UpperBound


Based on observed means.


110/151

SPSS 6 - Anova

ESACB 108

Homogeneous SubsetsProduo

Tukey HSDa,b

20 4769.4000

20 5042.0000

20 5058.1000

.113

VariedadeIR8

IR5

C4-63

Sig.

N 1

Subset

Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 198946.956.


Alpha = .05.b.

AdubaoMultiple Comparisons


Tukey HSD

-1277.6667* 182.0929 .000 -1795.0797 -760.2536

-1588.5000* 182.0929 .000 -2105.9131 -1071.0869

-2186.3333* 182.0929 .000 -2703.7464 -1668.9203

-2313.3333* 182.0929 .000 -2830.7464 -1795.9203

1277.6667* 182.0929 .000 760.2536 1795.0797

-310.8333 182.0929 .440 -828.2464 206.5797

-908.6667* 182.0929 .000 -1426.0797 -391.2536

-1035.6667* 182.0929 .000 -1553.0797 -518.2536

1588.5000* 182.0929 .000 1071.0869 2105.9131

310.8333 182.0929 .440 -206.5797 828.2464

-597.8333* 182.0929 .016 -1115.2464 -80.4203

-724.8333* 182.0929 .002 -1242.2464 -207.4203

2186.3333* 182.0929 .000 1668.9203 2703.7464

908.6667* 182.0929 .000 391.2536 1426.0797

597.8333* 182.0929 .016 80.4203 1115.2464

-127.0000 182.0929 .956 -644.4131 390.4131

2313.3333* 182.0929 .000 1795.9203 2830.7464

1035.6667* 182.0929 .000 518.2536 1553.0797

724.8333* 182.0929 .002 207.4203 1242.2464

127.0000 182.0929 .956 -390.4131 644.4131

(J) Adubao60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

120 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

90 kg/ha

150 kg/ha

0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

(I) Adubao0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

MeanDifference

(I-J) Std. Error Sig.LowerBound

UpperBound


Based on observed means.



111/151

SPSS 6 - Anova

ESACB 109

Homogeneous SubsetsProduo

Tukey HSDa,b

12 3483.3333

12 4761.0000

12 5071.8333

12 5669.6667

12 5796.6667

1.000 .440 .956

Adubao0 kg/ha

60 kg/ha

90 kg/ha

120 kg/ha

150 kg/ha

Sig.

N 1 2 3

Subset

Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 198946.956.


Alpha = .05.b.

Profile Plots

Estimated Marginal Means of Produo

Variedade

C4-63IR5IR8EstimatedMarginalMeans

5100

5000

4900

4800

4700


112/151

SPSS 6 - Anova

ESACB 110


Adubao

150 kg/ha120 kg/ha90 kg/ha60 kg/ha0 kg/haEst

imatedMarginalMeans

6000

5000

4000

3000


Adubao

150 kg/ha120 kg/ha90 kg/ha60 kg/ha0 kg/haEstimatedMarginalMeans

7000

6000

5000

4000

3000

2000

Variedade

IR8

IR5

C4-63


113/151

SPSS 7 - Regresso Linear

ESACB 111

7 - REGRESSO LINEAR

7.1 - INTRODUO

Muitos estudos estatsticos tm como objectivo estabelecer uma relao, traduzida poruma equao, que permite estimar o valor de uma varivel, em funo de outra ououtras variveis.

O caso mais simples traduzir esta relao pela equao de uma recta, quando oacrscimo de uma varivel, designada por dependente e usualmente representada por y,varia linearmente com os acrscimos provocados noutra varivel, designada porindependente, representada por x.

A equao que traduz esta relao bxay (# ou xbby 10(# , em que os parmetros

ou coeficientes so a ordenada na origem, a (ou bo), e o declive, b (ou b1).

Como regra, previamente ao clculo da regresso linear, deve fazer-se uma anlisegrfica aos dados (grfico de disperso ou scatterplot), a fim de ter uma percepovisual da existncia ou no de uma tendncia de dependncia entre as variveis, e comomtodo de detectar possveis observaes outliers ou influentes, que distoram osresultados.

A representao grfica dos dados, num grfico de pontos (scatterplot) ajuda aidentificar algumas situaes em que a equao de regresso linear simples no tem umajustamento perfeito. De seguida, ilustram-se algumas destas situaes.

Na situao 1, a observao assinalada um outlier bi-variado, muito embora no o sejaem relao a cada uma das variveis, j que no observao extrema. Contudo, o par(x,y) est deslocado do contexto geral das restantes observaes. Em relao srestantes observaes, o grfico evidencia uma tendncia segundo uma recta crescente.O utilizador dever verificar os dados e corrigir eventuais registos errneos, ousimplesmente desprezar esta observao e efectuar a regresso com os dados restantes.

Note-se que a incluso desta observao ir provocar uma acentuada variao nodeclive da recta.


114/151


ESACB 112

Situao 1

0

50

10

Na situao 2 existe uma observao igualmente muito influente em termos do decliveda recta ajustada. Neste caso, a observao assinalada tem tendncia a ser outlier, quer

bi-variado, quer em relao a cada uma das variveis. Alm disso, eliminando estaobservao, resta uma nuvem de pontos, em que no ntida qualquer tendncia derelao entre as variveis.

Situao 2

0

60

10

Na situao 3, a varincia da varivel y no uniforme, ao longo dos valores em x, isto, tomando fatias verticais ao longo do eixo dos xx, a disperso dos valores y vaiaumentando para valores mais elevados de y. Muito embora a normalidade dos dados

no seja um pressuposto obrigatrio para a estimativa da regresso linear, contudonecessrio que os resduos (yobs yest) tenham distribuio normal e varincia constante.

Nesta situao, estes pressupostos so violados, invalidando as inferncias que se faama partir da equao estimada.


115/151


ESACB 113

Situao 3

0

50

10

A situao 4 ilustra uma forte relao entre x e y, mas no de tipo linear, pelo que oajustamento de uma recta para traduzir esta funo de dependncia errada e semsignificado.

Situao 4

0

12

0 16

Na situao 5 recolheram-se observaes apenas nas zonas extremas do intervalo devariao de x, no existindo dados para valores intermdios da varivel x. A funo deregresso linear nesta situao fortemente influenciada pelos valores extremos, masno traduz a relao que existe para todo o intervalo de x. Na recolha de dados, devehaver a preocupao de que a amostragem cubra todo o intervalo de variao de x, demodo a evidenciar o comportamento da relao no interior desse intervalo.

Situao 5

0

20

0 10


116/151


ESACB 114

O objectivo da regresso linear estabelecer a funo bxay (# desta recta, que de ummodo muito aproximado permite estimar o valor de y para dado valor de x. O clculodos coeficientes de regresso faz-se pelo mtodo dos mnimos quadrados, que minimiza

a soma dos quadrados dos resduos, isto , minimiza a funo $ %8 & 2yyobs , em quey representa o valor estimado pela equao para dado valor x.

No grfico seguinte representam-se os valores de 24 pares de valores do tipo (x,y), emque no eixo dos xx est representada a varivel % de slidos insolveis em gua e nosyy se representa a % total de slidos, duas caractersticas importantes em molho detomate (adaptado de DERECK PIKE, 19??; os dados so apresentados em anexo):

% insolveis em gua

181716151413121110%s

lidos

nomolho

60

50

40

30

20

evidente a tendncia do decrscimo da % de slidos no molho com o aumento da %de insolveis em gua, segundo uma relao aproximadamente linear. Pretende-seestabelecer esta relao entre as duas variveis, com os objectivos de (i) descrever a

relao entre as caractersticas para este tipo de molho, e (ii) poder estimar ou prever a% de slidos do molho (caracterstica bastante difcil de quantificar) mediante a % deinsolveis em gua que o molho contm (caracterstica relativamente fcil dedeterminar).

A equao de regresso linear uma estatstica, e como tal, tem inerente a componentede erro estatstico. A fim de interpretar a equao estimada, so apresentados uma sriede coeficientes e estatsticas suplementares, que de um modo geral permitem analisar omaior ou menor grau de rigor com que a equao de regresso traduz a relao entre asvariveis em estudo.

Um dos coeficientes associados equao o coeficiente de correlao linear,representado por r, que representa, na escala ]-1, 1[, a correlao ou associao entre as


117/151


ESACB 115

duas variveis; o quadrado deste coeficiente constitui o coeficiente de correlao total,ou coeficiente de determinao, representado por R2, que traduz, a % de variabilidadeda varivel dependente (y) que explicada pela varivel independente (x).

apresentado o coeficiente de determinao ajustado, que um estimador no

enviezado de R2

(que tende a ser um estimador sobre-avaliado) definido a partir de R2

pela expresso:

1

)1( 222&&

&

pN

RpRRa

em que p o nmero de variveis independentes; no caso da equao de regressolinear simples bxay (# , p=1.

So apresentados os intervalos de confiana para os coeficientes a e b, bem como os

erros-padro e as estatsticas dos seguintes testes de hipteses:

teste referente ao coeficiente a: 0:0: 10 -# aHaH

teste referente ao coeficiente b: 0:0: 10 -# bHbH

O output do procedimento do clculo da equao de regresso apresenta a tabela daanova, que constitui um teste de hipteses existncia ou no de uma relao dedependncia:

0:0:

::

10

10

-#.

bHbH

xdedependeyHxdedependenoyH

A estatstica F tem um valor alto quando a varivel independente ajuda a explicar avariabilidade da varivel dependente.

Alm disso, a tabela da anlise de varincia fornece a mdia da soma dos quadradosdos resduos, cuja raz quadrada o erro padro da estimativa. A equao de regresso to mais ajustada aos dados, quanto menor for o erro padro da estimativa,comparativamente com o desvio padro da varivel dependente.

7.2 - REGRESSO LINEAR SIMPLES

Para proceder ao clculo da equao de regresso linear, executar o seguinteprocedimento7:

StatisticsRegression

7 No exemplo usam-se os dados das caractersticas do molho de tomate, em que as variveis soinsoluve(% de insolveis em gua) e solidos(% total de slidos no molho).


118/151


ESACB 116

No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,onde se define a varivel dependente (solidos) e a varivel independente (insoluve) paraos respectivos campos:

Seleccionar o boto , que abre a seguinte caixa de dilogo, onde seseleccionam as opes Confidence intervals e Descriptives; as opes Estimates eModel fit esto activadas por defeito:


119/151


ESACB 117

Fazer a fim de regressar janela Linear Regression, onde se selecciona:

Nesta caixa de dilogo, deve seleccionar e para obtero histograma e o grfico do ajustamento normal dos resduos, a fim de verificar se osresduos seguem distribuio normal (pressuposto para a validade da regresso linear)

para verificar a linearidade e a igualdade de varincia dos resduos, efectuar o grficodos resduos, com os valores estimados standardizados (ZPRED) no eixo dos xx, e os

resduos standardizados (ZRESID) no eixo dos yy. No final, fazer a fim deregressar janela Linear Regression.

O boto d acesso seguinte caixa de dilogo, onde se podem definir critriosde selecco ou remoo de variveis independentes (s tm efeito em regressomltipla):


120/151


ESACB 118

Os resultados do procedimento so os seguintes:

RegressionDescriptive Statistics

39.7292 5.1826 24

13.7775 1.8995 24

% slidos no molho

% insolveis em gua

MeanStd.

Deviation N

Correlations

1.000 -.970

-.970 1.000

. .000

.000 .

24 24

24 24

% slidos no molho

% insolveis em gua

% slidos no molho

% insolveis em gua

% slidos no molho

% insolveis em gua

Pearson Correlation

Sig. (1-tailed)

N

% slidosno molho

%insolveisem gua

Variables Entered/Removedb

% insolveis em guaa . Enter Model1

Variables EnteredVariablesRemoved Method

All requested variables entered.a.

Dependent Variable: % slidos no molhob.


121/151


ESACB 119

Model Summaryb

.970a .941 .938 1.2880Model1

R R SquareAdjusted R

Square

Std. Errorof the

Estimate

Predictors: (Constant), % insolveis em guaa.


ANOVAb

581.272 1 581.272 350.378 .000a

36.498 22 1.659

617.770 23

Regression

Residual

Total

Model1

Sum ofSquares df

MeanSquare F Sig.

Predictors: (Constant), % insolveis em guaa.


Coefficientsa

76.193 1.966 38.761 .000 72.117 80.270

-2.647 .141 -.970 -18.718 .000 -2.940 -2.353

(Constant)

% insolveis em gua

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig.LowerBound

UpperBound

95% Confidence Intervalfor B

Dependent Variable: % slidos no molhoa.

Residuals Statisticsa

27.9714 47.8478 39.7292 5.0272 24

-1.5871 3.1522 -3.70E-15 1.2597 24

-2.339 1.615 .000 1.000 24

-1.232 2.447 .000 .978 24

Predicted Value

Residual

Std. Predicted Value

Std. Residual

Minimum Maximum MeanStd.

Deviation N

Dependent Variable: % slidos no molhoa.


122/151


ESACB 120

Charts

Regression Standardized Residual

2.502.001.501.00.500.00-.50-1.00

Histogram

Dependent Variable: % slidos no molho

Freque

ncy

7

6

5

4

3

2

1

0

Std. Dev = .98

Mean = 0.00

N = 24.00

Normal P-P Plot of Regression Standardized Residual


Observed Cum Prob

1.00.75.50.250.00ExpectedCum

Prob

1.00

.75

.50

.25

0.00


123/151


ESACB 121

Scatterplot


Regression Standardized Predicted Value

210-1-2-3RegressionStandardizedResidual

3

2

1

0

-1

-2

A equao da recta estimada xy 647.2193.76 , em que x a % de insolveis emgua e y a % de slidos no molho.

A anlise e interpretao pormenorizadas dos resultados deixam-se a cargo do leitor.Chama-se apenas a ateno para o facto de os resduos estarem ligeiramente

desajustados da distribuio normal, como est evidenciado no histograma (nota-se umacentuado enviezamento esquerda, bem como a falta de resduos numa das classescentrais) e no grfico de ajustamento normal (um perfeito ajustamento traduzido

pela diagonal do grfico; neste caso, os resduos situam-se sistematicamente acima ouabaixo desta linha, em diferentes zonas do grfico). No grfico dos resduosstandardizados versusvalores previstos standardizados nota-se uma tendncia para queos resduos se distribuam segundo uma curva ligeiramente cncava.

Estas anlise dos resduos sugerem que o modelo linear ajustado (equao de uma recta)no o melhor modelo para traduzir a relao entre estas variveis; a distribuio dosresduos indica que o ajustamento de um modelo linear polinomial de 2 ordem, comuma equao do tipo 2cxbxay ((# aumentar a preciso da estimativa (que traduzida pelo coeficiente de determinao R2=0.941).

O ajustamento a uma equao de segundo grau ser abordado no pargrafo seguinte.

7.3 - REGRESSO LINEAR MLTIPLA

Neste pargrafo ser abordada a metodologia de clculo da equao de regresso linear

mltipla, do tipo xnxbxbxbxbby (((((# ...3322110 , em que a varivel resposta oudependente funo de vrias variveis independentes.


124/151


ESACB 122

Os coeficientes de regresso b1, b2, ..., bntraduzem o declive ou acrscimo na variveldependente provocado pelo acrscimo unitrio de cada uma das variveisindependentes, x1, x2, ..., xn, respectivamente.

A metodologia que se vai abordar serve igualmente para estimar uma equao deregresso linear polinomial, do tipo nnxbxbxbxbby (((((# ...

33

2210 , em que y

depende, no de diversas variveis independentes x1, x2, ..., xn, mas de um polinmio damesma varivel independente x. Neste caso, previamente a efectuar o procedimento daregresso linear, devem gerar-se as variveis correspondentes s potncias x2, x3, ..., xnaincluir no modelo. No pargrafo seguinte ser abordada uma metodologia diferente que

permite o ajustamento de equaes de curvas polinomiais a uma amostra de dados (x,y).

Quando se ajusta um modelo de regresso mltipla, pode acontecer que se justifiqueestatisticamente incluir na equao de regresso todas as variveis independentes, ou

que se incluam apenas algumas destas variveis explanatrias. Esta deciso tomadaem funo da significncia do parmetro de regresso de cada uma das variveis, oupelo acrscimo do coeficiente de determinao, R2, provocado pela incluso dessasvariveis.

De um modo geral, existem duas estratgias a seguir:

(i) comear por incluir todas as variveis, e analisar a contribuio ousignificncia dos coeficientes de regresso de cada uma das variveisindependentes no modelo; eliminar a varivel independente menossignificativa, desde que a sua contribuio seja inferior a determinado limite

(normalmente analisado em termos da estatstica F associada a essa varivelna tabela da anova); recalcular de novo o modelo sem esta varivel e, se forcaso disso, eliminar nova varivel, e assim sucessivamente, at que todas asrestantes variveis independentes sejam significativas para a preciso domodelo. Este tipo de estratgia designa-se por processo backward oustepback.

(ii) comear por calcular um modelo de regresso simples, xbby 10(# ,

incluindo, se for caso disso, apenas a varivel independente cujo coeficientede regresso mais significativo em termos de preciso; analisar asignificncia da prxima varivel independente mais significativa, e inclu-la, se for caso disso; recalcular de novo o modelo; analisar a significncia da

prxima varivel independente mais significativa, e inclu-la, se for casodisso, e assim sucessivamente at que mais nenhuma das variveisindependentes seja significativa. Este tipo de metodologia designa-se por

processo stepwise ou forward.

Pode acontecer que os modelos obtidos por estes dois tipos de metodologias, para amesma amostra de valores, no sejam inteiramente coincidentes, nomeadamente quandoalguma ou algumas das variveis independentes esto muito prximas do limite quedefine a significncia da sua incluso ou no incluso no modelo.

Chama-se a ateno que, por vezes, a incluso de muitas variveis explanatrias nomodelo pouco acrscimo trazem em termos de preciso do modelo, e este fica muito


125/151


ESACB 123

pouco funcional e muito fictcio ou artificial, isto , muito bem ajustado amostraparticular de valores usados para o clculo da equao, mas pouco adaptvel populao.

Para ilustrar o ajustamento de uma equao de regresso linear mltipla, vamos usar o

seguinte conjunto de dados (adaptado de DRAPPER & SMITH, 1981), em que asvariveis independentes so a temperatura mdia mensal (graus Fahrenheit), a produomensal (toneladas), o nmero de dias teis de trabalho por ms e o nmero deempregados, e a varivel dependente o consumo de gua (m3), observados numadeterminada empresa fabril:

Temperatura(F)

Produomensal

Dias teis doms

Nmero deoperrios

Consumo degua (m3)

58.80 7107.00 20.00 129.00 2967.0065.20 8373.00 20.00 141.00 2828.0070.90 9796.00 20.00 153.00 2891.0077.40 9208.00 20.00 166.00 2994.0079.30 14792.00 22.00 193.00 3282.0081.00 14564.00 23.00 189.00 3498.0071.90 11964.00 21.00 175.00 3302.0063.90 13526.00 22.00 186.00 3260.0054.50 12656.00 21.00 190.00 3211.0039.50 14119.00 21.00 187.00 3286.0044.50 15691.00 22.00 195.00 3432.0043.60 14571.00 23.00 206.00 3425.0056.00 13619.00 22.00 198.00 3256.00

64.70 14575.00 22.00 192.00 3422.0073.00 14556.00 21.00 191.00 3250.0078.90 16573.00 22.00 200.00 3464.0079.40 15618.00 22.00 200.00 3495.0068.40 14346.00 23.00 185.00 3568.00

Pretende-se ajustar uma equao do tipo 443322110 xbxbxbxbby ((((# que permita

estimar o consumo mensal de gua nesta empresa, em funo das variveisindependentes observadas.

Para estimar uma equao de regresso mltipla executar o seguinte procedimento:



126/151


ESACB 124

No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,onde se definem a varivel dependente e as todas as variveis independentes:

No campo das variveis independentes esto includas todas as variveis explanatrias.O mtodo de clculo seleccionado Enter, que obriga incluso de todas as variveisindependentes no modelo, sejam ou no significativas. Os outros mtodos de clculoso Stepwise e Forward (mtodos de incluso progressiva de variveis independentes),Backward (mtodo de eliminao progressiva de variveis independentes) e Remove(mtodo que calcula o modelo sem incluso de qualquer varivel independente, isto , omodelo resume-se a yy# ):

A fim de comparar diversos modelos de regresso, vamos comear por incluir todas asvariveis independentes, optando pelo mtodo Enter; seguidamente, deve repetir-se ametodologia, e optar por outros mtodos de clculo, nomeadamente Stepwise eBackward.

Seleccionar o boto , e tal como descrito para a regressolinear simples.



127/151


ESACB 125


3268.3889 218.9502 18

65.0500 13.1334 18

13091.89 2716.3310 18

21.5000 1.0432 18

182.0000 21.3514 18

Consumo mensal degua (m3)

Temperatura mdiamensal (F)

Produo mensal (Ton)

Dias teis no ms

Nmero de operrios

MeanStd.

Deviation N

Correlations

1.000 .013 .894 .901 .831

.013 1.000 -.005 -.022 -.080

.894 -.005 1.000 .811 .939

.901 -.022 .811 1.000 .784

.831 -.080 .939 .784 1.000

. .480 .000 .000 .000

.480 . .493 .466 .377

.000 .493 . .000 .000

.000 .466 .000 . .000

.000 .377 .000 .000 .

18 18 18 18 18

18 18 18 18 18

18 18 18 18 18

18 18 18 18 18

18 18 18 18 18



Produo mensal (Ton)

Dias teis no ms

Nmero de operrios



Produo mensal (Ton)

Dias teis no ms

Nmero de operrios

Consumo mensal de

gua (m3)Temperatura mdiamensal (F)

Produo mensal (Ton)

Dias teis no ms

Nmero de operrios

Pearson Correlation

Sig. (1-tailed)

N

Consumomensal degua (m3)

Temperaturamdia

mensal (F)

Produomensal(Ton)

Dias teisno ms

Nmero deoperrios

Variables Entered/Removedb

Nmero de operrios,Temperatura mdia mensal (F),

Dias teis no ms, Produomensal (Ton)a. Enter

Model1

Variables EnteredVariablesRemoved Method

All requested variables entered.a.

Dependent Variable: Consumo mensal de gua (m3)b.

Model Summaryb

.945a .893 .860 81.8974 .893 27.127 4 13 .000Model1


Square

Std. Errorof the

EstimateR SquareChange F Change df1 df2

Sig. FChange

Change Statistics

Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F), Dias teis no ms, Produo mensal (Ton)

a.



128/151


ESACB 126

ANOVAb

727772.930 4 181943.232 27.127 .000a

87193.348 13 6707.181

814966.278 17

Regression

Residual

Total

Model1

Sum ofSquares df

MeanSquare F Sig.

Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F),Dias teis no ms, Produo mensal (Ton)

a.


Coefficientsa

531.302 619.067 .858 .406 -806.111 1868.714

.232 1.550 .014 .150 .883 -3.117 3.581 .013 .041 .014

5.027E-02 .023 .624 2.166 .049 .000 .100 .894 .515 .197

110.460 32.724 .526 3.376 .005 39.765 181.156 .901 .683 .306

-1.709 2.801 -.167 -.610 .552 -7.759 4.342 .831 -.167 -.055

(Constant)

Temperatura mdia

mensal (F)Produo mensal (Ton)

Dias teis no ms

Nmero de operrios

Model1

B Std. Error


Beta

Standardized

Coefficients

t Sig.LowerBound

UpperBound


Zero-order Partial Part

Correlations

Dependent Variable: Consumo mensal de gua (m3)a.


2890.9719 3499.8154 3268.3889 206.9062 18

-111.5868 131.9858 1.011E-13 71.6172 18

-1.824 1.119 .000 1.000 18

-1.363 1.612 .000 .874 18

Predicted Value

Residual


Std. Residual


Deviation N


Charts


1.501.00.500.00-.50-1.00-1.50

Histogram

Dependent Variable: Consumo mensal de gua

Frequency

5

4

3

2

1

0

Std. Dev = .87

Mean = 0.00

N = 18.00


129/151


ESACB 127


Dependent Variable: Consumo mensal de gua (m3)

Observed Cum Prob

1.00.75.50.250.00Exp

ectedCum

Prob

1.00

.75

.50

.25

0.00

Scatterplot



1.51.0.50.0-.5-1.0-1.5-2.0RegressionStandardizedResid

ual

2.0

1.5

1.0

.5

0.0

-.5

-1.0

-1.5

A equao do modelo ajustado :

consumo=531.302+0.232temperat+0.05027producao+110.46dias-1.709operario

sendo R2=0.893 e 86.02 #ajustadoR .

Repita-se o processo, optando pelo mtodo de clculo Stepwise. Neste caso, chegar-se-ao modelo:


130/151


ESACB 128

consumo=443.965+0.03842producao+107.976dias

e R2=0.889 e 874.02 #ajustadoR .

Repare-se que se simplificou o modelo, sem contudo prejudicar a preciso deste comoinstrumento de estimativa da varivel dependente.

De seguida apresentam-se os resultados completos obtidos com o mtodo stepwise, demodo a possibilitar a comparao com o modelo que inclui todas as variveisindependentes:


3268.3889 218.9502 18

65.0500 13.1334 18

13091.89 2716.3310 18

21.5000 1.0432 18

182.0000 21.3514 18



Produo mensal (Ton)

Dias teis no ms

Nmero de operrios

Mean

Std.

Deviation N

Correlations

1.000 .013 .894 .901 .831

.013 1.000 -.005 -.022 -.080

.894 -.005 1.000 .811 .939

.901 -.022 .811 1.000 .784

.831 -.080 .939 .784 1.000

. .480 .000 .000 .000

.480 . .493 .466 .377

.000 .493 . .000 .000

.000 .466 .000 . .000

.000 .377 .000 .000 .

18 18 18 18 18

18 18 18 18 18

18 18 18 18 18

18 18 18 18 18

18 18 18 18 18



Produo mensal (Ton)

Dias teis no ms

Nmero de operrios



Produo mensal (Ton)

Dias teis no ms

Nmero de operriosConsumo mensal degua (m3)


Produo mensal (Ton)

Dias teis no ms

Nmero de operrios

Pearson Correlation

Sig. (1-tailed)

N

Consumomensal de

gua (m3)

Temperaturamdia

mensal (F)

Produomensal

(Ton)

Dias teis

no ms

Nmero de

operrios


131/151


ESACB 129

Variables Entered/Removeda

Dias teis noms .

Stepwise (Criteria:Probability-of-F-to-e

nter = .100).

Produomensal (Ton)

.

Stepwise (Criteria:Probability-of-F-to-enter = .100).

Model1

2

VariablesEntered

VariablesRemoved Method


Model Summaryc

.901a .811 .800 98.0273 .811 68.810 1 16 .000

.943b .889 .874 77.5677 .078 10.554 1 15 .005

Model1

2


Square

Std. Errorof the

EstimateR SquareChange F Change df1 df2

Sig. FChange

Change Statistics

Predictors: (Constant), Dias teis no msa.

Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)b.

Dependent Variable: Consumo mensal de gua (m3)c.

ANOVAc

661216.554 1 661216.554 68.810 .000a

153749.724 16 9609.358

814966.278 17

724715.124 2 362357.562 60.225 .000b

90251.154 15 6016.744

814966.278 17

RegressionResidual

Total

Regression

Residual

Total

Model1

2

Sum ofSquares df

MeanSquare F Sig.

Predictors: (Constant), Dias teis no msa.

Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)b.


Coefficientsa

-796.273 490.549 -1.623 .124 -1836.190 243.643

189.054 22.791 .901 8.295 .000 140.740 237.369 .901 .901 .901

443.965 544.446 .815 .428 -716.494 1604.425

107.976 30.791 .514 3.507 .003 42.346 173.606 .901 .671 .301

3.842E-02 .012 .477 3.249 .005 .013 .064 .894 .643 .279

(Constant)

Dias teis no ms

(Constant)

Dias teis no ms

Produo mensal (Ton)

Model1

2

B Std. Error


Beta

Standardized

Coefficients

t Sig.LowerBound

UpperBound


Zero-order Partial Part

Correlations



132/151


ESACB 130

Excluded Variablesc

.032a

.290 .776 .075 1.000

.477a 3.249 .005 .643 .343

.323a 2.017 .062 .462 .385

.026b

.296 .772 .079 .999

-.176b -.683 .506 -.179 .116


Produo mensal (Ton)

Nmero de operrios


Nmero de operrios

Model1

2

Beta In t Sig.Partial

Correlation Tolerance

Collinearity

Statistics

Predictors in the Model: (Constant), Dias teis no msa.

Predictors in the Model: (Constant), Dias teis no ms, Produo mensal (Ton)b.



2876.5112 3487.1743 3268.3889 206.4711 18

-105.6879 130.9278 2.274E-13 72.8621 18

-1.898 1.060 .000 1.000 18

-1.363 1.688 .000 .939 18

Predicted Value

Residual


Std. Residual


Deviation N


Charts


1.501.00.500.00-.50-1.00-1.50

Histogram


Frequency

5

4

3

2

1

0

Std. Dev = .94

Mean = 0.00

N = 18.00


133/151


ESACB 131



Observed Cum Prob

1.00.75.50.250.00Exp

ectedCum

Prob

1.00

.75

.50

.25

0.00

Scatterplot



1.51.0.50.0-.5-1.0-1.5-2.0RegressionStandardizedResid

ual

2.0

1.5

1.0

.5

0.0

-.5

-1.0

-1.5

7.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS

O SPSS dispe de uma rotina que permite o ajustamento de vrios modelos pr-

definidos a uma amostra de valores bi-variados (x,y). Tais modelos so:


134/151


ESACB 132

! Linear: xbby .10(#

! Quadrtico: 2210 .. xbxbby ((#

! Cbico: 332

210 ... xbxbxbby (((#

! Logartmico: xbby ln.10(#

! Inverso:xbby 10(#

! Potncia: 1.0bxby# . xbby ln.lnln 10(#

! Composto (compound): xbby 10 .# . 10 ln.lnln bxby (#

! Sigmoidal (S): xb

bey

10(

# .x

bby 10ln (#

! Logstico:xbb

u

y

10 .1

1

(

# . $ %10 ln.ln11

ln bxbuy

(#//0

1223

4&

(em que u o limite assimpttico superior, u>0, u>ymax)! Crescimento (growth): xbbey .10(# . xbby .ln 10(#

! Exponencial: xbeby .01.# . xbby .lnln 10(#

Muitos destes modelos so frequentemente usados em modelos economtricos, em quea varivel independente ou causal o decurso do tempo. Se for este o caso, no menuapropriado o utilizador pode definir que x o tempo (ver caixa de dilogo seguinte).

Para exemplificar esta metodologia, vamos usar os dados referentes s caractersticas do

molho de tomate (em anexo). Como anteriormente se viu, o grfico denota uma ligeiracurvatura na zona superior dos valores xx, que faz suspeitar que um modelo polinomialtalvez seja melhor ajustado que o modelo linear simples.

Para tal, fazer:


Neste menu, seleccionar a opo Curve Estimation... que d acesso seguinte caixa dedilogo, onde se definem as variveis dependente (solidos) e independente (insoluve) ese seleccionam os modelos que se pretendem obter, e se define para apresentar a tabela

da anova para cada um dos modelos calculados:


135/151


ESACB 133

Por defeito, os modelos ajustados incluem a constante (coeficiente b0)

, e apresentado o grfico com os modelos calculados

.

O utilizador pode seleccionar um ou mais modelos, com o objectivo de, pela anlise dos

resultados, nomeadamente R2 e anova, seleccionar o modelo melhor ajustado. Noexemplo, foi solicitado para calcular os modelos linear, quadrtico e cbico. Osresultados so os seguintes:

MODEL: MOD_1.

Dependent var i abl e. . SOLI DOS Method. . LI NEAR

Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 97001R Square . 94092

Adj ust ed R Square . 93823St andard Er r or 1. 28802

Anal ysi s of Var i ance:

DF Sum of Squares Mean Square

Regr essi on 1 581. 27190 581. 27190Resi dual s 22 36. 49768 1. 65899

F = 350. 37794 Si gni f F = . 0000

- - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -


136/151


ESACB 134

Var i abl e B SE B BetaT Si g T

I NSOLUVE - 2. 646653 . 141393 - . 970010 -

18. 718 . 0000( Const ant ) 76. 193433 1. 96570738. 761 . 0000Dependent var i abl e. . SOLI DOS Met hod. . QUADRATI

Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 98637R Square . 97293Adj ust ed R Square . 97035St andard Er r or . 89243



Regr essi on 2 601. 04440 300. 52220Resi dual s 21 16. 72518 . 79644

F = 377. 33322 Si gni f F = . 0000



I NSOLUVE - 8. 288178 1. 136478 - 3. 037655 -7. 293 . 0000I NSOLUVE**2 . 200730 . 040286 2. 0753704. 983 . 0001( Const ant ) 115. 123024 7. 93094914. 516 . 0000

Dependent var i abl e. . SOLI DOS Method. . CUBI C

Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 98637R Square . 97293Adj ust ed R Square . 97035St andard Er r or . 89243



Regr essi on 2 601. 04440 300. 52220Resi dual s 21 16. 72518 . 79644


137/151


ESACB 135

F = 377. 33322 Si gni f F = . 0000



I NSOLUVE - 8. 288178 1. 136478 - 3. 037655 -7. 293 . 0000I NSOLUVE**2 . 200730 . 040286 2. 0753704. 983 . 0001( Const ant ) 115. 123024 7. 93094914. 516 . 0000

- - - - - - - - - - - - - - - Var i abl es not i n t he Equat i on - - - - - - - - - - - - -- -

Var i abl e Bet a I n Par t i al Mi n Tol er T Si gT

I NSOLUVE**3 - 4. 796852 - . 214795 1. 368E- 05 - . 984. 3371

Not es:9 Tol erance l i mi t s reached; some dependent var i abl es were

not ent er ed.

% slidos no molho

% insolveis em gua

201816141210

60

50

40

30

20

Observed

Linear

Quadratic


138/151


ESACB 136

Note-se que ao passar do modelo linear y = 76.1934 2.6467x, R2=0.9409 para omodelo quadrtico y = 115.1230 8.2882x + 0.2007x2, R2=0.9729, h um acrscimosignificativo do ajustamento (Tb2=4.983, significativo; F=377.33 significativo);contudo, ao passar para o modelo cbico, a estatstica Tb3=-0.984 no significativa, enem sequer calculado este modelo, sendo apresentados os resultados do modelo

quadrtico, o que significa que o melhor modelo (dos pedidos) o modelo quadrtico.


139/151

SPSS 8 - Manusear os Resultados

ESACB 136

8 - MANUSEAR OS RESULTADOS

medida que se vo executando tarefas com o SPSS, os resultados vo-se acumulandosucessivamente no Viewer do programa.

A janela do organigrama apresenta a sequncia de resultados, que comeam naidentificao ; cada rotina ou tarefa aparece identificada com uma marcaidentificativa dos resultados, e respectivo contedo; por exemplo, os resultadoscorrespondentes obteno das estatsticas descritivas identificado no organigrama

pelo esquema .

Cada conjunto de resultados comea pela identificao da rotina ou tarefa( ) e com o respectivo contedo; esta rotina apresenta um ttulovisvel (repare que o livro est aberto), e que corresponde linhaDescriptives na janela direita, um conjunto de notas que no esto visveisno output (o livro est fechado), e as estatsticas descritivas visveis na janela deoutput (o livro est aberto). Esta organizao mantm-se para

os resultados das tarefas seguintes.


140/151


ESACB 137

Note que cada rotina tem um conjunto de notas, mas que no esto visualizadas; para asver na janela de output, o utilizador s tem que fazer duplo click sobre , demodo a abrir o livro, e aparecerem as notas na janela direita.

Repare que as notas incluem a data e hora de obteno dos resultados, a localizao doficheiro de dados usado, o nmero de linhas ou casos do ficheiro de dados, indicaessobre a existncia e tratamento de missing values, e as instrues que originaram osresultados (o utilizador gerou estas instrues, ou programa, seleccionando cons e

janelas nos menus do programa; contudo, e para utilizaes mais avanadas, o SPSStem um editor de programas, em que o utilizador constri as rotinas de anlise, como se

de uma linguagem de programao de tratasse). A ltima linha das notas indica o tempode processamento que a CPU do computador levou a executar esta rotina (neste caso,0.99 segundos).

Para fechar o livro de notas, isto , para que as notas no sejam visualizadas nooutput, fazer duplo click sobre .

Para condensar a parte de organigrama correspondente a uma rotina de anlise, fazerclick sobre o boto - esquerda da sua identificao; por exemplo, para condensar oorganigrama das estatsticas descritivas, fazer click sobre

O organigrama fica com o seguinte aspecto:


141/151


ESACB 138

Esta condensao do organigrama tem a vantagem de permitir maior rapidez nalocalizao de determinados conjuntos de resultados, pois o utilizador pode condensar

as partes no relevantes do organigrama, ficando apenas aberta a parte relevante doorganigrama.

Para expandir, fazer duplo click sobre o boto + correspondente

Para visualizar resultados subsequentes, o utilizador pode usar a barra de scroll verticalda janela de resultados, ou simplesmente fazer clik no item respectivo do organigrama.Para ter acesso imediato ao diagrama de extremos-e-quartis referente a todos is valores,

fazer click sobre o item

A

spss manual de utilização

Documents