regresia logistică

29
Florin Sava : Regresia logistică Se aplică în cazul în care variabila dependentă inclusă într-o regresie este măsurată dihotomic sub formele „da” şi „nu”, „corect” sau „incorect”, etc.. Poate fi simplă sau multiplă, cu scop predictiv sau explicativ, cuprinzând efecte simple sau de interacţiune . Modul de lucru este similar regresiei liniare: se pot întâlni variabile numerice, cât şi variabile dummy , ecuaţii de regresie liniare sau neliniare, modele simultane, ierarhice sau în paşi, etc… Exemplu de cercetare: infidelitatea în plan sexual(persoane fidele sau infidele faţă de partenerii de căsătorie. Regresia în scop predictiv: cazul în care cercetătorul caută să găsească un set de variabile care să realizeze o predicţie cât mai corectă a comportamentului în cuplu al partenerilor. Regresie logistică în scop explicativ: interesul se poartă asupra spre factori psihologici care pot explica infidelitatea în funcţie de variabile cu caracter personal sau social precum vârsta, sexul subiectului, statutul subiectului, nivelul de venit, nivelul de educaţie, oportunităţile existente la locul de muncă. Concepte şi principii teoretice. Variabila dependentă este dihotomică, în timp ce variabilele independente pot fi continue sau categoriale. Sunt semnalate cazuri în care variabila dependentă(VD) are mai multe alternative. Regresia logistică încearcă să găsească un model matematic cât mai bun, exprimat printr-o funcţie matematică. RL se aseamănă cu analiza logit , cele două tehnici oferind oferind chiar rezultate identice, însă analiza logit are un caracter 1

Upload: daniel

Post on 25-Nov-2015

709 views

Category:

Documents


25 download

DESCRIPTION

Regresia logistică

TRANSCRIPT

Regresia logistic

Florin Sava : Regresia logistic Se aplic n cazul n care variabila dependent inclus ntr-o regresie este msurat dihotomic sub formele da i nu, corect sau incorect, etc.. Poate fi simpl sau multipl, cu scop predictiv sau explicativ, cuprinznd efecte simple sau de interaciune. Modul de lucru este similar regresiei liniare: se pot ntlni variabile numerice, ct i variabile dummy , ecuaii de regresie liniare sau neliniare, modele simultane, ierarhice sau n pai, etc Exemplu de cercetare: infidelitatea n plan sexual(persoane fidele sau infidele fa de partenerii de cstorie. Regresia n scop predictiv: cazul n care cercettorul caut s gseasc un set de variabile care s realizeze o predicie ct mai corect a comportamentului n cuplu al partenerilor. Regresie logistic n scop explicativ: interesul se poart asupra spre factori psihologici care pot explica infidelitatea n funcie de variabile cu caracter personal sau social precum vrsta, sexul subiectului, statutul subiectului, nivelul de venit, nivelul de educaie, oportunitile existente la locul de munc.Concepte i principii teoretice.

Variabila dependent este dihotomic, n timp ce variabilele independente pot fi continue sau categoriale. Sunt semnalate cazuri n care variabila dependent(VD) are mai multe alternative. Regresia logistic ncearc s gseasc un model matematic ct mai bun, exprimat printr-o funcie matematic. RL se aseamn cu analiza logit , cele dou tehnici oferind oferind chiar rezultate identice, ns analiza logit are un caracter mai restrictiv, deoarece toi predictorii trebuie s fie msurai prin scale de tip nominal. Difererene ntre regresia liniar i RL:a. Spre deosebire de regresia liniar, nu exist condiia de liniaritate ntre VI i VD, nu exist condiia ca VI s fie distribuit normal, fiind astfel mai uor de aplicat. RL - metod foarte robust i util;b. Din punct de vedere tehnic regresia logistic se bazeaz pe metoda estimrii varosimilitii maxime Maximum likelihood estimation - i nu prin metoda celor mai mici ptrate;

c. n regresia liniar, cunoaterea VI duce la predicia VD, n RL, cunoaterea VI duce la determinarea (predicia) unei probabiliti pentru fiecare dintre cele dou rspunsuri posibile ale VD. Pe baza ecuaiei de regresie logistic se poate estima probabilitatea, pentru fiecare subiect n parte, de a se comporta ntr/un mod fidel sau infidel. Dei are aparent o form liniar, criteriul estimat este o variabil logit, de numire care vine de la faptul c VD din ecuaie este logaritmul natural al unei valori ce intr n calculul probabilitii de a se ntmpla un eveniment sau altul.Precizri metodologice1. Categorii VD trebuie s fie reciproc exclusive. 2. Datele trebuie s fie independente unele de altele - nu se pot include datele de la acelaii subiect n perioade de timp diferite.3. Modelul logistic trebuie s cuprind VI semnificative din punct de vedere teoretic pentru relaia cu VD. Includerea unor VI care nu au legtur cu VD poate conduce la erori de estimare a coeficienilor logit. n plus, pot aprea corelaii false ntre VI i VD, caz n care este afectat calitatea modelului.4. Utilizarea metodei de estimare a verosimilitii maxime necesit un numr mai mare de subieci dect la utilizarea metodei celor mai mici ptrate. Pentru eantioane mici, testarea ipotezelor statistice poate fi inadecvat. Cel puin 50 de subieci pentru fiecare variabil predictor. La cercetri cu peste 300 de subieci, se ajunge la 20-30 de subieci pentru fiecare predictor.Modelul regresiei logisticeExemplul: cnd era mai bine: nainte sau dup 1989?

Modelul ecuaie de regresie liniar: Y = b0 + b1* X Modelul regresiei logistice simple: ln(y)=b0+b1*X sau y = exp(b0 + b1Xn care y este ansa sau raportul dintre posibilitatea de a rspunde 1(era mai bine de 1989) i probabilitatea de a rspunde 0(era mai ru nainte de 1989). Adic, ln[p/(1-p)]; b0 i b1 sunt coeficienii logit corespunztori coeficienilor de regresie( b0 fiind asociat interceptului, iar b1 fiind asociat pantei de regresie determinat de predictorul X)Raportul ia valoare 1 cnd exist o egalitate ntre cele dou probabiliti. Devine supraunitar cnd exist mai multe anse s se ntmple situaia 1 i subunitar cnd exist mai multe anse de a se prezice varianta 0. Trebuie fcut diferenierea ntre probabiliti, anse i raportul anselor. n regresia logistic dihotomic, ansele unui subiect de a intra n categoria 1(era mai bine nainte de 1989) sunt egale cu raportul dintre probabilitatea de a fi inclus n acea categorie i probabilitatea de a aparine celeilalte categorii. Raportul se inverseaz dac dorim ansele cazului de a in categoria 0. Probabilitile pot lua valori ntre 0 i 1, Rn timp ce ansele variaz de la 0 la infinit. Avem la dispoziie formula lui R.E. WRIGHT.

Unde p = probabilitatea de a se petrece evenimentul 1; e simbolizeaz exponentul, iar y ia diferite valori n funcie de tipul de ecuaie logistic.y = b0+b1*X - pentru regresia logistic simpl;

y = b0+b1*X1+b2*X2 - pentru regresia logistic multipl

Exemplu: persoan de 20 de ani; valoare intercept = -1,02; coeficientul logit al variabilei vrst(b1) este de 0,03. Obinem: y=-1,02+0,03*20 = -0,42 Deoarece y= exp(b0+b1*X), exponentul valorii y de -0,42 este 0,657. Se poate nlocui n formul pentru a afla probabilitatea ca un tnr de 20 de ani s afirme varianta 1

Pentru persoan de 50 de ani:y= - 1,02+0,03*50=0,48, exp (y)=1,61

Decizia de a fi inclus ntr-o categorie sau alta se face avnd criteriul limit o probabilitate de 50, ns aceast valoare poate fi modificat n funcie de caracteristicile VD i de frecvena real a alternativelor de rspuns.

Pe baza probabilitilor putem stabili ansele de a fi inclus ntr-o categorie sau alta. Astfel, pentru tnr se poate afirma c exist de 1,5(0,604/0,396) ori mai multe anse c este mai bine acum. Aceleai anse le are o persoan de 50 de ani de a afirma c era mai bine nainte(0,616/0,384).Un concept esenial n regresia logistic este cel de raport al anselor. El estimeaaz schimbrile intervenite n ansa de a fi inclus n prima categorie, atunci cnd variabila predictor crete cu o unitate. Pentru a-l calcula avem nevoie de coeficientul logit al variabili predictor n cauz.

Exemplu: pentru alt predictor (numrul de copii) avem un parametru b=0,50. Pentru raportul anselor se va calcula exponent din valoarea acestuia:

e0,50 =1,64 Interpretare: un individ cu doi copii are de 1,64 ori mai multe anse s afirme c era mai bine nainte n comparaie cu o persoan cu un singur copil(VI crete cu o unitate). n cazul mai multor VI incluse n model se specific sintagmapstrnd celelalte variabile constante Raportul anselor poate fi calculat i pentru modificri ale VI mai mari de o unitate. Exemplu: comparaie o persoan cu 5 copii cu o alta care are un copil. Diferena este explicat astrfel: e4*0,50=7,38n interpretarea coeficienilor logit obinui inem seama de raportul de anse, i nu de probabiliti,

Probabilitile nu sunt eficiente , deoarece au valori diferite la variaii constante ale fiecrui predictor. n general, probabilitile se modific mai mult pentru valorile medii ale VI i mai puin pentru cele extreme.

Exemplu: La un intercept b0=-1,02 i un coeficient logit b1=0,50 pentru variabila numr copii , probabilitatea nu se modific uniform cnd VI crete cu o unitate. Probabilitatea unei persoane cu un copil de a afirma c era mai bine nainte de 89 este de 0,37, pe cnd cea a unei persoane cu doi copii este 0,49, diferena fiind de 0,12. ns, probabilitatea unui subiect cu 5 copii devine 0,81 i a unuia cu 6 copii devine 0,87, diferena fiind de doar 0,06Acest fapt se datoreaz formei neliniare a regresiei logistice, care are o form de S(curba de regresie logistic). Fiecare combinaie de coeficieni logit cu interceptul produce o modificare a formei acesteia. n funcie de valorile coeficientului logit al VI se modific panta curbei i direcia acesteia.Panta arat ct de bine poate discrimina coeficientul logit luat n calcul. Cu ct este mai abrupt, cu att variabila predictor intervine mai mult n vederea modificrii probabilitilor VD. Un coeficient logit egal cu 0 (b=0) nu va influena n nici un fel modificarea probabilitilor atunci cnd variabila predictor va lua valori diferite. n aceast situaie, curba se transform ntr-o linie orizontal.Pentru valori pozitive ale coeficientului logit, curba crete dinspre dinspre stnga spre dreapta. Semnificaia acestei situaii este c valorile mici ale predictorului determin o probabilitate mai mic de a se ntmpla evenimentul 1, iar valorile mai mari cresc aceast probabilitate. Situaia se inverseaz dac obinem un coeficient logit negativ.. Curba de regresie va crete dinspre dreapta spre stnga, ceea ce semnific faptul c valorile mari ale predictorului determin probabilitate mic de apariie a evenimentului 1.i invers. O valoare b=-1,5 va produce o curb invers fa de curba rezultat de la un coeficient logit b=1,5. Remarc: curba nu va depi niciodat probabilitatea 1 i nu va cdea sub probabilitatea 0, chiar n cazul existenei valorilor extreme.Estimarea modelelor logistice. Paii regresiei logistice.

Exemplu: factori care influeneaz naterea unor copii snatoi: ancheta mamelor pe 125 de nateri cu privire la 4 factori(vrsta mamei, existena n familie a unor malformaii genetice, consumul de alcool n perioada naterii i stresul cotidian perceput).

Cale SPSS: Analyse Regresion Binary LogisticCe se poate face cu regresia logistic?:

Poate testa dac un model este semnificativ statistic;

Poate compara dou modele ntre ele;

Poate stabili eficiena modelului ales;

Poate interpreta coeficieni logit semnificativi din modelul ales; Poate stabili profiluri ideale pe baza ecuaiei logistice obinute.Testarea modelelor explicative logistice.Trei metode pentru testarea semnificaiei statistice a unui model:

1. Testul G2 al rapoartelor de verosimilitate(exprimarea n englez: chi-square likelihood test)

2. Testul Hosmer and Lemershow de msurare a adecvrii(n englez Hosmer and Lemershows Goodness of Fit Test)3. Criteriul bayesian ajustat de informare notat cu BIC( Adjusted Bayesian Infornation Criterion)A.Testul G2 al rapoartelor de verosimilitate

O variant a testului chi ptrat cu proprieti care-l fac mai potrivitpentru a identifica modelele explicative optime. nelegerea necesit cunoaterea ctorva concepte:

Log-likelihood(LL) este un logaritm calculat prin iteraii utiliznd metoda verosimilitii maxime. Valori negative, 0 obinndu-se doar dac verosimilitatea este 1. Din acest motiv se prefer utilizarea abaterii -2 LL care este egal cu dublul LL cu semnul minus pentru a se obine valori pozitive.. Este o modalitate de lucru n SPSS. Hi ptrat iniial msoar erorile asociate cu modelul explicativ propus n situaia n care singurul parametru inclus este interceptul. Notare: -2LLnull sau elog likelihood iniial Hi ptrat ca msur a nepotrivirii Notare: -2LLmodel sau -2log likelihood. Reflect erorile asociate cu modelul explicativ propus cnd includem att interceptul ct i toate VI dorite de cercettor. Testul rapoartelor de verosimilitate se noteaz cu G2 i este un hi ptrat al modelului. Este principalul indicator care ne indic n ce msur modelul explicativ propus este sau nu semnificativ statistic. Se obine prin formula: G2 = (-2LLnull)- 2LLmodel. G2 testeaz ipoteza nul conform creia nici o VI nu este asociat cu logaritmul anselor ca VD s ia valoarea 0 sau 1. Adic, dac toi coeficienii logit ai VI, exceptnd interceptul sunt 0. Testul G2 msoar modelul n ansamblu i nu se refer la fiecare coeficient logit n parte. Acetia sunt verificai prin testul Wald sau alte probe similare. Testul G2 urmeaz o distribuie 2(numrul gradelor de libertate = nr. VI incluse n model). Dac G2 este semnificativ statistic(p.854. Valoarea este nesemnificativ statistic, ceea ce nseamn c introducerea variabileistresul perceput nu a adus mbuntiri suficiente modelului. Formula de calcul:Step 2=G2Model 2 - G2 Model 1Modelul 2 este totdeauna modelul cu mai puini predictori inclui.

Se poate calcula i diferena absolut dintre valorile BIC ale celor dou modele.

BIC1 = -54,501*3*ln N = -40,01BIC2 = -54,535*4*lnN=35,22

|BIC1-BIC2|= 4,79

Primul model este preferabil (probabilitate ntre .75 i .95 ca primul model s fie mai bu dect al doilea. n comparaia dintre dou modele trebuie s adoptm i punctul de vedere teoretic. Tehnicile statistice anterioare tind s prefere modelele ce dau dovad de parcimonie n dauna altora mai complexe. Dac exist numeroase argumente care s ne fac s credem c o anumit VI trebuie pstrat, n pofida aparenelor matematice, putem face acest lucru. n exemplu, cazul variabilei stresul perceput. Decizia rmne la latitudinea cercettorului. De obicei, n regresiile cu scop predictiv, asemenea variabile sunt eliminate, deoarece obiectivul major este de a estima ct mai corect probabilitatea subiecilor de a rspunde 1 sau 0 la criteriu.

Stabilirea eficienei explicative a modelului alesModelele pot trece pragul testrii ipotezei statistice mai ales n cazul unor eantioane foarte mari.. Exist indicatori, cu rol similar lui R2 din regresia liniar care arat n ce msur VI influeneaz variaia VD, indicnd mrimea efectului. Cinci indicatori:

Pseudo-R2;

R2 al lui McFadden;

R2 al lui Cox i Snell ;

R3 al lui Nagelkerke;

R2 de stabilire a proporiilor.Indicatorii explic modificarea probabilitii VD de a fi = sau 1, n funcie de variaia VI. Indicatorii nu testeaz o ipotez nul, ci evalueaz gradul de asociere ntre VI i VD

Pseudo R2 este un coeficient dezvoltat de Aldrich i Nelson, are valori pozitive subunitare. Dazavantaj: valoarea sa maxim nu atinge 1. Tehnica poate fi folosit att n cazul regresiei logistice binare, clasice, ct i n cazul regresiei logistice multinomiale sau a celei ordinale. Formula:

Se poate calcula i un Pseudo R2 ajustat, pentru a ine seama de mrimea eantionului(N) i numrului de regresori din model(df), excluznd interceptul.

R2 al lui McFadden este un indicator similar. Diferena const n faptul c McFadden ia n considerare log likelihood(LL) i nu funcia - 2LL. McFadden ofer posibilitatea unei ajustri(engl Adjusted McFadden R2) pentru a nu spori artificial caloarea indicatorului odat cu creterea numrului de VI incluse n model.

n care df este dat de numrul de parametri(VI) inclusin model, exceptnd interceptulR2 al lui Cox i Snell, respectiv R2 al lui Nagelkerke indicatori existeni n outputul SPSS. Indicatorul al II-lea se bazeaz pe primul, fiind o ajustare a acestuia pentru ca R2 s poat lua valori ntre 0 i 1, asemenea lui R2 din regresia liniar. Dintre toi indicatorii prezentai anterior, R2 al lui Nagelkerke este singurul care poate lua valori ntre 0 i 1, ceilali avnd o valoare maxim subunitar.R2 al proporiilor implic realizarea unui table de clasificare( dou linii i dou coloane i clasific observaiile i prediciile n dou grupe,o i 1(ex. angajai i omeri) Predicii omeri(0) Predicii angajai(1)

Observaii omeri(0) 32 5

Observaii angajai(1) 3 60

Exemplu de clasificare a observaiilor n funcie de datele culese i de cele estimateDac VI sunt adecvate pentru explicare VD, se va observa o similitudine ntre observaii(datele actuale) i predicii(pe baza VI) n a determina dac o persoan are anse mai mari s fie angajat sau, dimpotriv, s fie omer.Exemplu nou nscui.

Pentru calculul lui Pseudo-R2 trebuie s cunoatem valorile abateri modelului(-2LL model)i ale abaterii iniiale(-2LL nul), iar pentru calculul R2 al lui McFadden avem nevoie de valorile logaritmice pentru cele dou situaii(LL-loglikelihood)Model summary Step -2 Log likelihoodCox &Snell R SquareNagelkerke R Square

1 109,970 .353 .483

Fcnd nlocuirile n formulele prezentate anterior, vom obine:Pseudo - R2 = .3313 Pseudo R2ajustat=.3222

R2a lui Mc Fadden = .3313 R2 al lui McFadden ajustat = .2948

Valorile pot fi interpretate n termeni de procente. Predictorii inclui n model explic aproximativ ntre 29,48% i 33,13% din variaia probabilitii VD de a fi 1 sau 0(de a nate un copil sntos sau unul cu malformaii).R2 al lui Cocs i Snell i R2 al lui Nagelkerke sunt indicatori asemntori ca mod de funcionare. Conform lor, VI incluse n model explic aproximativ ntre 35,3% - 48,3% din variaia probabilitii de a fi 0 sau 1.R2 de stabilire a proporiilor msoar gradul n care exist o compatibilitate ntre observaii i predicii, adic gradul de corectitudine a prediciilor. n constituirea sa are loc urmtorul demers: Pentru fiecare subiect n parte se calculeaz probabilitatea de a se situa ntr-una din cele dou situaii posibile(nou nscut cu malformaii sau nou nscut sntos). Pe baza probabilitii calculate, subiecii sunt clasificai ntr-una din cele dou grupe. Din aceast clasificare a subiecilor pe baza estimrilor obinute prin ecuaia de regresie logistic, se compar corectitudinea clasificrii cu rezultatele observate. Exist un rezultat global dat de r aportul dintre prediciile corecte i totalul prediciilor. Din inspecia datelor observate s-a obinut 77,6% de rspunsuri corecte.

Clasification Table ObservatePrezise

Handicap Procentaj

corect

Copii cu problCopii sanatoi

Step 1 HANDICAP Copii cu probleme

Copii sntoi

Overall Percentage 31

13 15

66 67,4

83,5

77,6

Clasificarea subiecilor pe baza datelor observate i a celor estimateSe pot calcula ali trei indicatori specifici. Opus lui R2 de stabilire a proporiilor, este valoarea prediciilor negative dat de suma prediciilor greite supra totalul prediciilor. Ea este egal cu 1-R2 de stabilire a proporiilor. n cazul nostru este 23,4. Un caz din patru va fi prezis incorect de model. Modelul se va dovedi valid pentru trei sferturi din cazuri.

Exist i gradul gradul de sensibilitate (sensitivity) care const n raportul dintre numrul de predicii corecte i numrul de observaii ale evenimentului 1. n cazul dat exemplu, este vorba de raportul dintre numrul de predicii corecte referitoare la rspunsul nou nscut sntos , din numrul total de copii sntoi observai.

Se poate vorbi de 13 cazuri de diagnosticare greit(16 falsi negativi prezii cu laformaii, dar sntoi). Similar se poate calcula i specificitatea(engl. specificity) Se refer la numrul de predicii corecte i numrul de observaii ale evenimentului 0. Pe baza modelului, au fost estimai corect 31 din cei 46 de nou nscui cu malformaii genetice.

Se observ un numr de 15 cazuri diagnosticate greit(fali pozitivi )

Interpretarea se face innd cont att de valoarea global a lui R2 de stabilire a proporiilor, ct i n funcie de sensibilitate i specificitate. Ex: modelul propus reuete s ofere o mai bun predicie a cazurilor de copii nscui sntoi(83,84% din totalul celor sntoi), comparativ cu predicia naterii unor copii cu malformaii(65,26%). Valorile sunt mult deasupra mediei.

La schimbarea valorii critice( engl cut value) de clasificare de la probabilitatea de 0,5 la cea de 0,7 ca subiecii s fie ncadrai ca nou nscui sntoi, va conduce la urmtorul tabel de clasiciasre.Clasification Table ObservatePrezise

Handicap Procentaj

corect

Copii cu problCopii sanatoi

Step 1 HANDICAP Copii cu probleme

Copii sntoi

Overall Percentage 42

21 4

58 91,3

73,4

80

Reclasificarea subiecilor pe baza datelor observate i a celor estimate

Ridicarea probabilitii pentru a ncadra nou nscuii n categoria celor sntoi duce la o mai bun estimare a viitorilor nou nscui cu malformaii, 91,3% dintre acetia fiind identificai corect.. n schimb, scade la 73,4% puterea de estimare corect a nou nscuilor estimai sntoi.Decizia de a alege punctul critic de clasificare ine exclusiv de cercettor pe baza obiectivelor urmrite.

Testarea i interpretarea coeficienilor logitCoeficienii logit din regresia logistic corespund coeficienilor b din regresia liniar. Sunt utilizai pentru a estima raportul de anse ca variabila dihotomic s fie 0 sau 1. Ei indic msura n care se modific ansele ca VD s fie 1 sau 0 cnd predictorul asociat crete cu o unitate, iar ceilali predictori rmn constani.

Coeficienii logit sunt testai pentru a vedea dac au o influen semnificativ asupra VD. Dou proceduri: testul Wald i testul 2 al pasului

Testul Statistic Wald testeaz ipoteza nul conform creia un anumit coeficient logit este 0(dac predictorul respectiv influeneaz sau nu criteriul. Rezultatului obinut i corespunde o valoare t sau z, similar ca interpretare cu situaia din regresia liniar. Consecina: pot fi eliminate din model acele VI care nu au fost semnificative. Erori de tip 2, cnd o serie de coeficieni logit foarte mari(erori standard foarte mari). Aceasta nseamn respingerea unor VI atunci cnd este semnificativ. Pentru remediere, ar trebui utilizat alt procedeu..Alternativa: calcularea 2 al pasului. Diferena obinut este interpreta ca 2 cu k-1 grade de libertate., k reprezentnd numrul de categorii ale variabilei introduse. n cazul n care rezultatul este semnificativ statistic la p3k/n

Legend n = volumul eantionului; k = numrul de VIPrincipalii indicatori de detectare a cazurilor influenteExemplu: cazul infidelitii

Informaii necesare n aplicarea regresiei logistice:

1. precizarea ntr-un paragraf a variabilelor implicate n regresia logistic, a predictorilor(VI), a criteriului(VD), precum i a justificrii pentru alegerea acestei tehnici, pornind de la ipotezy i obiectivul studiului;2. n alt paragraf: precizarea datelor generale cu privire la eficiena modelului testat, a puterii sale explicative i a eventualelor comparaii cu alte modele alternative;

3. Prezentarea ntr-un tabel a valorii coeficienilor logit i a exponenilor acestora, precum i a indicatorilor utilizai pentru testarea gradului de semnificaie a acestora.

4. n cazul regresiilor cu scop predictiv se poate prezenta i tabelul cu R2 al proporiilor, pentru a afia gradul de corectitudine a clasificrii subiecilor pe baya ecuaiei de regresie observate;

5. n cazul regresiilor cu scop explicativ, este util de trecut n tabelul cu coeficieni logit, valorile R sau coeficienii logit standardizai, pentru a vedea contribuia fiecrei variabile la explicarea variabilei independente??? .n cazul utilizrii metodei ierarhice, se va trece 2 al pasului, pentru fiecare treapt adugat;6. Interpretarea coeficienilor logit obinui folosind fie varianta factorilor, fie pe cea a procentelor din analiza raportului anselor exp(b)

Caz infidelitate.

Se caut factori identificai n cercetrile anterioare. Clasificare: factori personali (sexul, vrsta, nivelul de educaie, venitul realizat, tipul de religie adoptat, starea civil, statut social), factori situaionali (distana fizic dintre parteneri, numrul de parteneri de sex opus eligibili la locul de munc, vrsta la care a avut loc cstoria), factori psihologici ( gradul de satisfacie marital n cuplu, gradul de implicare n relaie, nevoia de senzaii tari, stilul de ataament), etc..Dintre acetia se ncearc a se gsi nite predictori care s estimeze ct mai corect persoanele care vor da dovad de fidelitate n plan sexual. Lot ipotetic de 200 de subieci necstorii cu vrsta ntre 18 i 30 de ani

S-au utilizat ca predictori un numr de 8 variabile: vrsta, sexul persoanei, comportamentul religios(frecvena la biseric, pstrarea ritualurilor n post), atitudinea fa de relaii, stilul de ataament cu cele trei scale(sigur; ambivalent anxios; evitant) i nevoia de senzaii tari.Utiliznd metoda simultan, modelul testat are un G2(8)=42,15, p0,05vom interpreta acest model restrns, n care G2(5)=39,15, p