exemplu 1 analiza statistica
TRANSCRIPT
11
1. Introducere. La ce bun analiza statistică?
Primele aplicaţii ale gândirii statistice s-au legat de necesităţile statului de
a construi politici monetare şi economice eficiente (de unde probabil şi rădăcina stat-). Statistica era o unealtă extrem de utilă, deoarece pentru a creşte taxele sau a
declanşa războaie costisitoare conducătorii trebuiau să ştie numărul cetăţenilor
statului şi situaţia lor financiară. La fel de importantă era pentru marii negustori,
care trebuiau să calculeze costurile şi beneficiile unor investiţii sau călătorii. Lungu (2001) trece în revistă câteva surse inedite ale statisticii: teoria
modernă a corelaţiei provine din biologie (analiza similarităţilor dintre părinţi şi
copii); teoria analizei de varianţă îşi are originea în făbricuţele de bere din secolul al XVIII-lea şi pe câmpurile de orz (gustul berii era dat de soiul de orz şi timpul de
fermentare); teoria măsurării îşi are originea în studiul inteligenţei etc.
Definiţie Astăzi, termenul statistică are patru înţelesuri distincte. În funcţie de context, poate să semnifice (1) date; (2) descrieri ale datelor, cum ar
fi media, amplitudinea etc.; (3) tehnici de colectare, analiză şi
interpretare a datelor în scopul luării unor decizii; (4) ştiinţa care se ocupă cu crearea şi aplicarea unor astfel de tehnici (Kirk, 2008).
Analiza datelor este însă doar o parte a procesului de cercetare. SPSS şi
alte programe de calcul statistic computerizat nu sunt altceva decât unelte, iar utilizarea corectă a acestora depinde de desfăşurarea cu succes a unor paşi
premergători ai cercetării: design, eşantionare, alegerea instrumentelor etc. În sine,
rezultatele pe care programele le oferă nu sunt nici bune nici rele. Bune sau rele (sau mai degrabă corecte sau eronate) sunt în schimb strategiile de operaţionalizare
a variabilelor şi culegere a datelor, opţiunile pe care le bifăm în SPSS, modul în
care prezentăm rezultatele. De aceea afirmăm că de calitatea datelor introduse în SPSS depinde calitatea răspunsului statistic oferit de acesta, iar calitatea datelor la
rândul ei depinde de respectarea paşilor cercetării ştiinţifice.
Ca şi alte programe computerizate de calcul statistic, SPSS
oferă un sprijin cantitativ pentru a susţine o idee; el nu trebuie să devină un scop în sine, ci o unealtă care să servească scopurilor
cercetării. Chiar şi cunoaşterea aprofundată a unor astfel de
programe nu trebuie să ducă la prezentarea unor cercetări „sufocate” de statistică: dacă tot ce avem este un ciocan, atunci nu
trebuie ca toate obiectele din jur să ni se pară cuie!
O cercetare evaluată ca fiind „bună” depinde în mare parte de construirea scenariului experimental şi de modul în care îl punem în aplicare. Fiecare decizie
pe care o luăm pe parcurs, până a ajunge să introducem date în SPSS, afectează
modul în care vom fi capabili să răspundem întrebărilor cercetării noastre. De
aceea, pentru a nu consuma inutil efort şi timp, este bine să zăbovim asupra acestor paşi preliminari, chiar dacă uneori ni se pare că totul este limpede sau că pierdem
vremea. După ce s-a încheiat culegerea datelor, este târziu să mai introducem
variabile suplimentare.
12
În aceeaşi ordine de idei, Pallant (2005) enumeră câteva sugestii de care ar
fi bine să ţinem cont înainte de a culege datele.
gândiţi-vă ce fel de cercetare răspunde cel mai bine obiectivului dvs.
(observare, experiment, anchetă pe bază de chestionar etc.) Fiecare dintre acestea are avantaje şi dezavantaje, iar citirea unor studii similare realizate pe
aceeaşi temă poate să vă ajute în luarea deciziei (uneori citirea abstractului
este suficientă, pentru articolele publicate în reviste de specialitate); dacă alegeţi un experiment, decideţi dacă este mai potrivit un design intergrup
(grupuri diferite de participanţi în fiecare eşantion) sau unul intragrup (aceiaşi
participanţi măsuraţi de mai multe ori). Fiecare tip de design are avantajele şi
dezavantajele lui; în studiile experimentale asiguraţi-vă că variabila pe care o manipulaţi are
suficiente modalităţi. Dacă are doar două (asta însemnând practic două
eşantioane), concluziile nu vor fi prea limitate sau simpliste? Ar fi necesar sau de dorit un grup de control? Inexistenţa acestuia va scădea valoarea cercetării?
în studiile experimentale, asiguraţi-vă că aveţi suficienţi participanţi în fiecare
grup şi încercaţi să construiţi grupe egale ca număr. Utilizarea unor grupe prea mici sau dezechilibrate va face dificilă detectarea diferenţelor semnificative
statistic;
de câte ori este posibil, repartizaţi aleator subiecţii în fiecare grup, evitând
utilizarea grupurilor constituite deja. Această strategie reduce problemele legate de existenţa grupelor neechivalente în design-urile intergrup. De asemenea, dacă
aveţi resurse materiale şi timp, este bine să realizaţi şi alte măsurări ale
grupurilor pentru a vă asigura că ele nu diferă substanţial. Dacă astfel de diferenţe există şi le-aţi identificat, ele pot fi controlate statistic mai târziu;
alegeţi variabile dependente valide. O idee bună ar fi utilizarea mai multor
variabile dependente – unele sunt mai sensibile decât altele la modificările
variabilei independente; încercaţi să anticipaţi posibilele influenţe ale unor variabile externe designului,
iniţial neluate în calcul. Acestea se mai numesc variabile confundate şi pot să
ofere o explicaţie alternativă rezultatelor obţinute, chiar dacă uneori sunt greu de identificat când sunteţi preocupaţi doar de cercetarea voastră în sine. De
aceea este util să prezentaţi ideea şi designul studiului unei alte persoane,
înainte de a începe; dacă alegeţi metoda chestionarului, ar fi bine să completaţi şi dvs. chestionarul
şi să desfăşuraţi un studiu pilot pe un eşantion similar celui ţintă. Vă puteţi
asigura astfel că instrucţiunile sunt clare, că itemii sunt corect formulaţi etc.;
dacă alegeţi un experiment ar fi bine să realizaţi de asemenea un studiu pilot. Dacă aveţi nevoie de echipamente, asiguraţi-vă că ele funcţionează; dacă aveţi
colaboratori, aceştia trebuie bine instruiţi, iar dacă folosiţi mai mulţi
observatori, puneţi de acord modul în care vor coda diverse comportamente. Studiile pilot vă vor ajuta să depistaţi o parte din erori sau variabile
confundate. Va fi greu să stăpâniţi toate variabilele ascunse, dar cu siguranţă
studiul pilot poate să elimine din ele; una peste alta, acordaţi atenţie tuturor detaliilor care ar putea să afecteze
calitatea cercetării, de la design şi culegerea datelor la modul în care „vindeţi”
rezultatele acesteia în cadrul unor conferinţe sau articole.
13
1.1. De ce este nevoie de statistică?
Dacă vrem un răspuns simplu, putem afirma că statistica este necesară
deoarece oferă o abordare cantitativă unui domeniu puţin palpabil, cum este psihologia. Metodele statistice au devenit în timp esenţiale pentru ştiinţele sociale,
pentru psihologie în speţă, deoarece le-au conferit legitimitate. Ele includ o gamă
largă de tehnici sau proceduri folosite pentru a descrie, explora, înţelege, dovedi şi
prezice, pornind de la date culese de la grupuri de persoane (eşantioane). Statistica serveşte şi unui motiv practic, acela de a reduce cantitatea prea
mare de date. De exemplu, dacă dorim să investigăm efectul jocurilor video asupra
comportamentului copiilor, va trebui să măsurăm comportamentul acestora în situaţii diverse, în interacţiunile sociale etc. Vom apela poate şi la măsurarea unor
variabile precum tipul de personalitate sau indicatori fiziologici. Vom ajunge astfel
să avem mii de date condensate în zeci sau sute de pagini de grile de observaţie, chestionare şi altele.
Introducerea acestor informaţii într-o bază de date nu rezolvă decât în parte
problema. Oricine a văzut o bază de date stocată într-un program computerizat îşi
dă seama de nevoia de a condensa datele într-o formă comprehensibilă. Mintea umană nu este obişnuită să lucreze cu mari cantităţi de informaţie, ci mai degrabă
cu informaţia relevantă, pe care statistica o poate oferi în forma unor simple valori
numerice. Datele sunt astfel organizate şi sumarizate încât cercetătorul să poată vedea uşor rezultatele studiului său şi să le poată comunica şi altora.
De exemplu, ar fi extrem de dificil şi înţeles un raport de cercetare în care
se afirmă:
„La studiu au participat 130 de persoane, cu vârste între 18 şi 56 de ani..
Şapte persoane au avut 18 ani. Cinci persoane au avut 19 ani. Douăzeci
şi două de persoane au avut…”
Aceleaşi rezultate pot fi exprimate mult mai eficient utilizând datele oferite de analiza statistică:
„La studiu au participat 130 de persoane, cu vârste între 18 şi 56 de ani.
Media vârstei a fost de 25,45 ani, cu o abatere standard de 3,46 ani. Distribuţia vârstei a fost normală.”
Dacă vrem o formă şi mai condensată, putem apela la simboluri:
„N=130, mvârstă = 25,46; σvârstă = 3,46; min = 18; max = 56. Distribuţie
normală (KS = ,94; p > 0,05).”
În al doilea rând statistica ajută cercetătorii să găsească răspunsuri la
întrebările care au generat demersul de cercetare, determinând în ce măsură
concluziile sunt justificate de rezultatele obţinute. Pentru a avea încredere în rezultatele sale şi pentru a le prezenta comunităţii ştiinţifice, cercetătorul va apela
aşadar nu doar la analiza statistică, ci şi la limbajul statistic.
Din cele câteva scopuri prezentate reiese încă o posibilă definiţie a statisticii.
Definiţie Statistica se referă la setul de proceduri matematice desfăşurate
pentru a organiza, sumariza şi interpreta rezultatele într-o
manieră acurată şi informativă (Gravetter şi Wallnau, 2009).
14
În termeni pompoşi, am putea să afirmăm că statistica aduce ordine în
haos, folosind un set de tehnici standardizate recunoscute şi înţelese de comunitatea
ştiinţifică.
Statistica este deci un instrument indispensabil pentru cercetare, dar utilitatea ei nu se rezumă la aceasta. În multe domenii, este aproape imposibilă
înţelegerea unor articole de cercetare fără deţinerea unor noţiuni fundamentale de
statistică. Alteori, efectele parcurgerii unor cursuri de statistică sunt vizibile în modul de a gândi sau de a scrie al unor persoane. Nu de puţine ori ne-au frapat în
ştirile TV sau discuţii caracterul de lege absolută al unor afirmaţii: „Toţi oamenii
sunt…” sau „Românii sunt nemulţumiţi de…” Care dintre oameni sau dintre
români? Este suficient un contraexemplu pentru ca afirmaţia să nu mai fie adevărată. Statistica nu va permite niciodată realizarea unor astfel de afirmaţii.
1.2. Statistica şi simţul comun
Dincolo de glumele clasice la adresa statisticii („Enumeraţi trei tipuri de
minciună!”), statistica rămâne greu accesibilă simţului comun. Motulsky (2010)
atrăgea atenţia asupra faptului că interpretările rezultatelor statistice nu sunt atât de intuitive pe cât am crede la prima vedere şi realiza câteva observaţii pertinente.
(1). Oamenii tind să sară la concluzii
Un exemplu amuzant oferit de autor era acela în care o fetiţă de trei ani îi spunea prietenului ei „Tu nu poţi deveni medic, doar fetele pot
face asta”. Pentru ea, era perfect valabil, deoarece toţi medicii pe care îi
cunoştea (eşantionul de medici, am spune noi) erau femei. Autorul sublinia că abilitatea de a generaliza de la nivelul eşantionului la acela al
populaţiei este adânc înrădăcinată în mintea umană. Pe de altă parte,
cercetătorii au nevoie de rigoarea statistică pentru a evita formularea
unor concluzii excesiv de generale pe baza unor date limitate.
(2). Oamenii tind să fie prea încrezători
Uneori sintagma „sunt 90% sigur de asta” nu este rezultatul unui calcul
statistic, ci al cuantificării unui sentiment subiectiv de siguranţă. Pentru a ilustra faptul că oamenii se încred prea mult în propriul raţionament, Motulsky cita un
studiu realizat de Russo şi Schomaker în 1989. Autorii respectivi cereau unui
eşantion de peste 1,000 de participanţi să răspundă unor întrebări de
cultură generală. Dacă răspunsul corect nu era cunoscut, sarcina participanţilor era de a stabili singuri un interval în care să fie 90%
siguri că se află răspunsul corect (întrebările erau de genul: „Care este
anul naşterii lui Mozart?”; „Care este distanţa de la Pământ la Lună?” etc.) Rezultatele arătau că persoanele erau prea încrezătoare în
cunoştinţele lor. În urma analizei răspunsurilor, se dovedea că
intervalul oferit ca răspuns era prea îngust, incluzând doar între 30 şi 60% din răspunsurile corecte, deşi cercetătorii nu restricţionaseră mărimea
intervalului. Motulsky demonstra astfel că trebuie să distingem între limitele de
încredere calculate cu ajutorul metodelor statistice şi estimările informale.
(3). Oamenii tind să vadă tipare chiar şi în datele aleatoare Pentru a-şi argumenta ideea, Motulsky aducea în discuţie eroarea
jucătorului [aceasta se referă la convingerea că un eveniment aleator poate fi prezis
de un eveniment anterior independent. Este un rezultat al combinării eronate a probabilităţilor independente (Miclea, 1999)]. De exemplu, fanii baschetului pot
15
crede că, dacă un jucător a înscris dintr-o aruncare, şansele de a
înscrie şi din următoarea sunt mai mari decât acelea de a rata. În
mod normal, şansele sunt însă de 50%, ca şi în cazul aruncării unei
monede de mai multe ori. Faptul că a ieşit anterior „ban” nu creşte şansele ca la următoarea aruncare să iasă tot „ban”; de fapt, şansele
sunt de 50% la fiecare aruncare. Mintea umană a evoluat astfel
încât să găsească tipare cu uşurinţă, dar este nevoie de rigoare statistică pentru a nu fi păcălită de tipare aparente în rândul datelor aleatoare.
(4). Oamenii intuiesc incorect probabilităţile
Gândiţi-vă că aveţi la dispoziţie două bomboniere.
Cea mai mare conţine 93 de bomboane albe şi 7 roşii, iar cea mică 9 albe şi una roşie. Bomboanele sunt amestecate în
fiecare vas şi nu puteţi să vedeţi culoarea lor. Sarcina dvs.
este de a alege o bomboană roşie din oricare bombonieră. Dacă aţi alege din bomboniera mică, şansele de a găsi o bomboană roşie sunt de
10%. Dacă alegeţi din vasul mare, şansele sunt de doar 7%. Evident, şansele sunt
mai mari în cazul bombonierei mici. Totuşi, două treimi dintre persoanele care au participat la un astfel de experiment au ales vasul mare, deoarece conţinea mai
multe bomboane roşii (Denes-Raj şi Epstein, 1994, apud Motulsky, 2010).
(5). Oamenii evită să se gândească la situaţii ambigue
Imaginaţi-vă din nou că aveţi la dispoziţie două bomboniere. Ştim că prima conţine 50 de bomboane roşii şi
50 de bomboane negre, amestecate. A doua conţine tot 100
de bomboane, unele roşii şi altele albe, dar nu ştim proporţia acestora. Dacă dorim să alegem o bomboană,
indiferent de recipient, nu vom şti culoarea acesteia decât după ce o extragem. Veţi
câştiga un premiu dacă puteţi selecta o bomboană roşie şi sunteţi liber să extrageţi
din care recipient doriţi. Pentru care veţi opta? În foarte multe cazuri oamenii aleg prima bombonieră (Ellsberg, 1961, apud Motulsky, 2010), caz în care şansele de a
reuşi sunt de 50%. Extragerea unei bomboane roşii din a doua urnă este mai
complicată deoarece este ambiguă şi ne face să ne simţim inconfortabil.
(6). Oamenilor le este greu să combine probabilităţile
De data aceasta gândiţi-vă la concursurile televizate în care concurentul
trebuie să aleagă una dintre cele trei uşi închise, ştiind că în spatele uneia se află un premiu valoros, iar în spatele celorlalte două ceva nesemnificativ. Să spunem că aţi
ales o uşă, de exemplu numărul 2. Într-o astfel de emisiune, pentru a creşte
suspansul şi audienţa emisiunii, prezentatorul va apela la
un artificiu. Nu vă va arăta ce se află în spatele uşii numărul 2, ci va deschide una dintre uşile rămase (numărul
1 sau numărul 3), o uşă despre care ştie cu siguranţă că nu
ascunde premiul cel mare. Acum va urma momentul culminant: vi se oferă ocazia de a schimba opţiunea
originală sau de a rămâne la aceeaşi opţiune.
Nu este vorba despre nici un truc. Uşile sunt identice, faţa prezentatorului nu ar trebui să spună nimic, iar uşa pe care o deschide cu siguranţă nu va ascunde
premiul (el ştie în spatele cărei uşi se află acesta).
Totul depinde aşadar de probabilităţi. În prima fază, când aveaţi de ales între
trei uşi închise, şansele de a găsi uşa câştigătoare erau egale (33%). Ce se întâmplă în
16
faza a doua, când prezentatorul vă permite să schimbaţi opţiunea? Dacă în faza 1 aţi
ales uşa câştigătoare, (bineînţeles, fără să ştiţi şi fără să vi se arate), în faza a doua
prezentatorul va deschide oricum una dintre cele două uşi necâştigătoare (să zicem
el deschide uşa 3). Aveţi aşadar ocazia de a schimba opţiunea de la uşa câştigătoare la una necâştigătoare (despre niciuna dintre uşi dvs. nu ştiţi însă deocamdată
nimic). Schimbarea va duce la pierderea premiului (şansele irosite au fost de 33%).
Dimpotrivă, dacă în prima fază aţi ales o uşă necâştigătoare (să zicem tot uşa numărul 2), prezentatorul va avea de întors una dintre uşile rămase (1 sau 3),
iar el cu siguranţă va deschide o uşă necâştigătoare pentru a creşte tensiunea. Cu
alte cuvinte, deşi nu ştiţi acest lucru, şansele de a câştiga sunt de partea dvs.,
deoarece ambele uşi necâştigătoare au fost alese (una de către dvs., una de către prezentator – total 66% şanse). Schimbarea deciziei va duce cu siguranţă la
câştigarea premiului cel mare.
Dacă jocul s-ar repeta de mai multe ori (încercaţi acasă cu trei bucăţele de hârtie), veţi câştiga de două ori mai des dacă în faza a doua schimbaţi opţiunea
decât dacă nu aţi face-o. Aproape toată lumea ajunge intuitiv la o concluzie greşită,
crezând că schimbarea alegerii iniţiale nu este de ajutor (ibidem).
(7). Oamenii tind să ignore explicaţiile alternative
Să presupunem că formăm un eşantion de persoane care
suferă des din cauza migrenelor şi acestora li se aplică un tratament
experimental. Sarcina lor este de a evalua frecvenţa durerilor înainte şi după administrarea tratamentului. Să zicem că în cele mai multe
cazuri se constată o descreştere a frecvenţei migrenelor, calculele
statistice arătând că este puţin probabil ca acest lucru să se datoreze întâmplării. Prin urmare, am putea să concluzionăm că tratamentul a avut efect şi putem să
facem bani din asta. Din păcate, nu este neapărat aşa. Iată câteva explicaţii
alternative (ibidem):
efectul placebo a redus frecvenţa migrenelor: încrederea în tratament şi/sau medic ar fi putut duce la apariţia acestui efect;
pacienţii au fost politicoşi şi nu au dorit să-l supere pe cercetător, de aceea i-au
spus ceea ce el a vrut să audă; înainte, în timpul sau după tratament pacienţii au vorbit cu un medic care le-a
sugerat creşterea dozei unui alt medicament folosit anterior sau modificarea
stilului de viaţă. Scăderea frecvenţei migrenelor se poate datora respectării acestor sfaturi şi nu tratamentului experimental;
cercetătorul a exclus din baza de date rezultatele câtorva participanţi care
raportau migrene extrem de frecvente, pentru că depuseseră efort fizic intens în
săptămâna aplicării tratamentului. Deşi poate bine intenţionate, astfel de manipulări ale datelor pot explica frecvenţa mai redusă a migrenelor la nivelul
grupului;
pacienţii au luat un calmant puternic înaintea instalării migrenei, de aceea nici nu o mai raportează când sunt intervievaţi.
1.3. Analiza statistică şi… gătitul
Pallant (2001) încadra într-o formă interesantă conţinutul
unei cărţi de analiză statistică, punând cititorii să-şi imagineze că
datele pe care le au la dispoziţie sunt de fapt ingrediente ale unei reţete. Ingredientele respective pot fi gătite în moduri variate, ca
17
mic dejun, prânz, cină sau gustare. În funcţie de materia primă pe care o avem la
îndemână, anumite opţiuni pot fi potrivite sau nu. Aşadar, planificarea şi pregătirea
sunt etape importante ale procesului, atât în gătit, cât şi în analiza datelor. În acest
sens, trebuie să fim pregătiţi să răspundem la câteva întrebări: (1). Avem ingredientele necesare în cantităţile potrivite?
(2). Cum trebuie să pregătim ingredientele pentru a putea fi gătite?
(3). Cum vom găti ingredientele? (4). Avem în minte o imagine a felului în care produsul trebuie să arate la sfârşit?
(5). Cum vom şti că mâncarea este gata?
(6). După ce este gătită, cum o servim pentru a arăta apetisant?
Aceleaşi întrebări se aplică şi procesului de analiză a datelor. Este nevoie de planificarea cercetării pentru ca studiul să ne ofere informaţiile de care avem
nevoie. Baza de date trebuie construită cu atenţie, având clare în minte ipotezele de
la care pornim. Trebuie să ştim ce proceduri statistice avem la dispoziţie pentru datele noastre, trebuie să ştim să le rulăm şi să interpretăm corect rezultatul obţinut.
În fine, trebuie să ştim să prezentăm acest rezultat.