suport de curs disciplina informatica aplicata in psihologie

Upload: daniel-constantin-melinte

Post on 13-Oct-2015

93 views

Category:

Documents


3 download

DESCRIPTION

Curs Informatica aolicata in Psihologie

TRANSCRIPT

CE ESTE STATISTICA

UNIVERSITATEA PETRE ANDREI din IAI DEPARTAMENTUL DE TIINE SOCIO-UMANE

FACULTATEA DE PSIHOLOGIE I TIINELE EDUCAIEI

DISCIPLINA: Informatic aplicat n psihologie (disciplin obligatorie, de specialitate)

programul de studiu: PSIHOLOGIE Ciclul de studii: I diplom de licen, anul ITITULAR CURS: Lect. univ. dr. Viorel ROBU

Informatic aplicat n psihologie- suport de curs -

An universitar 2011-2012CE ESTE STATISTICA

Statistica se ocup cu stringerea, descrierea i analizarea datelor n vederea extragerii unor concluzii pe baza acestora. n esena ei, statistica opereaz cu numere care descriu realitatea. Termenul de statistic provine din latinescul medieval status, care semnifica stare politic. n anul 1770, la Londra, baronul Bielfeld public lucrarea The Elements of Universal Erudition n care exist un capitol de statistic, definit ca fiind: tiina care ne nva care este organizarea politic a tuturor statelor moderne ale lumii.

Utilizarea sistematic a statisticii n psihologie dateaz de la nceputul anilor 50. La vremea respectiv, n care calculatoarele se aflau nc n era electromecanic, cea mai mare problem era efortul de calcul. Din acest motiv, a nva statistic nsemna atunci mai ales nvarea unor formule i a unor proceduri care s simplifice pe ct posibil efortul de calcul. Apariia calculatoarelor si a programelor de prelucrri statistice, au fcut posibil trecerea la faza n care accentul se pune pe nelegerea raionamentelor statistice.

Statistica n activitatea a psihologilor

Iat cteva argumente n sprijinul ideii c utilizarea statisticii face parte integrant din activitatea curent a unui psiholog:

Selecia psihologic este un domeniu de aplicabilitate larg rspndit i care se bazeaz puternic pe aportul statisticii. Cu ajutorul ei se pune n eviden calitatea prognostic (predictiv) a unuia sau mai multor teste luate mpreun (baterie), se fixeaz pragul de respingere i se constituie scorurile individuale pe baza crora se ia decizia de selecie.

Chiar i atunci cnd se dedic unei activiti cu orientare puternic individual, cum este psihoterapia, psihologul nu se poate dispensa de statistic. Ea i este necesar pentru evaluarea eficienei unei noi metode terapeutice, comparativ cu o alt metod, sau pentru identificarea anumitor condiii care pot influena eficiena edinelor de terapie (ora zilei, similaritatea de sex dintre pacient i terapeut, etc.).

De asemenea integrarea n mediul tiinific profesional oblig psihologul s utilizeze metodele statistice n elaborarea studiilor proprii sau n nelegerea studiilor din literatura de specialitate.

Nu trebuie s uitm insa c nici statistica i nici metodologia de investigare psihologic (teste, dispozitive computerizate, etc.), orict de sofisticate ar fi, nu dau psihologiei, prin ele nsele, un caracter de tiin.

Dificulti i riscuri n nsuirea metodelor statistice

Se stie ca statistica n-a fost niciodat disciplina preferat a studenilor n psihologie. Trebuie s acceptm adevrul c majoritatea celor care vor sa neleag psihicul uman nu manifest o simpatie deosebit pentru numere, formule i algoritmi de calcul. Insa un curs introductiv de statistic aplicat n psihologie este pe deplin accesibil oricrui absolvent de liceu, chiar i celor care nu au urmat o secie de tip real.

Ce dificultati pot sa apara?

abundena de concepte noi, cu semnificaii uneori dificil de neles n mod intuitiv;

prezena unor concepte cunoscute din limbajul cotidian dar care au semnificaii diferite n domeniul statisticii;

dificultatea nelegerii raionamentelor de tip probabilistic.

Sa retinem totusi ca utilizarea n necunotin de cauz a unor prelucrri statistice, fr a ti dac sunt legitime sau nu i fr a le nelege semnificaia, poate conduce la grave confuzii. Acest tip de atitudine este favorizat in ultima perioada si de utilizarea programelor de calculator, care permit proceduri statistice diverse i care ntrein iluzia c ar putea fi aplicate n afara unei profunde cunoateri a rostului i semnificaiei lor.

Exsita si cazuri in care utilizarea statisticii se face cu scopul de a aparea mai doct. Se face astfel apel la ct mai multe date, la reprezentri grafice redundante sau la proceduri rar utilizate, chiar dac pina la urma se ajunge la aceleai concluzii.

Este bine sa ne insusim faptul ca statistica n psihologie este, ntotdeauna, un mijloc i nu un scop. Ea este un simplu instrument n atingerea unor obiective.

MSURAREA N PSIHOLOGIE

A msura nseamn a atribui numere sau simboluri unui aspect al realitii obiective sau subiective, n funcie de anumite aspecte cantitative sau calitative care le caracterizeaz. n acest mod relaia dintre numere sau simboluri ajunge s reflecte relaia dintre caracteristicile crora le-au fost atribuite. Modul n care sunt atribuite numere sau simboluri pentru a msura ceva, se numete scal de msurare.

Este important sa intelegem procesul de msurare deoarcece:

vom cunoate tipurile de transformri la care putem spune n mod legitim valorile rezultate prin msurare. De exemplu, dac am msurat distana n centimetri, tim c o putem transforma n inch prin aplicarea unei reguli, fr a altera semnificaia valorilor.

Vom sti sa alegem procedurile statistice adecvate datelor numerice i scopurilor pe care ni le propunem. De exemplu, nu vom putea alege proceduri de tip metric (cantitativ) atunci cnd variabila dependent este de tip non-metric (calitativ).

Statistica opereaz cu valori, numerice sau de alt natur, care rezult dintr-un proces de msurare. Dar numerele, dei au aceeai form, nu sunt asemntoare unele cu altele. Ele pot avea diferite semnificaii sau proprieti n funcie de tipul de msurare din care rezult. n funcie de cantitatea de informaie pe care o reprezint valorile, ca rezultat al procesului de msurare, putem distinge mai multe tipuri de scale de msurare:

Scale nominale

O msurare pe scal nominal nseamn a clasifica obiectele n diverse categorii. n acest caz, o valoare nu este cu nimic mai mare sau mic dect alt valoare. De exemplu, valoarea atribuit genului poate fi codificat cu M sau F, ori, la fel de bine cu 2 sau 1. n acest caz, respectivele valori nu sunt dect simboluri ale unei anumite caliti pe care o ia caracteristic de gen a unei persoane. Altfel spus, ntr-un asemenea caz 2 nu nseamn c este mai mult sau mai bun dect 1 ci doar faptul c este diferit de acesta. Putem remarca c ambele codificri de mai sus sunt arbitrare, n locul lor putnd utiliza orice alte simboluri, pe o baza de convenie. Variabilele msurate pe scale de tip nominal pun n eviden diferene calitative ntre valori i nu cantitative.

Exemple de variabile exprimate pe scale nominale: bolile psihice (depresie, nevroz, etc.), tipurile temperamentale (sanguin, coleric, flegmatic, melancolic) etc..

Valorile msurate pe o scal de tip nominal au un caracter calitativ i nu suport operaii numerice, altele dect cele de insumarea.

Scale ordinale

Valorile plasate pe o scal de tip ordinal au o anumit semnificaie cantitativ. O anumit valoare este mai mare sau mai bun dect alta, aflat sub ea. Implicit, ea poate fi mai mic sau mai puin bun dect alt valoare, aflat deasupra ei. Dac o anumit persoan este mai preferat dect alta, i atribuim primei valoarea 1 iar celei de-a doua valoarea 2, atunci cele dou valori se exprim pe o scal de tip ordinal, care indic doar ordinea preferinei i nu msura intensitii acestei preferine.

Asadar numerele de tip ordinal ne spun dac o valoare este mai mare sau mai mic dect alta, dac o anumit calitate este prezent ntr-o msur mai mare sau mai mic, fr a putea preciza care este diferena de cantitate a caracteristicii msurate. Ca urmare, valorile de tip ordinal au, ca i cele de tip nominal, o semnificaie calitativ i nu una cantitativ.

Scale de interval

O variabil msurat pe o scal de interval ne ofer informaii nu doar despre ordinea de mrime ci i despre dimensiunea exact a caracteristicii msurate. Valorile de acest tip au un caracter cantitativ, exprimat numeric, iar intervalele dintre ele sunt egale.

Exemplu: scala Celsius. Dac ntr-o zi se msoar 5 grade iar n ziua urmtoare 10 grade, se poate spune cu precizie c a doua zi a fost cu 5 grade mai cald;

Ceea ce este caracteristic valorilor msurate pe scal de interval este absena unei valori 0 absolute. Cu alte cuvinte, valorile de acest tip nu ne permit evaluri de genul: O temperatur de 10 grade este de dou ori mai mare dect una de 5 grade. Aceasta deoarece temperaturile msurate pe scala Celsius nu au o valoare 0 absolut (dac acceptm c nici un om viu nu are inteligen nul).

Posibilitatea msurrii pe scale de interval n psihologie face adesea obiectul unor controverse. Aceasta pentru c cele mai multe dintre variabilele psihologice sunt expresia unor evaluri subiective, fapt care face greu de demonstrat egalitatea intervalelor dintre dou valori consecutive. Cu toate acestea, multe dintre msurtorile studiilor psihologice sunt asimilate scalei de tip interval.

Scale de raport

Valorile exprimate pe o scal de raport au (pe lng egalitatea intervalelor) i o valoare 0 absolut la care se raporteaza (nu este posibil nici o valoare mai mic de 0). Astfel este permis aprecierea raportului dintre dou valori.

Exemplu: scala de temperaturi Kelvin (0 Kelvin este temperatura minim absolut).

n psihologie puine sunt variabilele acceptate ca fiind msurate pe scala de raport, deoarece sunt puine situaiile n care avem de a face cu caracteristici ce pot lua valoarea 0 absolut.

La fel ca i valorile msurate pe scale de interval, valorile msurate pe scal de raport suport toate transformrile matematice posibile. Din acest motiv, n practic, valorile msurate pe scal de interval sau de raport sunt considerate similare(variabile numerice), fiind prelucrate prin acelai gen de proceduri statistice.

Dac lum n considerare proprietile numerice i tipul de transformri suportate de fiecare scal de msurare, atunci ordinea cresctoare a acestora este nominal-ordinal-interval-raport. Din acest punct de vedere se poate chiar spune c scalele de msurare se plaseaz pe o scal ordinal.

Scale de msurare i variabile

Din perspectiva msurrii, variabila se refer la o caracteristic supus msurrii, n timp ce scala se refer la modalitatea de msurare. Uneori aceeai variabil (caracteristic) poate fi msurat pe oricare dintre tipurile de scal. De exemplu, timpul de reacie poate fi exprimat pe o scal nominal (corespunztor, necorespunztor), pe o scal ordinal (mic, mare, mediu, foarte mare) sau pe o scal de interval/raport (n uniti de timp). Uneori se folosete expresia variabil nominal, (ordinal sau de interval). Fr a fi greit, atunci cnd folosim o astfel de exprimare trebuia s ne gndim c ea semnific de fapt variabil msurat pe o scal nominal..., scala de msurare i variabila fiind noiuni diferite!

S reinem, de asemenea, faptul c valorile msurate pe o scal de nivel superior (cantitativ), pot fi convertite n valori msurate pe scale calitative. Niciodat, ns, nu vom putea transforma valori calitative n valori cantitative. Atunci cnd exist posibilitatea de a alege, se va prefera ntotdeauna msurarea pe o scal cantitativ (interval/raport).

VARIABILE, POPULATIE, ESANTION

Variabile dependente i variabile independente

Studiul statistic i propune evidenierea legturilor dintre diverse caracteristici ale realitii adica intre diverse variabile. Exist astfel variabile ale cror valori sunt dependente pentru c variaz n funcie de valorile altei sau altor variabile, care sunt denumite, din acest motiv, independente. Identificarea lor corect n cadrul unui studiu statistic este esenial pentru fundamentarea procedurilor statistice.

Variabila dependent face obiectul msurrii cu scopul de a fi supus unor concluzii. Prin opoziie, variabila independent este utilizat ca variabil de influen, ale cror efecte posibile asupra variabilei dependente urmeaz sa fie puse n eviden. Termenii dependent, independent se utilizeaz n mod obinuit n legtur cu cercetarea experimental. n acest context exist variabile manipulate adic independente de reaciile, inteniile, conduitele sau tririle subiecilor investigai (acestea fiind variabile dependente). n raport cu analiza statistic, definirea variabilelor ca dependente i independente nu este condiionat de msurarea lor n condiii de experiment.

Sa reinem faptul c nu exist variabile care sunt dependente sau independente prin natura lor. Caracteristica de a fi de un tip sau de altul provine din rolul care le este atribuit de ctre cercettor ntr-un anumit context de cercetare.

Variabile continue i variabile discrete

Se numete continu o variabil de tip numeric (cantitativ, de tip interval/raport) care are un numr teoretic infinit de niveluri ale valorilor msurate. Acest tip de variabil poate lua, n principiu, orice valoare, permind utilizarea zecimalelor.

Asadar variabilele continue, masurate pe scala de interval/raport, sint valori in numar infinit care permit inserarea unei valori intermediare intre oricare alte doua valori.

Ex.- inaltimea unei persoane

temperatura

virsta

Variabila discret este cea care prezint un numr finit al valorilor pe care le poate lua. Deci variabilele discrete, masurate pe scale nominale si ordinale, sint valori izolate care formeaza multimi finite.

Ex.- numarul de membrii a unei familii

numarul de studenti la o ora de curs

numarul angajatilor de la o firma

Populaie i eantion

Tinta oricarei cercetrii tiinifice este identificarea unor adevruri cu un anumit grad de generalitate. Din punct de vedere statistic generalul este reprezentat de totalitatea valorilor care descriu o anumit caracteristic, i este numit populaie. Din pcate ns, investigarea tuturor indivizilor care compun o anumit populaie nu este aproape niciodat posibil. Ca urmare, n practica cercetrii tiinifice se supun cercetrii psihologice loturi mai restrnse, extrase din ansamblul colectivitii vizate, ai cror parametri descriptivi (medie, variabilitate) sunt extrapolai, n anumite condiii i cu ajutorul unor proceduri specializate, la populaia din care fac parte.

Cercetarea statistica face apel la urmtoarele definiii:

Populaie - totalitatea elementelor care constituie obiectivul de interes al unei investigaii. Prin elemente nelegem cel mai adesea persoane (sau subieci, cu un termen uzual in cercetarea psihologic). Deci prin populaie trebuie s nelegem extinderea maxim posibil, sub aspectul volumului, a respectivelor elemente. Extinderea menionat este, la rndul ei, definit prin obiectivul de cercetare, ceea ce nseamn ca are o dimensiune subiectiv. De exemplu, ntr-un studiu cu privire la efectul oboselii asupra performanei cognitive, pot fi vizate diferite categorii de populaii: a studenilor, a elevilor etc.

Eantion - reprezint elementele selecionate pentru a fi efectiv studiate. Ideea pe care se bazeaz cercetrile bazate pe eantioane este aceea c se pot face aprecieri asupra unei ntregi populaii, n anumite condiii, doar pe baza caracteristicilor msurate pe o parte a acesteia.

Exemplu: intr-un studiu care vizeaz influena inteligenei asupra reusitei scolare in ciclul primar, populaia este reprezentat de toi scolarii din ciclul primar iar eantionul de subiecii inclui n studiu.

Dac am reui adunarea de date cu privire la ntreaga populaie care face obiectul cercetrii, am putea trage concluzii directe cu privire la aceasta prin utilizarea indicatorilor statistici descriptivi cunoscui (medie, dispersie, abatere standard) numii i parametrii populaiei. Dar acest lucru nu este i, ca urmare, indicatorii statistici ai eantionului sunt utilizai pentru a face estimri, inferene, cu privire la parametrii populaiei.

Reprezentativitatea eantionului

Ideea de baza este ca dac avem un eantion a crui alegere respect anumite condiii, extras dintr-o populaie orict de mare, rezultatele obinute pe acesta pot fi extrapolate la ntreaga populaie.

Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie din care a fost extras se numete reprezentativitate. Totusi nici un eantion nu poate reprezenta perfect datele populaiei fapt pentru care estimrile pe baz de eantion conin ntotdeauna o doz mai mare sau mai mic de eroare. Cu ct eroarea este mai mic, cu att concluziile obinute pe eantion pot fi generalizate cu o certitudine mai mare asupra populaiei.

Modul de constituire a eantionului este decisiv pentru nivelul de reprezentativitate. Esenial n acest caz este asigurarea condiiilor ca acesta s acopere n mod real caracteristicile populaiei.

Mentionam incontinuare cele mai utilizate metode de constituire a eantioanelor (tehnicile de esantionare nu constituie obiectivul acestui curs):

Eantionare stratificat multistadial. Populaia se mparte n categorii, fiecare categorie n subcategorii .a.m.d., iar subiecii sunt selecionai aleator la nivelul categoriei de nivelul cel mai sczut. Se obine astfel un eantion care reproduce fidel structura populaiei.

Eantionare prin clasificare unistadial. Se identific categorii pe un singur nivel iar subiecii se extrag aleator din fiecare categorie.

Eantionare aleatoare. Subiecii sunt extrai aleator din ansamblul populaiei. Aleator, nseamn n acest caz utilizarea unei proceduri care asigur fiecrui subiect al populaiei absolut aceleai anse de a fi inclus n eantion. n acest scop se pot utiliza programe de calculator sau tabele de numere aleatoare.

Eantionare pseudo-aleatoare. Sunt utilizai subiecii disponibili. Este cazul cel mai frecvent ntlnit n practic.

Asadar, presupunnd c am obinut anumite rezultate pe un eantion aleator, raionamentul statistic ne permite s aplicm concluziile la ntreaga populaie din care a fost extras acel eantion. Este necesar ns existena unei precizri clare a populaiei de referin pentru c, dincolo de limitele acesteia, extrapolarea nu este permis.

Studii experimentale i studii corelaionale

Luind in discutie legtura cauzala dintre variabile, trebuie s retinem ca cel mai adesea intilnim dou tipuri de cercetri: experimentale i corelaionale.

n cazul studiilor experimentale, cercettorul nu se limiteaz la msurarea variabilei independente ci o i manipuleaz, iar concluziile unui astfel de studiu pot fi interpretate n mod cauzal.

n cazul studiilor numite corelaionale, variabilele dependente i independente sunt msurate n condiii care nu permit inferene de tip cauzal. n psihologie, ponderea studiilor corelaionale este mult mai mare dect a celor experimentale, care sunt mai pretenioase i mai dificil de realizat. Aceasta nu nseamn c studiile corelaionale nu sunt relevante. Un studiu corelaional nu presupunem doar utilizarea coeficientului de corelaie ci utilizarea oricrui tip de test statistic care urmrete punerea n eviden a legturii dintre variabile, fr ca rezultatele s fi fost obinute ntr-un context experimental.

PARAMETRIC/NEPARAMETRIC, DESCRIPTIV/INFERENTIAL

Statistica parametric i statistica neparametric

Statistica presupune utilizarea unor proceduri de calcul care urmresc punerea n eviden a unor legturi dintre variabile. Atunci cnd aceste proceduri se aplic unor situaii n care variabilele dependente sunt de tip cantitativ (interval/raport), procedura se numete parametric. De cealalta parte, procedurile aplicate n cazul n care variabilele dependente sunt de tip calitativ (nominale sau ordinale) se numesc neparametrice. Alegerea procedurilor statistice nu este deloc un proces simplu. El va fi mai clar inteles poate dup finalizarea cursului i dobndirea unei practici n materie. In cele ce urmeaza considerm suficient o prezentare general a celor dou categorii de proceduri statistice.

Statistica descriptiv i statistica inferenial

Statistica descriptiva. Dac aplicm un test de timp de reacie unui numr de 100 de persoane, putem calcula valoarea medie a timpilor de reacie, mprtierea acestora sau, utiliznd o tehnic de reprezentare grafic, modul n care se distribuie valorile prin raportare la un sistem de coordonate. Asadar, cu ajutorul statisticii descriptive ne putem face o imagine cu privire la caracteristicile unui distribuii luat n sine, fr a putea emite judeci comparative prin raportare la populaia din care face parte distribuia respectiv sau la un alt lot de valori din aceeai populaie. Cu toate acestea, vom vedea c statistica descriptiv este un pas obligatoriu i esenial pentru statisticile avansate.

Statistica inferenial. Vizeaza metodele de verificare a ipotezelor de cercetare prin testarea ipotezelor statistice. S presupunem c cei 50 de subieci de mai sus sunt supui aceluiai test de timp de reacie n condiii de noxe de mediu (zgomot excesiv, de exemplu) pentru a verifica ipoteza c zgomotul reduce promptitudinea reaciilor. ntr-un astfel de caz statistica inferenial ne pune la dispoziie metode specifice prin care s putem afirma, cu anumit probabilitate, c o eventual diferen dintre media timpilor de reacie msurai n cele dou condiii difer semnificativ sau nu.

Este important de reinut c alegerea statisticii parametrice sau neparametrice se face pornind de la natura variabilei dependente. Atunci cnd aceasta este de tip cantitativ, i nu se abate de la condiiile impuse de procedura statistic pe care dorim s o aplicm, se utilizeaz teste statistice parametrice. n orice alte condiii, se apeleaz la teste neparametrice. Aceast distincie este oarecum dificil de neles n acest stadiu de inceput al discuiei dar este important s fie inut minte.

Tablou recapitulativ al scalelor de msurare i statisticile adecvate

ScaleProceduri statistice adecvate

CALITATIVENOMINALENON PARAMETRICE

Valorile sunt expresia denumirii unei caracteristici a variabilei care privete un grup de subieci (de exemplu: tipul temperamental, o categorie de boli psihice, etc.). O anumit valoare nu ne spune nimic cu privire la celelalte valori.

ORDINALENivelurile variabilei exprim doar ordinea unora fa de celelalte. Lungimea intervalelor dintre valori este incert, subiectiv. O anumit valoare ne spune c exist valori mai mari sau mai mici dect ea, dar nu i care este dimensiunea acestei diferene dintre valori. (exemplu: Ct de mult apreciezi s fii cu colegii n timpul liber: F. PUIN, PUIN, MULT, F. MULT ). Atribuirea unei valori se face prin comparaie cu alte valori, i nu prin raportare la un criteriu extern (obiectiv)

CANTITATIVEINTERVALNivelurile sunt egal distribuite, adic, o unitate ntr-o zon a scalei este egal cu o unitate din orice alt zon a scalei. Asta nseamn c valorile variabilei definesc o anumit caracteristic prin raportare la un etalon extern, cel care garanteaz echivalena intervalelor (De exemplu: scala termometrului. Sau scorul la un test care marcheaz numrul de puncte realizate. n acest caz, acumularea punctelor) .PARAMETRICE (dac sunt respectate anumite condiii)

RAPORTLa fel ca mai sus, cu specificaia c nivelurile variabilei nu sunt doar egal distribuite ci exist i un zero absolut, care face s existe o valoare care indic absena total a caracteristicii.

Idea fundamental rmne aceea c, atunci cnd variabila dependent implicat ntr-un studiu statistic este msurat pe o scal de tip calitativ (nominal sau ordinal), se aplic una dintre procedurile statistice neparametrice. n cazul variabilelor msurate pe scale cantitative se aplic, de regul, statistici parametrice, fr ca acest lucru s fie posibil ntotdeauna.

DISTRIBUTIA DE FRECVENE

Distribuia de frecvene simple

Presupunem ca in urma aplicarii unui test de memorie s-au obtinut urmatoarele scoruri: 9, 8, 6, 5, 8, 8, 7, 6, 6, 4, 4, 10, 6, 4, 10, 9, 8, 8, 7, 7, 6, 6, 6, 4, 2

Avem un sir de date irelevant. Pentru a obtine o imagine mai clara asupra acestor date putem proceda la aranjarea lor ntr-o ordine descresctoare:

10, 10, 9, 9, 8, 8, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, 6, 6, 6, 5, 4, 4, 4, 4, 2

Privind datele astfel aranjate observam cu uurin cteva lucruri: valoarea cea mai mare, valoarea cea mai mic si valorile care se repet.

Primul pas aflarea departarii intre valorile extreme: amplitudinea. Acesta este in fapt diferenta intre valoarea cea mai mare (Xmax) si valoarea cea mai mica (Xmin).

10(Xmax) 2(Xmin) = 8(amplitidinea)

Adaugind 1 la acesta diferenta aflam cite valori distincte avem in sirul de date.

Xmax Xmin + 1

10 - 2 + 1 = 9

Asadar vom avea 9 valori intregi, distincte. Putem sistematiza incontinuare materialul trecind intr-o coloana valorile diferite in ordine descrescinda (10, 9, 8, .....) si notam in dreptul fiecareia, de cite ori se repeta acesta in sirul initial.

Putem determina in acest fel efectivele corespunzatoare fiecarei valori, realizindu-se in acest fel o distributie de efective sau de frecventa. Acest lucru se mai poate scrie si sub forma unui tabel de frecventa cu forma:Tabelul 1. Frecvene simple

Valoare fa

102

92

85

73

67

51

44

30

21

Total(fa=25

Am realizat astfel un protocol sistematizat, clasificat. Sintem aici la nivelul procedurilor statistice liminare adica in pragul analizei statistice, pregatind aplicarea tehnicilor ulterioare. La acest nivel datele pot fi reprezentate si sub diferite forme grafice (diagrama in dreptunghiuti, in stelute, bare etc.)Dac lum n considerare seria de valori de mai sus, un tabel al frecvenelor simple (absolute) este compus din lista valorilor distincte, ordonate descresctor, la care se adaug frecvena absolut (fa) a fiecrei valori (de cte ori se ntlnete n cadrul seriei fiecare valoare).

Se observ astfel c datele au un caracter mai ordonat iar coloana frecvenelor absolute scoate n eviden anumite aspecte cum ar fi, de exemplu, faptul c cea mai frecvent valoare este 6 (apare de 7 ori). Observm c seria de valori din tabel include toate valorile posibile ntre valoarea cea mai mare (10) i cea mai mic (2), incluznd

i valorile care nu se ntlnesc n mod real n cadrul seriei. n cazul nostru avem valoarea 3, cu frecvena de apariie 0. Suma frecvenelor absolute ((fa) indic totalul valorilor din cadrul seriei (25).

n practic, pe lng frecvenele absolute se iau n considerare i alte tipuri de frecvene (tabelul 2):

Frecvena cumulat (fc). Totalul valorilor care se cumuleaz ncepnd de la valoarea cea mai mare pn la valoarea cea mai mic din tabel. De exemplu, n tabelul sintetic de mai jos, avem 6 valori mai mici sau egale cu 5, 21 de valori mai mici sau egale cu 8 i, evident, 25 de valori mai mici sau egale cu 10.

Frecvena relativ raportat la unitate fr(1). Este raportul dintre frecvena absolut i suma frecvenelor absolute (fa/(fa).

Exemple: pentru valoarea 10: fa/(fa=2/25=0.08;

Frecvena relativ procentual fr(%): Exprim procentul valorilor care se situeaz pn la o anumit valoare din cadrul distribuiei. Se calculeaz fie prin nmulirea fr(1) cu 100, fie prin calcularea direct a procentului pe care l reprezint o anumit valoare raportat la totalul valorilor dintr-o distribuie. Suma frecvenelor relative procentuale este ntotdeauna egal cu 100.

Exemplu: 8% dintre subiecii evaluai au realizat 10 rspunsuri corecte

Frecvena relativ cumulat procentual (frc%): Exprim procentul valorilor dintr-o distribuie care se plaseaz pn la o anumit valoare (inclusiv aceasta).

Exemplu: 52% dintre studeni au obinut o not egal sau mai mic de 6

Frecvena relativ procentual cumulat se numete rang percentil. Astfel, despre valoarea 6 din distribuia de mai sus se poate spune c are rangul percentil 52, adic, 52% dintre valorile unei distribuii sunt ntre cea mai mic valoare i valoarea 6, inclusiv.

n mod complementar, numim percentil, valoarea dintr-o distribuie care corespunde unui anumit rang percentil. n exemplul de mai sus, rangului percentil 52 i corespunde valoarea 6, numit, de aceea, percentila 52.

n practic, exist anumite percentile care au o importan aparte. Acestea sunt percentilele corespunztoare rangurilor percentile cu valorile 10, 20, 30,..., 100. Despre semnificaia lor vom vorbi mai trziu n acest curs. De asemenea, se utilizeaz termenul de quartile pentru pecentilele care mpart distribuia n patru zone egale ca numr de valori. Acestea sunt corespunztoare rangurilor percentile de 25, 50 i 75. Cu alte cuvinte, valoarea dintr-o distribuie pn la care se afl 25% din valori este percentila 25, valoarea pn la care se afl 50% este percentila 50, iar valoarea pn la care se afl 75% din valori este percentila 75.

Tabelul 2. Tabloul sintetic al frecvenelor simple

ValoareFaFcFr (1)frc (1)fr (%)frc (%)

102250,081,008%100%

92230,080,928%92%

85210,200,8420%84%

73160,120,6412%64%

67130,280,5228%52%

5160,040,244%24%

4450,160,2016%20%

30100,040%4%

2110,040,044%4%

Total(fa=25(fr=1(fr%=100

Distribuia de frecvene grupate

Prelucrarea realizata mai sus este indicata doar in cazul existentei unui numar redus de date, adica intinderea variatiei (amplitudinea) este redusa.

Cind amplitudinea este relativ mare urmeaza sa facem o distributie mai compacta pentru a asigura o concentrare suficienta a informatiei.S presupunem c valorile de mai jos reprezint distribuia variabilei memorie consemne msurat prin aplicarea unui test specific.

Tabel 3.

26

2732353737373939

3939404143444546

4747474848494949

4950515252525253

5353535454545454

5557575858585858

5859616363646566

6668697172747578

79

Datele din tabel sunt deja ordonate crescator.

1. Se impune atunci gruparea valorilor in clase pentru relevarea regularitatii de ansamblu a datelor. Dincolo de sugestiile statisticienilor in acest sens (ex. H. Sturges relatia empirica) alegerea numarului de clase, dupa un interval de grupare i este o operatiune in buna masura la latitudinea cercetatorului (experienta acestuia) dar ea trebuie sa tina cont totusi de o serie de recomandari:

nu exista, teoretic, un numar optim de intervale insa alegerea acestora nu trebuie sa influenteze tendinta de ansamblu a fenomenului studiat;

numarul de clase sa nu depaseasca 20, dar sa se evite frecventele mici pe clasa

in cercetarile psihologice se alege de obicei un numar impar de clase (3, 5, 7, 9, 11) pentru o serie de avantaje (observarea simetriei distributiei, existenta unei clase centrale);

pentru ca gruparea reprezinta un moment important in organizarea datelor se poate apela la mai multe variante de grupare pina se ajunge la situatia optima.

2. Precizarea intervalului de grupare i se face cu formula:

i = Xmax Xmin +1 / k unde k=nr. de clase

In exemplul nostru, alegind un numar de 9 clase vom avea

i = 79 26 +1/ 9 = 6

Vom determina clasele si apoi cite valori din sirul initial intra in fiecare clasa determinind in acest fel efectivele pe fiecare interval.

ClintervalDeterminarea efectivelorEfec(frec.)f%

126-31\ \21,6

232-37\ \ \ \ \ 57,8

338-43\ \ \ \ \ \ \710,9

444-49\ \ \ \ \ \ \ \ \ \ \ \1218,8

550-55\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \1625

656-61\ \ \ \ \ \ \ \ \914,1

762-67\ \ \ \ \ \ \710,9

868-73\ \ \ \46,2

974-79\ \ \ \44,7

i = 6N= 66100%

Daca insumam coloana efectivelor obtinem N (efectvul total al grupului).

Pentru ca, de multe ori, este nevoie de tabele comparative se apeleaza la exprimarea procentuala a frecventelor pe interval. Procedeul de calcul este simplu regula de trei simple: N se ia 100% si frecventa pe fiecare interval. Se obtine o noua coloana in procente care, totalizate, trebuie sa dea 100 sau ceva f. apropiat.

Incheind operatia de grupare, se obtine o distributie statistica care formeaza baza prelucrarii statistice a materialului.

Cind dispunem de computer si soft aferent, toate aceste operatiuni pot fi executate foarte usor.

Limite aparente i limite reale ale intervalelor de clas

n exemplul de mai sus distribuia conine valori, exprimnd, s zicem, scorul obinut la test n numere ntregi. Dar dac rezultatul ar fi msurat n numere zecimale? (ex. 67,7). ntr-un asemenea caz limitele intervalelor din tabelul de mai sus ar fi limite aparente deoarece prin rotunjire, valorile zecimale cu mai mult de 5 zecimi ar fi aduse la ntregul urmtor, n timp ce valorile cu pn la de 5 zecimi s-ar rotunji n jos (acest mod de rotunjire este unul convenional). Cu alte cuvinte, 67.7 ar intra n intervalul 68-73. Astfel, limitele reale ale intervalelor, dei sunt cu numere zecimale, vor apare ca numere ntregi (limite aparente).

REPREZENTRI GRAFICE

Reprezentrile graficele sunt forme intuitive de prezentare a distribuiilor de frecvene (o imagine face mai mult dect o mie de cuvinte). Ele sunt foarte frecvent utilizate pentru analiza i prezentarea datelor n psihologia aplicat deoarece faciliteaz nelegerea semnificaiei datelor numerice. n prezent, programele computerizate ofer mijloace extrem de puternice i de sofisticate pentru elaborarea reprezentrilor grafice. Dar simpla utilizare a unui astfel de program nu garanteaz realizarea unui grafic eficient. n esen, un grafic eficient este o combinaie reuit ntre form i coninutul statistic pe care l reflect. Realizarea acestei combinaii depinde de respectarea ctorva principii eseniale:

focalizarea pe coninutul i nu pe forma graficului

este recomandabil s fie utilizate grafice care favorizeaz comparaii ntre variabile i nu doar reprezentri individuale, statice, ale acestora

fiecare grafic trebuie s serveasc un singur scop, exprimat clar i evident

orice grafic va fi nsoit de informaii statistice i descrierile necesare pentru a fi uor i corect neles

un grafic trebuie s scoat n eviden datele i nu abilitile tehnice de editare ale celui care l-a creat.

Formele de expresie grafic a datelor statistice sunt foarte numeroase. Cele mai utilizate metode in grafica: diagrama, histograma, poligonul frecventelor, curba frecventelor cumulate, graficul circular si graficul de tip stem and leaf (tulpin i frunze).

Diagrama

Reprezinta cel mai simplu mod de reprezentare grafic a datelor. Se utilizeaz atunci cnd dorim s reprezentm o variabil discret (care prezint valori ntregi, de exemplu, numrul de rspunsuri corecte la un test n funcie de nivelul de instruire al subiecilor).

n mod obinuit, un grafic se prezint ca o imagine inclus ntr-un sistem de axe perpendiculare:

Axa orizontal (Ox) pe care sunt reprezentate valorile distribuiei

Axa vertical (Oy) pe care sunt reprezentate frecvenele fiecrei valori, sub forma unei bare rectangulare.

Histograma

La prima vedere, histograma este asemntoare cu graficul de tip bar. Ea este adecvat pentru situaiile cnd variabila pe care dorim s o reprezentm este de tip continuu (adic poate lua orice valoare pe o scal numeric). Iat, de exemplu, histograma distribuiei de frecvene din tabelul 3 (realizat cu programul SPSS):

Se observ faptul c programul a realizat automat o grupare de frecvene, afind pe axa Ox limita minim a intervalului ca etichet a acestuia.

Poligonul de frecvene

Este o reprezentare alternativ la histogram. Punctele centrale ale suprafeelor rectangulare care reprezint frecvena sunt unite cu o linie care delimiteaz suprafaa poligonului.

Graficul frecvenei cumulate

Este un grafic de tip liniar care reprezint valorile frecvenei absolute cumulate. Pe acest grafic se vede cu uurin cte valori se afl pn la o anumit valoare din distribuie (datele reprezentate sunt cele din tabelul 3).

Graficul circular

In practica psihologica se utilizeaza mai des diagramele circulare la construirea carora se utilizeaza cercul. Acesta se imparte in sectoare proportionale cu valorile pe care le reprezinta.

Obs. De retinut ca diagrama circulara se utilizeaza in cazurile in care datele se preteaza la prezentare in indici procentuali.

Concluzii.

Utilizarea tabelelor de frecven i a reprezentrilor grafice aduce un important ctig n analiza datelor statistice. Este ns, important s reinem faptul c att tabele ct i reprezentrile grafice nu sunt dect nceputul analizei datelor nu i sfritul acesteia. Cu alte cuvinte, nu vom putea trage direct concluzii pe baza lor. Ele pot fi utilizate, ns, pentru a ilustra concluzii, care devin astfel mai uor de neles i de reinut. n fazele primare de analiz a datelor statistice, graficele ne ajut s ne facem o imagine general asupra acestora, lucru util pentru alegerea procedurilor statistice. Este important s alegem tipul de grafic adecvat n raport cu natura datelor i cu ideea pe care dorim s o ilustrm. n practic, graficele se realizeaz utiliznd programe specializate, iar SPSS are proceduri puternice de realizare a unei largi varieti de grafice.

INDICATORI NUMERICI AI DISTRIBUIILOR STATISTICE

Analiza de frecvene este o metod util pentru punerea n valoare a unor caracteristici ale distribuiilor statistice. Cu toate acestea, ea este tributar necesitii de a manipula ntreaga cantitate de date, toate valorile unei distribuii (fie ele i grupate). Pentru a elimina acest neajuns sunt utilizai aa numiii indicatori sintetici. Acetia sunt descriptori numerici care condenseaz ntr-o valoare unic o anumit caracteristic a unei ntregi distribuii de valori. Principalele avantaje pe care le ofer sunt concentrarea semnificaiei i uurina utilizrii.

Tipuri de indicatori sintetici:

Trei sunt caracteristicile distribuiilor care sunt evaluate cu ajutorul indicatorilor sintetici: tendina central, variabilitatea (mprtierea) si forma distribuiei. Pentru fiecare din aceste caracteristici se utilizeaz anumii indicatori specifici:

Indicatori ai tendinei centrale: valori tipice, reprezentative, care descriu distribuia n ntregul ei;

Indicatori ai variabilitii: valori care descriu caracteristica de mprtiere a distribuiei;

Indicatori ai formei distribuiei: valori care se refer la forma curbei de reprezentare grafic a distribuiei, prin comparaie cu o curb normal (oblicitate, aplatizare).

Indicatorii tendinei centrale

Indicii prin care se determina in mod curent tendinta centrala a rezultatelor si pe care cercetatorul trebuie sa-i determine sint: media, mediana si modul.MEDIA ARITMETIC (m)

Media (m) este un descriptor al unui ansamblu de date care exprima suma valorilor datelor numerice, impartita la numarul acestora.

Notaii uzuale:

( (miu), atunci cnd este media ntregii populaii de referin

m, atunci cnd se calculeaz pentru un eantion (cazul cel mai frecvent)Calcularea mediei pentru o distribuie simpl de frecvene se face prin adunarea valorilor i se mprirea la numrul lor

in care

(=suma de

x=rezultatele, valorile individuale

N=efectivul grupei studiate

Proprietile mediei aritmetice

Adugarea\scderea unei constante la fiecare valoare a distribuiei, mrete\scade media cu acea valoare

nmulirea\mprirea fiecrei valori a distribuiei cu o constant, multiplic\divide media cu acea constant

Suma abaterii valorilor de la medie este ntotdeauna egal cu zero

Asadar prin calcularea mediei obtinem o masura a nivelului mediu relativ la un esantion, fapt ce va permite comparatii intre grupe.Combinarea mediilor provenind de la esantioane diferite

Sint cazuri cind sintem nevoiti sa aglutinam doua sau mai multe grupuri independente pentru a obtine o medie comuna. Se recomanda pentru aceasta utilizarea formulei:

M= n1m1+n2m2+.....+nkmk\N in care

m1,m2,mk media grupelor independente

n1,n2,nk numarul subiectilor grupelor

N=nr. total de subiecti

Formula de contopire a mediilor se poate extinde la k grupe in functie de necesitati.

MEDIANA (Me)

Este valoarea din mijlocul unei distribuii, adic aceea care are 50% dintre valori deasupra ei i 50% dintre valori dedesubtul ei (percentila 50).

Pentru a gasi mediana trebuie sa aranjam toate datele (valorile) dupa rang, de la valoarea cea mai mica la cea mai mare (sau invers). Mediana este acea valoare care imparte sirul ordonat de valori in doua grupe egale ca numar. Altfel spus, mediana se gaseste la mijlocul sirului. Locul sau rangul pe care-l ocupa mediana in sirul ordonat de date se determina cu ajutorul formulei: N+1\2.Atentie! Formula N+1\2 ne indica locul medianei si nu valoarea ei.

n cazul distribuiilor cu numr impar de valori, Me este chiar valoarea respectiv.

n cazul distribuiilor pare, Me se calculeaz ca medie a celor dou valori din mijlocul distribuiei

Exemplu:

n seria de valori 5,8,3,2,5,4, ordonat cresctor (2,3,4,5,5,8), Me=4,5 (ca medie a valorilor 4 i 5 aflate n mijlocul unei distribuii pare). Dac distribuia noastr ar fi avut 5 valori (fr 2, de exemplu), Me=5

MODUL (Mo)

Modul este valoarea care se repeta cel mai des intr-un sir de date, adica valoarea cu frecventa cea mai mare. Modul poate fi determinat prin simpla examinare a valoarilor, fara a se recurge la operatii de calcul.

Exemplu: in sirul de date 3, 4, 5, 6, 7, 7, 7, 8, 8, 10, 11

Mo=7

Pot exista cazuri extreme cind un sir de date poate prezenta doua valori cu frecvente maxime egale; in acest caz vorbim de doua module. Cind cele doua valori de frecvente egale sint vecine in sirul de date, modul va fi reprezentat de valoarea intermediara a celor doua. De asemenea, in cazul unui sir de date in care fiecare valoare apare o singura data (frecventa=1) nu se poate determina modul.

Distribuiile pot avea un singur mod (unimodale), dou moduri (bimodale) sau mai multe (multimodale)

Avantajele i dezavantajele indicatorilor tendinei centrale

Tabloul de mai jos prezint, n mod sintetic avantajele i dezavantajele specifice indicatorilor tendinei centrale:

AVANTAJEDEZAVANTAJE

MODUL- Uor de aflat (nesemnificativ n prezent);

- Poate fi utilizat pentru orice tip de scal;

- Este singurul indicator pentru scale nominale;-

- Corespunde unui scor real al distribuiei;- n general, nesigur, mai ales n cazul eantioanelor mici, cnd se poate modifica dramatic la o modificare minor a unei valori;

- Poate fi greit interpretat. Se identific total cu un scor anume, fr a spune nimic despre celelalte valori;

- Nu poate fi utilizat n statistici infereniale;

MEDIANA- Poate fi utilizat pe scale ordinale i de interval\raport;

- Poate fi utilizat i pe distribuii de frecven cu clase deschise sau scoruri nedeterminate la marginile distribuiei;- Poate s nu corespund unei valori reale (N par);

- Nu reflect valorile distribuiei (un scor extrem se poate modifica, fr a afecta Me);

- Este mai puin sigur n extrapolarea de la eantion la populaie;

- Greu de utilizat n statistici avansate

MEDIA- Reflect valorile ntregii distribuii;

- Are multe proprieti statistice dezirabile;

- Adecvat pentru utilizare n statistici avansate;- De obicei nu corespunde unei valori reale;

- Nu este tocmai adecvat pentru scale ordinale;

- Conduce la interpretri greite pe distribuii asimetrice

- Poate fi puternic afectat de scorurile extreme;

INDICATORI SINTETICI AI IMPRASTIERII

Indicatorii tendintei centrale caracterizeaza un singur aspect al distributiei statistice. Doua distributii statistice pot avea aceeasi medie dar ele pot fi foarte diferite sub aspectul variabilitatii, al omogenitatii.

Indicatorii mprtierii se refer la caracteristica de variabilitate, care descrie diferenele existente ntre valori. n cazul tendinei centrale este scoas n eviden caracteristica valorilor unei distribuii de a se asemna unele cu altele, asemnare surprins de indicatorii tendinei centrale. n cazul mprtierii, se urmrete descrierea tendinei valorilor de a se deosebi una de alta, de a se sustrage unei tendine centrale prin ndeprtarea de aceasta. De exemplu, o distribuie de tipul 6,5,6,5,4,5 este, evident, mult mai omogen (mai puin variabil) dect o distribuie de genul 2,3,4,5,8,9. Cu ct valorile difer mai mult una de alta, cu att variabilitatea distribuiei este mai mare.

S ne imaginm urmtoarea situaie: Un psiholog scolar vrea s vad efectul unei metode de cretere a ncrederii n sine pe un lot de elevi. n acest scop, el evalueaz ncrederea n sine nainte i dup o serie de edine specifice. Distribuia valorilor este reprezentat n imaginea de mai jos:

Aa cum se observ, valorile ncrederii msurate nainte de interventie au o medie de 30 i o mprtiere (neomogenitate) mai mare, n timp ce valorile de dup interventie prezint o medie de 40 i o mprtiere mai mic, (sunt mai omogene). Acest fapt sugereaz c tratamentul psihoterapeutic a avut efect. Imaginea scoate n eviden i faptul c n distribuiile mai omogene media este mai reprezentativ dect n distribuiile mai puin omogene.

Pentru evaluarea mprtierii distribuiilor statistice se utilizeaz mai muli indicatori.

1. Amplitudinea (R de la Range)

Este dat de diferena dintre valoarea maxim i valoarea minim a unei distribuii

R=Xmax-Xmin

Utilitatea ei este dat de faptul c ne indic n mod absolut plaja de valori ntre care se ntinde distribuia.

Principalul dezavantaj const n faptul c poate fi influenat de o singur valoare aflat la extremitatea distribuiei.

2. Abaterea interquartil (RSQ):

Semnific distana unui un scor tipic fa de amplitudinea ntregii distribuii i se calculeaz ca media diferenei dintre quartila 3 i quartila 1.

ntr-o distribuie perfect simetric RSQ=Q2=MeRSQ nu este afectat de valorile aberante fiind considerat, din acest motiv, un indicator robust al mprtierii

Acest tip de indicator ilustreaz mprtierea prin distana dintre dou puncte ale unei distribuii. Unul dintre avantajele lor este acela al uurinei de calcul. Pe de alt parte, tocmai pentru c iau n seam doar dou dintre valorile distribuiei, sunt vulnerabili i nesiguri. Utilitatea lor este n general limitat dar sunt singurii care pot fi folosii atunci cnd indicatorii de care vom vorbi n continuare, nu pot fi calculai.

Spre deosebire de primii doi indicatori (elementari), urmatorii indicatorii (sintetici) surprind mprtierea unei distribuii prin luarea n considerarea abaterii fiecrei valori de la un anumit indicator al tendinei centrale. Cel mai uzual indicator de referin pentru mprtiere este media. Aceasta pentru c, aa cum ne amintim, media are avantajul de a fi o concentrare a tuturor valorilor unei distribuii.

3. Abaterea medie

4. Dispersia (variana)

Notaii uzuale:

s2 (cnd se calculeaz pentru eantion)

(2 (cnd se calculeaz pentru ntreaga populaie)

Pentru a elimina inconvenientul abaterilor de la medie de a avea, se opereaz ridicarea la ptrat a abaterilor valorilor individuale.

Dac nsumm abaterile ridicate la ptrat (ptratice) i le mprim la numrul valorilor, obinem dispersia (numit i varian sau abatere medie ptratic)

Totui, din cauza ridicrii la ptrat, dispersia nu reprezint o valoare foarte bun a mprtierii (de ex., poate fi mai mare dect amplitudinea distribuiei). Soluia acestui neajuns o constituie:

5. Abaterea standard

Notaii uzuale:

s (pentru eantioane)

( (pentru populaie)

SD (Standard Deviation, n standardul APA )

ab.std.

Abaterea standard se obine prin extragerea radicalului din expresia abaterii medii ptratice (dispersiei).

Formula de calcul:

Operaiile succesive efectuate mai sus, ridicarea la ptrat i extragerea radicalului, nu trebuie vzute ca operaii artificiale, gratuite. Aceste operaii nu se refer la valorile distribuiei ci la abaterile de la medie, ceea ce conduce la rezultate diferite care exprim, ntr-o alt form, aceeai caracteristic de mprtiere a valorilor originale.

Semnificatia abaterii standard

Abaterea standard poate fi luata ca unitate de masura pe abcisa unei curbe de frecventa simetrice, acesta mai ales pentru ca ea se exprima in aceleasi unitati ca si cotele brute cu care se lucreaza. Astfel se poate pleaca de la punctul de pe abcisa care corespunde mediei esantionului in studiu si se adauga , respectiv se iau succesiv in dreapta si din stinga mediei sens crescator si respectiv descrescator - unitati de abateri standard. Se obtin astfel punctele din dreapta: 1s, 2s, 3s, sens crescator al cotelor brute, si din stinga -1s, -2s, -3s sens descrescator al cotelor brute.

(vezi fig. din anexa - curba cu sase repere si procente pe intervale)

Deci vom avea:

-3s, -2s, -1s, m, 1s, 2s, 3s

Intr-o distributie simetrica exista aproximativ 3s sub medie si 3s deasupra mediei ceea ce se scrie +-3s. Astfel amplitudinea sau intinderea variatiei este de aproximativ 6s iar abaterea standard este a sasea parte din amplitudine.

Apar astfel arii a unor suprafete de sub curba normala ce pot servi la estimarea unor probabilitati, exprimata si sub forma procentuala:

intre -s si +s se afla aproximativ 68% din totalul valorilor

intre -2s si +2s se afla aproximativ 95% din tot. valorilor

intre 3s si +3s se afla cam 99,95% din total adica aproape toate valorile

Sa retinem deci ca:

s masoarea distanta la care se afla o cota oarecare in raport cu m

exista o interpretare procentuala a celor 6 puncte de reper

abaterea standard se determina doar in cazul distributiilor normale, simetrice.

Coeficientul de variaie

Abaterea medie i abaterea standard se exprim n unitile de msur ale variabilei de referin. De exemplu, pentru o distribuie de timpi de reacie, exprimai n sutimi de secund, s=2.14 nseamn c mprtierea standard este de 2.14 sutimi de secund.

Dac acelai eantion face i un test de coordonare a micrilor, evaluat n numr de ieiri din traseu a cror abatere standard este s=20.94, nu putem compara omogenitatea celor dou serii de valori. Adic, nu putem spune dac eantionul este mai omogen sau mai puin omogen din perspectiva uneia dintre cele dou performane.

Dintre soluiile posibile pentru eliminarea acestui neajuns, cea mai des utilizat este coeficientul de variaie (variabilitate), notat cu cv (sau v), propus de Pearson. Se calculeaz ca raport ntre abaterea standard i medie. Poate fi exprimat i procentual conform formulei de mai jos:

Valoarea acestui coeficient exprim un raport procentual dintre abaterea standard i medie. Cu ct este mai mare, cu att putem spune c media este mai puin reprezentativ pentru distribuia respectiv, dat fiind ponderea ridicat a mprtierii. Utilizarea coeficientului de variaie este limitat la valorile msurate pe scale de raport, cu origine natural 0. n cazul a dou variabile a cror origine este diferit una de alta, diferenele dintre valori (abaterea standard) rmn aceleai dar media se schimb, fapt care face ca raportul exprimat n formul s fie modificat iar comparaia a doi coeficieni de variaie, irelevant.

Utilitatea coeficientului de variaie vine de la faptul c valoarea sa mai este legat de unitatea de msur. Diferena dintre dou valori cv poate fi interpretat ca diferen de mprtiere a celor dou variabile, chiar dac msoar lucruri diferite.

Sunt propuse anumite limite de interpretare a acestui indicator, astfel:

dac cv