moksliniu tyrimu metodologija statistines analizes metodai priemones n
TRANSCRIPT
LIETUVOS SVEIKATOS MOKSLŲ UNIVERSITETAS
VETERINARIJOS AKADEMIJA
MOKSLINIŲ TYRIMŲ METODOLOGIJA,
STATISTINĖS ANALIZĖS METODAI IR
PRIEMONĖS
Vida Juozaitienė, Arūnas Juozaitis, Sigita Kerzienė
Kaunas 2011
1
TURINYS
1. ĮVADAS .............................................................................................................................. 3
2. MOKSLO SAMPRATA ..................................................................................................... 4
3. INFORMACIJA IR JOS SAVYBĖS .................................................................................. 6
4. PAŽINIMO PRINCIPAI IR RAIDA .................................................................................. 7
4.1 Kasdieninis ir mokslinis žinojimas .............................................................................. 8
4.2 Empirinis ir teorinis pažinimas .................................................................................... 9
5. MOKSLO METODOLOGIJA IR METODAI .................................................................. 10
5.1 Metodologijos samprata ............................................................................................ 10
5.2 Empirinis tyrimas ...................................................................................................... 11
5.3 Tyrimo metodas ......................................................................................................... 12
5.4 Hipotezės ................................................................................................................... 13
5.5 Mokslinių tyrimų darbų eiga ..................................................................................... 16
5.5.1 Temos pasirinkimas ............................................................................................... 16
5.5.2 Literatūros studijavimas ........................................................................................ 17
5.5.3 Pasiruošimas tyrimui ir tyrimo organizavimas. ..................................................... 18
6. BANDYMŲ ATLIKIMO TVARKA IR PAGRINDINIAI REIKALAVIMAI ................ 20
6.1 Bendri bandymų su gyvūnaiss organizavimo principai ............................................. 20
6.2 Bandymų metodai ...................................................................................................... 22
6.3 Gyvūnų parinkimas bandymams ir jų suskirstymas į grupes .................................... 25
6.4 Bandymų organizavimo principai su paukščiais ....................................................... 27
6.5 Pašarų virškinamumo bandymų organizavimo principai .......................................... 28
7. STATISTINIAI METODAI MOKSLINIAME TYRIME ................................................ 31
7.1 Atrankos (imčių) metodai .......................................................................................... 31
7.1.1 Imtis ir populiacija. Imčių sudarymo būdai. .......................................................... 31
7.1.2 Požymiai ................................................................................................................ 33
7.2 Aprašomoji statistika ................................................................................................. 34
7.2.1 Duomenų grupavimas. Dažniai. ............................................................................ 35
7.2.2 Grafinis dažnių skirstinio vaizdavimas ................................................................. 38
7.2.3 Aprašomosios statistikos rodiklių skaičiavimas .................................................... 40
7.3 Dinamikos (laiko) eilutės .......................................................................................... 44
7.4 Indeksų metodas ........................................................................................................ 49
2
7.5 Statistiniai sprendimai. Parametriniai ir neparametriniai metodai ............................ 51
7.5.1 Imties reprezentatyvumas ...................................................................................... 51
7.5.2 Pasikliautinieji intervalai ...................................................................................... 52
7.5.3 Būtinojo imties dydžio nustatymas ....................................................................... 53
7.5.4 Hipotezių tikrinimas .............................................................................................. 55
7.5.5 Statistinės išvados vienai imčiai ............................................................................ 56
7.5.6 Statistinės išvados dviems imtims ......................................................................... 58
7.6 Koreliacinė ir regresinė analizė ................................................................................. 61
7.6.1 Tiesinė regresija ..................................................................................................... 61
7.6.2 Tiesinė koreliacija.................................................................................................. 65
7.6.3 Daugialypė regresija .............................................................................................. 66
7.7 Dispersinė analizė ...................................................................................................... 68
7.8 Kokybinių požymių analizė ....................................................................................... 71
7.9 R statisnis paketas .................................................................................................... 74
7.9.1 Duomenų analizės R statistiniu paketu pavyzdžiai ............................................... 81
8. TYRIMO ATASKAITOS PARENGIMAS ...................................................................... 92
9. TYRIMO VERTINIMAS .................................................................................................. 92
10. MOKSLINIO DARBO STRUKTŪRA ............................................................................. 92
11. MOKSLINIŲ PUBLIKACIJŲ RENGIMAS SPAUDAI .................................................. 93
12. IŠRADIMAI IR JŲ PATENTAVIMAS ........................................................................... 94
13. LITERATŪROS SĄRAŠAS ............................................................................................. 97
14. PRIEDAI ........................................................................................................................... 98
3
1. ĮVADAS
Pasaulinės informacinės visuomenės kūrimosi procesas XXI amžiuje žymiai padidina mokslo
vaidmenį įvairiose visuomenės gyvenimo srityse. Masiškas asmeninių kompiuterių panaudojimas
bei investicijų į mokslinius tyrimus svarbos akcentavimas reikalauja patikimos tyrimų atlikimo
kokybės.
Atskiros mokslo sritys išsiskiria savo specifiškumu, tačiau yra ir bendrų sąvokų bei teiginių,
susijusių su mokslo apibūdinimu, tyrimų metodais ir metodologija, empirinių ir teorinių statistinių
dydžių nagrinėjimu ir pan.
Šiame leidinyje pateikiamos mokslinio tyrimo pagrindų žinios biomedicinos moksluose, kurios
reikalingos pradedantiems tyrėjams. Duomenys sukaupti įvairiuose šalies ir užsienio
universitetuose. Pastaruoju metu pastebimas tyrimų metodologijos trūkumas, kas apsunkina
magistrantūros ir doktorantūros baigiamųjų darbų ruošimą. Manome, kad šis leidinys padės
pradedančių mokslininkų darbuose biomedicinos mokslų srityje ir bus naudingas Veterinarijos ir
Veterinarinės maisto saugos studijų programų studentams.
4
2. MOKSLO SAMPRATA Mokslo sąvoka žinoma seniai, tačiau jos supratimas yra labai įvairus, nes pats mokslinis
procesas pasižymi sudėtingumu.
Istorijos eigoje mokslas vystėsi netolygiai. Pagrindiniai mokslo raidos etapai:
- Senovės akmens amžius;
- Naujasis akmens amžius;
- Geležies amžius;
- Viduramžių mokslas;
- Renesanso laikotarpis;
- XVIII – XIX amžiaus mokslas;
- XX-XXI amžiaus mokslas.
Vienos teorijos keitė kitas, tuo sukeldamos didelius revoliucinius persitvarkymus. Tai būdinga
ir biologiniams mokslams. Todėl į mokslą žiūrima iš įvairių pozicijų - kaip į:
1) instituciją (mokslas – tai profesija, kurios praktika tiesiogiai ekonominės naudos
neduoda);
2) pažinimo būdą;
3) žinių kaupimo priemonę (faktai – sukaupiami, o rezultatai grupuojami, analizuojami,
lyginami ir t.t. prieš panaudojimą);
4) gamybos plėtros veiksnį;
5) veiksnį, formuojantį požiūrį į žmogų ir pasaulį;
6) reiškinį (žmonių veiklą, kurios pagrindinė funkcija – gauti ir teoriškai susisteminti
objektyvias žinias apie tikrovę).
Moksle, po daugelio tyrimų, duomenų analizių ir apibendrinimų, formuluojami dėsniai,
principai, hipotezės, galiausiai sukuriama tam tikra teorija, nuo ko ir prasideda praktinis mokslo
pritaikymas.
Tyrimo metodas yra mokslo taktika, o mokslo strategija – tai problemų, kurias reikia spręst,
parinkimas.
Mokslui būdinga savita kalba, kad mokslininkai galėtų suprasti vieni kitus (daug graikų ir
lotynų kalbų žodžių).
Viena pagrindinių mokslo funkcijų – naujų dėsnių ir dėsningumų atradimas, kurie vienaip ar
kitaip galėtų būti panaudoti praktinėje veikloje.
Mokslinio tyrimo objektu gali būti bet kuri žmogaus veikla, pažinimo sritys. Pagal tyrimų
pobūdį mokslą priimta skirstyti į:
1) fundamentalųjį (teorinėms mokslo problemoms nagrinėti, formuluoti naujus dėsnius);
2) taikomąjį (skirtą praktiškai pritaikyti fundamentaliųjų tyrimų rezultatus).
5
Kalbant apie mokslo struktūrą, išskiriama mokslo šakos ir kryptys. Pirmoje lentelėje
pateikiamas studijų kryptis sudarančių šakų sąrašas žemės ūkio ir veterinarijos studijų krypčių
grupėje. (Lietuvos respublikos švietimo ir mokslo ministro įsakymas „ Dėl studijų kryptis
sudarančių šakų sąrašo patvirtinimo“. 2010m. vasario 19d. Nr.V-222, Vilnius).
1 lentelė. Studijų kryptis sudarančių šakų sąrašas Žemės ūkio ir veterinarijos studijų krypčių
grupėje.
Studijų krypčių grupė – žemės
ūkis ir veterinarija Studijų kryptį sudarančių šakų pavadinimai
D100 Ikiklinikinė veterinarinė
medicina –
D200 Veterinarinė medicina
D210 Klinikinė veterinarinė medicina
D220 Klinikinė veterinarinė odontologija
D400 Žemės ūkis
D410 Žemės ūkio augalų auginimas
D420 Ūkinių gyvūnų auginimas
D430 Žuvų auginimas
D440 Dekoratyvusis želdinimas
D450 Ūkininkavimas
D460 Ekologinis ūkininkavimas
D500 Miškininkystė
D510 Miško auginimas
D520 Miško ekosistemų apsauga
D530 Miško išteklių apskaita ir projektavimas
D540 Medienos mokslas
D550 Laukinių gyvūnų populiacijų valdymas ir
medžioklininkystė
D560 Miestų ir rekreacinė miškininkystė
D600 Maisto studijos
D610 Maisto mokslas
D620 Maisto higiena
D630 Maisto ir gėrimų gamyba
D640 Maisto produktų prekinis paruošimas ir logistika
D650 Maisto žaliavų kokybė ir sauga
D700 Žemės ūkio mokslai
D710 Žemės ūkio biologija
D720 Agronomija
D730 Gyvulininkystė
D740 Pasaulio regionų žemės ūkis
D750 Ekologinis žemės ūkis
D760 Kaimo išteklių valdymas
D770 Žemės ūkio technologijos
D900 Žemės ūkis ir veterinarija
D910 Gyvūnų mokslas
D920 Gyvūnų sveikatingumas
6
Mokslinis tyrimas yra mokslinės veiklos rezultatas, padedantis plėsti mokslininkų pažintinę
veiklą. Mokslinis tyrimas yra sistemingas ir kryptingas tikrovės objektų nagrinėjimas kurioje nors
mokslo srityje, taikant atitinkamas mokslo priemones bei metodus.
Mokslinių tyrimų rezultatas – naujos žinios apie tiriamuosius objektus, jų savybes, šių objektų
panaudojimas naujoms technologijoms sukurti ir t.t. Mokslinių tyrimų dėka žmonija sužino tai, ko
iki tol nežinojo. Padaromi išradimai ir atradimai, kurių iki tol nebuvo numatę specialistai. Taigi
mokslinis tyrimas yra pagrindinis tikrovės pažinimo ir jos tobulinimo būdas.
Mokslinį tyrimą galima apibūdinti ir kaip sistemą, kurios paskirtis – rinkti informaciją apie
nagrinėjamus objektus, šią informaciją analizuoti, pertvarkyti, grupuoti, kondensuoti ir pateikti
visuomenei apibendrintas ir patikrintas išvadas apie tiriamuosius objektus.
Mokslininkas, surinkęs informaciją apie tiriamąjį objektą, (ši informacija vadinama pirmine
moksline informacija), siekia ištirti tai, kas nauja, iki tol nežinoma, tai yra stengiasi sukaupti
mokslinę informaciją apie tiriamąjį objektą.
3. INFORMACIJA IR JOS SAVYBĖS
Informacija – tai žinios, perduodamos vienų asmenų kitiems. Jas priimantysis sužino kažką
naujo. Tai gali būti faktai ar iki tol nežinomi ryšiai tarp jų, arba visiškai nauji duomenys.
Informacija – tai nežinojimo, neapibrėžtumo priešybė.
Kasdieniniame gyvenime terminas informacija vartojamas dažnai ir labai plačia prasme, tačiau
patys žmonės nustato informacijos kokybę, vertę ir kiekį intuityviai. Informacijos priėmimo procese
žmogaus jutimo organų g Žemės ūkio ir veterinarijos studijų krypčių grupėje alia nevienoda, o
žmonių surinkta ir perduota informacija gali būti labai subjektyvi.
Kaip mokslinio tyrimo objektas informacija turi būti tiksliai apibrėžta. Be informatikos,
informaciją įvairiais aspektais nagrinėja filosofija, semiotika, taikomoji lingvistika, informacijos
teorija, informologija kur informacijos terminas atitinkamai patikslinamas.
Informacija turi specifinių savybių, vienaip ar kitaip svarbių su ja dirbantiems vartotojams:
Naudingumas. Jį lemia tokios charakteristikos kaip informacijos aktualumas, kokybė,
prieinamumas, pateikimo forma. Informacijos nauda pirmiausia pasireiškia per jos aktualumą –
savybę, kuri nusako, kiek konkreti informacija konkrečiu laiko momentu reikalinga vartotojui.
Aktualumas nėra pastovi informacijos savybė laiko atžvilgiu; kitaip tariant, buvusi labai aktuali,
informacija gali prarasti savo aktualumą, ir atvirkščiai. Informacijos kokybė gali būti nusakyta
tokiais bruožais kaip pilnumas, savalaikiškumas, tikrumas. Tačiau aukštos kokybės informacija gali
būti nenaudinga, jeigu ji yra neaktuali ar sunkiai prieinama.
7
Pilnumas nusako, ar pakankamai tam tikra informacija nusako aprašomo reiškinio ar objekto
esmę. Valdymo informacija gali būti nepakankama, normalaus pakankamumo ir perteklinė.
Pavyzdžiui, prognozėms, veiklos planams ir operatyvaus valdymo sprendimams naudojama
informacija dažniausiai būna nepilna, ir tokie sprendimai priimami esant neapibrėžtumui.
Operatyviems sprendimams priimti naudojamai informacijai gali būti keliami griežtesni pilnumo
reikalavimai.
Savalaikiškumas rodo, kiek informacijos gavimo momentas sutampa su jos poreikio momentu.
Tai gana svarbi charakteristika daugeliui informacijos rūšių. Taip pat tai labai svarbi charakteristika
operatyvios veiklos ir operatyvių sprendimų informacijai, kai siekiama kuo greičiau pranešti apie
įvykusį nuokrypį nuo normalios procesų eigos.
Informacijos tikrumas (arba tapati sąvoka teisingumas) rodo, kiek ji atitinka objektyvių ja
nusakomų valdymo situacijų, kuriose priimami atitinkami sprendimai, charakteristikas. Tai viena is
formalesnių informacijos savybių, nes dažniausiai tikrumas nusakomas maksimaliai leistinu klaidų
skaičiumi arba minimaliai leistinu teisingos informacijos lygiu standartiniame informacijos kiekyje:
pavyzdžiui, tikrumo lygis „ne mažiau negu 0,995“ gali reikšti, kad tūkstantyje informacijos vienetų
(rodiklių, įrašų, simbolių, pranešimų ar kitokių) gali būti iki penkių klaidingų vienetų. Informacija
gali būti netikra jau nuo jos atsiradimo ar sukūrimo momento. Jos tikrumas taip pat gali sumažėti ją
perduodant, saugojant bei apdorojant. Ypač daug techninio pobudžio klaidų atsiranda atliekant
rankines informacijos apdorojimo operacijas. Tikrumas gali būti prarandamas ir tyčia, kai
sąmoningai iškreipiama informacija. Tokiu iškreipimu gali būti suinteresuoti tam tikri asmenys,
kurie nori nuslėpti esamą padėtį ar pateikti neteisingą informaciją, siekdami šitaip gauti naudingą
rezultatą.
Specifine informacijos charakteristika yra reikšmingumas: tai, kas vienam asmeniui atrodo
reikšminga informacija, kitam gali būti beprasmiai duomenys arba informacinis triukšmas. Vienos
dalykinės srities informacija gali nieko nesakyti kitos srities specialistui (mediko – informatikui),
arba ta pati informacija, neatlikus analizės, gali būti neteisingai suprasta. Kad informacija taptų
naudingu įrankiu, reikia turėti ne tik ją pačią, bet ir žinių, kaip tą informaciją teisingai interpretuoti
ir naudoti.
4. PAŽINIMO PRINCIPAI IR RAIDA
Mokslas yra sudėtingas socialinis reiškinys. Galima išskirti tris pagrindinius jo komponentus:
1) žinių sistemą;
2) mokslinę veiklą;
3) institucijų sistemą, per kurią ši veikla realizuojama.
8
Pirmasis komponentas vadinamas loginiu-gnoseologiniu mokslo komponentu, antrasis ir
trečiasis – sociologiniu. Mokslinio pažinimo tyrimas turėtų apimti visų trijų komponentų sąveiką,
nors dominuoja loginis – gnoseologinis aspektas.
Pažinimas yra žmogaus minties santykis su tikrove. Žmogiškojo pažinimo struktūrą ir
mechanizmą nagrinėja gnoseologija (gr. gnosis – žinojimas, logos – mokslas). Pažinimo tikslas –
pasiekti objektyvią tiesą. Šiame procese žmonės įgija žinių ir supratimą apie realiai egzistuojančius
reiškinius, įsisąmonina aplinkinį pasaulį. Įgytos žinios panaudojamos praktinėje veikloje, siekiant
pertvarkyti pasaulį.
Skiriami trys pažinimo proceso elementai:
1) pažinimo subjektas (tai, kas vykdo pažinomą – žmogus, kolektyvas, visuomenė,
bendruomenė, žmonija ir t.t.);
2) pažinimo objektas (tai, į ką žmogus nukreipia savo pažintinę veiklą – galaktika, žmogus,
sveikata, ugdymas ir t.t.);
3) santykis tarp jų.
4.1 Kasdieninis ir mokslinis žinojimas
Nors žinojimo rūšys yra įvairios, tačiau ne visos žinios yra mokslinės. Pavyzdžiui, žinios,
kurias įgyjame prasčiausiai stebėdami įvairius daiktus mūsų gyvenime yra svarbios, nes padeda
orientuotis aplinkoje, tačiau nepaaiškina daiktų bei reiškinių esmės, jų kilmės, tarpusavio ryšio ir
kt., dėl to jos nėra mokslinės.Tokių žinių turime daug, ir mums jų pakanka, norint orientuotis
aplinkoje. Jų su gyvenimiška patirtimi vis daugėja, tačiau, žinant bendrus dėsningumus, gyventi ir
orientuotis kur kas lengviau. Kita vertus, žmogaus žinojimas tiesiogiai yra susijęs su praktine
veikla. Šia veikla yra ne vien tik logika, remiamasi ir mokslo žiniomis, nes moksle pasikliauti
nuojauta arba besąlygiškai pripažinti kokius nors teiginius (hipotezes), praktiškai jų nepatikrinus ir
nepatvirtinus, negalima.
Mokslinis pažinimas, nesvarbu, kokios vystymosi stadijos jis būtų, nuo kasdieninio žinojimo
(asmeninio praktinio patyrimo) skiriasi tuo, jog tai nėra paprasta žinių apie pasaulį sankaupa, o jų
sistema, įgalinanti formuluoti naujas sąvokas, dėsnius, teorijas. Be abejo, dar gerokai prieš mokslo
atsiradimą žmogus turėjo sukaupęs daug žinių apie įvairių daiktų bei reiškinių, su kuriais
susidurdavo kasdieninėje praktinėje veikloje. Tai reiškia, kad mokslinis žinojimas nėra atskirtas nuo
kasdieninės praktikos. Be to, ir vienas, ir kitas pažinimas siekia to paties tikslo – pažinti objektyvią
realybę, rasti tiesą. Visa tai turi būti siejama tik su faktais, o ne su kokia nors išankstine nuomone,
tikėjimu. Taigi tarp mokslinio pažinimo ir kasdieninės praktikos yra glaudus tarpusavio ryšys, nes
mokslas visų pirma yra kilęs iš praktinės žmonių patirties.
9
Kasdieninio patyrimo nereikėtų pervertinti. Moksliniame pažinime, kitaip negu kasdieniniame,
taikomos specifinės priemonės, metodai bei įvairūs kriterijai. Be to, mokslui neužtenka tik ieškoti
naujų faktų, gauti naujų rezultatų. Kur kas svarbiau jais remiantis patikrinti hipotezes, formuluoti
naujus dėsnius, teorijas. Be abejo, visam tam reikia daug faktų, empirinių duomenų.
Šis pagrindinis mokslo ir kasdieninio žinojimo skirtumas leidžia geriau suprasti sisteminį,
nuoseklų bei kontroliuojamą mokslinio pažinimo pobūdį. Juk, norint paaiškinti kokį reiškinį, būtina
turėti teorinių žinių, vadovautis hipoteze, logika. Todėl moksle svarbiausia sukaupti faktų ne kuo
daugiau, o tiek, kad būtų galima juos paaiškinti, įvilkti į kokią tai teorinį sistemą. Tai padeda ne tik
paaiškinti žinomus faktus, bet ir numatyti dar nežinomus reiškinius. Be to, mokslas tyrinėja ir tokius
reiškinius, kurių paprasta akimi nematome ir su kuriais kasdieninėje veikloje nesusiduriame
(įvairios dalelės fizikoje, chemijoje).
Mokslinių tyrimų išvados yra konkrečios, objektyvios, patikimos ir patikrinamos; tuo tarpu
kasdieninis žinojimas subjektyvesnis, mažiau patikimas, ypač jeigu remiasi kokiu nors tikėjimu.
Kita vertus, kasdieninio pažinimo tikslas – konkreti praktinė veikla, praktinių uždavinių
sprendimas, dėl ko jis negali būti pagrindas kuriant abstrakčius modelius ar teorijas, padedančias
pažinti reiškinių kilmę, vidinius jų ypatumus. Tačiau svarbu pabrėžti, jog mokslinis žinojimas yra
tik viena iš žinojimo rūšių. Šalia mokslo egzistuoja ir kitos pažinimo rūšys, kaip pavyzdžiui,
religinis, filosofinis, mitologinis, meninis pažinimas ir be abejo, sveikas protas.
4.2 Empirinis ir teorinis pažinimas
Pažinimą galima suskirstyti į du lygius:
- jutiminį (empirinį);
- racionalinį (teorinį).
Pirmasis pažinimo lygis susijęs su mūsų pojūčiais, suvokimais, vaizdiniais, o antrasis – su
mąstymu, proto operacijomis, padedančiais daryti įvairius apibendrinimus, formuluoti sąvokas,
iškelti hipotezes ir tt.
Ilgą laiką šie du pažinimo lygiai buvo atsiskyrę, nes empirikai (D. Lokas) žinojimo pagrindu
laikė patyrimą, o racionalistai (R. Dekartas) žinojimo šaltiniu laikė protą. Pavyzdžiui, R. Dekartas
laikėsi požiūrio, jog juslinė (jutiminė) patirtis negali būti tikras žinių šaltinis. Tikros žinios, pasak
jo, yra aiškūs ryškūs teiginiai, nes tik tai, kas yra aišku ir ryšku, yra proto gerai apžvelgiama.
Tarkime, aiškios ir ryškios yra matematikos žinios, nes mums aiški jų struktūrą bei loginiai ryšiai
tarp atskirų žinių dalių. O patyrimu įgytos žinios tokios aiškios struktūros neturi. Dar svarbiau yra
tai, kad patyrimo faktai nepasižymi visuotinumu ir būtinumu, t. y. Jie neturi tų savybių, kurios kartu
su aiškumu ir apibrėžtumu yra tikrojo žinojimo požymis. Žinių visuotinumą ir būtinumą nustato tik
10
protas. Todėl protas ir yra pažinimo šaltinis. Tuo tarpu Loko įsitikinimu, visos mūsų idėjos yra
įgytos, ir jų turinys priklauso nuo patyrimo. Pasak jo, žmogaus protas – tai švari lenta, kurią
rašmenimis užpildo patyrimas. Visos sudėtingos idėjos sudarytos iš paprastų, o tiesioginis jų šaltinis
yra patyrimas.
Toks skirtingas požiūris į pažinimą trukdė mokslui plėtotis, todėl galiausiai šie abu pažinimo
lygiai buvo sujungti. Tai padarė I. Kantas, sakydamas, kad žmogaus žinojimas visada yra
racionalus, teorinis.
Be abejo, pažinimo procese jutiminis pažinimas neina pirmas, ir jo neseka loginis pažinimas,
šie du procesai visada eina greta. Empirinių duomenų rinkimas – kruopštus darbas, juos renkant
visada reikia žinoti, ko norime. Kita vertus, empirinių duomenų kaupimas nėra galutinis mokslinio
tyrimo rezultatas. Šalia to būtinas tam tikras teorinis jų interpretavimas. O jeigu tyrėjui nepavyksta
to padaryti ir darbas lieka empirinio lygio, tai mokslo šiuo atveju bus nedaug.
Kitaip negu empirinis pažinimas, teorinis pažinimas, apibendrindamas mokslinius faktus ir
atskleisdamas priežastinius jų ryšius, veda prie dėsnių ar jų sistemos formulavimo. Šis pažinimas,
būdamas aukščiausia pažinimo forma, atlieka tokias pagrindines mokslo funkcijas: aiškinamąją,
euristinę, sintezės ir reguliuojamąją.
Aiškinamoji funkcija pasireiškia tuo, kad pavieniai, izoliuoti reiškiniai teorijoje sujungiami į
platesnę loginė sistemą. Kartu aiškinamos reiškinių priežastys, formuluojami dėsniai, kuriais
nusakoma tai, kas yra visuotina, būtina, esminga, tačiau tokios teorijos, kurios žinomus reiškinius
tik paaiškina, mokslui yra nepakankamos. Teorija, remdamasi joje išreikštais dėsniais, turi numatyti
naujus, iki tol dar nežinotus reiškinius. Naujų faktų bei reiškinių ryšio nustatymas kaip tik ir
apibūdina euristinę teorijos funkciją.
Sintezės funkcija pasireiškia tuo, kad kiekviena teorija sutvarko empirinę medžiagą bei
formuoja tam tikrą mąstymo būdą, o reguliuojančioji funkcija – yra vienas metodų tolimesniems
tyrimams planuoti.
Iš šios trumpos apžvalgos apie empirinio ir teorinio pažinimo ryšį matome, jog tai bet kuriame
moksliniame tyrime yra du neatsiejami, vienas kitą papildami procesai.
5. MOKSLO METODOLOGIJA IR METODAI
5.1 Metodologijos samprata
Plačiąja prasme metodologija yra bendriausi pažinimo principai (žodis metodologija kilęs iš
graikų kalbos žodžių „methodos“ ir „logos“). Literatūroje ši sąvoka traktuojama nevienodai ir
teigiama, kad metodologija:
11
1) nagrinėja bendramokslinius principus ir tyrimo formas (pavyzdžiui, viso to, kas
egzistuoja, sistemingumas, struktūriškumas, informatyvumas);
2) yra pažinimo metodai ir būdai konkrečioje mokslo kryptyje;
3) yra susijusi su tyrimo metodais ir technika (šiuo atveju tai reiškia, kad bet kurį mokslinį
tyrimą būtina metodologiškai pagrįsti, t.y. suformuluoti temą, aptarti tyrimo koncepciją,
hipotezę, tyrimo metodus ir t.t.);
4) yra mokymas apie metodą.
Nepaisant sąvokų įvairovės, metodologiją galima apibrėžti kaip teoriją, kuri nagrinėja
mokslinio pažinimo procesą (bendroji metodologija) ir jo principus (bendramokslinė metodologija)
bei mokslinio tyrimo metodus ir techniką (mokslo krypties metodologija).
Metodologija, kaip žinių sistema, gali būti:
1) aprašomoji (aprašanti kaip funkcionuoja mokslinio pažinimo procesas, bei atskleidžianti jo
struktūrą);
2) normatyvinė (formuojanti paties mokslinio pažinimo proceso reikalavimus ir atsakanti į
klausimą, koks turi būti mokslinis pažinimas).
5.2 Empirinis tyrimas
Empirinį tyrimą galima apibūdinti kaip įvairios formos informacijos gavimą esant kontaktui
tarp tyrėjo ir tiriamojo objekto. Tačiau tai nėra visai paprastas procesas. Kaip tarpininkas tarp tyrėjo
ir tiriamojo objekto yra tyrimo metodas, kuris riboja arba iš viso izoliuoja tyrėjo poveikį. Todėl
tyrimo metodams yra keliami dideli reikalavimai.
Empirinio tyrimo duomenys – tai daiktų, reiškinių, požymių arba objektyvios tikrovės ryšių
atspindys. Tačiau tai ne objektyvios aplinkybės, o jutiminis jų atspindys, nes ne realūs objektai, o
duomenys apie juos sudaro enpirinį mokslo pagrindą.Taigi duomenys yra:
1) bet kurio mokslinio tyrimo žaliava, ir tai yra svarbiausias, lemiamas dalykas tiriant
hipotezes;
2) duomenys, tiesiogiai gaunami empirinio tyrimo metu ir sudarantys tyrimo protokolą,
vadinami pirminiais arba empiriniais duomenimis;
3) duomenys tampa prasmingais tik tada, kai jie yra sugretinami arba lyginami su kitais
duomenimis arba kokia nors teorine ar žodine sistema;
4) gali būti lyginami tik tokie duomenys, kurie turi objektyvių savybių. Lyginti reikia tik
esminius požymius.
12
5) Duomenys tam tikroje teorinėje sistemoje turi savo funkciją ir vietą. Dauguma duomenų
turi būti statistiškai sugrupuoti pagal kurią nors teoriją. Svarbu surinkti ne kuo daugiau
duomenų, o tokių, kurie būtų pakankamai reprezentatyvūs ir informatyvūs.
Pagal pobūdį duomenys gali būti klasifikuojami į mokslinius ir nemokslinius, sociologinius,
edukologinius, psichologinius, biologinius ir t.t., o pagal tyrimo metodus – į stebėjimo, apklausos,
eksperimento ir kt.
5.3 Tyrimo metodas
Kiekviena mokslo sritis, o tuo labiau kryptis, turi savo tyrimo metodus, nors yra ir bendrų
tyrimo metodų (pvz.: eksperimentas, matematinė statistika, teorinės analizės ir apibendrinimai ir
kt.).
Metodo reikšmė – didžiulė. Gerai parengtas ar pritaikytas metodas žymiai palengvina tyrimą.
Teigiama, kad nuo metodo priklauso viso tyrimo sėkmė, o remdamasis tinkamai parengtais tyrimo
metodais net ir nelabai gabus žmogus gali daug padaryti, kai tuo tarpu netinkamai parinkti tyrimo
metodai nepadės ir genialiam mokslininkui.
Tačiau patys metodai, kad ir kokie tikslūs būtų, dar nenulemia mokslo laimėjimų. Jie negali
pakeisti kūrybinės tyrėjo minties, jo sugebėjimo analizuoti ir interpretuoti tyrimo duomenis, o tai
gali ne kiekvienas. Duomenis rinkti gali bet kas, preliminariai susipažinęs su instrukcija, o juos
aprašyti ir interpretuoti kur kas sunkiau. Kita vertus, tinkamas metodas leidžia išvengti nereikalingų
klaidžiojimų, padeda greičiau gauti norimus rezultatus (pavyzdžiui, medicinoje reikėtų atlikti labai
daug tyrimų, norint įvertinti ligonio ar sveiko žmogaus būklę, o šiuolaikiniais tyrimo metodais,
įgalinančiais vienu metu registruoti daugelį parametrų, situaciją galima įvertinti kur kas greičiau).
Mokslui vystantis, tobulėjo ir tyrimo metodai. Ypač tai pastebima gamtos ir technikos
moksluose, kur sukurti prietaisai izoliuoja tyrėjo poveikį stebimam objektui, t.y. tyrimo rezultatai
nuo tyrėjo valios nepriklauso. Kur kas sunkiau taikyti objektyvius tyrimo metodus, įgalinančius
gauti nedviprasmišką informaciją edukologiniuose ir kituose socialinių mokslų tyrimuose.
Tyrimo metodas – tai tam tikrų praktinių arba pažintinių rezultatų gavimo būdas, taikant
įvairiais priemones. Savo ruožtu tai sisteminė procedūra, susidedanti iš nuosekliai pasikartojančių
operacijų, kurių taikymas kiekvienu konkrečiu atveju leidžia pasiekti norimų rezultatų. Be abejo,
sudėtingos, specifinės mokslo problemos reikalauja ir specialių tyrimo metodų, kuriuos reikia
sukurti.
Kiekvienas tyrimo metodas turi turėti teorinį pagrindą, t.y. remtis objektyviais dėsningumais,
būti moksliškai pagrįstas. Kadangi metodas remiasi tam tikra teorija, vadinasi, iš principo
neteisingų metodų neturėtų būti. Neteisingai juos galima būtų panaudoti: pavyzdžiui, vienos mokslo
13
srities metodus bandant pritaikyti kitoje srityje. Socialinių mokslų tyrimuose neretai parenkami ir
taikomi neadekvatūs tyrimo tikslams ir uždaviniams tyrimo metodai, kas metodologiškai menkina
sumanytą tyrimą. Visada geriau taikyti aprobuotus, t.y. teoriškai ir praktiškai patikrintus metodus,
negu rizikuoti būti apkaltintam neteisingai parinkta metodika, kurios tyrimo rezultatai dėl
neadekvatumo, gali būti nepatikimi.
Taigi siekiant efektyvių tyrimo metodų ir objektyvių naujų žinių gavimo būdų, jie visų pirma
turi būti metodologiškai pagrįsti, o antra – turi būti informatyvūs ir patikimi (validūs). Todėl,
taikant savo pačių parengtus ar pakoreguotus tyrimo metodus, būtina nurodyti metodo objektyvumo
sąlygas.
Metodo validumas – tai jo tinkamumas arba, kitaip tariant, jis išreiškia tai, kad matuojama
būtent tai, kas norima matuoti. Pavyzdžiui, anketinėje apklausoje svarbu, ar respondentas pasako
tiesą.
Jeigu yra galimybė, gautus tyrimo duomenis galima palyginti su kitais, objektyvesniais
duomenimis. Pavyzdžiui, jeigu anketinėje apklausoje mokinys nurodė, kad jis yra fiziškai aktyvus,
tai šią veiklą nusakančius duomenis galima palyginti su fizinės būklės rodikliais. Tokie ir panašūs
gautų duomenų patikimumo patikrinimai kartais moksle apibūdinami terminu empirinių faktų
verifikacija (duomenų teisingumo nustatymo procedūra).
5.4 Hipotezės
Kai tyrėjas neturi pakankamai faktų, kad galėtų atsakyti į jam rūpimus klausimus ar išspręsti
kokią nors problemą, tuomet dažnai taikomas hipotezės principas – mokslinė prielaida, kuria
bandoma nusakyti nežinomus reiškinius.
Hipotezės formulavimas yra bene pats svarbiausiais ir sunkiausias tyrimo etapas. Formuluojant
hipotezes, svarbu, kad jos nėra išvedamos iš faktų, o sukuriamos remiantis faktais. Tai preliminari
teorija, kuri preliminariai formuluoja priežastinius ryšius ir dėsnius bei jų pagrindu numato naujus
objektus, naujas tyrimų kryptis ir metodus. Vadinasi, mokslinis tyrimas – ne aklas faktų kaupimas,
tikslingas ir kryptingas perėjimas nuo hipotezės prie teorijos.
Kasdieniniame gyvenime hipotezės sąvokai suteikiama labai plati reikšmė. Labiausiai paplitę
šie hipotezės supratimai: spėjimas, įvykio prognozė ir apytikris žinojimas. Be abejo, šie kasdieniniai
hipotezės supratimai mokslui nepriimtini, nes neteikia esminių paaiškinimų ir nenurodo tyrimo
objekto bei metodų.
Prognozės jau turi loginį pagrindą, pavyzdžiui, orų prognozės, kurios remiasi tam tikrais
matavimais, apskaičiavimais. Gali būti ir mokslinės prognozės.
14
Tikslesnis yra apytikris žinojimas. Pavyzdžiui, kad ir toks teiginys: jeigu išmesiu monetą
aukštyn 1000 kartų, tai ji nukris herbu į viršų 500 kartų. Čia loginis pagrindimas yra stipresnis už
prognozes.
Nėra vieno apibrėžimo, apibūdinančio mokslinės hipotezės sąvoką. Galbūt priimtiniausias
hipotezės supratimas būtų toks. Hipotezė – tai mokslinio pažinimo forma, išreiškianti moksliškai
pagrįstą, tačiau dar nepatikrintą ir nepatvirtintą naujų dėsnių, priežastinių ryšių, objektų bei jų
struktūrų ir savybių numatymą.
Hipotezės gali būti įvairių rūšių:
1) Aprašomosios hipotezės (apie galimus nagrinėjamų reiškinių ryšius, bandant numatyti
atsakymą į klausimą kaip?);
2) Aiškinamosios hipotezės (analizuojančios reiškinių ryšius sąlygojančias priežastis, taip pat
bandant pagrįsti atsakymą į klausimą kodėl?);
3) Indukcinės hipotezės (kai iš atskirų faktų logiškai mąstant bandoma padaryti
apibendrinančias išvadas, kurios vėliau turės būti patvirtintos tyrimo būdu);
4) Dedukcinės (remiasi samprotavimais, kurių metu iš keleto teisingų teiginių ar prielaidų
pagal logikos taisykles formuluojami nauji teisingi teiginiai).
5) Kita vertus, tyrimuose formuluojamos hipotezės ne visada turi naujų mokslinių idėjų, ir
joms patikrinti kartais užtenka turimų žinių.
Literatūroje dar sutinkamas toks hipotezių klasifikavimas:
- darbinė hipotezė;
- mokslinė hipotezė (apie tai bus rašoma toliau).
Taip pat bandoma hipotezes skirstyti į:
- kryptingas;
- nekryptingas;
- nulines.
Dvi pirmosios jų rūšys ypatingos svarbos tyrimui neturi, tai trečioji yra labai svarbi. Kryptinga
hipotezė nurodo tikėtinų rezultatų kryptį, kuri gali būti teigiama arba neigiama. Nekryptinga
hipotezė numato galimus pokyčius nenurodydama tikėtinų rezultatų krypties.
Nulinė hipotezė teigia, kad nebus jokio poveikio, t.y. jokie skirtumai ar sąsajos nebus pastebėti.
Nulinės hipotezės paprastai naudojamos dėl šių priežasčių:
1) parodyti, kad nėra sąsajų tarp įvairių reiškinių;
2) jeigu tyrimas atskleidžia skirtumus ar reiškinių ryšius, patikrinama nulinės hipotezės
reikšmė.
3) Tai daroma, norint nustatyti, ar rasti skirtumai bei ryšiai iš tiesų yra tikri, ar tik klaidų,
padarytų tyrimo metu, rezultatas.
15
Nors hipotezė - preliminari teorija, tačiau jos su teorija nereikėtų tapatinti, nes teorija - tai tik
bendras paaiškinimas, kokia yra padėtis ir kodėl ji tokia, t.y., ji nieko nenumato.
Hipotezės formulavimo šaltiniai gali būti, pavyzdžiui:
1) Patirties apibendrinimas;
2) Žinomų mokslinių faktų analizė;
3) Tolesnė mokslinių teorijų plėtotė.
4) Formuluojant hipotezę, reikėtų laikytis šių reikalavimų:
5) Ji turi būti iš esmės patikrinta, t.y. paremta faktais. Pasitaiko ir grynai teorinių hipotezių,
kurios bus patikrintos tik ateityje, patobulėjus tyrimo metodams.
6) Hipotezė turi aiškinti klausimus, nusakančius nagrinėjamosios problemos esmę.
7) Dažniausiai ji neturi prieštarauti anksčiau nustatytiems faktams. Jeigu tyrėjas numatė teiginį,
prieštaraujantį esamai duomenų traktuotei, tai:
- hipotezė bus veiksminga tik tada, jeigu ji bus įrodyta naujais faktais;
- paneigti faktai turi būti paaiškinti, pavyzdžiui, ar ankstesnė medžiaga buvo surinkta,
naudojant netobulus tyrimo metodus, ar tiriant skirtingą kontingentą ir t.t. Vadinasi,
ankstesni faktai nėra paneigiami, o tik apribojami savo veikimo sferoje.
8) Hipotezė turi būti iš esmės paprasta. Jos paprastumas yra santykinis, nes santykinai paprasti
ir patys nagrinėjami reiškiniai.
9) Hipotezės turinyje neturi būti teoriškai ir praktiškai nepagrįstų teiginių, t.y. tokių teiginių,
kurie patys gali tapti tyrimo objektu (loginio rato klaida).
10) Ji turi būti produktyvi. Iš dviejų hipotezių, vienodai gerai aiškinančių tam tikrą reiškinį,
priimama hipotezė, aiškinanti platesnę reiškinių sritį.
11) Bet kuri hipotezė kaip teiginys visada yra stochastinio (tikimybinio) pobūdžio, tačiau tą
tikimybę reikia moksliškai pagrįsti. Taip pat reikia atminti, jog hipotezė nėra dogma, ji gali
keistis, dirbant būti tikslinama.
Hipotezės sukūrimo pagrindas – turimos žinios. Būtina žinoti, kad apriorinės (nepriklausančios
nuo patyrimo) hipotezės formulavime dalyvauja pats tyrėjas, ir dėl to ji nėra pakankamai objektyvi.
Tai teiginys, kurio negalima tiesiogiai pagrįsti patyrimu. Pagrindas priimti hipotezę yra tas, kad,
remiantis turimomis žiniomis ir pačia hipoteze, galima paaiškinti tam tikrus stebimus bei numatyti
naujus faktus. Be hipotezės tie faktai nepaaiškinami ir nenumatomi, tačiau jei net statistinės analizės
rezultatai parodys, jog hipotezė neprieštarauja tyrimų rezultatams, tai dar nereiškia, kad ji yra
besąlygiškai teisinga, nes praktiškai gali būti ir kitų hipotezių, gerai suderinamų su gautais
rezultatais. Hipotezė visada lieka atvira tolesniems moksliniams tyrinėjimams. Kita vertus, net
vienintelis hipotezei prieštaraujantis faktas, leidžia ją atmesti (hipotezių tikrinimo asimetrija).
16
Visi išdėstytieji teoriniai teiginiai labiausiai taikytini vadinamosioms mokslinėms hipotezėms.
Tačiau pagrindiniai jų formulavimo principai gali būti taikomi ir darbinėms (laikinoms) hipotezėms,
kuriomis laikytinos pirminės prielaidos, atsirandančios drauge su pagrindine tyrimų idėja. Tyriant
darbinės hipotezės yra tikrinamos: tobulinamos, patikslinamos arba atmetamos.
Taigi hipotezė visų pirma reikalinga mums patiems. Ji tarsi kompasas, rodantis moksliniam
tyrimui kryptį, neleidžiantis per daug išsiplėsti ir kreipiantis tyrėjo mintis reikiama linkme. Ji
svarbi mums dar ir tuo, jog padeda pasirinkti (numatyti) tyrimo objektą bei informacijos gavimo
būdą – tyrimo metodą. Ekspertų nuomonė patvirtins arba nepatvirtins mūsų hipotezę, o tada bus
daromi praktiniai sprendimai.
5.5 Mokslinių tyrimų darbų eiga
Mokslinių tyrimų eiga apima šiuos etapus:
1) Temos pasirinkimą.
2) Literatūros studijavimą.
3) Pasiruošimą tyrimui ir tyrimo organizavimą.
5.5.1 Temos pasirinkimas
Pasirenkant temą, patartina atsižvelgti į šiuos kriterijus:
1) Tema turi būti aktuali, svarbi mokslo krypčiai ar šakai šakai, turėti naujumo elementų.
2) Tema turi būti susijusi su mokslo srities arba mokslo šakos teorija ir praktika. Atskirais
atvejais gali būti tyrimai, kurie sprendžia teorinio pobūdžio uždavinius.
3) Pasirinkta tema turėtų dominti patį tyrėją, nes kartais tema tyrėjui gali būti primesta.
4) Pasirenkant temą, reikia atsižvelgti į temos realizavimo galimybes, kad sukauptas
mokslinis potencialas ir turimos materialinės sąlygos leistų įvykdyti temoje numatytus
tyrimo uždavinius.
5) Pasirinkta tema turėtų būti nei per plati, nei per siaura, tai yra gerai suformuluota nustatant
tiriamojo darbo ribas. Esant labai plačiai temai, tyrėjas nesugebės aprėpti numatytų
uždavinių ir tokios temos įvykdymas bus paviršutinis. Pasirinkus siaurą tema, gali pritrūkti
erdvės tyrėjo sugebėjimams pasireikšti. Tyrėjui dirbant savarankiškai, patartina pasirinkti
siauresnę tema ir apsiriboti viena problema, kurią išsamiau būtų galima išanalizuoti.
6) Tyrimo rezultatų įdiegimo perspektyvos sudaro mokslinės veiklos įprasminimo pagrindą,
nusako jos vertę. Todėl nagrinėjamos temos paskirtis ir kur jos tyrimo duomenys bei
išvados bus diegiamos yra reikšmingas veiksnys pasirenkant temą.
17
5.5.2 Literatūros studijavimas
Literatūros šaltinių analizė yra neatsiejama mokslinio darbo dalis, planuojant ir vykdant
mokslinius tyrimus.
Literatūros šaltinių studijavimas dažnai prasideda dar prieš pasirenkant temą ir gali būti kaip
pagalbinė priemonė, o atskirais atvejais – savarankiško tyrimo metodu.
Literatūros studijavimas, atliekant skirtingus mokslinio tyrimo etapus, gali būti skirtingas.
Planuojant tyrimus ir pasirenkant temą literatūros duomenų analizė padeda tiksliai suformuluoti
temą, pasirinkti tyrimo metodus, susipažinti su kitų tyrėjų pasiekimais tematikoje aktualiais
klausimais.
Vykdant tyrimo darbus, literatūros darbų studijavimas padeda:
- susipažinti su naujausiais kitų specialistų darbais;
- prireikus koreguoti savus tyrimus;
- palyginti savuose tyrimuose gautus rezultatus su literatūroje nurodytais;
- tiksliau interpretuoti kai kurių savo tyrimo duomenų patvirtinimą;
- rasti paaiškinimą, jeigu literatūros duomenys neatitinka tyrime gautų rezultatų.
Suprantama, kad rasti reikiamą literatūrą nelengva: kasmet įvairių mokslų klausimais
publikuojama daug darbų, jų gausėja geometrine progresija (per 10 – 15 metų padvigubėja).
Pradedantis tyrinėtojas visų pirma privalėtų sudaryti literatūros, su kuria reikia susipažinti,
sąrašą. Naudinga sudaryti tris literatūros sąrašus:
1) šaltinių, kuriuos reikia perskaityti pirmiausia;
2) šaltinių, su kuriais pageidautina susipažinti;
3) šaltinių, kuriuos galima papildomai paanalizuoti.
4) Literatūros šaltinis nagrinėjamas keliais etapais:
5) Perskaitomas pavadinimas, turinys, anotacija, įvadas, peržiūrima bibliografija. Tai padeda
pasirinkti šaltinio skaitymo būdą: ar veikalą skaityti išsamiai, giliai, ar tik susipažinti su
pagrindine jo idėja.
6) Skaitant literatūros šaltinį pirmą kartą, būtina visų pirma išsiaiškinti jo turinį, t.y. suprasti
pagrindines autoriaus mintis, idėjas. Todėl knygą ar straipsnį rekomenduojama skaityti,
pasižymint svarbiausias mintis, nurašant į atskirą žodynėlį pagrindinių sąvokų ir terminų
apibrėžimus.
7) Skaitant veikalą antrą kartą, būtina įvertinti faktinę medžiagą, atrinkti tipingiausius faktus
ir palyginti juos su jau žinomais. Reikia įsigilinti į autoriaus samprotavimų eigą, jų logiką.
8) Užrašų formos būna šios:
9) Citavimas
18
10) Ši forma vertinga, apibūdinant sąvokas, paryškinant paties tyrinėtojo mintis ir pan.
Skaitytojui yra lengviausia, nes nereikalauja savarankiškai mąstyti. Tačiau ji –
neekonomiška laiko atžvilgiu.
11) Planas
12) Tai lakoniškas pagrindinių publikacijos klausimų nagrinėjimas bei išdėstymas. Jis padeda
išskirti ir trumpai išdėstyti pagrindines autoriaus mintis.
13) Tezės
14) Jos išsamiau negu planas perteikia perskaitytos publikacijos turinį, t.y. išnagrinėja
kiekvieną plano punktą, įrodo kurį nors autoriaus ginamą teiginį. Tezėse turi atsispindėti
išvados, pagrindiniai teiginiai, kuriuos ateityje būtina išnagrinėti.
15) Konspektai
16) Konspektuose detaliai apibūdinami publikacijos turinys ir teiginiai.
5.5.3 Pasiruošimas tyrimui ir tyrimo organizavimas.
Visą mokslinio tyrimo procesą galima suskirstyti į tris pagrindinius etapus:
1) Pasiruošimas tyrimui ir tyrimo organizavimas:
- tyrimo tikslo ir uždavinių nusakymas;
- tyrimo strategijos arba tyrimo plano sudarymas;
- tyrimo proceso organizavimas.
2) Faktų rinkimas (empirinių duomenų banko kaupimas).
3) Empirinių duomenų apdorojimas. Šiame etape išskirtina:
- statistinis gautų duomenų apdorojimas;
- teorinis duomenų apdorojimas;
- gautų rezultatų praktinis pritaikymas (siūlomi būdai arba konkrečios rekomendacijos).
5.5.3.1 Tyrimo tikslo ir uždavinių nusakymas
Nusakant tyrimo tikslą, reikia atkreipti dėmesį į tai, kad tyrimo tikslas turi atitikti pasirinktos
temos pavadinimą, kuri paprastai formuluojama vienu sakiniu. Tyrimo tiksle turi atsispindėti tyrimo
objektas, t.y. tai, kas bus tiriama. Pastaruoju metu kai kuriuose mokslo darbuose (disertacijose,
magistro tezėse) įvadinėje darbo dalyje bandoma atskirai apibrėžti tyrimo objektą ir tyrimo dalyką.
Kiekviena, nors ir labai konkrečiai suformuluota, tema gali turėti daug sprendimo aspektų,
kurie paprastai negali būti nagrinėjami tuo pačiu metu. Todėl, suformulavus darbo tikslą,
užsibrėžiami konkretūs tyrimo uždaviniai, kurie kyla iš bendrųjų ir specifinių, tam tyrimui
suformuluotų klausimų.
19
5.5.3.2 Tyrimo strategijos arba tyrimo plano sudarymas
Visų pirma detaliai nusakoma tyrimo problema ir suformuluojama hipotezė. Be to, svarbu
numatyti ir galimus problemos sprendimo būdus bei prognozuoti tyrimo rezultatus. Tai vienas
svarbiausių tyrimo sumanymo aspektų, reikalaujantis teoretinio pagrindimo. Todėl, planuojant
tyrimą, pagrindinis vaidmuo tenka tyrimo idėjai. Kita vertus, ne kiekviena problema reikalauja
mokslinio tyrimo. Apskritai mokslinė problema yra ta, kuri apima mokslinį ir praktinį elementą.
Todėl kai kurioms problemoms išspręsti užtenka praktinių priemonių arba turimų žinių.
5.5.3.3 Tyrimo proceso organizavimo principai
Kai tyrimo struktūra teoriškai aiški, apsvarstomi procedūriniai tyrimo klausimai, t.y. sudaromas
tyrimo atlikimo planas, parenkami tyrimo metodai (pavyzdžiui, nusprendžiama, ar bus pasitelktas
pedagoginis stebėjimas, ar anketavimas, testavimas ar eksperimentas, arba keli iš jų). Be to,
aptariama, ar pasinaudoti jau žinomais metodais, ar kurti naujus. Svarbu nuspręsti, ypač
pedagoginiuose tyrimuose, ar būtinas eksperimentas, nes eksperimentas tik dėl eksperimento
dažniausiai neduoda teigiamų rezultatų, numatomas tiriamųjų kontingentas. Pastarasis elementas
yra vienas pagrindinių, neretai galintis turėti lemiamos įtakos duomenų patikimumui. Dažnai vien
tik dėl netinkamo tiriamųjų grupių parinkimo darbas nustoja mokslinės vertės. Todėl, parenkant
tiriamųjų grupes, būtina vadovautis jų atrankos kriterijais. Be to, nurodoma, jog tiriamųjų grupės ir
jose numatomas skaičius turi būti žinomas iš anksto, t.y. dar prieš tyrimo pradžią, nes tai susiję su
hipotezės formulavimu. Šiame etape svarbu numatyti ir kitus procedūrinius klausimus (pavyzdžiui,
kas padengs išlaidas bei suteiks kitokio pobūdžio materialinę ir dalykinę pagalbą ir kt.).
5.5.3.4 Faktų rinkimas (empirinių duomenų banko kaupimas)
Šiame etape renkami duomenys, kurie ir turi patikrinti mūsų daromas prielaidas. Visus tiriamus
požymius (duomenis) galima suskirstyti į keturias grupes:
1) Kiekybiniai požymiai (pavyzdžiui, antropometrinių matavimų, fizinės būklės rodikliai,
laboratorinių tyrimų duomenys ir kt., t.y. visa tai, ką galima išmatuoti). Jie tikslesni,
objektyvesni, gerai tinka matematinei analizei.
2) Kokybiniai požymiai (pavyzdžiui, elgesys, požiūriai, interesai, vertybinės orientacijos ir
kiti motyvai). Jie sunkiai nustatomi, įvertinami bei statistiškai apdorojami. Tai subjektyvūs
duomenys, galintys turėti daug interpretacijų. Juos sunkiau palyginti su kiekybiniai
požymių rodikliais.
20
3) Klasifikaciniai arba nominaliniai požymiai (pavyzdžiui, lytis, amžius, gyvenamoji vieta,
profesija, išsilavinimas ir kt.). Jie patogūs darant tiriamųjų atranką bei įvairius
palyginimus.
4) Reiškinio eiliškumo požymiai arba požymiai pagal reiškinio pasireiškimo laipsnį
(pavyzdžiui, fizinė būklė, kuri gali būti labai gera, gera, vidutinė,patenkinama arba bloga,
lygiai kaip ir sveikata, žinios bei kitų požymių charakteristikos).
5) Empiriniai tyrimai trunka palyginti neilgai. Daugiau laiko atima pasiruošimas tyrimo
procedūroms, statistinis duomenų apdorojimas. Tačiau empiriniai tyrimai svarbūs tuo, kad
jais remiantis gauti duomenys leidžia daryti apibendrinimus ir išvadas, t.y. nustatyti
empirinius dėsningumus bei kurti teorinius apibendrinimus.
Empiriniai duomenys nėra galutiniai duomenys. Kur kas svarbiau juos tinkamai sugrupuoti ir
interpretuoti. Neretai tikslinga atlikti pakartotinius tyrimus, kad įsitikinti jų objektyvumu, ypač
taikant įvairias matavimo procedūras (pavyzdžiui, kraujospūdis visada matuojamas keletą kartų).
5.5.3.5 Empirinių duomenų apdorojimo principai
Kai kurie autoriai išskiria kokybinę ir kiekybinę duomenų analizę. Pavyzdžiui, nurodoma, kad
kokybinė duomenų analizė – tai būdingi, tipiški surinktų duomenų požymiai, pagal kuriuos ir
grupuojami duomenys. Kokybinei analizei priskiriamas sisteminimas, klasifikavimas bei
priežastiniai funkciniai ir struktūriniai ryšiai.
Sisteminimas – tai kiekvienos grupės viduje duomenų grupavimas priklausomai nuo požymių
skirstymo į esminius ir neesminius.
Klasifikavimas – tai pagal esminius požymius ryšių atskleidimas tarp kiekvienos grupės
reiškinių ir preliminarios išvados apie grupių santykius.
Kokybinės analizės rezultatas – nustatymas ryšių, kurie gali būti priežastiniai, t.y. ryšiai tarp
reiškinio ir jį lemiančių veiksnių, funkciniai, išreiškiantys ryšius tarp požymių, laikomų
nepriklausomais ir keičiamų pagal tyrėjo norą, ir požymių, objektyviai susijusių su nepriklausomais
požymiais, kintančių keičiant pastaruosius, ir struktūriniai, nurodantys vienos sistemos elementų
ryšį.
6. BANDYMŲ ATLIKIMO TVARKA IR PAGRINDINIAI
REIKALAVIMAI
6.1 Bendri bandymų su gyvūnaiss organizavimo principai
Moksliniai tyrimai sudaro logiškai susijusių, daugkartinių ir kartais labai sudėtingų operacijų
grandinę, siejančių mokslininką su bandomaisiais gyvūnais.
21
Gyvūnų mokslų tyrimai susideda iš dviejų viena kitą papildančių krypčių:
1) biologinių ir gamybinių reiškinių stebėjimų;
2) bandymų.
Stebėjimų metu surenkama daug faktinės medžiagos, kuri vertinga ir šiuolaikiniam
gyvulininkystės mokslui. Tačiau pačių stebėjimų dar negalima vadinti bandymu, nes jie tik
užregistruoja atskirus reiškinius ir kai kuriuos ryšius tarp jų. Nuo stebėjimų pereinama prie
gamybinio bandymo, o nuo šio bandymo – prie mokslinio eksperimento.
Pirmajame etape stebėjimai gali būti paprasti (vizualiniai), kada nenaudojamos jokios
priemonės. Jų reikšmė nemažėja ir dabar, kada atskirų reiškinių stebėjimams galima panaudoti
optinę ir elektroninę mikroskopiją bei kitą sudėtingą šiuolaikinę technologiją.
Naudojant technines priemones, vykdomi sudėtingi stebėjimai. Visais atvejais vertingi tik
tinkamai įforminti stebėjimų rezultatai. Stebėjimų metu lyginami objektai ir reiškiniai, išskiriami
tipiški pavyzdžiai ir esminiai pakitimai.
Stebimi reiškiniai aprašomi įvairiais būdais:
1) Struktūrinis aprašymas (kada aprašomos išorinės ir vidinės formos, gyvulių konstitucija,
darbo įrankiai ir kt.).
2) Funkcinis aprašymas (kada aprašomi biologiniai gyvybės reiškiniai, gamtos procesai bei
jų ryšiai ir pan.).
3) Genetinis aprašymas (kada aprašoma individuali ar grupinė genezė ir vystymasis).
4) Išskiriama:
- pilnas aprašymas;
- atrankinis aprašymas.
Moksliniuose tyrimuose taikomos trys bandymų rūšys:
- Mokslinis bandymas.
- Mokslinis – ūkinis bandymas.
- Gamybinis bandymas.
Moksliniai bandymai vykdomi, kai tiriamieji objektai yra tokiose sąlygose, kuriose aplinkos
veiksniai kontroliuojami, tiksliai matuojami ir apskaitomi. Moksliniai tiriamieji bandymai, daug
labiau nei stebėjimai, siejami su teorijos išvystymu vienu ar kitu klausimu, turi detales tyrimų
metodikas ir tyrimų techniką. Be to, moksliniai tyrimai leidžia tirti atskirą objektą ar reiškinį vienu
metu esant skirtingoms sąlygoms bei esant šių sąlygų skirtingam nuoseklumui ir pan.
Mokslinis – ūkinis bandymas vykdomas panašiomis į gamybines sąlygomis, todėl dažnai
bandymų rezultatus galima iš karto pritaikyti gamyboje. Moksliniame – ūkiniame bandyme gauti
duomenys nagrinėjami iš biologinių, ekonominių, technologinių pozicijų ir turi atitinkamą reikšmę
gyvulininkystės gamybinių procesų tobulinimui. Šios rūšies bandymas neparodo kai kurių
22
biologinių procesų ypatumų, todėl be jo turi būti vykdomi ir platūs kompleksiški cheminiai,
fiziologiniai, medžiagų apykaitos, anatominiai, histologiniai, ekonominiai ir kt. moksliniai tyrimai.
Gamybinis bandymas - tai bandymų užbaigiamasis etapas. Šio bandymo metu gamybinėse
sąlygose, naudojant šiuolaikines technologijas, patikrinamos išvados, gautos mokslinių – tiriamųjų
bandymų metu. Gamybinis bandymas atliekamas keliuose stambiuose ūkiuose ar fermose. Jis gali
trukti gana ilgai. Svarbiausias jo tikslas – ne mokslinių žinių kaupimas, o gamybinių uždavinių
mokslinis sprendimas. Kartu tai yra ir mokslinių idėjų bei hipotezių šaltinis. Gamybinis bandymas
turi būti derinamas su kitais tyrimo metodais. Šios rūšies bandymas leidžia gauti gana patikimus
duomenis, jei atliekamas pagal gerą metodiką. Gamybiniame bandyme yra galimybė išsiaiškinti
visus technologinius ir ekonominius parametrus bei, esant teigiamiems rezultatams, rekomenduoti
juos plačiai taikyti žemės ūkio įmonėse.
6.2 Bandymų metodai
Pagal bandymų organizavimo būdą jie gali būti:
- paprasti;
- sudėtingi.
Atsižvelgiant į tai, kaip vykdomas bandymas ir kokiu būdu palyginami gauti duomenys, visi
bandymų metodai skirstomi į dvi stambias grupes:
- analoginių grupių;
- grupių – periodų.
Analoginių grupių metodus sudaro:
- porų – analogų metodas;
- monozigotinių dvynių metodas;
- išbalansuotų grupių metodas;
- modelinės mini bandos metodas;
- dviveiksnių ir daugiaveiksnių kompleksų metodai.
Grupių – periodų metodus sudaro:
- periodų metodas;
- paralelinių grupių – periodų metodas;
- atvirkščio pakeitimo metodas;
- pakartotinio pakeitimo metodas;
- lotynų kvadrato metodas.
Metodo pasirinkimą nulemia tiriamojo darbo uždaviniai ir konkrečios bandymo sąlygos.
23
Porų – analogų metodas yra pagrindinis ir labiausiai universalus. Tiriant vieną veiksnį,
sudaromos dvi analogiškos kokybės gyvulių grupės. Jie turi būti tipiški tai veislei, geriausiai –
giminingi arba bent panašūs pagal kūno sandaros tipą ir kitas savybes. Analogais parenkami
gyvuliai tik vienos lyties, panašaus amžiaus, išsivystymo, konstitucijos, sveikatingumo ir kt. Iš taip
sudarytų dviejų grupių viena yra kontrolinė, o antra – bandomoji.
Bandymo metu išskiriami trys periodai:
1) Paruošiamasis, kai visi veiksniai vienodi.
2) Pereinamasis.
3) Pagrindinis (apskaitomasis).
Šio metodo trūkumas tas, kad tiriami veiksniai vertinami pagal skirtingus, nors ir analogiškus,
gyvulius, kurie nėra visiškai identiški. Be to, reikia daug bandomųjų gyvulių. Tai apsunkina ir
pabrangina mokslinį tyrimą.
Monozigotinių dvynių metodas labai patikslina išvadas ir sumažina eksperimento išlaidas.
Duomenis rekomenduotina apibendrinti koreliaciniu ir dispersiniu metodais.
Išbalansuotų grupių metodas taikomas tuomet, kai tiriant porų – analogų metodu , duomenų
nepakanka arba yra per mažai gyvulių poroms – analogams sudaryti. Šiuo atveju gyvulių turi būti
1,5 – 2 kartus daugiau, negu jų reikėtų atlikti bandymus porų – analogų metodu. Tokia grupė turi
būti analogiška pagal vidinius grupės rodiklius. Gyvuliai į grupes parenkami atsitiktinumo principu.
Kai rodiklių skirtumai būna didesni negu 5proc., keli vienos grupės gyvuliai sukeičiami su kitos
grupės gyvuliais. Taip grupės suvienodinamos. Šis metodas daugiau tinka vykdant bandymus su
suaugusiais gyvuliais. Duomenys analizuojami koreliaciniu ir dispersiniu metodais.
Modelinis mini bandos metodas taikomas ilgalaikiams gyvulių šėrimo ir laikymo bandymams,
technologijų ir genetinių produktyvumo veiksnių tyrimams. Šio metodo esmė ta, kad, tiriant kurį
nors klausimą, sudaroma didelė gyvulių grupė. Ši grupė turi atitikti tiriamą bandą pagal visus
pagrindinius rodiklius: produktyvumą, amžių, gyvąją masę, veislę ir kt. Gyvuliai atrenkami
atsitiktinumo principu, po to bandos sudėtis reguliuojama pagal pagrindinius rodiklius. Kontrolinė
modelinės mini bandos grupė yra fermos arba ūkio banda. Dideliuose ūkiuose galima sudaryti
keletą modelinių mini bandų. Siekiant nustatyti, kaip bandomasis veiksnys veikia modelinėje mini
bandoje esančius įvairaus amžiaus, produktyvumo ir kt. grupių gyvulius, būtina individuali pašarų,
produktyvumo, fiziologinių ir biologinių rodiklių apskaita. Duomenys dažniausiai apibendrinami
tradiciniais variacinės statistikos metodais.
Dviveiksnių ir daugiaveiksnių kompleksų (integralinių grupių) metodai taikomi siekiant gauti
labiau detalizuotą informaciją apie tiriamą problemą. Tam vienu metu tiriama keletas veiksnių arba
jų skirtingo lygio (kiekio) poveikis ir tarpusavio sąveika. Integralinių grupių metodai padeda
išanalizuoti veiksnių komplekso įtaką gyvulių fiziologinei būklei ir produktyvumui. Kiekvienas
24
veiksnys analizuojamas pamažu besikeičiančių kitų veiksnių fone. Todėl galima nustatyti esminius
bendrus veiksnių poveikius arba vieno veiksnio stelbiamąjį poveikį kitam. Šie metodai ne tik
padeda išskirti atskirus veiksnius, bet ir nustatyti jų efektyvaus poveikio sąlygas. Tokių bandymų
duomenų analizė duoda geriausią medžiagą biologinio ir techninio pobūdžio išvadoms. Taikant
šiuos metodus, viename bandyme vieninga metodika sujungiama keletas mokslinių – ūkinių
bandymų, visapusiškai išaiškinančių tiriamąją problemą. Šio metodo trūkumas – reikalingos didelės
patalpos, daug vienodo amžiaus ir panašių gyvulių, nemažų vienodų pašarų atsargų, aukštos
kvalifikacijos darbuotojų. Integralinių grupių metodai plačiai taikomi kiaulininkystėje,
paukštininkystėje ir kitur. Jų rezultatai apibendrinami dispersinės ir regresinės analizės metodai.
Periodų metodas gali būti taikomas tiriant tik vieno veiksnio poveikį. Tuomet periodiškai
bandomi tik vienos grupės gyvuliai. Paruošiamajame bandymo periode patikrinama bandymui
atrinktų gyvulių sveikata, produktyvumo lygis, reakcija į išorinius veiksnius. Sergantys infekciniais,
invaziniais ir chroniškais susirgimais, neramūs ir agresyvūs gyvuliai bandymams netinka, todėl jie
pakeičiami kitais. Pirmajame bandymo periode gyvuliai laikomi įprastose sąlygose. Antrajame –
pagrindiniame – laikotarpyje į eksperimentą įvedamas tiriamasis veiksnys, kuris pakeičia kurią nors
įprasto režimo dalį, papildo buvusį režimą arba išimamas iš įprasto režimo, jeigu iki tol jame buvo.
Kontroliniame arba baigiamajame periode nustatoma, ar iš tikrųjų produktyvumo, sveikatingumo,
augimo ir kt. pasikeitimai yra sukelti tiriamojo veiksnio, o ne atsitiktinumo. Minimali paruošiamojo
periodo trukmė 15 parų, bandomojo – 25-30 ir 30-60, bei kontrolinio – 25-30 parų. Dažniausiai šis
metodas taikomas bandymuose su melžiamomis karvėmis. Bandymai vykdomi su tais pačiais
gyvuliais be kontrolinės grupės. Šio metodo trūkumas – galima klimatinių sąlygų ir bandomųjų
gyvulių fiziologinės būklės įtaka. Dėl to šis metodas taikomas trumpalaikiuose šėrimo bandymuose.
Paralelinių grupių – periodų metodas taikomas tada, kai vienu metu lyginama kelių veiksnių
įtaka. Tokiuose bandymuose galimas nepriklausomas veiksnių įtakos vertinimas ir santykinio
poveikio palyginimas. Šis metodas turi grupių ir periodų metodų privalumus ir trūkumus. Jis
taikomas palyginti retai, dažniausiai trumpalaikiuose šėrimo bandymuose.
Grupių – periodų atvirkščio pakeitimo metodas jungia jau aprašytų metodų pagrindus. Gauti
rodikliai lyginami tarp gyvulių grupių ir tarp bandymo periodų. Tai padeda gauti patikimesnius
rezultatus. Grupių – analogų parinkimas toks pats kaip ir grupinio metodo. Šis metodas taikomas
bandymuose su suaugusiais gyvuliais. Kartais vykdomi grupių – periodų metodo bandymai su
atvirkščiu pakeitimu, nenaudojant kontrolinės grupės. Tokiu atveju būtinas papildomas kontrolinis
(baigiamasis) periodas. Šį metodą galima taikyti tuo atveju, kada gyvulių fiziologinė būklė ir
esminiai veiksniai tapatūs palyginti ilgą, 1-2 mėnesių laikotarpį.
Pakartotinio pakeitimo metodas. Vykdant bandymus grupių ir periodų metodais, atsiranda
įvairaus pobūdžio klaidų, todėl dėl tikrumo bandymus būtina pakartoti. Tik sutapus abiejų bandymų
25
rezultatams, galima teigti, kad bandymas pavyko ir jo rezultatus galima diegti į gamybą. Tačiau
bandymų pakartojimui reikia nemažai laiko, jėgų ir lėšų. Taigi, naudojant šį metodą, derinami
grupių ir periodų metodų privalumai ir bandymas kartojamas tomis pačiomis sąlygomis mažiausiai
dar vieną kartą tiek gyvulių grupių tiek ir bandymo laikotarpių (periodų) atžvilgiu.
Lotynų kvadrato metodas yra patobulintas grupių – periodų metodas. Dviejų grupių ir dviejų
periodų schema yra paprasčiausias lotynų kvadrato struktūrinis planas. Šiuose bandymuose periodų
kiekis turi atitikti grupių (tiriamų veiksnių) kiekį. Gyvulių skaičius grupėje turi būti periodo
kartotiniu skaičiumi. Bandymui parenkami panašūs gyvuliai, kurie pagal atsitiktinumo principą
suskirstomi į grupes. Taikant šį metodą, sumažėja bandymams reikalingų gyvulių skaičius. Vienas
silpniausių šio metodo aspektų – prieš tai naudoto veiksnio poveikis. Šis metodas pagreitina
bandymus, bet netinka ilgalaikiams bandymams.
6.3 Gyvūnų parinkimas bandymams ir jų suskirstymas į grupes
Įvairių rūšių ir grupių gyvuliai bandymams turi būti parenkami pagal tam tikrus reikalavimus,
atsižvelgiant į bandymų tikslus. Pavyzdžiui, bandymui su kiaulių prieaugliu, t.y. su atjunkytais
paršeliais, grupėje parenkama 20 vienos veislės paršelių, kurie charakterizuojami šiais rodikliais:
- eilės numeris,
- paršelio numeris,
- lytis,
- gimimo data,
- paršelio masė, kg,
- kilmė – tėvas ir motina.
Bandymo atlikimui grupių metodu reikia parinktus paršelius suskirstyti į dvi analogiškas
grupes vadovaujantis šiais požymiais ir reikalavimais:
- veisliškumas – vienodas arba panašus;
- amžius – skirtumas tarp analogų ne daugiau 5 dienos;
- paršelių masė – leidžiami svyravimai ne daugiau 5 proc. nuo vidutinės masės;
- lytis – analogai vienodi;
- augimo intensyvumas – priesvoris per parą gali skirtis 5 proc. nuo vidutinio priesvorio
grupėje;
- kilmė – vieno kuilio ar paršavedės palikuonys.
Bandymui su suaugusiais galvijais (pavyzdžiui, su melžiamomis karvėmis) grupėje parenkama
20 tos pačios veislės karvių, kurios charakterizuojamos šiais rodikliais:
- eilės numeris,
26
- karvės vardas ir numeris,
- gimimo data,
- sėklinimo data,
- veislė ar veisliškumas,
- tėvas,
- motina,
- laktacija,
- laktacijos diena,
- tyrimo data,
- kūno masė, kg,
- pienas, kg ,
- pieno riebumo poc.,
- pieno baltymingumo proc.
Bandymo atlikimui grupių-periodų metodu karvės suskirstomos į analogines grupes pagal
tiriamus požymius ir reikalavimus.
- Veisliškumas - pageidautina vienodas arba artimas.
- Karvės turi būti tos pačios laktacijos.
- Masė – leidžiamas pageidautinas skirtumas ±5 proc. (išimtinais atvejais iki 10 proc.)
- Karvės turi būti to paties veršiavimosi sezono.
- Vidutinis primilžis per parą (tarp dviejų kontrolinių melžimų) – leidžiamas skirtumas
±5proc.
- Pieno riebumas ir baltymingumas – leidžiamas skirtumas 0,2-0,3 proc., bet ne daugiau
kaip 5 proc. nuo vidurkio .
Bandymui su galvijų prieaugliu (pavyzdžiui, su telyčaitėmis) parenkama 26 tos pačios veislės
veislės telyčaitės, kurios charakterizuojamos šiais rodikliais:
- eilės numeris,
- gyvūno numeris,
- vardas,
- gimimo data,
- kūno masė, kg,
- motina:
- vardas, numeris,
- laktacijų skaičius,
- vidutinis primilžis, kg,
- riebumas, proc.,
27
- baltymingumas, proc.,
- tėvas:
- vardas, numeris.
Telyčaitės, atliekant bandymą grupių metodu, suskirstomos į dvi analogines grupes (po 13
kiekvienoje iš jų) pagal šiuos požymius ir reikalavimus:
- amžius – skirtumas ne daugiau 10-15 dienų;
- masė – leidžiamas skirtumas ±5proc.;
- panašaus produktyvumo, kilmės ir veislinės vertės motinų, kurių skirtumas tarp
laktacijų – ne daugiau 1 laktacija; primilžis - ±5-10 proc.; pieno riebumo ir
baltymingumo – leidžiamas skirtumas 0,2-0,3 proc.;
- pageidautina vieno buliaus dukros.
6.4 Bandymų organizavimo principai su paukščiais
Atliekant bandymus su paukščiais būtina vadovautis šiais principais:
1) Metodo parinkimas.
2) Paukščių grupių parinkimas.
3) Paukščių skaičius bandomosiose grupėse nustatymas.
4) Bandymų trukmės ir periodų numatymas.
5) Bandymų atlikimo sąlygų įvertinimas ir numatymas.
6) Zootechninių rodiklių įvertinimas:
- išsaugojomo procentas,
- dėslumo intensyvumas,
- inkubaciniai kiaušinių rodikliai,
- masė,
- cheminė kombinuotųjų lesalų analizė
- sunaudotų kombinuotųjų lesalų sąnaudų apskaita.
7) Svėrimas.
8) Vidutinė kiaušinių masė.
9) Anatominis skerdenos įvertinimas.
10) Degustacija.
11) Priešskerdiminė masė, skerdenos įvertinimas.
12) Ekonominio efektyvumo įvertinimas.
28
6.5 Pašarų virškinamumo bandymų organizavimo principai
Pašarų virškinimo ir azoto, kalcio, fosforo bei kai kurių kitų mineralinių medžiagų apykaitos
tyrimai labai siejasi su moksliniais – ūkiniais bandymais ir dažnai būna jų sudėtine dalimi. Tačiau
minėti tyrimai gana specifiški ir jie gali būti visiškai savarankiški.
Virškinimo bandymai – tai vienas iš pašarų maistinės vertės nustatymo elementų.
Pašarų virškinimo bandymų metodika taikoma ir gyvuliams vertinti pagal raciono maisto
medžiagų įsisavinimą.
Pagrindinis yra tiesioginių bandymų metodas. Tuomet gyvuliui sušeriamas tiksliai
apskaičiuotas ir žinomos cheminės sudėties pašarų kiekis. Taipogi nustatomas išmatų kiekis ir jų
cheminė sudėtis. Pagal tai nustatomas maisto medžiagų kiekis, sunaudotas su pašarais ir išskirtas su
išmatomis. Suvirškintos dalies santykis su bendru sunaudotu kiekiu (procentais) sudaro virškinimo
koeficientą.
Pašarų virškinimo bandymai skirstomi į du periodus: paruošiamąjį ir pagrindinį. Paruošiamasis
periodas priklauso nuo pašarų slinkimo virškinamuoju traktu laiko ir atskiriems gyvuliams gali
užtrukti nuo 1 iki 21 paros. Pagrindinio periodo metu griežtai laikomasi nustatyto režimo,
atliekamos numatytos apskaitos analizės.
Šių bandymų metu, be minėtų operacijų, surenkamas šlapimas, nustatomas tiriamų elementų
kiekis jame. Medžiagų panaudojimas nustatomas pagal formulę:
100)(
a
cbaM
Kur: M – medžiagų panaudojimo koeficientas, proc.; a – medžiagos kiekis, sušertas su pašarais,
g; medžiagos kiekis, išskirtas su išmatomis, g; c - medžiagos kiekis, išskirtas su šlapimu, g.
Suvirškintų pašarų medžiagų panaudojimas nustatomas pagal formulę:
100)(
ba
baaM
Sudėtingesni bandymai būna tada, kai pilnaverčiam gyvulių šėrimui nepakanka vieno tiriamo
pašaro. Tuomet daromi diferenciniai bandymai.
Pašarų virškinamumo bandymams parenkami tipiški tai veislei ir visiškai sveiki gyvuliai. Jie
turi būti vidutinio amžiaus, sveikų dantų, turėti gerą apetitą. Geriausiai tinka suaugę vyriškos lyties
gyvuliai, nes jie turi stabilesnę fiziologinę būklę.
Vykdant palyginamąjį bandymą, būtina gyvulius suskirstyti į grupes. Tai atliekama tais pačiais
principais kaip ir moksliniame – ūkiniame bandyme.
Šios rūšies bandymams imamas ribotas gyvulių skaičius, todėl jie turi būti maksimaliai
vienodesni pagal fiziologinius bei genetinius ypatumus. Jeigu įmanoma, tokius bandymus geriausia
29
daryti su dvyniais arba gyvuliais, kilusiais iš vienos vados, priklausančiais vienai „uždarai“ linijai ir
pan.
Bandymo metu pildomas žurnalas, kur užrašoma visi duomenys kiekvienam bandomajam
gyvuliui. Dar pildomas dienoraštis, kur registruojama gyvulių būklė bei zoohigieninės sąlygos (t0,
santykinė oro drėgmė, oro judėjimo greitis ir t.t.). Bandomieji gyvūnai sveriami prieš kiekvieną
bandymo periodą ir jo pabaigoje. Sveriami ryte, prieš šėrimą ir dvi dienas iš eilės. Pašarų
virškinamumo bandymams pakanka 5-6 gyvulių, tiktai visi gyvuliai grupėse turi būti kruopščiai
parinkti analogų principu pagal visą eilę požymių.
Įvairiems gyvuliams pašaras per virškinamąjį traktą praeina nevienodu greičiu, todėl atskirų
bandymo periodų trukmė gali labai skirtis. Bandymo trukmė priklauso ir nuo paties bandymo
charakterio bei gyvulių būklės. Pavyzdžiui, bandymuose su galvijais ir ožkomis paruošiamasis
periodas gali trukti ir 10 dienų, jei pagrindinis ir bandomasis racionai mažai kuo skiriasi. Esant
žymiems kokybiniams skirtumams, ypač pagal proteinus ir ląstelieną, paruošiamojo periodo trukmė
padidėja iki 20 dienų.
Visuose bandymuose gyvulių šėrimo dažnumas priklauso nuo gyvulių rūšies, jų fiziologinės
būklės, amžiaus, raciono struktūros ir ėdamumo, tačiau šeriama ne mažiau kaip 2-3 kartus per parą.
Taikomas normuotas šėrimas. Tam apskaičiuojama vidutinis gyvasis svoris kiekvienoje
bandomojoje grupėje, o pagal jį apskaičiuojama pašaro kiekis per parą. Pašaro kiekį per parą
padalinus iš vidutinio gyvojo svorio grupėje, gauname pašaro reikmę per parą 1kg gyvulio svorio.
Nustatomas ir apykaitos energijos (AE) kiekis kiekvienam gyvuliui. Laktuojantiems gyvuliams bei
gyvuliams, duodantiems kitos rūšies produkciją, papildomai paskaičiuojama pašaro kiekis tai
produkcijai gauti.
Pašarų virškinamumo ir medžiagų apykaitos bandymuose gyvuliai šeriami individualiai. Pašarų
sąnaudos ir jų likučiai paskaičiuojami atskirai kiekvienam gyvuliui.
Pereinamuoju periodu gyvuliai pratinami prie bandymo sąlygų. Be to, griežtai laikomasi
numatytos dienotvarkės bei zoohigieninių normų. Prietaisų parodymai registruojami 4 kartus per
parą (6, 12, 18 ir 24 val.) viso bandymo metu.
Patalpoje, kur atliekami bandymai, neturi būti triukšmo ir pašalinių asmenų.
Pašarai, skirti bandymams, ruošiami iš anksto, reikiamu kiekiu ir asortimentu. Ypač svarbu
stebėti pašarų kokybę (kad atitiktų standartinius reikalavimus). Stambieji pašarai (šienas, šiaudai),
koncentratai grūdų pavidale prieš šėrimą smulkinami. Šakniavaisiai smulkinami tik prieš pat
šėrimą. Greitai negendantys pašarai (stambieji, koncentratai) susveriami visam bandymo
laikotarpiui kiekvienam gyvuliui ir atskirai kiekvienam šėrimui. Susverti pašarai laikomi sandariose
talpose.
30
Bandymuose su gyvuliais imami vidutiniai pašarų pavyzdžiai cheminiai analizei atlikti
(kiekvienam daviniui per parą atskirai ir atskirai kiekvienam pašarui). Pavyzdžiui, koncentratų
imama 200-250g, stambiųjų pašarų 400-500g, sultingųjų – 2-3kg.
Vidutinis pašarų pavyzdys sudaromas taip: paimtas pašarų bandinys gerai išmaišomas,
reikiamas jo kiekis patalpinamas į sandarų indą ir siunčiamas į cheminę laboratoriją tyrimams.
Pašarų likučiai paskaičiuojami kiekvienam gyvuliui atskirai ir po kiekvieno šėrimo (atskiriems
pašarams ar jų mišiniams). Tiriant mineralinių medžiagų apykaitą, apskaitomas tikslus išgerto
vandens kiekis. Vandens analizė atliekama ne mažiau kaip du kartus per bandymo laikotarpį.
Stambiųjų pašarų likučiai išsaugomi iki bandymo pabaigos. Po to iš bendro jų kiekio imamas
vidutinis bandinys (400-500g) analizėms atlikti. Žaliųjų pašarų, šakniavaisių, siloso, pieno, skystų
pramonės atliekų bei skystų pašarų mišinių likučiai konservuojami (pav., 3-5ml formalino 1kg
pašarų likučių). Bandiniai laikomi sandariuose stikliniuose induose prie 2-3 oC temperatūros
(šaldytuve).
Išskyrų apskaita atliekama tuoj pat renkant išmatas ir dedant jas į sandarias emaliuotas talpas.
Esant nedideliam išmatų kiekiui, tinka eksikatoriai. Išmatų apskaita ir bandinių atranka analizei
atliekama kartą per parą.
Išmatų ir šlapimo cheminėms analizėms atlikti pilnai užtenka 2 kg išmatų bei 2 l šlapimo iš
kiekvieno gyvulio. Esant dešimties dienų apskaitiniam laikotarpiui, būtina, kad išmatų bandinys per
parą būtų 200g, o šlapimo – 200ml.
Išmatų bandiniai konservuojami (pav., 10proc. HCl ir kt.). Reikia tiksliai žinoti pridedamų
konservantų kiekį. Bandiniai laikomi 2-3 oC temperatūroje.
Šlapimo apskaita vykdoma, jį surenkant specialios įrangos pagalba, o bandiniai taipogi
konservuojami (pav., 10proc. HCl, kurios turi būti 5proc. nuo bandinio svorio).
Minėtiems bandymams atlikti gyvuliai yra laikomi specialiuose narvuose ar grupiniuose
aptvaruose. Čia naudojama speciali įranga ir pritvirtinami maišeliai išmatų ir šlapimo surinkimui.
Pašarų virškinamumui nustatyti taikomi ir greitesni bei pigesni metodai. Tam naudojami
inertiniai indikatoriai. Vieni iš jų nustatomi pačiame pašare (silicio rūgštis, geležis, ligninas), kiti
papildomai įterpiami į pašarą (Fe2O3, Ti O3 ir kt.). Naudojant indikatorių, kuris įeina į pašarų
sudėtį ir nustatant maisto medžiagų virškinamumo koeficientus, atliekama pilna pašaro zootechninė
analizė bei išmatų analizė, kartu nustatant indikatorių pašare ir išmatose.
Bet kuri inertinė medžiaga (indikatorius) turi pasižymėti šiomis savybėmis:
- neturi būti virškinamas bei dalyvauti medžiagų apykaitoje;
- turi tolygiai išsiskirti su išmatomis;
- indikatoriaus neturi būti dirvoje, vandenyje ir ore;
- jis turi būti lengvai nustatomas cheminių analizių metu.
31
7. STATISTINIAI METODAI MOKSLINIAME TYRIME
7.1 Atrankos (imčių) metodai
7.1.1 Imtis ir populiacija. Imčių sudarymo būdai.
Sprendžiant problemas, dažnai iškeliame hipotezę, atliekame mokslinį tyrimą, sukaupiame
naujos informacijos kiekį, bandome tą naują informaciją sisteminti, lyginti su jau turima ir priimti
sprendimą.
Pirmasis, labai svarbus, dažnai lemiantis viso tyrimo sėkmę, žingsnis – pasirinkti tiriamąją aibę.
Jos objektai turi vieną ar keletą mus dominančių požymių. Labai svarbu kuo tiksliau apibrėžti
tyrimo tikslus ir įvertinti, ar konkretus objektas tikrai gali reprezentuoti mūsų tiriamą problemą.
Populiacija (generalinė visuma, generalinė aibė) yra visa objektų, kurie statistiškai tiriami,
visuma.
Imtis (atranka) – tyrimui atrinktų ir ištirtų objektų aibė.
Dažniausiai imtį sudaro populiacijos dalis. Bet jeigu ištiriama visa baigtinė populiacija, tai
imtis ir populiacija sutampa. Paprastai sprendžiamos problemos objektų aibė būna labai didelė, o
dažnai – begalinė (populiacija nuolat kinta ir neįmanoma išvardinti visų populiacijos objektų).
Bandydami ištirti visą populiaciją sutiktume tris pagrindines kliūtis: reikėtų labai daug laiko, labai
daug lėšų ir, jei populiacija begalinė, negalėtumėm surinkti visų populiacijos elementų.
Statistikos esmė – tirti palyginti nedidelę, ribotą imtį, o tyrimo rezultatus tikimybiškai
apibendrinti visai populiacijai. Matematinėje statistikoje yra sukurta technologija, kuri imčių bei
statistinių sprendimų teorijos metodų dėka su apibrėžta nedidele paklaida leidžia nustatyti
populiacijoje galiojančius dėsningumus, remiantis dalies objektų tyrimu.
Imties duomenų taikymo populiacijai pagrįstumą vadiname reprezentatyvumu.
Imtis turi kaip galima adekvačiau atspindėti populiaciją, iš kurios buvo sudaryta. Imties
reprezentatyvumą lemia sudarymo principas ir tūris (didumas).
Imties elementų skaičių vadiname imties didumu.
Didėjant imčiai, didėja tikimybė, kad šioje imtyje rastos požymių charakteristikos bei reikšmių
pasiskirstymas iš esmės būtų tokios pačios, kaip ir visos populiacijos objektų. Retai naudojamos
labai didelės imtys, nes panašaus patikimumo informaciją galima gauti ir iš vidutinio didumo imčių.
Imtis turi būti sudaryta pagal griežtas taisykles. Svarbiausia iš jų – imtis turi buti atsitiktinė
(visi populiacijos elementai turi turėti vienodas galimybes patekti į imtį). Atsitiktinės imties
pagrįstumas yra patvirtintas tiek praktine patirtimi, tiek ir matematikos teorija. Jeigu visų
populiacijos elementų tikimybės priklausyti imčiai visiškai vienodos, tai turime paprastąją
32
atsitiktinę grąžintinę imtį. Objektui pakliuvus į imtį, jį vėl reikėtų grąžinti į populiaciją, kad visų
objektų šansai pakliūti į imtį išsilygintų, ir vėl atrinkti naują objektą į imtį. Jeigu populiacija yra
didelė, tai kelių objektų pašalinimas tiriamam reiškiniui įtakos neturi. Praktiškai, beveik visada
imtys sudaromos be grąžinimų, bet taikomi grąžintinių imčių tyrimo metodai. Negrąžintinių imčių
tyrimo metodai yra sudėtingesni nei grąžintinių.
Sudaryti atsitiktinę imtį, kuri teisingai reprezentuotų populiaciją, pakankamai sudėtinga. Yra
keletas atsitiktinės imties sudarymo būdų. Šiuolaikiniuose tyrimuose atsitiktinės imtys dažnai
modeliuojamos kompiuteriu.
Sluoksninė atranka vykdoma pirmiausia populiaciją suskirstant į sluoksnius. Kiekvienam
sluoksniui taikomas paprastosios atsitiktinės grąžintinės imties sudarymo būdas. Sluoksninė imtis
leidžia surinkti informaciją apie kiekvieną populiacijos sluoksnį ir apibendrinti visai populiacijai.
Būtina atsižvelgti į kiekvieno sluoksnio užimamą dalį populiacijoje. Tokio tyrimo kaina būna
mažesnė, nes vienu metu galime atlikti kelis tyrimus – visos populiacijos ir atskirų sluoksnių.
Pavyzdžiui, jeigu norime išsiaiškinti kažkokio pieno produkto populiarumą Lietuvos gyventojų
tarpe, sudarant imtį reikia atsižvelgti į gyvenamą vietą, pajamas, amžių ir kt. Be to, reikės žinoti,
kokią visos Lietuvos gyventojų populiacijos dalį sudarys atitinkamo sluoksnio atstovai. Jeigu
kriterijų, pagal kuriuos apibrėžiami sluoksniai, yra daug, sudaryti imtį bus sudėtinga. Taikant šį
imties sudarymo būdą, populiacija turi būti nevienalytė sluoksnių atžvilgiu ir vienalytė sluoksnių
viduje.
Sudarant atsitiktinę imtį, reikia turėti visą tiriamųjų objektų sąrašą. Dažnai tai labai sudėtinga
arba neįmanoma. Tada konstruojama atsitiktinės imties atmaina, vadinama lizdine. Tarkim, jeigu
norime apklausti Lietuvos gyvulininkystės įmonių specialistus, tai iš įmonių sarašo atsitiktinai
atrenkame dalį įmonių ir apklausiame visus atrinktųjų įmonių specialistus. Šiuo metodu atlikto
tyrimo duomenų statistinės analizės būdai skiriasi nuo būdų taikomų paprastosios atsitiktinės imties
duomenų analizei.
Kartais objektų patekimą į imtį nulemia subjektyvus atsitiktinumas. Jo įtakos imties sudarymui
neįmanoma išmatuoti. Taip sudarytos imtys vadinamos netikimybinėmis imtimis. Tokios imtys būna
nereprezentatyvios. Ekspertinė imtis gaunama, kai objektai atrenkami atsižvelgiant į ekspertų
nuomonę. Tarkim, jeigu norime apklausti Lietuvos gyvulininkystės įmonių specialistus, ir iš įmonių
sąrašo atrenkame dalį įmonių ne atsitiktinai, o apžvelgę įmonių veiklos rezultatus ir parinkę tik
geriausius. Kvotinė imtis primena sluoksninę imtį, tačiau sluoksniuose elementai parenkami ne visai
atsitiktinai. Dažniausiai bandydami sudaryti atsitiktinę imtį, sudarome proginę. Tarkime, norime
išsiaiškinti „Rokiškio“ sūrio populiarumą Lietuvos gyventojų tarpe, o apklausiame tik Kauno
miesto gyventojus, arba tik Lietuvos sveikatos mokslų universiteto bendrabučiuose gyvenančius
33
kaimynus studentus. Iš proginės imties rezultatų neįmanoma padaryti jokių statistinių išvadų apie
visą populiaciją.
Dažnai norime rasti tiriamo reiškinio priklausomybę nuo kokio nors kito neatsitiktinio
reiškinio. Pavyzdžiui, norime nustatyti pašaro priedo efektyvumą (paršelių svorio padidėjimo
priklausomybę nuo pasirinkto vitamininio-mineralinio papildo), gyvenamosios vietos įtaką mėsos
produktų vartojimui (mėsos produktų kiekio suvartojimo skirtumą tarp miesto ir kaimo gyventojų).
Tuomet sudaromos kelios imtys, reprezentuojančios skirtingas tiriamas populiacijas (pvz.: miesto ir
kaimo gyventojus).
Tiriamas požymis matuojamas eksperimento nulemtose situacijose ir laikoma, kad matavimų
skirtumai priklauso tik nuo situacijos. Organizuojant eksperimentą, imtys derinamos tarpusavyje.
Išskiriamos susijusios (porinės, koreliuojančios) ir nesusijusios (lygiagrečiosios,
nekoreliuojančios) imtys.
Dvi imtys, kurių elementai nesusiję, bet kiekvienas pirmos imties elementas turi savo
atitikmenį antroje imtyje vadinamos porinėmis imtimis. Porinės imtys dažnai gaunamos
pakartotinai vertinant tos pačios imties elementus skirtingais laiko momentais. Pavyzdžiui,
įvertinome 20 žirgų pulsą treniruotės pradžioje, viduryje ir pabaigoje. Iš viso turime trijų matavimų
duomenis, kurie traktuojami kaip susijusios imtys. Porines imtis gauname ir tuo pačiu laiko
momentu, tada pirmosios imties objektui parenkamas „porininkas“ (pavyzdžiui, vertinant pašaro
priedo efektyvumą , iš tos pačios vados į skirtingas imtis atrenkame gyvūnus).
Keletas ar daugiau matavimų, atliktų kaskart su kitais bandomaisiais, traktuojami kaip
nesusijusios imtys. Nesusijusias imtis turėtume tuo atveju, jei tirtume žirgų, priklausančių
skirtingoms veislėms ar skirtingoms amžiaus grupėms eksterjero savybes.
Atliekant eksperimentus, dažnai kontrolinės ir eksperimentinės grupių skirtumai išryškėja ne
tik dėl tiriamojo, bet ir kokio nors kito požymio įtakos. Matematiniai skaičiavimai, jei neturime
pilnos informacijos apie kitus požymius, jų konkrečios įtakos įvertinti negali.
7.1.2 Požymiai
Požymiai yra tiriamųjų objektų savybės ar ypatybės, kurias siekiama užfiksuoti. Imties
elementų tiriamo požymio reikšmes vadiname duomenimis. Duomenų analizės metodo parinkimas
labai priklauso nuo jų prigimties.
Matuodami požymį, gauname tam tikrą dydį (kintamąjį), kuris kinta kartu su imties nariais.
Kintamieji skirstomi į kiekybinius ir kokybinius.
Kokybiniai (kategoriniai) kintamieji nusako dydžius, kurių neįmanoma įvertinti skaičiais,
apibūdinami juos įvardijant, t. y. pavadinant specialiais terminais, sutartiniais ženklais ar simboliais,
34
kurių funkciją gali atlikti net ir skaitmenys. Tokiu atveju jie nėra skaičiai, nes nereiškia dydžio,
kiekio, ir nėra loginio pamato su jais atlikti aritmetinius veiksmus.
Kiekybinis kintamasis nusako, kiek tiriamo požymio turi populiacijos elementas. Šie kintamieji
yra įvertinami vienokiais ar kitokiais matais ar skaičiavimo vienetais. Matavimo rezultatai paprastai
išreiškiami ir užrašomi skaičiais, su kuriais galima atlikti aritmetinius veiksmus.
Kiekybiniai kintamieji skirstomi į diskrečiuosius ir tolydžiuosius.
Diskretaus kintamojo galimų reikšmių skirtumai negali būti mažesni už tam tikrą minimalų
pokytį. Dažnai tas slenkstis ar žingsnis, vadinamas minimaliu galimų reikšmių skirtumu, būna lygus
vienetui (pvz. šuniukų skaičius vadoje). Diskrečiųjų kintamųjų įvertinimas priklauso nuo matavimo
prietaisų tikslumo (pvz. termometras fiksuoja 0,1 laipsnio kūno temperatūros pokyčius).
Tolydaus kintamojo reikšmių skirtumai gali būti neribotai maži, todėl jų neįmanoma absoliučiai
tiksliai užrašyti baigtiniais skaičiais, taip pat neįmanoma suskaičiuoti visų jų potencialių reikšmių,
nes jų yra be galo daug, ir tos reikšmės viena į kitą pereina laipsniškai, nenutrūkstamai. Tolydžius
kintamuosius dėl šios priežasties išmatuoti įmanoma tik apytiksliai, vienokiu ar kitokiu tikslumu.
Duomenys yra klasifikuojami ir atsižvelgiant į naudotą matavimų skalę.
Pavadinimų (nominalioji) skalė. Matuojant nominalųjį kintamąjį, kiekvienas imties elementas
turi turėti jam tinkamą kategoriją, o visos kategorijos turi aiškiai skirtis.
Rangų (tvarkos) skalė. Ši skalė naudojama, kai galima nustatyti objektų tiriamo požymio
skirtumus ir pagal tai objektus išrikiuoti į eilę. Ranginiai kintamieji užima tarpinę padėtį tarp
kiekybinių ir kokybinių požymių. Jie turi ir kiekybiniams, ir kokybiniams požymiams būdingų
bruožų. Ranginių požymių pavyzdžiai galėtų būti žirgų varžybose užimtos vietos, eksterjero
požymių įvertinimas balais ir pan.
Intervalų skalė. Duomenis, gautus pagal intervalų skalę, galima klasifikuoti, rikiuoti eilės
tvarka ir kiekybiškai vertinti skirtumus. Skirtumas tarp dviejų skaitinių duomenų požymio reikšmių
rodo, kiek daugiau matuojamo požymio yra viename objekte nei kitame.
Santykių skalė. Nuo intervalų skalės skiriasi tuo, kad joje apibrėžta absoliuti atskaitos pradžia,
kuri rodo, kad matuojamo požymio nėra. Pagal šią skalę matuojamas ilgis, svoris, amžius ir.t.t.
7.2 Aprašomoji statistika
Aprašomoji statistika – tai duomenų sisteminimo ir grafinio vaizdavimo metodai. Pagrindinis
aprašomosios statistikos tikslas – glaustas ir vaizdus surinktų duomenų apibūdinimas.
Duomenims sisteminti naudojamos skaitinės charakteristikos: dažniai, santykiniai dažniai,
vidurkis, mediana, standartinis nuokrypis ir t.t.
35
Grafiškai duomenys apibendrinami stulpelinėmis, skritulinėmis, stačiakampėmis, medžio
diagramomis ir kt..
Apibendrintai aprašomosios statistikos priemonių pasirinkimo galimybės susistemintos 2
lentelėje.
Aprašomosios statistikos pagrindu atliekamas pirminis kiekybinis duomenų apdorojimas,
parengiama bazė išsamesniems skaičiavimams. Aprašomosios statistikos metodų nepakanka tam,
kad pateiktume duomenų reprezentatyvumo, validumo argumentus, todėl pasitelkiami kiti
statistiniai metodai.
2 lentelė. Kintamojo tipams skaičiuotini aprašomosios statistikos rodikliai
Kokybinis kintamasis Kiekybinis kintamasis
Matavimų skalė Pavadinimų Rangų (tvarkos) Intervalinė Santykių
Matematiniai
veiksmai – – Sudėtis, atimtis,
daugyba, dalyba
Variacinės sekos Dažniai arba santykiniai dažniai Intevaliniai dažniai, intervaliniai
santykinai dažnai
Padėties
charakteristikos
Moda Moda, mediana,
kvartiliai,
kvantiliai
Vidurkis, moda,
mediana, kvartiliai, kvantiliai
Sklaidos
charakteristikos
Įvairovės ir
kokybinės
variacijos indeksai
Kvartilių
skirtumas
Variacijos amplitudė, kvartilių
skirtumas,
dispersija, standartinis nuokrypis,
standartinė vidurkio paklaida
Grafinės priemonės Skritulinė,
stulpelinė
diagramos
Histograma,
skritulinė,
stačiakampė
diagramos
Histograma,
stačiakampė diagrama
Aprašomoji statistika aprašo mus dominančius kintamuosius populiacijose ir imtyse (jų
dažnius, vidurkius, sklaidą). Kintamųjų savybės populiacijoje yra vadinamos parametrais, o imtyje
– statistikomis.
Aprašomosios statistikos priemonių naudojimas konkrečioje situacijoje priklauso nuo to, kokie
statistiniai duomenys yra surinkti. Reikia atsižvelgti į tai, koks turimų kintamųjų tipas: kokybiniai
(kategoriniai) ar kiekybiniai kintamieji. Taip pat svarbu, kokia skale išmatuoti šie kintamieji.
7.2.1 Duomenų grupavimas. Dažniai.
Vienas iš pirmųjų duomenų sisteminimo būdų, yra jų grupavimas. Statistiniu grupavimu
vadinamas visumos vienetų suskirstymas į vienarūšes grupes ir pogrupius pagal esminius
varijuojančius požymius.
36
Grupavimo požymių parinkimas priklauso nuo grupavimo tikslo ir preliminarios analizės.
Atsižvelgiant į grupavimo požymių skaičių, grupavimai gali būti:
- paprasti (pavyzdžiui, kai gyvūnai sugrupuojami pagal lytį);
- kombinuoti (pavyzdžiui, gyvūnai sugrupuojami pagal lytį ir amžių).
Pagal tarpusavio ryšį požymiai skirstomi į
- faktorinius (turinčius įtakos kitiems požymiams);
- ir rezultatinius (jiems įtakos turi kiti požymiai).
Empirinis skirstinys yra atsitiktinio kintamojo reikšmės ir jų dažniai. Kai kurie kintamųjų
dydžiai imtyje ar populiacijoje pastebimi dažniau nei kiti. Kintamojo reikšmės pasikartojimų imtyje
ar populiacijoje skaičius yra tos reikšmės dažnis. Jei kintamasis matuojamas rangų skalėje (ar
aukštesnėje), tuomet kintamojo reikšmės yra rikiuojamos nuo mažiausios iki didžiausios (sudarant
variacinę eilutę) ir su kiekviena reikšme susiejama jos dažnio išraiška.
Tarkime, kad X yra stebimas atsitiktinis dydis (kintamasis), o ),...,,( 21 nxxxx yra šio
atsitiktinio dydžio n stebėjimų rezultatai – paprastoji imtis. Surašę šią imtį nemažėjančia tvarka
turėsime vadinamąją variacinę seką.
Kintamojo dažniai pilnai neatskleidžia, kaip dažnai reikšmė kartojasi imtyje ar populiacijoje.
Kintamojo dydžio pasikartojimų skaičius, išreikštas nuo visų stebėjimų imtyje, yra to dydžio
santykinis dažnis nmw ii . Jis gerai parodo ar reikšmė kartojasi dažnai ar ne.
Reikšmės xi santykinis dažnis yra šios reikšmės tikimybės )( ii xXPP įvertis, i=1,2,…,k.
Vadinasi, yra prasmė sudaryti santykinių dažnių skirstinį, kuris įprastai yra vadinamas empiriniu.
Kai imtyje skirtingų reikšmių yra nedaug, imtį trumpiau galime užrašyti 3 lentelėje pateiktu
pavidalu.
3 lentelė. Imties užrašymo lentelė
Kintamasis x1 x2 ..... xk Dažnių suma
Dažnis m1 m2 .... mk n
Santykinis dažnis w1 w2 ... w3 1
Tokiu būdu sudaromos atributinės (pagal kokybinį požymį) ir neintervalinės diskretinės (pagal
kiekybinį diskretųjį požymį) variacinės eilutės. Pirmojoje eilutėje yra visos skirtingos kintamojo
reikšmės nxxx ,...,, 21 . Paprastai jos surašomos didėjančia tvarka: nxxx ...21 . Antroje eilutėje
nurodomas xi kintamojo reikšmės pasikartojimų imtyje skaičius mi (dažnis). Dažnių suma lygi
imties dydžiui nmk
i
i 0
. Trečiojoje eilutėje pateikiami santykiniai dažniai wi, kurių suma lygi
vienetui. Vietoje santykinių dažnių galima rašyti procentus.
37
Duomenims sisteminti naudojami ir sukauptieji bei santykiniai sukauptieji dažniai.
Kai skirtingų reikšmių yra daug, dažnių lentelė, kurioje pateikiamas kiekvienos reikšmės
dažnis, ilga ir neinformatyvi. Tada imtį suskirstome į klases, kaip nurodyta 4 lentelėje.
4 lentelė. Klasių dažnių skirstinio lentelė
Klasė Dažnis Sukauptasis dažnis Santykinis dažnis Santykinis
sukauptasis dažnis
a0 – a1 m1 m1 w1 m1/n
a1 – a2 m2 m1+m2 w2 (m1+m2)/n
… … … … …
ak-2 – ak-1 mk-1 m1+m2+…+mk-1 wk-1 (m1+m2+…+mk-1)/n
ak-1 – ak mk N wk 1
Dažnių suma N - 1
Tokia lentelė vadinama klasių dažnių skirstiniu. Atsitiktinio dydžio X empirinis santykinių
dažnių skirstinys yra tikrojo (populiacijos) skirstinio aproksimacija.
Klasių skaičių nustatome pagal formulę: nk lg222,31
Intervalo ilgis 1 ii aa vadinamas klasės pločiu, o intervalo vidurys 2/)( 1 ii aa – klasės
vidurio tašku. Kai grupuojame diskretų kintamąjį, klasės yra uždari intervalai 12; kk aa , o kai
grupuojame tolydų kintamąjį, klasės intervalas uždaras tik vienoje pusėje 12 ; kk aa .
Sugrupavus duomenis į dažnių lenteles, kartais kažkuriose klasėse dažniai būna labai maži ir
neišryškėja visumos būdingos savybės. Tokiais atvejais grupės stambinamos. Toks sugrupuotų
duomenų pertvarkymas vadinamas antriniu grupavimu.
Dažnių skaičiavimui skaičiuoklėje EXCEL naudojame 5 lentelėje nurodytas funkcijas ir
procedūras.
5 lentelė. Dažnių skaičiavimas skaičiuokle EXCEL
Suskaičiuoti Excel funkcija
Atributinės ir neintervalinės
diskretinės variacinės eilutės
dažnius
=COUNTIF(kintamojo reikšmės;sąlyga)
Variacinės eilutės dažnių sumą =SUM(dažniai)
lg n (dešimtainis logaritmas) =LOG10(reikšmių skaičius)
Intervalinės eilutės dažnius =FREQUENCY(kintamojo reikšmės; klasių ribos)
Naudojant šią funkciją, reikia:
pažymėti celių sritį, kurioje norime gauti suskaičiuotus klasių
dažnius;
parašyti formulę, panaudojus funkciją FREQUENCY
patvirtinti formulę <Ctrl>+<Alt>+<Enter> (vienu metu spausti)
38
7.2.2 Grafinis dažnių skirstinio vaizdavimas
Statistiniai grafikai sudaromi statistiniams duomenims populiarinti, apibendrinti ir analizuoti,
pateikia juos vaizdingiau, koncentruočiau.
Grafinės analizės metodas taip pat turi trūkumų. Jis suteikia mažiau informacijos nei lentelės.
Vaizduojamų reiškinių apimtį iš grafikų duomenų galima nustatyti tik apytikriai. Šis metodas
dažnai reikalauja nemažų darbo sąnaudų.
Statistiniai grafikai, kuriuose pateikiama informacija, atsakanti į klausimą „kiek daug“,
vadinami diagramomis.
Statistiniuose žemėlapiuose pateikiama informacija, paaiškinanti tyrimo klausimą „kur“.
Schemos parodo, kaip pasiekti tikslą. Dažnai šie trys statistinių grafikų tipai tarpusavyje
apjungiami.
Dažnių lentelės labai dažnai pateikiamos grafinėse diagramose.
Paprasčiausias dažnių skirstinį vaizduojantis grafikas yra dažnių daugiakampis (dažnių
poligonas, dažnių laužtė) (1 pav.). Dažnių skirstinį grafiškai vaizduojame koordinačių plokštumos
taškais nuosekliai sujungtais atkarpomis. Gali būti braižomos santykinių dažnių (3 pav.), sukauptųjų
dažnių (2 pav.) ar sukauptųjų santykinių dažnių (4 pav.) laužtės. Viename statistiniame grafike iš
karto galima braižyti keletą dažnių daugiakampių ir juos palyginti.
0
200
400
600
800
600 700 800 900 1000 1100 1200 1300 1400
klasė
dažnis
0
1000
2000
3000
4000
600 700 800 900 1000 1100 1200 1300 1400
klasė
dažnis
1 pav. Dažnių laužtė 2 pav. Sukauptųjų dažnių laužtė
0
5
10
15
20
600 700 800 900 1000 1100 1200 1300 1400
klasė
dažnis, %
0
20
40
60
80
100
600 700 800 900 1000 1100 1200 1300 1400
klasė
dažnis, %
3 pav. Santykinių dažnių laužtė 4 pav. Sukauptųjų santykinių dažnių laužtė
39
Grafiškai dažnai vaizduojami grupuoti duomenys. Empirinės grupuotų duomenų tankio
funkcijos grafikas vadinamas histograma (5 pav.). Histograma (stulpelinė diagrama) skirta reiškinių
kitimui, palyginimui, struktūrai ir struktūriniams poslinkiams vaizduoti. Histogramose dažniai
vaizduojami stačiakampiais, kurio aukštinė proporcinga pakliuvusių į intervalą reikšmių skaičiui.
Braižant histogramas vertikalioji (ordinačių) koordinačių ašis atspindi dažnį, o horizontalioji klasės
plotį. Histogramose nebūtina nagrinėti vienodus klasinius intervalus, kadangi jose dažnį
charakterizuoja stulpelio ribojama sritis.
0
100
200
300
400
500
600
700
800
600 700 800 900 1000 1100 1200 1300 1400
klasė
dažnis
10%
12%
15%
17%
17%
16%
8%4%1%
5 pav. Histograma 6 pav. Skritulinė diagrama
0
500
1000
1500
2000
600 700 800 900 1000 1100 1200 1300 1400
klasės
dažniai 1 diena 2 diena
0%
20%
40%
60%
80%
100%
600 700 800 900 1000 1100 1200 1300 1400
klasės
dažniai 1 diena 2 diena
7 pav. Sudėtinių dalių dinamikos diagrama 8 pav. Reiškinių struktūros palyginimas.
Skritulinės diagramos (6 pav.) labiausiai tinka kokybinių požymių analizei. Jose apskritimas
padalijamas į dalis, kurių plotas atspindi klasės dažnį. Labai dažnai skritulinėse diagramose
naudojamos procentinės dažnių išraiškos (santykiniai dažniai), kurios leidžia geriau suvokti
lyginamųjų kategorijų proporcijas.
Kokybinių požymių dažnių grafinei analizei labai tinka stulpelinės diagramos. Jose stulpelio
aukštis atitinka dažnį ir stulpeliai tarpusavyje nesiliečia.
Viso reiškinio ir jo sudėtinių dalių dinamiką geriausiai vaizduoja stulpeliai, dalijami į dalis,
proporcingas reiškinio vidinei sudėčiai (7 pav.). Kai norime pavaizduoti ir palyginti daugelio
40
reiškinių struktūrą, naudojame diagramą, kurios stulpeliai sudaryti iš santykinių dažnių ir visas
stulpelis prilyginamas 100 procentų (8 pav.).
Dažnių grafinio vaizdavimo skaičiuokle EXCEL procedūros apibendrintos 6 lentelėje.
6 lentelė. Grafinis dažnių skirstinio vaizdavimas skaičiuokle EXCEL
Vaizduoti grafiškai Excel funkcija
Dažnių laužtę
Sukauptųjų dažnių laužtę
Santykinių dažnių laužtę
Sukauptųjų santykinių dažnių laužtę
Insert Chart Line
Chart sub-type 1
Dažnių histogramą Insert Chart Column
Chart sub-type 1
Viso reiškinio ir jo sudėtinių dalių dinamiką Insert Chart Column
Chart sub-type 2
Pavaizduoti ir palyginti daugelio reiškinių
struktūrą (procentais) Insert Chart Column
Chart sub-type 3
Skritulinę diagramą Insert Chart Pie
7.2.3 Aprašomosios statistikos rodiklių skaičiavimas
7.2.3.1 Vidutiniai rodikliai
Visų imtyje randamų požymio reikšmių, pasiskirsčiusių tam tikru būdu, svorio centras,
vidutiniškoji (visos imties mastu imant) požymio reikšmė yra gaunama visų įvertinimų sumą
dalijant iš imties tūrio.
Labiausiai paplitusi duomenų padėties charakteristika yra vidurkis – tai taškas, kuris
vidutiniškai artimiausias visiems statistinės eilutės elementams..
Pirminio pavidalo (nesuglaustai) variacinei eilutei vidurkis skaičiuojamas pagal formulę:
Imties vidurkis: n
x
x
n
i
i 1
xi – kintamojo reikšmės; n – imties dydis.
Kai turime populiacijos arba imties dažnių skirstinį (1.2.1 skyr.), tai paprastai dažniai klasėse
nėra vienodi. Šiuo atveju vidurkiui skaičiuoti naudojame svertinį metodą:
k
i
i
k
i
ii
sv
m
mx
x
1
1
41
xi – kintamojo reikšmė; mi – kintamojo dažnis.
Jeigu turime populiacijos arba imties klasių dažnių skirstinį (1.2.1 skyr.), tai kiekvienos
kintamojo reikšmės nežinome. Tuomet randame klasės vidurio tašką ir jį naudojame skaičiuoti
vidurkiui svertiniu būdu.
2
1 iii
aaa
k
i
i
k
i
ii
sv
m
ma
x
1
1
Kai statistinėje eilutėje yra kelios labai išsiskiriančios iš kitų stebėjimų reikšmės, aritmetinis
vidurkis nėra itin geras matas, nes neatspindi to, kas būdinga daugumai stebėjimų. Tuomet
skaičiuojami nupjautieji vidurkiai. Nupjautuoju vadinamas toks vidurkis, kuris skaičiuojamas ne iš
visos variacinės eilutės, bet tik iš centrinės jos dalies, gautos atmetus po lygiai mažiausiųjų ir
didžiausiųjų požymio reikšmių.
Taip pat skaičiuojamas triskaitis vidurkis.
4
2 vidurkisTriskaitis 321 QQQ
Šis vidurkis toks pat nejautrus išskirtims, kaip ir mediana, todėl gerai tinka asimetrinėms
reikšmių eilutėms.
Jei statistinėje eilutėje labai išsiskiria kelios stebėjimų reikšmės, ieškome geriau nei vidurkis
eilutę apibūdinančios, tipiškiausios duomenų aibės reikšmės – modos. Moda – tai dažniausiai
duomenų aibėje pasikartojanti reikšmė. Jeigu visos reikšmės statistinėje eilutėje pasikartoja
vienodai dažnai, pasiskirstymas modos neturi. Jeigu kelios variacinės eilutės reikšmės pasikartoja
vienodai dažnai (bet dažniau nei kitos), tai pasiskirstymas turi kelias modas. Priklausomai nuo to,
kelios požymio reikšmės imtyje vienodai dažnos, galima skirti unimodalius, bimodalius ir
polimodalius pasiskirstymus. Modą turi tiek kiekybiniai tiek kokybiniai duomenys.
Reikšmė, dalijanti variacinę eilutę į 100q ir 100)1( q procentinių dalių, vadinama q-osios
eilės kvantiliu. Kvantilio reikšmė parodo, kad už ją 100q procentų kintamojo reikšmių yra
mažesnių ir 100)1( q – didesnių.
Skaičiai, dalijantys variacinę eilutę į 100 vienodų dalių, vadinami procentiliais.
Kvartiliai, tai kvantiliai, dalijantys variacinę duomenų eilutę į 4 lygias dalis, kas 25 procentus.
Už pirmąjį kvartilį (Q1) 25 proc. kintamojo reikšmių yra mažesnės ir 75 proc. didesnės. Už antrąjį
(Q2) – pusė didesnių ir pusė mažesnių. Už tečiąjį (Q3) – 75 proc. didesnių ir 25 proc. mažesnių.
Antrasis kvartilis vadinamas mediana.
Padėties charakteristikoms skaičiuoti naudojamos EXCEL funkcijos nurodytos 7 lentelėje.
42
7 lentelė. Vidutinių rodiklių nustatymo skaičiuokle EXCEL funkcijos
Suskaičiuoti Excel funkcija
Aritmetinis vidurkis =AVERAGE(kintamojo reikšmės)
Svertinis vidurkis =SUMPRODUCT(klasės kintamojo reikšmės;klasės dažniai)/SUM(klasės
dažniai)
Nupjautasis vidurkis =TRIMMEAN(kintamojo reikšmės; atmestinas procentas)
Moda =MODE(kintamojo reikšmės)
Mediana =MEDIAN(kintamojo reikšmės)
Kvartilis =QUARTILE(kintamojo reikšmės;nr) ; nr – 1 (pirmas); 2 (antras); 3
(trečias)
Procentilis,
Kvantilis =PERCENTILE(kintamojo reikšmės;procentilis); procentilis – nuo 0 iki 1
7.2.3.2 Variacijos rodikliai
Svarbiausia sklaidos (variacijos) charakteristika yra dispersija. Ji apskaičiuojama kaip
skirtumų, susidarančių tarp reikšmių vidurkio ir konkrečių požymio reikšmių, atitinkančių
kiekvieną imties objektą, kvadratų vidurkis.
Imties dispersija n
xxn
i
i
1
2
2
)(
Dispersijos naudojamos, kai norime tarpusavyje palyginti skirtingų duomenų aibių sklaidą.
Pagal dispersijos reikšmę suvokti, ar sklaida didelė ar maža, gana sunku, nes dispersija matuojama
kvadratiniais požymio mato vienetais.
Patogesnis, itin dažnai naudojamas ir vienas iš populiariausių sklaidos rodiklių yra standartinis
nuokrypis (vidutinis kvadratinis nuokrypis). Jis gaunamas ištraukus kvadratinę šaknį iš dispersijos.
Tokiu būdu jis paverčiamas vėl „linijiniu“ (t. y. geometriškai galimu pavaizduoti atitinkamo ilgio
linija; dispersiją gi tektų vaizduoti plotu) dydžiu ir tampa tam tikra prasme bendramatiškas tiek
imtyje figūruojančioms požymio reikšmėms, tiek ir pačiam empiriniam vidurkiui.
Imties standartinis nuokrypis n
xxn
i
i
1
2)(
Duomenų koncentracija apie vidurkį tiesiogiai priklauso nuo standartinio nuokrypio dydžio.
Skirtingų duomenų (skirtingais mato vienetais matuotų) aibių sklaidai palyginti naudojamas
kitimo (variacijos) koeficientas požymio variaciją leidžia išreikšti procentais:
100x
Cv
43
Duomenų aibės plotis – tai didžiausios ir mažiausios požymio reikšmių variacinėje eilutėje
skirtumas. Šios charakteristikos leidžia ne tik „iš akies“ įvertinti išskirtis, bet ir aptikti klaidas.
Daug mažiau jautrus išskirtims kvartilių skirtumas:
13 QQIQR
Kategorinių kintamųjų variaciją įvertiname apskaičiuodami kokybinės įvairovės indeksą:
)1(
))...((2
22
2
2
1
2
kn
pppnkQ k
IV
k – kategorijų skaičius; n – kintamojo reikšmių skaičius; mi – i-osios kategorijos dažnis.
Kokybinės įvairovės indeksas kinta nuo 0 (nėra reikšmių variacijos) iki 1 (didžiausia reikšmių
variacija).
Pagrindinių variacijos rodiklių nustatymo skaičiuokle EXCEL funkcijos parodytos 8 lentelėje.
8 lentelė. Variacijos rodiklių funkcijos skaičiuoklėje EXCEL
Suskaičiuoti Excel funkcija
Mažiausia reikšmė =MIN(kintamojo reikšmės)
Didžiausia reikšmė =MAX(kintamojo reikšmės)
Dispersija =VAR(kintamojo reikšmės)
Standartinis nuokrypis =STDEV(kintamojo reikšmės)
Mediana =MEDIAN(kintamojo reikšmės)
Skaičiuokle MS Excel visus pagrindinius aprašomosios statistikos rodiklius, t.t. ir variacijos,
galime apskaičiuoti naudodami Tools/Data Analysis įrankį (9 lentelė).
9 lentelė. Aprašomosios statistikos rodiklių skaičiavimas skaičiuokle EXCEL
Aprašomosios statistikos rodiklių skaičiavimo procedūra
TOOLS / DATA ANALYSIS / DESCRIPTIVE STATISTICS
Gautame programos lange užpildome punktus:
- Input Range – imties duomenų srities adresas (galima duomenis pažymėti pele);
- Output Range – adresas ląstelės, nuo kurios žemyn bus patalpinti skaičiavimo
rezultatai, t.y. viršutinis kairysis gaunamos lentelės kampas;
- Summary Statistics – pažymime, kad nurodytiems duomenims reikalinga skaičiuoti
skaitines charakteristikas.
Parinkus visus šiuos punktus, spaudžiame mygtuką OK ir gauname nurodytoje vietoje skaitinių
charakteristikų lentelę (10 lentelė).
44
10 lentelė. Aprašomosios statistikos rodiklių skaičiavimas skaičiuokle EXCEL
Aprašomosios statistikos rodikliai
Mean aritmetinis vidurkis
Standard Error vidurkio paklaida
Median Mediana
Mode Moda
Standard Deviation standartinis nuokrypis
Sample Variance Dispersija
Kurtosis Eksceso koeficientas
Skewness asimetrijos koeficientas
Range duomenų aibės plotis
Minimum mažiausia reikšmė
Maximum didžiausia reikšmė
Sum reikšmių suma
Count reikšmių kiekis
7.3 Dinamikos (laiko) eilutės
Skaitinė statistinių rodiklių seka laiko atžvilgiu vadinama dinamikos (laiko) eilute. Ji apibūdina
reiškinių kitimą laiko atžvilgiu.
Dinamikos eilutę sudaro:
- laiko charakteristika ( t ) – laikotarpis arba laiko momentas (data);
- dinamikos eilutės lygiai (yi) – nagrinėjamo reiškinio raidos kiekybinis matas.
Pagal laiko charakteristiką dinamikos eilutės gali būti:
- momentinės,
- intervalinės.
Momentinės dinamikos eilutės rodo nagrinėjamų reiškinių apimtį tam tikru laiko momentu,
apibūdina lėtai kintančius reiškinius (11 lentelė).
11 lentelė. Momentinės dinamikos eilutės pavyzdys
t (laiko momentas) 2006.01.01 2007.01.01 2008.01.01 2009.01.01 2010.01.01
yi (lygis) (galvijų skaičius
ūkyje) 500 520 600 580 560
Intervalinės dinamikos eilutės (12 lentelė) rodo reiškinių apimtį per tam tikrą laikotarpį (parą,
savaitę, mėnesį, metus ir t.t.), apibūdina turinčius proceso pobūdį reiškinius.
12 lentelė. Intervalinės dinamikos eilutės pavyzdys
t (laiko intervalas) 2006
metai
2007
metai
2008
metai
2009
metai
2010
metai
yi (lygis) (primelžta pieno, t) 2160 2184 2460 2442 2397
45
Sudarant dinamikos eilutes (grupuojant duomenis pagal laiką), reikia laikytis principų:
- visi lygiai apskaičiuojami pagal vieningą metodiką;
- visi lygiai apskaičiuojami tuo pačiu laiko momentu;
- laikomasi teritorijos tapatumo;
- lygiai išreiškiami tais pačiais mato vienetais;
- vertiniai rodikliai išreiškiami to paties tipo kainomis.
Dinamikos eilutės yra informatyvios, pateikia didelį kiekį susistemintos informacijos. Didžioji
dalis Lietuvos Statistikos departamente sukauptos ir susistemintos informacijos pateikiama kaip
dinamikos eilutės, todėl svarbu žinoti, kaip tą informaciją analizuoti ir įsisavinti.
Analizuojant dinamikos eilutę skaičiuojami analitiniai rodikliai:
- absoliutus pokytis (padidėjimas, sumažėjimas), prieaugis;
- kitimo (didėjimo, mažėjimo) tempas;
- pokyčio (padidėjimo, sumažėjimo) tempas;
- padidėjimo tempo 1 procentu absoliuti reikšmė.
Analitinių rodiklių skaičiavimui naudojami metodai:
- bazinis metodas, kai palyginimo bazė pastovi (dažniausiai lyginama su pradiniu eilutės
lygiu);
- grandininis metodas, kai palyginimo bazė kinta (lyginama su prieš tai esančiu lygiu).
Absoliutus pokytis rodo, keliais vienetais pasikeičia reiškinio apimtis per tam tiktą laikotarpį.
Tai dviejų dinamikos lygių skirtumas.
Bazinis absoliutus pokytis : bii yy .
Grandininis absoliutus pokytis: 1 iii yy .
Kitimo tempas rodo, kiek kartų pasikeitė reiškinio apimtis einamuoju laikotarpiu bazinio
laikotarpio atžvilgiu. Tai dviejų dinamikos eilutės lygių santykis, išreikštas koeficientais arba
procentais.
Bazinis kitimo tempas: b
i
y
y
iK .
Grandininis kitimo tempas: 1
i
i
y
y
iK .
Jeigu kitimo tempą padauginsime iš 100, jis bus išreikštas procentais.
Pokyčio tempas rodo, kiek procentų (ar punktų) pakito (sumažėjo – neigiamas pokytis;
padidėjo – teigiamas pokytis) tiriamas reiškinys vėlesniu laikotarpiu, palyginus su prieš tai buvusiu
(baziniu). Tai absoliutaus pokyčio ir dinamikos eilutės lygio, pasirinkto baze (pagal kurį
apskaičiuotas absoliutus pokytis), santykis.
46
Bazinis kitimo tempas: b
bi
b
ibi
y
yy
yP
.
Grandininis kitimo tempas: 1
1
1
i
ii
i
ig
iy
yy
yP .
Iš atitinkamo kitimo tempo atėmus 1 (arba 100, jei kitimo tempas išreikštas procentais)
gausime pokyčio tempą.
Pokyčio tempo vieno procento absoliutinė reikšmė rodo, kas slypi viename pokyčio procente
natūriniais mato vienetais. Tai absoliutinio pokyčio ir pokyčio tempo, išreikšto procentais, santykis.
(%)i
i
PA
Viso laikotarpio reiškinio dinamikai apibendrintai apibūdinti skaičiuojami vidutiniai dinamikos
eilučių rodikliai.
Vidutinis lygis (paprastasis vidurkis intervalinėms eilutėms; chronologinis vidurkis
momentinėms eilutėms; svertinis vidurkis eilutėms su nelygiais laiko intervalais);
Vidutiniai pokyčiai – absoliutus pokytis, kitimo tempas ir pokyčio tempas.
Reiškinio bendram lygiui apibūdinti per visą dinamikos eilutėje rodomą laikotarpį
skaičiuojamas vidutinis dinamikos eilutės lygis.
Intervalinių dinamikos eilučių vidutinis lygis: n
y
y
n
1i
n
.
Momentinių dinamikos eilučių vidutinis lygis: 1
2
1...
2
1321
n
yyyy
yn
Dinamikos eilučių su nelygiais laiko intervalais vdutinis lygis:
n
i
i
n
i
ii
t
ty
y
1
1
Absoliutus vidutinis pokytis (absoliučių pokyčių vidurkis) rodo, keliais vienetais vidutiniškai
kas laikotarpį pasikeičia reiškinio apimtis. Absoliutus vidutinis pokytis - tai grandininių absoliučių
pokyčių aritmetinis vidurkis.
1
1
n
yyny
k
kyyy
y
...21
47
Vidutinis kitimo tempas (kitimo tempų vidurkis) įvertina kiek (kiek kartų) vidutiniškai kas
laikotarpį pasikeičia reiškinio apimtis. Vidutinis kitimo tempas tai grandininių kitimo tempų
geometrinis vidurkis. 1
1
nn
ny
yK
kkk KKKKK ...321
Vidutinis pokyčio tempas (pokyčio tempų vidurkis) rodo keliais procentais (punktais)
vidutiniškai kas laikotarpį pasikeičia reiškinio apimtis.
Vidutinis pokyčio tempas apskaičiuojamas iš kitimo tempų vidurkio atėmus 1 (jei kitimo
tempas išreikštas koeficientu) arba 100 (jei kitimo tempas išreikštas
procentais). 100)1((%) KPn
y1 – pradinis dinamikos eilutės lygis; yn – galutinis dinamikos eilutės lygis; yb – bazinis
dinamikos eilutės lygis; n – lygių skaičius; k – laikotarpių skaičius.
Analizuojant dinamikos eilutes, svarbu ne tik nustatyti įvairius kitimo parametrus, bet ir
išsiaiškinti bendrą reiškinio kitimo kryptį (trajektoriją) ir ją kiekybiškai aprašyti, t.y. gauti jos
modelį, kuris leistų įvertinti reiškinio lygį ateityje.
Analizuojant konkrečią statistinę informaciją, svarbu įvertinti bendrus reiškinio kitimo bruožus,
išsiaiškinti pagrindinę reiškinių vystymosi tendenciją (trendą). Reiškinio kitimo tendencijai įvertinti
atliekamas dinamikos eilučių pertvarkymas tam tikrais metodais..
Sustambintų intervalų metodas. Laiko intervalai pailginami (apjungiami) ir apskaičiuojami
ilgesnių laikotarpių lygių vidurkiai. Sustambinus laiko intervalus aiškiau pastebimos kitimo
tendencijos. Ilgesnių laikotarpių reiškinio lygiai mažiau veikiami atsitiktinių faktorių negu
trumpesnių. Stambinant intervalus prarandama dalis informacijos.
Slenkančių vidurkių metodas. Skaičiuojami keleto laikotarpių vidurkiai, pasislenkant po vieną
dinamikos eilutės lygį. Gerai tinka tiriant sezoninius svyravimus. Nors šis metodas leidžia nustatyti
tiriamo reiškinio vystymosi tendenciją, tačiau nesuteikia galimybių tolesnei analizei.
Analitinio dinamikos eilučių išlyginimo metodas. Pagrindinė raidos tendencija (trendas)
išreiškiama kaip laiko funkcija )( it tfy .
Lygtis, aprašanti reiškinio kitimą laike, vadinama reiškinio tendencijos lygtimi (trendu).
Tolygioji funkcija parenkama mažiausių kvadratų metodu: min)yy( 2
tii (yi – faktinis
dinamikos eilutės lygis; yti – lygis, apskaičiuotas pagal funkcijos lygtį, tuo pačiu laiko momentu,
kaip ir yt). Šio metodo esmė ta, kad lygties koeficientus reikia parinkti taip, kad būtų kuo mažesni
nukrypimai tarp parinktos teorinės kreivės yt ir faktinių dinamikos eilutės lygių yi.. Priklausomai
nuo tiriamo reiškinio plėtros laiko atžvilgiu tendencijos, turime parinkti adekvatų raidos tendenciją
aprašančios funkcijos tipą.
48
Kai reiškinio kitimui būdingi pastovūs absoliutieji prieaugiai - raidos tendencija išreiškiama
tiesinės funkcijos lygtimi btayt
. Koeficientas b nusako raidos kryptį.
Jeigu tiriamojo reiškinio prieaugio tempai stabilūs - raidos tendencija išreiškiama antrojo
laipsnio parabolės funkcijos lygtimi .2ctbtayt Koeficientas c apibūdina raidos intensyvumo
kitimą.
Kintamai greitėjančios (lėtėjančios) raidos tendencija išreiškiama trečiojo laipsnio parabolės
funkcijos lygtimi .32 dtctbtayt Koeficientas d apibūdina greitėjimo kitimą.
Kai grandininiai kitimo tempai pastovūs, raidos tendencija išreiškiama rodiklinės funkcijos
lygtimi t
t bay . Koeficientas b, apibūdinantis didėjimo (mažėjimo) tempą, vadinamas raidos
intensyvumu.
Ar teisingai pasirinkome matematinę funkciją reiškinio raidos tyrimui, įvertina vidutinė
išlyginimo (aproksimacijos) paklaida 1001
.
i
tii
aproky
yy
n .
Priimta laikyti, kad prognozės rezultatai raidos tendenciją išreiškiančia funkcijos lygtimi
statistiškai reikšmingi, jeigu aproksimacijos paklaida neviršija 10%.
Dinamikos eilučių ekstrapoliacija, būsimų reiškinio lygių įvertinimas darant prielaidą, kad
remiantis dinamikos eilutės duomenimis nustatytas dėsningumas tam tikru laipsniu išlieka ir už jos
ribų.
Dinamikos prognozės atliekamos:
- pagal vidutinį absoliutų lygio pokytį ynLn Lyy ˆ
(L – prognozės į priekį
laikotarpių skaičius);
- pagal vidutinį pokyčio tempą L
nnLn Pyy )(ˆ ;
- pagal raidos tendencijos (trendo) funkciją (tiesinę, parabolės, rodiklinę ir t.t.).
Parenkant raidos tendencijos funkciją, kiekvienam dinamikos eilutės lygiui turime priskirti
laiko eilės numerius. Laiko eilės numerius ti parenkame taip, kad jų suma būtų lygi nuliui 0t .
Jei dinamikos eilutė turi nelyginį lygių skaičių, viduriniam lygiui priskiriame nulį (0), į dešinę laiko
eilės numeriai didėja kas vienetą (+1, +2, +3 ...), į kairę – mažėja kas vienetą (-1, -2, -3 ...). Kai
dinamikos lygiams parinkti laiko eilės numeriai, galime taikyti regresinės analizės metodą.
Vertindami dinamikos eilutes galime naudoti skaičiuoklės EXCEL procedūras ir funkcijas,
nurodytas 13 lentelėje.
49
13 lentelė. Dinamikos eilučių vertinimo procedūros skaičiuoklėje EXCEL pavyzdys
Apskaičiuoti ir vaizduoti grafiškai Excel funkcija
Apskaičiuojami (prognozuojami) dinamikos
eilutės lygiai pagal tiesės lygtį y = a + bt
(gaunama raidos tendencija – trendas)
=TREND(yi reikšmės;ti reikšmės; tp numeris)
Tiesinės regresijos lygties y = a + bt
koeficientas a
koeficientas b (regresijos)
=INTERCEPT(yi_reikšmės;ti_reikšmės)
=SLOPE(yi_reikšmės;ti_reikšmės)
Prognozuojamas lygis pagal tiesės lygtį
y = a + bt =FORECAST(tp numeris;yi reikšmės;ti reikšmės)
Prognozuojamų reikšmių standartinė paklaida.
Pateikia kiekvienai x reikšmei regresijoje
prognozuotos y reikšmės standartinę klaidą.
=STEYX(yi_reikšmės;ti_reikšmės)
Prognozuojamas lygis pagal rodiklinę lygtį
y = a * bt
GROWTH yi_reikšmės;ti_reikšmės; tp_numeris)
Reiškinio raidos tendenciją vaizduoti grafiškai
Brėžti raidos tendencijos kreivę
Pasirinkti tipą (tiesę)
Gauti raidos tendencijos lygtį
Gauti determinacijos koeficiento reikšmę
Insert Chart XY(Scatter)
Sklaidos diagramą papildyti trendo kreive :
Ant bet kurio sklaidos taško spausti dešinį pelės
klavišą
Rinktis Add Trendline;
Type / Linear
Options/ Display equation on chart
Options/ Display R-squared value on chart
yi reikšmės – dinamikos eilutės lygiai; ti reikšmės – dinamikos eilutės lygių laiko eilės numeriai; tp
numeris – dinamikos eilutės prognozuojamo lygio laiko eilės numeris; Kg reikšmės – grandininiai
kitimo tempai
Apskaičiuoti Excel funkcija
Suma (lygių) =SUM(yi reikšmės)
Aritmetinis vidurkis (lygių) =AVERAGE(yi reikšmės)
Geometrinis vidurkis (vidutinis kitimo tempas) =GEOMEAN(Kg reikšmės)
7.4 Indeksų metodas
Reiškinių kitimui charakterizuoti statistikoje plačiai naudojami apibendrinantys santykiniai
rodikliai, tarp kurių svarbią vietą užima indeksai.
Indeksas – tai vieno ir to pačio reiškinio dviejų būsenų palyginimo rodiklis. Jis kiekybiškai
apibūdina reiškinio kitimą laiko ar erdvės atžvilgiu. Tai palyginimo ne tik su praėjusiu laikotarpiu,
bet ir su kita teritorija bei normatyvais, rodiklis.
50
Indeksuojamo dydžio kitimą rodo skaičiuojamas indeksas. Dydis, su kuriuo lyginama,
vadinamas baziniu. Pagal reiškinių apimtį skiriami individualieji ir bendrieji (grupiniai) indeksai.
Individualieji indeksai – tai santykiniai dinamikos dydžiai. Santykiniai dydžiai – tai reiškinių
kiekybinių santykių rodikliai, leidžia lyginti ir gretinti absoliučiuosius dydžius. Santykiniam
dydžiui gauti reikalingi bent du absoliutūs dydžiai.
Individualūs indeksai apskaičiuojami lyginamąjį dydį (qn) dalinant iš bazinio dydžio (qb).
b
nq
q
qi
Dinamikos santykiniai dydžiai apibūdina vienarūšių reiškinių kitimą tam tikru laiku. Jie rodo
reiškinių vystymosi kryptį bei kitimo greitį.
Struktūros santykiniai dydžiai rodo nagrinėjamos visumos sudėtį. Jais remiantis galima
nustatyti struktūrinius poslinkius, įvykusius per tam tikrą laikotarpį. Koordinacijos santykiniai
dydžiai rodo to paties objekto atskirų dalių tarpusavio santykius. Jais nustatomas nagrinėjamos
visumos vienos dalies vienetų kiekis, tenkantis kitai visumos vienetų daliai.
Palyginimo santykiniai dydžiai rodo to paties laikotarpio tačiau priklausančių skirtingiems
objektams bei teritorijoms vienavardžių ir vienarūšių rodiklių tarpusavio santykius. Intensyvumo
santykiniai dydžiai rodo reiškinių paplitimą tam tikroje aplinkoje ar teritorijoje, gaunami lyginant
du kokybiškai skirtingus įvairiavardžius (bet susijusius) absoliutinius dydžius.Bendrieji indeksai
leidžia įvertinti sudėtingų reiškinių pokyčius. Jie vienu rodikliu apibūdina skirtingų, nevienarūšių
reiškinių visumų arba jų grupių pokyčius, kurių duomenų natūrine išraiška tarpusavyje sumuoti
negalima.
Sudarant bendrąjį (grupinį) indeksą, visi produktai perskaičiuojami į bendramačius (kuriuos
galima tiesiogiai sumuoti). Tam tikslui, priklausomai nuo analizuojamo reiškinio esmės, parenkami
bendramatikliai. Bendramatikliais būna savikaina, kaina, darbo sąnaudos, įvairūs perskaičiavimo
koeficientai. Bendramatikliai (svoriai) yra susiję su indeksuojamu rodikliu ir įvedami, kad būtų
galima įvairiavardžius, tarpusavyje nesumuojamus reiškinius paversti sumuojamais.Bendrąjį
indeksą apskaičiuojame:
ii
ii
qpq
pqI
0
1
q1i – indeksuojamas i-tąją reiškinio dalį apibūdinantis dydis; q0i – bazinis i-tąją reiškinio dalį
apibūdinantis dydis; pi – bendramatiklis (svoris).
51
Bendrasis indeksas, tai statistinis rodiklis, kuris keleto ar daugelio sujungtų autonomiškų
indikatorių pagrindu charakterizuoja naują apibendrintą kompleksinį kintamąjį. Indeksai ypač
paplitę ekonomikoje, statistikoje ir taip pat gyvūnų moksluose.
Indeksais gali būti apibūdinti ir palyginti kompleksiniai, daugiamačiai reiškiniai.
Tarkim, konstruodami gyvūno fenotipo bendrąjį kelių požymių indeksą, turėtume atsižvelgti į
keletą dimensijų (požymių įvertinimus), kurias sujungtume vienu indeksu.
Dažnai indekso sudedamosioms dimensijoms suteikiamas nevienodas „svoris“. Pavyzdžiui,
kiaulių raumeningumui arba karvių pieno baltymingumui suteikiamas didesnis lyginamasis svoris,
lyginant su kitų požymių fenotipiniu įvertinimu.
Vieno ar kito indikatoriaus (dimensijos) svoris nustatomas teoriškai, kai kada, kai yra šalutinis
kriterijus (ekspertinis vertinimas, gimininga skalė), svorį galima nustatyti empiriniu keliu,
panaudojant koreliacinę ir faktorinę analizę.
Indeksų konstravimas gyvūnų mokslų praktikoje visada pasireiškia kaip darni konceptualaus
teorinio ir formalaus statistinio mąstymo sąveika.
7.5 Statistiniai sprendimai. Parametriniai ir neparametriniai metodai
7.5.1 Imties reprezentatyvumas
Pagrindinė statistikos problema – remiantis imtimi gauti išvadas apie visą populiaciją.
Imties sudarymo būdas lemia, kokios bus kintamojo reikšmės (x) ir kaip dažnai (m) imtyje jos
pasitaikys. Dažnai mus domina ne visas kintamojo x skirstinys, o tik kokia nors jo charakteristika.
Statistinėms išvadoms naudojama imties duomenų funkcija vadinama statistika. Statistika, kuri
naudojama nežinomam parametrui įvertinti, vadinama taškiniu įverčiu. Statistinės išvados remiasi
tik vienu (konkrečiu) parametro taškiniu įverčiu. Turime įvertinti statistikos atsitiktinumo lygį ir
pasirinkti tokią sprendimo procedūrą, kad klaidingos išvados tikimybė būtų maža.
Nežinomas populiacijos parametras yra skaičius. Parametro įvertis iš imties duomenų yra
atsitiktinis dydis, kuris randamas konkrečiai imčiai. Vertinant tą patį populiacijos parametrą, dėl
imties atsitiktinumo (sudarant vis kitą atsitikrinę imtį, atliekant tyrimus) parametro įverčiai skirsis.
Kuo mažesnis skirtumas tarp tikrosios parametro reikšmės ir jo įverčio, gauto iš imties duomenų,
tuo įvertis yra geresnis ir tuo patikimiau gautieji rezultatai reprezentuoja populiaciją.
Skirtumas tarp tikrosios parametro reikšmės ir apskaičiuotosios iš imties duomenų vadinamas
imties paklaida (reprezentatyvumo paklaida, standartine paklaida).
Galim išskirti du paklaidų tipus:
- sisteminė – kai pažeidžiami imties sudarymo principai;
52
- atsitiktinė – dėl imties kintamumo.
Jeigu sudarydami imtį nesilaikėme imties sudarymo taisyklių, netiksliai matavome tiriamus
požymius, tai negalime tikėtis patikimų reprezentatyvių rezultatų. Sistemines paklaidas reikia
pašalinti.
Atsitiktinių paklaidų išvengti negalime, bet galime įvertinti jų dydį.
Atsitiktinė paklaida priklauso nuo:
- imties didumo – kuo imtis didesnė, tuo paklaida mažesnė;
- požymio variacijos dydžio – kuo dispersija didesnė, tuo ir paklaida didesnė.
Visi parametrai apskaičiuoti iš imties duomenų skiriasi nuo tikrųjų populiacijos parametrų, t.y.
turi standartines paklaidas (žymime raide m, su indeksu rodiklio, kuriam paklaida apskaičiuota).
Aritmetinio vidurkio standartinė paklaida nmx
Standartinio nuokrypio paklaida n2m
Variacijos koeficiento paklaida n2
Cm v
Cv
Imties parametro reprezentatyvumą įvertina santykinė paklaida.
100Parametras
paklaida Parametro % paklaida, Santykinė
Santykinė paklaida turėtų būti mažesnė nei 5%.
Vidurkio santykinę paklaidą galime apskaičiuoti 100,% x
mm x
x
7.5.2 Pasikliautinieji intervalai
Intervalas, kuriam gali priklausyti nežinomas parametras, vadinamas pasikliautinuoju intervalu.
Jeigu galime įvertinti tikimybę, kad populiacijos parametras priklauso skaičių intervalui,
tikimybė, kad populiacijos parametras priklauso tam tikram skaičių intervalui, vadinama
pasikliovimo lygmeniu, o tas skaičių intervalas – pasikliautinuoju intervalu.
Pasikliautinumas yra matavimo rezultato kokybinis bruožas, kuriuo apibūdinama matuojamo
dydžio ir tikrosios vertės atitikties tikimybė P.
Tradiciniai pasikliovimo lygmenys yra trys: 0,9 (90%), 0,95 (95%), 0,99 (99%).
Tarkime, kad pasikliovimo lygmuo yra 0,95. Tai reiškia, kad daug kartų taikant parametro
pasikliautinio intervalo skaičiavimo taisykles skirtingoms imčių realizacijoms, parametras
priklausys maždaug 95% visų intervalų.
53
Dažniausiai skaičiuojamų parametrų pasikliautinieji intervalai (14 lentelė):
vidurkio , kai populiacijos vidurkis nežinomas, o dispersija žinoma
nzxX
;
dispersijos, kai populiacijos vidurkis žinomas, o dispersija nežinoma
2
;
22
n
nS
;
vidurkio, kai populiacijos vidurkis ir dispersija nežinomi
n
txX n
1; ;
dispersijos, kai populiacijos vidurkis ir dispersija nežinomi
2
1;
22 )1(
n
nS
;
tikimybės (įgyti tam tikrą požymio reikšmę) n
ppzpP
)1( .
Čia: X – populiacijos vidurkis; x – imties vidurkis; S2 – populiacijos dispersija; – imties
standartinis nuokrypis; 2 – imties dispersija; n – imties dydis; P – turinčių tiriamą savybę
populiacijos objektų dalis; p – turinčių tiriamą savybę imties objektų dalis; z – standartinio
normaliojo skirstinio 1 lygmens kvantilis; )1(; nt – Stjudento skirstinio su n-1 laisvės laipsnių
1 lygmens kvantilis; 2
)(; k – 2 skirstinio su k laisvės laipsnių 1 lygmens kvantilis;
2/)1( Q ; Q – pasikliovimo lygmuo (0,9; 0,95; 0,99).
14 lentelė. Parametrų pasikliautinių intervalų vertinimo skaičiuokle EXCEL procedūros
Apskaičiuoti Excel funkcija
zα (Normaliojo skirstinio α lygmens kritinė
reikšmė) = NORMSINV(α)
tα (Stjudento skirstinio α lygmens kritinės
reikšmės) =TINV(α;laisvų narių skaičius)
2
( 2 skirstinio α lygmens kritinės reikšmės) = CHIINV(α;laisvų narių skaičius)
Fα (Fišerio skirstinio α lygmens kritinės
reikšmės) = FINV(α;laisvų narių sk_1; laisvų narių sk_1)
7.5.3 Būtinojo imties dydžio nustatymas
Planuojant tyrimus, svarbu nustatyti reikalingą minimalų tiriamųjų objektų skaičių, kad būtų
galima padaryti statistiškai reikšmingas išvadas.
Tiriamosios grupės dydis priklauso nuo tyrimo tikslo ir tiriamos populiacijos savybių, t.y. nuo
jos dydžio ir vienalytiškumo tiriamojo požymio atžvilgiu. Jei vienalytiškumas vienodas, tai pačiai
54
populiacijai reikalingos mažesnės tiriamųjų grupės, ir atvirkščiai, kuo didesnis populiacijos
heterogeniškumas, tuo imties dydis turėtų būti didesnis.
Manoma, kad jeigu tyrėjas savo tyrimo rezultatus apdoros statistiniais būdais, tada minimalus
atvejų skaičius neturėtų būti mažesnis kaip 30, tačiau norint gauti tikslesnius duomenis, būtina
vertinti tyrimo duomenų patikimumą bei jų tikslumą, t.y. remtis matematinės statistikos metodais.
Nustatant imties tūrį, svarbu išsiaiškinti, kam bus taikomi tyrimo rezultatai – ar visai tiriamai
populiacijai, ar tik tiriamosios grupės narių atžvilgiu.
Pasikliautinį intervalą nustatome naudodami tris tarpusavyje susijusius dydžius – pasikliovimo
lygmenį, imties dydį ir pasikliautinio intervalo ilgį. Užsibrėžus aukštesnį pasikliovimo lygmenį,
pasikliautinio intervalo ribos plečiasi. Didinant imtį, mažinamas pasikliautinio intervalo ilgis.
Vidurkio pasikliautinio intervalo ilgis yra nz /2 . Skaičiuodami būtinąjį imties dydį, turime
užsibrėžti, kokio tikslumo rezultatus tikimės gauti – su kokiu pasikliovimo lygmeniu ir kokio
intervalo ribose svyruos vertinamas populiacijos parametras.
Lengviau nustatyti imties tūrį, kai jau yra žinomi tam tikri tiriamo reiškinio parametrai
(dispersija). Šiuo atveju galima pritaikyti tokią formulę:
2
22
zn
n – planuojamo tyrimo imties dydis; z – standartinio normaliojo skirstinio 1 lygmens
kvantilis; 2 – imties dispersija; Δ – vidurkio pasikliautinio intervalo ilgis, laisvai pasirenkamas,
atsižvelgiant į ankstesnių tyrimų duomenis bei duomenų tikslumui keliamus reikalavimus.
Dvireikšmio kintamojo atveju (objektas pasižymi tiriama savybe arba ne), p pasikliautinio
intervalo ilgis apytiksliai yra nz / . Imties dydį apskaičiuosime 2
2
zn .
Dažnai sprendžiame uždavinį, ar skirtumas tarp dviejų populiacijų tiriamojo požymio vidurkių
yra statistiškai reikšmingas, su pasirinktu reikšmingumo lygmeniu ir galia.
Kai dviejų populiacijų tiriamojo požymio dispersijos nelygios ir planuojame sudaryti vienodo
dydžio imtis:
2
22
2
2
1111 )z2z(n
Kai dviejų populiacijų tiriamojo požymio dispersijos lygios ir planuojame sudaryti vienodo
dydžio imtis:
2
2
11
2 )zz(2n
Imčių dydis populiacijų požymių proporcijų palyginimo atveju:
55
2
21
2
11
)pp(2
)zz(n
Čia: α - reikšmingumo lygmuo; β – kriterijaus galia; Δ – tyrimui reikšmingas skirtumas, kurį
norima
7.5.4 Hipotezių tikrinimas
Parametro ar kintamojo skirstinio įvertis iš imties duomenų yra apytikslė reikšmė. Dažniausiai
sprendžiame iškilusius uždavinius, remdamiesi imties duomenimis. Iškeliame hipotezę ir, arba ją
priimame (hipotezė pasitvirtino), arba atmetame (nepasitvirtino).
Parametrinės hipotezės – tai hipotezės apie kintamųjų skirstinių parametrų (vidurkio,
dispersijos ir t.t.) reikšmes.
Kartais imtys būna mažos, ir mes negalime teigti, kad duomenys pasiskirstę pagal kažkurį
žinomą skirstinį. Tuomet skaičiuojami neparametriniai kriterijai, kurie tikrina neparametrines
hipotezes.
Statistinę parametrinę hipotezę sudaro du alternatyvūs teiginiai apie galimas parametro
reikšmes. Problema formuluojama kaip spėjimas apie galimas parametro b reikšmes, priklausančias
tam tikram reikšmių intervalui B1, pateikiant alternatyvą, kad b priklauso visai kitam reikšmių
intervalui B2.
.:
,:
11
00
BbH
BbH
H0 - nulinė hipotezė; H1 - alternatyva (alternatyvioji hipotezė).
Praktiškai hipotezė užrašoma taip:
.:
,:
01
00
bbH
bbH
Alternatyvos hipotezės skirstomos į dvipuses 0bb ir vienpuses 0bb (arba 0bb ).
Pavyzdžiui, tirdami, ar paršavedžių vislumas bus 11 paršelių, domėsimės ar nebus mažesnis.
Didesnis vislumas, vykdant selekciją, mus tenkins. Taigi kelsime vienpusę hipotezę 0bb .
Tirdami, ar dviejų veislių paršavedžių vislumas vienodas, kelsime dvipusę hipotezę ji bb .
Priimdami ar atmesdami nulinę hipotezę galime padaryti dviejų rūšių klaidas:
- pirmos rūšies klaida – H0 atmetame, kai ji teisinga;
- antros rūšies klaida – H0 priimame, kai ji klaidinga.
Taisyklė, pagal kurią iš imties rezultatų darome išvadą apie hipotezės teisingumą ar
klaidingumą, vadinama statistiniu kriterijumi.
56
Kriterijus tuo geresnis, kuo mažesnės abiejų rūšių klaidų tikimybės. Dėl imties atsitiktinumo
neįmanoma sudaryti kriterijaus, kad abiejų klaidų tikimybės būtų lygios nuliui. Parenkamas mažas
teigiamas skaičius ir nagrinėjami tik tokie kriterijai, kurių pirmos rūšies klaidos tikimybė lygi .
vadinamas reikšmingumo lygmeniu. Kriterijaus reikšmingumo lygmuo - tai tikimybė atmesti
nulinę hipotezę, kai ji teisinga.
Be reikšmingumo lygmens dažnai skaičiuojama kriterijaus galia . Kriterijaus galia – tai
tikimybė atmesti nulinę hipotezę, kai ji klaidinga.
Statistinis kriterijus turi atsakyti į klausimą – jeigu iš imties duomenų apskaičiuotas parametro
įvertis nepatenka į nulinės hipotezės priėmimo reikšmių intervalą, ar tikėtina, kad taip atsitiks ir su
tikruoju populiacijos parametru. Sprendimui priimti naudojame kokią nors statistiką, kuri turi
žinomą skirstinį, kai H0 teisinga. Jeigu apskaičiuotas kriterijus patenka į skaičių aibę W, tenkinančią
tam tikras sąlygas, nulinė hipotezė atmetama (priimama alternatyva). Aibė W vadinama kritine
sritimi. Kritinės reikšmės atskiria kritinę sritį nuo hipotezės neatmetimo srities.
Jeigu apskaičiuotasis statistinis kriterijus priklauso kritinei sričiai, nulinė hipotezė atmetama.
Priešingu atveju neatmetama.
7.5.5 Statistinės išvados vienai imčiai
7.5.5.1 Hipotezės apie vidurkio lygybę skaičiui tikrinimas
Stebime normalųjį atsitiktinį dydį ),(~ 2SXNX , kai dispersija yra žinoma, o vidurkis
nežinomas. Tikriname hipotezę, kad vidurkis yra lygus skaičiui a.
Kriterijaus statistiką apskaičiuojame: nS
axZ
/
Nulinė hipotezė atmetama (vidurkis statistiškai reikšmingai skiriasi nuo a), jeigu 2/zZ .
Čia: x – imties vidurkis; S – standartinis populiacijos nuokrypis; n – imties dydis; a – skaičius (su
kuriuo lyginamas parametras);. 2/z – standartinio normaliojo skirstinio 2/ lygmens kritinė
reikšmė; – reikšmingumo lygmuo.
Stebime normalųjį atsitiktinį dydį ),(~ 2SXNX , kai dispersija ir vidurkis nežinomi.
Tikriname hipotezę, kad vidurkis yra lygus skaičiui a.
Kriterijaus statistiką apskaičiuojame: n
axt
/
Nulinė hipotezė atmetama (vidurkis statistiškai reikšmingai skiriasi nuo a), jeigu )1(2/ ntt .
Čia: x – imties vidurkis; – standartinis imties nuokrypis; n – imties dydis; a – skaičius (su
kuriuo lyginamas parametras);. )1(2/ nt – Stjudento skirstinio su n-1 laisvės laipsnių (laisvų narių)
2/ lygmens kritinė reikšmė.
57
Skaičiuoklės EXCEL procedūros, naudojamos hipotezės apie vidurkio lygybę skaičiui
tikrinimas, nurodytos 15 lentelėje.
15 lentelė. Hipotezės apie vidurkio lygybę skaičiui tikrinimas, naudojant skaičiuoklę EXCEL
Hipotezės apie vidurkio lygybę skaičiui tikrinimas (kai dispersija žinoma)
= ZTEST(kintamojo_reikšmės;skaičius;žinoma_dispersija)
Tikrina vienpusę hipotezę, kad populiacijos vidurkis didesnis už skaičių
=2 * MIN(ZTEST(kintamojo_reikšmės;skaičius;žinoma_dispersija);
1 - ZTEST(kintamojo_reikšmės;skaičius;žinoma_dispersija))
Tikrina dvipusę hipotezę, kad populiacijos vidurkis didesnis už skaičių
Hipotezės apie vidurkio lygybę skaičiui tikrinimas (kai dispersija nežinoma; dispersija skaičiuojama
iš imties duomenų)
= ZTEST(kintamojo_reikšmės;skaičius)
Tikrina vienpusę hipotezę, kad populiacijos vidurkis didesnis už skaičių
=2 * MIN(ZTEST(kintamojo_reikšmės;skaičius);1 - ZTEST(kintamojo_reikšmės;skaičius))
Tikrina dvipusę hipotezę, kad populiacijos vidurkis didesnis už skaičių
7.5.5.2 Hipotezės apie dispersijos lygybę skaičiui tikrinimas
Stebime normalųjį atsitiktinį dydį ),(~ 2SXNX , kai dispersija yra nežinoma, o vidurkis
žinomas. Tikriname hipotezę, kad dispersija yra lygi skaičiui a.
Kriterijaus statistiką apskaičiuojame:
n
i
i Xxa
T1
2)(1
Nulinė hipotezė atmetama (dispersija statistiškai reikšmingai skiriasi nuo a), jeigu 2
)(2/ nT
arba 2
)(2/1 nT .
Čia: - imties kintamieji; X – populiacijos vidurkis; n – imties dydis; a – skaičius (su kuriuo
lyginamas parametras);. 2
)(2/ n ir 2
)(2/ n – 2 skirstinio su n laisvės laipsnių kritinės reikšmės.
Stebime normalųjį atsitiktinį dydį ),(~ 2SXNX , kai dispersija ir vidurkis nežinomi.
Tikriname hipotezę, kad dispersija yra lygi skaičiui a.
Kriterijaus statistiką apskaičiuojame:
n
i
i xxa
T1
2)(1
58
Nulinė hipotezė atmetama (dispersija statistiškai reikšmingai skiriasi nuo a), jeigu 2
)1(2/ nT
arba 2
)1(2/1 nT
Čia: ix - imties kintamieji; x – imties vidurkis; n – imties dydis; a – skaičius (su kuriuo
lyginamas parametras);. 2
)1(2/ n ir 2
)1(2/ n – 2 skirstinio su n-1 laisvės laipsnių kritinės
reikšmės.
7.5.6 Statistinės išvados dviems imtims
7.5.6.1 Hipotezės apie dviejų vidurkių lygybę tikrinimas
Dažnai reikia palyginti dviejose populiacijose stebimus atsitiktinius dydžius. Sudarome dvi
imtis, skaičiuojame imčių parametrus, konstruojame statistiką, kuri remiasi imčių parametrų
skirtumu.
Nepriklausomos imtys.
Stebime du normaliuosius atsitiktinius dydžius ),(~ 2SXNX ir ),(~ 2SYNY , kurių
vidurkiai nežinomi, o dispersijos nežinomos ir lygios. Tikriname hipotezę, kad vidurkiai nesiskiria.
Kriterijaus statistiką apskaičiuojame: yx
yxyx
yyxxnn
nnnn
nn
yxt
)2(
)1()1( 22
Nulinė hipotezė atmetama (skirtumas tarp vidurkių yra statistiškai reikšmingas), jeigu
)2(2/ yx nntt .
Čia: yx, – imčių vidurkiai; yx nn , – imčių dydžiai; yx , – imčių dispersijos; )2(2/ yx nnt -
Stjudento skirstinio su 2nn yx laisvės laipsnių 2/ lygmens kritinė reikšmė.
Hipotezės apie dviejų vidurkių lygybę tikrinimas, kai imtys nepriklausomos, dispersijos
nežinomos ir lygios vertinamos, naudojant skaičiuoklės EXCEL procedūras, nurodytas 16 lentelėje.
Stebime du normaliuosius atsitiktinius dydžius ),(~ 2SXNX ir ),(~ 2SYNY , kurių vidurkiai
nežinomi, o dispersijos nežinomos ir nelygios. Tikriname hipotezę, kad vidurkiai nesiskiria.
Kriterijaus statistiką apskaičiuojame:
y
2
y
x
2
x
nn
yxt
Nulinė hipotezė atmetama (skirtumas tarp vidurkių yra statistiškai reikšmingas), jeigu
)k(2/tt . Laisvės laipsnių skaičius apskaičiuojamas:
3
y
4
y
3
x
4
x
2
y
2
yx
2
x
nn
nnk
59
yx, – imčių vidurkiai; yx nn , – imčių dydžiai; 2
y
2
x , – imčių dispersijos; )k(2/t - Stjudento
skirstinio su k laisvės laipsnių 2/ lygmens kritinė reikšmė.
Tokios hipotezės vertinimui naudojame 17 lentelėje nurodytas skaičiuoklės EXCEL funkcijas.
16 lentelė. Hipotezės apie dviejų nepriklausomų imčių vidurkių lygybę tikrinimas
skaičiuokle EXCEL , kai dispersijos nežinomos ir lygios
= TTEST(imties1_reikšmės;imties2_reikšmės;hipotezės_tipas;imčių_tipas)
imčių_tipas 2; vienpusė hipotezė – hipotezės tipas 1; dvipusė hipotezė – hipotezės tipas 2.
TOOLS / DATA ANALYSIS / t-Test: Two-Sample Assuming Equal Variances
Gautame programos lange užpildome punktus:
- Input 1 Range – pirmosios imties kintamųjų srities adresas;
- Input 2 Range – antrosios imties kintamųjų srities adresas;
- Hypothesized Mean Difference – 0 (tikriname hipotezę, kad vidurkiai lygūs)
- Labels – , jeigu pažymime ir kintamųjų pavadinimus;
- Alpha – reikšmingumo lygmuo (nuo 0 iki 1)
- Output Range – adresas celės, nuo kurios žemyn bus patalpinti skaičiavimo rezultatai,
t.y. viršutinis kairysis gaunamos lentelės kampas;
Parinkus visus šiuos punktus, spaudžiame mygtuką OK ir gauname nurodytoje vietoje Stjudento
testo rezultatų lentelę.
17 lentelė. Hipotezės apie dviejų nepriklausomų imčių vidurkių lygybę tikrinimas
skaičiuokle EXCEL , kai dispersijos nežinomos ir nelygios
= TTEST(imties1_reikšmės;imties2_reikšmės;hipotezės_tipas;imčių_tipas)
imčių_tipas 3; vienpusė hipotezė – hipotezės tipas 1; dvipusė hipotezė – hipotezės tipas 2.
TOOLS / DATA ANALYSIS / t-Test: Two-Sample Assuming Unequal Variances
Gautame programos lange užpildome punktus taip pat kaip ir lygių dispersijų atveju.
Priklausomos imtys.
Stebime normalių atsitiktinių kintamųjų ),(~ 2SXNX ir ),(~ 2SYNY poras, kurių vidurkiai
ir dispersijos nežinomos. Tikriname hipotezę, kad vidurkiai nesiskiria.
Skaičiuojame porų duomenų skirtumus: iii yxd
Kriterijaus statistiką apskaičiuojame: n
d
n
yxt
2
d
2
d
Nulinė hipotezė atmetama (skirtumas tarp vidurkių yra statistiškai reikšmingas), jeigu
)1n(2/tt .
60
yx, – imčių vidurkiai; yx nn , – imčių dydžiai; d – skirtumų vidurkis; 2
d – skirtumų dispersija;
)1n(2/t - Stjudento skirstinio su n-1 laisvės laipsnių 2/ lygmens kritinė reikšmė.
Skaičiavimams naudojame 18 lentelėje nurodytas skaičiuoklės EXCEL funkcijas ir procedūras.
18 lentelė. Hipotezės apie dviejų priklausomų imčių vidurkių lygybę tikrinimas
skaičiuokle EXCEL , kai dispersijos nežinomos
Hipotezės apie dviejų vidurkių lygybę tikrinimas – imtys priklausomos, dispersijos nežinomos,
imčių_tipas 1; vienpusė hipotezė – hipotezės tipas 1; dvipusė hipotezė – hipotezės tipas 2.
= TTEST(imties1_reikšmės;imties2_reikšmės;hipotezės_tipas;imčių_tipas)
TOOLS / DATA ANALYSIS / t-Test: Paired Two-Sample for Means
Gautame programos lange užpildome punktus taip pat kaip ir nepriklausomų imčių atveju.
7.5.6.2 Hipotezės apie dviejų dispersijų lygybę tikrinimas
Nuo to, ar dispersijas galima laikyti lygiomis, priklauso Stjudento kriterijaus statistika.
Tikriname hipotezę, kad dispersijos nesiskiria.
Nepriklausomoms imtims kriterijaus statistika skaičiuojama: 2
y
2
xF
Nulinė hipotezė atmetama (dispersijos statistiškai reikšmingai skiriasi), jeigu )1n,1n(2/ yxFF
arba )1n,1n(2/1 yxFF
Čia: 2
y
2
x , – imčių dispersijos; )1n,1n(2/1 yxF - Fišerio skirstinio su 1nx ir 1ny laisvės
laipsnių 2/ lygmens kritinė reikšmė.
Hipotezės tikrinimui naudojame 19 lentelėje nurodytas skaičiuoklės EXCEL funkcijas ir
procedūras.
19 lentelė. Hipotezės apie dviejų dispersijų lygybę tikrinimas skaičiuokle EXCEL
nepriklausomoms imtims
= FTEST(imties1_reikšmės;imties2_reikšmės)
TOOLS / DATA ANALYSIS / F-Test: Two-Sample for Variances
Gautame programos lange užpildome punktus:
- Input 1 Range – pirmosios imties kintamųjų srities adresas;
- Input 2 Range – antrosios imties kintamųjų srities adresas;
- Labels – , jeigu pažymime ir kintamųjų pavadinimus;
- Alpha – reikšmingumo lygmuo (nuo 0 iki 1)
- Output Range – adresas celės, nuo kurios žemyn bus patalpinti skaičiavimo rezultatai,
t.y. viršutinis kairysis gaunamos lentelės kampas;
Parinkus visus šiuos punktus, spaudžiame mygtuką OK ir gauname nurodytoje vietoje Fišerio testo
rezultatų lentelę.
61
Priklausomoms imtims kriterijaus statistika skaičiuojama: )2n/()r1(4
t22
y
2
x
2
y
2
x
Nulinė hipotezė atmetama (dispersijos statistiškai reikšmingai skiriasi), jeigu )2n(2/tt .
Čia: 2
y
2
x , – imčių dispersijos; )2n(2/t – Stjudento skirstinio su 2n laisvės laipsnių 2/
lygmens kritinė reikšmė.
7.6 Koreliacinė ir regresinė analizė
Koreliacinė ir regresinė analizė yra dažniausiai taikomas duomenų analizės metodas, kai
norime įvertinti ryšio stiprumą tarp stebimų požymių (kintamųjų) ir rasti statistinės priklausomybės
išraišką. Tiriant reiškinius dažnai sutinkami tarpusavyje susieti kintamieji (požymiai, faktoriai ), kai
vieno kitimas priklauso nuo to, kaip keičiasi kito kintamojo reikšmės.
Ryšiai, nusakantys, kaip keičiantis vienam požymiui kinta kitas, vadinami koreliaciniais. Jie
įvertinami pagal koreliacijos (r) ir regresijos (R) koeficientus. Regresija įvertina statistinio ryšio
formą, o koreliacija šio ryšio stiprumą. Be to koreliacinė analizė padeda kartu atrinkti faktorius,
darančius didžiausią įtaką statistinėje priklausomybėje.
Priklausomybė nuo kelių išskirtinių faktorių vadinama statistine ir žymima y = F(x), kas reiškia
statistinę kintamojo x priklausomybę nuo kintamojo y reikšmių, kuris dėl juntamo neįtrauktų į
priklausomybę faktorių veikimo yra interpretuojamas kaip atsitiktinis dydis.
7.6.1 Tiesinė regresija
Regresinė analizė yra atliekama pagal du kintamuosius – priklausomąjį kintamąjį, kurį tiriame
ir nepriklausomąjį – su kuriuo aiškiname priklausomojo kintamojo pokyčius.
Turint duomenis apie kintamųjų reikšmes, pradžioje jos pavaizduojamos diagramoje, kuri
leidžia vizualiai parinkti tinkamiausią regresinį modelį. Tuo atveju, kai diagramos taškai grupuojasi
aplink tiesę, galima taikyti paprastąją tiesinę regresiją. Kai turime daugiau negu vieną
nepriklausomąjį kintamąjį, grafinės duomenų interpretacijos taikyti negalima, o regresinio modelio
parinkimui gali talkinti intuicija ir kitų tyrinėtojų patirtis.
Regresinė priklausomybė ne visuomet bus tiesinė. Ji gali būti išreiškiama ir kitokiomis
funkcijomis (paraboline, hiperboline ir kt.). Regresinės analizės uždavinys – nustatyti, kokia kreivė
geriausiai atspindės analizuojamą biologinį procesą tarp požymių (pvz.: normalizuotą laktacijos
kreivę geriausiai atspindi parabolinė funkcija, vabzdžių ar graužikų skaičiaus kitimas priklausomai
nuo sezono charakterizuojamas periodine kreive labai artima sinusoidei).
62
Linijiniams ir artimiems jiems ryšiams tarp požymių charakterizuoti atliekama tiesinė regresinė
analizė.
Regresinį ryšį galima išreikšti pagalba lygties, kurioje žinomą regresijos koeficiento reikšmę
atitinka tam tikra požymio reikšmė (argumentas) ir yra nustatoma kito požymio reikšmė (funkcija).
Tiesinės regresijos koeficientas R parodo, kokiu dydžiu vidutiniškai pasikeičia pirmasis iš
koreliuojančių požymių, antram požymiui pasikeitus vienu matavimo vienetu.
Jis paskaičiuojamas pagal atitinkamas formules:
;rRy
x
yx
;rRx
y
xy
Jeigu neskaičiuojame koreliacijos koeficiento, regresijos koeficientą galime surasti:
n
yy
n
yxxy
R2
2y
x
.
Vaizduodami vieno požymio priklausomybę nuo antrojo grafiškai gauname sklaidos diagramą.
Nors ir nemažai išsibarsčiusius duomenis galima aproksimuoti funkcija, kuri turi geriausiai
atspindėti empirinius duomenis. Labai dažnai tai būna tiesinė funkcija ir sklaidos diagramos taškai
aproksimuojami į tiesę. Regresijos koeficientas R, grafiškai išreiškiamas kaip kampo tarp abcisių
ašies ir tiesės, išreiškiančios dviejų požymių ryšį, tangentas.
Bendrą nežinomą tiesinės paprastosios priklausomybės formą populiacijoje galima išreikšti
lygtimi:
xy 10
Čia: y – ieškoma funkcija; x – argumentas; β0 - pradinė y reikšmė, kai x=0; β1 - koeficientas,
išreiškiantis ryšį tarp funkcijos y ir argumento x; ε – populiacijos klaida, gaunama tikrą
priklausomybės formą pakeičiant tiesine.
Iš imties žinome tik keletą funkcijos reikšmių yi, atitinkančių nepriklausomojo kintamojo xi
reikšmes. Norime surasti tiesinės statistinės x ir y priklausomybės populiacijoje įvertį, išreikštą
tiesinės regresijos lygtimi:
ŷ = a+byxx
Čia: y – priklausomas kintamasis (funkcija); x – nepriklausomas kintamasis (argumentas); a –
pradinė y reikšmė, kai x=0; b - regresijos koeficientas, atspindintis ryšį tarp funkcijos y, keičiantis
argumentui x tam tikra reikšme.
Kitaip sakant a ir b yra tiesinės priklausomybės parametrų β0 ir β1 įverčiai, gaunami iš
konkrečios imties duomenų.
63
Žinant, kad regresija žymi dvi ryšių kryptis, atvirkštinė požymių priklausomybė, gali būti
išreikšta analogiška lygtimi:
x=a+bxyy.
Žinant požymių aritmetinius vidurkius ir taikant metodą pagal x ir y nukrypimus nuo jų
aritmetinių vidurkių paskutinioji lygtis atrodys taip:
ybybxx xyxy .
Taikant tiek regresinę, tiek koreliacinę analizę labai svarbu yra žinoti, kad kiekvienai fiksuotai
x požymio reikšmei, atsitiktinio dydžio skirstinys ε yra standartinis normalusis.
Empirinių duomenų aproksimavimui į tiesę žinoma keletas daugiau ar mažiau tikslių būdų.
Dažniausiai naudojamas ir tiksliausias yra mažiausių kvadratų metodas, kurio pagalba yra
minimizuojama atstumų tarp tiesės ir duomenų taškų kvadratų suma (9 pav.).
Parametrai a ir b gaunami iš sąlygos, kad 2
ii
n
1i
)yy(
turi įgyti mažiausią galimą reikšmę.
Taigi, galima pateikti tokias ieškomų kintamųjų reikšmes:
22 xx
yxyxb
;
xbya .
9 pav. Sklaidos diagrama ir teorinė regresijos linija.
Turint regresijos kreivę dažnai kyla klausimas, ar gerai ji atitinka eksperimentinius duomenis.
Regresinės kreivės tinkamumo matu naudojamas determinacijos koeficientas.Visą priklausomojo
kintamojo y nuokrypį nuo vidurkio y galima išskaidyti į du priežastinius nuokrypius - klaidų
nuokrypį, išreiškiantį skirtumą tarp eksperimentinių priklausomojo kintamojo reikšmių ir regresinės
kreivės ordinatės taškų ir regresinį nuokrypį, kuris parodo tarp bendro vidurkio ir regresinės kreivės
ordinatės taškų:
64
)yy()yy()yy( iiii ;
)yy( i - bendras nuokrypis; )yy( ii - klaidų nuokrypis; )yy( i - regresijos nuokrypis.
Kuo mažiau bendras nuokrypis skiriasi nuo regresinio, tuo geriau regresinė kreivė atitinka
eksperimentų duomenis.
Nuokrypių nuo vidurkio kvadratų sumoms tinka analogiška lygybė:
n
1i
2
i
n
1i
2
ii
n
1i
2
i )yy()yy()yy(.
Skaičiuokle EXCEL regresinei analizė atliekama pagal 20 lentelėje nurodytas procedūras.
20 lentelė. Regresinei analizei naudojamos skaičiuoklės EXCEL procedūros
Regresinė analizė Excel funkcija
Brėžti sklaidos diagramą
Brėžti raidos tendencijos kreivę
Pasirinkti tipą (tiesę)
Gauti raidos tendencijos lygtį
Gauti determinacijos koeficiento
reikšmę
Insert Chart XY(Scatter)
Sklaidos diagramą papildyti regresijos kreive:
Ant bet kurio sklaidos taško spausti dešinį pelės klavišą
Rinktis Add Trendline;
Type / Linear
Options/ Display equation on chart
Options/ Display R-squared value on chart
Apskaičiuoti regresijos koeficientus
TOOLS / DATA ANALYSIS / REGRESSION
Gautame programos lange užpildome punktus:
- Input Y Range – priklausomojo kintamojo srities adresas;
- Input X Range – nepriklausomojo kintamojo srities adresas;
- Labels – , jeigu pažymime ir kintamųjų pavadinimus;
- Output Range – adresas celės, nuo kurios žemyn bus patalpinti skaičiavimo
rezultatai, t.y. viršutinis kairysis gaunamos lentelės kampas;
- Residuals – liekamųjų paklaidų analizė.
Parinkus visus šiuos punktus, spaudžiame mygtuką OK ir gauname nurodytoje vietoje
regresinės analizėsrezultatų lentelę.
Determinacijos koeficientas r2 yra santykis regresinio nuokrypio kvadratų sumos ir bendro
nuokrypio kvadratų sumos:
n
1i
2
i
n
1i
2
i
2
)yy(
)yy(
r.
65
Determinacijos koeficiento skaitinė reikšmės yra nuo 0 iki 1. Kuo r2 didesnis, tuo geriau
regresinė kreivė atitinka eksperimentinius duomenis.
Interpretuojant gautus rezultatus, reikia žinoti, kad r2
charakterizuoja, kokiu tikslumu regresinė
lygtis aproksimuoja pateiktus duomenis. Determinacijos (apibrėžtumo) koeficientas parodo, kiek
duomenų (vieneto dalimis ar procentais) patenka į aprašytą modelį. Jei r2
>0,95, tai modelis gerai
aprašo įvykį ar procesą ir aproksimacijos tikslumas yra aukštas; jei r2 reikšmės yra nuo 0,8 iki 0,95
aproksimacijos tikslumas yra patenkinamas ir modelis adekvatus stebėtam procesui, o jei r2 <0,6 –
aproksimacija nepakankama ir regresinį modelį reikia tikslinti.
7.6.2 Tiesinė koreliacija
Koreliacinė analizė yra taikoma normaliai pasiskirsčiusių atsitiktinių dydžių (požymių)
tarpusavio priklausomybei tirti. Priklausomybės tarp požymių gali būti tiesinės ir netiesinės, porinės
ir daugianarės. Požymių tarpusavio glaudumo matai yra koreliacijos koeficientai.
Kiekybinių požymių porinės koreliacijos koeficientas skaičiuojamas tarp dviejų tarpusavyje
koreliuojančių požymių, pasiskirsčiusių pagal normalųjį arba artimą jam dėsnį, esant tiesinei ryšio
formai. Šis koreliacijos koeficientas parodo vieno požymio kitimo priklausomybę nuo antrojo
požymio reikšmės pasikeitimo ir yra skaičiuojamas pagal formules:
22yyxx
yy)xx(r
arba yx CC
n
yxxy
r
;
n – imties dydis;
n
xxC
2
2
x ;
n
yyC
2
2
y
;
Koreliacijos koeficientą galime suskaičiuoti naudodami kovariacijos išraišką:
.)y;x(Cov
ryx
Dviejų požymių nuokrypių nuo vidurkių sandaugų vidurkis vadinamas kovariacija tarp tų
požymių.
yyxxn
1y;xCov .
Gausime koreliacinę matricą, kurioje susikertant eilutei su stulpeliu nurodyti požymių
koreliacijos koeficientai (r). Jei susikirtimo vietoje yra dydis lygus 1(r1), tai galima sakyti, kad
abudu dydžiai pilnai koreliuoja, t. y. požymis koreliuoja pats su savimi. Jeigu koeficiento absoliuti
reikšmė (be skaičiaus ženklo) daugiau kaip 0,95, tai tarp kintamųjų yra labai stipri linijinė
priklausomybė (ženklas parodo tiesies kryptį). Jeigu koeficiento reikšmė yra tarp 0,7 ir 0,95, tai tarp
66
požymių yra stipri linijinė priklausomybė. Esant reikšmei tarp 0,4 ir 0,7 – yra vidutinis linijinis
ryšys, o esant mažiau nei 0,4 – linijinės priklausomybės tarp dydžių nustatyti nepavyko.
Skaičiuokle EXCEL koreliacinė analizė atliekama naudojant 21 lentelėje nurodytas procedūras.
21 lentelė. Koreliacinei analizei naudojamos skaičiuoklės EXCEL procedūros
Koreliacinė analizė Excel funkcija
TOOLS / DATA ANALYSIS / CORRELATION
Gautame programos lange užpildome punktus:
- Input Range –kintamųjų (tarp kurių skaičiuosime koeficientus) srities adresas;
- Grouped By – duomenis skaityti (Columns – stulpeliais; Rows – eilutėmis);
- Labels in first row – , jeigu pažymime ir kintamųjų pavadinimus;
- Output Range – adresas celės, nuo kurios žemyn bus patalpinti skaičiavimo
rezultatai, t.y. viršutinis kairysis gaunamos lentelės kampas;
Parinkus visus šiuos punktus, spaudžiame mygtuką OK ir gauname nurodytoje vietoje
koreliacinės analizės rezultatų lentelę (koreliacinę matricą).
= CORREL(pirmo_kintamojo_reikšmės;antro_kintamojo reikšmės)
Koreliacijos koeficiento paklaidą apskaičiuopjame:
n
r1m
2
r
, kai n>=100; 2n
r1m
2
r
, kai n<100;
Koreliacijos koeficiento patikimumą nustatome apskaičiavę kriterijų:
2
r
rr1
2nr
m
rt
;
Koreliacijos koeficientas statistiškai reikšmingas (koreliacijos koeficientas reikšmingai skiriasi
nuo 0), jeigu )2(2/ nr tt .
r – koreliacijos koeficientas; n – imties dydis; )2(2/ nt – Stjudento skirstinio su n-2 laisvės laipsnių
2/ lygmens kritinė reikšmė.
7.6.3 Daugialypė regresija
Daugialypės regresijos modeliai panaudojami sprendžiant tokius daugiamatės statitikos
uždavinius:
- parinkti modelį ir jo kintamuosius, geriausiai atitinkančius stebėjimo ir matavimo
rezultatus;
- nustatyti ryšius ir įvertinti jų stiprumą tarp atskirų modelio kintamųjų.
67
Daugialypės regresijos modelis yra taikomas, kai nepriklausomų kintamųjų yra daugiau nei
vienas. Tarkime, kad Y yra priklausomas kintamasis, kurio i-tąją reikšmę Yi norime prognozuoti
esant fiksuotoms (neatsitiktinėms) nepriklausomų kintamųjų reikšmėms X1 = x1i,..., Xn = xni. Tada
tiesinės regresijos modelis yra:
;...2211 ikiniii enbxbxbaY
čia ei – atsitiktinė paklaida; a,b1,b2,...,bn – modelio koeficientai (nežinomi, juos randame
tikrindami, ar modelis tinka).
Regresijos modelio prielaidos ei normaliai pasiskirstę nepriklausomi atsitiktiniai dydžiai, kurių
vidurkis lygus 0, o dispersija nežinoma.
Priklausomojo kintamojo reikšmių prognozavimas – tai vienas iš regresijos tikslų. Toliau
aptarsime, kaip tai daroma daugialypėje regresijoje.
Tarkime, turime tokią daugiamatę nepriklausomų kintamųjų stebėjimų matricą:
nNNN
n
n
xxx
xxx
xxx
X
....
.........
...
...
21
22212
11211
Ir priklausomųjų kintamųjų vektorių:
Ny
y
y
Y...
2
1
Kaip ir vienmatės regresjos atveju, svarbu rasti parametrų a, b1,..., bk tokius įverčius, kad
a ir kbb ˆ,...,ˆ1 , kad funkcijos nnk xbxbxbaxxxyxy ˆ...ˆˆˆ),...,,(ˆ)(ˆ
221121
reikšmės taškuose
(x1i, x2i ,..., xni ) kiek galima mažiau skirtųsi nuo yi, t.y. visi skirtumai (liekamosios paklaidos)
),ˆ...ˆˆˆ()(ˆˆ2211 niniiiiii xbxbxbayxyye
i = 1,2, …, N, būtų kiek galima mažesni.
Tarkime, kad radome SSE minimizuojančius parametrų įverčius a , kbb ˆ,...,ˆ1 . Tada
)(ˆ xy
nnxbxbxba ˆ...ˆˆˆ2211
vadinama tiesine regresijos funkcija.
Norint gauti prognozuojamą Y reikšmę, užtenka į )(ˆ xy
įstatyti nxxx ,...,, 21 reikšmes.
Prognozuojama tik toms reikšmėms, kurios patenka į intervalą (mini x1i, maxi x1i) ir t.t. Koeficientas
jb parodo, kiek padidėja (sumažėja) )(ˆ xy
reikšmė vienu vienetu padidėjus xj, kai likusieji x1, ... , xj-1,
xj+1, ..., xk yra fiksuoti.
68
Daugialypėje regresijoje, kai yra du nepriklausomi kintamieji, regresijos funkcija apibrėžia
plokštumą. Pati plokštuma parenkama taip, kad būtų kiek galima arčiau trimatės erdvės taškų (x11,
x21, y1),..., (x1N, x2N, yN). Kai nepriklausomų kintamųjų yra n, tai )(ˆ xy
nusako n-matę
hiperplokštumą.
Daugialypės regresijos lygties parametrai randami mažiausių kvadratų metodu, t.y. parenkami
taip, kad liekamųjų paklaidų kvadratų suma SSE = N
ie1
2ˆbūtų mažiausia.
7.7 Dispersinė analizė
Užsienio literatūroje dispersinė analizė dažnai žymima sutrumpintai ANOVA (Analysis of
Variance). Pagrindinis dispersinės analizės tikslas – požymio kintamumo įvertinimą išskaidyti pagal
populiaciją veikiančius fiksuotus faktorius – nustatant kiekvieno iš jų veikimą atskirai bei
tarpusavio sąveikoje, o taip pat paskaičiuoti neišaiškintų (atsitiktinių arba likutinių) faktorių poveikį
bendram požymio kintamumui. Tokiu būdu dispersinė analizė parodo įvairių faktorių įtaką
požymiui. Antra svarbi dispersinės analizės ypatybė yra ta, kad galima nustatyti kiekvieno
faktoriaus veikimo statistinį patikimumą. Dispersinės analizės paskaičiavimus galima atlikti ir su
nedideliu variantų skaičiumi. Be to galima analizuoti nevienatipius duomenis (pvz.: skirtingų lyčių
ar veislių gyvulių). Genetiniuose tyrimuose dispersinė analizė naudojama nulinės hipotezės
patvirtinimui arba atmetimui.
Priklausomai nuo to, kelių faktorių įtaką analizuojame, gali būti vienfaktorinė, dvifaktorinė ir
daugiafaktorinė dispersinė analizė. Pagal tiriamų individų pasiskirstymą į klases – tolyginė,
proporcinė ir netolyginė.
Dispersinės analizės idėja - padalyti nuokrypių nuo bendro vidurkio kvadratų sumą į dalis pagal
variacijos šaltinius.
Bendroji dispersija išreiškiama kaip variantų nuokrypių nuo vidurkio kvadratų suma:
y
2Cxx
.
Bendrąją dispersiją sudaro atskiros dalys:
Cy=Cx+Cz;
Cx – faktorinė dispersija, charakterizuojanti tiriamo faktoriaus įtaką požymiui; Cz – atsitiktinė
(liekamoji) dispersija, įvertinanti visų kitų pašalinių faktorių įtaką grupės viduje.
Bendruoju atveju faktorinė dispersija Cx išreiškiama kaip skirtumų tarp požymio klasių viduje
vidurkių ir bendrojo požymio vidurkio skirtumų kvadratų suma:
69
;xxnC2
bendrgrxx
nx – stebėjimų skaičius kiekvienoje klasėje.
Cz – atsitiktinė (liekamoji) dispersijos dalis, išreiškiama kaip skirtumų tarp kiekvieno požymio
varianto ir požymio klasės viduje vidurkio skirtumų kvadratų suma:
.xxC2
grz
Kai nagrinėjama kelių faktorių įtaka:
ABBAx CCCC ; zABBAyCCCCC ;
CA ir CB – atskirų faktorių dispersija; CAB – faktorių sąveikos dispersija.
Kuo mažesnė faktorinės dispersijos dalis ir kuo didesnė liekamosios, tuo mažiau ištirti požymio
įvairavimo šaltiniai.
Fiksuotų ir atsitiktinių faktorių įtaką įvairuojančiam požymiui išreiškiame santykiais:
y
x2
xC
C
- fiksuotų faktorių; y
z2
zC
C
- atsitiktinių faktorių;
2
z
2
x
2
y - fiksuotų ir atsitiktinių faktorių.
y
xx
C
C
ir y
zz
C
C
yra koreliaciniai santykiai.
Taigi dispersinė analizė tuo pačiu leidžia nustatyti koreliacinius ryšius tarp požymių.
Dispersiniai analizei atlikti, sudaromos lentelės vadinamos statistiniu kompleksu. Tarp
statistinio komplekso faktorių negali būti koreliacinio ar funkcinio ryšio. Pagal veikimo pobūdį
faktoriai statistiniame komplekse suskaidomi į klases, kurios gali būti kelių tipų. Fiksuotos klasės
charakterizuoja tam tikrą konkrečią faktoriaus būklę (pvz. pagal lytį į patinus ir pateles; mutacijas
pagal tipą - chromosomines, genines ir t.t.). Varijuojančioms klasėms priklauso sugrupuoti
kiekybiniai požymiai. Hierarchinės vieno faktoriaus klasės griežtai susiijusios tarpusavyje (pvz.
gyvulių sugrupavimas pagal kilmę į veisles, linijas; pagal reproduktorius ir palikuonis).
Dispersinės analizės ypatumai priklauso nuo faktoriaus klasių tipo. Pavyzdžiui pagal amžių
gyvuliai gali būti sugrupuoti įvairiai - į fiksuoto amžiaus klases (1, 2 ir t.t metų) ar varijuojančias
klases ( nuo 1 iki 2 metų, 2-3 metų ir t.t.). Galimas taip pat gyvulių sugrupavimas į kokybines
klases pagal amžių – jauni, vidutinio amžiaus ir seni gyvuliai, pagal veislingumą – grynaveisliai ir
mišrūnai.
Sudarant daugiafaktorinį statistinį kompleksą kiekvieno iš faktorių klasių skaičius gali skirtis.
Klasių lygis turi įtakos dispersinės analizės rezultatams.
Dispersinės analizės rezultatams įtakos turi neįvertinti arba atsitiktiniai faktoriai. Pavyzdžiui,
žemo šėrimo lygio fone negalime daryti teisingų išvadų apie heterozės poveikį gyvulio svoriui.
70
Dispersinei analizei duomenys sugrupuojami į statistinį kompleksą, o atsakymai pateikiami
suvestinėje dispersinės analizės lentelėje.
Statistinis kompleksas tai atsitiktinai atrinkta populiacijos imtis, sugrupuota pagal faktoriaus
veikimą į klases. Į statistinį kompleksą duomenis galime grupuoti tiek pagal kiekybinius, tiek pagal
kokybinius požymius.
Dispersinė analizė atliekama tokiais etapais:
- Suskaičiuojame bendrąją, atsitiktinę ir faktorinę dispersijas: Cy, Cx, Cz.
- Skaičiuojame faktorinės 2
x
ir atsitiktinės 2
z dispersijos dalį bendrojoje
dispersijoje.
- Dispersijų reikšmes koreguojame pagal laisvų narių skaičių
zxy ,, , kuris
kiekvienai dispersijai randamas skirtingai.
Koreguotosios dispersijos išreiškiamos:
y
y2
y
C
- bendroji koreguota dispersija;
x
x2
x
C
- faktorinė koreguota dispersija;
z
z2
z
C
- liekamoji koreguota dispersija.
Iš koreguotųjų dispersijų ištraukus kvadratinę šaknį gausime atitinkamus vidutinius
kvadratinius nuokrypius.
Nusprendžiame ar patikima faktorinės dispersijos reikšmė, t.y. ar patikimas tiriamojo faktoriaus
(x arba A, B, AB ir t.t.) poveikis įvairuojančiam požymiui. Šiam tikslui naudojame Fišerio
patikimumo kriterijų F, kurį skaičiuojame taip:
2
z
2
xF
;
2
z
2
AF
;
2
z
2
BF
;
2
z
2
ABF
.
Surastąjį Fišerio kriterijų F lyginame su Fišerio lentelės reikšmėmis. Šioje lentelėje naudojama
faktorinės dispersijos laisvės laipsnių skaičius - x1 ir liekamosios dispersijos laisvų narių
skaičius - z2 . Jei suskaičiuota F reikšmė didesnė už lentelės reikšmę, tai faktorinė dispersija ir
faktoriaus įtaka yra patikima.
Interpretuojant gautus rezultatatus, įvertinama faktoriaus įtaka į tiriamąjį dydį. Ją parodo
Fišerio kriterijaus reikšmingumo lygmuo, kuris randasi ANOVA lentelėje. Kada p <0,05, Fišerio
kriterijus yra reikšmingas ir tiriamojo faktoriaus įtaką galima laikyti įrodyta.
Skaičiuokle EXCEL dispersinę duomenų analizę galima atlikti, naudojant 22 lentelėje
nurodytas procedūras.
71
22 lentelė. Skaičiuoklės Excel procedūros dispersinei duomenų analizei
Duomenys į lentelę turi būti suvesti taip, kad kiekviename stulpelyje būtų duomenys atitinkantys
vieną tiriamojo faktoriaus reikšmę, o stulpeliai būtų išsidėstę pagal jo reikšmės didėjimą ar
mažėjimą.
TOOLS / DATA ANALYSIS / ANOVA: Single Factor;
Gautame programos lange užpildome punktus:
- Input Range –kintamųjų (stulpeliai pagal faktorius) srities adresas;
- Grouped By – duomenis skaityti (Columns – stulpeliais; Rows – eilutėmis);
- Labels in first row – , jeigu pažymime ir faktorių pavadinimus;
- Output Range – adresas celės, nuo kurios žemyn bus patalpinti skaičiavimo rezultatai,
t.y. viršutinis kairysis gaunamos lentelės kampas;
Parinkus visus šiuos punktus, spaudžiame mygtuką OK ir gauname nurodytoje vietoje dispersinės
analizės rezultatų lentelę.
7.8 Kokybinių požymių analizė
Kategoriniam kintamajam negalime suskaičiuoti parametrų – vidurkio, standartinio nuokrypio
ir t.t. Taigi, kai norime palyginti tokius požymius, negalime lyginti parametrų. Šiuo atveju
naudojame neparametrinius kriterijus. Tai kriterijai, kurie nepriklauso nuo skirstinio ir nėra skirti
hipotezėms apie populiacijų parametrų reikšmes tikrinti. Aprašomoji kokybinio požymio statistika
išreiškiama dažnių skirstiniais (dažnių lentelėmis).
Pavyzdžiui, vertinome gyvulių susirgimo atvejus ir lentelėje surašėme rezultatus (23 lentelė)
23 lentelė. Vieno kokybinio požymių dažnių lentelės pavyzdys
Klasė
(susirgimas) Dažniai
sirgo m1
nesirgo m2
Jeigu vienu metu vertiname pasiskirstymą pagal du kokybinius požymius, dažnių lentelė
atrodys taip, kaip nurodyta 24 lentelėje.
24 lentelė. Dviejų kokybinių požymių dažnių lentelės pavyzdys
Klasės (susirgimas)
Klasė (veislės)
Lietuvos
baltųjų
Didžiųjų
baltųjų Jorkšyrų
sirgo m11 m12 m13
nesirgo m21 m22 m23
72
Kriterijai, kurie lygina kokybinius požymius, remiasi dažnių lentelėmis. Kaip ir parametriniai
kriterijai, jie pagal imties dažnių skirtumus, įvertina proporcijų skirtumus populiacijoje.
Vienas iš dažniausiai naudojamų neparametrinių kriterijų dažnių skirstiniams palyginti yra 2
kriterijus. Tai neparametrinis kriterijus, leidžiantis įvertinti skirtumus tarp dažnių skirstinių ir
nustatyti tų skirtumų statistinį reikšmingumą (patikimumą).
2 kriterijus naudojamas suderinamumo hipotezėms tikrinti (binominiams, Puasono,
normaliesiems skirstiniams). Šiuo atveju jis parodo, ar empirinio ir teorinio skirstinių skirtumas yra
reikšmingas. Tikrinama hipotezė, kad empirinio ir teorinio skirstinių atitinkamų klasių dažniai yra
lygūs.
Kriterijaus statistika apskaičiuojama:
k
i i
ii
E
EO
1
22 )(
.
Prielaida apie kintamojo skirstinį populiacijoje nepatvirtinama (empitinis ir teorinis skirstiniai
skiriasi statistiškai reikšmingai), jeigu 2
)1(
2
k .
Čia: iO – tikrieji (empirinio skirstinio) dažniai; iE – tikėtini (teorinio skirstinio) dažniai.
2
)1( k – 2 skirstinio su k-1 laisvės laipsnių lygmens kritinė reikšmė; k – klasių skaičius.
2 kriterijus naudojamas nepriklausomumo ir homogeniškumo hipotezėms tikrinti. Šiuo atveju
lyginame ne empirinį skirstinį su teoriniu, bet tarpusavyje keletą empirinių skirtinių ir pagal jų
skirtumą sprendžiame apie populiacijų skirtumus.
Kriterijaus statistika apskaičiuojama:
r
i
c
j ij
ijij
E
EO
1 1
2
2)(
.
Tikėtini dažniai nustatomi ne pagal žinomą teorinį skirstinį, bet apskaičiuojami: n
nnE
ji
ij
.
Prielaida apie kintamųjų priklausomumą populiacijoje patvirtinama (ryšys tarp dviejų
kokybinių kintamųjų statistiškai reikšmingas), jeigu 2
)1)(1(
2
cr .
Tikrinant populiacijų homogeniškumą, prielaida apie populiacijų vienodumą atmetama, jeigu
2
)1)(1(
2
cr .
Čia: iO – tikrieji (empirinio skirstinio) dažniai; iE – tikėtini (teorinio skirstinio) dažniai.
2
)1)(1( cr – 2 skirstinio su (r-1)(c-1) laisvės laipsnių lygmens kritinė reikšmė; r – klasių
skaičius pagal pirmąjį kintamąjį; c – klasių skaičius pagal antrąjį kintamąjį;
2 kriterijaus statsitika yra aproksimuojama 2
skirstiniu. Aproksimavimas laikomas
pakankamai tiksliu, jeigu imties dydis ne mažesnis nei 30 ir bent 75% dažnių lentelės skilčių tikėtini
dažniai ne mažesni nei 5.
73
Jeigu pažeidžiama antroji sąlyga, galime bandyti stambinti klases. Dvireikšmio požymio atveju
galime taikyti tikslųjį Fišerio kriterijų.
Kai turime priklausomas imtis (tarkime tiems patiems objektams tas pats požymis matuota
skirtingu laiku – prieš eksperimentą ir po eksperimento), naudojame 2 kriterijaus variantą –
Maknemaro kriterijų. Šis kriterijus remiasi pasikeitusių situacijų lyginimu. Remiantis dvireikšmių
požymių lentele (25 lnetelė).
25 lentelė. Dvireikšmių požymių lentelė
Prieš
eksperimentą
Po eksperimento
sirgo nesirgo Viso
sirgo a b a+b
nesirgo c d c+d
Viso a+c b+d a+b+c+d
Pasikeitusių situacijų skaičius yra b+c. Tikrinama hipotezė, kad pasikeitusių situacijų skaičius
sirgo-pasveiko ir nesirgo-susirgosutampa, 2/)( cbcb .
Kriterijaus statistiką apskaičiuojame:
)(
12
2
cb
cb
.
Hipotezę apie situacijos nepasikeitimą atmetame, kai 2
)1(
2
.
2 kriterijaus skaičiavimo procedūros, taikomos naudojant skaičiuoklę EXCEL, apibendrintos
26 lentelėje.
26 lentelė. 2 kriterijaus skaičiavimas naudojat EXCEL procedūras
Paruošti tyrimo (empirinių) dažnių lentelę.
Įvesti arba apskaičiuoti tikėtinų (teorinių) dažnių lentelę.
= CHITEST(tikrieji_dažniai;tikėtini_dažniai)
Gautame programos lange užpildome punktus:
- Actual Range –tikrųjų dažnių srities adresas;
- Expected Range – tikėtinų dažnių srities adresas
Funkcija suskaičiuoja tikimybę, kad nulinė hipotezė patvirtinama. Jei gautoji reikšmė <0,05. nulinę
hipotezę atmesime.
74
7.9 R statisnis paketas
Bill’o Venables’o ir Dave Smith’o sukurtas R statistinis paketas – tai sparčiai vystomas
tarptautinis projektas, kuris jau dabar leidžia spręsti praktiškai visus statistikos uždavinius. R
statistinio paketo pagalba galime:
duomenis skaityti iš bylų ir rezultatus grąžinti į bylas;
atlikti paprastus matematinius veiksmus su skaičiais, vektoriais ir matricomis;
sudaryti ciklus ir atlikti sąlyginį vykdymą;
skaičiavimuose naudoti įvairias funkcijas (vidurkiui, dispersijai ir t.t.);
duomenų analizei naudoti grupavimo priemonės;
duomenis grupuoti į statistinius modelius;
naudoti dispersinės analizės priemones;
duomenis vaizduoti grafiškai.
R iš esmės yra programavimo kalba su specializuota (statistikos reikmėms skirta) aplinka. R
statistinis paketas turi versijas Unix ir Windows operacinėms sistemoms.
R projekto internetinis adresas yra http://www.r-project.org/. Joje rasite paskutinę R versiją,
įvairiems statistikos skyriams skirtas bibliotekas ir kitą informaciją (pvz., įvairių autorių parašytus
R vadovus).
Atsisiuntus instaliavimui paruoštą failą (OS Windows pritaikyta versija šiuo metu R-2.12.2-
win.exe), įdiegimas atliekamas beveik automatiškai. Įdiegimo metu sukuriamas darbinis programos
aplankas ir nuoroda į programą iškeliama į darbalaukį.
Spragtelėjus ant R ikonos, atsidaro darbinis langas, kuriame rašysime komandas, gausime
rezultatus (1 pav. yra vaizdas, kurį matote ekrane). Grafinės analizės rezultatai pateikiami atskirame
grafiniame lange. Statistinės analizės rezultatus galime matyti ekrane, išsaugoti bylose ar spausdinti.
Komandinė eilutė prasideda simboliu > , toliau matome įvedimo kursorių. Ir galime rašyti
reikalingas komandas. Kai komanda labai ilga ir netelpa vienoje eilutėje, perėjus į kitą eitutę
atsiranda simbolis + , kas reiškia, kad komandą galime tęsti.
R darbinėje direktorijoje yra naudingas failas .Rhistory, kuriame fiksuojamos visos šios ir
ankstesnių sesijų metu įvykdytos komandos. Komandos history( ) pagalba galima apžiūrėti šį failą,
ir pasižymėję jame reikalingas komandas, spragtelėję dešiniuoju klavišu ir pasirinkę Paste to
console, galėsime pakartoti ankstesnę analizę.
75
Komanda q( ) – išėjimas iš R statistinio paketo terpės. Paprastai vartotojo klausiama, ar jis nori
išsaugoti vykdytas komandas (Save workspace image?). Jeigu išsaugosite (Yes), kitą kartą
komandas galima bus rinktis iš jau naudotų, nereikės rinkti iš naujo.
10 pav. R statistinio paketo darbinis langas.
Sužinoti įvairią informaciją apie R statistinį paketą galime help.start( ) komandos pagalba. Ši
komanda atidaro pagalbinį langą, kuriame pateikiama labai daug išsamios medžiagos apie paketo
naudojimo galimybes, komandas ir jų sintaksę, pateikiami pavyzdžiai.
R paketas turi galimybę sukurti įvairaus tipo kintamuosius ir juose saugoti duomenis.
Duomenis galime įvesti klaviatūra, kas nėra itin patogu. Galime paruošti tekstiniu redaktoriumi
(Notepad) kaip tekstinę bylą, kurios pirmoje eilutėje yra laukų (tiriamųjų požymių) pavadinimai ir
visi laukai tarpusavyje atskirti vienodu simboliu (tarpu, kabiataškiu ir t.t). Windows OS duomenis
galime paruošti Excel skaičiuokle ar DBVS Access ir išsaugoti txt ar csv formatu. Prijungiant
duomenis prie statistinio paketo reikia nurodyti duomenų bylos vietą. Jeigu duomenų bylą
pataplinsime R paketo darbinėje direktorijoje, užteks nurodyti tik bylos pavadinimą. Darbinę
direktoriją jūsų kompiuteryje nurodo komanda getwd() .
Duomenis į R paketą galima užkrauti, naudojant 27 lentelėje nurodytas procedūras.
Dažniausiai gautus statistinės analizės rezultatus svarbu ne tik pamatyti ekrane, bet ir išsaugoti
vienokio ar kitokio formato bylose.
Tekstą iš ekrano Copy+Paste komandų pagalba nesunku perkelti į Word’o dokumentą.
Atlikti garfinę analizę R pakete yra sudėtingiau:
76
- suaktyvinus grafikos langą, reikia spragtelti dešiniu klavišu ir pasirinkti Copy as
metafile;
- Word’o dokumente pasirinkti Edit|Paste Special…|Picture (Enhanced Metafile)|OK.
Duomenų išvedimo procedūros, naudojamos R pakete, susitemintos 28 lentelėje.
27 lentelė. Duomenų užkrovimo procedūros R statistiniame pakete
Reikalavimai duomenų byloms:
- Duomenys turi būti paruošti txt arba csv formato bylose;
- pirmojoje eilutėje turėtų būti laukų pavadinimai (headerT );
- kiekvienoje eilutėje turėtų būti vienodas laukų skaičius;
- visose eilutėse laukai atskirti kažkokiu vienodu simboliu (pvz.: sep";" ).
Sukuriama duomenų lentelė R pakete – kintamąjam objekto_pavadinimas priskiriamos reikšmės
iš duomenų bylos.
Iš txt formato bylos:
objekto_pavadinimas - read.table ("bylos_pavadinimas", headerT)
pvz: mag<- read.table("magistro.txt",headerT,sep=";")
simbolį <- gauname paspaudę klavišą < (mažiau) ir po to minuso ( – ) klavišą;
Iš csv formato bylos:
objekto_pavadinimas - read.csv ("bylos_pavadinimas", headerT,sep=";")
pvz: mag<- read.csv("magistro.csv",headerT,sep=";")
Sukuriama duomenų lentelė R pakete – į kintamąjį objekto_pavadinimas nukopijuojamos
reikšmės iš duomenų bylos.
- Atidarome bylą su duomenimis (teksto byla .txt arba skaičiuolės Excel .xls), pasižymime
reikalingą lentelę (duomenis sutvarkytus stulpeliais, su pavadinimais stulpelių)
- Spaudžiame klavišus Ctrl+C;
- R komandiniame lange surenkame
objekto_pavadinimas<-read.delim2("clipboard") (arba read.delim("clipboard"))
Sukuriamas kintamasis a ir jam priskiriamos reikšmės (k1, k2, k3, ...) – paruošiamas reikšmių
vektorius (patogu išsaugoti apskaičiuotą reikšmę)
a-c(k1, k2, k3, …)
pvz: norma<-75
Sukuriamas kintamasis norma ir jo reikšmė lygi 75. Kintamojo pavadinimą galima naudoti
formulėse.
vidurkis<- mean(priesv)
Sukuriamas kintamasis vidurkis ir jo reikšmė lygi apskaičiuotam priesv vidurkiui.
77
28 lentelė. Rezultatų išvedimo iš R paketo komandos
R paketo lentelės duomenis išvesti į tekstinę bylą
išvesti visą bylą:
write.table(objekto_pavadinimas,file="bylos_pavadinimas.txt")
išvesti nuo n1 iki n2 lentelės eilutės:
write.table(objekto_pavadinimas[n1:n2],file="bylos_pavadinimas.txt")
R paketo lentelės duomenis nukopijuoti į tekstinę ar skaičiuoklės bylą
Jei turime R pakete duomenų lentelę, reikia :
- surinkti komandą write.table(objekto_pavadinimas,"clipboard",sep="\t")
- atidaryti teksto redaktorių ar skaičiuoklę ir spausti CTRL+V
R paketo duomenis reikia pernešti į kitą kompiuterį, patogu paruošti duomenų bylą Rdata formatu
Išvesti duomenis:
save(objekto_pavadinimas,file="bylos_pavadinimas.Rdata")
Įkelti duomenis:
load("bylos_pavadinimas.Rdata")
Duomenų analizės rezultatus išsaugoti duomenų byloje
Rezultatus siųsti į bylą bylos_pavadinimas.txt (nematysime ekrane):
sink(file=“bylos_pavadinimas.txt“,append=TRUE)
Uždaryti bylą ir atnaujinti rezultatų rodymą ekrane:
sink( )
Grafinius rezultatus siųsti į bylą bylos_pavadinimas.ps (nematysime ekrane):
postscript(file=”bylos_pavadinimas.ps”)
Uždaryti grafinę bylą ir atnaujinti rezultatų rodymą ekrane:
graphics.off( )
R pakete galime sukurti daug kintamųjų, prijungti jau paruoštų duomenų lentelių. Atskirus
kintamuosius, lentelių laukus, konstantas galime jungti matematinių operacijų ženklais į formules ir
gauti reikalingą rezultatą.
R statistinio paketo matematinių operacijų ženklai:
- + - suma;
- - atimtis;
- - daugyba;
- / - dalyba;
- ^ - kėlimas laipsniu;
- sqrt( ) – kvadratinė šaknis.
78
Komandos, padedančios R pakete valdyti objektus, nurodytos 29 lentelėje.
29 lentelė. Objektų valdymo komandos
Lentelės aktyvavimas (jeigu R pakete darbinių lentelių daugiau nei viena, turime nurodyti su
kurios lentelės duomenimis dirbsime)
Prijungti lentelę (aktyvuoti)
attach (objekto_pavadinimas)
Išjungti lentelę (deaktyvuoti)
detach (objekto_pavadinimas)
R paketo atmintyje saugomų objektų (duomenų lentelių, kintamųjų) sąrašas
objects( )
ls( )
Lentelės laukų sąrašas
objects(objekto_pavadinimas)
ls(objekto_pavadinimas)
Objekto pašalinimas iš R paketo atminties
rm(objekto_pavadinimas)
Lentelės struktūra (laukų pavadinimai, tipas)
str(objekto_pavadinimas)
Lentelės dydį (eilučių ir stulpelių skaičius)
dim(objekto_pavadinimas)
Peržiūrėti lentelės (kintamojo, lentelės lauko) turinį
objekto_pavadinimas
lauko_pavadinimas
Peržiūrėti nepasikartojančias lentelės eilutes (pagal visus laukus)
unique(objekto_pavadinimas)
unique(lauko_pavadinimas)
Pažymi nepasikartojančias lentelės eilutes (lauko reikšmes) – FALSE, pasikartojančias lentelės
eilutes (lauko reikšmes) – TRUE
unique(objekto_pavadinimas)
unique(lauko_pavadinimas)
Nurodo, pasikartojančių lentelės eilučių (lauko reikšmių) numerius (T) arba nepasikartojančių
lentelės eilučių (lauko reikšmių) numerius (F)
which(duplicated(objekto_pavadinimas)==T)
which(duplicated(objekto_pavadinimas)==F)
which(duplicated(lauko_pavadinimas)==T)
which(duplicated(lauko_pavadinimas)==F)
R pakete naudojamos aprašomosios statistikos komandos pateiktos 30 lentelėje.
79
30 lentelė. Aprašomosios statistikos komandos R pakete
n imties dydis (lauko reikšmių skaičius)
length(lauko_pavadinimas)
Požymio reikšmių dažnių skirstinys
table(lauko_pavadinimas)
Požymio reikšmių suma
sum(lauko_pavadinimas)
Aritmetinis vidurkis
mean(lauko_pavadinimas)
mean(lauko_pavadinimas[n1:n2]) (vidurkis iš lauko reikšmių – nuo n1 iki n2 eilutės)
mean(lauko_pavadinimas[sąlyga]) (vidurkis iš lauko reikšmių tenkinančių užduotą salygą)
Moda
names(moda <- table(lauko_pavadinimas))[moda==max(moda)]
Mediana
median(lauko_pavadinimas)
Kvantiliai
quantile(lauko_pavadinimas)
Kvantiliai
quantile(lauko_pavadinimas)
Didžiausia ir mažiausia reikšmės
max(lauko_pavadinimas)
min(lauko_pavadinimas)
Dispersija
var(lauko_pavadinimas)
Standartinis nuokrypis (vidutinis kvadratinis nuokrypis)
sd(lauko_pavadinimas)
Struktūrinių vidurkių skaičiavimas (pateikia eilės tvarka – mažiausią reikšmę, pirmąjį kvartilį,
medianą, vidurkį, trečiąjį kvartilį, didžiausią reikšmę)
summary(lauko_pavadinimas) (vieno lauko reikšmėms)
summary(objekto_pavadinimas) (visiems lentelės laukams)
Aprašomosios statistikos rodiklių skaičiavimas grupuojant
aggregate(lauko_pavadinimas1, list(lauko_pavadinimas2),funkcija)
tapply(lauko_pavadinimas1,lauko_pavadinimas2,funkcija)
apply(objekto_pavadinimas,nr,funkcija) (nr = 1 – grupuos eilutėmis; nr = 2 –stulpeliais)
lauko_pavadinimas1 – šio lauko reikšmes apskaičiuosime (vidurkis, standartinis nuokrypis);
lauko_pavadinimas2 – pagal šio lauko reikšmes grupuosime;
funkcija – aprašomosios statistikos funkcija (mean, min, max ...)
80
R paketo grafinės analizė komandos susistemintos 31 lentelėje.
31 lentelė. Grafinės analizės komandos R pakete
Dažnių pasiskirstymo histograma (n klasių)
hist(lauko_pavadinimas,breaks=n)
hist(lauko_pavadinimas) (kai breaks praleista, klasių skaičius apskaičiuojamas)
Dažnių skirstinys
barplot(table(lauko_pavadinimas)
Santykinių dažnių išreikštų procentais skirstinys
barplot(100*table(lauko_pavadinimas)/length(lauko_pavadinimas))
Dažnių skirstinys
dotchart(lauko_pavadinimas)
Stačiakampė diagrama
boxplot(lauko_pavadinimas)
Sklaidos diagrama
plot(lauko_pavadinimas)
plot(lauko_pavadinimas1,lauko_pavadinimas2) (tarp dviejų požymių)
Medžio diagrama
stem(lauko_pavadinimas)
R paketo hipotezių tikrinimo komandos apibendrintos 32 lentelėje.
32 lentelė. Hipotezių tikrinimo komandos R pakete
Stjudento testas (vidurkių skirtumo patikimumas)
t.test(lauko_pavadinimas1,lauko_pavadinimas2) (nepriklausomoms imtims)
pairwise.t.test(lauko_pavadinimas1,lauko_pavadinimas2) (priklausomoms imtims)
Fišerio testas (hipotezės apie dispersijų lygybę tikrinimas)
var.test(lauko_pavadinimas1,lauko_pavadinimas2)
Hipotezė apie proporciją
prop.test(sėkmių_skaičius, imties_dydis, p=tikrinama_tikimybė)
binom.test(sėkmių_skaičius, imties_dydis, p=tikrinama_tikimybė)
pvz.: binom.test(170,1000,p=0.132)
χ2 testas (kokybinių požymių suderinamumas, nepriklausomumas, homogeniškumas)
chisq.test(dažnių_lentelė)
Fišerio testas (kokybinių požymių suderinamumas, nepriklausomumas, homogeniškumas)
fisher.test(dažnių_lentelė)
Koreliacijos koeficientas ir jo patikimumas
cor.test(lauko_pavadinimas1,lauko_pavadinimas2)
81
R pakete naudojamos ryšiams tarp požymių tirti komandos nurodytos 33 lentelėje.
33 lentelė. Ryšių tarp požymių įvertinimo komandos R pakete
Koreliacijos koeficientas ir jo patikimumas
cor.test(lauko_pavadinimas1,lauko_pavadinimas2)
cor(lauko_pavadinimas1,lauko_pavadinimas2)
cor.test(lentelės_pavadinimas)
Tiesinis modelis
modelis <-lm(rezultatinis_požymis~požymis_regresija+factor(požymis_faktorius)+...)
Funkcijos analizuojančios apskaičiuotąjį modelį
Summary(modelis) – visa modelio informacija
anova(modelis) – dispersinė analizė
aov(modelis) – dispersijos dalių analizė
coefficients(modelis) – regresijos koeficientai
deviance(modelis) – likutinė dispersija
residuals(modelis) - paklaidos
formula(modelis) – tiesinis modelis
7.9.1 Duomenų analizės R statistiniu paketu pavyzdžiai
Pavyzdžio pagalba išsiaiškinsime R paketo komandų ir funkcijų naudojimą. Tyrinėjome kiaulių
mėsos kokybės požymius. Kiaulės buvo skerstos žiemą ir vasarą. Poskerdiminiu tyrimu buvo
nustatyta, kad dalis kiaulių buvo sveikos, kita dalis turėjo plaučių pažeidimų. Duomenys paruošti
analizei skaičiuokle Excel byloje duomenys.csv. Žemiau pateikta tyrimo duomenų struktūra (34
lentelė).
34 lentelė. Tiriamų duomenų struktūros aprašymas
Tiriamas požymis Lauko
pavadinimas Kintamojo tipas
Mėginio numeris megnr sveiki skaičiai
Sezonas sez 1 - žiema; 2 - vasara
Susirgimas serga 0 - sveikas; 1 - sergantis
Mėsos šviežumas po 24 val. sviez 0 - norma; 1 - norma pažeista
ph po 1 val. ph1 dešimtainiai skaičiai
ph po 24 val. ph24 dešimtainiai skaičiai
Sausos medžiagos, % sm dešimtainiai skaičiai
Vandeningumas, % vand dešimtainiai skaičiai
Vandens rišlumas, % risl dešimtainiai skaičiai
Virimo nuostoliai, % virnuost dešimtainiai skaičiai
Švelnumas, % sveln dešimtainiai skaičiai
82
Į R paketo lentelę mag iš bylos duomenys.csv užkrauname duomenis:
> mag<-read.csv("duomenys.csv",header=T,sep=";")
Bylos pirmoje eilutėje yra nurodyti laukų pavadinimai (header=T). Kiekvienas laukas atskirtas
kabliataškiu (sep=”;“).
Peržiūrime lentelės mag turinį:
> mag
11 pav. Lentelės turinys
Jeigu R paketas neranda reikalingos lentelės, visų objektų sąrašą galime pamatyti panaudoję
komandas:
> objects( ) arba > ls( )
Komandos attach(objektas) pagalba prijungiame reikalingą lentelę.
> attach(mag)
Patikriname lentelės laukų sąrašą:
> objects(mag) arba > ls(mag)
Apskaičiuokime požymių aprašomosios statistikos rodiklius.
n - požymio reikšmių skaičius (imties dydis):
> length(ph1)
Sudarome dažnių skirstinį:
> table(ph1)
Apskaičiuojame vidurkius vieno požymio arba visos lentelės laukų:
> mean(ph1) arba > mean(mag)
Nustatome struktūrinius vidurkius (medianą, kvartilius):
> summary(ph1) arba summary(mag)
83
12 pav. Vidutinių rodiklių skaičiavimo pavyzdys
Apskaičiuojame variacijos rodiklius (mažiausia, didžiausia reikšmė, variacijos amplitudė,
dispersija, standartinis nuokrypis, vidurkio paklaida ir variacijos koeficientas) vieno požymio arba
visos lentelės laukų:
13 pav. Variacijos rodiklių skaičiavimo pavyzdys
84
Skaičiuoti vidutinius ir variacijos rodiklius galime ne iš visų požymio reikšmių, o tik iš tų,
kurios tenkina užduotą sąlygą.
> mean(ph1[serga==0]) pH vidurkis tik sveikų gyvulių
> mean(ph1[sm>30]) pH vidurkis gyvulių, kurių sausų medžiagų buvo daugiau nei 30%
> mean(ph1[1:10]) pH vidurkis pirmo – dešimto gyvulio imtinai
14 pav. Vidutinių rodiklių (su sąlyga) skaičiavimo pavyzdys
Duomenis sugrupuoti ir apskaičiuoti aprašomosios statistikos rodiklius galime naudodami
funkcijas aggregate(), tapply() arba apply():
15 pav. Aprašomosios statistikos rodiklių grupuojant skaičiavimo pavyzdys
85
Pavaizduokime duomenis grafiškai:
> hist(ph1) > barplot(table(ph1))
Histogram of ph1
ph1
Fre
qu
en
cy
6.5 6.6 6.7 6.8 6.9 7.0 7.1
05
10
15
20
25
30 30
24
33
27
6 6
6.5 6.6 6.7 6.8 6.9 7 7.1
pro
c.
05
10
15
20
25
16 pav. Dažnių ir santykinių dažnių išreikštų procentais pasiskirstymo histogramos.
> boxplot(sm[serga==0],sm[serga==1],names=c("sergantys","sveiki"))
> boxplot(sm[serga==0],sm[serga==1],names=c("sergantys","sveiki"),horizontal=T)
sergantys sveiki
26
28
30
32
34
se
rga
nty
ssve
iki
26 28 30 32 34
17 pav. Stačiakampės diagramos (vertikali ir horizontali)
Braižant grafikus galime užduoti papildomus parametrus:
breaks=n klasių skaičius n histogramoje;
labels=TRUE duomenų žymės diagramoje;
xlab=“pavadinimas“ x ašies pavadinimas;
86
ylab=“pavadinimas“ y ašies pavadinimas;
main=“pavadinimas“ diagramos pavadinimas;
ylim = c(n1, n2) y ašies skalė nuo n1 iki n2;
axes = FALSE nebraižyti x ir y ašių;
horizontal=TRUE diagramą pasukti horizontaliai.
Palyginkime skirtingų grupių tiriamųjų požymių vidurkius ir įvertinkime skirtumo statistinį
reikšmingumą.
Lyginame sirgusių ir sveikų kiaulių mėsos pH po 1 val. vidurkius:
> t.test(ph1[serga==0],ph1[serga==1])
Lyginame žiemą ir vasarą skerstų kiaulių sausų medžiagų kiekio mėsoje vidurkius:
> t.test(sm[sez==1],sm[sez==2])
18 pav. Vidurkių skirtumo patikimumo nustatymas.
Pirmuoju atveju gavome, kad sveikų ir sirgusių kiaulių mėsos pH (mean of x 6,705882 mean
of y 6,824000) skyrėsi statistiškai patikimai (p-value = 4,824e-07), o antruoju atveju galime teigti,
kad sausų medžiagų kiekis žiemą ir vasarą skerstų kiaulių mėsoje (mean of x 29,76476 mean of y
30,26476) nesiskiria statistiškai reikšmingai (p-value = 0,2507).
Palyginkime skirtingų grupių tiriamųjų požymių dispersijas (variaciją).
87
Lyginame kiaulių mėsos pH po 1 val. pt po 24 val. variaciją. Gavome p-value = 0,102, tai
galime teigti, kad variacija požymių nesiskiria.
> var.test (ph1,ph24)
19 pav. Skirtingų grupių variacijos palyginimas.
Vertinant kokybinių požymių tarpusavio priklausomybę, galime pasinaudoti χ2 arba Fišerio
testu. Statistinis paketas apskaičiuos kriterijaus reikšmę ir statistinį reikšmingumą, jeigu duomenis
paruošime kaip dažnių lentelę.
Įvertinkime sezono įtaką kiaulių sirgimui (požymiai Sezonas ir Susirgimas).
> chisq.test(table(serga,sez))
20 pav. Kokybinių požymių tarpusavio ryšio nustatymas.
88
χ2 testas (X-squared = 2,1082, df = 1, p-value = 0,1465) rodo, kas sezono įtaka kiaulių sirgimui
nėra statistiškai reikšminga. Tą patį teigia ir Fišerio testo rezultatai (p-value = 0,1462).
Ryšius tarp požymių įvertina coreliacijos ir regresijos koeficientai.
Pirsono koreliacijos koeficientus tarp požymių skaičiuoja funkcijos cor() ir cor.test().
Skliausteliuose įrašius lentelės pavadinimą, skaičiuojami koreliacijos koeficientai kiekvienai
požymių porai (pateikiamas komandos rezultato fragmentas 8 pav.).
> cor(mag)
21 pav. Pilnos koreliacinės analizės rezultatų fragmentas
Galima skaičiuoti koreliacijos koeficientus tarp kiekvienos požymių poros atskirai ir įvertinti
koeficientų statistinį reikšmingumą. Jeigu p-value<0,05, koreliacinis ryšys statistiškai reikšmingas.
> cor(ph1,ph24)
> cor.test(ph1,ph24)
22 pav. Koreliacijos koeficiento skaičiavimas.
Regresinę duomenų analizę atliekame sudarydami modelį (vertiname, kaip pH po 24 val.
priklauso nuo pH po 1 val.):
89
> model1<-lm(ph24~ph1)
Išaiškiname modelio parametrus:
> summary(model1)
23 pav. Regresinė analizė (regresijos koeficientas ir jo patikimumas pažymėti).
Požymių skaidos diagramomis grafiškai atliekame regresinę analizę.
6.5 6.6 6.7 6.8 6.9 7.0 7.1
5.7
5.8
5.9
6.0
6.1
6.2
ph1
ph
24
0 20 40 60 80 100 120
6.5
6.6
6.7
6.8
6.9
7.0
7.1
Index
ph
1
24 pav. Sklaidos diagramos
Dispersinei analizei statistiniai modeliai sudaromi analogišku būdu, nurodant požymį
veikiančius faktorius (vertiname, kaip pH po 24 val. priklauso nuo ligos):
> model1<-lm(ph24~ph1)
90
Išaiškiname modelio parametrus:
> summary(model1)
> anova(model1)
25 pav. Vienfaktorinės dispersinės analizės rezultatai.
Vienfaktorinės dispersinės analizės atveju, faktoriaus įtaka yra lygi Multiple R-squared:
0,1208. Padauginus iš 100 gausime veiksnio įtaką tiriamojo požymio variacijai išreikštą procentais.
Įtakos patikimumą nurodo p-value: 6,677e-05. Kai p-value<0,05, faktoriaus įtaka statistiškai
reikšminga.
Dažnai reikia tyrinėti kelių faktorių įtaką požymiui ir tuo pačiu įvertinti požymių tarpusavio
priklausomybę (vertiname, kaip pH po 24 val. priklauso nuo ligos, sezono ir pH po 1 valandos).
> model1<-lm(ph24~ph1+factor(serga)+factor(sez))
Išaiškiname modelio parametrus:
> summary(model1)
> anova(model1)
91
26 pav. Tiesinio modelio analizė.
Daugiafaktorinės dispersinės analizės atveju, Multiple R-squared: 0,6474 rodo visų tirtųjų
veiksnių įtaką požymiui (64,7 proc. požymio variacijos galima paaiškinti veiksnių įtaka). Modelio
patikimumą nurodo p-value: < 2,2e-16. Susumavus visus Sum Sq gauname bedrąją dispersiją
(nuokrypių kvadratų sumą). Padalinus faktoriaus Sum Sq ir bendrosios sumos ir padauginus iš 100,
gausime faktoriaus įtaką tiriamojo požymio variacijai išreikštą procentais.
Mūsų tiriamų faktorių apskaičiuota įtaka pH po 24 val. dydžiui pateikta 35 lentelėje
35 lentelė. Tiriamų faktorių įtakos analizės lentelė
faktorius Df SumSq MeanSq Fvalue Pr(>F) Įtaka, proc.
pH1 1 1.16520 1.16520 210.5398 <2.2e-16*** 60.8
factor(serga) 1 0.00218 0.00218 0.3934 0.5317066 0.1
factor(sez) 1 0.07243 0.07243 13.0878 0.0004335*** 3.8
Residuals 122 0.67519 0.00553 35.3
92
8. Tyrimo ataskaitos parengimas
Ruošiant tyrimų ataskaitą, vadovaujamasi bendromis tyrimų ataskaitos normomis.
Tyrimų ataskaitos pateikiamos žodžiu (pasisakymai mokslinėse konferencijose) ir raštu
(straipsniai mokslinėje periodikoje, leidiniai, kvalifikaciniai darbai: diplominiai, magistriniai,
disertacijos).
Kvalifikacinių darbų ataskaitoms keliami tam tikri formalūs reikalavimai. Pagal nurodytas
taisykles (standartą) apipavidalinamas titulinis lapas ir visas tekstas. Būtinai nurodoma: mokslo ir
studijų institucija, jos padalinys; duomenys apie autorių ir mokslinis vadovas; darbo tema, miestas,
metai ir kita aktuali informacija.
Kvalifikacinio darbo struktūrą paprastai sudaro:
1) Įvadinė dalis, kurioje labai koncentruotai pateikiama bendra darbo charakteristika.
2) Pagrindinė dalis, kurioje išdėstoma darbo turinys ir rezultatai.
3) Literatūros sąrašas.
4) Priedai, kuriuose pateikiama papildoma informacija: lentelės, anketų, testų užduočių,
stebėjimų protokolų pavyzdžiai, operacinių apibrėžimų bei duomenų statistinio
apdorojimo loginės schemos ir pan.
5) Būtina korektiškai laikytis citavimo ir kitų autorių, leidinių duomenų naudojimo taisyklių.
6) Mokslinio darbo ataskaitos tekstas vienaip ar kitaip turi atspindėti įrodymo loginę
struktūrą:
7) Argumentus (pagrindinius teiginius, kuriais remiamasi tyrime).
8) Demonstraciją, t.y. įrodymo būdą (naudotus teorinius ir empirinius metodus).
9) Įrodymo tezę (konkrečiai ir aiškiai suformuluotus tyrimo rezultatus, išvadas).
9. Tyrimo vertinimas
Tyrimo vertinimo problema netiesiogiai iškyla jau planuojant tyrimą. Mokslininkas savo tyrimą
vertina nuolat – tiek planuodamas, tiek jį atlikdamas. Vėliau, kai parengiama ataskaita raštu, tyrimą
vertina kiti mokslinės bendrijos nariai. Kvalifikaciniai darbai (magistriniai, disertacijos) vertinami
gynimo – specialiai organizuotos viešos procedūros – metu. Kiti darbai tiesiog publikuojami ir
tokiu būdu pateikiami mokslinės bendrijos vertinimui.
10. Mokslinio darbo struktūra
Dažniausiai naudojama mokslinio darbo struktūra yra tokia:
1) Įžanga arba įvadas.
93
2) Literatūros apžvalga.
3) Tyrimų metodika.
4) Tyrimų rezultatai ir jų aptarimas.
5) Išvados.
6) Pasiūlymai arba praktinės rekomendacijos.
7) Naudotos literatūros sąrašas.
8) Priedai.
11. Mokslinių publikacijų rengimas spaudai
Kiekvienas aktyviai dirbantis mokslinį darbą asmuo, o ypač doktorantas, suinteresuotas mokslo
leidinyje, prestižiniame žurnale ar pan. paskelbti savo tyrimo rezultatus. Tačiau mokslinį straipsnį
spausdinimui būtina atitinkamai parengti, laikantis ir bendrų mokslinėms publikacijoms keliamų
reikalavimų, ir specifinių, būdingų kuriam nors leidiniui, žurnalui. Dažnai tokius reikalavimus
skelbia leidinio redakcija.
Mokslo pažanga yra įmanoma tik dėl to, jog kiekvienas vėliau pasirodęs kūrinys įneša ką nors
naujo, palygint su pirmtakų darbais. Tyrėjas, publikuodamas atliktą mokslinį darbą, gauna ne tik
naudos sau, bet ir mokslinę literatūrą kuo nors atnaujina.
Rengiant mokslinį darbą reikia atsakyt į klausimą, ar tyrimai verti to, kad jo rezultatai būtų
publikuojami. Kitas momentas – autorystės klausimas. Čia svarbu įvertint kiekvieno asmens
konkretų indėlį į atliktą darbą, nuspręsti, kas bus pagrindinis straipsnio autorius, o kas –
bendraautoriai. Po to svarstomi straipsnio struktūros bei turinio klausimai.
Vertinant straipsnį turinio atžvilgiu, svarbu atsižvelgt į šiuos momentus:
- ar straipsnyje nagrinėjama problema yra aiški ir svarbi, ar darbas yra originalus;
- ar tyrimo metodai pakankamai patikimi;
- ar rezultatai atitinka tikslus, kurių buvo tikimasi pradedant tyrimą;
- ar tyrimo duomenys visikai ir nedviprasmikai patikrina hipotezes;
- ar tiriamieji atstovauja apibendrinamajai populiacijai;
- ar tyrimas pasiekė lygmenį, kad jo rezultatų publikavimas būtų reikšmingas.
Prieš pradedant rašyti mokslinį straipsnį, reikia atsižvelgt į tris pagrindines jo charakteristikas:
apimtį, antraštę ir toną.
Nustatant apimtį, reikia vadovautis leidinio ar žurnalo reikalavimais – nereikia viršyti
rekomenduojamo puslapių skaičiaus. Ilgas rankraštis nebūtinai atspindi kokybę. Dėl kompiuterinių
šriftų ir kitų simbolių sunku orientuotis, kokia bus tikroji apimtis, bet vis dėlto nereikia rašyt
pernelyg daug, nes tai išblaškyti pagrindines mintis. Reikia siekti kad straipsnis būtų glaustas.
94
Formuluojant antraštę, reikia stengtis, kad ji atspindėtų straipsnio esmę bei būtų gimininga
atskiroms straipsnio dalims.
Svarbu ir straipsnio tonas: mokslinis straipsnis – ne grožinės literatūros kūrinys. Visi teiginiai
turi būti perteikiami tiesiai, aiškiai, tačiau reikia įgūdžių norint tai padaryti įdomiai i profesionaliai.
Rankraštis susideda iš devynių pagrindinių dalių, kuriose turėtų būti tik tam tikro pobūdžio
informacija:
Titulinis lapas;
Santrauka (reziumė);
Įvadas;
Metodai;
Rezultatai;
Aptarimas;
Nuorodos;
Priedai;
Autoriaus žodis
12. Išradimai ir jų patentavimas
Vykdant mokslinio tyrimo darbus, ypač taikomuosius mokslinio tyrimo darbus, gali būti skurti
išradimai, kuriems suteikta teisinė apsauga – patentas. Išradimai yra patentabilūs, jeigu jie yra nauji,
išradimo lygio ir turi pramoninį pritaikymą. Išradimais negali būti mokslo teorijos ir matematiniai
metodai, gaminių išoriniai vaizdai, intelektinės arba ūkinės veiklos planai, taisyklės ir būdai, taip
pat kompiuterių programos bei informacijos teikimo būdai.
Patentai neišduodami už žmonių arba gyvūnų gydymo terapinius arba chirurginius būdus, ligų
diagnozavimo ir profilaktikos būdus, kurie taikomi žmogaus arba gyvūno kūnui. Patentai taip pat
neišduodami už augalų arba gyvūnų veisles ir biologinius jų išvedimo būdus. Ši nuostata netaikoma
mikrobiologiniams augalų arba gyvūnų produktyvumo būdams bei tokiais būdais gautiems
produktams.
Patentai negali būti išduoti už išradimus, kurių panaudojimas prieštarautų visuomenės
interesams, moralės ir humaniškumo principams.
Išradimas yra naujas, jeigu jis nežinomas technikos lygiu. Technikos lygiu laikoma visa, kas iki
patentinės paraiškos padavimo datos arba iki prioriteto datos buvo viešai skelbta arba naudota
Lietuvos Respublikoje ar užsienyje. Išradimas nelaikomas nauju, jeigu jis, nors ir nežinomas
95
technikos lygiu, yra aprašytas kito pareiškėjo patentinėje paraiškoje, kurios padavimo data yra
ankstesnė ir kuri paskelbta oficialiame Valstybinio patentų biuro biuletenyje. Išradimas yra
išradimo lygio, jeigu jis nežinomas atitinkamos srities specialistams technikos lygiu. Pramoninį
pritaikymą turi išradimas, kurį galima panaudoti pramonėje, žemės ūkyje, sveikatos apsaugos ir
kitose srityse.
Išradėjas, norintis gauti išradimo patentą, turi paduoti patentinę paraišką Valstybiniam patentų
biurui. Paraišką gali paduoti keletas juridinių ir fizinių asmenų. Patentinę paraišką sudaro:
prašymas išduoti patentą, išradimo aprašymas, vieno ar daugiau punktų išradimo apibrėžtis,
referatas, dokumentas, kad sumokėtas mokestis, dokumentas apie teisę paduoti patentinę paraišką (
jei ją paduoda ne išradėjas ) ir pareiškimas dėl išradimo autorystės. Prašymas išduoti patentą
pateikiamas lietuvių kalba.
Išradimo aprašymas turi išradimą atskleisti aiškiai ir išsamiai, kad atitinkamos srities
specialistai galėtų jį panaudoti. Jeigu patentinė paraiška paduota dėl biologinės medžiagos, kurios
negalima aprašyti taip, kad ją galėtų panaudoti tos srities specialistai, ir ši medžiaga yra visuomenei
neprieinama, ji turi būti atiduota saugoti deponavimo įstaigai. Prie Valstybiniam patentų biurui
paduotos patentinės paraiškos pridedamas dokumentas apie biologinės medžiagos deponavimą.
Patentinėje paraiškoje išradimo aprašymas ir kiti dokumentai turi būti pateikti pagal Valstybinio
patentų biuro reikalavimus.
Išradimo apibrėžtį gali sudaryti vienas ar daugiau apibrėžties punktų. Išradimo apibrėžtis
nustato patento suteikiamos teisinės apsaugos ribas. Visi apibrėžties punktai turi būti tikslūs ir
konkretūs. Išradimo apibrėžties punktai pateikiami pagal Valstybinio patentų biuro reikalavimus.
Referate pateikiama informacija apie išradimą Valstybinio patentų biuro nustatyta tvarka.
Nustatant patento teisinės apsaugos ribas, į referatą neatsižvelgiama.
Išradėjas, paduodamas patentinę paraišką, gali pateikti prašymą suteikti prioritetą pagal
Paryžiaus konvenciją dėl pramoninės nuosavybės saugojimo vietos kelių anksčiau paduotų kitose
valstybėse nacionalinių ar tarptautinių paraiškų pagrindu, nurodydamas tos paraiškos ar paraiškų
padavimo datą ir valstybę.
Išradėjas turi teisę taisyti patentinę paraišką per visą jos nagrinėjimo Valstybiniame patentų
biure laiką. Patentinės paraiškos taisymai neturi keisti bei išplėsti išradimo esmės ar ribų. Išradėjas
turi teisę atšaukti patentinę paraišką bet kuriuo jos nagrinėjimo Valstybiniame patentų biure metu.
Jeigu patentinė paraiška atitinka ekspertizės reikalavimus, Valstybinis patentų biuras per šešis
mėnesius išduoda patentą. Valstybinis patentų biuras, priėmęs sprendimą išduoti patentą, paskelbia
tai savo oficialiame biuletenyje. Paskelbus patentinę paraišką, susipažinti su ja gali bet kuris
suinteresuotas asmuo.
96
Kai patento objektas yra gaminys, patento savininkas turi išimtinę teisę drausti kitiems
asmenims be jo leidimo gaminti, naudoti, siūlyti parduoti, perduoti, importuoti ar eksportuoti tą
gaminį Kai patento objektas yra gaminio gamybos būdas, patento savininkas turi išimtinę teisę
drausti kitiems asmenims be jo leidimo naudoti tą būdą bei naudoti, importuoti ar eksportuoti
tiesiogiai tuo būdu gautą gaminį. Patento savininkas neturi teisės trukdyti kitiems asmenims atlikti
veiksmus, jeigu jie atliekami savo poreikiams tenkinti ir neprieštarauja ekonominiams patento
savininko interesams, taip pat jeigu jie atliekami eksperimentiniams arba mokslinių tyrimų tikslams,
vienkartiniam vaistų gaminimui ir tai netrukdo normaliai naudoti patentą ir nepažeidžia teisėtų
patento savininko interesų.
Detalesnė informacija apie išradimus ir jų patentavimą yra pateikta Lietuvos Respublikos
Patentų įstatyme (1994 m. sausio 18 d. Nr. 1-372) ir jo vėlesniuose pakeitimuose
(http://www.tb.lt/PIC/teisesproc.aktai/patentu istatymas.htm).
97
13. Literatūros sąrašas
1. Bakštys A. Statistika ir tikimybė. Vilnius, TEV, 2006.
2. Čekanavičius V., Murauskas G. Statistika ir jos taikymai, 1 dalis. Vilnius, TEV, 2000.
3. Čekanavičius V., Murauskas G. Statistika ir jos taikymai, 2 dalis. Vilnius, TEV, 2002.
4. Genienė M., Čiulevičienė V. Bendroji ir žemės ūkio statistika. Vilnius, Margi raštai, 1998.
5. Jankauskas S. Mokslo istorijos racionalus rekonstravimas: problema ir psiaudoproblema? //
Problemos. – 1984, Nr. 32, p. 97 – 106.
6. Januškevičius A. Zootechninių bandymų metodiniai nurodymai. Vilnius, 1992.
7. Juozaitienė V., Kerzienė S. Biometrija ir kompiuterinė duomenų analizė. Kaunas, 2001.
8. Kardelis K. Mokslinių tyrimų metodologija ir metodai. – Kaunas, 1997.
9. Kardelis K. Mokslinių tyrimų metodologija ir metodai. – Kaunas, 2002.
10. Lapinskas R. Įvadas į statistiką su R. Vilnius, VU, 2003.
11. Lietuvos Respublikos patentų įstatymas //Žinios.-1994, Nr. 8-120.
12. Makariūnas K. Kokio mokslo Lietuvai reikia? // Mokslas atvirai visuomenei: konferencijos
medžiaga, 1994, p. 132–145.
13. Mason J. Qualitative Researching. – London, 1996.
14. Misevičius V. Mokslinių tiriamųjų darbų vadyba. – Kaunas, 1995.
15. Mokslinių tyrimų pagrindai: Mokymo priemonė aukštųjų mokyklų studentams / V.Liutikas, V.
Šeštokas, J. Zujus. – Vilnius, 1987.
16. Palubinskas B. Mokslo logikos klausimai. – Vilnius, - 1974.
17. Pažinimo džiaugsmas. Populiari enciklopedija: versta iš anglų k. – Vilnius, 1990.
18. Sirvydis V.K. Moksliniai tyrimai biomedicinos moksluose (metodinė priemonė). Vilnius, 2004.
19. Songailienė A., Žernauskas K. Tyrimo duomenų biometrinis vertinimas. Vilnius, 1985.
20. Кун Т. Структура научных революций: пер.с англ.- Москва, 1975.
21. Литл Т., Тчилз ф. Сельскохозяйственное опытное дело. Москва, 1985.
22. Овсянников А. Основы опытного дела в животноводстве. Москва, 1976.
23. Проппер К. Логика и рост научного знания: пер с англ. - Москва, 1990.
24. Рузавин Г. И. Методы научного исследования.- Москва, 1974.
25. Фейерабенд П. Избранные труды по методологии науки: пер. с англ.-Москва, 1986.
26. http://www.r-project.org/ (žiūrėta 2011.05.01)
98
14. Priedai
1 priedas. Normaliojo skirstinio 1,0Ν kritinės reikšmės z
z z z z z z
0,5 0,000 0,37 0,331 0,24 0,706 0,11 1,226 0,025 1,959 0,012 2,257
0,49 0,025 0,36 0,358 0,23 0,738 0,10 1,281 0,024 1,977 0,011 2,290
0,48 0,050 0,35 0,385 0,22 0,772 0,09 1,340 0,023 1,995 0,010 2,326
0,47 0,075 0,34 0,412 0,21 0,806 0,08 1,405 0,022 2,014 0,009 2,365
0,46 0,100 0,33 0,439 0,20 0,841 0,07 1,475 0,021 2,033 0,008 2,408
0,45 0,125 0,32 0,467 0,19 0,877 0,06 1,554 0,020 2,053 0,007 2,457
0,44 0,150 0,31 0,495 0,18 0,915 0,05 1,644 0,019 2,074 0,006 2,512
0,43 0,176 0,30 0,524 0,17 0,954 0,04 1,750 0,018 2,096 0,005 2,575
0,42 0,201 0,29 0,553 0,16 0,994 0,03 1,880 0,017 2,120 0,004 2,652
0,41 0,227 0,28 0,582 0,15 1,036 0,029 1,895 0,016 2,144 0,003 2,747
0,40 0,253 0,27 0,612 0,14 1,080 0,028 1,911 0,015 2,170 0,002 2,878
0,39 0,279 0,26 0,643 0,13 1,126 0,027 1,926 0,014 2,197 0,001 3,090
0,38 0,305 0,25 0,674 0,12 1,174 0,026 1,943 0,013 2,226 0,0005 3,290
2 priedas. Stjudento skirstinio α lygmens kritinės reikšmės )(nt
n
0,1 0,05 0,025 0,01 0,005 0,001 0,0005
1 6,314 12,706 25,452 63,657 127,321 636,619 1273,239
2 2,920 4,303 6,205 9,925 14,089 31,599 44,705
3 2,353 3,182 4,177 5,841 7,453 12,924 16,326
4 2,132 2,776 3,495 4,604 5,598 8,610 10,306
5 2,015 2,571 3,163 4,032 4,773 6,869 7,976
6 1,943 2,447 2,969 3,707 4,317 5,959 6,788
7 1,895 2,365 2,841 3,499 4,029 5,408 6,082
8 1,860 2,306 2,752 3,355 3,833 5,041 5,617
9 1,833 2,262 2,685 3,250 3,690 4,781 5,291
10 1,812 2,228 2,634 3,169 3,581 4,587 5,049
11 1,796 2,201 2,593 3,106 3,497 4,437 4,863
12 1,782 2,179 2,560 3,055 3,428 4,318 4,716
13 1,771 2,160 2,533 3,012 3,372 4,221 4,597
14 1,761 2,145 2,510 2,977 3,326 4,140 4,499
15 1,753 2,131 2,490 2,947 3,286 4,073 4,417
16 1,746 2,120 2,473 2,921 3,252 4,015 4,346
17 1,740 2,110 2,458 2,898 3,222 3,965 4,286
18 1,734 2,101 2,445 2,878 3,197 3,922 4,233
19 1,729 2,093 2,433 2,861 3,174 3,883 4,187
20 1,725 2,086 2,423 2,845 3,153 3,850 4,146
21 1,721 2,080 2,414 2,831 3,135 3,819 4,110
22 1,717 2,074 2,405 2,819 3,119 3,792 4,077
23 1,714 2,069 2,398 2,807 3,104 3,768 4,047
24 1,711 2,064 2,391 2,797 3,091 3,745 4,021
25 1,708 2,060 2,385 2,787 3,078 3,725 3,996
30 1,697 2,042 2,360 2,750 3,030 3,646 3,902
40 1,684 2,021 2,329 2,704 2,971 3,551 3,788
60 1,671 2,000 2,299 2,660 2,915 3,460 3,681
120 1,658 1,980 2,270 2,617 2,860 3,373 3,578
1,645 1,960 2,242 2,576 2,808 3,291 3,482
99
3 priedas. χ2 skirstinio α lygmens kritinės reikšmės
2
)(n
n
0,9995 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0,001 0,0005
1 0,000 0,000 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 10,828 12,116
2 0,001 0,002 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 13,816 15,202
3 0,015 0,024 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 16,266 17,730
4 0,064 0,091 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 18,467 19,997
5 0,158 0,210 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,833 15,086 16,750 20,515 22,105
6 0,299 0,381 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 22,458 24,103
7 0,485 0,598 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 24,322 26,018
8 0,710 0,857 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 26,124 27,868
9 0,972 1,152 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589 27,877 29,666
10 1,265 1,479 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 29,588 31,420
11 1,587 1,834 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 31,264 33,137
12 1,934 2,214 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300 32,909 34,821
13 2,305 2,617 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819 34,528 36,478
14 2,697 3,041 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 36,123 38,109
15 3,108 3,483 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 37,697 39,719
16 3,536 3,942 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 39,252 41,308
17 3,980 4,416 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 40,790 42,879
18 4,439 4,905 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 42,312 44,434
19 4,912 5,407 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 43,820 45,973
20 5,398 5,921 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 45,315 47,498
21 5,896 6,447 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 46,797 49,011
22 6,404 6,983 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796 48,268 50,511
23 6,924 7,529 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 49,728 52,000
24 7,453 8,085 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559 51,179 53,479
25 7,991 8,649 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 52,620 54,947
26 8,538 9,222 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 54,052 56,407
100
n
0,9995 0,999 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005 0,001 0,0005
27 9,093 9,803 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645 55,476 57,858
28 9,656 10,391 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993 56,892 59,300
29 10,227 10,986 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,336 58,301 60,735
30 10,804 11,588 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 59,703 62,162
31 11,389 12,196 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,003 61,098 63,582
32 11,979 12,811 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328 62,487 64,995
33 12,576 13,431 15,815 17,074 19,047 20,867 23,110 43,745 47,400 50,725 54,776 57,648 63,870 66,403
34 13,179 14,057 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964 65,247 67,803
35 13,787 14,688 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275 66,619 69,199
36 14,401 15,324 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581 67,985 70,588
37 15,020 15,965 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,883 69,346 71,972
38 15,644 16,611 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,896 61,162 64,181 70,703 73,351
39 16,273 17,262 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,476 72,055 74,725
40 16,906 17,916 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 73,402 76,095
45 20,137 21,251 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,166 80,077 82,876
50 23,461 24,674 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 86,661 89,561
55 26,866 28,173 31,735 33,570 36,398 38,958 42,060 68,796 73,311 77,380 82,292 85,749 93,168 96,163
60 30,340 31,738 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 99,607 102,695
65 33,877 35,362 39,383 41,444 44,603 47,450 50,883 79,973 84,821 89,177 94,422 98,105 105,988 109,164
70 37,467 39,036 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,425 104,215 112,317 115,578
75 41,107 42,757 47,206 49,475 52,942 56,054 59,795 91,061 96,217 100,839 106,393 110,286 118,599 121,942
80 44,791 46,520 51,172 53,540 57,153 60,391 64,278 96,578 101,879 106,629 112,329 116,321 124,839 128,261
85 48,515 50,320 55,170 57,634 61,389 64,749 68,777 102,079 107,522 112,393 118,236 122,325 131,041 134,540
90 52,276 54,155 59,196 61,754 65,647 69,126 73,291 107,565 113,145 118,136 124,116 128,299 137,208 140,782
95 56,070 58,022 63,250 65,898 69,925 73,520 77,818 113,038 118,752 123,858 129,973 134,247 143,344 146,990
100 59,896 61,918 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169 149,449 153,167
101
4 priedas. Fišerio skirstinio α lygmens kritinės reikšmės ),( nmF
n m
α 1 2 3 4 5 6 7 8 9 10 12 15 20 40
1 0,05 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 251,1
0,01 4052,2 4999,5 5403,4 5624,6 5763,6 5859,0 5928,4 5981,1 6022,5 6055,8 6106,3 6157,3 6208,7 6286,8
2 0,05 18,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371 19,385 19,396 19,413 19,429 19,446 19,471
0,01 98,503 99,000 99,166 99,249 99,299 99,333 99,356 99,374 99,388 99,399 99,416 99,433 99,449 99,474
3 0,05 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,745 8,703 8,660 8,594
0,01 34,116 30,817 29,457 28,710 28,237 27,911 27,672 27,489 27,345 27,229 27,052 26,872 26,690 26,411
4 0,05 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,912 5,858 5,803 5,717
0,01 21,198 18,000 16,694 15,977 15,522 15,207 14,976 14,799 14,659 14,546 14,374 14,198 14,020 13,745
5 0,05 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,678 4,619 4,558 4,464
0,01 16,258 13,274 12,060 11,392 10,967 10,672 10,456 10,289 10,158 10,051 9,888 9,722 9,553 9,291
10 0,05 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,913 2,845 2,774 2,661
0,01 10,044 7,559 6,552 5,994 5,636 5,386 5,200 5,057 4,942 4,849 4,706 4,558 4,405 4,165
15 0,05 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,475 2,403 2,328 2,204
0,01 8,683 6,359 5,417 4,893 4,556 4,318 4,142 4,004 3,895 3,805 3,666 3,522 3,372 3,132
20 0,05 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,278 2,203 2,124 1,994
0,01 8,096 5,849 4,938 4,431 4,103 3,871 3,699 3,564 3,457 3,368 3,231 3,088 2,938 2,695
30 0,05 4,171 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,092 2,015 1,932 1,792
0,01 7,562 5,390 4,510 4,018 3,699 3,473 3,304 3,173 3,067 2,979 2,843 2,700 2,549 2,299
50 0,05 4,034 3,183 2,790 2,557 2,400 2,286 2,199 2,130 2,073 2,026 1,952 1,871 1,784 1,634
0,01 7,171 5,057 4,199 3,720 3,408 3,186 3,020 2,890 2,785 2,698 2,562 2,419 2,265 2,007
70 0,05 3,978 3,128 2,736 2,503 2,346 2,231 2,143 2,074 2,017 1,969 1,893 1,812 1,722 1,566
0,01 7,011 4,922 4,074 3,600 3,291 3,071 2,906 2,777 2,672 2,585 2,450 2,306 2,150 1,886
100 0,05 3,936 3,087 2,696 2,463 2,305 2,191 2,103 2,032 1,975 1,927 1,850 1,768 1,676 1,515
0,01 6,895 4,824 3,984 3,513 3,206 2,988 2,823 2,694 2,590 2,503 2,368 2,223 2,067 1,797
0,05 3,842 2,996 2,605 2,372 2,214 2,099 2,010 1,939 1,880 1,831 1,752 1,666 1,571 1,394
0,01 6,635 4,605 3,782 3,319 3,017 2,802 2,640 2,511 2,408 2,321 2,185 2,039 1,878 1,592
102
5 priedas. Statistikos terminų anglų-lietuvių kalbų žodynas
analysis analizė
factor - faktorinė analizė
- of covariance kovariacinė analizė
- of variance (ANOVA) dispersinė analizė
average aritmetinis vidurkis
bar chart stulpelinė diagrama
class interval grupavimo intervalas
coefficient koeficientas
determination - apibrėžtumo koeficientas
correlation - koreliacijos koeficientas
kurtosis - eksceso koeficientas
skewness - asimetrijos koeficientas
common bendrasis
continuous tolydusis
confidence interval pasikliautinasis intervalas
confidence level pasikliovimo lygmuo
correlation coefficient koreliacijos koeficientas
covariance kovariacija
criterion kriterijus
critical region kritinė sritis
cumulative frequency augantis dažnis
103
data duomenys
degrees of freedom (d.f.) laisvės laipsnių skaičius
density tankis
dependent priklausomas
discrete diskretusis
distribution skirstinys
exponential - eksponentinis skirstinys
normal - normalusis skirstinys
rectangular - stačiakampis skirstinys
chi–square - chi kvadrato skirstinys
uniform - tolygusis skirstinys
error klaida, paklaida
estimate įvertinti, įvertis
estimator įvertis
consistent - suderintasis įvertis
efficient - efektyvusis įvertis
least squares - mažiausiųjų kvadratų įvertis
maximum likelihood - didžiausiojo tikėtinumo įvertis
unbiased - nepaslinktasis įvertis
event įvykis
forecast prognozė, prognozuoti
frequency dažnis
expected - lauktas dažnis
observed - stebėtas dažnis
104
general linear model bendrasis tiesinis modelis
geometric mean geometrinis vidurkis
histogram histograma
frequency - dažnių histograma
relative frequency - santykinių dažnių histograma
hypothesis hipotezė
Independent Nepriklausomas
interquartile range kvartilinis plotis
kurtosis coefficient eksceso koeficientas
law dėsnis
least squares method mažiausių kvadratų metodas
maximum likelihood estimator didžiausiojo tikėtinumo įvertis
mean vidurkis, matematinė viltis
measurement matavimas
median mediana
observation stebėjimas
percentile procentilis
polygon empirinio skirstinio daugiakampis
population populiacija, generalinė aibė
power function galios funkcija
probability tikimybė
precision tikslumas
pseudo random number pseudo atsitiktiniai skaičiai
quartile kvartilis
105
random atsitiktinis
rate laipsnis
relative frequency santykinis dažnis
regression regresija
nonlinear - netiesinė regresija
multiple linear - daugialypė tiesinė regresija
simple linear - paprastoji tiesinė regresija
residual liekana, skirtumas
sample imtis
- size imties didumas
significance level reikšmingumo lygmuo
skewness coefficient asimetrijos koeficientas
smoothing glodinimas
standard deviation standartinis nuokrypis
test kriterijus, testas
- of hypothesis hipotezės tikrinimas
time series laiko eilutės
universe generalinė aibė
variante dispersija