pitanja iz uvoda u analizu podataka kolokvijum 2013

6
Ispitna pitanja za kolokvijum iz Uvoda u analizu podataka Baza podataka 1.Kako je organizovana jedna baza podataka? (kolone, redovi, ćelije) 2. Šta u analizi podataka podrazumevamo pod terminom „varijabla“? (Skup vrednosti dobijenih merenjem različitih jedinica posmatranja duž jedne iste dimenzije.) 3. Kako se razlikuju varijable prema nivou merenja? (nominalne/kategorijalne, ordinalne, intervalne, srazmerne) 4. Šta podrazumevamo pod jedinicom posmatranja? (Jedan objekt/entitet/slučaj, odnosno skup vrednosti dobijenih merenjem jednog istog objekta duž svih posmatranih dimenzija) 5. Šta se smatra podatkom? (vrednost dobijena merenjem jednog objekta duž jedne dimenzije). 6. Kakva je razlika između vrednosti jedne kategorijalne varijable i oznake vrednosti (kod ili šifra) te iste varijable? Navedite neki primer. Praktični zadatak: 1. Sačinite jednu jednostavnu bazu podataka na osnovu sledećih informacija. Andrija živi u Beogradu, studira medicinu i voli da igra košarku. Branka je medicinska sestra, živi u Leskovcu i planinari. Ceca je nezaposlena, živi u Nišu i voli da slika. Dušan je vozač u GSP, živi u Novom Sadu i sakuplja modele automobila. Ema je penzioner, živi u Vrnjačkoj Banji i voli da veze. Filip je službenik iz Kragujevca i svake nedelje ide u lov.

Upload: aleksandra-stevanovic

Post on 16-Dec-2015

225 views

Category:

Documents


5 download

DESCRIPTION

pitanja za kolokvijum

TRANSCRIPT

Ispitna pitanja iz uvoda u analizu podataka

Ispitna pitanja za kolokvijum iz Uvoda u analizu podatakaBaza podataka1.Kako je organizovana jedna baza podataka? (kolone, redovi, elije)

2. ta u analizi podataka podrazumevamo pod terminom varijabla? (Skup vrednosti dobijenih merenjem razliitih jedinica posmatranja du jedne iste dimenzije.)

3. Kako se razlikuju varijable prema nivou merenja? (nominalne/kategorijalne, ordinalne, intervalne, srazmerne)

4. ta podrazumevamo pod jedinicom posmatranja? (Jedan objekt/entitet/sluaj, odnosno skup vrednosti dobijenih merenjem jednog istog objekta du svih posmatranih dimenzija)

5. ta se smatra podatkom? (vrednost dobijena merenjem jednog objekta du jedne dimenzije).6. Kakva je razlika izmeu vrednosti jedne kategorijalne varijable i oznake vrednosti (kod ili ifra) te iste varijable? Navedite neki primer.

Praktini zadatak: 1. Sainite jednu jednostavnu bazu podataka na osnovu sledeih informacija. Andrija ivi u Beogradu, studira medicinu i voli da igra koarku.

Branka je medicinska sestra, ivi u Leskovcu i planinari.

Ceca je nezaposlena, ivi u Niu i voli da slika.

Duan je voza u GSP, ivi u Novom Sadu i sakuplja modele automobila.

Ema je penzioner, ivi u Vrnjakoj Banji i voli da veze.

Filip je slubenik iz Kragujevca i svake nedelje ide u lov.

2. Oznaite nivo merenja za sledee varijable:1. pol (M, )2. visina prihoda (u dinarima)3. religijska pripadnost (hrianin, musliman, jevrejin, drugo)4. stepen religioznosti (veruje u sve to vera ui; veruje, mada ne ba sve; nije siguran da li veruje ili ne veruje; ne veruje )5. obrazovanje (bez kole; osnovno; srednje; visoko)6. starost (u godinama)3. Oznaite vrednosti kategorijalnih varijabli iz prethodnog zadatka (dodelite kodove ili ifre pojedinim vrednostima).

OPIS jedne varijable

1. Kako se sve mogu prikazati vrednosti koje ine jednu varijablu? Nabrojte i ilustrujte. (tabelarno, grafiki, numeriki) (Tako to se prikae raspodela uestalosti pojavljivanja pojedinih vrednosti /distribucija frekvencija/).2. Opiite postupak tabelarnog prikazivanja distribucije frekvencija. (identifikacija vrednosti, probrojavanje pojavljivanja pojedinih vrednosti, apsolutni broj pojavljivanja, relativni broj pojavljivanja)

3. Navedite elemente i opiite izgled frekvencijske tabele. (broj tabele, naziv tabele, zaglavlje, pretkolona, kolone u frekvencijskoj tabeli /apsolutna frekvencija, relativna frekvencija, frekvencija vaeih podataka, kumulativna frekvencija/)3. Navedite i opiite osnovne naine grafikog prikazivanja distribucije. (histogram, kruni dijagram)

4. Pomou kojih vrednosti numeriki opisujemo skup individualnih razlika? (pet brojeva) 5. Definiite modalnu vrednost (MODUS ili MOD). (vrednost sa najveom frekvencijom; vrednost koja se najee pojavljuje).

6. Kako se izraava disperzija (rasipanje) u odnosu na MOD. (kao broj ili proporcija sluajeva izvan modalne vrednosti) 7. Definiite srednju vrednost (MEDIJANU). (vrednost izmerena na srednjem lanu ureenog skupa)

8. Kako se meri disperzija u odnosu na MEDIJANU? (Interkvartilni raspon i interkvartilno rastojanje)

9, Definiite aritmetiku sredinu (AS). (zbir svih vrednosti jedne varijable podeljen brojem vrednosti).

10. Kako se meri disperzija u odnosu na AS? (proseno apsolutno odstupanje, proseno kvadrirano odstupanje /varijansa/, kvadratni koren iz prosenog kvadriranog odstupanja /standardna devijacija STD DEV/)

Praktini zadaci:1. Za sledei skup podataka sainite frekvencijsku tabelu, odredite MOD i MEDIJANU.

(2, 1, 2, 3, 5, 3, 4, 1, 2, 2, 4)

2. Iz baze podataka, prikaite tabelarno distribuciju sledeih varijabli: a, b, c,

3. Prikaite grafiki distribuciju frekvencija za sledee varijable iz baze podataka...

4. Prikaite numeriki distribuciju frekvencija za sledee varijable iz baze podataka...

5. U priloenoj tabeli, popunite prazna polja, odredite MOD, MEDIJANU, KVARTILE

Skolska sprema majke

FrequencyPercentValid PercentCumulative Percent

Validbez skole59.2.2.2

nepotpuna osnovna90.3.5

osnovna skola22196.46.97.4

srednja skola1942457.160.7

visa skola371010.911.679.7

visoka skola649019.120.3100.0

Total31992100.0

Missing920336.0

Total34025100.0

POVEZANOST1. Kada se moe rei da su dve varijable meusobno povezane?2. Kada su dve varijable meusobno nezavisne?

3. ta je korelacija? 4. ta izraavaju razliiti koeficijenti korelacije?5. Koje koeficijente korelacije moemo koristiti kada korelacija nije linearna? Na osnovu kojih informacija se ti koeficijenti raunaju?6. Kojim koeficijentima merimo jainu veze izmeu ordinalnih varijabli? 7. Kojim koeficijentom merimo jainu veze izmeu jedne nominalne i jedne intervalne varijable? Navedite glavne karakteristike koeficijenta. 8. Kako povezanost ordinalnih varijabli meri Spirmanov koeficijent korelacije?9. Kako povezanost ordinalnih varijabli meri Kendalov tau koeficijent? 10. U kojim sluajevima Pirsonov koeficijent korelacije moe pruiti iskrivljenu sliku o jaini veze izmeu varijabli?11. Kako se meri povezanost nominalnih varijabli? Asocijacija i/ili kontingencija.12. Opiite izgled i strukturu kontingencijske tabele.13. Kada je povezanost u kontingencijskim tabelama potpuna a kada povezanost ne postoji?

14. ta meri Hi kvadrat statistik? Opiite postupak (algoritam) izraunavanja Hi kvadrata. 15. Zato Hi kvadrat nije dobra mera asocijacije nominalnih varijabli? 16. Koje se mere povezanosti nominalnih varijabli zasnivaju na Hi-kvadratu? Kako one koriguju nedostatke Hi kvadrata kao mere povezanosti nominalnih varijabli?17. ta je proporcionalno smanjenje greke u predvianju? (Predvianje na osnovu modalne vrednosti cele ispitane grupe i predvianje na osnovu poznatih modalnih vrednosti u razliitim kategorijama nezavisne varijable). 18. Koji koeficijenti mere proporcionalno smanjenje greke u predvianju kod nominalnih varijabli? Navedite njihove karakteristike.Praktini zadaci:

1. Na osnovu datih podataka, sainite kontingencijsku tabelu.r. br. Pol Fakultet

1MPravni

2Pravni

3Filozofski

4Medicinski

5MMedicinski

6MFilozfski

7Pravni

8MFilozofski

9MPravni

10Medicinski

2. Za dve zadate varijable iz baze podataka izraunajte jainu povezanosti. Obrazloite izbor koeficijenta. Interpretirajte rezultat (da li je veza upravna/pozitivna ili obrnuta/negativna; da li je jaina veze blia nuli ili potpunoj povezanosti)

3. Za dva para zadatih varijabli: odredite jainu veze izmeu dve varijable. Odredite par varijabli koji je jae povezan. Obrazloite izbor koeficijenta.