integrált (nem csak) államigazgatási adatbázisok a pályakövetésben
Post on 20-Jan-2016
24 Views
Preview:
DESCRIPTION
TRANSCRIPT
Integrált (nem csak) államigazgatási adatbázisok a pályakövetésben
Fodor SzabolcsEDUCATIO Nonprofit Kft.
„Adatalapú döntéshozatal és stratégiaalkotás a felsőoktatásban”2011. február 24.
Előadás tervezett tartalma
1. DPR Adattár tartalma, főbb elemei2. Államigazgatási adatok bevonásának indokoltsága3. Tervezett – megvalósult menetrend4. Adatforrások bemutatása, kapcsolódásuk5. Adatintegráció lépései, a „módszertan”6. Az eredmény, felhasználási célok7. Tanulságok, tapasztalatok8. Tervek, továbblépés
2
Miért fontos az „adatalapú” megközelítés?
Az „érzékenyített” szektor, kihegyezett fülek… Az érzésekre, sajtóhírekre alapozott következtetések
veszélyei Rendelkezésre állnak az adatok, csak „le kell értük
hajolni” A felsőoktatás kimeneti mutatóinak figyelmen kívül
hagyása rövidtávon káros, hosszútávon bűn! Tévhitek és rémhírek terjesztése helyett: kerüljenek
helyükre a tények!
3
4
DPR Adattár főbb elemei
„Az
ism
étlé
s a
tudá
s an
yja…
és
az u
nalo
m a
pja.
”
Megoldás az adattár? Mire?
Több, egymástól független adatforrást von be
Jól illeszkedő adatkörök alakíthatók ki (szövetszerűség)
Különböző vizsgálati keretben értelmezhető (és értelmezendő!) adatok
Adatvédelmi szempontok: önbevallás, hozzájárulás és személyes adatok szükségtelensége
5
„Saját” kutatások helye és szerepe
Két nagyon fontos saját kutatás hallgatók és (2007-ben) végzettek körében (ΣN=~13.000 fő)
Reprezentativitás, mintakialakítás miatt kontrollt jelenthetnek
Bizonyos csoportokra vonatkozóan elsőként kaptunk visszajelzéseket (BA/BSc)
Előkészítették az intézményi kutatásokat, segítségül szolgáltak a módszertani alapok kialakításában
6
Intézményi kutatások - adatintegráció
2007-ben és 2009-ben végzettek elhelyezkedése, hallgatók munkaerő-piaci motivációi
29 intézmény szolgáltatott adatot kb. 50 000 fő végzett és hallgató, egy helyen elérhető: www.diplomantul.hu
Az első országos adatok a BSc diploma munkaerő-piaci fogadtatásáról!
Probléma: az alacsony válaszadás, 10-20% (2009: induló év), adatszolgáltatás módjának kiforratlansága (VIR-ek, rendszerek fejlődése megoldást hoz)
7
Miért kellenek államigazgatási adatok (is)?
Jelentős mennyiségű adat áll rendelkezésre az államigazgatási adatbázisokban
Az adatok keletkezési körülményeinek köszönhetően szinte teljeskörű adatforrások (kötelező adatszolgáltatások stb.)
Kevésbé szubjektívek, még ha bizonyos korlátokkal ezek esetében is számolni kell
Az érintett potenciális adatforrások egyre jobbak, egyre inkább „használhatóak”
8
A kezdeti stratégia …
9
Először tervezett módszertan és menetrend
Közvetlen szerződéses kapcsolat a potenciális adatszolgáltatókkal
Egyeztetjük az adatköröket, a szükséges adatokat nyers formában adják át
Adatok 5 személyes adat segítségével kapcsoljuk össze (név, szül. dátum stb.): átadjuk ezeket, és visszakapjuk a jövedelmi, munkaerő-piaci adatokat (személyes adatok nélkül)
10
… és hogy miért nem működött?
Adatvédelmi akadályok: személyes adatok változatlan formában nem adhatók át másik, akár hatósági szervnek sem, ha nincs erre törvényi felhatalmazás (vagy beleegyezés) Törvénymódosításra kevés esély volt
Nehéz volt mindegyik potenciális adatforrással külön-külön tárgyalni az adatok átadásáról
Kellett egy „törvény hátszele” a megvalósításhoz, ez nem volt meg (Ftv. Vonatkozó része nem elég ehhez)
11
2007. évi CI. Törvény lehetőségei
Az államnak és az államigazgatási szerveknek kötelessége, hogy a gazdaságra és a társadalmi folyamatokra kiható döntéseiket előzetesen mérlegeljék, eredményüket utólagosan vizsgálják.
Államigazgatási adatbázisokból származó adatok anonim összekapcsolása, a megfelelő statisztikai adatbázis előkészítése: Neumann Nonprofit Kft.
FONTOS! Személyes (jogtalan) adatkezelést nem valósítunk meg, mindenki csak azokat az adatokat kezeli, amire felhatalmazása van!
12
Adatintegrációs folyamat bemutatása
13
N A VN A V(APEH)N A VN A V(APEH)
O E PO E PO E PO E P
F HF H(FSZH)F HF H
(FSZH)
Neumann Kft.Neumann Kft.(lebonyolítás,
adatössze-kapcsolás)
Neumann Kft.Neumann Kft.(lebonyolítás,
adatössze-kapcsolás)
F I RF I R(minta+tanulm
adatok)
F I RF I R(minta+tanulm
adatok)
ALGORITMUSALGORITMUSALGORITMUSALGORITMUS
MINTA + TAN. MINTA + TAN. ADATOKADATOK
MINTA + TAN. MINTA + TAN. ADATOKADATOK
ALGORITM
ALGORITM.+MINTA
.+MINTA
ALGORITM
ALGORITM.+MINTA
.+MINTA
ALGORITM
ALGORITM.+MINTA
.+MINTA
ALGORITM
ALGORITM.+MINTA
.+MINTA
ALGORITMALGORITM.+.+MINTAMINTA
ALGORITMALGORITM.+.+MINTAMINTA
INTEGRÁLT ADATOK
INTEGRÁLT ADATOK
ADATOKADATOK
ADATOKADATOK
ADATOK
ADATOK
Adatok összekapcsolása HASH-AZONOSÍTÓK alapján
Törvény írja le a módszertantTörvény írja le a módszertantNincs személyesadat-mozgás!Nincs személyesadat-mozgás!Nem visszaazonosíthatóak az alanyok!Nem visszaazonosíthatóak az alanyok!
Törvény írja le a módszertantTörvény írja le a módszertantNincs személyesadat-mozgás!Nincs személyesadat-mozgás!Nem visszaazonosíthatóak az alanyok!Nem visszaazonosíthatóak az alanyok!
Adatforrások kiválasztásának szempontjai
14
Az „induló adatok” forrása csak a FIR lehetett Állami regiszterek legyenek, közhiteles és megbízható
adatokkal Munkaerő-piaci adatok kellettek a következőkről:
Jövedelem, igénybe vett (állami) támogatások, Elhelyezkedési dinamika, paraméterek, Munkaadókkal kapcsolatos információk, Munkanélküliség, passzivitással kapcsolatos információk, Regionalitás, (legalább belföldi!) diplomás migráció
Technikailag alkalmas legyen az integrációra
A FIR érintett adatkörei
15
CÉL: tanulmányi előélet, továbbtanulási tendenciák vizsgálata
Végzett hallgatók demográfiai adatai, amit az anonimitás megenged (pl. nem, régió, állampolgárság)
Végzettségi adatok (pl. képzés, típus, félévszám, finanszírozás)
Korábbi végzettség (ld. előző) Jelenlegi tanulmányi adatok (aktuális képzési
információk)
A FIR érintett adatkörei - „nyers” változók
16
A NAV (APEH) érintett adatkörei
17
Munkavállalói (kifizetett bérekre és juttatásokra kiterjedő) havi adatszolgáltatás
Ún. „08-as” nyomtatványcsomag adatai Van a Munkáltatóra és a Munkavállalóra vonatkozó
része Több munkáltató/munkakör = több jogviszony Nincs teljes évi adat, két hónap „pillanatfelvétele”:
Végzés hónapja 2010 márciusa
A NAV (APEH) érintett adatkörei -„nyers” változók
18
Az OEP érintett adatkörei
19
Munkavállalói adatszolgáltatás alkalmazás tényéről, módjáról, egyéb körülményeiről
Ún. „1041-es” nyomtatvány adatai Van a Munkáltatóra és a Munkavállalóra vonatkozó
része (szintén) Több munkáltató/munkakör = több jogviszony
(szintén) Minden, alkalmazási körülményben beállt változás
esetén újabb adatszolgáltatás Mindegyik elérhető adatszolgáltatás adatai fontosak
Az FH érintett adatkörei
20
Valamely munkaerő-piaci eszközt igénybevevőkről nyilvántartást vezetnek
Nem csak a (regisztrált!) munkanélküliek vizsgálata a cél, fontosak a képzések, egyéb eszközök
Csak egyénekre vonatkozó információk Adatok a 2009.01.01-től 2010.12.31-ig terjedő
időszakra vonatkozóan Egyénenként akár több jogcím Hangsúlyosan vizsgálnánk a diplomaszerzést
követően képzésben résztvevőket
Az OEP és az FH érintett adatkörei -„nyers” változók
21
OEP változók
• LakoIrsz • BSZJJogvKezd • BszjJogvVeg • BszjJogvKod • MunkFeor • MunkaOra • MunkMegye • MunkIrSz • MunkAlkSzam
FH változók
• RegisztrDatum • Mpiac_reszv • ReszKod • MpiacKepzFotip • MpiacKepzAltip• BefKepzMod• TanfDij• TamTanfDij• Egykolts
A (NYERS!) adatok mennyiségéről…
22
FIR (induló): ~54.100 fő NAV (APEH):
~34.700 rekord ~22.400 fő
OEP: ~43.200 rekord ~25.000 fő
FH: ~2.200 rekord ~1.500 fő
Adatok tervezett felhasználási célja
23
A V I R Ágazati szintű tanulmány(ok), stratégiai
javaslatok Oktatáskutatási tanulmányok, elemzések A széles(ebb) közvélemény számára készített
rövid elemzések Tájékoztatók, pályaorientációs célok
Tapasztalatok, tanulságok
24
Az első fecskék között lenni nehéz A FIR, mint forrásadatbázis több adatkör esetében
további fejlesztésre, adattisztításra szorul Az államigazgatási szereplők (forrásadatbázisok)
többsége nincs még felkészülve erre a módszertanra Nincsenek, illetve hiányosak a potenciális
adatforrásokat leíró metaadatbázisok Változó a forrásadatbázisok adatminősége is, további
tisztításra van szükség Közös pont kellene: KEKKH-val való szinkronizáció?
További tervek, feladatok, céljaink
25
További tervek, feladatok, céljaink
26
Adatok mélyebb megismerése, lehetőségek és korlátok mélyebb vizsgálata
Adatok AVIR-ba történő „bedolgozása”, riportok stb. kialakítása
Törvényi keretek erősítése – jogszabályalkotás Következő adatintegráció forrásának biztosítása,
szakmai előkészítése További adatforrások felkutatása, az integráció
előkészítése További szakértők bevonása, a szakértői kör bővítése
MOTTÓ, köszönet
27
„Van, aki a lehetőségben a problémákat látja, és van, aki
egy problémában a lehetőségeket!”
/Ismeretlen forrás/
top related