tutkimuslaboratorion etäkäyttöprojektin tuloksia2010/12/01 · antti katainen / tutkijapalvelut...
TRANSCRIPT
Tilastokeskuksen tutkijapalvelut
Antti Katainen
Sisällys
Tutkijapalvelut
Tutkijapalvelun kehittäminen 2010-2011
Mikroaineistojen etäkäyttöjärjestelmät
Antti Katainen / Tutkijapalvelut 1.12.2010
Tutkijapalvelut
Laajat ja monipuoliset mikroaineistot ovat arvokkaita
yhteiskunta- ja taloustieteellisessä tutkimuksessa
Tilastoaineistoja voidaan luovuttaa yhteiskuntaoloja
koskeviin tieteellisiin tutkimuksiin ja tilastollisiin
selvityksiin
Henkilöotoksia voidaan luovuttaa talosta ulos vain
tunnistamattomassa muodossa
Yritysaineistoja käytetään valvotusti
tutkimuslaboratoriossa / etäkäyttöpalvelussa.
Yritysten suora tunnistaminen on estetty
Käyttölupia myönnetään noin 100 kpl/vuosi,
tutkimuslaboratoriossa hankkeita ollut noin 30 kpl/vuosi
Antti Katainen / Tutkijapalvelut 1.12.2010
Tutkijapalvelut -toiminto on perustettu syksyllä 2010
Toiminnon tehtävät:
Palvella tutkijoita ja tutkimushankkeita
tuottamalla yksikkökohtaisia aineistoja
otosaineistoina, tutkimuslaboratoriossa
käytettäväksi ja etäkäyttöön.
Osallistua tutkimushankkeisiin ja tehdä
tutkimusta
Koordinoida Yritysten rakenteet -yksikön
maksullista tietopalvelutoimintaa
Kehittää tilastokeskuksen etäkäyttöjärjestelmää
yhdessä Tietotekniikka-yksikön kanssa
”Selkiyttää tutkijapalveluprosessia sekä
tutkijoiden että aineistotoimittajien suuntaan”Antti Katainen / Tutkijapalvelut 1.12.2010
Tutkijapalvelun vakioaineistot, nykytilanne
YRITYSAINEISTOT
Yritysrekisterin konserni-, yritys- ja toimipaikkatason aineistot:
perustiedot yrityksistä (mm. liikevaihto, henkilöstö, toimiala,
konsernisuhteet)
Tilinpäätösaineistopaneeli: yritysten tuloslaskelma- ja tasetiedot,
tilinpäätöstunnusluvut
Teollisuustilaston toimipaikkapaneeli: teollisuuden tuotantotiedot
Hyödyketilastot: arvo- ja määrätiedot toimipaikoittain tuotteille ja
raaka-aineille
T&K-paneeli: yritysten tutkimus- ja tuotekehitystoiminta
Innovaatioaineistot: yritysten innovaatiotoiminta
Patenttiaineistot: yritysten patentit
ICT-paneelit: tietotekniikan ja internetin käyttö yrityksissä
Yritystukitietokanta: yritystuet
Antti Katainen / Tutkijapalvelut 1.12.2010
HENKILÖAINEISTOT
Yhdistetty työnantaja-työntekijä-aineisto, ns. FLEED-aineisto
Sisältää laajasti työikäisen väestön taustatietoja ja linkit työnantajiin
Totaali-FLEED käytössä ainoastaan TK:n henkilökunnan kautta
Aineistosta muodostettu tutkijakäyttöön soveltuva FLEED-otos
FLEED-aineiston pohjalta aggregoidut tiedot yritys- ja
toimipaikkatason henkilökunnan ominaisuuksista ja palkoista
(mm. toimipaikan henkilöstön palkat, työkokemus, koulutus, ikä)
sekä työpaikka- ja työntekijävirrat
Palkkarakenneaineisto
On yhdistetty työnantaja-työntekijä-aineisto, joka sisältää
yksityiskohtaisia tietoja palkansaajien tunti- ja kuukausiansioista sekä
taustatietoja työnantajasta. Aineistosta muodostetaan
tutkimuskäyttöön soveltuva otos.
Antti Katainen / Tutkijapalvelut 1.12.2010
Mahdollisia uusia aineistoja
Henkilötason koulutus-, perhe-, kotitalous- ja asumistiedot
Väestölaskennan pitkittäisaineiston otos
Tulonjaon palveluaineisto
Työolo-, kulutus-, varallisuus- ja ajankäyttötutkimusten
palveluaineistot
Eurostatille toimitettavat yksikköaineistot seuraavista
otostutkimuksista:
Euroopan yhteisön kotitaloustiedustelu (ECHP)
Euroopan unionin tulo- ja elinolotilastot (EU-SILC)
työvoimatutkimus (LFS)
kotitalouksien tietotekniikan käyttö (ICT)
yhteisön innovaatiotutkimus (CIS)
aikuiskoulutusta koskeva kyselytutkimus (AES) ja ammatillista
täydennyskoulutusta koskeva kyselytutkimus (CVTS)
palkkarakennetutkimus (SES)
kulutustutkimusAntti Katainen / Tutkijapalvelut 1.12.2010
Tutkijapalvelun kehittäminen 2010-2011
Taustaa
Kehittämistarpeesta on keskusteltu monessa
yhteydessä
Selvitysmiehet ja tilastotoimen selvityshanke
2008-2010
Tietojen yhteiskäytön ja tutkijapalvelun kehittämisen
tarve
Rekisteri- ja tutkimusaineistokeskus
Tutkimuslaboratorion etäkäyttöhanke 2008-2009
Tutkijapalveluille toimintastrategia
Käyttölupien käsittelyn nopeuttaminen
Palvelu- ja laskutuskäytäntöjen yhdenmukaistaminen
Antti Katainen / Tutkijapalvelut 1.12.2010
Tilastokeskuksen sisäinen Tutkijapalveluiden
kehittäminen työryhmä 11/2009-3/2010
Tehtävänä oli valmistella ehdotukset:
tutkimusaineistojen käyttölupamenettelyn ja
tiedonluovutuskäytäntöjen parantamiseksi
tutkijapalvelun organisoimiseksi
tutkijapalvelun voimavarojen kohdentamiseksi
tutkimusaineistojen ja tutkijapalveluiden
kokoamiseksi tutkimuslaboratorioon
Lisäksi asiaan on otettu kantaa monessa
ryhmässä (hallitusohjelma, Eduskunnan
tulevaisuusvaliokunta, ministeriöiden
tulevaisuuskatsaukset) → julkisen tiedon avoimuus
Lisäksi julkinen paine tutkijapalvelun
kehittämiseen on ”jälleen” kasvanutAntti Katainen / Tutkijapalvelut 1.12.2010
Kehittämistyön tavoitteita
Asiakaslähtöinen palvelumalli
Yhden luukun periaatteen edistäminen
Yksikköaineistojen keskittäminen ja
aineistokokonaisuuksien lisääminen
Prosessin sujuvuuden ja läpinäkyvyyden
parantaminen
Tutkimusaineistojen luovuttamiseen ja
hinnoitteluun yhtenäiset periaatteet
Etäkäytön kehittäminen ja laajentaminen: 10
organisaatiota vuoden 2011 lopussa
Päivittäinen toiminta uuteen tilanteeseen
sopeutettuna
Antti Katainen / Tutkijapalvelut 1.12.2010
Antti Katainen / Tutkijapalvelut 1.12.2010
tutkijapalvelut
survey-laboratorio
ATK-menetelmät
Tutkimus- ja tutkijapalvelua Tilastokeskuksessa
-Tavoitetila
T&M yksikkö
tilastoyksiköt
tutkimuspalvelua
ulkoinen asiakas,
tutkija
sisäinen asiakas,
tilastoyksikköatk-menetelmät
lomakesuunnittelu
tutkimuspalvelua
tutkimuspalvelua
tutkijapalvelua
tutkijat
auktorisoitu
tutkimuslaitos
TUTKIJAPALVELUT = toimeksiannot, jotka koskevat rekisteri- ja
tilastoaineistoista tuotettavia yksikkötason mikroaineistoja ja jotka
vaativat käyttölupaa
Tähän mennessä tehtyä 1
Organisaatiomuutos → yhden luukun periaate
2 henkilöä Henkilötilastot -yksiköstä
1 henkilö Hinnat ja palkat -yksiköstä
Tiimiesimies rekrytoitu
Näiden lisäksi 1 ”resurssisiirto” vastuualueen
sisällä ja 1 tuntityöntekijä
Tutkijapalveluihin hyväksyttyjen aineistojen
käyttöluvan myöntää Yritysten rakenteet -yksikön
tilastojohtaja
Etäkäytön laajentamisesta käydään keskustelua
uusien organisaatioiden kanssa
Lähinnä yliopistojaAntti Katainen / Tutkijapalvelut 1.12.2010
Tähän mennessä tehtyä 2
Tutkijapalveluiden kehittäminen –projekti →
Asetettu 1.9.2010
Määräaika 30.6.2011
Projektiryhmä koostuu tutkijapalvelut- tiimin
jäsenistä + 1 henkilö YR-yksiköstä
asiakas/projektihallintajärjestelmän
kehittämisessä.
Ohjausryhmässä omaa henkilökuntaa eri
tilastoyksiköistä sekä 2 ulkopuolista
tutkimuslaitosten edustajaa
Antti Katainen / Tutkijapalvelut 1.12.2010
Projektin tehtävät:
Tutkijapalvelun kehittäminen ja jatkuvan
toiminnan organisointi
Prosessin sujuvuuden ja läpinäkyvyyden
parantaminen
Aineistokokonaisuuksien ja aineistokuvausten
kehittäminen
Asiakas/projektihallintajärjestelmän
kehittäminen
Tilastokeskuksen etäkäyttöjärjestelmän
jatkokehittäminen ja valtion
etäkäyttöjärjestelmän kehittämistyön
seuraaminen
Antti Katainen / Tutkijapalvelut 1.12.2010
Tutkijapalveluiden tulevaisuus ja jatkokehittäminen
Tutkijapalvelut -toiminnon kasvattaminen puuttuvalla
osaamisella ja aineistoilla
Helposti muokattavat ja hyvin dokumentoidut
perusaineistot sekä aineistojen laajempi yhdisteltävyys
Esim. tulo- ja varallisuusaineistot, haastatteluaineistot
Tietojen luovutus- ja päivitysprosessin nopeutuminen
Etäkäyttö ensisijaiseksi tutkimusaineistojen
luovutustavaksi
Parempi kontrolli aineistojen käyttöön
Kansallinen rekisteritietojen etäkäyttöjärjestelmä?
Tilastolain muutos?
välillinen tunnistaminen mahdolliseksiAntti Katainen / Tutkijapalvelut 1.12.2010
Etäkäyttöjärjestelmät
Oma järjestelmä rakennettiin 2008-2009.
Rakentamisen lähtökohdat:
tutkijoiden tasapuolinen kohtelu
mikroaineistojen käytön tehostuminen
turvallinen ja valvottu ympäristö
Tutkijat ottavat yhteyden työasemaltaan
etäkäyttöpalvelimelle, jossa tutkijalla on käytössä
Windows-työpöytä (4 palvelinta)
Työpöydällä on kansiot tutkimushankkeelle (tilaa 20
GB), aineistolle, ohjeille ja tulosten siirrolle
Järjestelmässä on käytössä tutkijapalveluhin
hyväksytyt aineistot Antti Katainen / Tutkijapalvelut 1.12.2010
Työvälineinä STATA, SPSS, R ja Acrobat reader ja
tekstinkäsittelyohjelma
Järjestelmästä ei pysty siirtämään tietoa ulos ja
tulokset saa käyttöönsä tarkastusmenettelyn jälkeen
Tietoturva
Vahva tunnistaminen. Käyttäjatunnus, salasana ja GSM-
tunnistautuminen
Palvelimet eristetty TK:n verkosta ja suojatut yhteydet
rajatuista IP-osoitteista
Lokitietojen keräys
Tällä hetkellä maksimissaan 16-32 yhtäaikaista
käyttäjää
Antti Katainen / Tutkijapalvelut 1.12.2010
Antti Katainen / Tutkijapalvelut 1.12.2010
Antti Katainen / Tutkijapalvelut 1.12.2010
Etäkäytön ehdot
Etäkäyttöyhteyden avaus asiakkaalle
Sopimus tutkimusaineistojen etäkäytöstä organisaation
kanssa
Selvitys tietoturva- ja tietosuojakäytännöistä
Yhteyshenkilöt vastaavat tiedotuksesta ja käyttökoulutuksesta
Tutkimushankesopimus
Nimeää etäkäyttöön osallistuvat tutkijat
Edellyttää hankekohtaista käyttölupaa
Tutkijat sitoutuvat noudattamaan etäkäytön sääntöjä
Etäyhteyden saa ottaa vain työpaikalta
Tutkimusorganisaatiot vastaavat käyttäjistään
Antti Katainen / Tutkijapalvelut 1.12.2010
Oman etäkäyttöpalvelun jatkokehittäminen
Kehittäminen on tällä hetkelle pienimuotoista:
Uusia hankkeita ja aineistoja
Sovelluspäivityksiä
Käyttäjän- ja oikeuksien hallintajärjestelmä
Tulosten siirron automatisointi
Odotetaan ratkaisua yhteisestä
etäkäyttöjärjestelmästä
Antti Katainen / Tutkijapalvelut 1.12.2010
Midras (rekisteritietojen) –etäkäyttöjärjestelmä lähde :Midras selvityshanke
Kehittämisestä vastannut OKM:n rahoittama ja CSC:n
(Tieteen tietotekniikan keskus) ja Retken
(Rekisteritutkimuksen tukikeskus) toteuttama selvityshanke
4/2009–12/2010 (TK mukana ohjausryhmässä)
Hankkeen tehtävät:
Selvittää järjestelmän toimintamallivaihtoehdot
Selvittää hallinnolliset ja lainsäädölliset esteet ja muutostarpeet
Suunnitella järjestelmän tietotekniset ratkaisut
Arvioida järjestelmän kustannukset rakentamis- ja käyttövaiheessa
Selvittää rahoitusmalleja (rahoittajaa) rakentamis- ja ylläpitovaiheelle
Antti Katainen / Tutkijapalvelut 1.12.2010
Midras -järjestelmän toimintamalli
Etäkäyttöjärjestelmä tarjoaa palveluita kirjautuneille,
käyttöluvan omaaville käyttäjille (validit tutkijat)
Aineistojen omistajuus säilyy rekisterinpitäjillä, CSC hoitaa
teknisen kehityksen ja ylläpidon ja ReTki tutkimuksen tuen
Rekisterinpitäjät päättävät siitä, millä tavoilla ja aineistoilla
he osallistuvat etäkäyttöjärjestelmään.
Rakennettava pilottijärjestelmä testaa lähinnä
toimintamallia ja tekniikkaa (Järjestelmässä ei ole tällä
hetkellä tulosten siirtoa tai arkistointia)
Kutakin aineistoa käsitellään sitä koskevien lakien
mukaisesti ja kaikkien aineistojen tietosuoja ja tietoturva
säilyvät vähintään aikaisemmalla tasolla
Antti Katainen / Tutkijapalvelut 1.12.2010
Midras-visio
Tarjotaan sekä avoimia että rajattuja palveluita
Etätyöpöydän oheispalveluina mm. aineistojen vakiomuotoiset
metatiedot, public use -aineistoja ja lisäpalveluita (forum)
Sähköinen asiointi nopeuttaa prosesseja
Keskitetty sähköinen lupahakemus, josta käyttöoikeuksien
myöntäminen hajautuu rekisteriorganisaatioille automaattisesti
Vahva autentikointi takaa tietoturvan (pilotissa sirukortti)
Vain validilla tutkijalla pääsy etätyöpöydälle ja vain aineistoihin,
joihin hänellä on käyttöoikeus ja vain etätyöpöydällä
Etätyöpöydällä kattava työkaluvalikoima
Helppokäyttöinen haku aineistoista, aineistojen yhdistely, kattava
valikoima tilasto-ohjelmistoja, omia tietokantoja
Datan avaaminen ja tarjoaminen helppoa, mutta hallittua
Antti Katainen / Tutkijapalvelut 1.12.2010
Aineistojen välittäminen Midras -järjestelmässä
Antti Katainen / Tutkijapalvelut 1.12.2010
Midras -järjestelmän palvelut ja niiden julkisuus
Antti Katainen / Tutkijapalvelut 1.12.2010
Julkinen Käyttäjätunnuksella Tutkimusluvalla
Aineistokatalogi
Käyttäjätuki
Tiedotteet
Metatietojen
lähetys
Metatietojen
selailu
Omien käyttöoikeuksien
tarkkailu
Tukifoorumi
Lupahakemus
Käyttöoikeuksien
antaminen
(rekisteriorganisaa-
tio)
Aineistojen
lähettäminen
Pseudonymisointi
Saatavuusaineistot
Etätyöpöytä
Kokeiluaineistot
Tallennusalue
Yksikkötason
aineistot
Tulosten
luovutuspalvelu
Tulosten
arkistointipalvelu?
Analyysiohjelmistot
Midras- järjestelmän toimintamalli, muutoksia
aikaisempaan
Rekisteriorganisaatioiden tekemää
aineistonmuodostustyötä siirtyy tutkijoille
Tutkija itse tekee yhdistelyjä eri aineistoista, ja poimittujen hetu-
listojen ja “mäppäystaulujen” kierrätys rekisteriorganisaatioiden
välillä vähenee
Alkukohortin muodostamisen tukena saatavuusaineistoja
Tutkijakohtaisista aineistoista siirrytään osittain yleisiin
yhteiskäyttöisiin aineistoihin
Rekisteriorganisaatio voi tuottaa “valmisaineiston” (tai
vuosiaineiston) tai avata alkuperäisiä tietojärjestelmiään
rajapintojen avulla
Antti Katainen / Tutkijapalvelut 1.12.2010
Etäkäyttöjärjestelmien yhdistäminen
Viime keväänä perustettiin Tilastokeskuksen ja Midras -
etäkäyttöjärjestelmien yhteiskehittämistä valmisteleva
työryhmä VM:n asettamana
Tehtävät:
Selvittää Tilastokeskuksen ja Midras-projektin
etäkäyttöhankkeiden yhteiskehittämismahdollisuudet
Selvittää ja tehdä ehdotus etäkäyttöjärjestelmien hallintomalliksi
Selvittää ja tehdä ehdotus järjestelmien toteuttamisen ja ylläpidon
resursoinniksi ja rahoitukseksi
Tavoitteena olisi tarjota hallinnollisten ja tilastoaineistojen
tietoja tutkijoille yhtenäisen etäkäyttöjärjestelmän kautta,
joka olisi osa kansallista tutkimuksen e-infrastruktuuria
Antti Katainen / Tutkijapalvelut 1.12.2010
Yhteisjärjestelmän ominaisuuksia olisivat mm.:
Poikkihallinnollisuus (useiden eri rekisterinpitäjien aineistoja)
Tuotantokelpoisuus (tietoturvallinen, tietosuojattu, moderni
tietojärjestelmä tutkijoiden käytössä)
Helppokäyttöisyys (esim. Windows-etätyöpöytä, jossa laaja tilasto-
ohjelmistovalikoima tarjolla)
Federointi (yhteinen käyttäjähallinta, aineistoihin liittyvä kontrolli
säilyy tuottajilla)
Lähtökohdat yhteisjärjestelmälle ovat suotuisat, sillä
nykyiset järjestelmät ovat hyvin samankaltaisia.
Hallintomalli ja rahoitus haastavin osa yhteiskehittämistä
Antti Katainen / Tutkijapalvelut 1.12.2010
Lisätietoja
Antti Katainen 09 1734 2347
Antti Katainen / Tutkijapalvelut 1.12.2010