samordning – teknik och praktik bortom mona-systemet · samordning – teknik och praktik bortom...
Post on 06-Jun-2020
4 Views
Preview:
TRANSCRIPT
Samordning – teknik och praktik
bortom MONA-systemet
C-G Hjelm
2011-05-10
claus-goran.hjelm@scb.se
Eller…
Från MONA till MO(L)NA
Dagens övningar
• Bakgrund
• Dagsläget
• Lärdomar
• Framtiden
Finns det motsättningar mellan
myndighets- och forskarintressen ?
• Myndigheter producerar statistik
• För en viss period
• Metadata för produktionsprocessen
• Mao – inga longitudinella data eller
metadata/dokumentation
• Hantera mikrodata primärt för att producera
statistik/tabeller
Vad vi ser efterfrågas idag och i nog framtiden
av forskare
• Mikrodata …
• Longitudinellt synsätt på både mikrodata och
metadata
• Dokumentation om processdata/paradata
• Sökbara metadata
• Möjlighet att länka mellan
material
Metadata standard ISO 11179
MONA systemet idag
Microdata ON-line Access)
Tillkomsten av MONA
• SCB hade under många år förmedlat/försett forskare med mikrodata • Aptiten och volymerna växte
• Vi såg ett framtida behov att se vart data fanns / tog vägen
• Säkerheten och användarmöjligheterna kom
främst
• Infrastruktur – många forskningsprojekt har inte
möjligheten/kompetensen att bygga dessa
strukturer eller säkerheter
Tillkomsten av MONA - fortsättning
• Forskningen är inte längre lokal – möjligheter att arbeta med samma material från flera platser
• Service till alla – oavsett storlek på projekt eller personkännedom
• Sammantaget större forskaranvändning av mikrodata
• Stort behov av metadata – vilka data finns och hur ser dessa data ut
Utvecklingen av MONA
• Startade fullt början av 2005
• 2011 – runt 650 registrerade användare (500 aktiva)
• Ökning på mellan 25-30% per år
• Forskaranvändningen i systemet är runt 75%
0
100
200
300
400
2006 2007 2008 2009 2010
MONA infrastruktur idag
Internet
https SSL
Reverse Proxy (PortWise)
https://mikrodata.scb.se
Domain Controller and Terminal Servers
File, SQL, Application and RSA Servers
SAN
Struktur i nuvarande MONA
Strukturerat datalager (Data Warehouse)
Vyer (filter) i SQL Server
Användare-1 Användare-2 Användare-n
Personliga skrivbord och datalager
Vad har vi lärt oss ?
• Att aptiten ökar snabbare än resurserna
• Infrastruktur är också att många grupper har tillgång till resurser och oberoende av ort
• STORT, BRETT datalager – borde vara större
• Centraliserat system var rätt väg att börja
• Allmänhetens förtroende är viktigt
• Ny Metropolit-debatt (10 februari 1986…)
• Diskussion i DN kring register och biobanker
• Att i drift måste tekniken vara beprövad
• Metadata finns idag ”utspritt” på olika registerhållare och i olika format
• Svårt för forskare att komma åt
Vet du ?
• … var ditt data finns idag eller i morgon ?
• … var dina data bearbetas idag eller i morgon ?
Flerstegsraket • Idag – centraliserad lösning
• MONA etc
• Snart – decentraliserad lösning
• Flera MONA som talar med varandra
• Framåt – federerad lösning
• Data kvar hos dataägarna – bearbetning på ett
ställe
Ju längre fram – ju större beroende av
metadata !
Betrodd plats
Forskardata Dataleverantör Dataleverantör
Nav
Data
Relations- databas
Data
Relations- databas Lab
data
Relations- databas
Egna data
Applikations- server
Säkra förbindelser mellan servrar/datalager
Logiskt flöde
Meta- data
Federation server
Analysserver Metadata är nyckeln till allt…
Federation av data - slutgiltig lösning ?
Federering -
förutsättningar/hinder • Bygger idag på programvara från en leverantör
(IBM)
• Borde bygga på freeware/public domain
• Lagstiftningen runt detta finns ej ännu
• Tekniken ännu ej mogen
• Fungerar med att skicka enstaka poster – ej hela
register (kapacitets/tidsfråga)
Det var nog allt – frågor …
claus-goran.hjelm@scb.se
top related