data-suomi, selittävä sanakirja
DESCRIPTION
Kaikki kelmut eivät valitettavasti näy tässä oikein, mutta anti mennä :) Vielä beta-vaiheessa oleva, termiviidakon selviytymisopas kaikille, jotka ovat koittavat ymmärtää mitä se kaikki datahöpinä tarkoittaa. Tullaan elävöittämään myöhemmin vielä esimerkkien avulla.TRANSCRIPT
DATA-SUOMI-SANAKIRJA
Termiviidakon selviytymisopas
© Leisca Contents
YLEISTÄ DATASTA Data ei ole IT:n synonyymi.
© Leisca Contents
”VUONNA 2002 (SIIS YLI KYMMENEN VUOTTA SITTEN !!)
HEIKKOLAATUINEN DATA AIHEUTTI SUOMALAISILLE YRITYKSILLE ARVIOLTA 10
MILJARDIN EURON TAPPIOT ” - DAMA FINLAND ARVIO ECKERSONIN TUTKIMUKSEN POHJALTA -
© Leisca Contents
”ALKUJAAN TODELLISUUTTA REKISTERÖITIIN DATAKSI.
NYKYÄÄN DATA ON TODELLISUUS.”
- PETER R. BENSON, ECCMA -
© Leisca Contents
MITÄ ON DATA? Perustermit tutuksi:
© Leisca Contents
DATA ON INFORMAATION RAKENNUSAINE
Informaatio
Data
Yksittäiset termit, kirjaimet, symbolit, signaalit. Järjestelmät välittävät dataa toistensa kesken. Data prosessoidaan informaatioksi.
Dataa ymmärrettävässä muodossa, datasta tehty tulkinta. Esim. Varastoinnissa yhdistetään eri datoja (tuotekoodi ja numeraalinen saldotieto), jonka perusteella voidaan muodostaa informaatiota siitä, onko tuotetta varastossa ja kuinka paljon.
© Leisca Contents
ESIMERKKI Etunimi Sukunimi Puhelin Maa Kaupunki Postinro Katu Talonro Rappu Asunto/
ovi
Kalle Niemi 04012345 Suomi Pori 28130 Teljänkatu 8 A 3
DATA
Ylläolevasta datasetistä voidaan muodostaa erilaista informaatiota käyttötarpeen/ kontekstin mukaan.
DATA IS WHAT IT IS AND INFORMATION IS WHAT WE MAKE OF IT. - PETER R. BENSON, ECCMA -
MASTER DATA - METADATA - REFERENCE DATA?
MASTER DATA § Tarkoittaa yrityksen liiketoiminnalle
tärkeään informaatioon liittyvää dataa, kuten asiakasdata, työntekijädata, toimittajadata, tuotedata, materiaalidata yms.
§ Master Data on yrityksen strateginen
resurssi ja sitä tulee hallita sen mukaisesti.
METADATA § Metadata on dataa datasta tai datan
taltioinnista (esim. Kuvatiedoston tallennusasetukset)
§ Esimerkiksi Word-dokumentti sisältää metadatana dokumentin tekijän, tallennuspäivän, muokkauspäivän, avainsanoja, tiedoston koon yms.
§ Metadataa hyödynnetään parantamaan tiedon löydettävyyttä. REFERENCE DATA
§ Organisaation ulkopuolelta tulevaa standardidataa, kuten valuuttakoodit (EUR, USD yms.) tai maakoodit. Myös toimittajan tai valmistajan omasta tuotekoodista puhutaan usein referenssidatana.
© Leisca Contents
BIG DATA
§ Suurten, jäsentymättömien tietomassojen käsittely, johon ihmisaivot tai perinteiset tietokantaratkaisut eivät itsekseen kykene.
§ Esimerkiksi Facebookin palvelinkeskuksissa tapahtuva viestiliikenne tai Amazon.com –verkkokaupan ostotapahtumat kerryttävät valtavat määrät dataa.
§ Usein viitataan myös useista eri lähteistä koostettuun suureen datamassaan, jota analysoidaan esim. Sää- ja liikennetietojen suhdetta kuluttajan ostokäyttäytymiseen.
§ Datan määrän kasvaessa joka vuosi eksponentiaalisesti myös määritelmä siitä, mikä oikeastaan on ”BIG”, elää jatkuvasti.
© Leisca Contents
DATAN HALLINNAN TERMINOLOGIA Perusteet hallussa?
© Leisca Contents
MDM ELI MASTER DATA MANAGEMENT
§ Ylätason käsite, jolla pyritään kuvaamaan sitä toimintamallien, sääntöjen ja työkalujen muodostamaa kokonaisuutta, millä yritys luo ja ylläpitää master dataa.
§ Ei tarkoita mitään yksittäistä, tiettyä tapaa toimia.
§ Master data management lähtee useimmiten liikkeelle päällekkäisten datojen poistamisesta hallinnan keskittämisellä, ettei esim. sama tuote esiinny useampaan kertaan, mahdollisesti eri kuvaustiedoin yrityksen tietojärjestelmissä.
§ Muita tyypillisiä kehittämisen osa-alueita ovat mm. datan laatu, datan luokittelu ja datan identifiointi.
© Leisca Contents
DATA GOVERNANCE
§ Viittaa useimmiten datahallinnan prosessien ja työkalujen määrittelyihin ja vastuujakoihin.
§ Jos master data management kuvaa enemmänkin operatiivista kokonaisuutta, niin data governance viittaa tuon kokonaisuuden määrittelyyn, ohjeistukseen, tavoitteiden asetantaan, johtamiseen yms.
§ Data Governanceen liittyvät osa-alueet:
Data Quality, Data Security, Data Storage, Data Warehouse & Business Intelligence, Data Modeling & Design, Data Integration & Interoperability, Data Architechture.
Data Governance ilman operatiivista datan hallintaa muodostuu nopeasti akateemiseksi himmeliksi.
© Leisca Contents
DATA GOVERNANCE ESIMERKKIMALLI (MALLEJA ON USEITA ERILAISIA)
Määrittele vastuut
Jalkauta säännöt
Tarkasta / hyväksy Eskaloi
Luo säännöt Auditoi / Taltioi Jäljitettävyys Korjaa
ongelmat Tarkkaile / raportoi
Määrittele käytännöt
Profilointi ja löydökset Datan laatu
Dat
a O
wne
rs
Mää
ritt
ely
Dat
a St
ewar
ds
Käyt
äntö
D
ata
Cust
odia
ns
Ope
roin
ti
Spesifikaatiot
Spesifikaatiot Tapahtumat (poikkeamat, rikkeet..)
Raja-arvoissa pysyminen
© Leisca Contents
MASTER DATA MANAGEMENT =
KÄSITE KUVAA OPERATIIVISTA MASTER DATAN HALLINTAA.
DATA GOVERNANCE
= KÄSITE KUVAA DATAN HALLINTAAN LIITTYVÄN OPERATIIVISEN TOIMINNAN OHJAAMISTA JA
MÄÄRITTELYÄ
© Leisca Contents
DATAN HALLINNAN ALAKÄSITTEET Yhä syvemmälle viidakkoon:
© Leisca Contents
HALLINTOHENKILÖT
DATA OWNER = Datan oikeellisuudesta vastaava, määrittelee mm. Datan laatuvaatimukset ja prosessikehyksen data-alueen ylläpidolle. Useimmiten ylemmän johtotason henkilö, esim. Myyntijohtaja voi olla asiakasdatan Data Owner. Päävastuullinen omasta data-alueestaan.
DATA STEWARD = Data Steward eli kavereiden kesken Data Paimen valvoo ja huolehtii, että määritellyt reunaehdot toteutuvat käytännössä ja korjaa virheitä tarvittaessa. Määrittelee. Keskeinen rooli datan laadun parantamisessa informaation elinkaaren eri vaiheissa.
DATA CUSTODIAN = Usein IT-osasto, jonka tehtävänä on huolehtia datan turvallisesta taltioinnista, liikkuvuudesta, pääsynhallinnasta ja muista käytännön asioista.
© Leisca Contents
DATAHALLINNAN OSA-ALUEET
Data Quality = Datan laatu. Vaikkakin usein luokiteltu omaksi osa-alueekseen, niin kaikki datan hallinnan toimenpiteet tähtäävät lopputulemana datan laadun parantamiseen ja varmistamiseen. Eri dataryhmillä voi olla erilaisia laatuvaatimuksia, mutta usein laatua peilataan seuraavaan viiteen (5) ehtoon *Dama finland: ① ACCURACY: data kuvastaa oikein reaalimaailman tilannetta ② COMPLETENESS: kaikki tarvittava tieto on annettu
③ CONSISTENCY: tieto on yhdenmukaista esim. järjestelmien välillä ④ DUPLICATION: samaa tietoa ei ole kahdesti
⑤ TIMELINESS: tieto on saatavilla riittävän nopeasti © Leisca Contents
TYYPILLISIÄ VIRHEITÄ DATASSA
SISÄLTÖVIRHEITÄ: § Kirjoitusvirheitä tai saman asian kirjoittaminen useilla synonyymeilla (vrt.
Helsinki, Hki), joka johtuu sääntöjen puuttumisesta.
KENTTIEN VÄÄRINKÄYTTÖÄ: § Vääriä asioita pistetty vääriin kenttiin. Esimerkiksi materiaalidatassa
toimittajatieto laitettuna tekniseen kuvauskenttään.
LUOKITTELUHAJONTAA § Sama asia laitettu luokiteltu eri kategoriaan.
LÖYDETTÄVYYS KÄRSII, DUPLIKAATTIEN MÄÄRÄ KASVAA JA RAPORTIT EIVÄT PIDÄ PAIKKAANSA.
HAJATELMIA DATAN LAADUSTA
ACCURACY= Mitä ”vastaa reaalimaailman tilannetta” tarkoittaa datan laadun osalta? Laadukkaan datan ei tarvitse vastata reaalimaailman tilannetta, informaation täytyy.
TIMELINESS= Laadukas data ei ole aikariippuvaista. Laadukas informaatio on.
LAADUKAS DATA EI TAKAA LAADUKASTA INFORMAATIOTA, MUTTA ILMAN LAADUKASTA DATAA EI VOI OLLA LAADUKASTA INFORMAATIOTA.
© Leisca Contents
DATAN LAATU EI OLE UNIVERSAALI KÄSITE.
DATAN LAADUN MÄÄRITTELEE DATAN TARVITSIJA.
© Leisca Contents
DATAHALLINNAN OSA-ALUEET
Data Security = Datan turvaaminen & suojaaminen, pääsynhallinta. Näihin liittyvät työkalut ja toimintatavat.
Data Storage = Datan taltiointi/ varastoiminen ja varmistus. Työkalut ja toimintatavat, eli koska arkistoituu, miten käytettävyys ja 24/7 pääsy on varmistettu yms.
Data Warehouse = Keskitetty tietovarasto, joka taltio dataa eri lähteistä yhteen pisteeseen useimmiten raportointia varten. Business Intelligence = Ratkaisu, joka muodostaa erilaisia liiketoimintanäkymiä, -raportteja ja -analytiikkaa Data Warehouseen taltioidusta datasta päätöksenteon tueksi. © Leisca Contents
DATAHALLINNAN OSA-ALUEET
Data Modeling & Design = Prosessi , jonka tarkoituksena on määrittää ja luoda datavaatimukset tukemaan parhaalla tavalla liiketoimintaprosesseja ja niihin liittyviä järjestelmiä.
Data Integration & Interoperability = Määrittely ja toteutus; miten data liikkuu ja toimii eri järjestelmien välillä, miten dataa siirretään.
Data Architechture = Määrittelee mallit, politiikat ja säännöt mitä dataa taltioidaan, minne, miten, miten se parhaiten valjastetaan liiketoiminnan tarpeisiin.
© Leisca Contents
MIKSI KANNATTAA TOIMIA NYT ”Ainahan ne on ollut kuralla…”
© Leisca Contents
YLEINEN ENNUSTE: TULEVAN VIIDEN (5) VUODEN AIKANA DATAN
MÄÄRÄ YHDEKSÄNKERTAISTUU (9).
© Leisca Contents
1. DATAN KOKONAISMASSA TULEE OLEMAAN YLI 35 ZB* (2011 = 1.8 ZB)
2. ORGANISAATIOIDEN INFORMAATIOMÄÄRÄ KASVAA 50-KERTAISEKSI
3. INFORMAATIOSIILOJEN ( TIEDOSTOT, OBJEKTIT, LAITTEET JNE. ) MÄÄRÄ KASVAA 75-KERTAISEKSI.
4. PALVELINTEN ( FYYSISTEN JA VIRTUAALISTEN ) MÄÄRÄ
KYMMENKERTAISTUU.
5. IT-OSAAJIEN MÄÄRÄ KASVAA VAIN 50 % - IDC Digital Universe Study, 2012 -
Vuonna 2020:
*1 ZB = 1 099 511 627 776 GB © Leisca Contents
KOKO DATAMASSAN VOISI TALTIOIDA 39 MILJARDILLE 1 TB:N ULKOISELLE
KIINTOLEVYLLE.
1,9 CM KORKEISTA KIINTOLEVYISTÄ RAKENTUISI
741 000 KM KORKEAN TORNI
2020 =
ENEMMÄN TYÖSTETTÄVÄÄ JA VÄHEMMÄN KÄSIPAREJA.
© Leisca Contents
NIIN MITÄ SE DATA OLI? Eksekjuutiv sammari:
© Leisca Contents
DATA IT
© Leisca Contents
DATA =
© Leisca Contents