data-suomi, selittävä sanakirja

33
DATA-SUOMI-SANAKIRJA Termiviidakon selviytymisopas © Leisca Contents

Upload: kalle-niemi

Post on 07-Jul-2015

662 views

Category:

Technology


1 download

DESCRIPTION

Kaikki kelmut eivät valitettavasti näy tässä oikein, mutta anti mennä :) Vielä beta-vaiheessa oleva, termiviidakon selviytymisopas kaikille, jotka ovat koittavat ymmärtää mitä se kaikki datahöpinä tarkoittaa. Tullaan elävöittämään myöhemmin vielä esimerkkien avulla.

TRANSCRIPT

Page 1: Data-suomi, selittävä sanakirja

DATA-SUOMI-SANAKIRJA

Termiviidakon selviytymisopas

© Leisca Contents

Page 2: Data-suomi, selittävä sanakirja

YLEISTÄ DATASTA Data ei ole IT:n synonyymi.

© Leisca Contents

Page 3: Data-suomi, selittävä sanakirja

”VUONNA 2002 (SIIS YLI KYMMENEN VUOTTA SITTEN !!)

HEIKKOLAATUINEN DATA AIHEUTTI SUOMALAISILLE YRITYKSILLE ARVIOLTA 10

MILJARDIN EURON TAPPIOT ” - DAMA FINLAND ARVIO ECKERSONIN TUTKIMUKSEN POHJALTA -

© Leisca Contents

Page 4: Data-suomi, selittävä sanakirja

”ALKUJAAN TODELLISUUTTA REKISTERÖITIIN DATAKSI.

NYKYÄÄN DATA ON TODELLISUUS.”

- PETER R. BENSON, ECCMA -

© Leisca Contents

Page 5: Data-suomi, selittävä sanakirja

MITÄ ON DATA? Perustermit tutuksi:

© Leisca Contents

Page 6: Data-suomi, selittävä sanakirja

DATA ON INFORMAATION RAKENNUSAINE

Informaatio

Data

Yksittäiset termit, kirjaimet, symbolit, signaalit. Järjestelmät välittävät dataa toistensa kesken. Data prosessoidaan informaatioksi.

Dataa ymmärrettävässä muodossa, datasta tehty tulkinta. Esim. Varastoinnissa yhdistetään eri datoja (tuotekoodi ja numeraalinen saldotieto), jonka perusteella voidaan muodostaa informaatiota siitä, onko tuotetta varastossa ja kuinka paljon.

© Leisca Contents

Page 7: Data-suomi, selittävä sanakirja

ESIMERKKI Etunimi Sukunimi Puhelin Maa Kaupunki Postinro Katu Talonro Rappu Asunto/

ovi

Kalle Niemi 04012345 Suomi Pori 28130 Teljänkatu 8 A 3

DATA

Ylläolevasta datasetistä voidaan muodostaa erilaista informaatiota käyttötarpeen/ kontekstin mukaan.

Page 8: Data-suomi, selittävä sanakirja

DATA IS WHAT IT IS AND INFORMATION IS WHAT WE MAKE OF IT. - PETER R. BENSON, ECCMA -

Page 9: Data-suomi, selittävä sanakirja

MASTER DATA - METADATA - REFERENCE DATA?

MASTER DATA §  Tarkoittaa yrityksen liiketoiminnalle

tärkeään informaatioon liittyvää dataa, kuten asiakasdata, työntekijädata, toimittajadata, tuotedata, materiaalidata yms.

§  Master Data on yrityksen strateginen

resurssi ja sitä tulee hallita sen mukaisesti.

METADATA §  Metadata on dataa datasta tai datan

taltioinnista (esim. Kuvatiedoston tallennusasetukset)

§  Esimerkiksi Word-dokumentti sisältää metadatana dokumentin tekijän, tallennuspäivän, muokkauspäivän, avainsanoja, tiedoston koon yms.

§  Metadataa hyödynnetään parantamaan tiedon löydettävyyttä. REFERENCE DATA

§  Organisaation ulkopuolelta tulevaa standardidataa, kuten valuuttakoodit (EUR, USD yms.) tai maakoodit. Myös toimittajan tai valmistajan omasta tuotekoodista puhutaan usein referenssidatana.

© Leisca Contents

Page 10: Data-suomi, selittävä sanakirja

BIG DATA

§  Suurten, jäsentymättömien tietomassojen käsittely, johon ihmisaivot tai perinteiset tietokantaratkaisut eivät itsekseen kykene.

§  Esimerkiksi Facebookin palvelinkeskuksissa tapahtuva viestiliikenne tai Amazon.com –verkkokaupan ostotapahtumat kerryttävät valtavat määrät dataa.

§  Usein viitataan myös useista eri lähteistä koostettuun suureen datamassaan, jota analysoidaan esim. Sää- ja liikennetietojen suhdetta kuluttajan ostokäyttäytymiseen.

§  Datan määrän kasvaessa joka vuosi eksponentiaalisesti myös määritelmä siitä, mikä oikeastaan on ”BIG”, elää jatkuvasti.

© Leisca Contents

Page 11: Data-suomi, selittävä sanakirja

DATAN HALLINNAN TERMINOLOGIA Perusteet hallussa?

© Leisca Contents

Page 12: Data-suomi, selittävä sanakirja

MDM ELI MASTER DATA MANAGEMENT

§  Ylätason käsite, jolla pyritään kuvaamaan sitä toimintamallien, sääntöjen ja työkalujen muodostamaa kokonaisuutta, millä yritys luo ja ylläpitää master dataa.

§  Ei tarkoita mitään yksittäistä, tiettyä tapaa toimia.

§  Master data management lähtee useimmiten liikkeelle päällekkäisten datojen poistamisesta hallinnan keskittämisellä, ettei esim. sama tuote esiinny useampaan kertaan, mahdollisesti eri kuvaustiedoin yrityksen tietojärjestelmissä.

§  Muita tyypillisiä kehittämisen osa-alueita ovat mm. datan laatu, datan luokittelu ja datan identifiointi.

© Leisca Contents

Page 13: Data-suomi, selittävä sanakirja

DATA GOVERNANCE

§  Viittaa useimmiten datahallinnan prosessien ja työkalujen määrittelyihin ja vastuujakoihin.

§  Jos master data management kuvaa enemmänkin operatiivista kokonaisuutta, niin data governance viittaa tuon kokonaisuuden määrittelyyn, ohjeistukseen, tavoitteiden asetantaan, johtamiseen yms.

§  Data Governanceen liittyvät osa-alueet:

Data Quality, Data Security, Data Storage, Data Warehouse & Business Intelligence, Data Modeling & Design, Data Integration & Interoperability, Data Architechture.

Data Governance ilman operatiivista datan hallintaa muodostuu nopeasti akateemiseksi himmeliksi.

© Leisca Contents

Page 14: Data-suomi, selittävä sanakirja

DATA GOVERNANCE ESIMERKKIMALLI (MALLEJA ON USEITA ERILAISIA)

Määrittele vastuut

Jalkauta säännöt

Tarkasta / hyväksy Eskaloi

Luo säännöt Auditoi / Taltioi Jäljitettävyys Korjaa

ongelmat Tarkkaile / raportoi

Määrittele käytännöt

Profilointi ja löydökset Datan laatu

Dat

a O

wne

rs

Mää

ritt

ely

Dat

a St

ewar

ds

Käyt

äntö

D

ata

Cust

odia

ns

Ope

roin

ti

Spesifikaatiot

Spesifikaatiot Tapahtumat (poikkeamat, rikkeet..)

Raja-arvoissa pysyminen

© Leisca Contents

Page 15: Data-suomi, selittävä sanakirja

MASTER DATA MANAGEMENT =

KÄSITE KUVAA OPERATIIVISTA MASTER DATAN HALLINTAA.

DATA GOVERNANCE

= KÄSITE KUVAA DATAN HALLINTAAN LIITTYVÄN OPERATIIVISEN TOIMINNAN OHJAAMISTA JA

MÄÄRITTELYÄ

© Leisca Contents

Page 16: Data-suomi, selittävä sanakirja

DATAN HALLINNAN ALAKÄSITTEET Yhä syvemmälle viidakkoon:

© Leisca Contents

Page 17: Data-suomi, selittävä sanakirja

HALLINTOHENKILÖT

DATA OWNER = Datan oikeellisuudesta vastaava, määrittelee mm. Datan laatuvaatimukset ja prosessikehyksen data-alueen ylläpidolle. Useimmiten ylemmän johtotason henkilö, esim. Myyntijohtaja voi olla asiakasdatan Data Owner. Päävastuullinen omasta data-alueestaan.

DATA STEWARD = Data Steward eli kavereiden kesken Data Paimen valvoo ja huolehtii, että määritellyt reunaehdot toteutuvat käytännössä ja korjaa virheitä tarvittaessa. Määrittelee. Keskeinen rooli datan laadun parantamisessa informaation elinkaaren eri vaiheissa.

DATA CUSTODIAN = Usein IT-osasto, jonka tehtävänä on huolehtia datan turvallisesta taltioinnista, liikkuvuudesta, pääsynhallinnasta ja muista käytännön asioista.

© Leisca Contents

Page 18: Data-suomi, selittävä sanakirja

DATAHALLINNAN OSA-ALUEET

Data Quality = Datan laatu. Vaikkakin usein luokiteltu omaksi osa-alueekseen, niin kaikki datan hallinnan toimenpiteet tähtäävät lopputulemana datan laadun parantamiseen ja varmistamiseen. Eri dataryhmillä voi olla erilaisia laatuvaatimuksia, mutta usein laatua peilataan seuraavaan viiteen (5) ehtoon *Dama finland: ①  ACCURACY: data kuvastaa oikein reaalimaailman tilannetta ②  COMPLETENESS: kaikki tarvittava tieto on annettu

③  CONSISTENCY: tieto on yhdenmukaista esim. järjestelmien välillä ④  DUPLICATION: samaa tietoa ei ole kahdesti

⑤  TIMELINESS: tieto on saatavilla riittävän nopeasti © Leisca Contents

Page 19: Data-suomi, selittävä sanakirja

TYYPILLISIÄ VIRHEITÄ DATASSA

SISÄLTÖVIRHEITÄ: §  Kirjoitusvirheitä tai saman asian kirjoittaminen useilla synonyymeilla (vrt.

Helsinki, Hki), joka johtuu sääntöjen puuttumisesta.

KENTTIEN VÄÄRINKÄYTTÖÄ: §  Vääriä asioita pistetty vääriin kenttiin. Esimerkiksi materiaalidatassa

toimittajatieto laitettuna tekniseen kuvauskenttään.

LUOKITTELUHAJONTAA §  Sama asia laitettu luokiteltu eri kategoriaan.

LÖYDETTÄVYYS KÄRSII, DUPLIKAATTIEN MÄÄRÄ KASVAA JA RAPORTIT EIVÄT PIDÄ PAIKKAANSA.

Page 20: Data-suomi, selittävä sanakirja

HAJATELMIA DATAN LAADUSTA

ACCURACY= Mitä ”vastaa reaalimaailman tilannetta” tarkoittaa datan laadun osalta? Laadukkaan datan ei tarvitse vastata reaalimaailman tilannetta, informaation täytyy.

TIMELINESS= Laadukas data ei ole aikariippuvaista. Laadukas informaatio on.

LAADUKAS DATA EI TAKAA LAADUKASTA INFORMAATIOTA, MUTTA ILMAN LAADUKASTA DATAA EI VOI OLLA LAADUKASTA INFORMAATIOTA.

© Leisca Contents

Page 21: Data-suomi, selittävä sanakirja

DATAN LAATU EI OLE UNIVERSAALI KÄSITE.

DATAN LAADUN MÄÄRITTELEE DATAN TARVITSIJA.

© Leisca Contents

Page 22: Data-suomi, selittävä sanakirja

DATAHALLINNAN OSA-ALUEET

Data Security = Datan turvaaminen & suojaaminen, pääsynhallinta. Näihin liittyvät työkalut ja toimintatavat.

Data Storage = Datan taltiointi/ varastoiminen ja varmistus. Työkalut ja toimintatavat, eli koska arkistoituu, miten käytettävyys ja 24/7 pääsy on varmistettu yms.

Data Warehouse = Keskitetty tietovarasto, joka taltio dataa eri lähteistä yhteen pisteeseen useimmiten raportointia varten. Business Intelligence = Ratkaisu, joka muodostaa erilaisia liiketoimintanäkymiä, -raportteja ja -analytiikkaa Data Warehouseen taltioidusta datasta päätöksenteon tueksi. © Leisca Contents

Page 23: Data-suomi, selittävä sanakirja

DATAHALLINNAN OSA-ALUEET

Data Modeling & Design = Prosessi , jonka tarkoituksena on määrittää ja luoda datavaatimukset tukemaan parhaalla tavalla liiketoimintaprosesseja ja niihin liittyviä järjestelmiä.

Data Integration & Interoperability = Määrittely ja toteutus; miten data liikkuu ja toimii eri järjestelmien välillä, miten dataa siirretään.

Data Architechture = Määrittelee mallit, politiikat ja säännöt mitä dataa taltioidaan, minne, miten, miten se parhaiten valjastetaan liiketoiminnan tarpeisiin.

© Leisca Contents

Page 24: Data-suomi, selittävä sanakirja

MIKSI KANNATTAA TOIMIA NYT ”Ainahan ne on ollut kuralla…”

© Leisca Contents

Page 25: Data-suomi, selittävä sanakirja

YLEINEN ENNUSTE: TULEVAN VIIDEN (5) VUODEN AIKANA DATAN

MÄÄRÄ YHDEKSÄNKERTAISTUU (9).

© Leisca Contents

Page 26: Data-suomi, selittävä sanakirja

1. DATAN KOKONAISMASSA TULEE OLEMAAN YLI 35 ZB* (2011 = 1.8 ZB)

2. ORGANISAATIOIDEN INFORMAATIOMÄÄRÄ KASVAA 50-KERTAISEKSI

3. INFORMAATIOSIILOJEN ( TIEDOSTOT, OBJEKTIT, LAITTEET JNE. ) MÄÄRÄ KASVAA 75-KERTAISEKSI.

4. PALVELINTEN ( FYYSISTEN JA VIRTUAALISTEN ) MÄÄRÄ

KYMMENKERTAISTUU.

5. IT-OSAAJIEN MÄÄRÄ KASVAA VAIN 50 % - IDC Digital Universe Study, 2012 -

Vuonna 2020:

*1 ZB = 1 099 511 627 776 GB © Leisca Contents

Page 27: Data-suomi, selittävä sanakirja

KOKO DATAMASSAN VOISI TALTIOIDA 39 MILJARDILLE 1 TB:N ULKOISELLE

KIINTOLEVYLLE.

Page 28: Data-suomi, selittävä sanakirja

1,9 CM KORKEISTA KIINTOLEVYISTÄ RAKENTUISI

741 000 KM KORKEAN TORNI

Page 29: Data-suomi, selittävä sanakirja

2020 =

ENEMMÄN TYÖSTETTÄVÄÄ JA VÄHEMMÄN KÄSIPAREJA.

© Leisca Contents

Page 30: Data-suomi, selittävä sanakirja

NIIN MITÄ SE DATA OLI? Eksekjuutiv sammari:

© Leisca Contents

Page 31: Data-suomi, selittävä sanakirja

DATA IT

© Leisca Contents

Page 32: Data-suomi, selittävä sanakirja

DATA =

© Leisca Contents

Page 33: Data-suomi, selittävä sanakirja

KIITOKSIA

© Leisca Contents

Kalle Niemi +35840 702 6270

[email protected] @kaheniem