big data ja liiketoiminnan etiikka
TRANSCRIPT
Big Data ja liiketoiminnan etiikka
Jyrki J.J. Kasvi@jyrkikasvi #Aamuareena 10.2.2017
01.05.2023 @jyrkikasvi @tiekery 2
Tiedonmurusista leivottu datakakku Big Data tarkoittaa suurten tietomassojen reaaliaikaista
kokoamista, hallintaa ja analyysiä Big datan analyysin tuloksia voidaan hyödyntää toiminnan
reaaliaikaisessa automaattisessa ohjaamisessa ja tiedolla johtamisessa
Big dataa voidaan hyödyntää tietointensiivisten palvelu-tuotteiden tuottamiseen esimerkiksi terveydenhoidossa, liikenteessä, markkinoinnissa tai asumisessa Big data muuttaa investointituotteet tietointensiivisiksi palveluiksi,
esim. hissit, meridieselit, tuotantojärjestelmät, sähköverkot, … Kuluttajista kerätään verkossa jatkuvasti tietoa, jota jalostetaan
esimerkiksi mainostajille myytäviksi tuotteiksi
Kun Hitachi korvasi logistiikan esimiehet Big Datalla koulutetullatekoälyllä, varastomiehet työskentelivät 8% tehokkaammin.
Ken Teegardin, CC BY-SA 2.0
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 4
Uusissa suihkumoottoreissa tuhansia sensoreita, jotka lähettävät jatkuvasti dataa, jota analysoimalla valmistaja tietää, mitä huoltoa tarvitaan.
CC 2.0 BY Mark Kobayashi-Hillary
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 5
Dataa joka minuutti!Ja kaikki tämä data kertoomeistä Internetin käyttäjistä
CC 2.0 BY Erik Fitzpatrick
Bitti löytyy Big Data -suovasta … reaaliajassa
Vanhentunut tieto on päätöksenteossa ja liiketoiminnassa arvotonta
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 6
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 7
0,1
0,1
Dataa syntyy, entä tietoa? Organisaatiot ja järjestelmät tuottavat yhä enemmän
(big) dataa High VVV: High Volume, high Velocity & high Variety of sources
Tekniikka mahdollistaa hyvin suurten datamassojen kokoamisen ja analysoinnin murto-osalla aiemmista kustannuksista Vanhoja järjestelmiä ja datavarantoja ei suunniteltu big datan tarpeisiin Haasteena datavarojen pirstaloituminen ja heikko laatu (puutteelliset
määrittelyt, epäyhdenmukaiset datan esitysmuodot, puuttuva metadata)
Tiedolla johtaminen edellyttää ajantasaista tietoa Liiketoiminnan reaaliaikainen ohjaus (RTE - real time economy)
@jyrkikasvi #eGovernment
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 9
Big Datan etiikkaa Gartner ennustaa, että 2018 puolet liiketoiminnan etiikan rikkeistä
liittyy big datan analyysin sopimattomaan hyödyntämiseen Vaikka lakia ei oltaisi rikottu, vahinko yrityksen maineelle voi olla merkittävä http://www.gartner.com/newsroom/id/3144217
Esimerkiksi Target-kauppaketjun algoritmi päätteli 15-vuotiaan asiakkaan olevan raskaana ja lähetti hänelle vauvanhoito-tuotteiden mainoksia Algoritmin ohjelmoijan tehtävänä oli ollut päätellä asiakkaasta kerättyjen tietojen
perusteella, onko tämä raskaana vaikka hän ei haluaisi kauppaketjun tietävän siitä Tyttö oli raskaana, mutta hänen vanhempansa eivät sitä tienneet, ennen mainoksia.
“Datalla ei ole moraalia – ei hyvää eikä pahaa, data vain on. Dataetiikassa on kyse siitä, millaisia valintoja me dataa hyödyntävät ihmiset teemme.” – Alan Duncan, Gartner
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 10
Big data, yksityisyys ja itsemääräämisoikeus Suurin osa big datan eettisistä kysymyksistä liittyy yksityisyyteen
Esim. mitä sosiaalisen median yhtiöt tekevät meistä keräämillään tiedoilla Rekistereitä yhdistämällä mahdollista luoda hyvin yksityiskohtaisia henkilöprofiileja
Kerättyjen henkilötietojen tietoturva Vaikka käyttäisi keräämiään tietoja eettisesti, tietomurtajaa se ei pidättele
Kerättyjen henkilötietojen omistajuus ja hallinta Esim terveystiedot omistaa potilas itse
Henkilötietoja saa käyttää vain tarkoituksiin, joihin niiden luovuttajat ovat suostuneet Tietojen yhdisteleminen eri rekistereistä? Anonymisoitujen tietojen hyödyntäminen?
01.05.2023 11
Esim terveystiedot omistaa ja niitä hallitsee potilas
@jyrkikasvi #eGovernment
01.05.2023 12
Anonymisoitua tietoa hyödyntäviä palveluita
@jyrkikasvi #eGovernment
Analyysin pohjana oleva data on suojattava manipuoloinnilta.
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 13
Big data ja tiedon etiikka Big datan analyysi ei välttämättä
läpinäkyvää Oppivan algoritmin logiikan seuraaminen voi olla ihmiselle mahdotonta Analyysiin käyttävän algoritmin manipulointia ei välttämättä pysty huomaamaan
Huonosta big datasta ei saa hyvää analyysiä Laadukas data on tarkkaa, luotettavaa, yhtenäistä, kattavaa ja ajantasaista Analysoitava data on suojattava manipuloinnilta
Hyväkin analyysi voidaan tulkita huonosti Tuloksia ei saa kaunistella eikä käyttää muuhun kuin mitä analyysi koskee Tulosten merkittävyyttä ei saa ali- eikä ylitulkita
Tulkinta edellyttää käytettyjen analyysimenetelmien ymmärtämistä Tilastoanalyysin ja algoritmien lisäksi on ymmärrettävä esim sosiaalitieteitä
Lisäys yleisökommentin perusteella!Myös huonolaatuista big dataa voi analysoida, kunhan tiedostaa datan laadun ongelmat, niiden edellyttämändatan esikäsittelyn ja niistä seuraavatrajoitteet tulosten hyödynnettävyydelle.Jos vain laadukasta tietoa voisi analy-soida, ei olisi paljon analysoitavaa!
01.05.2023 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 14
Big datan eettisiä periaatteitä Kerää, hallitse ja käytä henkilötietoja vain siten kuin hyväksyisit
oman lapsesi tietoja käytettävän
Informoi ja kysy lupa aina kun keräät henkilötietoja Noudattamasi tiedon hallinnan, tietoturvan ja yksityisyyden suojan periaatteet Mihin tarkoituksiin tietoa kerätään Miten tiedon keruu hyödyttää sinua, asiakasta ja yhteiskuntaa
Arvioi tietojen keruuseen ja analyysiin liittyviä riskejä Esim. mitä tapahtuu, jos tehdään tietomurto tai henkilöstö käyttää tietoja väärin? Onko riskeihin varauduttu ja ehkäisty sekä käytännöt auditoitu?
Varmista kerättyjen tietojen tietoturva Noudattavatko yhteistyökumppanit vastaavia eettisiä ja tietoturvakäytäntöjä
Huolehdi datan, analyysin ja tulkinnan laadusta
30.9.2010 www.kasvi.org 15
Sukupuolten välinen digikuilu?Keskustelua
U.S. Army Photo