analytiikka toiminnan kehittämisessä

45
Analytiikka toiminnan kehittämisessä Jari Jussila Novi tutkimuskeskus Data-analytiikka PK-yritysten toiminnan kehittämisessä 4.12.2014

Upload: jari-jussila

Post on 13-Jul-2015

424 views

Category:

Business


2 download

TRANSCRIPT

Page 1: Analytiikka toiminnan kehittämisessä

Analytiikka toiminnan

kehittämisessä

Jari Jussila

Novi tutkimuskeskus

Data-analytiikka PK-yritysten toiminnan kehittämisessä

4.12.2014

Page 2: Analytiikka toiminnan kehittämisessä

Johdanto

• Big Datan ja analytiikkamaailman

käsitteiden läpikäyminen

• Toiminnan kehittämisen eri ulottuvuudet,

mihin kaikkeen data ja analytiikka taipuvat

• Analytiikka web-sivujen seurannassa,

hakukoneoptimointi, sosiaalisen median

hyödyntäminen toiminnan kehittämisessä

ja asiakasanalyysissa

8.12.2014 2

Page 3: Analytiikka toiminnan kehittämisessä

Big datan ja

analytiikkamaailman

käsitteet

8.12.2014 3

Page 4: Analytiikka toiminnan kehittämisessä

Päätöksenteon tukijärjestelmät

ja johdon tietojärjestelmät

”1970-1990”

8.12.2014 4

vrt. erilaiset johdon työpöydät, kuten markkinoinnin työpöytä

Vierailut

Toiminnot sivustolla

Liidit

Mahdollisuudet

Voitot

Metriikka Tavoitteen

saavuttaminen

64 %

51 %

70 %

29 %

35 %

Myyntisuppilo

Lähde: erilaisia esimerkkejä nähtävillä esim. Klipfolion sivuilla (ks. Dashboards);

ks. myös Visualisointi ja tiedon jakamisen käytännöt (Aho 2014)

Page 5: Analytiikka toiminnan kehittämisessä

Kuutioiden mallinnus - OLAP

(online analytical processing)

8.12.2014 5

Tuote

Aika

Markkinat

image Athanasios Kastanidis

”1980-1990”

Page 6: Analytiikka toiminnan kehittämisessä

OLAP-kuutioiden perusidea

• OLAP-tekniikka poikkeaa perinteisestä

tilastoinnista ja raportoinnista siten, että käyttäjä

voi vaihtaa näkökulmaa tiedontarpeensa mukaan.

• Esimerkiksi analyytikko voi lähteä 1)

tarkastelemaan tuoteryhmien myyntiä maittain, 2)

filtteröidä aineisto tiettyihin maihin 3) joista löytää

jotain esimerkiksi myyntitavoitteista poikkeavaa.

Tämän jälkeen 4) porautua esimerkiksi myyntiin

tietyissä kaupungeissa. 5) Vaihtaa näkökulmaa

liikevoittoon tuoteryhmittäin, jne.

8.12.2014 6

”1980-1990”

Page 7: Analytiikka toiminnan kehittämisessä

Liiketoimintatiedon

hallinnan ulottuvuudet

8.12.2014 7

Organisaation

sisäinen Organisaation

ulkoinen TIEDON

KOHDE

Määrällinen

Laadullinen

TIEDON

TYYPPI

Organisaation

sisäinen

Organisaation

ulkoinen

TIEDON

LÄHDE

Lähde: [Hannula 2005]; image Athanasios Kastanidis

”1989-2005”

Page 8: Analytiikka toiminnan kehittämisessä

Tiedon arvoketju

liiketoimintatiedon hallinnan

näkökulmasta

8.12.2014 8

Lähde: [Myllärniemi 2012]

Page 9: Analytiikka toiminnan kehittämisessä

Minkälaista tietoa tarvitaan?

Tieto, joka on pystytty

hankkimaan

Tieto, joka todella

tarvitaan

Tieto, joka määritellään tarpeelliseksi

8.12.2014 9

Lähde: [Hannula 2005]

Page 10: Analytiikka toiminnan kehittämisessä

Liiketoimintatiedon hallinnan

prosessimalli ja keskeiset tehtävät

8.12.2014 10

Lähde: Tietojohtaminen [Laihonen et al. 2013]

Page 11: Analytiikka toiminnan kehittämisessä

Tiedonlouhinta, data mining,

knowledge discovery in

databases (KDD) ”1990-2007”

8.12.2014 11

10-20 % 20-30 % 50-70 % 10-20 % 10-20 % 5-10 %

1. Liiketoiminnan

ymmärtäminen

2. Datan

ymmärtäminen

3. Datan

valmistelu

3. Mallinnus,

tiedonlouhinta

5. Arviointi

6. Tulosten

julkaisu

Lähde: The CRISP-DM Model [Shearer 2000], [Aho 2014]

Page 12: Analytiikka toiminnan kehittämisessä

CRISP-DM referenssimalli

CRISP-DM referenssimallin tehtävät

Liiketoiminnan

ymmärtäminen

Datan

ymmärtäminen

Datan

valmistelu

Mallinnus,

tiedonlouhinta

Arviointi Tulosten

julkaisu

Määritä

liiketoiminnan

tavoitteet

Tee tilannearvio

Määritä

tiedonlouhinnan

tavoitteet

Laadi

projektisuunnitelma

Kerää alustava

data

Kuvaa data

Tutki dataa

Varmista datan

laatu

Datasetin

kuvaus

Datan valinta

Datan siivous

Datan

rakentaminen

Datan

integrointi

Datan

formatointi

Valitse mallinnus

menetelmä

Suunnittele koe

Rakenna malli

Arvioi mallia

Arvioi tuloksia

Arvioi ja

varmista

tiedonlouhinta

prosessin laatu

Määrittele

seuraavat

stepit

Suunnittele

mallin julkaisu

(esim.

verkkosivuna)

asiakkaalle

Suunnittele

mallin ylläpito

Laadi

loppuraportti

Arvioi projekti

8.12.2014 12

Lähde: The CRISP-DM Model [Shearer 2000]

Page 13: Analytiikka toiminnan kehittämisessä

Analytiikka ”2005-2010”

• Deskriptiivinen analytiikka: tekniikoita joiden avulla voidaan

ymmärtää dataa ja analysoida liiketoiminnan suoriutumiskykyä

• Diagnostiivinen analytiikka: tekniikoita joiden avulla voidaan

ymmärtää mitä on tapahtunut ja miksi

• Prediktiivinen analytiikka: tekniikoita joiden avulla voidaan

analysoida nyky- ja historiatietoa jotta voidaan päätellä mitä

todennäköisesti tapahtuu tai ei tapahdu

• Preskriptiivinen analytiikka: tekniikoita joiden avulla voidaan

laskennallisesti kehittää ja analysoida vaihtoehtoja organisaation

toiminnalle

• Päätöksentekoa tukeva analytiikka: tekniikoita joiden avulla voidaan

visualisoida informaatiota päätöksen teon tueksi

8.12.2014 13

Lähde: Big Data and Analytics [Kaisler et al. 2014]

Page 14: Analytiikka toiminnan kehittämisessä

Analytiikkasykli

1. Määrittele liiketoimintaongelma tai kysymys johon haluat vastauksen

2. Tunnista, kerää, siivoa ja valmistele data kysymyksen vastausta varten

3. Deskriptiivinen analytiikka

– Perehdy dataan (descriptives, correlations, factor analysis, cluster

analysis, ym.)

– Luo mahdollisia hypoteeseja (data mining ym.)

4. Prediktiivinen analytiikka

– Muodosta hypoteesit

– Tunnista soveltuvimmat analytiikkamenetelmät

– Kehitä analyyttiset mallit (multivariate regression, logistic regression,

forecasting, non-linear models, decision trees, ym.)

– Aja mallit ja luo ennusteet

5. Preskriptiivinen analytiikka

– Kehitä päätös- ja optimointimallit

– Hyödynnä koneoppimista päätöksien ohjelmointiin

6. Kirjoita johtopäätökset ja suositukset

8.12.2014 14

Lähde: Introduction to Big Data [Kaisler et al. 2014]

Page 15: Analytiikka toiminnan kehittämisessä

Big Data ”2010-”

8.12.2014 15

Volyymi Vauhti Variaatio Varmuus

Data at Rest Data in Motion Data in Many Forms Data in Doubt

Terabittejä olemassa

olevaa dataa

prosessoitavaksi

Striimattua dataa, nopea

vasteaika millisekunneista

sekunteihin

Strukturoitua, ei-

strukturoitua, ja

semistrukturoitua dataa

Epävarmuutta liittyen

datan epätäydellisyyteen,

puutteellisuuteen, tai

virheellisyyteen

Lähde: [Breuker 2014; Laney, Meta Group 2001 (3V:tä)]

Page 16: Analytiikka toiminnan kehittämisessä

Big Data transaktioista

interaktioihin

8.12.2014 16

WEB

BIG DATA

Lähde: mukaillen [Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013]

ERP

CRM

ostotiedot

maksutiedot

segmentointi

tarjoustiedot

asiakaskohtaamiset

tukikontaktit

weblogit

tarjoushistoria A/B testaaminen

Dynaaminen

hinnoittelu

Hakukonemarkkinointi

ja optimointi

Mainosverkostot

Käyttäytymispohjainen

kohdentaminen

Dynaamiset

funnellit

Sentimentti

Ulkopuolinen demografia

Kuvat ja videot

Puheen muuttaminen tekstiksi

Feedit

Anturi/sensoridata

Tuote / palvelu logit

SMS/MMS

Sosiaaliset verkostot

Sosiaalinen media

Käyttäjien luoma sisältö

Mobiilidata

Klikkivirran analyysi

Sijaintidata

Page 17: Analytiikka toiminnan kehittämisessä

Datan lajeja

Datan laji Muoto Volyymi Kuvaus Esimerkkejä

Master Data Strukturoitu Matala Yritystason dataa jolla on

strategista arvoa organisaatiolle

Asiakas, tuote,

toimittaja

Transaktiodata Struktoroitu & semi-

strukturoitu

Keskinkertainen -

korkea

Transaktiot joita syntyy

liiketoiminta-prosesseissa

Tilaukset, ostot,

maksut

Referenssidata Struktoroitu & semi-

strukturoitu

Matala – keskin-

kertainen

Faktoja jotka tukevat

organisaation kykyä tehokkaasti

prosessoida transaktioita, hallita

masterdataa ja tukea päätöksiä

Demografiset kentät

Metadata Strukturoitu Matala ”Dataa datasta” Datan nimi, datan

dimensiot tai yksiköt,

ym.

Analytiikkadata Strukturoitu Keskinkertainen -

korkea

Liiketoimintaoperaatiosta tai

transaktioista jalostettua tietoa

raportoinnin ja analytiikan

tarpeisiin

Data joka sijaitsee

tietovarastoissa ja

päätöksenteon

tukijärjestelmissä

Big Data Struktoroitu, semi-

strukturoitu ja ei

strukturoitu

Korkea Isoja data settejä, joita on

haastava tallentaa, etsiä, jakaa,

visualisoida ja analysoida

Ihmisten ja koneiden

luomaa dataa

sosiaalisesta

mediasta, webistä,

mobiililaitteista,

sensoreista, ym.

8.12.2014 17

Lähde: Big Data and Analytics [Kaisler et al. 2014]

Page 18: Analytiikka toiminnan kehittämisessä

Master data

• organisaation ydintieto on usein kaikkein

tärkeintä liiketoiminnalle ja siinä menestymiselle

sekä data-lähtöiselle päätöksenteolle

• ydintietoa käytetään useissa yrityksen

prosesseissa ja tietojärjestelmissä, joten

ydintietojen muotojen standardointi ja arvojen

synkronointi on kriittistä järjestelmien

onnistuneelle integroinnille

• ydintiedoksi mielletään usein esimerkiksi

asiakastiedot ja tuotetiedot

8.12.2014 18

Lähde: [Vilminko-Heikkinen & Pekkola 2013]

Page 19: Analytiikka toiminnan kehittämisessä

Datan käyttöön ja analysointiin

liittyvää terminologiaa

Termi Ajanjakso Kuvaus

Päätöksenteon tuki

[Decision Support]

1970-1985 Hyödynnetään data analyysiä

tukemaan päätöksentekoa

Johdon tukijärjestelmät

[Executive Support Systems]

1980-1990 Fokus data analyysissä

ylemmän johdon tueksi

Kuutioiden mallinnus

[Online Analytical Processing

OLAP]

1990-2000 Ohjelmistoja

multidimensionaalisten data

taulujen analysointiin

Liiketoimintatiedon hallinta

[Business Intelligence]

1989-2005 Työkaluja tukemaan

datalähtöistä päätöksentekoa,

painopiste raportoinnissa

Analytiikka

[Analytics]

2005-2010 Fokus tilastollisessa ja

matemaattisessa analyysissä

päätöksenteon tueksi

Massadata

[Big Data]

2010- Fokus erittäin isossa,

monimuotoisessa ja nopeasti

liikkuvassa datassa

8.12.2014 19

Lähde: Big Data at Work [Davenport, 2014]

Page 20: Analytiikka toiminnan kehittämisessä

Kuinka liiketoimintatiedon

hallinta on muuttunut

massadatan myötä?

Massadata Business analytiikka Liiketoimintatiedon

hallinta

Vanhaa • Relaatiotietokannat

• SQL

• Tietovarastot

• Tiedonlouhinta

• Kvantitatiivinen

analyysi

• Tilastotiede

• Operaatiotutkimus

• Päätöksenteon

tukijärjestelmät

• Johdon

tietojärjestelmät

• OLAP

Uutta • 4V:tä

• Monimuotoista dataa

• Vähemmän struktuuria

• Big Data teknologiat

(MapReduce, Hadoop,

NoSQL, ym.)

• Ei strukturoitua dataa

• Dataa monesta

lähteestä

• Monimuotoista dataa

• Data liikkeessä

• Tekstianalytiikka

• Visuaalinen analytiikka

• Sosiaalisen median

analytiikka

• Helppokäyttöisyys

• Visuaalisuus

• Dynaamisuus

• Kattaa organisaation

prosessit

• Koneoppiminen

• RTAP

8.12.2014 20

Lähde: mukailtu Introduction to Big Data [Kaisler et al. 2014]

Page 21: Analytiikka toiminnan kehittämisessä

Big Data, data-analytiikka ja

lähikäsitteet

• Big Data can be defined as the amount of data just beyond

technology’s capability to store, manage and process efficiently.

(Kaisler et al. 2014)

• Data analytics is the science of examining raw data with the purpose

of drawing conclusions about that information. (Rouse 2008)

• Business analytics is the scientific process of transforming data into

insight for making better decisions (INFORMS)

• Tiedonlouhinta (engl. data mining) on kokoelma menetelmiä, jotka

valikoivat, kuvailevat ja mallintavat suuria tietomääriä tavoitteenaan

löytää tiedon omistajalle uusia ja hyödyllisiä säännönmukaisuuksia

ymmärrettävässä muodossa (Hand et al. 2001)

• Business Intelligence refers to the technologies, applications, and

processes for gathering, storing, accessing, and analyzing data to

help its users make better decisions (Wixom and Watson, Teradata

University Network 2012)

8.12.2014 21

Page 22: Analytiikka toiminnan kehittämisessä

Ymmärrys

Tiedon tasot

8.12.2014 22

Data

Informaatio

Tietämys

Lähde: [Laihonen et al. 2013; Tuomi 1999; Thierauf 1999; Ackoff 1989]

Page 23: Analytiikka toiminnan kehittämisessä

Tiedon tasot esimerkein

avattuna

8.12.2014 23

Informaatio Data Tietämys Ymmärrys

A X1 X2

1 1 300

2 0 159

… … …

100 1 501

A X1 X2

1 1 300

2 0 159

… … …

100 1 501

A = asiakasnumero

X1 = sukupuoli

(0=nainen, 1=mies)

X2 = kk-ostot

• ”Meillä on

tietokannassamme

100 asiakkuutta”

• ”85%

asiakkaistamme on

naisia”

• ”Keskimääräiset

kk-ostot ovat 250€”

• ”Suurin osa

asiakkaistamme on

naisia, vaikka

tuotteemme ovat

suunnattu

pääasiassa

miehille -?!@%!”

Lähde: [Väisänen 2011]

Page 24: Analytiikka toiminnan kehittämisessä

Tiedonhallinnan tasot

8.12.2014 24

Innovoiva

Erottuva

Arkistoiva

Mallinnus

Visualisointi

Ennustaminen

Optimointi

Raportointi

”Löytyisikö

täältä jotain?”

”Tiedän mitä

tarvitsen mutta

haluan tehdä

sen kilpailijoita

paremmin"

”Tätä tarvitaan

mutta tällä ei

erotuta"

Lähde: Informaatiosta kilpailuetua teollisuusyrityksiin [Valli & Ahlgren 2013]

tieto, joka on tallennettava esimerkiksi

määräysten perusteella

tieto, jonka avulla voidaan edistää ja

parantaa nykyistä liiketoimintaa

tieto, jonka avulla voidaan innovoida uutta

liiketoimintaa

Page 25: Analytiikka toiminnan kehittämisessä

Lähteitä

• Breuker, D. 2014. Towards Model-Driven Engineering for Big Data Analytics – An Exploratory Analysis of Domain-

Specific Languages for Machine Learning. 47th Hawaii International Conference on System Sciences.

• Davenport, T. H., Patil, D. J. 2012. Data Scientist. The Sexiest Job of the 21st Century. Harvard Business Review.

October 2012.

• Davenport, T. H. 2014. Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business

Review.

• Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Introduction to Big Data. Presented at HICSS-47, January

6, 2014, Waikoloa, Hawai’i.

• Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Big Data and Analytics. Presented at HICSS-47, January

6, 2014, Waikoloa, Hawai’i.

• Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Advanced Analytics – Issues and Challenges in the Global

Environment. 47th Hawaii International Conference on System Sciences.

• Hannula, M. 2005. Tieto- ja liiketoiminta. Tekniset välineet ja sovellukset. Luento 23.10.2005.

• Laihonen, H., Hannula, M; Helander, N; Ilvonen, I; Jussila, J; Kukko, M; Kärkkäinen, H; Lönnqvist, A; Myllärniemi,

J; Pekkola, S; Virtanen, P; Vuori, V; Yliniemi, T. 2013. Tietojohtaminen. Laitosraportti. Tampereen teknillinen

yliopisto.

• Laney, D. 3D Data Management: Controlling Data Volume, Velocity and Variety. Gartner. Retrieved 6 February

2001.

• Loukides, M. 2010. What is Data Science? O’ Reilly, Cambridge. http://www.kiwidatascience.it/wp-

content/uploads/2013/05/What_Is_Data_Science_.pdf

• Yli-Pietilä & Backman 2013. Management by analytics. Commercial and technical applications in the Big Data era.

Teradata

• Valli, K., Alhgren 2013. Informaatiosta kilpailuetua teollisuusyrityksiin. Teknologiateollisuus.

http://www.teknologiateollisuus.fi/file/16270/Informaatiostakilpailuetua.pdf.html

• Vilminko-Heikkinen, R., Pekkola, S. 2013. Establishing an Organization’s Master Data Management Function: A

Step-wise Approach. 46th Hawaii International Conference on System Sciences.

• Väisänen, J. 2011. Tiedonlouhinta. Luentomateriaali.

8.12.2014 25

Page 26: Analytiikka toiminnan kehittämisessä

Toiminnan kehittämisen eri

ulottuvuudet, mihin kaikkeen

data ja analytiikka taipuvat

8.12.2014 26

Page 27: Analytiikka toiminnan kehittämisessä

Raportoinnista operationaaliseen

data-analytiikkaan

8.12.2014 27

Raportit

RAPORTOIDAAN

MITÄ

tapahtui?

ANALYSOIDAAN

MIKSI

se tapahtui?

Ad hoc

BI työkalut

ENNUSTETAAN

MITÄ TULEE

tapahtumaan?

Ennustavat

mallit

OPERATIONALISOIDAAN

MITÄ ON

tapahtumassa nyt?

Linkki operatiivisiin

järjestelmiin

AKTIVOIDAAN

PISTETÄÄN

tapahtumaan

Automaattiset

linkitykset

STRATEGINEN ÄLYKKYYS

OPERATIONAALINEN ÄLYKKYYS

Lähde: mukaillen [Yli-Pietilä & Backman 2013]

Page 28: Analytiikka toiminnan kehittämisessä

Tiedonlouhinnan menetelmiä

8.12.2014 28

Suunnattu

Ei-suunnattu

Ad Hoc Strateginen

suunnittelu

Ennustaminen Segmentointi

Klusterointi

Visualisointi

OLAP

Neuroverkot

Regressio

Lähde: [Kudyba & Hoptroff, 2001; Väisänen, 2011]

Page 29: Analytiikka toiminnan kehittämisessä

Klusterointi

• Kuvailevaa tiedonlouhintaa / deskriptiivistä analytiikkaa

• Tavoitteena klusteroida (luokitella) datamatriisin

havainnot siten, että jokaisen klusterin sisällä olevat

havainnot ovat mahdollisimman homogeenisia, ja

jokainen klusteri mahdollisimman heterogeeninen

muiden klusterien kanssa

• Yleisiä käyttötarkoituksia

– asiakkaiden segmentointi

– myymälöiden ryhmittely menestyksen mukaan esimerkiksi

kolmeen ryhmään: menestyjiin, keskinkertaisiin ja huonoihin

[Niemijärvi 2013]

8.12.2014 29

Page 30: Analytiikka toiminnan kehittämisessä

Esimerkki hierarkkisesta

klusteroinnista

8.12.2014 30

Klusterien

lukumäärä

Klusterit

5 (1) (2) (3) (4) (5)

4 (1,2) (3) (4) (5)

3 (1,2) (3,4) (5)

2 (1,2) (3,4,5)

1 (1,2,3,4,5)

1 2 3 4 5

Lähde: [Väisänen, 2011]

Page 31: Analytiikka toiminnan kehittämisessä

Assosiaatiosäännöt

• Tarkoituksena löytää havaintoja, jotka esiintyvät yhdessä

useammin kuin muut

• Usein käytettyjä sovelluksia

– Ostoskorianalyysi, engl. market basket analysis (MBA), ks. Esim.

[Niemijärvi 2014]; [Ollikainen 2013]

– Klikkivirran analyysi, engl. web clickstream analysis (WCA)

[Paananen 2006]

• Normaaleista tietokannoista poiketen

assosiaatiosääntöjä tarkastellaan transaktio- ei

asiakaspohjaisesti

– MBA:ssa yksi datamatriisin rivi vastaa yhtä kassalla käyntiä

– WCA:ssa yksi datamatriisin rivi vastaa yhtä vierailua

verkkosivuille

8.12.2014 31

Page 32: Analytiikka toiminnan kehittämisessä

Assosiaatiosäännöt

• Assosiaatiosääntö on todennäköisyyteen perustuva

lausuma tiettyjen tapahtumien samanaikaisesta

tapahtumisesta:

• JOS A=1 ja B=1, NIIN (tietyllä todennäköisyydellä p) C=1

• Todennäköisyys, että ostetaan tavara X, kun tavara Y on ostettu: X → Y

• Esim. (Maito & Tee) → Keksejä (assosioaatiosääntö)

• Säännön oikealla puolella yleensä vain yksi tekijä

• Säännön vasemmalla puolella harvoin kolmea tekijää enempää (3. asteen sääntö)

• Todennäköisyydet tavaroiden ostamiselle saadaan jakamalla ostotapahtumien esiintymistiheys kaikkien ostotapahtumien lukumäärällä

8.12.2014 32

Lähde: [Väisänen, 2011]

Page 33: Analytiikka toiminnan kehittämisessä

• Tuki (”Support”) {A → B} = P(A ja B)

– Todennäköisyys, että tuotteet A ja B löytyvät satunnaisesta ostoskorista. Jos 40%

ostoksista sisältää sekä maitoa että leipää, tuki {maitoa→ leipää} = 0.4

• Symmetrinen, eli tuki {leipää → juustoa} = tuki {juustoa → leipää}

• Jos tuki kovin alhainen, ei säännöllä välttämättä ole kovin suurta käytännön

merkitystä

• Luottamus (”Confidence”) {A → B} = tuki {A → B} / tuki {A}

– Todennäköisyys, että satunnaisesta ostoskorista löytyy tuote B, jos siellä on tuote A

– Jos 80 % ostoksista sisältää leipää, mutta vain 40 % sisältää sekä leipää että maitoa,

luottamus {leipää → maitoa} = 0.4 / 0.8 = 0.5

– Luku ei välttämättä ole symmetrinen

• Noste (”Lift”) {A → B} = luottamus {A → B} / tuki {B}

– Normalisoitu luku, joka ilmaisee, kuinka paljon tuotteen A ostaminen vaikuttaa tuotteen

B ostamiseen

– Jos luottamus {leipää → maitoa} = 0.5 ja 40 % ostoksista sisältää maitoa, noste

{leipää → maitoa} = 0.5 / 0.4 = 1.25

– Eli henkilöt, jotka ostelevat leipää, ostelevat 1.25-kertaisesti maitoa verrattuna koko

porukkaan

8.12.2014 33

Assosiaatiosäännöt

Lähde: [Väisänen, 2011]

Page 34: Analytiikka toiminnan kehittämisessä

Regressio

• Lineaarinen regressio auttaa ennustamaan

toisen muuttujan arvoja toisen muuttujan

arvoilla

• Logistisen regression avulla voidaan

selittää/ennustaa binääristä muuttujaa

• Kuinka mallinnuksen avulla ennustetaan

asiakkaan ostotodennäköisyys? [Ollikainen

2014]

8.12.2014 34

Page 35: Analytiikka toiminnan kehittämisessä

Puumallit

• Yhdistetään regressio ja klusterointi

– Jaetaan havaintoja osajoukkoihin (klusterointi) tietyn

ennustettavan muuttujan mukaan (regressio)

• Käytetään usein asiakkaiden luokitteluun, kun tiedetään,

minkä ominaisuuden mukaan halutaan luokitella

– Puhelinoperaattorilla tiedossa, että 70 % asiakkaista maksaa

laskunsa myöhässä, ja nyt halutaan tietää, keitä nämä ihmiset

oikein ovat, ja miten voidaan ennustaa, maksaako uusi asiakas

mahdollisesti laskunsa ajoissa

– Asiakastiedoista valitaan ne muuttujat, joiden arvellaan olevan

keskeisessä roolissa. Oletetaan, että seuraavat muuttujat

voisivat vaikuttaa siihen, maksaako asiakas laskunsa ajoissa (0=

ei maksa ajoissa, 1= maksaa ajoissa)

1. Keskimääräinen puhelimen käyttöaste (min/kk)

2. Ikä (1 = alle, 30v. 2 = yli 30v.)

3. Siviilisääty (1 = naimaton, 2 = naimisissa)

8.12.2014 35

Lähde: [Väisänen, 2011]

Page 36: Analytiikka toiminnan kehittämisessä

8.12.2014 36

• Puhelinoperaattoriesimerkki jatkuu… – Alussa meillä on kaikki havainnot (10 000) yhdessä, joista

siis 3 000 maksaa laskunsa ajoissa

– Puumalli jaottelee kaikki 10 000 havaintoa parhaiten

kohdemuuttujaa (laskun ajoissa maksu) luokittelevalla

muuttujalla

1: 30% 3000

0: 70% 7000

Yht. 100% 10000

1: 30% 3000

0: 70% 7000

Yht. 100% 10000

1: 11.7% 460

0: 88.3% 3480

Yht. 100% 3940

1: 41.9% 2540

0: 58.1% 3520

Yht. 100% 6060

Ikä

2 1

Ikä (1 = alle, 30v. 2 = yli 30v.)

Puumallit

Lähde: [Väisänen, 2011]

Page 37: Analytiikka toiminnan kehittämisessä

8.12.2014 37

1: 30% 3000

0: 70% 7000

Yht. 100% 10000

1: 11.7% 460

0: 88.3% 3480

Yht. 100% 3940

1: 41.9% 2540

0: 58.1% 3520

Yht. 100% 6060 2 1

1: 67.1% 490

0: 32.9% 240

Yht. 100% 730

1: 38.5% 2050

0: 61.5% 3280

Yht. 100% 5330

1: 9.3% 310

0: 90.7% 3030

Yht. 100% 3340

1: 25.0% 150

0: 75.0% 450

Yht. 100% 600

Puh.

käyttö

Ikä

Siviili-

sääty 1 2 1 2

• Puhelinoperaattoriesimerkki jatkuu…

• Lopullinen malli voi näyttää tältä

Siviilisääty (1 = naimaton, 2 = naimisissa)

Ikä (1 = alle, 30v. 2 = yli 30v.)

Keskimääräinen puhelimen käyttöaste (1 = <300, 2 = >300 )

Puumallit

Lähde: [Väisänen, 2011]

Page 38: Analytiikka toiminnan kehittämisessä

Puumallit

• Mitä saatiin selville?

– 91 % alle kolmekymppisistä naimattomista ei

maksa laskuaan ajoissa

– Ainoa ryhmä, joka maksaa laskunsa

ennemmin ajoissa kuin myöhässä on yli

kolmekymppiset alle 300min/kk puhujat

– Ikä on silti tärkein kriteeri

8.12.2014 38

Lähde: [Väisänen, 2011]

Page 39: Analytiikka toiminnan kehittämisessä

Ennakoiva analytiikka

• Millä ohjelmistoilla ennakoiva analytiikka onnistuu ja millä ei?

– Onnistuu: RapidMiner, SAS, SPSS, MS analysis services, R, AnyLogic..

– Ei onnistu: IBM Cognos, Qlikview, Business Objects, MS reporting services,

Tableau, Oracle OBIEE…

• Vinkki: Jos myyntimies vakuuttaa, että heidän softa tekee

ennakoivaa analytiikkaa, niin kysy mm. seuraavien

ennustemenetelmien sisältymisestä ohjelmistoon:

– Luokittelumuuttujille - naive bayes, neuroverkko, logistinen regressio,

päätöspuut..

– Jatkuville muuttujille - erilaiset regressioanalyysit, neuroverkot..

• Jos ei löydy, niin kyseessä lienee raportointiohjelmisto.

• Milloin kannattaisi investoida ennakoivaan analytiikkaan?

– Silloin kun sinulla on edellytyksiä hyödyntää tuloksia, esim.

• Voit toteuttaa ennakoivan huollon ennen laitteen vikaantumista

• Voit torjua asiakaspoistumaa tai ostoskorin hylkäämistä aktiivisilla toimenpiteillä

• Kykenet kohdistettuun myyntiin ja markkinointiin..

8.12.2014 39

Muokattu lähteestä: [Laukkanen]

Page 40: Analytiikka toiminnan kehittämisessä

Analytiikka web-sivujen seurannassa,

hakukoneoptimointi, sosiaalisen median

hyödyntäminen toiminnan

kehittämisessä ja asiakasanalyysissa

8.12.2014 40

Page 41: Analytiikka toiminnan kehittämisessä

Hakukoneoptimointi

• Esimerkkejä analytiikkatyökaluista

hakukoneoptimointiin

– Google Analytics

– Google Webmaster Tools

– ClickHeat

– ks. esim. Konsepton blogi (Paltamaa 2010)

8.12.2014 41

Page 42: Analytiikka toiminnan kehittämisessä

Sosiaalisen median analytiikka esimerkki

8.12.2014 42

Impressions

-number of times users saw the Tweet on

Twitter

Engagements

-number of times users have interacted with a

Tweet, e.g. clicks, retweets, replies…

Page 43: Analytiikka toiminnan kehittämisessä

Myynti ja web-analytiikka

8.12.2014 43

Prospektit Suspektit

Liidit

Liidit

Liidit

Awareness Interest Desire Action

Impressions Bounce rate Engagements Shopping area

traction Shopping cart

actions Payments Repeat visits

Asiakkaat

Satisfaction

Recommendations

Page 44: Analytiikka toiminnan kehittämisessä

Starbucks hinnoittelun korjaaminen

twiittien perusteella

8.12.2014 44

Lähde: [Kaisler 2014] Introduction to Big Data

• Huoli siitä kuinka asiakkaat

pitävät uuden kahvituotteen

mausta

• Seurattiin sosiaalista mediaa

• Maku oli hyvä, mutta hinta oli

liian suuri

• Hinta laskettiin saman päivän

aikana

Page 45: Analytiikka toiminnan kehittämisessä

Linkkejä lisätietoon

8.12.2014 45

Twitter: @Noviresearch ja @tietojohtaminen

Novi tutkimuskeskuksen kotisivut:

https://www.tut.fi/novi/

Slideshare: http://www.slideshare.net/Noviresearch

YouTube: http://youtube.com/noviresearch