waltteri turunen pro gradu -tutkielma · tyyn. verkko-opetus tuottaa dataa, jota voidaan...

80
Datatiede verkko-opetuksessa Waltteri Turunen Pro gradu -tutkielma Tietojenkäsittelytieteen laitos Tietojenkäsittelytiede Heinäkuu 2016

Upload: others

Post on 17-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

Datatiede verkko-opetuksessa

Waltteri Turunen

Pro gradu -tutkielma

Tietojenkäsittelytieteen laitos

Tietojenkäsittelytiede

Heinäkuu 2016

Page 2: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

i

ITÄ-SUOMEN YLIOPISTO, Luonnontieteiden ja metsätieteiden tiedekunta, Kuopio

Tietojenkäsittelytieteen laitos

Tietojenkäsittelytiede

Turunen, Jon Lauri Waltteri: Datatiede verkko-opetuksessa

Pro gradu -tutkielma, 78 s.

Pro gradu -tutkielman ohjaaja: FT Maija Marttila-Kontio

Heinäkuu 2016

Tiivistelmä: Internetin ja tieto- ja viestintätekniikan myötä lisääntyneet verkko-oppi-

misympäristöt asettava uusia mahdollisuuksia ja haasteita opetukselle. Samalla lisään-

tyneet datamäärät ja niiden analysointimahdollisuudet ovat johtaneet datatieteen syn-

tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä

tutkielma on kirjallisuuskatsaus, jossa kerrotaan näiden kahden alan kosketuspinnasta.

Tutkielma käsittelee ensimmäisessä kappaleessa verkko-opetusta alkaen sen histori-

asta 1960-luvulta tähän päivään saakka, jonka jälkeen esitellään verkko-opetuksen teo-

riaa. Lopuksi käydään läpi verkko-opetuksen hyötyjä ja haittoja. Toisessa kappaleessa

keskitytään datatieteeseen. Datatieteestä pyritään muodostamaan kokonaiskuva esitte-

lemällä sen eri määrittelyt ja sijainti suhteessa muihin tutkimusaloihin. Kerrotaan

myös datatieteen historiasta ja nykytilasta, etenkin sen yleistymisen syistä. Tämän jäl-

keen esitellään joitain sen käyttökohteista ja käydään läpi datatieteen prosessi ja kehi-

tyssuunnat. Viimeisessä kappaleessa kerrotaan, kuinka datatiedettä hyödynnetään

verkko-opetuksessa. Ensin tutkitaan miksi datatiedettä pitäisi soveltaa verkko-opetuk-

seen, sitten esitellään, miten sitä sovelletaan ja mihin sitä verkko-opetuksessa voidaan

soveltaa. Lopuksi käsitellään muutama merkittävä tapaustutkimus, katsaus markki-

noilla oleviin tuotteisiin ja tulevaisuuden odotuksiin.

Avainsanat: datatiede verkko-opetuksessa, datatiede, verkko-opetus, oppimisen ana-

lytiikka, koulutustiedonlouhinta

ACM-luokat (ACM Computing Classification System, 1998 version): J.1, K.3.1

Page 3: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

ii

UNIVERSITY OF EASTERN FINLAND, Faculty of Science and Forestry, Kuopio School of Computing

Computer Science

Turunen, Jon Lauri Waltteri: Data science in e-learning

Master’s Thesis, 78 p.

Supervisor of the Master’s Thesis: PhD Maija Marttila-Kontio

July 2016

Abstract: The internet along with information and communication technologies have

given rise to e-learning environments which present new opportunities and challenges

for education. At the same time increased amounts of data and the capabilities to ana-

lyze it have led to the emergence of data science. E-learning generates data that can be

processed with the methods of data science. This study is a literature review, the pur-

pose of which is to explore the contact surface between the two sectors. The thesis

starts with tracing the origins of e-learning from its history in 1960s to the present day

and, after that, we go through the theory behind e-learning and end up with the de-

scription its advantages and disadvantages. The second section will focus on data sci-

ence and it starts by defining data science and its relation to other scientific disciplines.

It continues on to describe the history and current state of data science, particularly the

reasons of recent emergence, and the section ends with the presentation of some of its

uses and going through the process of data science and its future trends. The final

section explains how data science can be used with e-learning. First we go through the

motivation of applying data science to e-learning, then discuss how and where specif-

ically to apply it. Finally, we go through a few important case studies, followed by an

overview of the products on the market and we end with some future expectations.

Keywords: data science in e-learning, data science, e-learning, learning analytics, ed-

ucational data mining

CR Categories (ACM Computing Classification System, 1998 version): J.1, K.3.1

Page 4: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

iii

Esipuhe

Tämä tutkielma on tehty Itä-Suomen yliopiston Tietojenkäsittelytieteen laitokselle ke-

väällä 2016. Tahdon kiittää ohjaajaani Maija Marttila-Kontiota hyvästä ohjauksesta ja

kirjoittajan takakireän deadlinen sietämisestä.

Suurin kiitos tästä työstä kuuluu kuitenkin vaimolleni Tuijalle, joka pyöritti kotita-

loutta vailla valituksen sanaa aviomiehen istuessa iltaan asti napit korvilla tietoko-

neella näppäimistöä nakuttamassa oltuaan ensin pitkän päivän lorvailemassa toimis-

tolla syöden työpaikkalounaita, kun perheelle oli tarjolla vain haaleaa makaronivelliä.

Pahoitteluni myös kahdelle tyttärelleni, joilla ei viikkokausiin ollut isää ennen iltaseit-

semää. Viimeiseksi haluaisin kiittää Spotify-suoratoistopalvelua, joka tuotti mainion

Electronic Study Music -soittolistan, jonka avulla olen saanut työrauhan niin yliopis-

tolla ja anoppilassa kuin kotonakin ja auton kyydissä.

Vuorela, Heinäkuu 2016

Waltteri Turunen

Page 5: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

iv

Lyhenneluettelo

AR Augmented Reality; lisätty todellisuus.

CD-ROM Compact Disc - Read-Only Memory. Tietokoneissa käytettävä tiedon

talletuslevy, jota voi ainoastaan lukea.

EDM Educational Data Mining; koulutustiedonlouhinta

ITS Intelligent Tutoring System; älykäs opetusjärjestelmä

Jisc Brittiläinen ei-kaupallinen yhdistys. Entinen Joint Information Systems

Committee.

KPI Key Performance Indicator; keskeinen suorituskykymittari

LA Learning Analytics; oppimisen analytiikka

LAK Learning Analytics and Knowledge. Ks. LA

LMS Learning Management System; oppimisen hallintajärjestelmä

MOOC Massive Open Online Course; kaikille avoin verkkokurssi

ROI Return On Investment; sijoitetun pääoman tuotto

SIS Student Information System; opiskelijatietojärjestelmä

SNA Social Network Analysis; sosiaalisten verkkojen analysointi

VR Virtual Reality; virtuaalitodellisuus.

Page 6: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

v

Sisällysluettelo

1 Johdanto ...................................................................................................... 1

2 Verkko-opetus ............................................................................................. 3

2.1 Verkko-opetuksen historiaa ja nykytilanne ........................................ 3 2.2 Verkko-opetuksen teoriaa ................................................................... 7

2.2.1 Oppimiskäsitykset ............................................................... 7 2.2.2 Pedagogisia malleja .......................................................... 10

2.2.3 Verkko-oppimisympäristöjen eri tasot .............................. 13

2.2.4 Oppimisaihiot .................................................................... 13 2.3 Verkko-opetuksen hyötyjä ja haittoja ............................................... 14

2.3.1 Hyötyjä .............................................................................. 14 2.3.2 Haittoja .............................................................................. 15

3 Datatiede ................................................................................................... 17

3.1 Määritelmät ....................................................................................... 17

3.1.1 Tiedon eri tasot ................................................................. 17 3.1.2 Big data ............................................................................. 19

3.1.3 Datatiede ........................................................................... 20 3.2 Datatieteen historia ja nykytila ......................................................... 23

3.2.1 Datatieteen juuret .............................................................. 23

3.2.2 Syyt yleistymiselle ............................................................ 24

3.3 Datatieteen käyttökohteet ................................................................. 25 3.4 Datatiede prosessina ......................................................................... 28

3.4.1 Kysymyksen asettelu ........................................................ 29

3.4.2 Tiedon hankinta ................................................................ 30 3.4.3 Tiedon puhdistaminen ....................................................... 30

3.4.4 Kuvaileva analytiikka ....................................................... 31 3.4.5 Ennustava analytiikka ....................................................... 32 3.4.6 Tulosten havainnollistaminen ja johtopäätösten tekeminen33

3.5 Datatieteen kehityssuuntia ................................................................ 35

4 Datatiede verkko-opetuksessa ................................................................... 37

4.1 EDM ja LAK .................................................................................... 37 4.2 Sovellusalat ....................................................................................... 39

4.2.1 Opiskelijan tietämyksen mallintaminen ............................ 39

4.2.2 Käyttäytymisen mallintaminen ......................................... 40 4.2.3 Kokemuksen mallintaminen ............................................. 41

4.2.4 Opiskelijan profilointi ....................................................... 41 4.2.5 Aihealueen mallintaminen ................................................ 41 4.2.6 Oppimisaihioiden ja pedagogisen mallin analysointi ....... 42

4.2.7 Trendianalyysi .................................................................. 42 4.2.8 Mukautuminen ja yksilöllistäminen.................................. 42

4.3 Hyödyt .............................................................................................. 43 4.3.1 Opiskelun laatu ................................................................. 43

4.3.2 Opetuksen laatu ................................................................. 43

Page 7: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

vi

4.3.3 Opiskelijapysyvyyden parantaminen ................................ 44

4.3.4 Kustannustehokkuus ......................................................... 45 4.4 Käytäntö ............................................................................................ 45

4.4.1 Menetelmät ....................................................................... 45 4.4.2 Infrastruktuuri ................................................................... 49 4.4.3 Työkalut ............................................................................ 50

4.4.4 Rajoitteet ........................................................................... 51 4.5 Esimerkkejä datatieteen hyödyntämisestä verkko-opetuksessa ........ 52

4.5.1 Purduen yliopisto .............................................................. 52 4.5.2 Nottingham Trentin yliopisto ............................................ 54 4.5.3 PeT-työkalu ....................................................................... 56

4.6 Datatiedettä hyödyntäviä verkko-opetuksen tuotteita ....................... 57 4.7 Datatieteen ja verkko-opetuksen yhteinen tulevaisuus ..................... 58

5 Pohdinta .................................................................................................... 60

Viitteet .............................................................................................................. 63

Page 8: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

1

1 Johdanto

Nykyään lähes jokainen koulutuslaitos hyödyntää opetuksessaan tietoverkkoja, eten-

kin internetiä. Verkko-opetus on suosittua, koska se mahdollistaa helpon tiedonjaka-

misen sekä aika- ja paikkariippumattoman opiskelun. Joustavalla opiskelulla helpote-

taan opiskelua, koska opiskelijoiden ja opettajien ei tarvitse olla enää samassa paikassa

vaan kukin voi osallistua opiskeluun, miten ja mistä haluavat. Vaikka jokainen voikin

osallistua opetukseen eri paikasta, verkko-opetus kuitenkin parantaa yhteisöllistä op-

pimista sosiaalisten työkalujen kautta. (Tervo, 2012) Verkko-opiskelu tapahtuu

verkko-oppimisympäristöissä, joissa tapahtuvista toiminnoista voidaan tallentaa dataa

myöhempää jatkokäsittelyä varten.

Datan määrä maailmassa kasvaa räjähdysmäisesti. 90% maailman datasta on syntynyt

viimeisen kahden vuoden aikana ja datan määrän on ennustettu kaksinkertaistuvan vii-

den vuoden sisällä. (B. Walker, 2015) Datan määrän kasvu ja sen analysointimahdol-

lisuuksien parantuminen ovat nostaneet datatieteen muodikkaaksi ilmiöksi. Datatiede

on uusi tieteenala, joka sijaitsee tilastotieteen, ohjelmoinnin ja alakohtaisen osaamisen

kohtaamispisteessä. Sen avulla voidaan saavuttaa merkittäviä hyötyjä lähes alasta riip-

pumatta. Sen avulla voi muun muassa tehostaa liiketoimintaa, parantaa julkista liiken-

nettä, vähentää potilaskuolleisuutta sekä ennustaa epidemioiden puhkeamista.

Datatiedettä sovelletaan verkko-opetuksessa opiskelijan tietämyksen, käyttäytymisen

ja opiskelukokemuksen mallintamiseen, opiskelijan profilointiin ja opetuksen aihealu-

een mallintamiseen. Lisäksi sitä voidaan käyttää oppimisaihioiden ja pedagogisten

mallien analysointiin, trendianalyysiin sekä mallianalyysiin. (Bienkowski, Feng, &

Means, 2012) Datatieteen avulla on mahdollista nostaa opiskelun ja opetuksen laatua,

parantaa opiskelijapysyvyyttä sekä opetuksen kustannustehokkuutta. (Sclater,

Peasgood, & Mullan, 2016)

Tutkielman luvussa 2 esitellään verkko-opetuksen historiaa ja nykytilannetta, sen teo-

reettista taustaa sekä sen hyötyjä että haittoja. Luvussa 3 pyritään määrittelemään da-

Page 9: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

2

tatiede terminä, datatieteen historiaa ja miksi se on yleistynyt juuri nyt. Luvussa käy-

dään myös läpi datatieteen eri käyttökohteita ja tutustutaan tarkemmin sen prosessiin,

kunnes lopulta esitetään datatieteen mahdollisia kehityssuuntia. Datatieteen sovellusta

itse verkko-opetukseen tutkitaan luvussa 4. Siinä esitellään ensin kaksi merkittävintä

tutkimusalaa aiheesta, jonka jälkeen esitellään saavutettavat hyödyt. Seuraavaksi ker-

rotaan käytännön soveltamisesta sekä sovellusaloista eli mihin kaikkeen datatiedettä

voi verkko-opetuksessa käyttää. Lopuksi esitellään muutama tapaustutkimus ja kau-

pallinen tuote sekä luodaan katsaus tulevaan. Tutkielma päättyy aiheen pohdintaan ja

ajatuksiin sen tulevaisuudesta.

Page 10: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

3

2 Verkko-opetus

Tässä luvussa määritellään verkko-opetuksessa käytettävät termit. Luku 2.1 kertoo

verkko-opetuksen historiasta ja nykytilanteesta ja luku 2.2 käsittelee verkko-opetuksen

teoriaa. Luvussa 2.3 punnitaan verkko-opetuksen hyötyjä ja haittoja.

Verkko-opetuksella tarkoitetaan suunnitelmallista tietoverkkojen, erityisesti internetin

hyödyntämistä opetuksessa ja opiskelussa (Nevgi et al., 2005; Tella et al., 2001). Opis-

kelija on verkon kautta vuorovaikutuksessa toisten opiskelijoiden, opettajan, oppima-

teriaalien tai muiden aineistojen ja palveluiden kanssa. Pedagogiikka tarkoittaa tapaa,

jolla opetus järjestetään, sekä sen kasvatuksellisia periaatteita (Hellström, 2008), joten

verkkopedagogiikan voidaan käsittää tarkoittavan tapaa, jolla verkko-opetus järjeste-

tään sekä sen järjestämisen teoreettista sisältöä.

Tässä yhteydessä tietoverkolla tarkoitetaan tietokoneiden ja tietoliikennelaitteiden

muodostamaa fyysistä kokonaisuutta, jonka avulla on mahdollista siirtää informaa-

tiota. Verkkokäsitteeseen liittyy myös käsitys virtuaalisista toiminnoista, jolloin asioi-

den tekeminen ei edellytä fyysistä läsnäoloa tai ympäristöä (Lepistö, 2008).

Oppimisympäristöksi kutsutaan paikkaa tai yhteisöä, jossa ihmisillä on käytössään eri-

laisia resursseja, joiden avulla he voivat oppia ymmärtämään erilaisia asioita ja kehit-

tämään mielekkäitä ratkaisuja erilaisiin ongelmiin (Manninen, 2001). Esimerkiksi

luokkahuone on perinteinen fyysinen oppimisympäristö. Verkko-opetus tapahtuu

verkko-oppimisympäristössä, joka usein sisältyy oppimisen hallintajärjestelmään

(eng. Learning Management System, LMS), jonka avulla voi hallinnoida ja seurata

opetusta sekä tuottaa siitä raportteja. (Ryann K. Ellis, 2010)

2.1 Verkko-opetuksen historiaa ja nykytilanne

Verkko-opetus sai alkunsa 1960-luvulla, kun PLATO (Programmed Logic for Auto-

matic Teaching Operations) kehitettiin Illinoisin yliopistossa Yhdysvalloissa (Bitzer,

Page 11: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

4

Lyman, & Easley, 1966). Se oli yksi ensimmäisistä tietokoneita hyödyntävistä oppi-

misympäristöistä ja se oli käytössä lähinnä akateemisissa laitoksissa. PLATO mahdol-

listi tuhansien opiskelijoiden samanaikaisen ja yksilöllisen opetuksen paikallisesti. Se

käytti aluksi näyttönä televisiota ja erityistä näppäimistöä komentojen antamiseksi.

PLATO:ssa esiintyi monia nykyisten oppimisympäristöjen ominaisuuksia, kuten säh-

köinen oppikirja, tiedonhakumahdollisuus, tukijärjestelmä avun saamiseksi sekä hen-

kilökohtaiset muistiinpanot. Siihen sisältyi myös suoritusten ja toimintojen tallentumi-

nen myöhempää tilastollista analyysiä varten.

1980-luvun alussa julkaistiin ensimmäiset oppimisympäristöt, joihin sai etäyhteyden

modeemin avulla. Niitä hyödynnettiin mm. Ison-Britannian The Open University -yli-

opistossa. Nämä ensimmäiset varsinaiset verkko-oppimisympäristöt pohjautuivat vi-

deotex-tekniikkaan, joka mahdollisti yhteyden ottamisen keskustietokoneeseen puhe-

linlinjoja pitkin käyttäen televisiota näyttönä – aivan kuten kaksisuuntainen teksti-tv.

Myöhemmin näihin ympäristöihin voitiin ottaa yhteyttä Internetin kautta omalta koti-

koneelta.

Yrityksissä sähköiset oppimisympäristöt alkoivat yleistyä 1980-luvun puolessavälissä

CD-ROM (Compact Disc - Read-Only Memory) -teknologian myötä. CD-levyt olivat

paljon halvempia kuin kouluttajat ja kursseja oli helppo levittää, mutta CD-levyihin

perustuvilla kursseilla oli kuitenkin huikea keskeyttämisaste eikä tietokoneen edessä

istuminen ollut työntekijälle kiinnostavaa – kouluttaja ei ollut läsnä auttamassa tai mo-

tivoimassa opiskelijaa. (Cross & Jay, 2004)

1990-luvun lopussa opetuksen sisältöä alettiin jakaa Internetin välityksellä ja opetus

voitiin järjestää opetuspaikasta tai -ajasta riippumatta. Välitystapa mahdollisti myös

räätälöidyt koulutusportaalit, suoritusten seurannan, uutiskirjeet ja keskusteluryhmät

(Cross, 2004). Internetin toiminnallisuuden parantuminen mahdollisti myös multime-

dian ja verkkokameran käytön opetuksessa. Teknologian kehittyessä kustannukset ale-

nivat ja se mahdollisti opetuksen entistä laajemmalle yleisölle. Käyttäjät saattoivat

suorittaa tutkintoja eri yliopistoista ja sivistää itseään kursseilla joustavasti ja riippu-

mattomasti kotoaan käsin heille sopivaan kellonaikaan.

Page 12: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

5

Yritysmaailmassa työntekijöiden kouluttamiseksi alettiin myös käyttää verkko-ope-

tusmallia. Niin uudet kuin kokeneetkin työntekijät saattoivat nyt helposti kerrata jo

opittuja asioita ja oppia uutta näin lisäten yrityksen henkistä pääomaa. Tämä olikin

tärkeää etenkin IT-sektorin kasvaessa, sillä sen työkalut vanhenivat suhteellisen nope-

asti, jolloin kouluttamisesta tuli entistä tärkeämpää.

Suomessa Internetiä alettiin hyödyntää koulutukseen 1990-luvun puolivälissä

(Taipalmaa, 2008). Alta Vista Forum oli yksi ensimmäisistä Internetiä hyödyntävistä

oppimisympäristöistä. Se oli eräänlainen yhdistelmä uutisryhmää ja sähköpostilistaa,

jonka avulla voitiin luoda keskusteluketjuja ja -arkistoja. Se mahdollisti samanaikai-

sen, ajasta riippumattoman viestinnän monelle opiskelijalle ja sitä käytettiin yleisen

viestinnän lisäksi henkilökohtaiseen opastukseen.

2010-luvulla verkko-opetukseen tuotiin myös sosiaalinen elementti. Yhteisöt tarjoavat

opiskelijalle tukea ja paikan, jossa vaihtaa ajatuksia opetuksesta. Yhteisöt voivat sijaita

joko itse verkko-oppimisympäristössä tai kaikille avoimessa sosiaalisessa verkossa.

Opetuksessa voitiin myös hyödyntää mm. blogeja ja wikejä keskustelun ja vuorovai-

kutteisuuden lisäämiseksi.

2010-luvulla myös MOOC- (eng. Massive Open Online Course) -kurssien tarjonta li-

sääntyi vahvasti. Ne tarjoavat Internetin välityksellä kaikille avoimia yliopistotason

kursseja. Näin opiskelija itse voi määritellä mitä haluaa opiskella ja kuinka paljon

käyttää siihen aikaa. Yleensä MOOC-kurssit eivät aluksi olleet hyväksiluettavissa pe-

rinteisten oppilaitosten opintokokonaisuuksiin, mutta sittemmin monet opetuksen jär-

jestäjät ovat tuoneet tarjolle maksullisia suoritustodistuksia ja jopa kokonaisia tutkin-

toja.

Eräitä tämän hetken tunnetuimpia MOOC-tarjoajia ovat Coursera, Udacity ja edX.

Coursera on niistä suurin tarjoten 1764 yliopistotason kurssia 147 yhteistyötä tekevien

yliopistojen ja instituuttien tarjonnasta. Opiskelijoita sillä on ollut yli 17 miljoonaa.

Suurin osa Courseran kursseista on ilmaisia, mutta se tarjoaa myös maksullisia kurs-

sikokonaisuuksia sertifikaatteineen, joista voi saada myös opintopisteitä akateemisiin

oppilaitoksiin. Udacity keskittyy enemmän ammattitaidon lisäämiseen ilmaisilla ja

Page 13: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

6

maksullisilla kursseilla. Sen erityinen innovaatio on kurssimaksun vaativat ”nanotut-

kinnot”, joille he lupaavat työllistämistakuun – jos opiskelija ei saa työpaikkaa tietyn

ajan kuluessa, hän saa kurssimaksut takaisin. Sen kurssitarjonta käsittää 134 kurssia

19 eri yhteistyökumppanilta, esimerkiksi Googlelta, Amazonilta ja Facebookilta. edX

on voittoa tavoittelematon järjestö, joka tarjoaa yli 800 avointa yliopistotason kurssia

yli 88 kumppanilta. Opiskelijoita on ollut yli 6 miljoonaa ja kurssi-ilmoittautumisia yli

19 miljoonaa.

Tällä hetkellä Suomessa MOOC -kursseja järjestävät Aalto-yliopisto ja Helsingin yli-

opiston tietojenkäsittelytieteen laitos. Kursseja on yhteensä 12 kappaletta tietojenkä-

sittelyn ja matematiikan alalta. Ne ovat ilmaisia kaikille ja ne voidaan myös hyväksi-

lukea laitosten opinnoissa. Osa Helsingin yliopiston MOOC-kursseista toimii myös

osittaisena pääsykokeena laitokselle. (Helsingin yliopisto, 2016)

Suomen Virtuaaliammattikorkeakoulu tarjoaa AMK-tason verkko-opetusta. Se on ol-

lut toiminnassa vuodesta 2000 lähtien ja se tarjoaa vuosittain n. 800 ammattikorkea-

koulujen järjestämää opintojaksoa, jotka tarjotaan enimmäkseen verkko-opintoina.

Opinnot ovat avoinna vain AMK-tutkintoa suorittaville tai vaihto-opiskelijoille.

Suosituimmat verkko-oppimisympäristöt tällä hetkellä ovat Blackboard, De-

sire2Learn, Moodle, Sakai ja Pearson. Nykyiset verkko-oppimisympäristöt tarjoavat

työkaluja, joilla opiskelijoiden hallinta, seuranta ja rekisteröinti on erotettu yksittäi-

sistä kursseista. Opiskelijakohtainen suoritusten yleinen ja yksityiskohtainen rapor-

tointi mahdollistaa arvioinnin opiskelun vaikutuksesta tulevaan suoritustasoon. Tätä

suoritustietoa voi hyödyntää esimerkiksi ROI-laskennassa (Return Of Investment) yri-

tysmaailmassa. Erilaisen suoritusdatan keräämistä ja sen raportointia pidetään kilpai-

luvalttina verkko-oppimisympäristöjen välisessä kilpailussa. (Stone & Zheng, 2016)

Tällä hetkellä 93% korkeakouluista käyttävät verkko-oppimisympäristöjä ja 65% pi-

tävät verkko-opetusta kriittisenä pitkän aikavälin suunnitelmilleen. Työmarkkinoiden

kasvavat koulutusvaatimukset vaativat tulevaisuuden verkko-oppimisympäristöiltä

avoimuutta, oppijakeskeisyyttä ja joustavuutta. Tämän lisäksi niiden pitää perustua

Page 14: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

7

yhteistyöhön, mahdollistaa suoritustason mittaukset ja raportointi sekä olla saatavilla

päätelaitteesta riippumatta. (Stone & Zheng, 2016)

2.2 Verkko-opetuksen teoriaa

Tässä luvussa käsitellään verkko-opetuksen teoreettista puolta. Ensin esitellään oppi-

miskäsitykset ja kuinka ne liittyvät verkko-opetukseen. Sen jälkeen esitellään muu-

tama verkko-opetukseen liittyvä pedagoginen malli, jonka jälkeen esitellään verkko-

oppimisympäristöjen eri tasot. Lopuksi esitellään oppimisaihio-käsite.

2.2.1 Oppimiskäsitykset

Opetus perustuu opettajan käsitykseen oppimisesta ja opetuksesta. Opettajan pedago-

ginen ajattelu ja opetuksen suunnittelu ja toteutus perustuvat erilaisiin oppimiskäsityk-

siin eli teoreettisiin malleihin siitä, miten ihminen oppii. Tässä luvussa esitellään be-

havioristinen, kognitiivinen, konstruktivistinen sekä realistinen oppimiskäsitys.

Behavioristinen oppimiskäsitys

Kuten perinteinen luokkahuoneopetus, myös varhainen verkko-opetus perustui beha-

vioristiseen oppimiskäsitykseen, joka painottaa passiivista lähestymistapaa oppimi-

seen (Greitzer, 2002). Se pohjautuu behaviorismiin, josta esimerkkinä käy kuuluisa

psykologi Pavlov ja hänen koiransa, jotka oppivat kuolaamaan kuullessaan kellon soi-

van. Behavioristinen oppimiskäsitys korostaa opettajan, sisällön ja materiaalin roolia

oppimisessa ja opiskelijaa pidetään opetuksen kohteena ja suorittajana (Ihanainen et

al, 2004). Tässä mallissa opetustavoitteet ovat tarkkaan määritelty, opettaja suodattaa

materiaalin valmiiksi ja opiskelija vastaanottaa tiedon passiivisesti. Keskeisiä periaat-

teita ovat lisäksi ärsyke – reaktio -kytkentä, oikeiden suoritusten vahvistaminen, vir-

heellisten vastausten nopea ohittaminen ja opetettavan aineksen jakaminen mitattaviin

osioihin.

Nykykäsityksen mukaan behavioristinen oppimiskäsitys on vanhentunut ja sille löytyy

parempiakin vaihtoehtoja (Lepistö, 2008). Verkko-opetuksessa se näyttäytyy liian

Page 15: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

8

suunnittelupainotteisena lähestymistapana opetuksen suunnitteluun. Odottamattomille

käänteille ei jätetä kehitystilaa eikä opiskelijakohtaista mukautumista tapahdu ja ope-

tuksessa keskitytään suoritettaviin tehtäviin eikä itse tehtävien tarkoitukseen. (Emin-

Martínez et al., 2014)

Kognitiivinen oppimiskäsitys

Behaviorismin lisäksi perinteisiin oppimisteorioihin luetaan kognitiivinen oppimiskä-

sitys (Raitala & Ylilehto, 2012). Se perustuu oppijan omiin kognitiivisiin prosesseihin

– oppija itse ohjaa omaa oppimistaan. Sen mukaan oppiminen ei ole pelkkää tiedon

varastointia ja ulkoisiin ärsykkeisiin reagoimista vaan ennemminkin se on tiedon han-

kintaa ja prosessointia. Eri asioita opitaan eri tavalla ja oppiminen on sosiaalista. Ope-

tuksen tarkoituksena tukea aktiivista oppimista ja opettajan ja opiskelijan välistä kom-

munikaatiota, lisätä opiskelijoiden välistä yhteistyötä ja antaa täsmällistä ja kannusta-

vaa palautetta. Opetuksessa otetaan myös huomioon erilaiset lahjakkuudet ja oppimi-

sen tavat sekä asetetaan tavoitteet korkealle (Lepistö, 2008). Verrattuna behavioris-

miin, oppijan rooli aktivoituu ja hän ottaa vastaan tietoa, tekee havaintoja, taltioi tietoa

valikoivasti ja tekee tulkintoja (Pylkkä, 2010). Opettajan roolina on vuorovaikutusten

ja kognitiivisten mallien kehittymisen ohjaaminen (Manninen, 2001).

Verkko-opetus mahdollistaa kustannustehokkaan tavan hyödyntää kognitiivisen oppi-

miskäsityksen periaatteita mm. vuorovaikutteisten, opiskelijakeskeisten oppimateriaa-

lien avulla. Oppimateriaaleihin voidaan lisätä esim. simulaatioita oikeista tilanteista,

joita voi kokeilla ratkaista ja kerrata yhä uudestaan. (Greitzer, 2002)

Konstruktivistinen oppimiskäsitys

Konstruktivismi on muunnelma kognitivismista ja perustuu humanistiseen ihmiskäsi-

tykseen, tiedon suhteellisuuden käsitykseen ja näkemykseen oppijasta aktiivisena tie-

donrakentajana (Auvinen et al, 2007). Viimeisen kahden vuosikymmenen aikana huo-

mio on opetuksessa siirtynyt juuri konstruktivismiin, koska tukee aktiivista oppimista

tiedon rakentamisen avulla. (Koohang, Riley, Smith, & Schreurs, 2009)

Page 16: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

9

Humanistisen ihmiskäsityksen mukaan ihmisen kyky ohjata omaa oppimistaan, käsi-

tys omasta itsestään ja itsereflektiiviset valmiudet, kuten itseen suuntautuva mietiskely

ja harkinta, ovat opittavia ominaisuuksia. Subjektiivisista kokemuksista syntyy objek-

tiivista tietoa sosiaalisen vuorovaikutuksen ja oppijoiden keskinäisen yhteistoiminnan

kautta (Pylkkä, 2010). Tieto on suhteellista, koska absoluuttista tai kiistatonta totuutta

ei ole, joten jokainen todellisuuskuva on arvokas ja luotettava - sama asia voidaan

tulkita tai käsittää monella eri tavalla. Näin ollen sitä ei voi behavioristisesti siirtää

oppijalle. Konstruktivismin perusprosessi onkin oppijan tiedon konstruoiminen eli tie-

don rakentaminen vanhan tietopohjan päälle. Tieto jäsennetään omien kokemuksien

kautta ja ymmärtäminen liittyy aina johonkin tilanteeseen. Toimintaa ohjaa tavoite,

joka taas määritellään oppimisen kriteereissä, mutta itse oppiminen on oppijan oman

toiminnan tulosta (Lepistö, 2008; Manninen, 2001).

Konstruktivistinen oppimiskäsitys sopii erityisen hyvin verkko-opetukseen, sillä se

varmistaa opiskelijoiden oppimisen (Koohang et al., 2009). Verkko-opetuksen keskus-

telufoorumit ja muu yhteisöllinen oppiminen edustavat myös konstruktivistista oppi-

miskäsitystä, jossa tietoa ei siirretä ihmiseltä toiselle vaan opiskelija on aktiivinen osa-

puoli oppimisessa. (Harris & Sandor, 2007)

Realistinen oppimiskäsitys

Realistisessa oppimiskäsityksessä ei ole yhtä ainoata opetustapaa vaan sen mukaan

erilaiset näkemykset tulisi nähdä toisiaan täydentävinä näkökulmina. Näin ollen esi-

merkiksi behavioristista oppimiskäsitystä ei voida suoraan hylätä, vaan sitä voidaan

hyödyntää esimerkiksi oppimisvaikeuksista kärsivien opiskelijoiden kohdalla. Toisin

kuin konstruktivismissa, realismin mukaan kaikki tieto ei ole suhteellista, vaan on ole-

massa pysyviä totuuksia ja opetuksen tarkoituksena on auttaa opiskelijoita muodosta-

maan käsityksiä, taitoja, tottumuksia ja asenteita, jotka vastaavat tätä todellisuutta ja

sen asettamia vaatimuksia. Tietoa rakennetaan aktiivisesti ja vanhaan pohjaten, mutta

samalla edellytetään näiden rakenteiden pätevyyden arviointia. Realismi myös sallii

oppijan epätäydellisyyden ja tunnustaa hänen tarpeensa toisten tukeen ja ohjaukseen.

(Auvinen et al., 2007)

Page 17: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

10

Kirjallisuudesta ei löytynyt esimerkkejä tämän oppimiskäsityksen soveltamisesta

verkko-opetukseen.

2.2.2 Pedagogisia malleja

Erilaisia pedagogisia oppimiskäsityksiä voidaan toteuttaa pedagogisilla malleilla. Ne

jäsentävät oppimisprosessin etenemistä ja kuvaavat miten oppiminen pedagogisten pe-

riaatteiden mukaan käytännössä tapahtuu. Ne eroavat lähinnä painotuseroissa ja käy-

tännöissä. Niitä voidaan myös yhdistellä ja soveltaa tilanteiden mukaan. Tämän hetken

verkko-opetuksessa yleisimmät pedagogiset mallit ovat tutkiva, keksivä ja ongelma-

keskeinen oppiminen.

Tutkiva oppiminen

Tutkivan oppimisen tarkoitus on saada opiskelijat osallistumaan yhteisölliseen tiedon-

luomisen prosessiin, jossa kysymykset käsiteltävästä asiasta perustuvat opiskelijoiden

omiin ennakkokäsityksiin ja aiempiin tietoihin. Prosessi syvenee asteittain, kun kysy-

myksiä ja selityksiä tarkennetaan tietolähteiden avulla. Yhteisöllisyys on olennaista –

opiskelijat jakavat tietoa keskenään ja opettelevat jatko-kehittämään selityksiä jaetusta

tiedosta sekä tukemaan toistensa ajattelua.

Tutkivan oppimisen prosessi alkaa kontekstin luomisesta, jonka tarkoitus on moti-

voida opiskelijoita ja luoda perusta oppimiselle, jonka jälkeen opiskelijat itse asettavat

tutkimuskysymykset. Opettaja ohjaa keskustelua mielekkääseen suuntaan, mutta opis-

kelijat itse asettavat ne kysymykset, joita he haluavat tutkia. Sen jälkeen opiskelijoiden

tulee paljastaa omat ennakkokäsityksensä ja aikaisemmat tietonsa valituista kysymyk-

sistä muodostamalla niistä työskentelyteorioita eli hypoteeseja. Tämä rohkaisee heitä

aktiivisesti ajattelemaan ongelmaa eikä vain passiivisesti ottamaan vastaan informaa-

tiota. Verkko-oppimisympäristön yhteiset työskentelyfoorumit antavat hyvän ympä-

ristön työskentelyteorioiden julkaisemiseen sekä erilaisten selitysten ja tulkintojen

vertailemiseen.

Luotuja teorioita kehitetään nostamalla niistä esiin epäselvyyksiä tai puutteellisuuksia.

Työskentelyfoorumit ovat tässäkin erittäin hyviä työkaluja, koska ne mahdollistavat

Page 18: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

11

kaikille avoimen teorioiden argumentoinnin ja kommenttien tallentamisen. Sitten opis-

kelijat hankkivat lisää syventävää tietoa eri tietolähteistä, tarkentavat sen avulla tutki-

muskysymyksiä ja niiden pohjalta teorioita. Tämä prosessi jatkuu asteittain kohti pro-

sessin tulosten yhteenvetoa ja selitysten julkaisemista.

Verkko-oppimisympäristö tukee hyvin tutkivaa oppimista tarjoamalla eräänlaisen

”kollektiivisen työpöydän” opiskelijoiden tuottamalle tiedolle, sen jakamiselle ja ke-

hittelylle. Verkon avustuksella myös asiantuntijoiden on helppo osallistua oppimisen

prosessiin. Verkkofoorumeiden ja tiedostonjaon lisäksi yhteisöllistä tiedonluonnin

prosessia helpottaa tehokas tiedostojen versionhallinta, dokumenttien yhteismuokkaus

ja tietokohteiden uudelleenjärjestely. (Lakkala, 2002; Raitala & Ylilehto, 2012;

Veermans, 2004)

Keksivä oppiminen

Keksivän oppimisen seurauksena on tarkoitus, että oppija kokee keksineensä jotain

uutta, henkilökohtaisesti mielekästä ja kiinnostavaa. Se erottuu omaksi malliksi juuri

tämän henkilökohtaisen oppimisprosessin painottamisen ansiosta. Sitä yleensä käyte-

tään jonkin tietyn periaatteen tai ilmiön oppimiseen ja keksivän oppimisen taitojen

käyttämiseen uudelleen uusissa yhteyksissä ja tilanteissa.

Konstruktivistisen oppimiskäsityksen yleistyminen on tehnyt tätä mallia suosituksi,

mutta siihen on vaikuttanut myös laajentunut ja monipuolistunut tietotekniikan käyttö.

Keksivää oppimista käytetään etenkin luonnontieteissä, joissa käytetään simulaatioita

mallintamaan monimutkaisia luonnonlakeja ja -ilmiöitä.

Keksivän oppimisen prosessi koostuu viidestä vaiheesta tai aliprosessista: ongelman

määrittäminen, hypoteesin kehittäminen, kokeen suunnitteleminen ja hypoteesin tes-

taaminen, yhteenveto ja regulaatio. Nämä vaiheet tulisi tehdä opiskelijalle näkyväksi,

jotta he pystyvät monitoroimaan omaa oppimistaan. Se voidaan tehdä graafisen työ-

kalun avulla, joka tallentaa eri prosessit, niiden väliset suhteet ja suhteiden muutokset.

Keksivää oppimista voidaan tukea käyttämällä erilaisia simulaatioita, kuten esimer-

kiksi SimQuest. Sen avulla voidaan rakentaa simulaatioiden ympärille rakentuvia

Page 19: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

12

verkko-oppimisympäristöjä, jotka tarjoavat opiskelijalle yksilöllistä palautetta sekä

oppimista tukevia toimintoja, kuten esim. tehtäviä, selityksiä ja monitorointityökaluja.

(Veermans, 2004)

Ongelmakeskeinen oppiminen

Ongelmakeskeinen oppiminen on käytännönläheistä ja se on kehitetty työelämän nä-

kökulmasta. Siinä lähdetään liikkeelle huolellisesti suunnitelluista ongelmista, jotka

ovat samankaltaisia kuin opiskeltavan aihepiirin todelliset ongelmat. Ne pohjautuvat

usein ”tapauksiin” (eng. case) ja niissä kuvataan ilmiöitä tai tapahtumia, joille tarvitaan

selitys. Erotuksena muiden opetusmenetelmien ongelmanratkaisuun, tapausten ongel-

mat eivät ole valmiiksi strukturoituja eikä niille välttämättä ole ratkaisua tai niille voi

olla monta ratkaisua.

Ongelmakeskeisen oppimisen mallissa oppiminen perustuu ryhmätyöskentelyyn on-

gelman ymmärtämiseksi tai ratkaisemiseksi. Opiskelijat perehtyvät kukin joihinkin

ongelman erityispiirteisiin ja oleellista on, että ryhmässä keskustellaan yhteisesti sekä

opiskellaan yhteisesti ja yksilöllisesti ratkaisua ongelmaan. Tämä työtapa tuottaa on-

gelmanratkaisun edellyttämää jaettua asiantuntijuutta. Opiskelijoilla on apunaan tutor,

joka vie prosessia eteenpäin, korjaa syntyneitä vääriä käsityksiä tai ratkaisuja sekä tu-

kee opiskelua mm. asiantuntijuudella, kontakteilla ja autenttisilla materiaaleilla.

Ongelmakeskeinen oppimisprosessi alkaa ongelmatilanteen kuvauksella, joka on

usein moniulotteinen. Sitä seuraava prosessi kulkee seitsemän eri vaiheen kautta: kä-

sitteiden ja termien selvittäminen, ongelman määrittely, aivoriihi, ongelman analy-

sointi ja hypoteesin kehittäminen, oppimistavoitteiden määrittely (eli mistä tarvitaan

tietoa), tiedon hankinta sekä ryhmäkeskustelu.

Verkko-opetuksessa ongelmanratkaisuprosessia voi mallintaa ja ohjata tuottamalla

verkkoon pohja, joka kuvaa ongelmaratkaisun eri vaiheita ja johon opiskelijat voivat

tuottaa eri vaiheiden aikana syntyvää tietoa, ajatuksia, kuvia yms. Tällainen pohja tu-

kee työskentelyprosessia ja auttaa jäsentämään ratkaisun vaiheita. Voidaan käyttää

myös virtuaalisia esimerkkejä, kuten esim. lääketieteen opetuksessa virtuaalipotilasta,

Page 20: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

13

joka saattaa itsessään olla ratkaisua vaativa ongelma. Se voi olla toteutettuna videona

ja potilaan lisätiedot voidaan antaa esim. todenmukaisina laboratoriotuloksina. Myös

koko ongelmanratkaisuprosessi voidaan toteuttaa verkkokurssina, jolloin opiskelija-

ryhmä toteuttaa koko prosessin verkossa erilaisten virtuaalisten työkalujen avulla.

(Veermans, 2004)

2.2.3 Verkko-oppimisympäristöjen eri tasot

Verkko-oppimisympäristöt voidaan jäsentää eri tasoihin verkko-opetuksen yhteisölli-

syyden perusteella (Raitala & Ylilehto, 2012). Ensimmäisellä tasolla verkkoympäristö

toimii vain materiaalipankkina, jonka avulla välitetään informaatiota. Toisella tasolla

verkkoa hyödynnetään myös opettajan ja opiskelijan väliseen viestintään, kuten esi-

merkiksi tehtävien palautukseen ja oppimisen palautteeseen. Kolmannella tasolla opis-

kelijat ovat vuorovaikutuksessa myös keskenään. Yhteisöllisissä työskentelytilan-

teissa jaetaan ideoita sekä tuotoksia ja kommentoidaan niitä. Neljännellä tasolla opis-

kelijoiden vuorovaikutus painottuu oppisisällön sijaan suoraan keskinäiseen kommu-

nikointiin. Opiskelijat vaihtavat ajatuksia ja ideoita sovitusta aihepiiristä ja voivat esi-

merkiksi tuottaa yhdessä kehitellyn ratkaisun johonkin avoimeen ongelmaan. Kor-

keimmalla viidennellä tasolla ratkaisuja ja tuotoksia kehitetään pitkäjänteisesti yh-

dessä, jolloin tiettyjen oppisisältöjen hallinta tulee ikään kuin toiminnan sivutuotteena.

2.2.4 Oppimisaihiot

Verkko-opetus on mahdollista käyttää itsenäisiä digitaalisen oppimisen resursseja eli

oppimisaihioita. (Ilomäki, 2008; Opetushallitus, 2011) Oppimisaihio on pienimuotoi-

nen, tiettyihin oppimistilanteisiin soveltuva, opiskelijaa aktivoiva oppimateriaalikoko-

naisuus. Ne on tarkoitettu helposti jaettaviksi, löydettäviksi ja uudelleenkäytettäviksi

ja niiden avulla on pyritty kustannustehokkuuteen oppimateriaaleissa. Esimerkkejä

niistä ovat muun muassa animaatiot, simulaatiot tai pienimuotoiset oppimispelit. Opis-

kelija hyötyy oppimisaihioista opiskelun joustavuuden kautta, koska niillä voidaan li-

sätä opiskelun aika- ja paikkariippumattomuutta. Oppimisaihiot myös tukevat yksilöl-

lisiä opiskelutarpeita sekä yhteisöllistä työskentelyä.

Page 21: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

14

2.3 Verkko-opetuksen hyötyjä ja haittoja

Tässä luvussa käsitellään verkko-opetuksen erilaisia hyötyjä ja haittoja perinteiseen

luokkaopetukseen verrattuna. Hyödyt kerrotaan ensin ja niitä tasapainotetaan sen jäl-

keen haittapuolien esittelemisellä.

2.3.1 Hyötyjä

Verkko-opetus on perinteistä opetusta joustavampaa, niin ajallisesti kuin maantieteel-

lisestikin. Kun opiskelija suorittaa kurssia itsenäisesti, hän voi suorittaa opintoja silloin

kun hänelle itselleen parhaiten sopii, kunhan noudatetaan kurssille asettuja aikataulu-

rajoitteita. Tämä joustavuus on myös kustannustehokasta, kun opiskelijoiden ja opet-

tajien ei tarvitse matkustaa eikä opetus vaadi fyysisiä opiskelutiloja. Myös henkilö-

kuntaa vaaditaan opiskelijaa kohden vähemmän kuin perinteisessä opetuksessa.

Verkko-opetuksessa myös asiantuntijoiden hyödyntäminen on helpompaa. Tämä joh-

tuu siitä, että verkkoluennot voi tallentaa ja niihin voi myöhemmin palata itsenäisesti.

Vierailevia asiantuntijoita voidaan myös integroida opetukseen interaktiivisten simu-

laatioiden tai vuorovaikutusympäristöjen avulla.

Tiedon jakaminen on verkko-opetuksessa helppoa, koska verkossa tieto voidaan koota

yhteen paikkaan, johon kaikilla opiskelijoilla on pääsy. Tämä jättää lisää aikaa opis-

kelulle, sillä verkossa kurssimateriaali on aina saatavilla toisin kuin lähiopetuksessa,

jolloin opiskelijan täytyy olla läsnä materiaalia jaettaessa. Myös opiskelijoiden tuot-

tama tieto on luonnollisempaa jakaa verkon välityksellä kuin esimerkiksi kopioida ja

jakaa muistiinpanoja koko kurssiryhmälle.

Verkko-opetuksessa voidaan hyödyntää verkon aika- ja paikkariippumattomuutta

myös opiskelijoiden ja opettajien vuorovaikutuksessa. Verkko toimii sosiaalisena toi-

mintaympäristönä, jossa opiskelijat keskustelevat, tuottavat ja vertailevat materiaalia

sekä ottavat kantaa muiden tekemään materiaaliin. Verkossa opiskelijalle jää myös

enemmän aikaa ajatella, kun vastausta ei tarvitse tuottaa heti kysyttäessä. Verkkoym-

päristössä keskustelu ohjautuu enemmän käsiteltävään asiaan kuin ryhmäsuhteisiin ja

Page 22: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

15

vuorovaikutuksen rakenne muuttuu opettaja-opiskelija-suhteesta enemmän opiskeli-

joiden väliseen ja opettajan väliseen vuorovaikutukseen. Keskustelut tallentuvat verk-

koon, jossa niihin voi myöhemmin palata ja ottaa osaksi oppimateriaalia.

Yhteisön sosiaalisen tuen merkitys korostuu verkko-opiskelussa, sillä verkko-opetuk-

seen osallistuvilla opiskelijoilla herää tarve yhteistyöhön ja sosiaaliseen vuorovaiku-

tukseen. Yhteisöllisyys ja yhdessä tekeminen aktivoi ja motivoi opiskelijoita. Ver-

kossa yhteisön tasa-arvo korostuu, sillä verkkokeskusteluissa kaikkien ääni on saman

arvoinen ja esimerkiksi luokkahuoneen hiljaisimmat voivat osallistua tasa-arvoisesti

keskusteluun. (Tervo, 2012)

Datatieteen avulla verkko-oppimisympäristö soveltuu reflektiiviseen oppimiseen,

jossa opiskelija voi itse nähdä suoritushistoriansa ja oppimisensa edistymisen. Tämä

on yksi tärkeimpiä asioita tämän tutkielman kannalta. Lähtötasotestit ja oppimisen seu-

ranta antavat suoraa palautetta opiskelija ja opettajalle. Myös verkko-oppimisympäris-

töjen raportointimahdollisuudet tuottavat arvokasta tietoa ja mittareita opiskelijan mo-

tivaatiosta, opettajan suorituksessa ja verkko-opetuksen toiminnasta. Raporteilla on

myös todettu positiivinen vaikutus kurssin lopputulokseen. (Arkorful & Abaidoo,

2015; Tervo, 2012)

2.3.2 Haittoja

Verkko-opetukseen liittyy myös haittoja verrattuna perinteiseen opetukseen. Verkko-

opetus asettaa uudenlaisia vaatimuksia, jotka täytyy ottaa huomioon oppimateriaalin

suunnittelussa, etenkin muokattaessa olemassa olevaa materiaalia verkkoon sopivaksi.

Verkossa materiaalia luetaan silmäillen, joten tekstisisältö täytyy jäsentää eri tavalla

verrattuna perinteiseen oppimateriaaliin. Verkko mahdollistaa myös eri medioiden

käytön oppimateriaalissa, mutta niiden käyttö täytyy suunnitella hyvin, jotta koko-

naisuus pysyy johdonmukaisena. (Pirilä, 2013)

Verkko-opetuksessa on kiinnitettävä erityistä huomiota sosiaaliseen vuorovaikutuk-

seen, koska sen tuottama dialogi on paras tapa kehittää argumentointitaitoja ja kriittistä

ajattelua. Sosiaalinen vuorovaikutus syntyy luonnostaan lähiopetustilanteissa, mutta

verkkoympäristöissä se usein unohtuu ja vuorovaikutus keskittyy enemmän muihin

Page 23: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

16

asioihin, kuten kognitiivisiin prosesseihin ja yhteiseen tiedonrakentamiseen. (Nevgi et

al., 2005)

Koska verkko-oppiminen vaatii itsenäistä työtä eikä aina edellytä sosiaalista vuorovai-

kutusta, se vaatii opiskelijalta hyvää motivaatiota ja ajanhallintakykyä. (Arkorful &

Abaidoo, 2015) Kommunikaatio saattaa olla joillekin hankalampaa verkossa, jolloin

opiskelijan taitotaso ei välity muille. Verkko-oppimisympäristöissä myös erilainen

huono toiminta, kuten huijaaminen, on mahdollista ja siitä kiinnijäämisen riski pie-

nempi.

Alati läsnä oleva teknologia on myös johtanut huomion jatkuvaan hajaantumiseen ja

keskittymiskyvyn heikentymiseen (Small & Vorgan, 2008). Jatkuva huomion jakau-

tuminen voi johtaa aivojen stressitilan kohoamiseen, joka pitkään jatkuessa heikentää

kognitiivisia prosesseja ja aiheuttaa masennusta.

Page 24: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

17

3 Datatiede

Tässä luvussa keskitytään datatieteeseen. Luvussa 3.1 määritellään datatiede ja siihen

liittyvät termit, jonka jälkeen luvussa 3.2 keskitytään datatieteen syntyhistoriaan ja

syihin miksi se on noussut merkittäväksi juuri nyt. Luvussa 3.3 esitellään datatieteen

nykyisiä käyttökohteita ja luvussa 3.4 tutustutaan tarkemmin datatieteen prosessiin.

Viimeisessä luvussa 3.5 tarkastellaan datatieteen kehityssuuntia.

3.1 Määritelmät

Tässä luvussa pyritään saamaan selville datatieteen konteksti ja mitä datatiede tarkoit-

taa. Ensin käydään läpi mitä tiedolla, ja sen eri tasoilla, tarkoitetaan, jonka jälkeen

määritellään Big Data -termi. Lopuksi yritetään saada datatieteelle selkeä määrittely.

3.1.1 Tiedon eri tasot

Tieto on hyvin laaja-alainen käsite. Se koostuu eri tasoista, joita ovat data, informaa-

tio, tietämys ja ymmärrys, jotka ovat kuvattu kuvassa 1. Tieto kumuloituu ja jalostuu

liikuttaessa datasta informaation kautta tietämykseen ja edelleen ymmärrykseen.

(Ilvonen, Jussila, & Kukko, 2013; Jokela, 2011)

Page 25: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

18

Kuva 1: Tiedon eri tasot ovat data, informaatio, tietämys sekä ymmärrys. (Jokela, 2011)

Data tarkoittaa jonkin ”asian säännönmukaista esitystä käsittelykelpoisessa muo-

dossa” (Kotimaisten kielten keskus, 2016). Se on rakenteetonta, objektiivista tietoa,

jota kerättäessä tallennetaan säilytystä varten tietokantoihin tai hieman organisoidum-

min tietovarastoihin (Ilvonen et al., 2013). Data-sana on lähtöisin latinan kielen sanasta

datum, ’annettu’. Data-sanaa on käytetty nykyisessä kontekstissaan 1940-luvulta läh-

tien, kun tietokoneilla on alettu käsitellä tietoa. (Stanton, 2013)

Datalla ei sinänsä ole merkitystä, vaan se tarvitsee aina tulkintaa. Eri järjestelmät ja

sovellukset luovat datasta informaatiota (eng. information) luomalla sille rakenteen,

sisällön ja merkityksen, joka mahdollistaa sen analysoinnin. (Ilvonen et al., 2013;

Jokela, 2011)

Data ja informaatio ovat objektiivista, helposti välitettävissä olevaa tietoa. Tietämys

(eng. knowledge) taas on inhimillistä tietoa, joka syntyy tulkittaessa oppimisen ja

omaksumisen avulla merkitykselliseksi koettua informaatiota. (Ilvonen et al., 2013)

Page 26: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

19

Ymmärrys (eng. wisdom) on tiedon ylin muoto ja se saavutetaan, kun tietämyksen

käsittelyä jatketaan aiempien kokemusten, arvojen ja tavoitteiden pohjalta. Ymmär-

ryksellä tarkoitetaan kykyä soveltaa tietämystä sekä saatavilla olevaa informaatiota

ongelmanratkaisussa tai tehtävän suorittamisessa. Ymmärrystä syntyy, kun vertail-

laan, tehdään johtopäätöksiä ja keskustellaan. (Ilvonen et al., 2013)

3.1.2 Big data

Big Data on sana, jolla ei myöskään ole tarkkaa määritelmää. Yleisesti voidaan sanoa,

että Big Data on suhteellinen, ei absoluuttinen, termi. Sillä tarkoitetaan suurta määrää

dataa, mutta suurta ei tässä yhteydessä määritellä. Sille ei anneta lukua, esim. 1 peta-

tavu < Big Data. Data on suurta silloin, kun sen käsittelystä tulee haasteellista. (Schutt

& O’Neil, 2013)

Big Dataa voidaan luonnehtia nk. neljällä V:llä: Volume (määrä), Velocity (nopeus),

Variety (muoto) ja Veracity (todenmukaisuus), jotka löytyvät kuvan 2 kohdasta ”Big

Data”.1 Big Datan määrä on nimensä mukaisesti suurta. Dataa syntyy joka päivä 2,5

exabittiä eli 2500 petabittiä ja 90% maailman datasta on syntynyt viimeisen kahden

vuoden aikana. Dataa syntyy yhä nopeammin, sillä vuonna 2013 dataa syntyi 28,9 te-

ratavua sekunnissa ja vuonna 2018 sitä on ennustettu syntyvän jo 50 teratavua sekun-

nissa eli tuotetun datan määrä lähes kaksinkertaistuu viidessä vuodessa. 90% Big Da-

tasta on jäsentämätöntä dataa, kuten esim. valokuvia, videoita tai keskustelupalstan

kommentteja. (B. Walker, 2015) Jäsentämätön data on nimensä mukaisesti merkittä-

viltä osin epävarmaa ja epätarkkaa. Kerättävän datan nopeus osaltaan kasvattaa tätä

ongelmaa, sillä aikaa ei enää riitä datan jäsentämiseen esikäsittelyssä. (M. Walker,

2012a)

1 Eri lähteet määrittelevät eri lukumäärän V-alkuisia termejä ja ne voivat olla toisistaan hieman poik-

keavia. Määrät vaihtelevat lähteestä riippuen kolmen ja kymmenen välillä. Luetellut neljä termiä ovat

kuitenkin yleisimmät.

Page 27: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

20

Kuva 2: Big Datan "viisi V:tä": Volume, Velocity, Variety, Veracity, Visibility sekä Value.

(Quitzau, 2014)

IBM on lisännyt edellä lueteltuihin Big Datan ominaisuuksiin kaksi V-alkuista termiä

lisää: Visibility (näkyvyys) ja Value (arvo), jotka löytyvät kuvan 2 kohdasta ”Open

Data”. Näkyvä data on avointa kaikille, joka aiheuttaa huolta yksityisyyden, turvalli-

suuden ja alkuperän kannalta. Datan arvo riippuu sen analysoinnista eli sama data eri

tavalla käytettynä voi olla arvokkaampaa kuin toisella tavalla käytettynä. (Marr, 2014;

Quitzau, 2014)

3.1.3 Datatiede

Datatiede on uusi termi, jolla ei vielä ole vakiintunutta määritelmää. Sillä kuvataan jo

yleisesti työpaikkoja tai tutkintoja, jotka sisältävät datan keräämistä, tulkitsemista ja

havainnollistamista. (Harvard, 2016; Schutt & O’Neil, 2013)

Datatieteen yhteydessä on käytetty myös termiä datan louhinta (eng. Data Mining)

sekä tietämyksen louhinta (eng. Knowledge Discovery) ja joskus myös tietämyksen

Page 28: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

21

louhinta tietokannoista (eng. Knowledge Discovery in Databases, KDD). Tietämyk-

sen louhinta on prosessi, jonka avulla etsitään käyttökelpoista tietoa datasta. Datan

louhinta on sen prosessin osa, jossa datasta louhitaan hahmoja soveltamalla siihen tiet-

tyjä algoritmeja. (Fayyad, Piatetsky-Shapiro, & Smyth, 1996) KDD-prosessi on hyvin

samankaltainen datatieteen prosessin kanssa (Schutt & O’Neil, 2013) ja datatieteilijä

Gregory Piatetsky-Shapiro onkin sitä mieltä, että se on vain yksi uusi termi kuvaamaan

samaa kuin KDD eli datan analysointia. (Piatetsky-Shapiro, 2012)

Informaatiojärjestelmien professori Vasant Dharin mukaan datatiede on poikkitieteel-

linen ala koskien järjestelmiä ja prosesseja, joiden avulla louhitaan datasta tietämystä

tai oivalluksia joko rakenteellisessa tai ei-rakenteellisessa muodossa ja, joka on jatkoa

sellaisille data-analytiikan aloille kuin tilastotiede, datanlouhinta ja ennustava analy-

tiikka, samoin kuin KDD. (NYU, 2013)

Eräs toinen laajalti viitattu määritelmä datatieteelle määrittelee sen alaksi, joka sijait-

see tilastotieteen, ohjelmoinnin ja alakohtaisen asiantuntijuuden risteyskohdassa. Ku-

vassa 3 datatieteen sijainti kuvataan Venn-kaavion avulla. (Conway, 2015; Schutt &

O’Neil, 2013)

Page 29: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

22

Kuva 3: Datatieteen sijainti Venn-kaavion avulla kuvattuna. Datatiede sijaitsee tilastotieteen,

ohjelmoinnin ja alakohtaisen asiantuntijuuden risteyskohdassa. (Conway, 2015)

Kaikkia kaaviossa kuvattuja kolmea alaa tarvitaan datatieteessä. Perinteinen tutkimus

on tässä kaaviossa kuvattu yhdistelmäksi matematiikan ja tilastotieteen teoriaa ja ala-

kohtaista tuntemusta. Conway väittää, että tämä voi johtua akateemisesta kulttuurista,

joka ei perinteisesti ole palkinnut teknologian ymmärrystä. Ilman alakohtaisen tunte-

muksen antamaa kontekstia ja tutkimuskysymyksiä, datatieteestä jää jäljelle vain ko-

neoppiminen. Ohjelmointi ja alakohtainen tuntemus ilman tuloksia selittävää mate-

maattista teoriaa johtaa vaaralliseen tilanteeseen, jossa päällisin puolin päteviltä vai-

kuttavia analyysejä ei osata tulkita oikein ja se voi johtaa vääriin toimenpiteisiin.

(Conway, 2015)

Page 30: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

23

Datatiede eroaa perinteisestä datan analysoinnista esimerkiksi tilastollisin keinoin

siinä, että tilastotieteessä pyritään selittämään ilmiö tarkastelemalla yksittäisissä data-

joukoissa esiintyviä hahmoja, kun taas datatiede pyrkii tekemään datasta ennusteita ja

tuottamaan tietoa päätöksenteon tueksi. (Wladawsky-Berger, 2014)

Datatiede on myös tilastotiedettä vapaampaa siinä suhteessa, että se ei pyri olemaan

niin eksaktia vaan sallii suuremman virhemarginaalin tai mallin poikkeaman saavut-

taakseen nopeammin toimeenpantavia tuloksia. Tehokkuus ja ROI ovat tärkeimpiä

ominaisuuksia, kuten myös ratkaisujen vakaus, skaalautuvuus sekä tulosten tulkitta-

vuus. (Granville, 2014)

3.2 Datatieteen historia ja nykytila

Tässä luvussa pyritään vastaamaan kysymykseen: mistä datatiede kumpuaa? Ensin tut-

kitaan datatieteen syntyhistoriaa ja sen jälkeen datatieteen kasvuun vaikuttaneita teki-

jöitä.

3.2.1 Datatieteen juuret

Datatiede on lähtöisin kypsän tilastotieteen alan ja nuoren tietojenkäsittelytieteen yh-

distämisestä. Vuonna 1977 kansainvälisen tilastoinstituutin (International Statistical

Institute ISI) jaostoksi perustettiin laskennan alajaosto (International Association for

Statistical Computing IASC), jonka tehtävänä on muuttaa data informaatioksi ja tietä-

mykseksi yhdistämällä perinteiset tilastomenetelmät ja moderni tietokoneteknologia

alakohtaisten asiantuntijoiden tietämykseen. (Press, 2013)

Vuonna 1989 Gregory Piatetsky-Shapiro järjesti ensimmäisen Knowledge Discovery

in Databases (KDD) -työpajan, josta vuonna 1995 tuli vuosittainen ACM SIGKDD

tiedonlouhinnan konferenssi. SIGKDD on datalouhinnan, -tieteen ja -analysoinnin yh-

teisö. (Press, 2013)

Vuonna 1994 yhdysvaltalainen talouslehti Businessweek kertoi kansitarinassaan tie-

tokantamarkkinoinnista (Database marketing), jossa yritykset keräsivät paljon tietoa

asiakkaistaan. Tiedon avulla ennustettiin, kuinka todennäköistä oli, että kuluttaja ostaa

Page 31: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

24

jonkin tuotteen ja tuleva markkinointi suunniteltiin sen ympärille. Ongelmana kuiten-

kin siihen aikaan oli niin suuren tietomäärän käsittely vaikeus. (Berry, 1994)

Ensimmäistä kertaa datatiede-termi esiintyi konferenssin nimessä vuonna 1996, kun

IFCS (International Federation of Classification Societies) järjesti konferenssinsa ni-

mellä ”Data science, classification and related methods”. (Press, 2013)

Vuosina 2002 ja 2003 julkaistiin ensimmäistä kertaa kaksi datatiedettä käsittelevää

tieteellistä julkaisua, Data Science Journal ja Journal of Data Science. Datatiede sai

oman tutkimuskeskuksensa Fudanin yliopiston yhteyteen vuonna 2007 nimellä ”The

Research Center for Dataology and Data Science”.

Brittiläinen ei-kaupallinen yhdistys Jisc (ent. Joint Information Systems Committee)

määritteli datatieteilijät vuonna 2008 henkilöiksi, jotka ”työskentelevät siellä missä

tutkimusta suoritetaan, tai, tietokeskushenkilökunnan tapauksessa, lähellä paikkaa,

jossa data tuotetaan” ja jotka ”tuottavat luovia kyselyjä tai analyysejä, mahdollistaen

muiden työskentelyn digitaalisen datan kanssa ja edistyksen tietokantateknologiassa”.

(Swan & Brown, 2008)

2010-luvulla saavuttiin nykyisenlaiseen määritelmään datatieteilijästä eli hän on hen-

kilö, joka ”käyttää niin dataa kuin tiedettäkin luodakseen jotain uutta”. (Patil, 2011)

3.2.2 Syyt yleistymiselle

Datatiede on yleistynyt juuri nyt, koska tiedon, teknologian ja liiketoiminnan odotuk-

set suuntautuvat analysoimaan ja käyttämään kasvanutta datamäärää. (Upadhyaya,

2014) Aiemmin mainitusta kerätyn datan määrän räjähdysmäisestä kasvusta johtuen,

dataa on paremmin saatavilla. Uudet teknologiat mahdollistavat entistä kustannuste-

hokkaamman datanhallinnan, -säilömisen kuin -käsittelynopeudenkin. Uusien työka-

lujen avulla voidaan myös paremmin käsitellä yhä kasvavaa joukkoa muodoltaan mo-

ninaista dataa sekä kehittäminen ja ottaa käyttöön tietomalleja entistä tehokkaammin.

Liiketoiminnan odotukset ovat myös suuntautuneet hyödyntämään teknologian avaa-

mia uusia mahdollisuuksia, kuten vasteaikojen pienentämistä tai asiakkaan yksilöllistä

Page 32: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

25

tunnistamista ja käyttäytymisen ennustamista sekä sen pohjalta viestimistä. (Schutt &

O’Neil, 2013)

Kuva 4: Datatieteen nousuun vaikuttavat tekijät ovat data, teknologia sekä liiketoiminnalliset

tarpeet. (Upadhyaya, 2014)

Datatieteen yleistymiseen johtavia tekijöitä on avattu kuvassa 4. Datan saatavuuden

kasvu sekä teknologian uudet mahdollisuudet selviytyä suurten datamäärien analy-

soinnista järkevin kustannuksin ovat osaltaan edistäneet datatieteen esiinmarssia.

Myös yritysten kilpailutilanne, joka vaatii digitaalisen kokemuksen huomioon otta-

mista ja uusia palvelumalleja, on siihen vaikuttanut. (Upadhyaya, 2014)

3.3 Datatieteen käyttökohteet

Datatiedettä voidaan käyttää hyvin laaja-alaisesti. Kerättyä dataa käytetään mm. edis-

tämään terveyttä ja terveydenhuoltoa, tehostamaan resurssien käyttöä ja kierrätystä,

vähentämään rikollisuutta ja parantamaan turvallisuutta. Kerätystä datasta muodoste-

taan myös mm. datatuotteita, kuten verkkokauppojen suosittelijajärjestelmiä, verkko-

Page 33: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

26

opiskelun yksilöllisesti mukautuvaa materiaalia tai dataan pohjautuvaa politiikkaa.

(Loukides, 2010; Schutt & O’Neil, 2013; B. Walker, 2015)

Ennakoivan analytiikan suurimmat datalähteet liittyvät tulovirtoihin. Vuonna 2012 en-

nustavaa analyysia käyttävien yritysten käyttökohteet olivat markkinointi (65%) ja

myynti (59%) ja suurimmat tietolähteet asiakkaisiin (69%), markkinointiin (67%),

tuotteisiin (55%), myyntiin (54%) ja rahoitukseen (51%) liittyvä data. (Vorhies, 2014)

Lääketiede voi hyötyä valtavasti datatieteen soveltamisesta. Suuria hyötyjä voidaan

saavuttaa etenkin, jos dataa saadaan yhdistettyä ja avattua eri tahojen, kuten sairaaloi-

den ja klinikoiden, tietovarastoista. Dataa voidaan myös kerätä ihmisten käyttämistä

laitteista mm. aktiviteetinseurantaan, jolloin data on oikeellisempaa kuin ihmisten it-

sensä ilmoittama tieto. Terveysalan yritykset, kuten Pittsburgh Health Data Alliance,

ovat jo alkaneet tarjota palveluita kuluttajille, jotka ovat räätälöity yksilöllisesti heidän

vakuutustietojensa, laiteseurantadatan, genetiikan ja jopa sosiaalisen median käyttö-

datan mukaan. Lisääntyneen datan ja koneoppimisen myötä diagnosointi helpottuu ja

jopa diagnoosin mukainen hoito voi olla räätälöity yksilökohtaisesti. Datatieteen

avulla voidaan myös tehostaa jälkihoitoa mm. ennustamalla ketkä potilaat todennäköi-

sesti noudattavat terveydenhuollon ammattilaisen ohjeita ja ketkä eivät. (Marr, 2016a;

Rojas, 2015)

Yksi datatieteen käyttökohteista on markkinointi, jossa sitä hyödynnetään ennusta-

maan asiakkaiden käyttäytymistä ja heidän kulutuskäyttäytymistään. Tämän tiedon

avulla voidaan tehokkaasti markkinoida oikeita tuotteita oikeille henkilöille oikeaan

aikaan, joka johtaa korkeampaan asiakastyytyväisyyteen sekä korkeampaan asiakas-

kohtaiseen tuottoon. (M. Walker, 2013)

Datatiedettä käytetään myös rakennusalalla, jossa on alettu hyödyntämään tietojärjes-

telmiä, jotka mahdollistavat ennustavan, reaaliaikaisen rakennussuunnitelman päivit-

tämisen kustannusarvion raameissa. Tämänkaltaiset tietojärjestelmät nopeuttavat

suunnitteluprosessia vähentämällä tarvetta edestakaiseen kommunikaatioon arkkiteh-

tien, insinöörien ja omistajien välillä. Ne myös vähentävät materiaalihukkaa, joka on

merkittävä menoerä rakennusalalla. Kuten muillakin aloilla, datan vapauttaminen ja

Page 34: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

27

kokoaminen eri lähteistä on mahdollistanut sen hyödyntämisen datatieteen keinoin.

(Marr, 2016c)

Datatieteen käyttö vakuutusalalla mahdollistaa uusien tuottomahdollisuuksien tunnis-

tamisen. Asiakaskäyttäytymisen analysointi ja ennustaminen on johtanut kasvaneisiin

tuloihin mm. nopeutuneen laskunmaksun kautta. Datatiedettä voidaan hyödyntää ris-

kiprofiilien muodostamisessa ja mahdollisten vakuutuspetosten tunnistamisessa.

(Pandey, 2014) Liikennevakuutuksien yhteydessä voidaan käyttää reaaliaikaisesti päi-

vittyvää dataa asiakkaiden autoista ja muodostaa datasta yksilöllisiä hinnoittelumalleja

liikennevakuutuksille. Myös kotivakuutusten yhteydessä voidaan muodostaa yksilöl-

lisiä riskiprofiileja asuinpaikan, siitä saatavan julkisen datan ja kodin sisäisten senso-

rien (kosteussensorit, liiketunnistimet, turvakamerat) tuottamaa dataa yhdistämällä.

Niistä voidaan myös tuottaa ennusteita ja sen pohjalta auttaa asukasta varautumaan

mahdollisiin vaaratilanteisiin. Samaa dataa, jota kerätään terveydenhuollon käyttöön,

voidaan myös käyttää terveys- ja henkivakuutusten riskiprofiilien muodostamiseen.

(MastersInDataScience.org, 2016)

Datatieteen sovelluksilla voidaan helpottaa henkilöstöresurssien hallintaa. Näitä sovel-

luksia tarjoavat mm. Oracle, IBM ja SAP. Henkilöstöstä kerättyä dataa voidaan ana-

lysoida ja sen avulla parantaa erilaisia henkilöstöön liittyviä prosesseja, kuten esim.

henkilöstön säilyttämistä, rekrytointia ja koulutusta. Datatieteen avulla voidaan mm.

ennustaa työvoiman muutostarpeita sekä tunnistaa henkilöstön tyytyväisyyttä ja työ-

paikanvaihtohalukkuutta. MITn ja IBMn suorittaman tutkimuksen mukaan HR:ssä da-

tatiedettä soveltavat yritykset kasvattivat myyntiään 8% nopeammin, niillä oli 24%

suurempi nettotuotto ja 58% suurempi työntekijäkohtainen myynti. (Sen, 2016)

Datatiedettä voidaan käyttää jokaisella koulutusasteella ennustamaan oppilaiden suo-

ritustasoa ja tunnistamaan varhain opiskelijat, jotka todennäköisimmin jäisivät jälkeen

opetuksessa. Opetuksen sisältö voi mukautua yksilöllisesti opiskelijan tasoon ja oppi-

mistyyliin ja opiskelijoiden motivaatiota voidaan parantaa oikea-aikaisella palaut-

teella. Opettajille ja opetuslaitoksen hallinnolle voidaan tarjota tietoa opetuksen ja

opintosuunnitelman vaikuttavuudesta. Datatieteen avulla voidaan myös parantaa pää-

töksentekoa ja vähentää kuluja. (Siemens et al., 2007)

Page 35: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

28

Pelimaailmassa datatiedettä on sovellettu markkinointiin ja pelisuunnitteluun. Mark-

kinoinnissa sitä käytetään kuten muillakin aloilla, eli tunnistetaan asiakassegmenttejä

ja kohdennetaan markkinointia niiden perustella. Pelisuunnittelussa pystytään taas

mittaamaan, miten pelaajat reagoivat eri ärsykkeisiin ja saadun palautteen perusteella

voidaan muokata peliä toivottuun suuntaan. Tässä tärkein tavoite on maksimoida pe-

liaika ja kokemus siitä, että rahalle on saatu vastinetta maksullisten pelien suhteen ja

toisaalta ilmaisissa, mainosrahoitteisissa peleissä on tarkoitus maksimoida nähtyjen

mainosten määrä. (Marr, 2015) Lisäksi ”freemium”-mallin mukaan hinnoitelluissa pe-

leissä maksua ei suoriteta peliä ostettaessa vaan sitä käytettäessä ja datatieteen avulla

optimoidaan pelin sisällä käytetty raha. Kilpailullisissa peleissä datatieteellä varmiste-

taan pelihahmojen välinen tasapaino. Myös kasinojen pelikoneissa voittojen ajankohta

on rytmitetty pelaajan mentaliteetin mukaan, oli sitten kyseessä harkitsevainen varmo-

jen voittojen pelaaja tai riskialtis vedonlyöjä. (Parkin, 2015)

3.4 Datatiede prosessina

Tässä luvussa käydään läpi datatieteen prosessi. Datatieteen soveltaminen ei ole trivi-

aali seikka vaan vaatii verkko-opetuksessakin erityistä suunnittelua. Jokainen vaihe

nojaa edelliseen ja perustan on oltava kunnossa, jos prosessin kautta halutaan saavuttaa

hyötyjä. Datatieteen prosessi koostuu kysymyksen asettelusta, tiedon hankinnasta ja

sen puhdistamisesta, kuvailevasta ja ennustavasta analytiikasta sekä tulosten havain-

nollistamisesta ja päätöksenteosta ja se on avattu kuvassa 5.

Page 36: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

29

Kuva 5: Datatieteen prosessi koostuu kysymyksen asettelusta, tiedon hankinnasta, tiedon puh-

distamisesta, kuvailevasta ja ennustavasta analytiikasta sekä tulosten havainnollistamisesta.

(Schutt & O'Neil, 2013)

3.4.1 Kysymyksen asettelu

Datatieteen prosessi alkaa kysymyksen asettelulla – mihin kysymykseen halutaan vas-

tata tai mikä ongelma halutaan ratkaista. Kysymys voi esimerkiksi olla: Minkälaiset

ominaisuudet kuvaavat hyvin suoriutuvia opiskelijoita? (Bucky, 2016). Tässä ensim-

mäisessä vaiheessa syntyy datatieteen varsinainen arvo, joten on tärkeää, että haetaan

vastausta oikeaan kysymykseen. Oikea kysymys on se, johon vastattaessa saavutetaan

olosuhteisiin nähden suurin mahdollinen hyöty. Hyödyn ei tarvitse välttämättä olla

korkein rahallinen hyöty, vaan se voi olla myös esimerkiksi kilpailuetu. (Shung, 2014)

Kysymykset kumpuavat omasta toimialastaan, joka on tunnettava, jotta kysymys osa-

taan kysyä oikein. Näin ollen tämä on tärkeä työvaihe datan analysoimisessa. (Stanton,

2013)

Page 37: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

30

3.4.2 Tiedon hankinta

Ennen kuin tietoa voi analysoida, se täytyy kerätä ja tallentaa. Tiedonlähteitä on monia

erilaisia, kuten esim. julkiset tilastot, verkkorajapintojen kautta saatava tieto, sensori-

data, tietokoneohjelmiston generoima tieto. Esimerkiksi terveydenhuollon tietokanto-

jen potilaskohtaista dataa voidaan täydentää potilaan omien aktiviteetin- ja terveyden-

seurantalaitteiden datalla. Eri lähteistä kerätty data täytyy koostaa yhdeksi käsiteltä-

väksi datajoukoksi. (Guo, 2013; Stanton, 2013)

Alakohtainen asiantuntijuus auttaa valitsemaan mitä tietoa kerätään. Yleensä kannat-

taa kerätä kaikki mahdollinen tutkimuskysymykseen liittyvä data, jotta saadaan mah-

dollisimman tarkkoja tuloksia, mutta joskus kannattaa välttää keräämästä joitain tie-

toja esim. yksityisyydensuojan nojalla. (Ali, 2016; Altintas & Gupta, 2016; Gutierrez,

2014) Keräämisessä voidaan käyttää hyödyksi keskeisiä suorituskykymittareita (eng.

Key Performance Indicator, KPI), jotka kertovat olennaisen tiedon esimerkiksi yrityk-

sen suorituskyvystä. (Marr, 2016e)

3.4.3 Tiedon puhdistaminen

Kerätty tieto täytyy puhdistaa, jotta sitä voidaan analysoida ja se vaatii tiedon eri as-

teista muokkausta riippuen sen lähteestä. Esimerkiksi verkkosivuilta kopioitu tieto

voidaan joutua jäsentämään lähdekielen sääntöjen mukaan ennen kuin sitä voidaan

käyttää. Tyhjät ja puuttuvat arvot sekä duplikaatit tulee käsitellä tilanteen vaatimalla

tavalla, tiedon muoto tulee yhtenäistää ja semanttiset virheet korjata. Tiedon puhdista-

minen voi tapahtua koneellisesti tai manuaalisen työn avulla. (Bandyopadhyay, 2016;

Guo, 2013; Loukides, 2010)

Kun tieto on jäsennetty, sen laatu täytyy ottaa tarkasteluun. Yleensä tieto on puutteel-

lista tai sisäisesti ristiriitaista. Ristiriitojen syy täytyy selvittää. Onko tieto virheellistä

ja jos on, mistä se johtuu? Kertooko ristiriita jotain muuta kuin mitä tutkimuskysymys

kysyy ja seurataanko sen sijaan tätä ristiriitaisuuksien kysymyslinjaa? Esimerkiksi ot-

sonikato olisi todettu aikaisemmin, mutta aukon todentaminen viivästyi, koska auto-

maattinen tiedonkeräys hylkäsi liian matalat lukemat. (Loukides, 2010)

Page 38: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

31

Tiedon puhdistaminen on yleensä aikaa vievin ja pitkästyttävin työvaihe datatieteessä

- datatietelijän työajasta jopa 50% - 80% voi mennä tietoa puhdistettaessa. Etenkin eri

tietolähteistä kerättyä tietoa yhdistettäessä sen puhdistaminen käy entistä vaikeam-

maksi. Sitä puhdistettaessa voidaan kuitenkin päätellä jotain tietojoukon ominaispiir-

teistä, mitä oletuksia siitä voidaan tehdä ja millä tavalla sitä kannattaa lähteä analysoi-

maan. (Guo, 2013; Lohr, 2014)

3.4.4 Kuvaileva analytiikka

Kuva 6: Gartnerin analyyttinen jatkumo kuvailevasta analytiikasta ohjailevaan analytiikkaan.

(Laney, 2015)

Kuvassa 6 Gartner asettaa kuvailevan analytiikan (eng. descriptive analytics) analyyt-

tisen jatkumon alimmalle tasolle. Se katsoo taaksepäin ja on helpoin analytiikan ala

suorittaa. Se vastaa kysymykseen: Mitä on tapahtunut? (Laney, 2015)

Kuvailevan analytiikan keinoin yritetään ymmärtää datasta mitä tapahtui menneisyy-

dessä. Tässä yhteydessä menneisyys tarkoittaa aikaa minuuteista vuosiin. Tämä on

yleisin ja yksinkertaisin tapa analysoida dataa ja se auttaa ymmärtämään mitä on tehty,

Page 39: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

32

mitä siitä voi oppia ja miten se saattaa vaikuttaa tulevaisuuteen. Tärkeimpänä kuvai-

levan analytiikan välineenä ovat yksinkertaiset tilastotieteelliset menetelmät, kuten

summa, keskiarvo ja prosenttimääräiset muutokset. (Bertolucci, 2013)

Kuvailevaa analytiikkaa hyödynnetään näyttämään tietoa, kuten varastosaldo, asiak-

kaiden keskimääräinen ostosmäärä ja myynnin vuotuinen muutos. Yleisin kuvailevan

analytiikan tulos onkin raportti, jossa kerrotaan miten esimerkiksi yrityksen tuotto, ra-

hoitus, myynti yms. ovat kehittyneet. Kuvailevaa analytiikkaa käytetään myös esimer-

kiksi luokittelemaan analysoinnin kohteita (esim. asiakkaita) eri ominaisuuksien (ku-

ten suositun tuotteen) mukaan. (Bertolucci, 2013)

3.4.5 Ennustava analytiikka

Kuvassa 6 Gartner asettaa ennustavan analytiikan (eng. predictive analytics) analyyt-

tisen jatkumon toiseksi korkeimmalle tasolle. Se katsoo eteenpäin ajassa ja on toiseksi

vaikein analytiikan ala suorittaa. Se vastaa kysymykseen: Mitä tulee tapahtumaan?

(Laney, 2015)

Ennustavan analytiikan keinoin pyritään ennustamaan tulevia tapahtumia menneisyy-

den pohjalta. Sen tarkoitus on tuottaa dataa tulevaisuudesta, jonka pohjalta voidaan

tehdä toimenpiteitä muun muassa antamalla mahdollisille tapahtumille todennäköi-

syyksiä. Pitää kuitenkin muistaa, että mikään algoritmi ei voi ennustaa tulevaisuutta

100% todennäköisyydellä. (Halo Business Intelligence, 2016)

Ennustavassa analytiikassa käytetään monenlaisia menetelmiä mallintamisen, koneop-

pimisen, datalouhinnan ja peliteorian alalta, joilla pyritään havaitsemaan datasta eri-

laisia toistuvia malleja ja datajoukkojen välisiä suhteita, joita käytetään ennustamaan

esimerkiksi asiakaskäyttäytymistä, ostostrendejä ja tuotantoketjun vaatimuksia. Eräs

yleinen sovelluskohde on luottoluokituksen laskeminen, joiden avulla luoton antaja

voi arvioida luoton saajan tulevaisuuden maksukykyä. (Halo Business Intelligence,

2016; M. Walker, 2012b)

Ennustavan analytiikka ei ole rajoittunut vain ajalliseen ennustamiseen – olemassa ole-

vaa tietoa voidaan myös käyttää sellaisen tiedon ennustamiseen, jota ei vielä tiedä.

Page 40: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

33

Esimerkiksi sosiaalisessa mediassa ennustavaa analytiikkaa voidaan käyttää henkilön

vaikutuksen ennustamiseen hänen sosiaalisen aktiivisuustiedon perusteella. Sitä käy-

tetään myös tunneanalyysiin, jossa analysoidaan henkilön tuottamaa tekstitietoa ja en-

nustetaan siitä henkilön tunnetilaa. (Wu, 2013a)

3.4.6 Tulosten havainnollistaminen ja johtopäätösten tekeminen

Kuva 7: BADIR™-päätöksentekoprosessi (Jain, 2013)

Kerättyä tietoa voidaan analysoida ja ymmärtää, mutta siitä ei ole hyötyä, jos sitä ei

käytetä päätöksenteon tukena! Päätöksentekoa helpotetaan pitämällä se mukana pro-

sessin jokaisessa vaiheessa esimerkiksi pysymällä liiketoiminnallisten rajoitteiden si-

sällä, osallistamalla avainsidosryhmiä ja ajoittamalla päätöksenteon niin, että sidos-

ryhmät ovat valmiita ryhtymään toimeen analyysin tulosten pohjalta. Kuvassa 7 on

havainnollistettu päätöksentekoprosessia, jossa data ja siitä tehdyt johtopäätökset ovat

kiinteä ja jatkuva osa koko prosessia. (Jain, 2013)

Päätöksiä tehtäessä pitää myös muistaa datan konteksti ja arvioida tulosten oikeelli-

suus. Jos jotain datajoukkoa analysoidaan liian pitkälle, siitä vedettyjä johtopäätöksiä

ei voi yleistää datajoukon ulkopuoliseen maailmaan. Tätä ilmiötä kutsutaan ylisovit-

tamiseksi. (Provost & Fawcett, 2013)

Page 41: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

34

Tuloksista ei ole hyötyä, jos niitä ei ymmärretä, joten ne täytyy esittää ymmärrettä-

vässä muodossa kohdeyleisölle, jotka eivät yleensä ole asiantuntijoita. Näin ollen on

erittäin tärkeää, että datatieteilijät ja päätöksentekijät puhuvat asioista kaikkien osa-

puolien ymmärtämillä termeillä. Esimerkiksi teknisien mittareiden (algoritmien tark-

kuus tai herkkyys) sijaan tulisi puhua kontekstin mukaisin termein, eli yritysmaail-

massa liiketoimintamittarien mukaan. Mittaustulosten sijaan kannattaa puhua analy-

soinnin pohjalta tehtyjen toimenpide-ehdotuksien hyvistä ja huonoista puolista. Tari-

nankerronta on tehokas tapa kommunikoida tulokset. (Davenport, 2013; Matsudaira,

2015)

Tiedon havainnollistaminen eli visualisointi on tehokas tapa havainnollistaa analyysin

tuloksia. Taulukossa 1 on esimerkki pylväskaaviosta. Eri kaaviotyylejä, kuten pylväs-

, viiva- ja ympyräkaavioita, voi soveltaa tapauskohtaisesti ja jotkut ohjelmistot, kuten

SAS Visual Analytics, osaavat valita kaaviotyylin automaattisesti käytetyn datan mu-

kaan. Kaaviot voivat myös olla dynaamisia ja vuorovaikutteisia, joiden avulla voidaan

helpommin tuoda esille ajan mittaan tapahtuvia muutoksia ja porautua tarkemmin eri

mittaustuloksiin. Tietoa voidaan myös havainnollistaa muilla keinoin, kuten esim. 3D-

tulostetuilla, kosketeltavilla tulosten esityksillä. (Davenport, 2013)

Page 42: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

35

Taulukko 1: Esimerkki pylväskaaviosta

Eri medioita voidaan myös yhdistää tulosten kommunikointia varten. Esimerkiksi mu-

siikkivideot yhdistävät kuvaa, ääntä ja videota tulosten kommunikointia varten ja sitä

voidaan vielä tukea suusanallisella esityksellä. Myös pelejä voidaan käyttää helpotta-

maan eri muuttujien välisten monimutkaisten vuorovaikutusten ymmärtämistä.

(Davenport, 2013)

3.5 Datatieteen kehityssuuntia

Tässä luvussa luodaan katsaus datatieteen tulevaisuuteen ja mitä siitä voidaan yrittää

sanoa.

Luonnollisen kielen käsittely (Natural Language Processing, NLP) helpottaa koneen

ja ihmisen välisen kommunikointia ja alentaa monimutkaisen tiedon analysoinnin kyn-

nystä. Tämä tulee mahdollistamaan tiedon analysoinnin yhä suuremmalle käyttäjäjou-

kolle, joilla ei välttämättä muuten olisi asiantuntijuutta sitä suorittaa. Ei tarvittaisi enää

0

1

2

3

4

5

6

Luokka 1 Luokka 2 Luokka 3 Luokka 4

Esimerkki pylväskaaviosta

Sarja 1 Sarja 2 Sarja 3

Page 43: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

36

tietojenkäsittelytieteen opintoja vaan lyhyt tutustuminen NLP-teknologian käyttöön

riittäisi tuottamaan hyötyä tiedon analysoinnista. Myös tiedon havainnollistaminen au-

tomatisoituu uusien tuotteiden ilmestyessä. Esimerkiksi tietokoneohjelma Quill pystyy

tuottamaan tekstimuotoisia raportteja, jotka selittävät analysoinnin tulokset ja tuotta-

vat niistä tiivistelmän automaattisesti. (Marr, 2016b)

Preskriptiivinen eli ohjaileva analytiikka lisääntyy tulevaisuudessa. Siinä missä ennus-

tava analytiikka ennustaa useita mahdollisia kehityssuuntia, ohjailevalla analytiikalla

voidaan ennustaa eri toimenpiteiden vaikutuksia, joka mahdollistaa parhaiden toimen-

piteiden suosittelemisen. (Wu, 2013b) Sen avulla voi myös tuottaa ehdotuksia tulevien

mahdollisuuksien hyödyntämiseen tai vähentää tulevia riskejä. Ohjaava analytiikka

voi jatkuvasti ja automaattisesti käsitellä uutta tietoa parantaen ennustamisen tark-

kuutta ja tuottaen parempia toimenpide-ehdotuksia. (M. Walker, 2012b)

Kuvassa 6 Gartner asettaa preskriptiivisen eli ohjailevan analytiikan (eng. prescriptive

analytics) analyyttisen jatkumon korkeimmalle tasolle. Se katsoo eteenpäin ajassa ja

on vaikein analytiikan ala suorittaa. Se vastaa kysymykseen: Kuinka saadaan aikaan

haluttu tulos? (Laney, 2015)

Tiedon visualisointi tulee hyötymään käynnissä olevasta virtuaalitodellisuuden yleis-

tymisestä. Kun tiedon määrä ja monimutkaisuus lisääntyvät, tiedon kaksiulotteinen

esittäminen ei riitä välittämään lisääntynyttä tietosisältöä. Virtuaalitodellisuuden

avulla tiedon havainnollistamiseen voidaan lisätä 360-asteen näkökenttä ja kolmas

ulottuvuus. Sen avulla mahdollistetaan hienojakoisempi visualisaatio ja parempi im-

mersio eli ”uppoaminen” mediaan. (Marr, 2016d)

Page 44: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

37

4 Datatiede verkko-opetuksessa

Edellisissä luvuissa käytiin läpi verkko-opetuksen ja datatieteen taustoja sekä merki-

tystä. Tässä luvussa vedetään edellä esitelty tieto yhteen ja tarkastellaan, mitä datatiede

voi merkitä verkko-opetuksessa. Luvussa 4.1 esitellään kahden alan tutkimusyhteisön,

EDM ja LAK, määritelmät. Sen jälkeen motivoidaan lukijaa kertomalla mahdollisista

hyödyistä luvussa 4.2. Datatieteen käytännön suorittamista esitellään luvussa 4.3 ja

luku 4.4 vastaa kysymykseen: mitä datatieteellä voi verkko-opetuksessa tehdä. Lu-

vussa 4.5 esitellään muutama merkittävä tapaustutkimus ja luvussa 4.6 muutama mer-

kille pantava kaupallinen tuote. Viimeiseksi luvussa 4.7 luodaan katsaus tulevaan.

4.1 EDM ja LAK

Kiinnostus dataa ja sen analysointia kohtaan koulutuksessa, opetuksessa ja oppimi-

sessa on johtanut kahden eri tutkimusyhteisön syntymiseen – koulutusdatanlouhinta

(eng. Educational Data Mining, EDM) ja oppimisen analytiikka (eng. Learning Ana-

lytics and Knowledge, LAK) (Siemens & Baker, 2012b) Taulukossa 2 on avattu niiden

välisiä eroja. Ne molemmat edustavat datapohjaista lähestymistapaa koulutukseen ja

ne molemmat tähtäävät koulutuksen parantamiseen parantamalla arviointia, koulutus-

kysymysten ymmärrystä ja kuinka väliintulot suunnitellaan ja valitaan. Niillä on kui-

tenkin muutama keskeinen eroavaisuus. EDM analysoi tietoa mieluummin automaat-

tisesti, kun taas LAK painottaa ihmisen arvostelukykyä automatiikan sijaan. EDM

hyödyntää ennemmin automaattista puuttumista opiskeluun, kun LAK tuottaa analy-

soitua tietoa opettajien ja opiskelijoiden käyttöön. EDM keskittyy enemmän ilmiöiden

redusoimiseen komponenteiksi ja tarkastelee niiden välisiä vuorovaikutuksia. LAK

vastaavasti lähestyy järjestelmää holistisesti, käsitellen sitä kokonaisuutena.

Page 45: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

38

LAK EDM

Löydökset Ihmisen harkintakyky

tärkeintä: Automaattinen

analysointi on työkalu

tätä varten.

Automaattinen analy-

sointi tärkeintä; Ihmisen

harkintakyky on työkalu

tätä varten.

Reduktio vs holismi Painottaa monimutkais-

tenkin kokonaisuuksien

ymmärtämistä

Painottaa selittävien

muuttujien vähentämistä

(redusointia) ja niiden

välisten suhteiden analy-

sointia

Tausta LAK-tutkijoiden tausta

semanttisessa verkossa,

tulosten ennustamisessa

ja systeemisissä interven-

tioissa.

EDM-tutkijoiden tausta

koulutusohjelmistossa ja

opiskelijoiden mallinta-

misessa sekä koulutus-

suoritusten ennustami-

sessa.

Mukautuminen ja per-

sonalisaatio

Keskittyy tiedottamiseen

ja päätösvallan antami-

seen opettajalle ja opis-

kelijalle.

Keskittyy automaattisen

mukautumiseen

Tekniikat ja menetel-

mät

Sosiaalisten verkkojen,

tunnetilojen, vaikutusval-

lan ja keskustelujen ana-

lysointi; opiskelijoiden

suoritusten ennustaminen

Luokittelu, klusterointi,

Bayesiläinen mallinnus,

vuorovaikutussuhteiden

analysointi, mallianalyysi

(discovery with models),

visualisaatio

Taulukko 2: EDM:n ja LAK:n erot (Siemens & Baker, 2012b)

Page 46: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

39

4.2 Sovellusalat

Datatiedettä sovelletaan opiskelussa kahdeksaan eri osa-alueeseen, jotka ovat opiske-

lijan tietämyksen, käyttäytymisen ja kokemuksen mallintaminen; opiskelijan profiloi-

minen; toimialueen mallintaminen; oppimisaihioiden ja pedagogisen mallin analyysi;

trendianalyysi sekä käyttäjäkokemuksen mukauttaminen ja yksilöllistäminen.

(Bienkowski et al., 2012)

Tietolähteinä oppimisen analytiikalle toimivat etenkin etäopiskelussa ja MOOC-kurs-

seilla verkko-oppimisympäristöt, joissa opiskelijat tarkastelevat aikataulujaan sekä ar-

vosanojaan, lukevat oppimateriaalia, osallistuvat keskustelufoorumeille ja lähettävät

tehtäviä arvioitaviksi. Verkko-oppimisympäristöistä kerättyä tietoa voidaan yhdistää

opiskelijatietojärjestelmiin (SIS), jotka voivat sisältää tietoa esim. aikaisemmista tut-

kinnoista, sosioekonomisesta ja etnisestä taustasta, kurssivalinnoista ja arvosanoista.

Tietolähteenä voidaan käyttää myös sensoridataa esimerkiksi kulunvalvonnasta, josta

nähdään opiskelijan liikkuminen koulutuslaitoksessa, ja langattoman verkon käyttö-

tiedoista. Kirjaston tietojärjestelmistä voidaan kerätä tietoa kirjastokäynneistä, lai-

nauksista ja sähköisten julkaisujen lukemisesta. Tietoa voidaan myös kerätä sähköi-

sistä oppikirjoista, älykkäistä opetusjärjestelmistä (eng. Intelligent Tutoring System,

ITS), videoista, opetuspeleistä sekä opiskelijoiden itse tuottamasta tiedosta. (Sclater et

al., 2016)

4.2.1 Opiskelijan tietämyksen mallintaminen

Opiskelijan tietämyksen taso voidaan päätellä mittareista kuten kysymysten vastaukset

(esim. oikein, osittain oikein, väärin), kulunut aika ennen vastausta sekä pyydettyjen

vastausvihjeiden toistuvien väärien vastauksien ja tehtyjen virheiden määrä ja laatu.

Päätelmät voidaan tehdä ennustavan analytiikan keinoin tietokonemallia hyväksikäyt-

tämällä tai tarkastelemalla suoritusdataa esimerkiksi dashboard-näkymästä.

(Bienkowski et al., 2012)

Page 47: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

40

Opiskelijan tietämystä mallintamalla voidaan opetusta yksilöllistää vastaamaan hänen

tietotasoaan. Sen avulla voidaan muodostaa muun muassa suosituksia ja älykkäitä ope-

tusjärjestelmiä, joissa sitä käytetään päättämään mitä kysymyksiä seuraavaksi opiske-

lijalle annetaan. Esimerkiksi koneoppimista hyödyntäen voidaan arvioida vastauksista

tietämystason lisäksi, yrittääkö opiskelija arvata oikeita vastauksia tai antoiko hän

erehdyksessä väärän vastauksen. (R. S. J. D. Baker, Corbett, & Aleven, 2008;

Bienkowski et al., 2012)

Tietämysmallien hyödyntäminen on yleinen ominaisuus kaupallisissa LMS-tuotteissa

ja niiden käyttö vaihtelee automatiikan ja manuaalisen työn välillä. Jotkut järjestelmät

siirtävät opiskelijat eteenpäin opinnoissaan automaattisesti päätellyn tietämystason

mukaan. Täysin koneellisesti tehty päätös etenemisestä tai lisäopinnoista voi olla kui-

tenkin riskialtista, koska ”vielä ei tiedetä tarpeeksi aiheiden välisistä riippuvuuksista,

jotta voitaisiin tehdä näitä päätöksiä automaattisesti.” (Bienkowski et al., 2012). Jotkut

järjestelmät puolestaan antavat vain tietoa ja suosituksia opettajalle, kun taas osassa

järjestelmistä etenemis- tai lisäopiskelusuositukset annetaan opiskelijalle.

4.2.2 Käyttäytymisen mallintaminen

Käyttäytymisen mallintamisessa käytetään samankaltaisia mittareita kuin tietämyk-

senkin mallintamisessa ja lisäksi mittareita kuten esimerkiksi opiskelijan verkko-op-

pimisympäristössä vietetty aika, kurssin suoritustulokset, läsnäolo, myöhässä olo ja

jopa aikaisemmin mallinnettu tietämystaso. Näistä mittareista voidaan päätellä millä

tavalla opiskelijan toiminta verkko-oppimisympäristössä vaikutta opiskelutuloksiin.

Mallintamalla opiskelijan käyttäytymistä voidaan havaita esimerkiksi järjestelmän

manipulointia ja sen heikentävää vaikutusta tuloksiin. Käyttäytymiseen reagoimalla

esimerkiksi lisätehtävillä voidaan vähentää ei-toivotun käyttäytymisen negatiivisa vai-

kutuksia. (R. S. Baker, Corbett, Koedinger, & Wagner, 2004; Bienkowski et al., 2012)

Käyttäytymistä voidaan mallintaa analysoimalla verkko-oppimisympäristön lokitie-

toja ja niistä voidaan päätellä oppimista korreloivia muuttujia. Eräässä tutkimuksessa

Page 48: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

41

lokitiedoista löydettiin neljä muuttujaa, jotka selittivät 30% opiskelijoiden arvosano-

jen vaihtelevuudesta ja niiden perusteella voitiin ennustaa oikein 81% hylätyn suori-

tuksen saaneista. (Macfadyen & Dawson, 2010)

4.2.3 Kokemuksen mallintaminen

Opiskelukokemuksen mallintamisella tarkoitetaan opiskelijan tyytyväisyyttä opiske-

lukokemukseen. Se voidaan määrittää kyselyjen lisäksi mittaamalla opiskelijoiden va-

lintoja, käyttäytymistä, suoritustasoa ja halukkuutta jatkaa opiskelua. Opiskelukoke-

mus on tärkeää etenkin yrityksille, jotka tuottavat kaupallisia verkkokursseja. Sitä mi-

tataan etenkin opiskelijapysyvyydellä. Kokemus täytyy kuitenkin päätellä monien mit-

tareiden perusteella. Kyselyissä opiskelijat voivat kertoa pitävänsä kurssista, mutta

sillä voi silti olla suurempi keskeytysaste, kuin toisella kurssilla, josta opiskelijat ker-

toivat pitävänsä vähemmän. (Bienkowski et al., 2012)

4.2.4 Opiskelijan profilointi

Opiskelijan profiloinnilla pyritään muodostamaan profiili, joka kuvaa hänen olennai-

set erityispiirteensä. Profiloinnin tarkoituksena on parantaa oppimisen tehokkuutta ja

vaikuttavuutta yksilöllistämällä ja mukauttamalla verkko-oppimisympäristöä opiske-

lijan tai opiskelijaryhmän mukaan. Profilointia suoritetaan usein luokittelemalla opis-

kelijoita heidän opiskeludatan (kuten aikaisemmin kuvailtu) tai demografisen datan,

tai molempien, perusteella. (Bienkowski et al., 2012)

4.2.5 Aihealueen mallintaminen

Aihealuemallia käytetään edustamaan jonkin aihealueen, kuten matematiikan tai tai-

dehistorian, avainkäsitteitä ja niiden välisiä suhteita. Sen avulla pyritään tunnistamaan,

miten avainkäsitteiden jaottelu vaikuttaa oppimiseen eli esimerkiksi, miten jokin aihe-

alue tuodaan opiskeltavaksi, minkälaisina palasina ja missä järjestyksessä. Mittareina

käytetään opiskeludataa (kuten aikaisemmin kuvailtu), aihealueen taksonomiaa eli

luokittelua ja ongelmien välisiä sekä ongelmien ja vastauksien välisiä yhteyksiä.

(Bienkowski et al., 2012)

Page 49: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

42

4.2.6 Oppimisaihioiden ja pedagogisen mallin analysointi

Oppimisaihioiden ja pedagogisen mallin analysoinnilla pyritään selvittämään vastauk-

sia kysymyksiin, kuten mitkä oppimisaihiot edesauttavat oppimista tehokkaimmin,

mahdollistaako jokin opetussuunnitelma paremman oppimisen kuin toinen ja minkä

tyyppinen koulutuksen järjestäminen on tehokkain tapa edistää oppimista. Oppimisai-

hioiden ja pedagogisen mallin analysoinnilla voidaan parantaa verkko-oppimisympä-

ristöjä ja sillä on merkittävä vaikutus opiskelijoiden oppimiseen ja se on keskeinen

mielenkiinnon kohde oppimisen analytiikan ja koulutustiedonlouhinnan tutkimisessa.

Mittareina käytetään opiskelijoiden vastauksia, opiskelijoiden ajan myötä tapahtuvaa

toimintaa oppimisaihioiden suhteen, milloin ja mihin ryhmään pedagogista mallia käy-

tettiin, sekä opiskelijoiden suoritustasoa ennen ja jälkeen kokeen suorituksen.

(Bienkowski et al., 2012)

4.2.7 Trendianalyysi

Trendianalyysin avulla kerätystä datasta pyritään löytämään jonkin ilmiön kehityksen

suunta eli trendi. Sillä pyritään vastaamaan kysymyksiin kuten mitä muutoksia oppi-

misessa on ajan mittaan tapahtunut. Trendianalyysiä on hyödyllinen tarkastellessa esi-

merkiksi koesuorituksia ja muita mittareita, joiden avulla voidaan selvittää eri käytän-

töjen vaikutusta oppimiseen. Koulutusdatanlouhinnassa sillä tarkoitetaan eri hahmojen

löytämistä asiaan liittymättömän datan (nk. kohinan) seasta. Trendianalyysiä varten

kerättävä data vaihtelee halutun tiedon mukaan, mutta tyypillisesti tarvitaan dataa ai-

nakin kolmelta ajanjaksolta. (Bienkowski et al., 2012)

4.2.8 Mukautuminen ja yksilöllistäminen

Yksilöllistämisellä eli personoinnilla tarkoitetaan tässä yhteydessä mukautuvaa rytmi-

tystä sekä ohjeistuksen muokkaamista ja sisällön räätälöintiä oppimismieltymysten

mukaan. Mukautumisella tarkoitetaan muutoksia, jotka järjestelmä tai kouluttaja tekee

yksilöllistääkseen opetusta opiskelijoiden reaktioiden mukaan. Mukautumisella ja yk-

silöllistämisellä vastataan kysymyksiin, kuten kuinka oppimiskokemusta tulisi muut-

Page 50: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

43

taa tätä opiskelijaa varten tai mitä muutoksia tarvitaan, että voidaan palvella opiskeli-

joita parhaalla mahdollisella tavalla reaaliaikaisesti. Usein mukauttamisessa käytetään

hyödyksi luokittelun ja trendianalyysin avulla kehitettyjä työkaluja, kuten opiskelijalle

suunnattua palautetta tai suosituksia seuraavasta toiminnosta. Mukauttamisen ja yksi-

löllistämisen mahdollistamiseksi jokaista opiskelijaa varten pyritään muodostamaan

profiili, jota varten kerätään sellaista dataa kuten sarjoja opiskelijan suorittamia toi-

mintasarjoja, tietoa opiskelijan yrittämistä vaiheista tai ongelmista sekä demografista

tietoa. (Bienkowski et al., 2012)

4.3 Hyödyt

Tässä luvussa käsitellään datatieteen verkko-opetukseen soveltamisesta syntyvää hyö-

tyä. Merkittävimmät hyödyt syntyvät opiskelun ja opetuksen laatuun, opiskelija-

pysyvyyteen sekä kustannustehokkuuteen.

4.3.1 Opiskelun laatu

Eräs oppimisen analytiikan tärkeimmistä sovellutuksista on antaa opiskelijalle tietoa

siitä, kuinka hän edistyy suhteessa omiin tavoitteisiinsa ja mitä hänen täytyy tehdä

saavuttaakseen ne. Jotkut yliopistot myös tarjoavat opiskelijoille analytiikkapohjaisia

järjestelmiä, jotka auttavat opiskelijoita valitsemaan tulevia opintoja. Ne pyrkivät tar-

joamaan optimaalisen opintopolun ottamalla huomioon opiskelijan omat uravalinnat,

kyvyt sekä aikaisempien opintojen arvosanat. (Sclater et al., 2016)

4.3.2 Opetuksen laatu

Oppimisen analytiikkaa käytetään opetuksen laadun parantamiseen. Sen avulla voi-

daan antaa opettajille palautetta opiskelumateriaalin ja -menetelmien sekä arviointi-

prosessin toimivuudesta, joka mahdollistaa opetuksen jatkuvan kehittämisen. Tieto

opiskelijan oppimiskokemuksesta mahdollistaa huolenaiheisiin puuttumisen ja voi

johtaa parempaan yhteyteen opiskelijan ja henkilökunnan välillä. Analytiikkaa voi-

daan käyttää seuraamaan opiskelijoiden suoritusta opintojakson aikana ja sen tiedon

Page 51: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

44

pohjalta opettajat voivat muokata opetustaan esimerkiksi, jos opiskelijoilla on vai-

keuksia tietyn aiheen kanssa. Tämä tieto hyödyttää nykyisten opiskelijoiden lisäksi

myös tulevia opiskelijoita. (Sclater et al., 2016)

Oppimisen analytiikalla voidaan myös saavuttaa laajempia hyötyjä oppimiselle, ope-

tukselle ja opiskelijoiden tuelle. Sen avulla voidaan edesauttaa datapohjaista ajattelua

ja tietoon perustuvaa päätöksentekoa. Jopa pienimuotoinen opetusanalyyttinen kokeilu

voi johtaa parempaan käsitykseen datan hyödyntämisestä ja keskustelun käymiseen

esimerkiksi opiskelijapysyvyydestä. Analytiikalla voi siis olla hyödyllisiä vaikutuksia

yli projektin tavoitteiden ja voi olla osa opetuskulttuurin muutosta kohti tietopohjaista

ajattelua. (Sclater et al., 2016)

4.3.3 Opiskelijapysyvyyden parantaminen

Analysoimalla tietoa opiskelijoista ja heidän suorituksistaan yliopistot voivat vähentää

keskeyttävien opiskelijoiden määrää, joka puolestaan vaikuttaa positiivisesti kyseessä

olevien opiskelijoiden elämään sekä alentaa yliopiston keskeyttäneisiin hukkaan hei-

tettyjä resursseja. Keskeyttämiseen johtavat ongelmat pystytään tunnistamaan entistä

aikaisemmin. Esimerkiksi Purduen yliopistossa ongelmat tunnistettiin jo lukukauden

toisella viikolla, joka on niin aikaisin, että se ei aikaisemmin ole ollut mahdollista.

Opiskelutietojen analyysiä voidaan käyttää ennustamaan ketkä opiskelijat eivät edisty

opinnoissaan. Esimerkiksi New Yorkin teknologisessa instituutissa pystytään ennus-

tamaan kolme neljästä keskeyttäneestä. (Sclater et al., 2016)

Kun keskeyttämisriskin alttiina olevat opiskelijat on tunnistettu, heihin voidaan koh-

dentaa yksilöllistettyjä tukitoimia ja sitä kautta pyrkiä säilyttämään heidät opiskeli-

joina. Eräs esimerkki tästä on opiskelijan dashboard, josta hän näkee edistymisensä

suhteessa tavoitteisiinsa tai muihin opiskelijoihin. Tämä on huomattu motivoivan opis-

kelijoita joissain tapauksissa. Purduen yliopistossa käytettävä Signals-järjestelmä vä-

hensi D ja F -arvosanoja 14% (asteikolla A-F, jossa A on paras). (Sclater et al., 2016)

Page 52: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

45

4.3.4 Kustannustehokkuus

Oppimisen analytiikalla voidaan parantaa opiskelijapysyvyyttä, suoritus- sekä valmis-

tumistasoa, joka johtaa alempiin institutionaalisiin kustannuksiin per valmistuva opis-

kelija. Opintojen keskeyttäminen paitsi aiheuttaa negatiivisia vaikutuksia keskeyttä-

ville opiskelijoille ja kuluttaa turhaan koulutuslaitoksen varoja, myös säästää yhteis-

kunnan varoja, koska valmistuvat opiskelijat maksavat todennäköisemmin opintolai-

nansa takaisin. (Contact North, 2013; Sclater et al., 2016)

4.4 Käytäntö

Entä kuinka datatieteen soveltaminen verkko-opetukseen käytännössä tapahtuu? Sii-

hen pyritään tässä luvussa. Ensin käsitellään datatieteen menetelmiä, joista on verkko-

opetuksessa hyötyä. Seuraavaksi käsitellään hieman infrastruktuuria ja tarvittavia työ-

kaluja ja lopuksi esitellään joitain rajoitteita käytännön hyödyntämisessä.

4.4.1 Menetelmät

Tässä luvussa käsitellään mitä datatieteen menetelmiä verkko-opetukseen voidaan so-

veltaa. Niistä esitellään kolme ennustamisen menetelmää, neljä hahmontunnistuksen

ja yhteyksien louhinnan menetelmää sekä tiedonkeruun ja mallianalyysin menetelmät.

Ennustaminen

Yksi koulutusdatanlouhinnan merkittävimmistä menetelmistä on ennustaminen. Sen

tavoitteena on muodostaa malli, jonka avulla voidaan päätellä yksi muuttuja (ennus-

tettava muuttuja) jostakin datajoukon muiden muuttujien (ennustava muuttuja) yhdis-

telmästä. Ennustava malli luodaan ensin pienelle datajoukolle, jonka jälkeen sen luo-

tettavuus tarkistetaan tilastollisesti, jonka jälkeen se voidaan ottaa käyttöön suurem-

man datajoukon kanssa. Ennustavia malleja käytetään yleisesti ennustamaan tulevia

tapahtumia, kuten keskeyttäviä opiskelijoita, tai ennustamaan muuttujia, joita ei olisi

mahdollista mitata suoraan reaaliajassa. Esimerkiksi tunnereaktiotiedon kerääminen

Page 53: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

46

vaatii perinteisesti häiritseviä kyselyitä tai kallista havainnointia, mutta opiskeluloki-

tiedoista muodostettu ennustava malli voi tuottaa saman datan häiritsemättä opiskelua.

(D’Mello, Craig, Witherspoon, McDaniel, & Graesser, 2008; Siemens & Baker,

2012a)

Oppimisen analytiikassa ja opiskeludatanlouhinnassa käytetään yleisesti kolmea eri

ennustusmenetelmää: luokittelijoita, regressioanalyysiä sekä piilevän tiedon arvioin-

tia (eng. latent knowledge estimation). Luokittelijoissa ennustettava muuttuja on bi-

näärinen (esim. 1 tai 0) tai kategorinen muuttuja. Koulutusalalla suosittuja luokittelu-

menetelmiä ovat mm. päätöspuut, satunnainen metsä (eng. random forest), päätössään-

nöt (eng. decision rules) sekä askel- ja logistinen regressio. Regressioanalyysissä en-

nustettava muuttuja on jatkuva muuttuja, esimerkiksi numero. Yleisin regressio-

analyysi koulutusdatanlouhinnassa on lineaarinen regressio. Piilevän tiedon arvioin-

tia käytetään tietämyksen mallintamiseen ja sen kaksi suosituinta algoritmia ovat

bayesilainen tiedonjäljitys (eng. Bayesian Knowledge Tracing, BKT) ja suoritusfakto-

rianalyysi (eng. Performance Factor Analysis, PFA). (Siemens & Baker, 2012a)

Hahmontunnistus

Hahmontunnistusalgoritmit eroavat ennustamisesta merkittävästi siinä, että niillä yri-

tetään löytää ennakolta tuntemattomia hahmoja datasta. Toisin kuin ennustamisessa,

hahmontunnistuksessa ei ole kiinnostuksen kohteena jotain tiettyä muuttujaa vaan da-

tasta pyritään etsimään luonnollisesti ilmaantuvaa rakennetta. Yleisimmät ennustus-

menetelmät EDM/LA:ssa ovat klusterointi, faktorianalyysi, sosiaalisten verkkojen

analysointi sekä aihealueen rakenteen analysointi (eng. domain structure analysis).

(Siemens & Baker, 2012a)

Klusteroinnissa pyritään jakamaan datajoukko samankaltaisuuden perusteella luon-

nollisesti ryhmittyviin joukkoihin eli klustereihin. Se on hyödyllinen menetelmä eten-

kin silloin, kun datajoukon todennäköisiä kategorioita ei tiedetä etukäteen. Klusteroin-

tia on käytetty opiskelijoiden ja opiskelijatoimintojen ryhmittelyyn, joiden avulla voi-

daan päätellä, kuinka opiskelijat käyttävät verkko-oppimisympäristöä ja sitä kautta pa-

Page 54: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

47

rantaa opintosuunnitelmaa. Klusterointiin läheisesti liittyvässä faktorianalyysissä py-

ritään ryhmittelemään datajoukon muuttujat ja jaottelemaan ne joukoksi piileviä, eli

vain epäsuorasti tarkasteltavissa olevia, tekijöitä eli faktoreita. Toisin sanoen, faktori-

analyysissä pyritään ryhmittämään muuttujat niiden välisten korrelaatioiden avulla.

EDM/LA:ssa faktorianalyysiä käytetään vähentämään datajoukon ulottuvuuksia esi-

merkiksi vähentämällä muuttujien lukumäärää. Sitä on käytetty tunnistamaan minkä-

laisia suunnittelupäätöksiä älykkäiden opetusjärjestelmien suunnittelijat yleensä teke-

vät. Sosiaalisten verkkojen analysoinnissa (SNA) mallinnetaan yksittäisten toimi-

joiden välisiä suhteita ja vuorovaikutuksia sekä niistä ilmaantuvia hahmoja. Sitä voi-

daan käyttää esimerkiksi tehokkaiden ja tehottomien ryhmien erojen selvittämisessä

analysoimalla ryhmän sisäisten suhteiden vahvuutta. Sitä on myös käytetty opiskeli-

joiden kommunikaation ajan myötä tapahtuvien muutosten tutkimiseen sekä kuinka

opiskelijoiden sijainti sosiaalisessa verkostossa vaikuttaa heidän käsitykseen opiske-

luyhteisöön kuulumisesta. Näistä vuorovaikutuksen ja yhdistyneisyyden hahmoista

voidaan päätellä opiskelumenestymistä sekä sitoutuneisuutta kurssiin. Aihealueen ra-

kenteen analysoinnissa pyritään löytämään rakenne esimerkiksi yhdistämällä tietyn-

tyyppinen sisältö tietynlaisiin oppimisen komponentteihin tai taitoihin. Sitä tietoa voi-

daan sitten käyttää esimerkiksi piilevän tiedon arvioinnissa tai koulutusongelmien va-

linnassa. (Kotimaisten kielten keskus, 2016; Siemens & Baker, 2012a)

Yhteyksien louhinta

Yhteyksien louhinnassa pyritään löytämään yhteyksiä datajoukon eri muuttujien vä-

lillä. Se on ollut tutkituin EDM:n ala ja on vieläkin erittäin merkittävä. Esimerkkejä

yhteyksien louhinnasta ovat niiden muuttujien selvittäminen, jotka liittyvät vahvim-

min johonkin tiettyyn muuttujaan tai mitkä yhteydet kahden muuttujan välillä ovat

vahvimmat. Yleisesti ottaen yhteyksien louhinta koostuu neljästä eri menetelmästä:

assosiaatiosääntöjen louhinta, korrelaatioiden louhinta, toistuvien hahmojen louhinta

sekä syysuhteiden louhinta. (Siemens & Baker, 2012a)

Assosiaatiosääntöjen louhinnassa pyritään löytämään sellaisia sääntöjä, joilla löy-

dettyihin muuttujaryhmiin liittyy joidenkin muuttujien tietty arvo. Sitä voidaan käyttää

esimerkiksi yhdistämään opiskelijoiden toiminnat heidän saamaansa arvosanaan tai

Page 55: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

48

löytämään yhdessä esiintyvät opiskeluvirheet. Korrelaatioiden louhinnassa pyritään

löytämään positiiviset tai negatiiviset suorat korrelaatiot muuttujien välillä. Sitä on

käytetty esimerkiksi laskemaan korrelaatiot erilaisten älykkäiden opetusjärjestelmien

tehtävien suunnitteluun käytettyjen ominaisuusjoukkojen ja opiskelijoiden suoritta-

man järjestelmän manipulaation esiintymisen välillä. Toistuvien hahmojen louhin-

nassa pyritään ajallisia yhteyksiä tapahtumien välillä. Sitä voi käyttää esimerkiksi sel-

vittämään minkä tyyppinen opiskelijoiden yhteistyö johtaa menestyksekkääseen tule-

vaan ryhmäprojektiin. Syysuhteiden louhinnassa pyritään selvittämään, onko jokin

tapahtuma toisen tapahtuman syy, eli esimerkiksi mitkä tekijät johtavat opiskelijan

heikkoon suoriutumiseen. (Bienkowski et al., 2012; Siemens & Baker, 2012a)

Tiedonkeruu päätöksenteon tueksi

Tiedonkeruu päätöksenteon tueksi on LAssa yleinen menetelmä, jonka tarkoituksena

on keskittää ja havainnollistaa opiskelijoiden suorituksista kerättyä tietoa reaaliaikai-

sesti kouluttajille, jotta siitä voidaan käyttää osana pedagogista toimintaa. Esimerkiksi

opiskelijoiden kehityskaaren visualisointia voidaan käyttää tunnistamaan yhteisiä piir-

teitä menestyneiden ja menestymättömien opiskelijoiden joukoissa tai päättelemään,

tarpeeksi ajoissa toimenpiteitä varten, mitkä opiskelijat ovat vaarassa jäädä opetuk-

sesta jälkeen. Joitain käytettyjä havainnollistamiskeinoja ovat muun muassa lämpö-

kartta (eng. heatmap), oppimiskaari (eng. learning curve) ja oppimisdiagrammi (eng.

learnogram).

Mallianalyysi (discovery with models)

Mallianalyysissä (eng. discovery with models) käytetään yhden koulutusdatalouhin-

nan tuloksia toisessa datalouhinnassa. Yleensä siinä muodostetaan jokin malli, usein

ennustavien menetelmien avulla, jonka tuottamaa ennustetta käytetään toisen data-

louhintamenetelmän syötteenä. Ehkä yleisin tapa suorittaa mallianalyysiä on käyttää

ennustavaa mallia toisessa ennustavassa mallissa, jolloin ensimmäisen mallin ennus-

tettuja muuttujia käytetään toisen mallin ennustavina muuttujina. Näin mallit voivat

koostua toisista malleista jopa monitasoisesti. Esimerkiksi vahvat oppimisen ennuste-

Page 56: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

49

mallit tavallisesti riippuvat opiskelijoiden metakognitiivisista malleista, jotka puoles-

taan riippuvat piilevän tiedon arvioinnista, joka puolestaan on riippuvainen aihealueen

rakenteen malleista. Toinen tapa suorittaa mallianalyysiä on käyttää ennustavaa mallia

yhteyksien louhinnassa, jolloin tarkastellaan suhteita ensimmäisen mallin ennusteiden

ja muiden muuttujien välillä. Sitä on käytetty esimerkiksi verkko-oppimisympäristön

manipulaation ennustemallin korreloimiseksi opiskelijoiden yksilöllisiin eroihin,

jonka avulla pyrittiin ymmärtämään, ketkä opiskelijat todennäköisimmin syyllistyisi-

vät järjestelmän manipulaatioon. (Siemens & Baker, 2012a)

4.4.2 Infrastruktuuri

Kuva 8: Oppimisen analytiikan infrastruktuuri (Sclater et al., 2016). Data liikkuu datalähteistä

datavaraston kautta analytiikkasuorittimeen, josta analysoitu data on hälytysjärjestelmän,

dashboardien ja eri ohjelmistosovelluksien käytössä.

Page 57: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

50

Oppimisdatan analysoinnin tekninen infrastruktuuri ei ole vielä vakiintunut johtuen

asiaankuuluvan teknologian nuoruudesta ja markkinoilla olevien ratkaisujen moninai-

suudesta, joten ohessa esitellään yksinkertainen esimerkki. Kuvassa 8 on esitetty Jisc:n

ehdotelma mahdollisesta oppimisen analytiikan infrastruktuurista. (Sclater et al.,

2016)

Datalähteinä toimivat kyselyin kerätty data, opiskelijatietojärjestelmä, verkko-oppi-

misympäristö sekä kirjastojärjestelmä. Näistä lähteistä kerätty data syötetään datava-

rastoon, jota kutsutaan myös LRS:ksi (Learning Record Store). Varsinainen datan ana-

lysointi tapahtuu suorittimessa, joka noutaa ja tallentaa dataa datavarastosta. Suoritti-

meen liittyy hälytys- ja väliintulojärjestelmä ja niistä liikkuu analysoitua dataa henki-

lökunnalle erilaisiin dashboard-näkymiin sekä opiskelijoiden ohjelmistosovelluksiin.

Opiskelijasovelluksessa opiskelijan on mahdollista tarkastella omaa sitoutumistaan ja

saavutuksiaan, jonka avulla hän voi asettaa itselleen opiskelutavoitteita ja saada niistä

vahvistavaa palautetta. Sovellukseen liittyy myös opiskelija suostumuspalvelu, jonka

avulla välitetään prosessorille tietoa datan keräys- ja käyttöoikeuksista. (Sclater et al.,

2016)

4.4.3 Työkalut

Pääosa EDM/LA-tutkimuksesta suoritetaan julkisesti saatavilla, usein avoimen lähde-

koodin työkaluilla, kuten R:llä, Weka:lla ja RapidMiner:lla. Näiden työkalujen avulla

voidaan toteuttaa EDM/LA:n menetelmiä ja ne myös tukevat tiedon valmistelua me-

netelmien soveltamista varten, mallien soveltuvuuden validointia sekä tiedon havain-

nollistamista. (Siemens & Baker, 2012a)

Avoimeen lähdekoodiin perustuvat työkalut mahdollistavat niiden toiminnallisuuden

laajentamisen tutkijoiden kehittämillä lisäosilla. R on avoimen lähdekoodin tilastolli-

sen laskennan ympäristö ja se on hyvin suosittu työkalu tilastollisen analyysin suorit-

tamiseen. Yksi sen vahvuuksista on julkaisukelpoisten kuvaajien tuottamisen help-

pous. Erityisen arvokas ominaisuus tutkijoille on mahdollisuus laajentaa R:n toimin-

nallisuutta muodostamalla lisäpaketteja, joiden avulla voidaan vastata alakohtaisiin

Page 58: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

51

tutkimustarpeisiin- (Siemens & Baker, 2012a; The R Foundation, 2016) Weka on avoi-

men lähdekoodin sarja koneoppimisen algoritmeja datalouhintaan ja osia siitä on

otettu käyttöön muissa tuotteissa, kuten RapidMinerissä (Hall et al., 2009; Siemens &

Baker, 2012a). RapidMiner on markkinoiden johtava avoimen lähdekoodin ennusta-

van analytiikan ympäristö. Se on yleistymässä EDM-tutkijoiden joukossa, koska sen

avulla voi joustavasti suorittaa monimutkaista validaatiota. (RapidMiner, 2016;

Siemens & Baker, 2012a)

Kaupalliset työkalut vievät eteenpäin analytiikan käyttöä koulutuksessa. Niitä ovat yri-

tysmaailman työkalut, kuten IBM:n ja SAS:n analytiikkatyökalut; verkko-oppimisym-

päristöjen, kuten Blackboard, tarjoamat analytiikkatyökalut sekä opiskelijajärjestel-

mät, kuten Ellucian.

Näiden yleistyökalujen lisäksi saatavilla on erikoistuneita työkaluja esimerkiksi tietä-

myksen mallintamiseen BKT:n avulla (Chang, Beck, Mostow, & Corbett, 2006), en-

nustavien mallien kehitykseen (Rodrigo, Baker, McLaren, Jayme, & Dy, 2012) sekä

havainnollistamaan opiskelijoiden oppimisen kehittymistä ja opiskelusuoritusten hah-

moja (Koedinger, McLaughlin, & Stamper, 2012).

Infrastruktuurin puolella tärkeä kehitysaskel on ollut datavaraston ja analytiikkapro-

sessorin välisen rajapinnan standardointi xAPI-rajapinnan avulla. xAPI määrittelee

opiskelutoimintojen paketoimisen ja lähettämisen datavarastoon joustavassa, mutta lu-

ettavassa muodossa. Standardinmukainen data vähentää oppimistapahtumien ja eri

verkko-oppimisympäristöjen välistä riippuvuutta. xAPI-spesifikaatio on ottanut vah-

vasti vaikutteita konstruktivismista ja se tarjoaa uusia käyttömahdollisuuksia yleisesti

behavioristisista lähtökohdista kehitettyjen verkko-oppimisympäristöjen joukossa.

xAPI on otettu ensimmäisenä käyttöön yritysmaailmassa, mutta sitä ollaan nopeaan

tahtiin ottamassa myös akateemisessa maailmassa. Muun muassa Sakai ja Blackboard

ovat integroineet sen LMS-tuotteisiinsa. (Kevan & Ryan, 2016)

4.4.4 Rajoitteet

Teknologisten ratkaisujen lisäksi datan valmistelu-, käsittely- ja analysointityöstä ai-

heutuu kustannuksia. Koska datan tallennusjärjestelmissä kapasiteetti on rajoitettu, se

Page 59: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

52

asettaa paineen kerättävän datan priorisoinnille. On tärkeää tietää mihin kysymykseen

halutaan vastaus ja mitä tietoa valitaan kerättäväksi. Montaa eri tietolähdettä käytettä-

essä datan täytyy olla samassa muodossa, jotta sitä voidaan analysoida ja tämä aiheut-

taa haasteita etenkin, jos järjestelmiä on hankittu monelta eri toimittajalta. Eri tietoläh-

teiden datan yhdistäminen on lisäksi vaikeaa ja, koska koulutusta koskevat päätökset

ovat yksilön kannalta merkittäviä, datasta tehdyt johtopäätökset täytyy tehdä asianmu-

kaisten standardien mukaan. (Bienkowski et al., 2012)

Henkilökohtaisten tietojen keräämisellä on vaikutuksia yksityisyydensuojaan. Kerät-

tyjen tietojen turvaaminen on todistetusti ongelmallista, mutta toisaalta yksilöllistämi-

nen onnistuu sitä paremmin mitä enemmän tietoa yksilöstä on kerätty. (Bienkowski et

al., 2012) Tietoa kerättäessä, tallennettaessa ja julkaistessa täytyy kiinnittää huomiota

yksityisyydensuojaan, menettelytapaan sekä laillisiin näkökohtiin. Suomessa yksityi-

syydensuojaa toteuttaa henkilötietolaki, joka määrittää mitä ja miten tietoa saa kerätä,

kuinka kerätty tieto suojataan ja mihin tietoa saa käyttää. (Henkilötietolaki, 1999/523)

4.5 Esimerkkejä datatieteen hyödyntämisestä verkko-opetuksessa

Tässä luvussa esitellään kolme eri tapausta, jossa datatiedettä on onnistuneesti sovel-

lettu verkko-opetukseen. Ensimmäinen, ja ehkä kuuluisin, tapaus tulee Yhdysvalloista

Purduen yliopistosta, jossa otettiin käyttöön eräänlainen opiskelun liikennevalojärjes-

telmä. Toinen tapaus tulee Iso-Britanniasta Nottingam Trentin yliopistosta, jossa si-

toutettiin opiskelijoita nk. dashboard-näkymän avulla. Viimeinen tapaus tulee yritys-

maailmasta, jossa parannettiin öljy- ja kaasuteollisuuden toimintatapoja koulutustyö-

kalun avulla.

4.5.1 Purduen yliopisto

Yhdysvaltojen Indianan osavaltiossa sijaitsevan Purduen yliopiston käynnistämä Sig-

nals-projekti on yksi oppimisen analytiikan siteeratuimmista esimerkeistä. (JISC,

2016) Signals-järjestelmän tarkoitus on opiskelijoille palautetta omasta edistymises-

tään tarpeeksi ajoissa, jotta he voisivat pyytää tukea mahdollisen arvosanan korotta-

Page 60: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

53

miseksi tai vaihtaakseen kurssia. Signals käyttää opintorekisteristä ja verkko-oppimis-

ympäristöstä kerättyä dataa ja muodostaa kerätystä datasta ”liikennevalot” näyttämään

kuinka riskialttiina kunkin opiskelijan opinnot ovat. Ennustava malli perustuu opiske-

lijan suoritustasoon (tähän asti ansaitut pisteet), työskentelyyn (toiminta verkko-oppi-

misympäristössä), aikaisempi koulumenestys sekä opiskelijan ominaisuudet, kuten ikä

tai yritetyt opintopisteet. Nämä muuttujat painotetaan ja syötetään algoritmiin, joka

tuottaa asianmukaisen liikennevalon värin. Punainen valo merkitsee suurta epäonnis-

tumisen todennäköisyyttä, keltainen mahdollisia ongelmia ja vihreä valo suurta onnis-

tumisen todennäköisyyttä.

Signals-järjestelmän avulla mahdolliset ongelmat havaitaan jo lukukauden toisella vii-

kolla. Opettajat voivat puuttua ongelmiin erilaisilla tavoilla kuten lähettää opiskelijalle

viestin sähköpostitse tai tekstiviestitse tai he voivat järjestää tapaamisen. Vihreän va-

lon voi lähettää positiivisena palautteena, jota opettaja voi täydentää positiivisella vies-

tillä. Negatiivinen palaute voidaan täydentää varoittavalla viestillä. Vaikutukset mitat-

tiin opiskelijoiden arvosanoista ja käytöksestä, jota varten mitattiin toimintaa verkko-

oppimisympäristössä sekä tuen hakemisessa. Kahden vuoden testijakson perusteella

voitiin todeta, että niillä kursseilla, jossa Signals-järjestelmä oli käytössä, oli enemmän

B ja C arvosanoja (12%) ja vastaavasti vähemmän D ja F arvosanoja2. Testijaksolla

perusteella havaittiin myös 14% lisäys niiden opiskelijoiden määrässä, jotka vaihtoivat

kurssia tarpeeksi ajoissa, etteivät heidän kurssiarvosanojen keskiarvonsa tippuneet.

Keskeyttäneiden opiskelijoiden määrä kuitenkin pysyi samana. Testijakson aikana

opiskelijat muuttivat käytöstään tultuaan tietoiseksi riskitasostaan. He pyysivät apua

aikaisemmin ja useammin ja vaikutus pysyi järjestelmän käytön lopettamisenkin jäl-

keen. Lisääntynyt tukipalveluiden hyödyntäminen koettiin hyvin tärkeänä samoin,

kuin opiskelijan ja opettajan välisen kommunikaation ja opiskelijoiden sitoutumisen

parantuminen. Opiskelijat olivat myös tyytyväisiä järjestelmän kautta tapahtuneeseen

viestintään, joka tuntui henkilökohtaiselta ja hyödylliseltä. (JISC, 2016)

2 Arvosana-asteikolla A-F, jossa A on paras arvosana ja F huonoin.

Page 61: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

54

4.5.2 Nottingham Trentin yliopisto

Yksi Ison-Britannian merkittävimmistä oppimisen analytiikan sovelluksista löytyy

Nottingham Trentin yliopistossa (NTU), jossa NTU Student Dashboard (suom. opis-

kelijan dashboard) otettiin käyttöön helpottamaan opiskelijoiden, heidän tutoreidensa

ja tukihenkilökunnan välistä kommunikaatiota. (JISC, 2014) Lähtökohtana oli paran-

taa opiskelijoiden sitoutumista sekä heidän saavutuksiaan. Aikaisempi tutkimus oli

paljastanut, että kolmasosa opiskelijoista oli harkinnut keskeyttämistä ensimmäisen

vuoden aikana. He olivat epävarmempia itsestään, välinpitämättömämpiä, muodosti-

vat heikompia sidoksia kanssaopiskelijoihinsa ja tutoreihin sekä todennäköisemmin

keskeyttivät aikaisessa vaiheessa. He jäivät ilman tutoreiden tukea, sillä he eivät pyy-

täneet apua. Näitä ongelmia varten dashboardiin suunniteltiin neljä avainominaisuutta.

Dashboard näyttää saman tiedon opiskelijoille ja henkilökunnalle; se lähettää tutoreille

viestin, jos opiskelija ei työskentele yli kahteen viikkoon; se mahdollistaa tutoreille

muistiinpanojen tekemisen opiskelijoiden kanssa sovituista töistä; sekä siihen ei sisäl-

lytetty demografista tietoa opiskelijasta vaan vain tietoa opiskelijan työnteosta kurssin

aikana. Käyttöönottoa helpotettiin tekemällä työkalusta helppokäyttöinen. Kuvassa 9

käy esille käyttöliittymän yksinkertaisuus.

Page 62: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

55

Kuva 9: Esimerkki opiskelijan dashboardista, henkilökunnan näkymä. (JISC, 2014)

Opiskelijan perustiedot kerätään opiskelijatietojärjestelmästä ja varsinainen sitoutu-

misdata kerätään verkko-oppimisympäristöstä ja kulunvalvontajärjestelmästä, tehtä-

vien palautusjärjestelmästä sekä kirjaston tietojärjestelmästä. Mitattavia asioita olivat

muun muassa kirjautumiset verkko-oppimisympäristöön, kulku laitoksen rakennuk-

siin, tehtävien palautusten ja kirjastolainauksien lukumäärä. Valittujen muuttujien pe-

rusteella jokaiselle opiskelijalle annetaan arvosana heidän sitoutumisensa mukaan:

”Korkea”, ”Hyvä”, ”Osittainen”, ”Matala” ja ”Ei Täysin Sitoutunut”.

Dashboardin avulla opiskelijat pystyvät vertaamaan sitoutumistaan muihin opiskeli-

joihin ja keskustelemaan siitä tutorinsa kanssa. Tutor pystyy analysoimaan dataa opis-

kelijaa tarkemmalla tasolla ja hänelle tulee myös ilmoitus, jos opiskelija ei näytä opis-

kelevan yli kahteen viikkoon. Viestin tarkoitus on edesauttaa tutorin ja opiskelijan vä-

listä viestintää.

Page 63: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

56

Jo ensitestistä lähtien oli selvää, että opiskelija sitoutuminen vaikutti positiivisesti

opiskelun etenemiseen sekä saavutuksiin. Jatkotutkimuksissa selvisi, että opiskelijan

sitoutumisen taso oli tärkeämpi suoritustason ennustaja kuin esimerkiksi opiskelijan

taustatiedot tai pääsykoetulokset. 81% viimeisen vuoden opiskelijoista, joilla oli kor-

kea sitoutumistaso, suorittivat opintonsa korkein arvosanoin, kun vain 42% alemman

sitoutumistason opiskelijoista ylti samaan tulokseen. 27% ensimmäisen vuoden opis-

kelijoista kertoivat muuttaneensa käytöstään dashboardin tietojen perusteella – osa

opiskelemalla enemmän, osa kilpailemalla keskenään sitoutumisen arvosanoista.

Myös tutoreiden käytös muuttui dashboardin käyttämisen myötä. Dashboardin myötä

he pystyivät kohdentamaan väliintulon paremmin – kolmasosa tutoreista otti opiskeli-

jaan yhteyttä sitoutumistiedon perusteella ja valtaosa tutoreista käyttivät dashboardia

vain kerran viikossa, eikä sillä ollut suurta vaikutusta työmäärään. (JISC, 2014)

Aloite sai vuoden 2014 Times Higher Education Award -palkinnon erinomaisesta

opiskelijatuesta.

4.5.3 PeT-työkalu

Öljy- ja kaasuteollisuudessa puutteellinen koulutus on johtanut useisiin merkittäviin

onnettomuuksiin ja jopa kuolemantapauksiin sekä äärimmäisen arvokkaisiin kalusto-

vahinkoihin ja vähentyneeseen tuottavuuteen. (Boulanger, Seanosky, Baddeley,

Kumar, & Kinshuk, 2014) Onnettomuuksia ja niistä johtuvia kustannuksia voitaisiin

estää tehokkaalla koulutusjärjestelmällä, jota varten kanadalainen tutkimusryhmä ke-

hitti PeT (Procedure evaluation/e-training) -työkalun menetelmien arviointia ja säh-

köistä koulutusta varten. Sen tarkoituksena oli todentaa vakiotoimintatapojen osaami-

nen, varmistaa työvoiman asianmukainen päätöksenteko hätätilanteessa, luoda päte-

vyysportfolio jokaiselle käyttäjälle sekä täydentämään käyttäjien tarvitsemaa tietoa ja

pätevyyttä toteuttaa kriittisiä ja ei-kriittisiä työtehtäviä.

Tietämystä kahdesta eri hätätilan toimintatavasta testattiin monivalintakysymyksillä ja

vastaukset luokiteltiin oikeiksi; vajaiksi, mutta oikeiksi; osittain oikeiksi; enimmäk-

seen vääriksi sekä täysin vääriksi. PeT keräsi dataa koesuorituksesta, kysymyksistä

Page 64: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

57

sekä vastausvalinnoista. Kerätystä datasta pystyttiin luomaan malli, jonka avulla voi-

tiin päätellä paitsi työntekijän tietämyksen taso, myös hänen käytöksensä hätätilanteen

sattuessa. Työkalua testattiin vuonna 2014 kahdessa erässä eri käyttäjillä, joilla oli eri-

laiset taustat ja osaamistasot. Tuloksista kävi ilmi, että PeT-työkalun avulla voidaan

tehokkaasti arvioida työvoiman tietämys ja käytös normaali- sekä hätätilanteissa. Se

mahdollistaa jäljitettävän työvoimakoulutuksen ja sen käyttö johtaa parempaan työtur-

vallisuuteen ja parempaan tuottavuuteen. (Boulanger et al., 2014)

4.6 Datatiedettä hyödyntäviä verkko-opetuksen tuotteita

Tässä luvussa kerrotaan kolmesta erilaisesta tuotteesta verkko-opetuksen ja datatieteen

rajapinnassa: Blackboard, Carnegie Learning Cognitive Tutor Algebra sekä SAP Suc-

cessFactors Learning Analytics.

Blackboard on verkko-oppimisympäristöjen markkinajohtaja. (Edutechnica, 2016)

Blackboard Analytics on sen analytiikka-alusta, joka hyödyntää oppimisen analytiik-

kaa. Sen datalähteenä voidaan käyttää muun muassa dataa verkko-oppimisympäris-

töstä, opiskelijatietojärjestelmästä, rahoituksesta ja henkilöstöresursseista. Sen avulla

voi vähentää opiskelijoiden keskeyttämisastetta, analysoida hakijoita, optimoida kou-

lutuslaitoksen taloudenpitoa sekä parantaa opiskelijoiden suorituksia. (Blackboard,

2016a) Lewis & Clark Community College -kansalaisopisto saavutti sen avulla

700 000 dollarin säästöt kolmen lukukauden aikana ja Central Piedmont Community

College -kansalaisopisto paransi sen avulla opiskelijoiden uudelleenilmoittautumisas-

tetta 23%. (Blackboard, 2014a, 2014b) Blackboard myös tuottanut X-Ray Learning

Analytics -lisäosan suosittuun ja avoimeen Moodle -verkko-oppimisympäristöön. Se

analysoi järjestelmän dataa ja tuottaa tietoa opiskelijoiden keskeyttämisriskistä sekä

heidän aktiivisuudestaan, arvosanoistaan sekä keskusteluistaan. (Blackboard, 2016b)

Carnegie Learning Cognitive Tutor (CT) Algebra on älykäs opetusjärjestelmä (ITS)

algebran opetukseen, joka on käytössä sadoissa tuhansissa kouluissa ja lukioissa ym-

päri maailman ja sitä käytetään yhä enemmän myös korkeakouluissa. CT esittää oppi-

materiaalia mukautetusti mallintamalla opiskelijan tietämystä tai osaamista aiheesta

Page 65: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

58

ongelmanratkaisun aikana. Tietämyksen mallintaminen tapahtuu BKT:n avulla. Opis-

kelija voi pyytää aiheen mukaisia vihjeitä sekä saa vastattuaan välittömän palautteen,

joka toisinaan koostuu vastauksen oikeellisuuden lisäksi tarkemmasta, aiheenmukai-

sesta palautteesta. CT:n tuottaman datan pohjalta on koulutustiedonlouhinnan mene-

telmien avulla kehitetty malleja tunnistamaan järjestelmän manipulaatiota, tehtävän-

ratkaisuun liittymätöntä toimintaa (eng. off-task behaviour) sekä tunnetiloja. (Fancsali

& Street, 2014)

SAP SuccessFactors Learning Analytics on osa yritysohjelmistojen markkinajohtaja

SAP:n verkko-oppimisympäristötuotetta. Se lähestyy oppimisen analytiikkaa yritysten

tarpeiden näkökulmasta ja pyrkii ennen kaikkea selvittämään, minkälaista vastinetta

sijoitukset henkilöstön koulutukseen tuottavat. Se tuottaa verkko-oppimisympäristön

keräämästä datasta tietoa liittyen yrityksen tarjoaman koulutuksen määrään, tyyppiin,

kustannuksiin ja vaikuttavuuteen. Mittareita ovat esimerkiksi koulutustunnit per opis-

kelija, koulutuksen läpäisykyky sekä kurssien suoritus- ja peruutustasot. Sen yksi

avainominaisuuksista on laajat raportointityökalut sekä oleellisen tiedon keskittävät

dashboardit. (SAP, 2016)

4.7 Datatieteen ja verkko-opetuksen yhteinen tulevaisuus

Tässä luvussa katsotaan hieman datatieteen ja verkko-opetuksen yhteiseen tulevaisuu-

teen ja havaitaan haasteita kasvavien tietomäärien käsittelyn kanssa sekä potentiaalista

kasvua eri sovelluskohteiden kanssa.

Analysoitavat tietomäärät jatkavat kasvamistaan ja tämä johtaa oppimisen ilmiöiden

ja prosessien yhä parempaan ymmärtämiseen, mutta suurten tietomäärien kanssa työs-

kentely tulee aiheuttamaan teknisiä haasteita. (Chatti et al., 2014) Tietomäärät kasva-

vat myös uusien datalähteiden käyttöönoton myötä. Käytettäviä datalähteitä tulevat

olemaan muun muassa luonnontieteisiin liittyvät simulaatiot, opettajien uutisryhmät,

koulupiirien arvosanajärjestelmät sekä opiskelijoiden yhteistyöstä kerätty data.

(Siemens & Baker, 2012a)

Page 66: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

59

Suuria datamääriä syntyy myös MOOCeissa, jossa datatiedettä on tähän asti käytetty

enimmäkseen keskeyttämisasteen parantamiseen, mutta potentiaalia sen käytölle löy-

tyy sieltä valtavasti, etenkin opiskelijan oppimiskokemuksen parantamisessa esimer-

kiksi mukautumisen, palautteen ja suosittelujen avulla. Mobiililaitteiden käytön li-

sääntymisen myötä opiskeluympäristössä ei ole enää rajoja, joten oppimisen konteks-

tista tulee entistä tärkeämpää, etenkin työvoiman kouluttamisessa, elinikäisessä oppi-

misessa ja itseopiskelussa, jossa oppiminen voi tapahtua työ- tai vapaa-aikana. Kon-

tekstitiedon tallentaminen mahdollistaa kontekstiriippumattoman oppimisen eli oppi-

miskokemus pysyy yhtenäisenä esimerkiksi työpäivän jälkeen vapaa-ajalle siirryttä-

essä. (Chatti et al., 2014)

Datatiedettä voidaan soveltaa koulutuksessa moneen eri tarkoitukseen ja jokaiseen

niistä tarvitaan omanlaisensa mittarit, jotka nykyisissä sovelluksissa ovat etukäteen

määritelty. Tämä rajoittaa niiden käyttöä ja jatkossa tulee olemaan kysyntää tuotteille,

jossa käyttäjä voi määritellä tavoitteensa ja mitattavat muuttujat. Tämä johtaa myös

avoimempiin tuotteisiin, josta näkee selkeästi mitä se mittaa ja mitä tarkoitusta varten.

Myös dashboard-painotteinen tiedon esittäminen tulee korvautumaan oikea-aikaisella

ja -paikkaisella tiedon esittämisellä. (Chatti et al., 2014)

Datatieteen käyttökohteet koulutuksessa tulevat lisääntymään. Sitä tullaan sovelta-

maan muun muassa opettavaisiin peleihin, opiskelijoiden väliseen kanssakäymiseen,

oppimiseen virtuaalitodellisuudessa sekä opettajankoulutukseen. (Siemens & Baker,

2012a)

Page 67: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

60

5 Pohdinta

Tässä tutkielmassa on esitelty verkko-opetusta, datatiedettä ja kuinka jälkimmäistä voi

soveltaa edelliseen. Siinä on käsitelty niiden historiaa, teoreettista pohjaa ja tarkoi-

tusta, punnittu niiden hyötyjä ja haittoja sekä avattu hieman niiden kehityssuuntia.

Kuten on tullut jo esille, oppimisdatan, niin kuin minkään muunkaan datan, analysoin-

nilla ei ole merkitystä, jos ei siitä ei ole hyötyä. Päinvastoin, datan ja ilmiöiden analy-

sointi ja tutkiminen ovat jopa resurssien tuhlausta, jos analyysin tuloksena syntyviä

ideoita ja ajatuksia ei jollain tavalla käytetä hyödyksi. Resursseja siihen tuleekin kulu-

maan, sillä datankeräysinfrastruktuurin pystyttäminen sekä tarvittavan osaamisen ja

työkalujen hankkiminen vaativat paljon aikaa tai rahaa ja todennäköisesti molempia.

Jotta varmistetaan, että panostetuille resursseille saadaan riittävästä vastinetta, täytyy

ennen koko datan analysoinnin prosessia määritellä mihin kysymykseen halutaan vas-

taus ja miksi. Pyrkimyksenä on datatiedeprosessista saavutettavan hyödyn maksi-

mointi eli toisin sanoen tärkeimmän kysymyksen tunnistaminen. Liiketaloudessa voisi

olla kyse rahassa mitattavasta ROI:sta ja akateemisissa piireissä oppimisen laadun

maksimointi. Kysymyksen määrittelyn merkitystä kuvaa kuuluisa sanonta ”Jos mi-

nulla olisi tunti aikaa ratkaista jokin ongelma, käyttäisin 55 minuuttia ongelman poh-

timiseen ja 5 minuuttia ratkaisuihin.”. Oikea kysymys johtaa sateenkaaren juurelle,

mutta väärä kysymys muuttaa datatieteen seireenin kutsuksi, joka lupaa satumaista on-

nea, mutta johtaa vain karikkoihin ja epäonneen.

Datatieteen käytössä verkko-opetuksessa on haasteensa, mutta en epäile, etteikö niistä

päästäisi yli tai vähintäänkin saadaan muodostettua hyväksyttäviä kompromisseja. Da-

tatiedettä ei vain ole varaa jättää käyttämättä verkko-opetuksessa – niin suuret siitä

saatavat hyödyt ovat. Tärkein hyöty verkko-opetuksen datatieteestä syntyy varmasti

opiskelijoille, jotka hyötyvät verkko-opetuksen data-analytiikasta monella tapaa. Op-

piminen parantuu, kun mukautuva oppimateriaali tarjoaa sopivan haastetason kehityk-

selle, oikea-aikainen ja henkilökohtainen palaute tukee oppimista sekä mahdollisuus

oman suoritustason vertaamisen muiden opiskelijoiden suoritustasoon voi motivoida.

Page 68: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

61

Parantunut opintopolkujen suunnittelu helpottaa opiskelun suunnittelua, vaikka henki-

lökohtaista opiskelijanohjausta ja -tukea tarvitaan vieläkin. Datatiedettä harjoitettaessa

tulisi kuitenkin olla mahdollisimman avoin opiskelijalle siitä datasta, mitä heistä kerä-

tään. Jos kerättävää dataa ei olla riittävän avoimia ja läpinäkyviä, on riski siitä, etteivät

opiskelijat tiedä mitä heidän toiminnastaan tallennetaan ja mitä ei. Tämä voi luoda

vähimmilläänkin epäselvyyttä sekä epäluottamusta ja pahimmillaan vainoharhaa,

koska jos ei tiedetä mitä mitataan, ihmiselle on luonteenomaista käyttäytyä kuin kaik-

kea mitataan ja tämä voi aiheuttaa turhaa stressiä opiskelijoille. Tietenkin on olemassa

riski, että jos tiedetään mitä mitataan, voidaan vaikuttaa suoraan niihin muuttujiin ja

käyttää niitä epäreilusti hyväksi ja se vääristää kerättyjä tuloksia. Tämä riski on otet-

tava ja suunniteltava analyysiprosessi sellaiseksi, että se käyttää hyväksi riittävää mää-

rää muuttujia, jotta muutaman manipulaatio ei vääristä tuloksia liiaksi.

Kerätystä datasta muodostettu opiskelijan oppimismalli tulisi voida tallentaa tietova-

rastoon, jota kautta sovellukset voisivat sitä käyttää. Ei ole järkeä kerätä opiskelijasta

tietoa koko oppimispolun ajan ja olla hyödyntämättä sitä sen jälkeen, kun hän lopettaa

viimeisetkin opintonsa. Etenkin nykyisenä elinikäisen oppimisen aikakautena olisi

hyvä saada jonkinlainen kansallinen varasto henkilökohtaiselle tiedolle, jonne oppi-

mismallin tai -profiilin voisi säilöä ja käyttää niin työhön, jatko-opiskeluun kuin va-

paa-aikaankin liittyvien opintojen yhteydessä.

Yksi tärkeä tekijä paremmissa oppimistuloksissa on myös parempi opetus, jonka da-

tatiede verkko-opetuksessa mahdollistaa. Mittarit, joista näkee opiskelijoiden tietä-

mys- ja suoritustason, oppimisprosessin haasteelliset kohdat sekä nopea ja henkilö-

kohtainen palautteen anto parantavat selkeästi opetusta. Mutta vain jos niitä käytetään.

Jo nykyisiin verkko-oppimisympäristöihin siirryttäessä on kohdattu vahvaakin muu-

tosvastarintaa opettajissa. Osaksi se on terveellistä hyödyn kyseenalaistamista, ettei

omaksuta suin päin uusia teknologioita, mutta etenkin silloin, kun hyödyt on jo toteen

näytetty, voi olla kyse muutoksen pelosta ja haluttomuudesta uusiutua. Tätä voidaan

lievittää merkittävästä hiomalla verkko-oppimisympäristöjen ja oppimisen hallintajär-

jestelmien sekä niiden analyyttisten työkalujen käytettävyys huippuunsa. Ohjelmisto-

jen käyttökynnys on saatava mahdollisimman alas ja tehdä vaivattomaksi käyttää.

Page 69: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

62

Preskriptiivisen analytiikan keinoin sen voi tehdä jopa kädestä pitävän ohjaavaksi.

Toisaalta kehittyneille käyttäjille on annettava myös enemmän mahdollisuuksia ja työ-

kaluja käyttöön.

Datatieteen käytöstä verkko-opetuksessa hyötyvät myös koulutuslaitokset ja koulu-

tusta tarjoavat työpaikat. Opiskelijoiden parempi suoriutuminen on toki sinänsä jo kil-

pailuvaltti, mutta koska datatiede myös tehostaa opettamista, opettajat ja kouluttajat

voivat kouluttaa suuremman määrän opiskelijoita vähemmällä vaivalla. Näin korote-

tusta opiskelun tasosta hyötyvät yhä useammat opiskelijaa, etenkin koska datatieteen

avulla voidaan vähentää opiskelijoiden keskeyttämistä.

Edellä esiteltyjen tulevaisuuden kuvauksien lisäksi odotan, että verkko-opetus yhdis-

tetään preskriptiiviseen analytiikkaan, josta saatavat suosittelut voisivat parantaa ope-

tuksen tasoa. Näen mielessäni jo opettajan dashboardin, jossa kurssin suoritustietoja

tarkastellessa voisi hälytyksen lailla tulla esille, että tämä tietty kurssinosa aiheuttaa

ongelmia opiskelijoille ja tässä toimintaehdotus sen parantamiseksi. Opettaja saisi tie-

tenkin käyttää omaa harkintakykyään ongelman vahvistamiseen ja korjaamiseen,

mutta suositukset varmasti virtaviivaistaisivat opetusprosessia. Preskriptiivisestä ana-

lytiikasta olisi hyötyä etenkin suurten opiskelija- ja kurssimäärien kanssa työskennel-

lessä, jolloin pienetkin optimoinnit kertautuvat suuriksi hyödyiksi.

Lisääntyvä AR- (Augmented Reality, lisätty todellisuus) ja VR- (Virtual Reality, vir-

tuaalitodellisuus) -teknologioiden käyttö luo myös kiehtovia mahdollisuuksia datatie-

teelle ja verkko-opetukselle. Käyttäjän toiminnan ja tietotason perusteella mukautuvat

virtuaaliympäristöt tuntuvat lähes käsittämättömiltä, mutta ovat mahdollisia toteuttaa

lähitulevaisuudessa. Esimerkiksi aloitteleva biologian opiskelija pääsisi tutustumaan

lammen eliöstöön uimalla siellä virtuaalisesti, kun taas osaavampi opiskelija voi löytää

itsensä virtuaalisesta viidakosta tutkimassa jo sukupuuttoon kuolleita eliölajeja. AR

voisi olla mielenkiintoinen lisä visualisointiteknologioihin. Opettaja voisi luokkaa

opettaessaan nähdä opiskelijoiden suoritustiedot ja niihin liittyvät ilmoitukset lisättynä

kerroksena todellisuuden päällä. Näin ei olisi tarvetta katsoa koko ajan dashboardia

vaan tiedon saa suoraan kontekstissaan.

Page 70: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

63

Viitteet

Ali, M. (2016). Data Science Process: How to collect the right data. Retrieved June

2, 2016, from https://www.linkedin.com/pulse/data-science-process-how-

collect-right-mohammed-ali

Altintas, I., & Gupta, A. (2016). Acquiring Data. Retrieved June 2, 2016, from

https://www.coursera.org/learn/intro-to-big-data/lecture/esxnG/step-1-

acquiring-data

Arkorful, V., & Abaidoo, N. A. (2015). The role of e-learning, advantages and

disadvantages of its adoption in higher education. International Journal of

Instructional Technology and Distance Learning, 12(1), 29–43.

Auvinen, P., Hirvonen, K., Maso, R. D., & Kallberg, K. (2007). Opetussuunnitelma

ammattikorkeakoulussa.

Baker, R. S., Corbett, A. T., Koedinger, K. R., & Wagner, A. Z. (2004). Off-task

behavior in the cognitive tutor classroom: When students “game the system.”

Proceedings of the ACM Conference on Human Factors in Computing Systems,

383–390. http://doi.org/10.1145/985692.985741

Baker, R. S. J. D., Corbett, A. T., & Aleven, V. (2008). More accurate student

modeling through contextual estimation of slip and guess probabilities in

bayesian knowledge tracing. Lecture Notes in Computer Science (Including

Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in

Bioinformatics), 5091 LNCS, 406–415. http://doi.org/10.1007/978-3-540-

69132-7-44

Bandyopadhyay, R. (2016). The Data Science Process. Retrieved June 2, 2016, from

http://www.kdnuggets.com/2016/03/data-science-process.html

Berry, J. (1994). Database Marketing. Businessweek. Retrieved from

http://www.bloomberg.com/news/articles/1994-09-04/database-marketing

Bertolucci, J. (2013). Big Data Analytics: Descriptive Vs. Predictive Vs.

Prescriptive. InformationWeek. Retrieved from

Page 71: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

64

http://www.informationweek.com/big-data/big-data-analytics/big-data-

analytics-descriptive-vs-predictive-vs-prescriptive/d/d-id/1113279

Bienkowski, M., Feng, M., & Means, B. (2012). Enhancing teaching and learning

through educational data mining and learning analytics: An issue brief.

Washington, DC: SRI International, 1–57. Retrieved from

http://www.ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf

Bitzer, D. L., Lyman, E. R., & Easley, J. A. J. (1966). The uses of Plato: a computer

controlled teaching system. In H. Goldhor (Ed). 1966. Proceedings of the 1966

Clinic on Library Applications of Data Processing, 107(2), 34–46. Retrieved

from https://www.ideals.uiuc.edu/handle/2142/1760

Blackboard. (2014a). Blackboard Analytics for Student and Institutional Insight.

Blackboard. Improving the re-enrollment rate through proactive outreach (2014).

Blackboard. (2016a). Blackboard Analytics. Retrieved June 25, 2016, from

https://www.blackboard.com/education-data-analytics/blackboard-

analytics.aspx

Blackboard. (2016b). X-Ray Learning Analytics. Retrieved June 24, 2016, from

https://en-us.help.blackboard.com/Moodlerooms/Teacher/Track_Progress/X-

Ray_Learning_Analytics

Boulanger, D., Seanosky, J., Baddeley, M., Kumar, V., & Kinshuk. (2014). Learning

Analytics in the Energy Industry: Measuring Competences in Emergency

Procedures. Technology for Education (T4E), 2014 IEEE Sixth International

Conference on. http://doi.org/10.1109/T4E.2014.44

Bucky, C. (2016). Intro to data analysis. Retrieved March 15, 2016, from

https://www.udacity.com/course/intro-to-data-analysis--ud170

Chang, K. M., Beck, J., Mostow, J., & Corbett, A. (2006). A bayes net toolkit for

student modeling in intelligent tutoring systems. Lecture Notes in Computer

Science (Including Subseries Lecture Notes in Artificial Intelligence and

Lecture Notes in Bioinformatics), 4053 LNCS, 104–113.

http://doi.org/10.1007/11774303_11

Page 72: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

65

Chatti, A. M., Lukarov, V., Thüs, H., Muslim, A., Yousef, F. A. M., Wahid, U., …

Schroeder, U. (2014). Learning Analytics: Challenges and Future Research

Directions. Eleed, 10(1). Retrieved from http://nbn-

resolving.de/urn:nbn:de:0009-5-40350

Contact North. (2013). Reducing Costs through Online Learning. Retrieved from

http://teachonline.ca/sites/default/files/tools-

trends/downloads/reducing_costs_through_online_learning.pdf

Conway, D. (2015). The Data Science Venn Diagram. Retrieved May 14, 2016, from

http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

Cross, J. (2004). An informal history of eLearning. On the Horizon, 12(3), 103–110.

http://doi.org/10.1108/10748120410555340

D’Mello, S. K., Craig, S. D., Witherspoon, A., McDaniel, B., & Graesser, A. (2008).

Automatic detection of learner’s affect from conversational cues. User

Modeling and User-Adapted Interaction, 18(1-2), 45–80.

http://doi.org/10.1007/s11257-007-9037-6

Davenport, T. H. (2013). Telling a Story with Data : Communicating effectively with

analytics. Deloitte Review. Retrieved from http://dupress.com/articles/telling-a-

story-with-data/

Edutechnica. (2016). LMS Data – Spring 2016 Updates. Retrieved from

http://edutechnica.com/2016/03/20/lms-data-spring-2016-updates/

Emin-Martínez, V., Hansen, C., Rodríguez-Triana, M. J., Wasson, B., Mor, Y.,

Dascalu, M., … Pernin, J.-P. (2014). Learning Analytics and Assessment.

Elearning Papers, (36), 1–48. Retrieved from

www.openeducationeuropa.eu/en/elearning_papers

Fancsali, S., & Street, G. (2014). Causal Discovery with Models : Behavior , Affect ,

and Learning in Cognitive Tutor Algebra. Proceedings of the 7th International

Conference on Educational Data Mining (EDM), (Edm), 28–35. Retrieved from

http://educationaldatamining.org/EDM2014/uploads/procs2014/long

papers/28_EDM-2014-Full.pdf

Page 73: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

66

Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to

knowledge discovery in databases. AI Magazine, 37–54.

http://doi.org/10.1145/240455.240463

Granville, V. (2014). Best solution to a problem: data science versus statistical

paradigm. Retrieved June 27, 2016, from

http://www.datasciencecentral.com/profiles/blogs/best-solution-to-a-problem-

data-science-versus-statistical-paradi

Greitzer, F. L. (2002). A Cognitive Approach to Student-Centered E-Learning.

Proceedings of the Human Factors and Ergonomics Society Annual Meeting,

46(25), 2064–2068. http://doi.org/10.1177/154193120204602515

Guo, P. (2013). Data Science Workflow. Retrieved May 3, 2016, from

http://cacm.acm.org/blogs/blog-cacm/169199-data-science-workflow-overview-

and-challenges/fulltext

Gutierrez, D. D. (2014). Ask a Data Scientist: The Data Science Process. Retrieved

June 2, 2016, from http://insidebigdata.com/2014/11/12/ask-data-scientist-data-

science-process/

Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., & Witten, I. H.

(2009). The WEKA Data Mining Software: An Update. SIGKDD Explorations,

11(1).

Halo Business Intelligence. (2016). Descriptive, Predictive, and Prescriptive

Analytics Explained. Retrieved June 30, 2016, from

https://halobi.com/2014/10/descriptive-predictive-and-prescriptive-analytics-

explained/

Harris, N., & Sandor, M. (2007). Developing online discussion forums as student

centred peer e-learning environments. Ascilite 2007 - ICT: Providing Choices

for Learners and Learning, 383–387. Retrieved from

www.ascilite.org.au/conferences/singapore07/procs/harris.pdf

Harvard. (2016). Data Science Certificate. Retrieved June 27, 2016, from

https://www.extension.harvard.edu/academics/professional-graduate-

Page 74: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

67

certificates/data-science-certificate

Hellström, M. (2008). Sata sanaa opetuksesta - Keskeisten käsitteiden käsikirja.

Jyväskylä: PS-kustannus.

Helsingin yliopisto. (2016). MOOC on väylä yliopistoon. Retrieved June 30, 2016,

from http://mooc.fi/courses/2016/ohjelmoinnin-mooc/opinto-oikeus.html

Henkilötietolaki, Pub. L. No. 523 (1999).

Ihanainen, P., Hietala, P., Mäkinen, P., Rannikko, S., & Keskinen, A. (2004).

Verkko-oppimisen käytäntöjä, malleja ja työkaluja. Helsinki: Opetushallitus.

Ilomäki, L. (2008). Sähköä opetukseen! : digitaaliset oppimateriaalit osana

oppimisympäristöä. Retrieved from

https://oula.linneanet.fi/vwebv/holdingsInfo?bibId=1025066\nhttp://www.oph.fi

/download/46732_sahkoa_opetukseen.pdf

Ilvonen, I., Jussila, J., & Kukko, M. (2013). Tietojohtaminen. Tampere.

Jain, P. (2013). Data Science or Analytics? Retrieved May 3, 2016, from

http://www.forbes.com/sites/piyankajain/2013/02/25/data-science-or-analytics/

JISC. (2014). CASE STUDY I : Predictive analytics at Nottingham.

JISC. (2016). CASE STUDY A : Traffic lights and interventions : Signals at Purdue

University. Retrieved from

https://analytics.jiscinvolve.org/wp/files/2016/04/CASE-STUDY-A-Purdue-

University.pdf

Jokela, M. (2011). Mitä tieto on? Retrieved May 10, 2016, from http://inside-the-

plm.blogspot.fi/p/mita-tieto-on_12.html

Kevan, J. M., & Ryan, P. R. (2016). Experience API: Flexible, Decentralized and

Activity-Centric Data Collection. Technology, Knowledge and Learning, 21(1),

143–149. http://doi.org/10.1007/s10758-015-9260-x

Koedinger, K., McLaughlin, E., & Stamper, J. (2012). Automated Student Model

Improvement. Educational Data Mining, Proceedings of the 5th International

Conference on, 17–24. http://doi.org/10.978.17421/02764

Page 75: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

68

Koohang, A., Riley, L., Smith, T., & Schreurs, J. (2009). E-Learning and

Constructivism : From Theory to Application E-Learning and E-Learning

Design What is Constructivism ? Elearning, 5, 91–109. Retrieved from

http://www.mendeley.com/research/elearning-constructivism-theory-

application-elearning-elearning-design-constructivism/

Kotimaisten kielten keskus. (2016). Kielitoimiston sanakirja. Retrieved from

http://www.kielitoimistonsanakirja.fi/

Lakkala, M. (2002). Verkko-oppimisen organisointi ja ohjaaminen kohti tutkivaa

ongelmakeskeistä oppimista.

Laney, D. (2015). The Gartner Analytic Continuum. Retrieved June 29, 2016, from

https://twitter.com/doug_laney/status/611172882882916352

Lepistö, L. (2008). Ammatillinen opettajakorkeakoulu, 1–34.

Lohr, S. (2014). For Big-Data Scientists, “Janitor Work” Is Key Hurdle to Insights.

New York Times. Retrieved from

http://www.nytimes.com/2014/08/18/technology/for-big-data-scientists-hurdle-

to-insights-is-janitor-work.html

Loukides, M. (2010). What is data science? Retrieved April 12, 2016, from

https://www.oreilly.com/ideas/what-is-data-science

Macfadyen, L. P., & Dawson, S. (2010). Mining LMS data to develop an “early

warning system” for educators: A proof of concept. Computers and Education,

54(2), 588–599. http://doi.org/10.1016/j.compedu.2009.09.008

Manninen, J. (2001). Verkko-pedagogiikka. Retrieved from

http://tievie.oulu.fi/koulutusresurssit/kalvot/2001/espoo/verkkopedagogiikka_te

oriaa_ja_kaytantoa.pdf

Marr, B. (2014). Big Data: The 5 Vs Everyone Must Know. Retrieved May 14, 2016,

from https://www.linkedin.com/pulse/20140306073407-64875646-big-data-the-

5-vs-everyone-must-know

Marr, B. (2015). Big Data In The Amazing World of Gaming. Retrieved June 2,

2016, from http://www.datasciencecentral.com/profiles/blogs/big-data-in-the-

Page 76: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

69

amazing-world-of-gaming

Marr, B. (2016a). Big Data: A Game Changer in Healthcare. Retrieved June 2, 2016,

from http://www.forbes.com/sites/bernardmarr/2016/05/24/big-data-a-game-

changer-in-healthcare

Marr, B. (2016b). Big Data: Will We Soon No Longer Need Data Scientists?

Retrieved June 5, 2016, from

http://www.forbes.com/sites/bernardmarr/2016/04/27/will-we-soon-no-longer-

need-data-scientists/

Marr, B. (2016c). How Big Data And Analytics Are Transforming The Construction

Industry. Retrieved June 2, 2016, from

http://www.forbes.com/sites/bernardmarr/2016/04/19/how-big-data-and-

analytics-are-transforming-the-construction-industry

Marr, B. (2016d). How VR Will Revolutionize Big Data Visualizations. Retrieved

June 6, 2016, from http://www.forbes.com/sites/bernardmarr/2016/05/04/how-

vr-will-revolutionize-big-data-visualizations/

Marr, B. (2016e). Why “Big Data” Means Nothing Without “Little Data.” Retrieved

June 28, 2016, from http://www.forbes.com/sites/bernardmarr/2016/06/23/why-

big-data-means-nothing-without-little-data/

MastersInDataScience.org. (2016). Data Science in Insurance. Retrieved June 30,

2016, from http://www.mastersindatascience.org/industry/insurance/

Matsudaira, K. (2015). Communications, 58(06), 44–47.

http://doi.org/10.1145/2745390

Nevgi, A., Löfström, E., & Evälä, A. (2005). Laadukkaasti verkossa: Yliopistollisen

verkko-opetuksen ulottuvuudet (Vol. 7).

NYU. (2013). What is Data Science? Retrieved June 27, 2016, from

http://cds.nyu.edu/research/

Opetushallitus. (2011). Tieto- ja viestintätekniikka opetuskäytössä - Välineet,

vaikuttavuus ja hyödyt. Tilannekatsaus toukokuu 2011. Retrieved from

http://www.oph.fi/julkaisut/2011/tieto_ja_viestintatekniikka_opetuskaytossa

Page 77: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

70

Pandey, R. (2014). Building Analytics into the Insurance Value Chain. Retrieved

June 2, 2016, from http://www.analyticbridge.com/profiles/blogs/building-

analytics-into-the-insurance-value-chain

Parkin, S. (2015). Gaming Your Brain. ESPN The Magazine. Retrieved from

http://espn.go.com/espn/story/_/id/13065280/video-game-data-science-profit

Patil, D. J. (2011). Building data science teams. Retrieved May 31, 2016, from

http://radar.oreilly.com/2011/09/building-data-science-teams.html

Piatetsky-Shapiro, G. (2012). From Data Mining to Big Data and Beyond. Retrieved

June 27, 2016, from http://insideanalysis.com/2012/04/data-mining-and-beyond/

Pirilä, A. (2013). VERKKO-OPETUKSEN MAHDOLLISUUDET JA HAASTEET.

Retrieved from

https://publications.theseus.fi/bitstream/handle/10024/60502/Pirila_Armi.pdf

Press, G. (2013). A Very Short History Of Data Science. Retrieved May 17, 2016,

from http://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-

data-science/

Provost, F., & Fawcett, T. (2013). Data Science and its Relationship to Big Data and

Data-Driven Decision Making. Data Science and Big Data, 1(1), 51–59.

http://doi.org/10.1089/big.2013.1508

Pylkkä, O. (2010). Oppimiskäsitykset. Retrieved January 17, 2016, from

http://oppimateriaalit.jamk.fi/oppimiskasitykset/

Quitzau, A. (2014). Big Data Analytics in Energy & Utilities. Retrieved from

http://www.slideshare.net/AndersQuitzauIbm/big-data-analyticsin-energy-

utilities

Raitala, S., & Ylilehto, H. (2012). Parempi oppia yhdessä – tukea eTwinning-

hankkeesta.

RapidMiner. (2016). RapidMiner. Retrieved June 20, 2016, from

http://rapidminer.com/

Rodrigo, M., Baker, R., McLaren, B., Jayme, A., & Dy, T. (2012). Development of a

Page 78: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

71

workbench to address the educational data mining bottleneck. Proceedings of

the 5th International Conference on Educational Data Mining, 152–155.

Rojas, N. (2015). Healthcare Industry Finds New Solutions to Big Data Storage

Challenges. Retrieved June 2, 2016, from

http://www.datasciencecentral.com/profiles/blogs/healthcare-industry-finds-

new-solutions-to-big-data-storage

Ryann K. Ellis. (2010). A Field Guide to Learning management systems.

International Anesthesiology Clinics, 48(3), 27–51.

http://doi.org/10.1097/AIA.0b013e3181e5c1d5

SAP. (2016). SAP SuccessFactors Learning Analytics.

Schutt, R., & O’Neil, C. (2013). Doing data science.

http://doi.org/10.5860/CHOICE.51-6803

Sclater, N., Peasgood, A., & Mullan, J. (2016). Learning analytics in higher

education : A review of UK and international practice Full report, (April), 40.

Retrieved from https://www.jisc.ac.uk/sites/default/files/learning-analytics-in-

he-v2_0.pdf

Sen, S. (2016). Caring about Analytics for HR. Retrieved June 2, 2016, from

http://www.datasciencecentral.com/profiles/blogs/caring-about-analytics-for-hr

Shung, K. P. (2014). Stages in the Analytics/Data Science Process. Retrieved June 2,

2016, from https://www.linkedin.com/pulse/20140822130955-4710606-stages-

in-the-analytics-data-science-process

Siemens, G., & Baker, R. S. J. D. (2012a). Learning analytics and educational data

mining. Proceedings of the 2nd International Conference on Learning Analytics

and Knowledge - LAK ’12, 252. http://doi.org/10.1145/2330601.2330661

Siemens, G., & Baker, R. S. J. d. (2012b). Learning Analytics and Educational Data

Mining: Torwards Communication and Collaboration. Proceedings of the 2nd

International Conference on Learning Analytics and Knowledge - LAK ’12,

252–254. http://doi.org/10.1145/2330601.2330661

Siemens, G., Gasevic, D., Haythornthwaite, C., Dawson, S., Buckingham Shum, S.,

Page 79: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

72

Ferguson, R., … Oblinger, D. G. (2007). Open Learning Analytics: an

integrated & modularized platform Proposal to design, implement and evaluate

an open platform to integrate heterogeneous learning analytics techniques

Project Overview. EDUCAUSE Review, 42(4), 53–54.

Small, G., & Vorgan, G. (2008). Meet Your iBrain. Scientific American Mind, 19(5),

42–49. Retrieved from

http://search.ebscohost.com.ezproxy.uef.fi:2048/login.aspx?direct=true&db=ap

h&AN=34939318&site=ehost-live

Stanton, J. (2013). An introduction to data science. Syracuse University, (2012), 195.

Stone, D. E., & Zheng, G. (2016). Learning Management Systems in a Changing

Environment. Handbook of Research on Education and Technology in a

Changing Society, (JANUARY 2014), 756–767. http://doi.org/10.4018/978-1-

4666-6046-5.ch056

Swan, A., & Brown, S. (2008). The skills, role and career structure of data scientists

and curators: An assessment of current practice and future needs. A Report to

the Joint Information Systems Committee (JISC), July, 34. Retrieved from

http://www.jisc.org.uk/media/documents/programmes/digitalrepositories/dataski

llscareersfinalreport.pdf

Taipalmaa, H. (2008). VERKKO-OPETUSMENETELMÄT.

Tella, S., Vahtivuori, S., Vuorento, A., Wager, P., & Oksanen, U. (2001). Verkko

opetuksessa – opettaja verkossa. Helsinki: Edita.

Tervo, U. (2012). VERKKO-OPETTAJAN ABC Risto Kivipensas.

The R Project for Statistical Computing. (2016). Retrieved June 30, 2016, from

https://www.r-project.org/

Upadhyaya, M. (2014). Impact of big data on analytics. Retrieved May 31, 2016,

from https://www.slideshare.net/slideshow/embed_code/36866068

Walker, B. (2015). Every Day Big Data Statistics. Retrieved April 12, 2016, from

http://www.vcloudnews.com/every-day-big-data-statistics-2-5-quintillion-bytes-

of-data-created-daily/

Page 80: Waltteri Turunen Pro gradu -tutkielma · tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä ... and the section ends with the presentation of

73

Walker, M. (2012a). Data Veracity. Retrieved May 14, 2016, from

http://www.datasciencecentral.com/profiles/blogs/data-veracity

Walker, M. (2012b). Predictive, Descriptive, Prescriptive Analytics. Retrieved June

2, 2016, from www.analyticbridge.com/profiles/blogs/predictive-descriptive-

prescriptive-analytics

Walker, M. (2013). Data Science and Predictive Analytics Strategy for Marketing.

Retrieved from http://www.datasciencecentral.com/profiles/blogs/data-science-

and-predictive-analytics-strategy-for-marketing

Veermans, M. (2004). Keksivä oppiminen. Laatua E-Oppimateriaaleihin. Retrieved

from http://www.opetushallitus.fi/download/144415_Laatua_e-

oppimateriaaleihin_2.pdf#page=100

Wladawsky-Berger, I. (2014). Why Do We Need Data Science when We’ve Had

Statistics for Centuries? Retrieved June 27, 2016, from

http://blog.irvingwb.com/blog/2014/04/why-do-we-need-data-science-when-

weve-had-statistics-for-centuries.html

Vorhies, W. (2014). Types and Uses of Predictive Analytics, What they are and

Where You Can Put Them to Work. Retrieved June 27, 2016, from

http://www.datasciencecentral.com/profiles/blogs/types-and-uses-of-predictive-

analytics-what-they-are-and-where

Wu, M. (2013a). Big Data Reduction 2: Understanding Predictive Analytics.

Retrieved June 2, 2016, from https://community.lithium.com/t5/Science-of-

Social-blog/Big-Data-Reduction-2-Understanding-Predictive-Analytics/ba-

p/79616

Wu, M. (2013b). Big Data Reduction 3: From Descriptive to Prescriptive. Retrieved

June 5, 2016, from https://community.lithium.com/t5/Science-of-Social-

blog/Big-Data-Reduction-3-From-Descriptive-to-Prescriptive/ba-p/81556