okroadshow mikkeli 13.10.2014: sovelluksia ja viisautta avoimesta tekstidatasta

17
Timo Honkela, 13.10.2014 Sovelluksia ja viisautta avoimesta tekstidatasta Timo Honkela Mikkeli, 13.10.2014 Helsingin yliopisto Nykykielten laitos Kansalliskirjasto Digitointi- ja konservointikeskus

Upload: digitalmikkeli

Post on 26-May-2015

58 views

Category:

Business


0 download

DESCRIPTION

Avoimen tiedon kuntakiertue - Open Knowledge Roadshow - Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta / Timo Honkela, Helsingin yliopisto, Kansalliskirjasto

TRANSCRIPT

Page 1: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela

Mikkeli, 13.10.2014Helsingin yliopistoNykykielten laitos

KansalliskirjastoDigitointi- ja

konservointikeskus

Page 2: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

VALUES POWER

Page 3: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

VALUES POWER

Page 4: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

NEEDS ECONOMY

Page 5: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

NEEDS ECONOMY

Page 6: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

UNDERSTANDING KNOWLEDGE

Page 7: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

UNDERSTANDING KNOWLEDGE

Page 8: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Kansalaiset

Kuluttajat

Äänestäjät

AsiakkaatOppijat

TutkijatPäättäjät

Yritykset

Matkailijat

Kuntoilijat

VALTAVATTEKSTIMASSAT

Page 9: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

TEKSTINLOUHINTA

Page 10: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Example:

Complexity ofFinnish at thelevel of wordforms

Kimmo Koskenniemi (2013):Johdatus kieliteknologiaan,sen merkitykseen ja sovelluksiin(Introduction to language technology, its significance andapplications)

https://helda.helsinki.fi/bitstream/handle/10138/38503/kt-johd.pdf?sequence=1

Page 11: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Kemia

Fysiikka, muut luonnon-ja insinööritieteet

Bio- jaympäristö-tieteet

Terveyden tutkimus

Kulttuurin jayhteiskunnan

tutkimus

Suomen tieteen kartta

(Honkela & Klami 2007)

Page 12: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Quality texts

OCR texts

Language model

Evaluation

CorrectionBettertexts

Productionsystem

DIGRA project / OCR-tulostenjatkojalostus (Mikkeli+Helsinki)

http://www.ifla.org/files/assets/newspapers/Geneva_2014/s6-honkela-en.pdf

Page 13: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Text mining for peer support

TOPIC ANALYSIS SENTIMENT ANALYSIS

Discussion forum postings, etc.

Selected stories

STYLEANALYSIS

MULTICRITERIA SELECTION PROCESS

User modelingand analysis of

feedback

EVALUATION

User'sinput

(Hon

kela

, Iz

zatd

ust,

Lag

us 2

012)

Page 14: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

ICA of wellbeing-related termsin Reddit texts

(Honkela, Izzatdust, Lagus 2012)

Page 15: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

GICA: Grounded IntersubjectiveConcept Analysis

Hon

kela

et

al.

IJC

NN

201

2

Page 16: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

Analysis of “health” in theState of the Union addresses

Subjects on objects in contexts: Using GICA method to quantify epistemological subjectivity. Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.Proc. of IJCNN 2012.

Page 17: OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta

Timo Honkela, 13.10.2014

KIITOS!KIITOS!