puheentutkimuksen resurssit ett£¤ ihminen voi...

Download Puheentutkimuksen resurssit ett£¤ ihminen voi v£¤litt£¤£¤ tietoa sis£¤isist£¤ tarpeistaan ja ulkoisesta

Post on 04-Feb-2020

0 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • PUHEENTUTKIMUKSEN RESURSSIT SUOMESSA

  • PUHEENTUTKIMUKSEN RESURSSIT SUOMESSA

    toimittaneet Juhani Toivanen ja Manne Miettinen

    CSC – Tieteellinen laskenta Oy

  • c �

    CSC – Tieteellinen laskenta Oy 2001

    ISBN 952-9821-76-X ��������� � ������� ������� ����� ����������������� ������� �

  • Puheentutkimuksen resurssit Suomessa 5

    Esipuhe

    Idea tämän esiselvityksen tekemiseen on lähtöisin opetusministeriön omista- man tieteen tietotekniikan keskuksen CSC:n kielitieteen palvelun johtoryh- mästä. Esiselvitys on toteutettu opetusministeriöltä saadun 100 000 markan määrärahan turvin. Esiselvitykselle asetettiin kaksi tavoitetta: ensimmäinen tavoite oli kartoittaa kattavasti suomenkielistä puhetta tutkivien tieteenalojen nykytila ja tulevaisuudennäkymät Suomessa, toinen tavoite oli esittää kartoi- tuksen pohjalta joukko toimenpiteitä, joilla puheentutkimuksen edellytyksiä voitaisiin parantaa maassamme.

    Esiselvityshanke alkoi marraskuussa 2000. Syksyn pohjatyö kulminoitui Hel- singin yliopistossa 13. joulukuuta 2000 järjestettyyn seminaariin Puheen- tutkimuksen resurssit Suomessa. Kyselylomakkeet lähetettiin helmikuussa 2001 44:ään puheentutkimusta harjoittavaan tutkimuslaitokseen ja yrityk- seen. Toukokuussa 2001 pyydettiin lisäksi kuutta puheentutkimuksen eri alo- jen asiantuntijaa kirjoittamaan asiantuntija-arvio alansa nykytilasta, tulevai- suudennäkymistä ja kehittämistarpeista.

    Hankkeen ohjausryhmän muodostivat professori Matti Karjalainen (Teknil- linen korkeakoulu), professori Kimmo Koskenniemi (Helsingin yliopisto), tutkimusjohtaja Kari Laurila (Nokia Research Center), erikoistutkija Marja- Leena Sorjonen (Kotimaisten kielten tutkimuskeskus), kehittämispäällikkö Juha Sylberg (Näkövammaisten kirjasto), tutkija Martti Vainio (Helsingin yliopisto) ja arkistonjohtaja Lauri Vihonen (Yleisradio). Haluamme toimit- tajina kiittää ohjausryhmää kannustavasta ohjauksesta. Lisäksi asiantuntija- arvioiden kirjoittajat Lauri Carlson, Matti Karjalainen, Matti Laine, Unto K. Laine, Mikko Sams, Kari Suomi ja Martti Vainio, kyselyyn vastanneet pu- heentutkijat sekä eri tavoin oman panoksensa raportin syntyyn antaneet Too- mas Altosaar, Roope Havu, Jyrki Hokkanen ja Eija Koskenlinna ansaitsevat niin ikään lämpimät kiitoksemme.

    Kaikki raportin mahdolliset virheet ja epätarkkuudet ovat toimittajien vas- tuulla.

    Espoossa ja Oulussa 13.8.2001

    Juhani Toivanen ja Manne Miettinen

  • 6 Puheentutkimuksen resurssit Suomessa

    Tiivistelmä

    Puhetta tutkitaan eri puolella Suomea pienissä muutaman hengen tutkimus- ryhmissä. Yhteiskunnan muutos ja teknologisoituminen ovat luoneet puheen- tutkimukselle uusia tehtäviä, joihin vanhat rakenteet eivät pysty vastaamaan. Puheentutkimusyksiköiden maantieteellinen ja tieteenalakohtainen eristynei- syys sekä yksiköiden pieni koko haittaavat merkittävästi puheentutkimuksen edistymistä Suomessa.

    Tutkimuksen rahoittajat voisivat parantaa puheentutkimuksen edellytyksiä Suomessa tukemalla:

    ! vähintään yhden yli 20 tutkijan kokoisen yksikön syntymistä, jonka tutkimuksella on selvä painopistealue

    ! tutkimushankkeita, joissa luodaan siltoja eri puheentutkimuksen aluei- den, erityisesti humanistisen puheentutkimuksen ja puheteknologian tutkijoiden välille

    ! puheentutkimuksen eri alueiden verkostoitumista ! tutkimusaineistojen kokoamista ja käyttöä koskevien yhteisten stan-

    dardien ja pelisääntöjen laatimista

    ! olemassaolevien tutkimusaineistojen käytön koordinointia ! pitkän aikavälin monitieteistä perustutkimusta puhutun kielen olemuk-

    sen selvittämiseksi

    ! perus- ja jatkokoulutuksen uudelleen organisointia monitieteiseen suun- taan

  • Puheentutkimuksen resurssit Suomessa 7

    English summary

    Speech and spoken language is studied by a number of small research groups scattered around Finland. The fast pace of globalisation and information tech- nology have created new demands for speech research, that are not suppor- ted by the existing organisational structures. Especially the small size and geographical dispersion of the research units create serious barriers for the advancement of speech research in Finland.

    The research funding and policy should be directed so that:

    ! at least one larger and focused research unit with over 20 researchers will be created

    ! new multidisciplinary research programs are launched to bring toget- her the different traditions of humanistic and technological speech re- search.

    ! common standards and recommendations are created for the compila- tion and use of speech databases

    ! use of existing resources is better coordinated ! there will be long-term multidisciplinary basic research to understand

    the essence of spoken language

    ! education is reorganized in a more multidisciplinary way

  • 8 Puheentutkimuksen resurssit Suomessa

    Sisältö

    Esipuhe 5

    Tiivistelmä 6

    English summary 7

    1 Johdanto 9 1.1 Puheentutkimuksen merkitys Suomelle . . . . . . . . . . 9 1.2 Raportin tarkoitus ja rakenne . . . . . . . . . . . . . . . 10

    2 Monimuotoinen puhe 12 2.1 Fysikaalinen puhe . . . . . . . . . . . . . . . . . . . . . 12 2.2 Sosiaalinen puhe . . . . . . . . . . . . . . . . . . . . . 14

    3 Asiantuntija-arvioiden tiivistelmä 16 3.1 Tutkimuksen nykytila . . . . . . . . . . . . . . . . . . . 16 3.2 Tulevaisuudennäkymät . . . . . . . . . . . . . . . . . . 17 3.3 Puhetietokannat . . . . . . . . . . . . . . . . . . . . . . 17

    4 Vastausten analyysi 18 4.1 Yhteenveto . . . . . . . . . . . . . . . . . . . . . . . . 18 4.2 Puheen tuottamisen ja havaitsemisen perustutkimus . . . 19 4.3 Puheteknologian tutkimus . . . . . . . . . . . . . . . . . 20 4.4 Puhekielen ja kielellisen variaation tutkimus . . . . . . . 21 4.5 Dialogin ja kielellisen vuorovaikutuksen tutkimus . . . . 22 4.6 Kaupallinen puheteknologian tutkimus . . . . . . . . . . 23

    5 Toimenpide-ehdotukset 24

  • Sisältö 9

    Liitteet 25

    A Asiantuntija-arviot 26

    B Vastaukset 40 B.1 Akustiikan ja äänenkäsittelytekniikan laboratorio (TKK) 40 B.2 Digitaali- ja tietokonetekniikan laitos (TTKK) . . . . . . 43 B.3 Digitaalisen median instituutti (TTKK) . . . . . . . . . . 45 B.4 Elisan tutkimuskeskus . . . . . . . . . . . . . . . . . . . 47 B.5 Fonetiikan laitos (HY) . . . . . . . . . . . . . . . . . . . 48 B.6 Fonetiikka (TUY) . . . . . . . . . . . . . . . . . . . . . 51 B.7 Institutionaalisen vuorovaikutuksen tutkimusyksikkö . . 53 B.8 Kognitiivisen tieteen ja teknologian tutkimusryhmä (TKK) 54 B.9 Kotimaisten kielten tutkimuskeskus . . . . . . . . . . . . 56 B.10 Lingsoft Oy . . . . . . . . . . . . . . . . . . . . . . . . 58 B.11 MediaTeam (OY) . . . . . . . . . . . . . . . . . . . . . 59 B.12 Neuroverkkojen tutkimusyksikkö (TKK) . . . . . . . . . 61 B.13 Nokian tutkimuskeskus . . . . . . . . . . . . . . . . . . 62 B.14 Näkövammaisten keskusliitto . . . . . . . . . . . . . . . 63 B.15 Puheopin laitos (TAY) . . . . . . . . . . . . . . . . . . . 64 B.16 Suomen kielen laitos (HY) . . . . . . . . . . . . . . . . 69 B.17 Suomen kielen laitos (JYU) . . . . . . . . . . . . . . . . 71 B.18 Suomalaisen ja yleisen kielitieteen laitos (TUY) . . . . . 73 B.19 Suomen kielen ja kulttuuritieteiden laitos (JOY) . . . . . 75 B.20 Suomen kielen ja yleisen kielitieteen laitos (TAY) . . . . 76 B.21 Suomen kielen jaos (OY) . . . . . . . . . . . . . . . . . 78 B.22 TAUCHI-tutkimusryhmä (TAY) . . . . . . . . . . . . . . 80 B.23 Timehouse Oy . . . . . . . . . . . . . . . . . . . . . . . 83 B.24 Vieraiden kielten laitos (JOY) . . . . . . . . . . . . . . . 84

  • 10 Puheentutkimuksen resurssit Suomessa

    1 Johdanto 1.1 Puheentutkimuksen merkitys Suomelle

    Globalisaatio yhdessä tieto- ja viestintäteknologian kanssa muodostavat en- nen näkemättömän suuren uhan suomen ja muiden kotimaisten kielten ase- malle. Automaattiseen puheentunnistukseen ja puhesynteesiin (eli puhetek- nologiaan) perustuvat sovellukset ja palvelut yleistynevät lähivuosina osaksi ihmisten arkipäivää. Pienten kielten asema on vaarassa heikentyä ellei nii- den avulla voi käyttää myös uusia puheteknologiaan perustuvia sovelluksia ja palveluita.

    Kansainväliset suuryritykset eivät juurikaan huolehdi pienten kielten sovel- luksista, sillä niiden keskinäisessä kilpailussa ja markkinoiden turvaamisessa avainasemassa ovat suuret ja vauraat kielialueet, joiden puhujamäärät las- ketaan kymmenissä miljoonissa. Microsoftin kaltaiset jättiläisyritykset ovat porrastaneet eri kielille annettavan tuen tärkeysjärjestykseen markkinoiden koon mukaan. Suomen kieli ei tällä listalla yllä kovinkaan korkealle sijal- le. Tuki pienille kielille voi kokonaan jäädä toteutumatta tai aikataulutetaan huomattavasti englannin kieltä myöhemmäksi. Kansainväliset suuryritykset eivät välttämättä aseta samoja vaatimuksia pienten kielten tuen laadulle kuin valtakielille. Monet suomalaiset ovat jo nyt sopeutuneet käyttämään tietoko- neohjelmien englanninkielisiä versiota. Saako suomalainen puheteknologian sovelluksen käyttäjä lähitulevaisuudessa asiansa paremmin hoidetuksi puhu- malla huonoa englantia kuin äidinkieltään? Tällainen kehitys uhkaisi koti- maisten kielten asemaa ja johtaisi vanhempien ja vähemmän koulutettujen ihmisten syrjäytymiseen.

    Kotimaisten kielten puheteknologian saatavuuden takaaminen on siis tär- keä kansallinen tehtävä. Tavoitetta e