Puheesta tekstiksi ja tekstistä ruututekstiksi – ihmisen ja koneen yhteistyönä

Yle on julkisen palvelun mediayhtiö, jonka moniin yhteiskunnallisiin tehtäviin kuuluu myös TV-ohjelmien tekstittäminen erityisryhmille, kuten kuulovammaisille ja kieltä opetteleville katsojille. Lingsoft on toimittanut ohjelmatekstityspalveluja Ylelle vuodesta 2011.

Yleisradio on julkisen palvelun mediayhtiö, ”koko kansan Yle”. Sen tehtävänä on ”tukea kansanvaltaa ja vahvistaa suomalaista kulttuuria sekä näyttää monipuolinen ja monikulttuurinen kuva maailmasta” – tuottaa ohjelmia ja palveluja tv:ssä, radiossa ja verkossa kaikille tasapuolisesti.

Ylen moniin yhteiskunnallisiin tehtäviin kuuluu myös TV-ohjelmien tekstittäminen erityisryhmille, kuten kuulovammaisille ja kieltä opetteleville katsojille. Vuoden 2018 loppuun mennessä Ylen tulee tekstittää 100 % kotimaisesta ohjelmatuotannostaan, suomenkieliset ohjelmat suomeksi ja ruotsinkieliset ruotsiksi. Saavutettavuusvaatimus käsittää etukäteen tallennettujen ohjelmien lisäksi suorat ja lähes suorat lähetykset, kuten uutiset tai ajankohtaisohjelmat.

Tekstitys ei ole vain tekstiä

Yle panostaa ohjelmatekstityksen laatuun. Asiasisällön välittämisen lisäksi tekstitysten tulee heijastaa puhekielen ominaispiirteitä, mutta samalla noudattaa kirjoitetun kielen rakenteita. Ruututekstien tulee olla vaivatta luettavissa, joten puhuttua tekstiä täytyy lyhentää ja tiivistää. Myös repliikkien ajastus on tekstityksen seuraamisen kannalta tärkeää: tekstityksen tulee noudattaa sekä puheen että ohjelman kuvallisen kerronnan rytmiä, jolloin tekstitys toimii saumattomasti ja on katsojalle lähes huomaamaton.

Automaatio asiantuntijan apuna

Ohjelmatekstitykset on perinteisesti nähty ja tehty puhtaasti käsityönä. Lingsoft on kuitenkin alusta pitäen sekä hyödyntänyt että kehittänyt ohjelmatekstitysprosessissaan eri teknologioita. Yksi niistä on automaattinen puheentunnistus, jonka avulla ohjelman puhe muunnetaan tekstiksi joko suoraan ääniraidalta tai uudelleenpuhunnan (ns. respeakaus) avulla.

Pelkkä puheentunnistus ei kuitenkaan riitä, vaan tunnistettu teksti tiivistetään ja ajastetaan Lingsoftin kielianalyysiteknologoiden avulla. Tekstitysalgoritmi ottaa huomioon niin lukuajat, sallitut merkkimäärät, kohtaustenvaihdot, rivityssäännöt kuin monia muitakin kielellisiä ja tyylillisiä konventioita. Kun kone on tehnyt esivalmistelut, ohjelmatekstittäjä voi keskittyä ruututekstien viimeistelyyn ja hienosäätöön – nyansseihin ja katsojakokemuksen optimointiin.

Puhe muuttuu siis ihmisen ja teknologian yhteistyössä ensin tekstiksi, sitten tekstistä ruututekstiksi – saumattomaksi osaksi katselukokemusta.