Tekoäly mullistaa puhesynteesin käytön viestinnässä

Puhesynteesin, eli ihmispuheen koneellisen mallintamisen historia ulottuu 1950-luvulle. Puhesynteesi on toiminut historiansa aikana ihmisten apuvälineenä sekä tehostekeinona elokuvissa ja musiikissa, mutta 2020-luvulla puhesynteesi on myös vahvasti osa sosiaalista mediaa ja markkinointia. Puhesynteesiä kuullaan päivittäin mm. TikTokissa, jossa meemien päälle liitetty koneääni ”Jessie” puhuu ylikorostavan innostuneesti.

Nykyään puhesynteesi pohjautuu usein tekoälyyn, jossa tekoälyn avulla mallinnetaan oikean ihmisen puheesta mm. sen äänensävy ja intonaatio, jonka avulla luodaan ohjelmoitu malli ihmisäänestä. Mallin avulla puhesynteesiä käyttävä tietokoneohjelma kykenee luomaan kirjoitetusta tekstistä lähes aidolta kuulostavaa ihmisääntä. Esimerkiksi TikTokista tuttu naisääni perustuu radiojuontaja Kat Callaghanin ääneen. Vaikka TikTok-Jessie onkin pääasiassa muodostunut jo melkein meemiksi itsessään, on se myös tärkeä osa TikTokin kaltaisten palvelujen saavutettavuutta – ääni on erityisen tärkeä huononäköisille, koska oikein käytettynä se avustaa ihmistä ymmärtämään TikTokin pääsääntöisesti visuaalista sisältöä paremmin. (CBC 2022.) Katso Kat Callaghanin Twiitti.

Ihmispuhetta imitoiva tekoäly 

Tekoälysovellusten yleistyessä puheäänen ja äänensävyjen oppimiseen käytetyt mallit ovat tulleet laajemmin saataville ja Internetistä löytyykin useita palveluja, joissa tekstiä voi muuntaa puheeksi eri puheääniä hyödyntäen. Kaupalliseen käyttöön tarkoitetut palvelut tarjoavat ammattimaisesti mallinnettuja puheääniä muun muassa videoiden selostukseen, mainosvideoääniksi sekä vaikkapa tekstimuotoisten oppaiden saattamiseksi kuunneltavaksi materiaaliksi heikkonäköisiä varten.  

Äänen syntetisointi koneoppimisen avulla luo myös ongelmia. Ohjelmat ovat kaikkien käytettävissä, jolloin tekoälylle voidaan opettaa uusia ääniä minkä tahansa äänilähteen avulla.  Tämä mahdollistaa ihmisten äänien kloonauksen ilman heidän lupaansa – jo YouTubesta löytyvä puhetta sisältävä video kelpaa puhesynteesin lähdeaineistoksi. Mitä suurempi opetusaineisto on, sitä laadukkaampi synteesistä saadaan. Puhesynteesin avulla onkin jo nyt mahdollista asettaa sellaisia sanoja ihmisten suuhun, joita he eivät koskaan tosielämässä puhuisi. Mahdollisuudet ovat rajattomat vaikkapa poliittisen toimijan tai julkisuuden henkilön maineen sabotoinnille sosiaalisessa mediassa. Palvelut kuten Voice.ai ja Uberduck mahdollistavat jo nyt äänen syntetisoinnin Barack Obamasta Donald Trumpiin. (Voice.ai ja Uberduck 2023.) 

Koneoppimisen kehittyessä puhesynteesin käyttö tulee yleistymään niin sosiaalisessa mediassa kuin yleisemminkin markkinoinnissa. Mainostajat käyttävät tällä hetkellä sosiaalisen median palveluissa samoja työkaluja kuin muut sisällöntuottajat ja esimerkiksi TikTokissa ”Jessien” ääntä kuullaan myös monen mainostajan videolla (Seay, E. 2022). Osana yrityksen ja palvelun äänibrändäystä markkinoinnissa on yleisesti totuttu käyttämään usein samaa, brändiin sopivaa ääninäyttelijää, jonka tarkoitus markkinoinnissa on myös erottaa brändi kilpailijoistaan. Samoja sosiaalisen median työkaluja käyttäessä mainoksista häviää tämä tärkeä brändejä erottava ominaisuus. Tulevaisuudessa osana yrityksen äänibrändäystä voikin olla joko ääninäyttelijän syntetisoitu ääni tai kokonaan tekoälyllä luotu uusi brändin arvoja kuvastava mainosääni.  

Lähteet

ToneSpectra.com. (21.8.2010). Early Computer Speech Synthesis. Saatavissa: https://www.youtube.com/watch?v=ebK4wX76RZ4 [viitattu 20.4.2023]. 

Canadian Broadcasting Company. (2022). Meet Kat Callaghan: The Kitchener, Ont. woman behind TikTok’s text-to-speech voice. Saatavissa: https://www.cbc.ca/news/canada/kitchener-waterloo/tiktok-kat-callaghan-voice-1.6698948 [viitattu 20.4.2023]. 

Seay, E. The New Sound of Opportunity: What AI Voice Branding Means for You. Branding Magazine. Saatavissa: https://www.brandingmag.com/eric-seay/the-new-sound-of-opportunity-what-ai-voice-branding-means-for-you [viitattu 20.4.2023]. 

Uberduck. 2023. The Open Source Voice AI Community. Saatavissa: https://www.uberduck.ai [viitattu 20.4.2023]. 

Voice.ai. 2023. Free Real Time Voice Changer. Saatavissa: https://www.voice.ai [viitattu 20.4.2023]. 

Pin It on Pinterest