Tekoäly mullistaa puhesynteesin käytön viestinnässä

Nykyään puhesynteesi pohjautuu usein tekoälyyn, jossa tekoälyn avulla mallinnetaan oikean ihmisen puheesta mm. sen äänensävy ja intonaatio, jonka avulla luodaan ohjelmoitu malli ihmisäänestä. Mallin avulla puhesynteesiä käyttävä tietokoneohjelma kykenee luomaan kirjoitetusta tekstistä lähes aidolta kuulostavaa ihmisääntä. Esimerkiksi TikTokista tuttu naisääni perustuu radiojuontaja Kat Callaghanin ääneen. Vaikka TikTok-Jessie onkin pääasiassa muodostunut jo melkein meemiksi itsessään, on se myös tärkeä osa TikTokin kaltaisten palvelujen saavutettavuutta – ääni on erityisen tärkeä huononäköisille, koska oikein käytettynä se avustaa ihmistä ymmärtämään TikTokin pääsääntöisesti visuaalista sisältöä paremmin. (CBC 2022.) Katso Kat Callaghanin Twiitti.

Ihmispuhetta imitoiva tekoäly

Tekoälysovellusten yleistyessä puheäänen ja äänensävyjen oppimiseen käytetyt mallit ovat tulleet laajemmin saataville ja Internetistä löytyykin useita palveluja, joissa tekstiä voi muuntaa puheeksi eri puheääniä hyödyntäen. Kaupalliseen käyttöön tarkoitetut palvelut tarjoavat ammattimaisesti mallinnettuja puheääniä muun muassa videoiden selostukseen, mainosvideoääniksi sekä vaikkapa tekstimuotoisten oppaiden saattamiseksi kuunneltavaksi materiaaliksi heikkonäköisiä varten.

Äänen syntetisointi koneoppimisen avulla luo myös ongelmia. Ohjelmat ovat kaikkien käytettävissä, jolloin tekoälylle voidaan opettaa uusia ääniä minkä tahansa äänilähteen avulla. Tämä mahdollistaa ihmisten äänien kloonauksen ilman heidän lupaansa – jo YouTubesta löytyvä puhetta sisältävä video kelpaa puhesynteesin lähdeaineistoksi. Mitä suurempi opetusaineisto on, sitä laadukkaampi synteesistä saadaan. Puhesynteesin avulla onkin jo nyt mahdollista asettaa sellaisia sanoja ihmisten suuhun, joita he eivät koskaan tosielämässä puhuisi. Mahdollisuudet ovat rajattomat vaikkapa poliittisen toimijan tai julkisuuden henkilön maineen sabotoinnille sosiaalisessa mediassa. Palvelut kuten Voice.ai ja Uberduck mahdollistavat jo nyt äänen syntetisoinnin Barack Obamasta Donald Trumpiin. (Voice.ai ja Uberduck 2023.)

Koneoppimisen kehittyessä puhesynteesin käyttö tulee yleistymään niin sosiaalisessa mediassa kuin yleisemminkin markkinoinnissa. Mainostajat käyttävät tällä hetkellä sosiaalisen median palveluissa samoja työkaluja kuin muut sisällöntuottajat ja esimerkiksi TikTokissa ”Jessien” ääntä kuullaan myös monen mainostajan videolla (Seay, E. 2022). Osana yrityksen ja palvelun äänibrändäystä markkinoinnissa on yleisesti totuttu käyttämään usein samaa, brändiin sopivaa ääninäyttelijää, jonka tarkoitus markkinoinnissa on myös erottaa brändi kilpailijoistaan. Samoja sosiaalisen median työkaluja käyttäessä mainoksista häviää tämä tärkeä brändejä erottava ominaisuus. Tulevaisuudessa osana yrityksen äänibrändäystä voikin olla joko ääninäyttelijän syntetisoitu ääni tai kokonaan tekoälyllä luotu uusi brändin arvoja kuvastava mainosääni.

Viimeisimmät artikkelimme

Jäähyväiset Nextille

Yhteisöllisyys työssä ei ole mielipideasia

Nuorten hyvinvointi ja kestävät kulkumuodot

Selaa julkaisukategorioittain

Lue lisää

Tekoäly mullistaa puhesynteesin käytön viestinnässä

Ihmispuhetta imitoiva tekoäly

Lue lisää