Mesterséges intelligencia adta vissza egy rádióriporter hangját

Mesterséges intelligencia segítségével kapta vissza a hangját egy amerikai rádióriporter, aki egy ritka idegrendszeri betegség miatt két éve nem tud beszélni. Az 54 éves Jamie Dupree, a Cox Media riportere “új hangját” a skót CereProc technológiai cég készítette. Korábbi hangfelvételei alapján megtanították egy ideghálózatnak – ami a gépi tanulás működésének alapja -, megjósolni, hogy fog Dupree elmondani egy szöveget.

“Ez megmentette az állásomat és a családomat az anyagi csődtől. Nincs túl sok lehetőség az olyan rádióriporter számára, aki nem tud beszélni” – mondta a BBC-nek a rádiós.

Forrás: Jamie Dupree

Ahhoz, hogy egy ember beszédhangját a gép reprodukálja, általában harmincórás felolvasásra van szükség, ez alatt tud a mesterséges intelligencia elég adatot gyűjten. A mesterséges intelligenciáknak eddig egy hónap kellett ahhoz, hogy egy ember hangját reprodukálják, a módszer nagyon drága is volt. A CereProc 2006-ban kezdte kidolgozni saját ideghálózatát, hogy a folyamatot felgyorsítsa és olcsóbbá tegye. Ma ez néhány nap alatt, mindössze 500 fontért (185 ezer forint) elkészíti egy ember hangját, ha a felhasználó a cég portálján felveszi a saját hangját, amint egy szöveget felolvas. A

A mesterséges intelligencia minden felolvasott szót száz apró részletre bont. Sok gyakran használt szó felbontása után végül megtanulja a felolvasó ember hangképzésének működését és minden egyes szóhoz hozzárendeli a benne lévő fonetikai elemek sorrendjét. Az ideghálózat saját hangokat is képes előállítani és meg tudja jósolni, hogyan hangzana, ha egy adott ember egy beszélgetésben elmondana egy sor szót.

Forrás: CereProc

Dupree 35 éven át politikai tudósításokat készített az Egyesült Államok Kongresszusából. 2016-ban kezdte elveszíteni a hangját, bár hangszálai, torka és gégéje rendben voltak. Hosszas vizsgálatok után megállapították, hogy ritka idegrendszeri zavar miatt a nyelve előreesik a szájüregbe és a torka megfeszül, valahányszor meg akar szólalni, így képtelen egyszerre két-három szónál többet kimondani. A riporter mégsem hagyta abba a munkát, interjúkat írt, de az éterből eltűnt a hangja.

Munkaadója a CereProchoz fordult, melynek segítségével Dupree június 25-től újra “megszólalhat”: megírja a szövegét, amit egy program beszéddé alakít és az ő hangján hangzik el a rádióban. “Kétségtelen, hogy én szólalok meg, ugyan kicsit robotszerűen, de senki sem ígérte, hogy tökéletes lesz” – mondta Dupree.


Ha érdekesnek találod a cikket,
oszd meg ismerőseiddel is!


Ha érdekesnek találod a cikket,
oszd meg ismerőseiddel is!