SAVRŠEN KLON ZA 15 SEKUNDI: Veštačkoj inteligenciji potrebno minimalno vreme da sintetizuje realističan glas
OPENAI je predstavio „Vojs Endžin“, revolucionarnu AI platformu za pretvaranje teksta u govor.

Foto Shutterstock
Kroz glasovni snimak od samo 15 sekundi, ova najnovija OpenAI inovacija može da sintetizuje realističan glas sposoban da čita tekst na više jezika, što bi moglo da ima ogroman uticaj na različite industrije.
OpenAI-jev post na blogu naglašava važnost preliminarnih implementacija u oblikovanju etičkih razmatranja i istraživanja u različitim aplikacijama.
Značajni korisnici ove tehnologije uključuju kompanije Age of Learning, Dimagi, Livox i Lifespan kao i HeyGen AI video generator, od kojih svaki koristi „Vojs Endžin“ u različite svrhe. Age of Learning ga, na primer, koristi za generisanje unapred pripremljenog glasovnog sadržaja i isporuku personalizovanih odgovora učenicima.
Razvoj „Vojs Endžin“-a datira od 2022. godine, a njegova evolucija je kulminirala u unapred podešenim glasovima za API, za pretvaranje teksta u govor i ČetGPT-ovu funkciju „Rid Alaud“. Džef Haris iz OpenAI tima za proizvode otkrio je da je model prošao obuku na osnovu mešavine licenciranih i javno dostupnih podataka, naglašavajući njegovu čvrstu osnovu.
GLASOVNA AI TEHNOLOGIJA SE ŠIRI
Pejzaž zvuka generisanog veštačkom inteligencijom nastavlja da se širi, a „Vojs Endžin“ označava značajan korak u tom razvoju. Međutim, etička razmatranja su velika, kao što pokazuje nedavni mandat američkog FCC-a koji zabranjuje glasovne pozive sa veštačkom inteligencijom, što je upozoravajuća priča koja odražava zabrinutost koju je izneo sam OpenAI.
OpenAI partnerstvo predviđa poštovanje strogih pravila korišćenja, uključujući dobijanje izričitog pristanka od originalnog govornika, uzdržavanje od lažnog predstavljanja i otkrivanje AI porekla slušaocima. Vodeni žig dalje obezbeđuje sledljivost i odgovornost u korišćenju zvuka, odražavajući proaktivan stav OpenAI u ublažavanju potencijalne zloupotrebe.
Postoji niz predloga za ublažavanje rizika povezanih sa glasovnom tehnologijom vođenom veštačkom inteligencijom, uključujući mere kao što su postepeno ukidanje glasovne autentifikacije za bankarstvo, jake politike koje štite individualne glasove, povećana svest javnosti o dubokim lažnjacima veštačke inteligencije i razvoj sveobuhvatnog praćenja sistema za sadržaj generisan AI.
Kroz proaktivne mere i zajedničke napore, transformativni potencijal „Vojs Endžin“ -a može se odgovorno iskoristiti, najavljujući novu eru u interakciji čoveka i mašine, prenosi portal The Verge.
sputnikportal.rs
BONUS VIDEO - ZAJEDNIČKA VEŽBA: Kina, Rusija i Iran sa zajedničkom budućnošću
Preporučujemo

NIJE NI KUPILA KARTU, NA PLAŽI JOJ PONUDILI BESPLATNU VOŽNjU: Novi detalji tragične smrti Novosađanke u Budvi
TINEJDžERKA je, kako kaže njen blizak prijatelj, bila devojka puna života, imala je mnogo planova za budućnost, a tek je imala 19 godina, i ceo život je bio pred njom, a sada je čitava njena porodica zavijena u crno.
30. 05. 2025. u 14:42

UKRAJINA IZVELA JEDAN OD NAJVEĆIH NAPADA NA RUSIJU: Aerodromi u Moskvi zatvoreni, uništena važna fabrika (VIDEO)
UKRAJINA je tokom noći izvela jedan od najvećih napada dronovima od početka rata, gađajući više ciljeva na teritoriji Rusije. Zbog napada su moskovski aerodromi bili primorani da privremeno obustave rad, što je izazvalo haos u vazdušnom saobraćaju.
28. 05. 2025. u 09:45

POSTOJI DRUGI SNIMAK Koji je uzrok ponašanja devojke stradale u Budvi? Psiholog objašnjava: "Ekstremni strah i fokus da se pobegne"
"ZA TEZU da je beg iz situacije opasne sa suženom svešću više goovri o tome da se radi o ekstremnogm strahu koji može da se protumači kao panika. Ako nije dolazila u takve situacije ne možemo znati da li je sklona tome ako ne zna da li ima napad panike."
30. 05. 2025. u 13:33 >> 13:33
Komentari (0)