Open AI može da klonira ljudski glas na osnovu 15 sekundi snimka realnog glasa
Prema tvrdnji kompanije, Vojs endžin je prvi put razvijen 2022. godine i njegova početna verzija je korišćena za pretvaranje teksta u govor za potrebe AI modela Čet Dži-Pi-Ti (Chat GPT).
Na veb stranici kompanije Open AI je objavljeno nekoliko audio primera pravog ljudskog glasa i njegovih sintetičkih kopija koje je generisala veštačka inteligencija. Takođe, saopšteno je da ova moćna tehnologija za sada neće biti javno dostupna zbog mogućih opasnosti i zloupotreba.
We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024
"Vojs endžin predstavlja nastavak naših napora da razumemo granice tehnološkog razvoja i podelimo sa javnošću mogućnosti veštačke inteligencije", navodi se u saopštenju Open AI.
Kompanija je rekla da se raduje razgovorima o izazovima i mogućnostima nove tehnologije kloniranja glasova.
"Važno je da ljudi širom sveta shvate kuda ova tehnologija vodi, bez obzira da li je mi sami široko primenjujemo ili ne", zaključuje Open AI.