Magazin

Open AI može da klonira ljudski glas na osnovu 15 sekundi snimka realnog glasa

1. apr 2024 15:19

| Obnovljeno: 1. apr 2024 14:47

Kalifornijska kompanija Open AI predstavila je novi alat Vojs endžin (Voice Engine) koji može da klonira bilo koji ljudski glas ako ima na raspolaganju samo 15 sekundi realnog glasa te osobe.

Open AI može da klonira ljudski glas na osnovu 15 sekundi snimka realnog glasa

Prema tvrdnji kompanije, Vojs endžin je prvi put razvijen 2022. godine i njegova početna verzija je korišćena za pretvaranje teksta u govor za potrebe AI modela Čet Dži-Pi-Ti (Chat GPT).

Na veb stranici kompanije Open AI je objavljeno nekoliko audio primera pravog ljudskog glasa i njegovih sintetičkih kopija koje je generisala veštačka inteligencija. Takođe, saopšteno je da ova moćna tehnologija za sada neće biti javno dostupna zbog mogućih opasnosti i zloupotreba.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024

"Vojs endžin predstavlja nastavak naših napora da razumemo granice tehnološkog razvoja i podelimo sa javnošću mogućnosti veštačke inteligencije", navodi se u saopštenju Open AI.

Kompanija je rekla da se raduje razgovorima o izazovima i mogućnostima nove tehnologije kloniranja glasova.

"Važno je da ljudi širom sveta shvate kuda ova tehnologija vodi, bez obzira da li je mi sami široko primenjujemo ili ne", zaključuje Open AI.