Majkrosoft lansira AI alat koji generiše video iz slike - rezultati su neverovatno realistični
Pokreti usana su 'izvanredno sinhronizovani' sa audio zapisom, tako da izgleda kao da je subjekt oživeo, tvrdi tehnološki gigant. Na korisnicima je da obezbede sliku i audio zapis, a VASA-1 će generisati video snimak osobe koja govori sa prirodnim izrazima lica i širokim spektrom emocija.
Majkrosoft je na svom vebu prestavio nekoliko primera slika ljudi koji su "oživeli" u realističnom video snimku i počeli da reprodukuju traženi audio zapis, odnosno da izgovaraju reči. U jednom primeru, remek-delo iz 16. veka Leonarda da Vinčija, Mona Liza, počinje da repuje sa američkim akcentom.
Programeri Majkrosofta navode da je nova neuronska mreža znatno naprednija u odnosu na ranije modele, kao i da su pokreti glave i izrazi lica veoma uverljivi.
Video je dostupan u rezoluciji 512x512 piksela sa smenjivanjem 40 slika (frejmova) u sekundi, sa malim početnim kašnjenjem.
Kompanija veruje da će neuronska mreža pomoći u stvaranju realističnih avatara koji imitiraju ljudsko ponašanje tokom razgovora.
Majkrosoft ne planira da u bliskoj budućnosti izbaci ovaj proizvod na tržište zbog mogućih zloupotreba i prevara. Međutim, stručnjaci su izrazili zabrinutost u vezi sa ovom tehnologijom, koja bi, ako bi bila objavljena, mogla dovesti ljude u zabludu jer ovako generisan video može da izgleda kao da ljudi izgovaraju stvari koje nikada nisu rekli.