Proiectul Deep Voice a pornit la Baidu acum un an și are ca scop învățarea computerelor să genereze audio dintr-un text care să sune cât mai real. Un fel de test Turing, dar pentru audio, adică să se poată confunda vocea umană cu cea robotică.
Sistemul de la Baidu, care încă nu va fi comercializat, dar care va putea fi folosit în viitor de companii sau chiar guverne, poate să reproducă mii de voci după un antrenament de doar jumătate de oră.
Clonarea vocii, în schimb, e o problemă și mai complexă, pentru că reprezintă posibilitatea de a reproduce vocea unui om după doar câteva propoziții sau câteva secunde ascultate. Cu ajutorul clonării vocii, sistemele inteligente vor putea să interacționeze mai bine cu oamenii, pentru a suna cât mai natural. De asemenea, am putea chiar avea asistenți personali care să reproducă vocea părinților sau bunicilor. Sau chiar a persoanelor care au decedat. Imaginați-vă că s-ar putea face un asistent vocal cu vocea lui Winston Churchill.
Poți afla mai multe despre aceste rezultate pe site-ul oficial Baidu.
Dacă vrei să asculți vocile clonate, o poți face în acest link.