W zeszłym tygodniu zespół z Microsoft Research Asia w Pekinie, prezentował wyniki swojej pracy w światowej centrali Microsoftu w Redmond. Zespół wykorzystał głos Craig Mundie, dyrektora badawczego Microsoftu. Głos najpierw pozdrowił publiczność w ojczystym języku Mundie – angielskim. Następnie wykorzystano nowe oprogramowanie, dzięki czemu dyrektor „przemówiła” po chińsku.
Oprogramowanie potrzebuje na początku około godziny, aby wykonać model głosu lektora, który będzie w stanie odczytać dowolny tekst. Następnie model jest przekształcany w inny, dzięki któremu oprogramowanie będzie w stanie odczytać tekst w jednym z 26 obsługiwanych języków. Odbywa się to poprzez dostosowanie głosu do tradycyjnego modelu text-to-speech dla języka, który został wybrany.
Źródło: Neowin