ДеепМинд А.И. Мостови између робота и људских гласова

$config[ads_kvadrat] not found

ДвернаÑ? охота (Выломаные двери)

ДвернаÑ? охота (Выломаные двери)
Anonim

Вештачка интелигенција само је учинила да гласови робота звуче много реалније.

ДеепМинд, који је раније демонстрирао моћ А.И. премлаћивањем људског играча на Го у марту и резањем рачуна за струју за половину у јулу, сада је фокусиран на синтезу говора.

Истраживачка група А.И, која је део Гоогле-ове матичне компаније Алпхабет, открила је јутрос да је креирала нову технологију звану ВавеНет која се може користити за генерисање говора, музике и других звукова прецизније него раније.

ДеепМинд објашњава да се многи постојећи начини синтезе говора ослањају на “веома велику базу кратких говорних фрагмената који се снимају из једног звучника, а затим рекомбинују да би формирали комплетне изразе.” ВавеНет, с друге стране, користи “сирови вални облик аудио сигнала”. Да бисте створили реалистичније гласове и звукове.

То значи да ВавеНет ради са индивидуалним звуковима који се стварају када човек говори уместо да користи комплетне слогове или целокупне речи. Ти звукови се затим покрећу кроз “рачунски скуп” процес који је ДеепМинд пронашао “неопходан за генерисање сложеног, реалистичног звука” са машинама.

Резултат свега тог додатног рада је 50-постотно побољшање синтетизираног говора у америчком енглеском и кинеском мандаринском језику. Ево примера говора генерисаног помоћу параметарског тект-то-спеецх, који је данас уобичајен, а користи га ДеепМинд да демонстрира како овај метод синтезе говора недостаје:

Ево примера исте реченице коју је генерисао ВавеНет:

Како компаније настављају са радом на интерфејсу природног језика, пружање реалистичнијих одговора постаће све важније. ВавеНет може помоћи у рјешавању тог проблема.

$config[ads_kvadrat] not found