Мицрософтово истраживање открива боље препознавање говора

$config[ads_kvadrat] not found

Use of UTF 8 CodeHTML

Use of UTF 8 CodeHTML
Anonim

Мицрософт је постао прва компанија на свету која је развила софтвер за препознавање говора који је тачнији од људи. У документу "Постизање људског паритета у разговору у препознавању говора" који је објављен у понедјељак, софтвер је произвео транскрипте који су садржавали пола посто мање грешака него људски напори, што је невјеројатно с обзиром на то колико су људи добри у разумијевању говора. Пробој отвара врата за ново А.И. асистенти који су точнији него икада раније.

Импресивно је колико је технологија стигла у тако кратком времену. Не тако давно је да је препознавање компјутерског говора било чудна ниша која се чинила безнадежно удаљеном. Погледајте ову демонстрацију говорног софтвера оперативног система Виндовс Виста из 2006. године:

Тим је користио тест Националног института за стандарде и технологију (НИСТ) 2000, који се користи у цијелој индустрији за мјерење поузданости транскрипције говора. Разговор се одвија између два учесника преко телефона, редом, прије него што се резултантни скрипт упореди и провјери са правописом.

У делу централе, где два странца први пут говоре, стопа људске грешке је око 5.9 процената, док је на позивном делу, где две особе које се међусобно знају, стопа грешака око 11.3 процената. Мицрософтов софтвер је забележио око 0,4 одсто нижу стопу грешака.

У августу, студент Јосхуа Бровдер је узео тајне са свог ДоНотПаи цхат-а, који може помоћи бескућницима да добију бесплатан правни савет. У комбинацији са напредовањем препознавања, лако је замислити будућност у којој људи траже помоћ виртуалног асистента за стамбено збрињавање тако што ће редовно разговарати са својим рачунаром.

У овој фази, истраживачи размишљају о томе како А.И.-препознавање говора може дати паметније одговоре. Сенсаи, гњев који детектује А.И. из лабораторије иза Сири, користи напредне могућности препознавања да би детектовао да ли се корисник љути или збуњен, мијењајући своје одговоре како би одговарао ситуацији. Уклањање баријере препознавања гласа склоне грешкама, ствара узбудљиве нове могућности за виртуелну помоћ.

$config[ads_kvadrat] not found