Спеецхматицс Користи АИ за транскрипцију језика, и то Беатинг Гоогле

$config[ads_kvadrat] not found

Настя и сборник весёлых историй

Настя и сборник весёлых историй
Anonim

Спеецхматицс иде након Гоогле-а. Британски стартуп је прошлог месеца преузео облоге од Аутоматиц Лингуист-а, моћну вештачку интелигенцију која може научити било који језик за транскрипцију говора у текст за неколико дана. Тим жели да омогући технологију за сваки од око 7.000 језика на свету, са потенцијалом да трансформише животе.

Од покретања лингвистичког алата, Спеецхматицс је радио на Омниглоту, изазову за изградњу језика дневно. Прошле недеље, компанија је постигла велику прекретницу: званично је победила Гоогле, са укупно 72 јединствена језика.

Систем користи машинско учење да би ускладио аудио податке са копијом транскрипта. Затим користи лингвистичке обрасце из других језика како би процес био што једноставнији, идентификујући сличности између звукова и граматичких структура и примјењујући их на нове језике. Процес је веома ефикасан: као пример, рад Спеецхматицс-а на Хинди-у трајао је само две недеље да би се достигла тачност од 80 процената. Када је финални производ тестиран против Гооглеових напора, он је направио 23% мање грешака.

Инверсе разговарао са Бенедиктом вон Тхунгеном, генералним директором Спеецхматицс-а, да сазна више.

Како је ваш тим први пут почео да ради на пројекту?

Покренули смо пројекат Омниглот као изазов за себе - да видимо колико језика можемо изградити за шест недеља. Дуго смо схватили да традиционални приступ изградње сваког језика појединачно више није одржив када се ради о брзој брзини. Имајући то у виду, морали смо да поново размислимо који је језик, како је структуриран и које сличности постоје између различитих језика. Пронашли смо начин да користимо те заједничке карактеристике да бисмо идентификовали обрасце и помогли нашем оквиру за аутоматску лингвисту (АЛ), да изграде језике брже него икада - 46 у шест недеља да будемо прецизни, или око једног језика дневно током шест недеља !

Како се то разликује од Гооглеових напора?

Наш приступ изградњи језика је један од главних аспеката који нас разликује од Гоогле-а. Иако претпостављамо да они граде своје језике појединачно (или оно што ми зовемо „брутална сила“), ми користимо моћ А.И. поједноставити и убрзати процес изградње језика. Поред тога, док се друге услуге, као што је Гоогле, фокусирају на изградњу дијалеката, а не на јединствене језике, поносни смо што можемо рећи да су наши напори били усмјерени на јединствене језике из цијелог свијета, укључујући подручја која су претходно била недовољно подржана од стране великих технолошких компанија.

Које су неке од стварних апликација за ово?

Сада имамо технологију и знање како бисмо учинили нашу услугу далекосежнијом него икада раније и донијели аутоматско препознавање говора (АСР) свима. Ово је посебно релевантно у земљама са ниским стопама писмености, гдје способност да се користи раније недоступна технологија говора у текст за комуникацију може направити разлику за људе. Други стварни случајеви у којима АСР технологија може да помогне има везе са питањима приступачности - особе са оштећењем слуха и / или оштећења вида из целог света сада могу да користе уређај као једноставан телефон за интеракцију са онима око себе.

Да ли ово побољшава тачност добро покривених језика као што је енглески?

Како настављамо да развијамо више језика, наша А.И. Оквир ће постати све више упућен у препознавање језичких особина и образаца. Користићемо ово знање да бисмо наставили усавршавати нашу језичку базу, укључујући и енглески.

Да ли би ово могло да побољша нешто попут алатки за превод у реалном времену Гоогле Пикел Будс?

Дефинитивно видимо пројекте попут Омниглота који помажу да се унапреде алати за превод у реалном времену. Како се више ресурса улаже у проширење досега и тачности језика, видећемо континуирано побољшање у сектору преводилачких услуга.

Да ли ово функционише са било којим језиком, чак и са језицима као што је клингонски?

Још увек морамо да покушамо да изградимо било какве закључке, али не видимо разлога зашто не би радили. Како људи и даље говоре ове језике, они прате слична структурна правила и ограничења као и свакодневни језици (као што је број фонема), што би дало АЛ довољно података за градњу.

Јесте ли отворили пројекат?

Не, немамо планове за то.

Како ће лиценцирање функционисати?

Језици који се нуде у оквиру пројекта Омниглот су бесплатни и не могу се користити у комерцијалне сврхе. Као таква, у догледној будућности неће бити додељене никакве лиценце.

Који су сљедећи кораци одавде?

Пројект Омниглот је само почетак за нас. Желимо да на крају изградимо сваки језик у свијету, тако да ћемо напорно радити на том циљу!

$config[ads_kvadrat] not found