Зашто А.И. Може се борити за разумевање арапског

$config[ads_kvadrat] not found

rytp барбоскины без мата VIDEOMEGA RU

rytp барбоскины без мата VIDEOMEGA RU
Anonim

У свету вештачке интелигенције, подаци су краљ. Што више имате, ваши алати постају бољи јер системи могу да “науче” више о томе шта могу очекивати. Али зависно од платформе, А.И. извлачи податке из, неки језици могу бити боље представљени од других, према Мириам Реди, истраживачици за Иахоо Лабс.

„На пример, као што је Флицкр, одакле узимамо наше податке, неки језици су веома мало заступљени“, рекао је Реди, говорећи на лондонском Самиту за дубоко учење у четвртак. "Дакле, имамо енглески, милионе слика за енглески, али имамо можда 100.000 за арапски."

Редијев тим ради на алату који може да идентификује невидљиве елементе у сликама, као што су културне вредности и емоционалне конотације. Алат анализира текст који је приложен јавно доступним сликама на Флицкр-у. Временом, А.И. почиње да схвата зашто неко може да означи слику „срећном страном“ или „незгодним тренутком“, али ове идеје ће постајати све прецизније док алат анализира више слика.

"Нажалост, прецизност за детекцију сентимента на сликама за арапске језике има тенденцију да буде нижа зато што немамо довољно података", рекао је Реди.

На језицима који су имали веће количине података, Редијев тим је приметио неколико занимљивих образаца. Романски језици, као што су француски и шпански, имали су тенденцију да се изражавају на сличан начин, док је италијански био једини језик на коме су корисници идентификовали слике са термином „утаја пореза“.

Језичке баријере и даље остају нешто што је проблем за А.И. истраживача. Свако ко је користио Гоогле преводилац знаће да промена језика никада није тако једноставна као што звучи. Међутим, нова дешавања мијењају ствари, јер Фацебоок најављује овог љета да се приближава сну о једној језичној друштвеној мрежи, која аутоматски преводи текстове за кориснике.

Развој догађаја у уклањању језичких баријера може помоћи у јачању међународне комуникације, али за пројекте као што је Реди, нема стварне замјене за податке о сентименту које генерише човјек.

$config[ads_kvadrat] not found