Како је ДеепМинд развио језиво самоук А.И. То може надмудрити људе

Настя и сборник весёлых историй

Преглед садржаја:

Како подучавати А.И. Научити се
Зашто је Алпа Зеро тако добар

Компјутери шутирају наше крхке људске гузице у шаху већ неколико деценија. Први пут се то десило 1996. године, када је ИБМ-ов Дееп Блуе успео да скине светског првака Гариа Касперова. Али нова студија из Алпхабет'с А.И. опрема ДеепМинд осветљава колико је ограничен обим ране победе.

За једног, Касперов је одмах одскочио, освојивши три утакмице и два пута нацртавши у плејофу од шест утакмица, по старом Дневне вести извештај.

Али много важније, каже истраживач ДеепМинда Јулиан Сцхриттвиесер Инверсе, апликације као што је Дееп Блуе су такође програмиране ручно. То значи да су људи морали подучавати А.И. све што је требало да зна о томе како се носити са свим могућим околностима. Другим речима, она је увек могла бити једнако добра као и људи који су је програмирали. И док је Дееп Блуе био очигледно у стању да буде прилично добар у шаху; дајте му још једну, сличну, игру као што је Го и било је не знам.

Алпха Зеро је потпуно другачији. У новој студији објављеној данас у часопису Наука, аутори откривају како су могли не само научити Алпха Зеро како побиједити људе у шаху, већ како научити Алпха Зеро како научите се да бисте савладали више игара.

Како подучавати А.И. Научити се

Алпха Зеро је развијен користећи технику под називом учење дубоког појачања. У суштини, то укључује подучавање А.И. нешто веома једноставно, као основна правила шаха, а затим радиш ту једноставну ствар изнова и изнова, све док не научи компликованије, занимљиве ствари као што су стратегије и технике.

"Традиционално … људи би узели своје знање о игри и покушали да је кодирају у правилима", каже Сцхриттвиесер, који већ скоро четири године ради на Алпха Зеро. "Наш приступ је да се иницијализујемо насумично, а онда да се играју против себе, а из самих игара могу научити које стратегије раде."

Сви Алпха Зеро добијају основна правила, а одатле учи како да победи играјући се. Према новим сазнањима, требало је само девет сати да Алпха Зеро овлада шахом, 12 сати да савлада Схоги и око 13 дана да овлада Гоом. Зато што се и сама игра, у суштини је самоук. Направљен је од свих светских првака у људским вођеним алгоритмима, победивши светског шампиона у Шогију у 91% случајева.

"Он може самостално открити занимљива знања о игри", каже Сцхриттвиесер. "То доводи до програма који играју више људски."

Иако је његов стил људски и креативан, ипак је вероватно оптималан, каже он, довољно да би Алпха Зеро могао да доминира у скоро свакој игри у којој има приступ свим доступним информацијама. У ствари, Алпха Зеро је толико софистициран, да ћемо можда морати да пређемо на потпуно другу класу игара како бисмо наставили да померамо границе како А.И. решава проблеме.

Зашто је Алпа Зеро тако добар

А.И. истраживачи воле да користе ове игре за тестирање основа за све софистицираније облике алгоритама из неколико разлога. Елегантни су, а људи их играју стотинама година, што значи да имате много потенцијалних изазивача да тестирате свој алгоритам. Али они су такође компликовани и замршени, што значи да могу послужити као одскочна даска за А.И. који могу ријешити проблеме у стварном свијету. Сцхриттвиесер каже да је сљедећа област истраживања креирање алгоритма као што је Алпха Зеро који још увијек може доносити оптималне одлуке са несавршеним информацијама.

"У свим овим играма знате све што се дешава", каже он. “У стварном свијету, можда знате само дио информација. Можда знате своје картице, али не знате вашег противника, имате делимичне информације."

И даље постоји неколико игара на плочи које су у стању да дају алгоритме попут Алпха Зеро-а таквом изазову - Сцхриттвиесер је споменуо Стратего, у којем играчи крију своје потезе један од другог - и Старцрафт, што је још једна област од интереса за ДеепМиндове истраживаче фокусиране на игре.

"Ми желимо да све више и више сложимо проблеме које имамо," каже он. "Али то је увек једна димензија у исто време."

У исто време, следећа генерација компјутеризованих решивача проблема Дееп Минд већ показује потенцијал за прелазак из света игара у стварни свет. Раније ове недеље, најавио је још један алгоритам назван АлпхаФолд, који је способан да екстраполира секвенцу протеина у тачно предвиђање његове 3Д структуре.То је проблем који су десетљећима збуњени знанственици и који би могли помоћи у отварању врата лијековима за болести од Алцхајмерове до цистичне фиброзе.

Фром Пунк то Роцк: Како се брзо "петак" развио Дваине Јохнсон

Двејн Џонсон је одувек био снажна акцијска звезда, али га је Фаст Фиве учинио моћном. Све док није играо предаторског Лукеа Хоббса у петом Фаст & Фуриоус наставку 2011, Дваине Јохнсон није носио сасвим ниво шепурења на Таилор Свифт, без жртвовања своје Херкуловске ауре. Па шта је било ...

Како Гоогле-ов ДеепМинд А.И. Користи шифроване податке о пацијенту да научи како да предвиди болести

Гооглеов систем за вештачку интелигенцију ДеепМинд добио је приступ здравственим подацима од 1,6 милиона британских пацијената у једном од највећих споразума о размени података те врсте. Лондонско удружење "Роиал Фрее НХС труст" обезбеђује евиденцију и укључује пуна имена свих пацијената током последњих пет година ...

Форд добија неку помоћ од НАСА-е како би развио потпуно самостална возила

Форд се удружује са НАСА-ом како би покушао ријешити такозвани "проблем трговачког путника", који се односи на проблем како пронаћи најдјелотворнији пут између више градова док се још увијек враћа на мјесто поријекла. Да би помогао у решавању проблема, ауто-гигант је недавно потписао уговор са НАСА-ом.

$config[ads_kvadrat] not found