Природно језичко разумијевање је будућност А.И. Препознавање гласа

Са појавом Амазонове Алека и Сири конзистентне способности да преузму више послова (и добију све више и више сасси), многи се питају: шта је следеће за разумевање природног језика и разговорне гласовне интерфејсе?

У овој трци постоји неколико компанија које се баве вратом и вратом. Ту је Вит.аи, компанија Фацебоок је стекла - можете се играти са демо. (Покушајте ову наредбу: "Желим гледати мачке.") Аппле има свој ХомеКит и, с њим, ради оно што Аппле најбоље ради - разбијајући гузицу. Амазон је такође испред са својим Ехо и Ехо Дот опремљеним са Алека.

Једна компанија која је на трагу разумевања природног језика је МиндМелд. МиндМелд нуди своје способности разумевања природног језика другим компанијама које желе да додају интелигентне гласовне интерфејсе својим производима, услугама или уређајима. Компанија са седиштем у Сан Франциску даје партнерима инфраструктуру и опције прилагођавања тако да њихови уређаји могу имати своје, фино подешене личне асистенте. МиндМелд је недавно најавио такво партнерство са Спотифи, али такође ради са аутомобилским компанијама, агенцијама за одбрану, компанијама за е-трговину и још много тога. (И, наравно, није у стању да подели многе специфичности таквих партнерстава.)

Инверсе разговарао је са Сам Васисхтом МиндМелд-а о стању поља за препознавање гласа - али он је брзо указао на то да је “препознавање гласа”, као предузеће, сада “земаљска тема”. “Гласовно препознавање је скоро достигло свој врхунац: након 50-ак година развоја, АИ сада могу ефикасно препознати говор. Ови системи су на послу скоро бољи од људи и сигурно ће ускоро надмашити обичне смртнике.

Предвидиви следећи корак, а затим - баш као и развој детета - је да се науче овим системима разумем језику који сада могу да препознају. “Овај човек говори речи; то су речи ”је далеко од тога:“ Ја разумем шта овај човек говори; дозволите ми да помогнем."

А тај даљи корак и развој захтевају интерпретацију значење: Опонашање начина на који људски ум обрађује вербалне информације. Постоје два дела ове једначине. Први је намера: Који је људски циљ или жеља у изговарању ове реченице? Рачунар који може извући намеру из изговорене реченице може "разумети" оно на шта човек жели да утиче Икс или интеракцију са и. Са овим процесом је испреплетан други део једначине: Ентитет. Тхе А.И. морају знати како одредити ентитет који се обраћа, предмет људске намјере.

Да би то учинили, МиндМелд није (као што сам претпоставио, нити се надао) запошљавао филозофе. Запошљава стручњаке за природне језике, али велики дио А.И. Процес “учења” је сам по себи релативно непрактичан. Ако подучавате систем да разуме поруџбине за кафу, морате показати систему све различите начине на које би људи могли наручити кафу.

"Хтео бих мока."

"Могу ли молим те да попијем шољицу Џоа?"

"Само велика кафа за мене."

И ту долазе стручњаци за природни језик - лингвисти. Али чак и то више није потребно јер можемо прикупити податке. Ови алати вам омогућавају да поставите хиљаде људи истом питању и саставите њихове одговоре. Онда ви само уносите те одговоре у А.И., и воила: А.И. може реаговати на широк спектар могућих питања. “Од хиљада упита, сада можемо само у основи стројно научити како се генерирају милијарде других упита”, каже Васисхт.

Инверсе Васисхта, који је дуго био инсајдер у А.И. и подручје разумијевања природног језика, да спекулишемо за нас.

Може ли МиндМелд учествовати у продуженом дијалогу? На пример, ако поставим неко накнадно питање, да ли ће А.И. разумете и наставите да реагујете?

Да. То је део дизајна. Ако неко постави питање које је непотпуно - тако, на пример, ако наручујем кафу, а не прецизирам величину кафе коју желим, вратит ће се и рећи: “Коју величину каве имаш? хоћеш?"

Очекујете ли напредак на Туринговом тесту?

Мислим да смо прилично блиски. Мислим, ИБМ Ватсон је Опасност!, и мислим да је то био заиста добар пример. Ми смо у том тренутку: постаје веома близу. Као што смо сада, у смислу препознавања говора, на тачкама у којима су машине добре као људска бића, мислим да ћемо - свакако у наредне три до пет година - бити у тачки када већина тих разговора системи ће се сматрати добрим као и људи.

Какве ствари кућне аутоматике ради МиндМелд?

Можемо применити нашу технологију на било коју врсту производа, било коју врсту услуге, било коју врсту домена података. Кућна аутоматизација је једна од њих. У кући имате контролу расвјете, термостат, сигурносне системе, аудио системе, видео системе, све те врсте ствари. У могућности смо да контролишемо све системе под условом да постоји одговарајући интерфејс.

Шта желите да се прикључите МиндМелд-у унутар вашег дома?

Мислим да су напреднији случајеви употребе - као што је разговор са мојом Спотифи-ом да кажем "Плаи ме тхе Роллинг Стонес плаилист", или "Плаи ме цлассиц" вечерас - такве ствари би биле … сјајне.

Нешто неочекивано или ван оквира које желите да контролишете својим гласом?

Ствари које сам вам описао су ствари за које мислим да су неизбежне. Другим ријечима, то ће се догодити врло брзо. Оно што се неће десити одмах, мислим, би биле ствари као што су микроталаси, апарати за кафу и фрижидери. Контрола тих врста апарата - у суштини могу рећи: “Да ли је моја машина за кафу спремна за кафу? Укључите апарат за кафу ”и ако није припремљен, требало би да се врати и каже“ Жао ми је, али ваша машина за кафу није спремна ”- та врста интелигенције још увек не постоји. То ће бити свети грал: где у суштини сваки уређај може одговорити вама и рећи вам шта може и што не може. Али још нисмо тамо.

Шта мислите да држи индустрију назад?

Ово су изузетно јефтини апарати, сада. Мислим, ово су апарати које можете купити скоро ништа. Пре десет година су коштали много више.Дакле, изградња нових функција је нешто што повећава трошкове ових уређаја. На крају, садашња вредност пропозиција је веома јака; већина ових произвођача није склона да додају нове функције, осим ако су на веома ниској цијени.

Мислим да је то један аспект тога. Други аспект тога је да говоримо о повезивању ових уређаја. Дакле, за повезивање ових уређаја мора постојати више од самог случаја употребе гласа. Мора постојати више способности које треба да се возе на тој вези пре него што постану одрживе.

Да ли знате за било коју компанију која ради на том другом капацитету?

Многе компаније за производњу полупроводника раде на веома јефтиним микрофонима. Оно што у суштини можете уградити - по веома ниским цијенама, на скоро сваки уређај или апликацију - што би омогућило да постоји гласовни унос. И не морате стајати поред ових уређаја - можете причати са 10 стопа. Изградња те способности - мислим да је то полазна тачка. И мислим да ће омогућити људима да почну да стављају микрофоне на уређаје, а онда ће уследити и друге, напредне могућности. Али од сада не познајем ниједну компанију која гради ову врсту паметне апарате за кафу, или паметне микроталасне пећнице или веш машину.

Која је ваша најбоља процена када имамо потпуно паметне куће, потпуно паметне станове?

Данас, заправо имамо скоро све битне подсистеме у кући које људи желе аутоматизовати, који су способни да буду аутоматизовани. То укључује светла, термостате, сигурносне системе, гаражна врата, браве предњих врата - такве ствари. Све ове ствари се могу урадити. Питање је заиста око цијена. Ово је још увијек на цијени гдје су углавном рани усвојитељи и људи који имају стварно озбиљну потребу за њима. Али цена на овим стварима пада драматично, веома брзо. Мислим да ћемо ове подсистеме вероватно добити на масовно тржиште у наредних неколико година.

Друге ствари о којима сам говорио - аутоматизација врло јефтиних апарата - мислим да су то вероватно у периоду од пет до седам година. Више од 10 година, пре него што то постане стварност. Али, као што сам рекао раније, то су ствари које ће захтијевати низ других ствари које ће доћи заједно. И то би се могло догодити раније ако се ти разни састојци брже спајају.

Шта мислите како би изгледао стан у Нев Иорку или Сан Франциску у, рецимо, 2050?

2050! Вов. Мислим да ћемо бити потпуно тамо. Ствари које видимо у научно-фантастичним филмовима - гдје можете прилично много разговарати са сваким системом у вашој кући, и контролирати све гласом - мислим да ће те врсте способности бити раширене. Свакако у градовима као што су Нев Иорк и Сан Францисцо.