Šta je Mark Zakerberg naučio dok je pravio svog AI asistenta?

Zakerberg se upustio u ovaj izazov sa željom da sazna na kom je stadijumu razvoj veštačke inteligencije — stigli smo daleko, ali potrebno je da odemo još dalje.

Nevenka Rangelov - 27. Decembar, 2016.

Osnivač i izvršni direktor Facebooka, Mark Zakerberg već par godina unazad sebi zadaje (novo)godišnje izazove izvan posla u Facebooku (npr. da tokom jedne godine svakog meseca pročita po dve knjige, ili da svakog dana upozna novu osobu i nauči mandarinski).

Izazov za 2016. godinu je bio da kreira jednostavnog AI asistenta koji bi upravljao uređajima u njegovoj kući i pomagao mu na poslu — nešto poput Džarvisa iz Iron Mana.

Kako se bliži kraj godine, Zakerberg je na Facebooku objavio tekst posvećen ovom izazovu i lekcijama koje je naučio praveći svog AI asistenta.

Do sada je razvio AI asistenta sa kojim komunicira putem telefona i računara i koji kontroliše temperaturu, uređaje, svetla, muziku i sigurnosni sistem u njegovoj kući. Zakerbergov AI može da uči njegove ukuse, navike i obrasce u ponašanju, kao i nove reči i koncepte. Tu je čak i da povremeno zabavlja njegovu ćerku.

Koristi nekoliko tehnika veštačke inteligencije — NLP (procesuiranje prirodnog jezika), prepoznavanje govora, lica i reinforcement learning, pisanih u Pythonu, PHP-u i Objective C-u.

Povezivanje kuće

Pre nego što je Zakerbergov AI asistent preuzeo deo kontrole nad njegovom kućom, bilo je potrebno da svi uređaji u njegovoj kući budu povezani u jedinstven sistem. Ovo je bilo dosta izazovno jer trenutno manje više svi IoT uređaji i sistemi koriste različite “jezike” i protokole. Zakerberg je zbog toga morao da izmeni veliki broj inženjerskih API-a, kako bi mogao da zadaje komande sa svog računara npr. da se svetla uključe ili da počne da svira određena pesma.

Drugi problem je to što veliki broj kućnih aparata nije povezan na internet. Mada je moguće improvizovati i učiniti da se nekim od ovih uređaja upravlja daljinski, potrebne su prilične promene u hardveru da bi ta zamisao bila realizovana.

Da bi asistenti poput Džarvisa mogli da kontrolišu sve u kući, potrebno je da više uređaja bude povezano i da industrija ustanovi zajedničke API-e i standarde kako bi uređaji mogli da međusobno “komuniciraju”.

Prirodni jezik

natural-language-jarvis

Nakon povezivanja kuće, Zakerberg je želeo da sa svojim AI asistentom razgovara kao sa bilo kim drugim — prvo putem poruka, a zatim i putem glasovnih komandi.

Počeo je od ključnih reči, na primer “spavaća soba”, “svetlo” i “uključeno” što je bila komanda za “uključi svetlo u spavaćoj sobi”. Nakon toga je AI asistenta morao da nauči i sinonimima za većinu ključnih reči koje koristi.

Razumevanje konteksta je veoma važno za bilo koji AI. Bitno je da zna ko mu zadaje komandu, u kojoj se prostoriji u tom trenutku nalazi i slično.

Muzika je Zakerbergu zadavala najviše problema zbog ogromnog broja izvođača i komandi koje može zadati (svetlo možete samo isključiti ili uključiti, ali kada AI asistentu kažete “pusti takvu i takvu muziku” možete dobiti mnogo različitih rezultata). Davanje pozitivnog i negativnog feedbacka nakon zadavanja komandi otvorenog tipa koje nisu dovoljno specifične, jako je bitno jer na taj način AI uči kako da ubuduće reaguje na takve zahteve.

Zakerberg smatra da kod svakodnevnih aktivnosti mnogo češće koristimo ovakve otvorene zahteve, a da trenutno nijedan komercijalni AI proizvod nije napravljen tako da adekvatno na to odgovori. Stoga na tom polju veštačke inteligencije postoji veliki prostor za razvoj.

Prepoznavanje lica

face-recognition-jarvis-aiUzevši u obzir da je jedna trećina ljudskog mozga posvećena vidu, ovaj aspekt AI tehnologije je izuzetno važan. Zapravo, najveći deo problema veštačke inteligencije vezuje se upravo za vizuelne sposobnosti (prepoznavanje i tumačenje pokreta i prepoznavanje i razlikovanje predmeta i lica).

Prepoznavanje lica je posebno izazovno jer većina ljudi izgleda relativno slično u poređenju sa predmetima koje AI dosta lakše razlikuje. Facebook je postao prilično uspešan u prepoznavanju lica na fotografijama, a Zakerberg je to iskoristio kako bi njegov AI asistent mogao da prepozna njegove prijatelje kada dodju kod njega (tačnije dok još uvek stoje pred vratima).

Izgradio je jednostavan server koji operiše u dva koraka: prvo na osnovu snimaka sa kamere ustanovljava da li je neko ispred vrata, a zatim identifikuje koja osoba je u pitanju. Nakon toga će proveriti da li je ta osoba na spisku i da li je Zakerberg očekuje i ako jeste pustiće je unutra.

Ova sposobnost detektovanja lica i predmeta je značajna jer dopunjava ostale funkcije, pružajući AI-u već pomenuti kontekst. AI asistent tako može da detektuje ko mu je zadao komandu, u kojoj se prostoriji ko nalazi i slično. Što više konteksta sistem poseduje, to je inteligentniji.

Messenger Bot

messenger-bot-jarvis-aiDa bi AI asistent bio zaista koristan, potrebno je da postoji mogućnost da mu se komande zadaju gde god se nalazili, to jest da sa njim komuniciramo putem telefona (a ne putem uređaja koji se nalazi u samoj kući). Zakerberg je u tu svrhu napravio chatbota za Facebook Messenger, što je po njegovim rečima bilo znatno jednostavnije nego da se odlučio da pravi zasebnu aplikaciju.

Messenger ima jednostavan framework za pravljenje chatbota, dosta stvari je automatizovano — slanje tekstualnog, foto i audio sadržaja, push notifikacije, identitet i dozvole za pristup nalogu itd.

Zakerberg svom Džarvis AI botu može da šalje tekstualne i govorne poruke koje će server prevesti u tekst i izvršiti zadatu komandu. Ako neko u toku dana dođe u njegovu kuću Džarvis će ga o tome obavestiti na Messengeru i poslati mu sliku ili ime osobe koja je došla.

Ono što je primetio nakon što je neko vreme komunicirao pomoću chat bota jeste da se mnogo češće odlučuje za tekstualne umesto glasovnih komandi, kao i za tekstualne notifikacije umesto govornih. To je najvećim delom zbog toga što se poruke bolje uklapaju u svakodnevne obaveze, manje ometaju i nas i ljude oko nas.

Zakerbergovo zapažanje o njegovom ličnom iskustvu se poklapa sa globalnim trendom — ljudi sve više preferiraju tekstualne poruke u odnosu na glasovne komande i uopšte govornu komunikaciju. Ovaj podatak sugeriše da se AI proizvodi ne mogu fokusirati isključivo na glas, već bi trebalo da sadrže i određenu formu privatnog chata.

Prepoznavanje glasa i govora

Iako će, po Zakerbergovom mišljenju, tekstualne poruke biti dosta važnije u komunikaciji sa veštačkom inteligencijom nego što ljudi misle, govorne komande će i dalje imati značajno mesto u ovoj tehnologiji. Pre svega zbog svoje brzine — nije potrebno da izvadite telefon, otvorite aplikaciju i kucate, dovoljno je samo da pričate.

Kako bi osposobio glasovne komande za Džarvisa, Zakerberg je kreirao aplikaciju koja može da kontinuirano sluša ono što on govori. Prva verzija aplikacije je za iOS, ali Zakerberg planira da uskoro napravi i verziju za Android.

Pošto se od 2012. nije bavio kreiranjem aplikacija, glavni utisak mu je bio koliko su napredovali alati za pravljenje aplikacija za prepoznavanje govora koje su razvili u Facebooku. Ipak, nijedan AI sistem još uvek nije dovoljno dobar da bi mogao da razume razgovor. Prepoznavanje govora se oslanja na slušanje, ali i na predviđanje šta će sledeće biti rečeno, tako da je AI-u još uvek mnogo lakše da razume strukturisan govor od nestrukturisanog razgovora.

Još jedno ograničenje sistema za prepoznavanje govora, i uopšte sistema koji se oslanjaju na mašinsko učenje jeste što su optimizovani za mnogo specifičnije probleme nego što se na prvi pogled čini.

Na primer, ako jedan takav sistem napajate podacima sa Google-a, to jest informacijama o tome na koji način ljudi “komuniciraju” sa pretraživačem, taj sistem neće dovoljno dobro razumeti razgovore između ljudi na Facebooku.

Takođe, AI asistenti poput Zakerbergovog Džarvisa kojima se glasovne komande zadaju sa relativne blizine, zahtevaju drugačiju vrstu učenja od sistema kao što je Amazonov Echo sa kojim možete razgovarati sa veće razdaljine. Deluje da će proći još neko vreme dok ne budemo imali AI sisteme koji objedinjuju sve ove funkcije.

Postoji još dosta prostora za eksperimentisanje sa glasom u AI-u. Zakerberg očekuje da će se na ovom polju u narednih nekoliko godina desiti bitni pomaci, ali da će najbolji AI uređaji ipak biti oni koji pored glasa podržavaju i neki vid privatne komunikacije.

Dalji koraci i zaključci

Iako je ovogodišnji izazov priveo kraju, Zakerberg planira da nastavi rad na svom AI asistentu. Na duži plan, ideja je da ga nauči kako da sam stiče nove veštine umesto da ga podučava kako da izvodi pojedinačne zadatke.

Tokom naredne godine takođe planira da se posveti izučavanju samog procesa učenja, kako se odvija ne samo kod mašina već i kod ljudi.

Iako je u ovom trenutku neizvodljivo da open-source-uje svoj kod za Džarvisa, pre svega jer je usko povezan sa njegovim uređajima, kućom i konfiguracijom mreže, plan je da u budućnosti Džarvis postane dostupan javnosti mada nije sigurno u kom obliku.

Najsnažniji utisci i zaključci koje Zakerberg izdvaja iz ovogodišnjeg izazova tiču se uglavnom njegove iznenađenosti koliko smo daleko stigli sa razvojem veštačke inteligencije, ali i koliko smo daleko od razumevanja procesa učenja.

Sve tehnike veštačke inteligencije koje je primenio na svom AI asistentu, bazirane su na istoj fundamentalnoj šemi tehnike prepoznavanja. Ako računaru pokažemo mnogo primera neke stvari, on će je ubuduće uspešno prepoznavati, ali još uvek ne znamo kako da učinimo da računar ideju iz jednog domena primeni na nešto potpuno drugačije.

mark-zuckerbergNa neki način, AI je u isto vreme odmakao i bliže i dalje nego što možemo da zamislimo. AI će uskoro moći da obavlja više kompleksnih stvari nego što ljudi očekuju — vožnja kola, izlečenje bolesti, otkrivanje planeta, razumevanje medija. Sve to će imati bitan uticaj na svet, ali i dalje nam predstoji da otkrijemo šta znači prava inteligencija.