Veštačka inteligencija sa intuicijom — Google-ov kompjuter vodi 2:0 protiv šampiona najteže igre na svetu

Veštačka inteligencija pobedila je evropskog prvaka u najtežoj igri na svetu, a osvojila je prvu partiju protiv svetskog šampiona. Go ima mogućih poteza koliko i atoma u univerzumu, ali ono što je posebno karakteriše je intuicija, koju izgleda da prvi put kompjuter savladava.

Strahinja Krstić - 10. Mart, 2016.

Učinjen je prvi korak da mart ove godine postane mesec jednog od najznačajnijih momenata u istoriji razvoja veštačke inteligencije. Mesto je Seul, glavni grad Južne Koreje. Čovek i mašina igraju antičku istočnu igru zvanu Go.

Koliko je teško igrati Go?

U Google-u kažu da u ovoj igri možete da povučete više poteza nego što postoji atoma u univerzumu. To je broj koji ne mogu da sagledaju ni najmoćniji računari na svetu.

Ova igra ima 10^100 puta više poteza od šaha, te vam je za nju potrebno nešto drugo osim “malo jačeg” digitrona, a to je intuicija koja se stiče iskustvom nakon velikog broja odigranih mečeva. Intuicija, odnosno “osećaj” za igru je ljudski faktor koji je bio skoro nepremostiv za one koji su pokušavali da stvore računarski sistem koji može da savlada bilo kog čoveka u ovoj igri.

Kako izgleda ring

DeepMind_Go_Press_3-1024x768

U jednom uglu je čovek, i to ne bilo koji, već šampion. Lee Sedol je jedan od najboljih igrača igre Go. I kad to tako kažem, realno vam ne znači ništa, zato hajde da stavimo to u kontekst.

lee novak

Sad kad smo to shvatili da vidimo ko je taj bezobrazni izazivač u suprotnom uglu ringa. U pitanju je AlphaGo, računarski sistem koji je kreirao Google, odnosno njegov londonski ogranak za veštačku inteligenciju – DeepMind.

Zašto je ovaj meč poseban i drugačiji?

Mnogi govore da ih ovo podseća na meč između IBM-ovog superkompjutera DeepBlue i svetskog šampiona u šahu Kasparova iz 1997 ili kada je isto IBM-ov superkompjuter Watson igrao kviz Jeopardy! sa nekadašnjim pobednicima tog kviza. Međutim, ovo je drugačije pre svega zbog prirode igre Go. Kao što sam napisao gore, za ovu igru vam je potrebna intuicija koju gradite na osnovu iskustva sa odigranih mečeva.

Dakle, AlphaGo može da uči, a zatim da koristi naučeno da donosi odluke koje će joj pomoći da pobedi u igri. Tehnologija koja se nalazi u osnovi ovog računarskog sistema je pretekla sve konkurentne tehnologije na tržištu i omogućava računaru da prepoznaje slike i identifikuje izrečene reči na nivou koji je ranije bio nezamisliv. Ako se “moć” ove tehnologije potvrdi na primeru sa igrom Go, to će biti sledeći veliki korak za razvoj veštačke inteligencije.

Dve stvari koje je još potrebno napomenuti:

  1. Lee Sedol je samo sledeći stepenik za AlphaGo. Pre njega, žrtva veštačke inteligencije bio je Evropski šampion ove igre – Fan Hui. Dakle, kada je Go u pitanju: Evropa < Južna Koreja
  2. Do sada se smatralo da veštačka inteligencija neće savladati Go bar još deset godina. Ekipa iz DeepMind-a je prva uspela da načini taj korak, iako su mnogi pored njih pokušavali i dalje pokušavaju.

Koje su kvote?

Da bi se zvanično potvrdilo da je AlphaGo pobednik, mora da bude 5:0 za računar. Demis Hassabis, CEO DeepMind-a kaže da drugi ljudi daju otprilike 5% šansi AlphaGo da pobedi. Međutim, on je još rekao i da oni ne shvataju da se njihov sistem konstantno usavršava. Veštačka inteligencija konstantno uči i napreduje neverovatnom brzinom i to je ono što mu daje prednost nad bilo kojim igračem, pa i jednim od najboljih kao što je Lee Sedol.

Kako AlphaGo funkcioniše i uči?

Najprostije rečeno – što više podataka i materijala za učenje to će mašina biti bolja u bilo čemu što radi. Ako želite da računar počne da prepoznaje pomorandže, “nahranite” ga sa mnogo slika pomorandži. Ako želite da priča (skoro) kao ljudsko biće dajte mu mnogo ljudskih dijaloga da preslušava. Ako joj pokažete dovoljno Go poteza, mašina će naučiti da igra Go – i to prilično dobro. Tako da — duboko. Učenje.

Ali to je samo početak. Nakon što su naučili sistem da igra Go, DeepMind ga je postavio da igra sam protiv sebe. Tako što igra protiv sebe i prati poteze, može da shvati koji su potezi najbolji i da konstatno poboljšava svoje veštine. Ljudi tu i tamo promene po nešto u kodu, ali u suštini sistem se sam usavršava. To je princip koji se još naziva i reinforcement learning. Rezultat toga bila je pomenuta pobeda nad evropskim šampionom.

Ali nije u pitanju samo mašinsko učenje. Ove “nove” metode oslanjaju se na jednu stariju koja se naziva Monte Carlo tree search (ha, Novače!) koja u principu samo pokušava da izračuna sve moguće ishode, kojih je previše. Ono što duboko i pojačano učenje rade je u stvari selektovanje i smanjivanje mogućih ishoda kako sistem ne bi morao da računa sve ishode, jer realno, ne bi ni mogao.

Šta dalje?

Ono što govore Hassabi i DeepMind je sledeće:

Ako se ove tehnike mašinskog učenja pokažu dobrim u igri Go, onda ih možemo koristiti i u ostalim sferama života, a onda – nebo je granica.

Sa druge strane, oni skeptični kažu da je stvaran svet mnogo komplikovaniji od jedne obične igre. Nivo veštačke inteligencije koji može da pobedi Go jeste pitanje od milion dolara, ali ono što je pitanje od milijardu i više dolara je:

Kako da napravimo sistem za nejasne životne situacije koje su mnogo manje veštačke od obične igre?

Trenutno je 2:0 za AlphaGo, a prva dva meča mogli ste da pratite i na Youtube-u. Sa uzbuđenjem nastavljamo da pratimo ovu priču, da vidimo da li će i sledeća 3 meča dobiti računar.