Facebook open-sorsovao AI alate za prepoznavanje slika

Kroz mašinsko učenje, Facebook može da uči algoritme kognitivnim zadacima koji su svojstveni ljudima. Dakle, ako algoritmu pokažete dovoljno slika na kojima je ovca, posle izvesnog vremena, on će početi i samostalno da ih prepoznaje.

Maja Marković - 29. Avgust, 2016.

Softver koji Facebook koristi kako bi prepoznao oblik i raznovrsnost objekata na slikama, sličan onome koji pomaže da se slepim i slabovidim osobama opiše slika, prelazi u open source domen. DeepMask i SharpMask su eksperimentalni alati, koji sliku tumače kroz proces “segmentacije”, odnosno pretvaranja piksela u numerički niz koji odgovara promenama u boji. Prepoznavanje posmatranih objekata koji ljudsko oko izvršava sa lakoćom, za kompjutere predstavlja ozbiljan problem.

Kroz mašinsko učenje, Facebook može da uči algoritme kognitivnim zadacima koji su svojstveni ljudima. Dakle, ako algoritmu pokažete dovoljno slika na kojima je ovca, posle izvesnog vremena, on će početi i samostalno da ih prepoznaje.

DeepMask postavlja seriju da/ne pitanja koji algoritmu pomažu da prepozna sadržaj, dok SharpMask pomaže u razaznavanju objekata u odnosu na pozadinu. Za prepoznavanje objekata i kategorizaciju koristi se MultiPathNet, zajedno sa osnovnim tehnikama prepoznavanja softvera koje je razvio Ros Giršik, istraživač pri Facebookovom timu za istraživanje AI (FAIR).

Postoje velike mogućnosti primene ove tehnologije. Pored mogućnosti pretraga fotografija koje nisu tagovane, može biti korisna i osobama sa posebnim potrebama.

Naš cilj je da omogućimo korisnicima još impresivnija iskustva koja im omogućavaju da “vide” fotografije prelazeći prstom preko slike dok im sistem objašnjava sadržaj koji dodiruju” kaže Pjotr Dolar, član istraživačkog tima.

Microsoft je otvorio kod i objavio otkrića kao akademska istraživanja da bi ohrabrio druge da lakše dele tehnike i tehnologije u nadi da će i ostali moći da sarađuju sa njima, unapređujući sopstvene alatke.

Važno je zapamtiti i da se mnoga od ovih istraživanja sprovode od strane kompanija poput Microsofta i Google-a. Google koristi veštačku inteligenciju za prepoznavanje površine fotografije sa odmora kada pretražujete po upitu “plaža” ili za predviđanje odgovora na mejl. Kako je Google deo ove tehnologije otvorio za open source, moguće da je i to ono što je nagnalo Facebook na ovaj potez, jer verovatno oseća pritisak da doprinese istraživačkoj zajednici.

Facebookov AI istraživački tim se nada da će u budućnosti moći da identifikuje i sadržaj u videu, formatu u kome Zakerberg vidi najveću priliku za razvoj društvenih mreža u narednih pet godina, što je pokazao i transformacijom sajta i aplikacije da lakše odgovore potrebama već snimljenih videa, kao i striminga. Već je došlo do napretka u raspoznavanju objekata u videima, poput mačaka ili hrane, ali bi klasifikacija u realnom vremenu jednog dana mogla dovesti i do naracije u realnom vremenu.