Duboko učenje: kako su mašine nadmašile vrhunske radiologe

Da je Bil Gejts danas student kompjuterskih nauka, bavio bi se proučavanjem mašinskog učenja – ili, još konkretnije, dubokim učenjem.

Marija Gavrilov - 25. Decembar, 2015.

Da je Bil Gejts danas student kompjuterskih nauka, bavio bi se proučavanjem mašinskog učenja – ili, još konkretnije, dubokim učenjem (prevod → deep learning). Barem sudeći po odgovorima koje je prošle godine pružio na Reditovom AMA.

Screen Shot 2015-12-24 at 2.22.09 PMOd Google pretrage, preko Amazonovih preporuka, detektora neželjenih poruka u vašem inboksu, naše internet iskustvo zavisi od mašinskog učenja. U medicini je isprobavano u oblasti kompjuterizovane tomografije, kako bi lekarima omogućilo identifikaciju stotina novih odlika skenova s ciljem preciznije identifikacije kancera. Međutim, sve ovo je rađeno sa nešto “starijom” verzijom mašinskog učenja. Ono gde su oči uprte sada je duboko učenje – podoblast mašinskog učenja, koja obećava da će omogućiti bolje predstavljanje i modele na osnovu velikog seta neobeleženih podataka.

Dok mašinsko učenje radi sa preciznom setu karakteristika uzetih iz sirovih podataka i zahteva postojanje ekstraktora karakteristika (recimo, za prepoznavanje lica na slikama, koristi se facijalni ekstraktor), duboko učenje omogućuje samostalno učenje kompleksnih karakteristika iz samih podataka. Tako će, umesto potrebe za facijalnim ekstraktorom, pokušati da nauči osobenosti lika, poput razdaljine između različitih delova vašeg lica ili dužine nosa.

Upravo prepoznavanje slika, kao jedan od primera primene deep learning mehanizama, pokazuje stepen napretka čitave oblasti. Pre pet godina procenat pogreške u prepoznavanju slika bio je šest puta viši nego što je danas, a Google i Microsoft su ove godine objavili da su njihovi algoritmi za mašinsko učenje bolji od ljudi u rešavanju zadataka sa niskim procentom pogreške (oko 4,9%).

Kada se ovo primeni u medicini i kompjuterizovanoj tomografiji, dobije se alat za ranu detekciju raka. Startap Enlitic, koji se bavi mašinskim učenjem, nahranio je svoj algoritam podacima miliona pacijenata, izgradivši “neuralnu mrežu ljudskog tela”. Među podacima su bili i snimci pluća, a rezultati testiranja pokazali su prednost algoritma pri detekciji raka u poređenju sa četvoro najboljih svetskih radiologa. Dok su radiolozi promašili detekciju raka u 7% slučajeva, algoritam nije omanuo. Pored toga, algoritam daje lekarima na uvid istoriju sličnih slučajeva i pokazuje kako da pristupe novom pacijentu na osnovu naučenog.