Kreatori i alati: Marko Jevremović, Nordeus

Marko analizira igre u najvećoj domaćoj gejming kompaniji — Nordeusu. Ovom prilikom otkriva šta svakodnevno koristi od hardvera i softvera, ali i čime se služi kako bi bolje organizivao svoj rad.

Dimitrije Milenkovic
03/12/2016

Marko se bavi naukom i igrama — i naukom u igrama. Poslednjih pet godina analizira igre u najvećoj domaćoj gejming kompaniji, Nordeusu. Poslednjih dvadeset i pet godina igra igre.

Hardver

Do pre par godina sam koristio Lenovo t530, sjajna i izdržljiva mašina — izdržala je čak i kolegu koji je stao na njega punom svojom težinom. Kada sam uzimao nov računar rešio sam da kažem “ne” Windows-u i izbor je pao na MacBook Pro. Pravi Unix terminal se ne može zameniti bilo kakvim emulatorima. Doviđenja i hvala na svim “Send/Don’t send error” izveštajima.

Dok radim, bar jedan prozor terminala je remote konekcija na Hadoop klaster, Cloudera distribucija. Za one koje je hajp oko Hadoop-a nekako zaobišao:

Hadoop je sistem koji resurse više (puno!) servera predstavlja apstraktno kao jedan superračunar i omogućava masivno paralelnu obradu podataka na relativno jednostavan način — stvar koja je pokrenula Big Data revoluciju.

Softver

Svakako moram krenuti od Tableau-a, softvera prema kom imam bipolaran odnos, pa sveukupno i najveći zbir (apsolutnih) emocija. Svako ko se bavi obradom i prezentacijom podataka bi trebalo makar neko vreme da koristi Tableau. Nudi neverovatnu lakoću baratanja podacima i mogućnost ogromnog eksperimentisanja sa načinima vizualizacije i upravo eksperimentisanjem u Tableau-u sam naučio sve što znam na temu vizualizacije podataka. Sjajna stvar, preporučujem.

Duže korišćenje neminovno izlaže korisnika čudnim malenim bagovima i neshvatljivim ograničenjima inače sjajnog softvera. Zanimljivo, ali prvobitno oduševljenje ne nestaje, već nauči da mirno koegzistira sa svim pomešanim emocijama. Ipak sjajna stvar, preporučujem.

Za samo manipulisanje podacima koristim Impalu. Cloudera Impala je query engine sličan rasprostranjenom Hive-u i omogućava pisanje standardnih SQL upita fenomenalnih performansi nad podacima u Hadoop-u. Impalu koristimo od ranih dana verzije 0.8 kada je bila jedini takav softver na tržištu i smatram je esencijalnim delom svakodnevnog posla.

Na poslu koristim dva monitora, od kojih je jedan postavljen vertikalno. Gornju polovinu standardno zauzima terminal, dok je donja polovina rezervisana za Sublime koji koristim za najrazličitije stvari, ali ne i za pisanje koda. Tako se nekako desilo.

marko-jevremovic-alati

Programiranje

Kombinacija Tableau + Impala je neverovatno moćna, ali pre ili kasnije R ili Python postaju neizbežni. Moj izbor je pao na Python, ponajviše zbog velike sličnosti Numpy i Scipy paketa sa Matlab-om koji sam ranije koristio. Za Python koristim isključivo PyCharm editor na preporuku kolege.

Iako Python ima zavidne biblioteke za vizualizaciju podataka, najčešće pišem skripte koje obrađene podatke upišu u csv fajl koji učitam u Tableau. Nivo interakcije sa podacima koje Tableau pruža mi je i dalje nezamenljiv.

Od skoro koristim i veoma zanimljiv Julia Language. U pitanju je veoma mlad jezik stvoren kao alternativa pre svega za Matlab, ali i za R i Python, a sintaksa podseća na zanimljiv spoj Python, Matlab i C sintakse. Podjednako je lak za koršićenje kao Python, ali značajno boljih performansi koje su posledica raznih optimizacija ispod haube, ali i mogućnosti deklarisanja tipova varijabli. Posledica svega toga je da, recimo, Julia izvršava velike Monte Karlo simulacije bar 10 puta brže od Python-a. To pravi razliku između 15 minuta i 2 i po sata i potpuno prebacuje koncept rada na vrlo agilne iteracije.

Organizacija rada

I pored svih aplikacija u ovom domenu, zid mi je nezamenljiv (kancelarije su oblepljene materijalom koji pravi whiteboard od svih zidova). Ovaj pristup radi za zadatke koji i inače idu u Jira-u, ili za pravljenje planova na malo većem nivou apstrakcije.

Poseban slučaj nastaje prilikom rada na dužim analizama, koje prkose upotrebljivosti standardnih skram i edžajl pravila cepanja zadatakla i planiranja budući da je priroda ovakvih analiza nepredvidiva i nelinearna — posle isprobanih 5 pristupa shvatite da je u drugom, odbačenom pristupu ključ za dalji prodor. Rešenje koje se nametnulo kao najbolje je vođenje dnevnika postavljenih hipoteza sa opisima metodologija i metoda provere. Posle nekog vremena imate pred sobom svojevrsnu bazu znanja o temi sa listom novih hipoteza koje je sve lakše prioritetizovati kako vreme prolazi.

Kao još jedno low-tech rešenje, ovaj dnevnik se pokazao najkorisnijim ukoliko je u običnom tekstualnom formatu, komitovan na git zajedno sa ostalim kodom i materijalom.

Dimitrije Milenkovic

Objavio/la članak.

subota, 3. Decembar, 2016.

IT Industrija

🔥 Najčitanije

Milos Pavlovic

ponedeljak, 12. Decembar, 2016.

A sta kazete na linuks umesto Mac-a?

Dimitrije Milenković

subota, 3. Decembar, 2016.

Ćao, Dušane! Planirali smo da bude još tekstova ljudi koji se bave analizom u K&A rubrici u narednom periodu. Sledeći stiže već u naredne dve nedelje. :)

Dusan

subota, 3. Decembar, 2016.

Korisno!. Bilo bi sjajno kada bi nastavili sa ovakvim tekstovima (hardvare/softver/alati koji se koriste) sa svima koji se bave analizom podataka kod nas.