Data science iliti nauka o podacima je jedna od najdinamičnijih i brzorastućih oblasti koja privlači programere, statističare, istraživače iz različitih oblasti, kao i mnoge druge profile. Ukoliko se pronalaziš u tom opisu i želiš besplatno da naučiš R programski jezik, kao i kako da ga primenjuješ u oblasti data science, onda te pozivamo da nastaviš da čitaš dalje!
Uslovi
Uslovi učešća na kursu su sledeći:
- ozbiljnost u nameri da naučiš R i uđeš u oblast data science
- posedovanje laptopa koji ćeš donositi na kurs
- osnovno znanje iz statistike i/ili verovatnoće
- makar minimalno iskustvo sa programiranjem u bilo kom programskom jeziku
- depozit od 2.500 dinara
Dodatak: depozit je jedini način koji imamo kojim možemo da osiguramo primanje samo ozbiljnih polaznika. U slučaju da polaznik prekrši dogovor o redovnosti i posvećenosti, depozit neće biti vraćen, ali ni zadržan od strane naše organizacije; biće uplaćen u vaše ime u dobrotvorne svrhe. Sva prava i obaveze organizatora i polaznika se definišu ugovorom.
Šta se očekuje od tebe tokom kursa?
- Od polaznika se očekuje sledeće:
- da prisustvuju svim sesijama kursa
- da se pripremaju svaku sesiju unapred (čitanje + kodiranje, odnosno vežbe u R koje će biti zadavane). Ovo je neophodno pošto će kurs biti prilično intenzivan, ali zato i efikasniji od prethodnih sličnih kurseva. Fokus će biti na knjizi R for Data Science, ali pošto ona prati na linearan način učenja R programiranja polaznici će jezičke ekspresije u R savladavati uporedo sa poglavljima knjige, kroz vežbe i kod na GitHubu
- da pronađu, u dogovoru sa predavačem, skup podataka na kome će vežbati i razvijati svoje znanje programskog jezika R tokom kursa i na kraju kursa predstaviti mini-projekat na osnovu analize i vizuelizacije tog skupa podataka.
Šta ti možeš da očekuješ od kursa?
- Polaznici mogu da očekuju sledeće:
- poznavanje i razumevanje logike rada sa R paketima iz {tidyverse}
- I/O funkcije samog jezika, paketa poput {readr} i {data.table}
- transformisanje i uređivanje skupova podataka sa paketima {dplyr} i {tidyr}
- vizuelizaciju podataka statitičkim dijagramima u paketu {ggplot2}
- poznavanje toka rada za eksploratornu analizu podataka (EDA), deskripciju podataka, i elementarne neparametrijske metode u R
- elementarno matematičko modeliranje u programskom jeziku R koje će se proučavati na primeru linearnog regresionog modela i nekih veoma korisnih modela iz klase Generalizovanih linearnih modela (binarna i multinomijalna logistička regresija).
- Polaznici na kraju kursa ne treba da očekuju:
- poznavanje R za produkciju (Rmarkdown, RStudio Shiny, itd.)
- poznavanje paralelizacije R koda
- rad sa Big Data kroz R
- znanje razvoja interaktivnih, dinamičkih vizuelizacija putem R interfejsa ka D3 funkcijama i sličnim JS front-end alatkama
- elaborirano znanje matematičkog modeliranja u određenoj oblasti (to je granica koju samo oni sami sebi mogu da zacrtaju i osvajaju je)
O predavaču
Dr Goran S. Milovanović se više od petnest godina profesionalno bavi analitikom podataka, a radi kao Data Scientist od 2013. godine, posle akademske karijere u kognitivnim naukama (suđenje i rezonovanje, odlučivanje u uslovima rizika i neizvesnosti, semantičko pamćenje, kategorizacija, statističko kauzalno učenje). Ima akademsko, profesionalno, i volontersko iskustvo u nastavi statistike u društvenim naukama, te eksperimentalne i neeksperimentalne metodologije, na srpskom i engleskom jeziku.
Trenutno je angažovan kao Data Scientist na semantičkom veb projektu Wikidata od strane Wikimedia Deutschland, i kao mentor u oblasti Data Science-a za američki startap Springboard. Vlasnik je konsultantske firme DataKolektiv u Beogradu. Njegova ekspertiza u Data Science je u Information Retrieval problemima (u eksploratornoj analitici) i predikciji ljudskih izbora (u prediktivnoj analitici). Više o njegovom radu i interesovanjima se može naći na stranicama bloga The Exactness of Mind. Član je Data Science Srbija.
Termini kursa
U toku kursa je planirano 10 sesija od 2 sata (uvek u terminu od 17-19h) sledećih datuma:
- 7. oktobar (nedelja)
- 13. oktobar (subota)
- 20. oktobar (subota)
- 27. oktobar (subota)
- 3. novembar (subota)
- 17. novembar (subota)
- 24. novembar (subota)
- 1. decembar (subota)
- 8. decembar (subota)
- 15. decembar (subota)
Materijali za kurs
-
- GitHub repozitorijum sa R kodom i RMarkdown notebooks sa prethodnih kurseva u Startitu
- knjiga R za statističku obradu podataka (O’Reilly izdanje na srpskom jeziku, Mikroknjiga, 2017, odn. R for Data Science, na engleskom, kompletno otvorena online, aut. Hadley Wickham & Garrett Grolemund);
- knjiga za one koji žele da prodube svoje poznavanje programiranja u R: THE ART OF R PROGRAMMING, autora Normana Matlofa.
Prijave
Prijave za R za Data Science kurs su otvorene do 4. oktobra, a svi zainteresovani se mogu prijaviti ovde. Za sva pitanja ili nedoumice koje imate, možete pisati na [email protected].
Goran
utorak, 25. Septembar, 2018.
Kada kazete osnovno znanje statistike i/ili verovatnoce na koliko znanje pucate da treba da znamo kao osnovno?