R jezik u praksi: Kako velike kompanije štede resurse uz pomoć nauke o podacima?

Kao najava za predstojeću Data Science konferenciju koja će se održati 11. i 12. oktobra u hotelu Holiday Inn, 20. septembra u Startit Centru održan je meetup Life cycle of Data Scientist.

Aleksa Vidović
22/09/2016

Bojan Sovilj, jedan od pionira nauke o podacima u Srbiji i osnivač kompanije Cloudwalker,  objašnjavao je praktičnu upotrebu ove oblasti na primeru etiketir mašine.

Optimizacija pomoću nauke o podacima

Bojan nam je objasnio na koji način pomoću data science-a možemo optimatizovati rad mašine za lepljenje etiketa i ostvariti uštedu između 15-20% u potrošnji hemijskog lepka. U apsolutnim brojkama to je cifra od oko 10 tona lepka na godišnjem nivou.

Ta ušteda možda i ne deluje značajno, ali ukoliko uzmete u obzir da, na primer, Henkel ima preko 1000 etiketir mašina širom Evrope, dolazimo do toga da je moguće uštedeti gotovo 10.000 tona hemijskog lepka na godišnjem nivou.

Bojan nam je objasnio da je prvi problem sa kojim se susreo bio upravo u samoj arhitekturi baze podataka. Naime, u jednom trenutku se došlo do toga da etiketir mašina koristi tabelu od 17 miliona redova kako bi započela svoj aktivni proces koji definiše količinu lepka koja je neophodna da bi se etiketa zalepila na flašu.

S obzirom na to da je bilo potrebno istovremeno i upisivati podatke, mašina je u jednom trenutku prestala da radi. Nakon što je problem rešen kroz uvođenje privremene tabele koja sadrži samo neophodne podatke za pokretanje aktivnog procesa, prešlo se na proces optimizacije potrošnje hemijskog lepka.

Sam proces etiketiranja je takav da mašina prolazi kroz nekoliko vrsti stanja: stabilna potrošnja, nestabilna potrošnja, zaustavljen proces i spoljni uticaj (iliti kada operater stane na vagu prilikom dolivanja lepka). Ideja je da se nestabilna stanja detektuju u početnom ciklusu nestabilnosti (koji traje i do 2.5h) i da se proces što manje zaustavlja, jer tada dolazi do pasivne potrošnje u vidu isparivanja hemijskog lepka.

Pomoću vektorskog jezika R, koji je veoma ekspresivan i popularan u Data Science zajednici (a s kojim svi možete da se upoznate ovde), za kratko vreme se uspelo da se unaprede algoritmi za izračunavanje procene potrošnje lepka kroz nekoliko matematičkih operacija i drugačiju organizaciju podataka.

Bojan nam je rekao da tu nije kraj i da je tek na početku procesa da se postigne pomenuta ušteda od 20%. Do toga se dolazi kako kroz drugačiji organizaciju arhitekture baze, koja će omogućitioptimalnu potrošnju hemijskog lepka.

Prijave za konferenciju

U cilju podizanja svesti i jačanja nauke o podacima, Institut savremenih nauka organizuje Data Science Conference, drugi put za redom u Beogradu.

Konferencija je potpuno besplatna i služi da se steknu osnovna i prodube postojeća znanja iz ove oblasti. Konferencija će biti održana 11. i 12. oktobra u hotelu Holiday Inn. Možete se prijaviti ovde.

Aleksa Vidović

Objavio/la članak.

četvrtak, 22. Septembar, 2016.

IT Industrija

🔥 Najčitanije