Većina ljudi pod open-source AI podrazumeva mogućnost da preuzmu težine (engl. weights). Za Nikolu Cvetkovića, senior inženjera u Tenstorrentu, to je tek polazna tačka. On radi na najnižem sloju AI steka — piše kod niskog nivoa za RISC-V hardver koji je pravljen da bismo mogli da imamo potpunu kontrolu u našem radu. To znači transparentniji razvoj, prilagodljivije sisteme i manje zavisnosti od crnih kutija.
Na našem razgovoru u okviru Hot AI Summera, Nikola je povezao filozofiju sa vrlo praktičnim stvarima: kako se modeli zaista prave, gde su uska grla, kada otvorenost ubrzava inovacije — i koliko to sve košta u realnom svetu, kad treba da pokreneš model na sopstvenoj mašini.
Šta zapravo znači „otvoreno“ u AI-ju
Ako želiš stvarno otvoren AI, ne staješ na težinama. Trebaju ti otvoreni skupovi podataka (da bi se rezultat ponovio i proverio), uvid u to kako je treniran, otvoreni alati za evaluaciju i — sve češće — otvoreni kompajleri i ISA (instruction set architecture) kako ne bi zavisio ni od koga (npr. NVIDIA-je) na nivou silicijuma.
Tek tada dobijaš transparentnost, prilagodljivost i raznolik ekosistem u kome možeš da biraš rešenje za svoj slučaj upotrebe umesto da se prilagođavaš tuđem API-ju.
Ako postoji open-source ekosistem to nam dajetransparentnost — da možemo da vidimo unutrašnjost ovog modela.
Daje nam prilagodljivost — da mogu da promenim određene stvari i prilagodim ih svom slučaju upotrebe.
Pa raznovrsnost ekosistema — tako da mogu da biram različita rešenja prema svojim potrebama.
Open-source AI softver sada tamo gde je Linux bio devedesetih.
Zašto je Tenstorrent interesantan „ispod haube“
Tenstorrent gradi AI računare na otvorenom RISC-V ISA i sav SDK otvara javnosti. To uključuje kompajler (TT-Forge), runtime (TT-Metal) i trening recepte (Blacksmith).
Poenta: preuzmeš model, kompajliraš ga i — ako je operacije modela hardver pokrio — pokreneš ga bez tuđih zatvorenih slojeva.
Naše ploče su oko $1,000–1,300; workstation je oko $10,000 — to može da kupi i solo developer.
Ne treba ti ni NVLink — skaliramo preko Ethernet-a.
Ono što posebno ističe su dva praktična efekta.
Prvi: spomenuto skaliranje preko Ethernet-a umesto patentiranih interkonekcija — što spušta cenu i podiže fleksibilnost.
Drugi: TCO. U zavisnosti od nivoa, Nikola procenjuje da ukupni trošak za istu klasu posla može biti i duplo manji, a u povoljnijim scenarijima i do nekoliko puta niži u odnosu na klasične zatvorene sisteme.
Za isti posao trošak može biti više kao pola — a u nekim slučajevima i nekoliko puta niži.
Naravno, zrelost ekosistema nije ista po svim oblastima — diffuzija/video su sporiji — ali core LLM slučajevi (Llama, DeepSeek i sl.) rade i napreduju.
Llama? Da.
DeepSeek? Da.
Neki najnoviji modeli traže da prvo implementiramo potrebne operatore, pa ponekad treba sačekati port.
Kako se modeli prave — i gde otvorenost menja igru
Od prikupljanja i označavanja ogromnih skupova podataka, preko izbora arhitekture i treninga, do evaluacije i objave — svaki korak dobija na kvalitetu kad je otvoren: reproducibilni rezultati, nezavisne provere, specijalizacije preko fine-tuninga, distilacije i portovanja na različit hardver.
Otvoreni recepti, otvoreni skupovi podataka i otvoreni alati za evaluaciju ti daju mogućnost da rezultat ponoviš — i da ga prilagodiš svom slučaju upotrebe.
Kad sve to držiš u svojim rukama, ne strepiš da će promena uslova korišćenja ili neka nova odluka trećeg lica sutra razbiti tvoj proizvod ili proces.
Hot AI Summer je bio projekat Startita uz podršku OTP banke gde smo AI zajednici u Srbiji pružali besplatan coworking i networking (10–18h) i meetupe sa uglednim gostima (18–20h) u Beogradu i Novom Sadu.