Prošle subote Čamat Palihapitija, osnivač Social Capitala i jedan od voditelja popularnog All-In podkasta, objavio je tvit koji je počeo jednostavno, sa Wow.

Reagovao je na lansiranje Taalas-a — novog AI čip startapa koji tvrdi da može da pokrene Llama 3.1 model brzinom od 17.000 tokena po sekundi po korisniku.

To je, prema njihovim podacima, skoro 10 puta brže od bilo čega što trenutno postoji na tržištu. Iza tog startapa stoji Ljubiša Bajić.

Bajićeva karijera pre Taalasa

Bajić je odrastao u Jugoslaviji, a srednju školu je završio u Moskvi, privučen jakom matematičkom tradicijom.

Godine 1985. se preselio u Kanadu da studira elektrotehniku, a odatle je otišao u Silicijumsku Dolinu, gde je godinama radio na dizajnu čipova — kao direktor u AMDu i kao senior arhitekta u Nvidiji.

Godine 2016. osnovao je Tenstorrent zajedno sa Ivanom Hamerom i Milošem Trajkovićem. Kompanija je krenula iz podruma, a danas ima preko hiljadu zaposlenih u kancelarijama širom sveta — uključujući i kancelariju u Beogradu koju je Bajić lično otvorio.

Kada je Džim Keler postao CEO Tenstorrenta 2023. godine, Bajić se povukao iz operativne uloge i posle šest meseci počeo da radi na potpuno drugačijoj ideji.

Taalas — jedan čip, jedan model

Ideja iza Taalasa je drugačija od ostatka industrije: umesto da praviš čipove koji mogu da pokrenu bilo koji model (kao što to rade Nvidia, Groq, Cerebras i ostali), napravi čip koji je dizajniran da pokrene samo jedan specifičan model — ali da to uradi brzo i jeftino.

HC1, njihov prvi čip, ima Llama 3.1 8B model bukvalno "utisnut" u silicijum. Model je hardverski deo čipa — bez učitavanja težina iz eksterne memorije, bez hlađenja vodom.

Tim od 24 ljudi potrošio je 30 miliona dolara na razvoj i dobio ovo:

Za kontekst, evo šta to znači u praksi:

Reakcije i kompromisi

Reakcije na Taalas su bile pomešane:

Upravo tu je i glavni kompromis: ako napraviš čip za jedan model, moraš napraviti novi čip za svaki novi model. Za Llama 4 — novi čip. Za GPT-5 — novi čip.

Ali specijalizacija ne znači nužno zaključanost:

"Zamislite Opus 5 ovom brzinom"

A šta ako ovakva brzina postane dostupna za ozbiljne modele?

Naravno, bilo je i onih koji su ovako zamišljali primenu:

A bilo je i iskrenih reakcija tipa "šta će mi ovo":

Šta dalje

Taalas je do sada prikupio oko 219 miliona dolara u tri runde finansiranja.

Plan za 2026. uključuje dva nova čipa: jedan za reasoning model srednje veličine ovog proleća, i jedan za najnapredniju klasu modela (frontier — tu spadaju GPT-4, Claude Opus i slični) na kraju godine. Prema najavama samog Taalasa, cilj je da njihov čip podrži model na nivou GPT-5.

Pitanje da li se specijalizovani čipovi za pojedinačne modele zaista isplate — ili je industrija prebrza za takav pristup — verovatno ćemo znati pre kraja godine.

Za one koji žele da probaju — demo je dostupan na chatjimmy.ai.