Meituan, kineski gigant za dostavu hrane — kod nas bi mu pandan bili Glovo i Wolt zajedno — objavio je veliki jezički model LongCat-2.0 sa 1.6 biliona parametara. Prvi je, kako navode, frontier model te skale u potpunosti pre-treniran bez ijednog NVIDIA čipa, na domaćim Huawei Ascend NPU.

To je važno jer su američke izvozne kontrole presekle Kini pristup najnaprednijim NVIDIA čipovima. Niz modela poput DeepSeek V4 i Kimi 2.6 već drži korak, ali je treniranje ovih razmera gotovo uvek zavisilo od NVIDIA.

Domaći hardver, sopstveni softver

Softverska zajednica oko Ascend čipova je, kako navode, slabije razrađena nego oko NVIDIA. Meituan je zato morao sam da izgradi stabilan i skalabilan infrastrukturni sloj ispod modela.

Kad dostavljač hrane napravi model svetske klase

Po rezultatima je LongCat-2.0 blizu vrha, navodno sa 70.8 na Terminal Bench testu. Poređenje koje kruži dobro pogađa razmere: kao da DoorDash iznenada izbaci model svetske klase.

Još je rano da se vidi kakav je u stvarnom korišćenju, ali deluje vredno praćenja.

Više u objavi koja raščlanjuje Meituanov blog: