Zyphra bemutatja a ZAYA1-8B-t: egy érvelő MoE modell AMD hardveren, amely a felsőbb kategóriákat is megszorongatja

Fedezd fel a Zyphra legújabb innovációját, a ZAYA1-8B modellt, amely mindössze 760 millió aktív paraméterrel is felülmúlja méretét többszörösen meghaladó modelleket a matematikai és kódolási teszteken. Az AMD Instinct MI300 hardveren képzett modell új mércét állít a kis súlyú nyelvi modellek intelligenciasűrűségében, és már most lenyűgöző eredményeket ér el a legújabb benchmarkokon.

A mesterséges intelligencia világában a Zyphra legújabb fejlesztése, a ZAYA1-8B, komoly áttörést jelent. Ez a modell a „Mixture of Experts” (MoE) technológiát alkalmazza, és bár csupán 760 millió aktív paraméterrel rendelkezik, teljesítménye messze meghaladja a hasonló súlyú modellekét. Különösen a matematikai és kódolási feladatok terén mutat kiemelkedő eredményeket, ahol számos, nála nagyobb modellt is felülmúl.

A ZAYA1-8B fejlesztése során AMD Instinct MI300 hardveren folytattak teljes körű képzést, ami lehetővé tette, hogy a modell a lehető legnagyobb hatékonysággal működjön. Külön figyelmet érdemel a Markovian RSA tesztelési módszer, amely lehetővé teszi, hogy a modell még összetett feladatok során is kiemelkedően teljesítsen.

A ZAYA1-8B modell lényegét tekintve egy intelligencia-sűrűségről szóló új mércét állít fel a kisebb nyelvi modellek kategóriájában. Ez a fejlesztés nemcsak hogy összehasonlítható a DeepSeek-V3.2 teljesítményével, de a Claude 4.5 Sonnet modellt is túlszárnyalja a HMMT’25 tesztelése során.

A modell Apache 2.0 licenc alatt került kiadásra, ami azt jelenti, hogy a fejlesztők és kutatók szabadon hozzáférhetnek és továbbfejleszthetik, így a tudományos közösség szélesebb köre is profitálhat a Zyphra innovatív munkájából.

Ez a fejlesztés jól mutatja, hogy a mesterséges intelligencia területén nem mindig a méret a lényeg. A hatékonyság és a specifikus optimalizáció révén a kisebb modellek is képesek versenyre kelni a nagyobbakkal, és sok esetben felül is múlni azokat. A Zyphra ezzel az új modellel bizonyította, hogy a jövőben még több meglepetésre számíthatunk a mesterséges intelligencia világában.