
A mesterséges intelligencia világában a Zyphra legújabb fejlesztése, a ZAYA1-8B, komoly áttörést jelent. Ez a modell a „Mixture of Experts” (MoE) technológiát alkalmazza, és bár csupán 760 millió aktív paraméterrel rendelkezik, teljesítménye messze meghaladja a hasonló súlyú modellekét. Különösen a matematikai és kódolási feladatok terén mutat kiemelkedő eredményeket, ahol számos, nála nagyobb modellt is felülmúl.
A ZAYA1-8B fejlesztése során AMD Instinct MI300 hardveren folytattak teljes körű képzést, ami lehetővé tette, hogy a modell a lehető legnagyobb hatékonysággal működjön. Külön figyelmet érdemel a Markovian RSA tesztelési módszer, amely lehetővé teszi, hogy a modell még összetett feladatok során is kiemelkedően teljesítsen.
A ZAYA1-8B modell lényegét tekintve egy intelligencia-sűrűségről szóló új mércét állít fel a kisebb nyelvi modellek kategóriájában. Ez a fejlesztés nemcsak hogy összehasonlítható a DeepSeek-V3.2 teljesítményével, de a Claude 4.5 Sonnet modellt is túlszárnyalja a HMMT’25 tesztelése során.
A modell Apache 2.0 licenc alatt került kiadásra, ami azt jelenti, hogy a fejlesztők és kutatók szabadon hozzáférhetnek és továbbfejleszthetik, így a tudományos közösség szélesebb köre is profitálhat a Zyphra innovatív munkájából.
Ez a fejlesztés jól mutatja, hogy a mesterséges intelligencia területén nem mindig a méret a lényeg. A hatékonyság és a specifikus optimalizáció révén a kisebb modellek is képesek versenyre kelni a nagyobbakkal, és sok esetben felül is múlni azokat. A Zyphra ezzel az új modellel bizonyította, hogy a jövőben még több meglepetésre számíthatunk a mesterséges intelligencia világában.