Tudástár

Blog

Gyakorlati tippek, esettanulmányok és gondolatok az automatizálásról magyar kis- és középvállalkozásoknak.

Egyéb

A FireRedTeam bemutatja a FireRed-OCR-2B-t: új megoldás a táblázatok és LaTeX strukturális hibáinak javítására szoftverfejlesztőknek GRPO használatával

Fedezd fel a FireRed-OCR-2B-t, a FireRedTeam legújabb fejlesztését, amely forradalmasítja a dokumentum digitalizálást! Az új modell a "struktúrahallucinációk" problémáját célozza meg, így a szoftverfejlesztők számára még pontosabb és megbízhatóbb adatkinyerést biztosít táblázatok és LaTeX dokumentumok esetében.

Tovább olvasom
Egyéb

Kódolási megoldás hierarchikus tervező MI ügynök létrehozására nyílt forráskódú LLM-ek segítségével, eszközvégrehajtással és strukturált többügynökös érveléssel

Fedezd fel, hogyan építhetsz egy hierarchikus tervező mesterséges intelligencia ügynököt nyílt forráskódú modellek segítségével! Az útmutató bemutatja, miként alakíthatsz ki egy összetett feladatok megoldására alkalmas, több ügynökből álló rendszert, amelyben a tervező, végrehajtó és összegző ügynökök mindegyike speciális szerepet játszik.

Tovább olvasom
Egyéb

A Google DeepMind bemutatja az Egyesített Latenseket (UL): gépi tanulási keretrendszer diffúziós priorral és dekóderrel

A Google DeepMind új áttörést jelentő keretrendszert mutatott be, amely a generatív mesterséges intelligencia hatékonyságát hivatott növelni. Az újítás lehetővé teszi a magas minőségű rekonstrukciót anélkül, hogy a tanulási folyamat bonyolultabbá válna. Fedezd fel, hogyan forradalmasítja a Unified Latents (UL) a mesterséges intelligencia világát!

Tovább olvasom
Egyéb

Megjelent a Perplexity újítása: pplx-embed, az új csúcstechnológiás Qwen3 kétnyílú beágyazási modellek webes keresési feladatokhoz

A Perplexity bemutatta a pplx-embed nevű új, többnyelvű beágyazási modelljeit, amelyek kifejezetten nagy léptékű keresési feladatokra lettek optimalizálva. Ezek a modellek képesek kezelni a webes adatok zajosságát és összetettségét, így versenyképes alternatívát kínálnak a meglévő, zárt forráskódú beágyazási API-kkal szemben. Fedezd fel, hogyan hoznak újításokat az irányított figyelem és a diffúziós megközelítés révén!

Tovább olvasom
Egyéb

Tailscale és LM Studio bemutatja az „LM Linket” – titkosított pont-pont hozzáférés a privát GPU hardvereszközeidhez

A modern AI fejlesztők számára gyakran kihívást jelent a megfelelő hardveres erőforrásokhoz való hozzáférés, legyen szó otthoni munkaállomásról vagy hordozható laptopról. Ezen a problémán segít a Tailscale és az LM Studio újítása, az 'LM Link', amely titkosított, pont-pont elérést biztosít a privát GPU hardverekhez. Fedezd fel, hogyan hidalhatod át a hardveres különbségeket bárhonnan!

Tovább olvasom
Egyéb

Meta AI nyílt forráskódúvá teszi a GCM-et a jobb GPU klaszterellenőrzésért a kiemelkedő AI teljesítmény és hardver megbízhatóság érdekében

A technológiai világ figyelme a legújabb Llama fejlesztésekre irányul, de a valódi küzdelem a háttérben, az adatközpontok mélyén zajlik. Ahogy az AI modellek mérete egyre növekszik, úgy válnak a képzésükhöz szükséges klaszterek is egyre összetettebbé és sérülékenyebbé. A Meta AI kutatócsapata most egy új eszközt, a GCM-et tette nyílt forráskódúvá, hogy javítsa a GPU klaszterek monitorozását és ezáltal a mesterséges intelligencia képzés teljesítményét és a hardver megbízhatóságát.

Tovább olvasom
Egyéb

A Composio nyílt forráskódú ügynök-vezérlőt mutat be, hogy segítse az AI fejlesztőket a hagyományos ReAct hurkokon túlmutató, skálázható többügynökös munk

Az AI fejlesztők számára most új lehetőségek nyílnak meg a Composio által nyílt forráskódúvá tett Agent Orchestrator révén. Ez az eszköz segít túllépni a hagyományos ReAct (Reasoning + Acting) mintán, lehetővé téve a skálázható, több ügynököt kezelő munkafolyamatok kialakítását. Fedezd fel, hogyan forradalmasíthatja ez a megközelítés az AI fejlesztés világát!

Tovább olvasom
Egyéb

Hogyan hangoljuk össze a nagy nyelvi modelleket az emberi preferenciákkal: közvetlen preferenciaoptimalizálás, QLoRA és ultra-visszajelzés alkalmazásával

Fedezd fel, hogyan hangolhatjuk össze a nagy nyelvi modelleket az emberi preferenciákkal anélkül, hogy jutalommodellt használnánk! Az útmutató bemutatja, miként alkalmazhatjuk a Direct Preference Optimization (DPO) módszert QLoRA és PEFT technikákkal egyetlen Colab GPU-n, az UltraFeedback binarizált adathalmazon keresztül.

Tovább olvasom
Egyéb

Hogyan készítsünk matrjoska-optimalizált mondatbeágyazó modellt villámgyors kereséshez 64 dimenziós csonkítással?

Fedezd fel, hogyan finomhangolhatod a Sentence-Transformers beágyazási modellt a Matryoshka Representation Learning segítségével, hogy a legkorábbi dimenziók hordozzák a leghasznosabb szemantikai jeleket! A cikk bemutatja, hogyan érhetünk el ultragyors visszakeresést a beágyazások 64 dimenziós csonkításával, miközben megőrizzük a magas szintű keresési minőséget.

Tovább olvasom
Egyéb

NVIDIA-kutatók új KVTC kódolási eljárással 20x-os tömörítést érnek el a kulcs-érték tárolóknál a hatékony LLM kiszolgálásért

A nagy nyelvi modellek hatékony kiszolgálása komoly mérnöki kihívást jelent a kulcs-érték (KV) gyorsítótár kezelés miatt, különösen ahogy a modellek mérete és képességei növekednek. Az NVIDIA kutatói most bemutatták a KVTC átalakító kódolási eljárást, amely akár 20-szorosára is képes csökkenteni a KV gyorsítótárak méretét, ezzel jelentősen javítva a modellek kiszolgálásának hatékonyságát.

Tovább olvasom