Tudástár

Blog

Gyakorlati tippek, esettanulmányok és gondolatok az automatizálásról magyar kis- és középvállalkozásoknak.

Egyéb

Képes-e egy kis nyelvi modell megjósolni a kernel késleltetését, a memóriát és a modell pontosságát a kódból? Egy új regressziós nyelvi modell (RLM) igennel válaszol

A Cornell és a Google kutatói kifejlesztettek egy új, egységes Regression Language Modelt (RLM), amely képes közvetlenül kódsorokból numerikus eredmények előrejelzésére, mint például GPU kernel késleltetés, program memóriahasználat vagy neurális hálózatok pontossága. Ez a 300 millió paraméteres modell erős rangkorrelációkat ér el különböző feladatok és nyelvek között, megmutatva, hogy a kis nyelvi modellek is képesek lehetnek a kódokból történő pontos előrejelzésekre.

Tovább olvasom
Egyéb

Gondolkodó gépek bemutatja a Tinkert: alacsony szintű képzési API, amely elosztott LLM finomhangolást tesz lehetővé a beállítások megőrzésével

A Thinking Machines bemutatta a Tinkert, egy új Python API-t, amely lehetővé teszi a kutatók és mérnökök számára, hogy helyben írják meg a tanítási ciklusokat, miközben a platform ezeket kezeli a felügyelt, elosztott GPU-klasztereken. A Tinker különleges előnye, hogy miközben a felhasználók teljes kontrollt tarthatnak az adatok, célok és optimalizálási lépések felett, a rendszer gondoskodik az ütemezésről, hibatűrésről és többcsomópontos vezérlésről.

Tovább olvasom
Egyéb

Servicenow AI bemutatja az Apriel-1.5-15B-Thinker modellt: csúcsteljesítményű, nyílt súlyú multimodális érvelési rendszer megfizethető GPU-költséggel

Fedezd fel a ServiceNow AI legújabb fejlesztését, az Apriel-1.5-15B-Thinker modellt, amely 15 milliárd paraméterével és nyílt súlyaival új szintre emeli a multimodális érvelést. Ez a modell a legmodernebb teljesítményt nyújtja, miközben nyolcszoros költségmegtakarítást biztosít, és mindezt egyetlen GPU-val.

Tovább olvasom
Egyéb

Hogyan építsünk fejlett, ügynöki visszakeresés-alapú generatív rendszert dinamikus stratégiával és intelligens visszakereséssel?

Fedezd fel az Agentic Retrieval-Augmented Generation (RAG) rendszer fejlesztésének izgalmas világát! Ebben az útmutatóban bemutatjuk, hogyan hozhatsz létre egy intelligens rendszert, amely nemcsak dokumentumokat keres, hanem dinamikusan dönt a legjobb stratégiáról és kontextusfüggően szintetizál válaszokat. Ha érdekel a modern technológiák alkalmazása a mesterséges intelligenciában, ne hagyd ki ezt a cikket!

Tovább olvasom
Egyéb

Az Anthropic bemutatja a Claude Sonnet 4.5-öt új kódolási és ügynöki csúcsteljesítménnyel

Az Anthropic bemutatta a Claude Sonnet 4.5-öt, amely új mércét állít fel a szoftverfejlesztés és a valós számítógéphasználat terén. Az újítások között található a Claude Code ellenőrzőpontok, egy natív VS Code kiterjesztés és egy Agent SDK, amely lehetővé teszi az Anthropic belső használatú eszközeinek elérését.

Tovább olvasom
Egyéb

Hogyan tervezzünk interaktív Dash és Plotly irányítópultot visszahívási mechanizmusokkal helyi és online telepítéshez?

Fedezd fel, hogyan építhetsz egy fejlett interaktív irányítópultot Dash, Plotly és Bootstrap segítségével! Ez az útmutató nemcsak a dizájn és vizualizáció alapjait mutatja be, hanem azt is, hogyan kapcsolódnak a vezérlők az eredményekhez a Dash callback mechanizmusával, valós idejű reakcióképességet biztosítva.

Tovább olvasom
Egyéb

A legújabb Gemini 2.5 Flash-Lite bemutató: a leggyorsabb saját modell (külső tesztek alapján) és 50%-kal kevesebb kimeneti tokennel

A Google nemrégiben kiadta a Gemini 2.5 Flash és Flash-Lite modellek frissített verzióit, amelyek az AI Studio és a Vertex AI platformokon érhetők el. Az új előnézeti modellek a leggyorsabbak közé tartoznak a piacon, és akár 50%-kal kevesebb kimeneti tokent használnak, így még hatékonyabbá válnak a felhasználók számára.

Tovább olvasom
Egyéb

Ismerd meg a Qwen3Guardot: Qwen3-alapú többnyelvű biztonsági modell a globális, valós idejű mesterséges intelligencia védelemért

Ismerd meg a Qwen3Guardot, az Alibaba legújabb fejlesztését, amely a valós idejű mesterséges intelligencia biztonságát hivatott garantálni! A Qwen3Guard két változatban érhető el, és célja, hogy többnyelvű szövegek esetén is hatékonyan moderálja a beérkező és generált tartalmakat, így biztosítva a globális felhasználók számára a biztonságos AI-élményt.

Tovább olvasom
Egyéb

Az OpenAI bemutatja a ChatGPT „Pulse”-t: proaktív, személyre szabott napi összefoglalók profiknak

Fedezd fel az OpenAI legújabb innovációját, a ChatGPT Pulse-t, amely személyre szabott, kutatásokkal alátámasztott napi frissítésekkel segíti a napod indítását. Ez a mobilon elérhető, előzetes verzióban és kizárólag a havi 200 dolláros Pro előfizetők számára elérhető szolgáltatás a ChatGPT-t egy kontextusérzékeny asszisztenssé alakítja.

Tovább olvasom
Egyéb

Vállalati keresés: vision-RAG és text-RAG technikai összehasonlítása

Fedezd fel, hogyan forradalmasítja a Vision-RAG az üzleti kereséseket! A Vision-RAG technológia a vizuális elemeket is figyelembe véve javítja a korábbi Text-RAG rendszerek pontosságát és hatékonyságát, különösen a gazdag vizuális tartalommal rendelkező dokumentumok esetében. Ha érdekel, hogyan küzd meg a PDF-ek feldolgozása során felmerülő kihívásokkal, olvass tovább!

Tovább olvasom