BySárközi Kálmán2026.05.25. Hozz létre egy teljes Langfuse megfigyelő és értékelő rendszert nyomkövetéshez, utasításkezeléshez, pontozáshoz és kísérletekhez Egyéb
BySárközi Kálmán2025.10.16. QeRL: az NVFP4-kvantált megerősítéses tanulás (RL) egyetlen H100-ra hozza a 32B LLM képzést—miközben javítja a felfedezést Egyéb