BySárközi Kálmán2026.03.28. Az NVIDIA AI bemutatja a ProRL ügynököt: egy szétválasztott szolgáltatási infrastruktúra a többfordulós megerősítéses tanulás nagy léptékű támogatásához Egyéb
BySárközi Kálmán2026.02.04. Egy biztonságkritikus megerősítéses tanulóügynökök offline képzése konzervatív Q-tanulással d3rlpy és rögzített történeti adatok segítségével Egyéb