BySárközi Kálmán2026.02.04. Egy biztonságkritikus megerősítéses tanulóügynökök offline képzése konzervatív Q-tanulással d3rlpy és rögzített történeti adatok segítségével Egyéb