BySárközi Kálmán2025.12.04. Hogyan tanulunk lépésenkénti jutalmakat preferenciákból a ritka jutalmú környezetek megoldására online folyamat jutalmi tanulással Egyéb