BySárközi Kálmán2025.09.05. Biomni-R0: új, ügynöki LLM-ek végponttól végpontig többfordulós megerősítéses tanulással, szakértői szintű intelligenciáért a biomedikai kutatásban Egyéb
BySárközi Kálmán2025.08.29. Memory-R1: Hogyan turbózza fel a megerősítéses tanulás a nagy nyelvi modellek memóriáját? Egyéb