南方科技大学统计与数据科学系

新闻公告

大模型推理能力的进化路径：可验证奖励、离策略学习和测试时强化学习

演讲者：Dr. Yafu LI, Shanghai Artificial Intelligence Laboratory

时间：2025-10-27 14:00-16:30

地点：Room 112, Lecture Hall 3

海报

微信公众号

Copyright © 2026 粤ICP备14051456号