新闻公告

大模型推理能力的进化路径:可验证奖励、离策略学习和测试时强化学习

演讲者:Dr. Yafu LI, Shanghai Artificial Intelligence Laboratory

时间:2025-10-27 14:00-16:30

地点:Room 112, Lecture Hall 3

海报