2019年12月18日,美国普林斯顿大学终身教授范剑青应邀做客第251期南科大讲堂,在图书馆111报告厅为我校师生带来以“大数据人工智能与金融创新”为主题的精彩报告。本期大讲堂由我校统计与数据科学系主任邵启满主持。
范剑青作报告
范剑青是美国普林斯顿大学终身教授,Frederick L. Moore’18冠名金融讲席教授,运筹与金融工程系原系主任,国际数理统计学会前主席,Academician of Academia Sinica,《Journal of Econometric计量经济杂志》主编。他曾获2000年度的COPSS总统奖,2007“晨兴华人数学家大会应用数学金奖”等国内外奖项。他的主要研究领域包括高维统计、机器学习、计量金融、时间序列、非参数建模等。
师生认真听讲
范剑青在报告中介绍了当代发展迅猛的大数据人工智能浪潮,简述了人工智能的背景与起源。随后通过引出并回答三个问题“What is AI?”“What is Machine Learning? ”与“What is Deep Learning?”,范剑青用简洁的话语解释了三者的本质,并指出“人工智能其实就是统计学”。在介绍机器学习通过权衡偏差和方差的有效方法在大数据时代获得巨大成功的同时,范剑青也点出现今机器学习领域的不足,介绍了今后人工智能机器学习方面的挑战。
经济金融与数据联系紧密。范剑青介绍,由于金融数据信息密度、深度和广度均显著增加,让数据变得更智能以期提高金融市场的决策效率是当下金融行业内的主要课题。在应用方面,他给出当下金融科技热门的三个方向:移动支付、智能投顾和大数据征信,说明现在大数据已经无处不在,数据智慧化已经成为这场技术与信息革命的核心任务。
范剑青接下来谈到人工智能的基础与大数据的共性,幽默风趣地给出非参数统计的定义,指出“All models are wrong but some are useful”,从数学原理的角度解释在高维度数据下非参数统计方法的灵活性。他通过列举法,给出大数据的共性,有相互依赖性、数据重尾性、数据缺失性、测量误差性、生存偏差和抽样偏差等,随后通过两个大数据经典应用“预测债券风险溢价”和“蛋白质和基因表达”,讲述了数据处理过程中因子调整与模型选择的重要性,以及如何使得模型更加稳健。金融预测也是数据智能化下的一个重要课题。他介绍,预测金融市场变化的重点在于主因子分析与协变量分析,以此建立多因子指标预测模型,对模型应用深度学习方法,获得预测结果。
踊跃提问的同学
范剑青教授的演讲内容丰富、语言生动。他指出,现在大数据与人工智能在各行各业的广泛应用,鼓励师生多学习统计知识。讲座结束后,现场师生踊跃提问,现场气氛十分活跃,范剑青一一认真作答。