统计数科大讲堂

统计学习方法在观测型数据的应用:预测与因果关系分析

演讲者:刘涛(布朗大学)

时间:2019-11-27 16:00-17:30

地点:慧园3栋415报告厅

报告简介  Abstract

预测 (prediction)、统计推断 (inference)、和因果关系 (causation) 是统计分析的三个重要领域。“机器/统计学习”侧重于预测、并在很多领域(包括人工智能)获得广泛应用。“因果关系分析”在可观测数据的基础上进一步探索不同事件的内部关系,因此与预测紧密相关,但侧重进一步解读不同事件之间的本质关系。本次报告分为两部分:首先,以大型艾滋病临床数据为例,介绍一个以贝叶斯方法为基础的叠加决策树模型。 此模型类似于“房屋” (compartment) 微观模型,利用决策树的优势可以 (a) 对复杂疾病进程进行描述和预测,预测结果可为多项式/复合分布 (joint posterior distribution) 也可为后验最可能结果 (posterior mode);另外 (b) 此决策树模型可以把G-computation 结合到贝叶斯resampling中进行因果关系分析,用于预测和比较不同临床干预方案下的潜在(counterfactual) 治疗结果。报告的第二部分以伊博拉临床数据为例,介绍一个生存分析模型、以及如何利用倾向性值(propensity score) 对观测型数据进行修正、以模拟随机分组试验。修正包括在counterfactual下对医疗方案的选择和删失数据的调整。模型分析了静脉补液、维生素、抗疟疾药物等临床干预对伊博拉患者生存的影响。报告最后将讨论电子医疗健康数据中的一些开放式问题。


嘉宾简介  About the Speaker

刘涛博士,男 。布朗大学(Brown University)生物统计学副教授(博士生导师)、布朗大学ARCH 健康数据与分析中心主任。同时担任布朗大学统计科学中心(CSS)、数据科学计划(DSI)、临床与转化研究中心(Advance-CTR)、波士顿-普罗维登斯艾滋病研究中心(CFAR)教授成员。以及美国-肯尼亚健康服务网络(AMPATH)委任教授成员。美国影像学会(ACR)心血管研究组委会委员。主要研究方向为医疗与公共卫生统计学,侧重于医疗健康大数据整合、分析与建模,多中心临床试验设计,数据驱动(data-driven)循证临床决策,基于虚拟事实模型的因果关系分析,机器学习以及数据可视化,以及健康信息技术在多学科跨领域中的应用。