ntry-header

日前,清华大学统计学研究中心邓婉璐、周在莹两位老师荣获“2019-2020学年度春季学期疫情防控期间在线教学优秀教师”称号。

我能有幸能得到这份肯定与鼓励,更多想说的是感谢。自年初疫情以来,其实我们作为一线教师一开始都比较茫然。要谢谢学校的果断决策,并迅速组织了各类支持小组,经过多次测试拟出了应对各种情形的方案,给了我们充分的培训,我们才能从容按时地开课。也特别谢谢系里和中心的全力而温暖的支持,无论是设备还是经验上都给我们提供了很多便利,我也经常在教学交流群中得到其他老师们的帮助。这些后盾让我有了应对可能的突发情况的底气。所以这份肯定应该属于我们整个集体,而我会带着这份鼓励继续前行。这学期又有了新的挑战,开启了融合课堂,相信我们一起努力,也可以顺利把课上好!

——邓婉璐

“Education is not the filling of a pail, but the lighting of a fire.”据说这是著名诗人William Butler Yeats的名言,它深深地影响了我。我热爱教学,每当学生反馈学有所得总令我无比欣慰。我也用心呵护学生,非常荣幸可以为他们的专业学习提供帮助,陪伴他们走过一小程人生。得这个奖实属侥幸,感谢信任我的各位同事、学生,感谢关心我的统计学研究中心和工业工程系的各位领导。借用前辈Howell Tong先生给我的留言,”In life, one needs first performance and then luck.” 与诸君共勉吧。当我们坚定信念、努力修炼,幸福总会来敲门。

——周在莹

#post-12183
ntry-header

自2020年3月开始,新冠肺炎国际疫情形势日益严峻,海外输入性风险给我国的疫情防控带来巨大挑战。海关总署卫生检疫司及时组织以清华大学统计学研究中心邓柯副教授和中国检验检疫科学研究院杨宇研究员为首的多学科专家团队,成立“境外新冠肺炎疫情流行趋势研判分析专家组”,为口岸实施针对性防控措施提供支持。

邓柯教授带领清华大学统计咨询中心团队,联合中国检科院杨宇研究员团队,在清华大学科技抗疫攻关“流行病学传播预测与对策突击队”宫鹏教授、徐冰教授团队的大力支持下,开展跨部门、多学科、多领域的风险研判分析工作。研究团队实时采集整理了世界各国新冠疫情发展、传播、防控方面的大量数据;综合运用多种统计学和流行病学方法建立新冠肺炎国际疫情风险评估和趋势预测模型,及时对全球各国的新冠疫情风险、未来发展趋势和对我国影响进行系统分析;定期撰写《境外新冠肺炎疫情流行趋势研究报告》30余期。

海关总署卫生检疫司于2020年8月11日为研究团队出具了《成果应用证明》,指出相关工作为监管部门及时掌握全球疫情动态和发展趋势,有针对性地指导全国口岸做好疫情防控工作,提供了关键技术支持;为实现科学精准的疫情防控做出了重要贡献。

清华大学统计学团队深受鼓舞,将以更加饱满的工作热情和更加严谨的科学态度,积极参与到关系国计民生的重大课题研究,运用数据科学技术保障人民健康。

成果应用证明及研究报告

#post-12173
ntry-header

近日,由我中心执行主任、长聘副教授邓柯领衔清华大学统计咨询中心团队承担的研究项目——“市场销售食品安全评价性抽检方法研究与应用”通过国家市场监督管理总局结题验收。该项目受国家市场监督管理总局委托,力求以我国食品安全抽检数据为基础,研发制定适合我国监管需求的食品安全状况评价模型、抽样方法以及相应的实施和应用细则。项目成果获国家市场监督管理总局高度评价,成功应用到2020年度的国家食品安全评价性抽检工作当中。

项目研讨会 市场监督管理总局段永升司长出席并参与讨论

2017年起,邓柯教授团队就与国家市场监督管理总局展开深入合作,围绕食品安全问题开展一系列课题研究。

2019年6月项目组成员随同市场监督管理总局工作组赴地方调研

项目组在充分调研国内外已有研究成果的基础上,充分考虑到我国食品安全现状、监管模式以及监管部门对“评价性抽验”的业务需求,以年度评价性抽检历史数据为基础,综合利用多种数据资源,运用稀疏数据分析的统计学理论和方法,研发了适合我国国情的食品安全状况评价模型,建立了可支持多维度、多视角研判的食品安全综合评价指标体系。以该模型为基础,项目组还运用抽样调查的统计学理论和方法,在项目协作单位中国肉类食品综合研究中心臧明伍研究员带领的团队支持下,制定了在全国范围内实施评价性抽检的抽样计划和实施方案细则,在检测资源有限的条件下最大程度保证抽样的科学性、代表性和可操作性。相关研究成果获得国家市场监督管理总局高度认可,已在全国范围内的食品安全监管工作中推广应用。

#post-12172
ntry-header

2020年8月,国际知名统计学杂志 Statistica Sinica 产生新一届编委,我中心执行主任、长聘副教授邓柯受邀担任杂志副主编(Associate Editor),任期三年。

Statistica Sinica 创办于1991年,是“泛华统计学会”(International Chinese Statistical Association)的会刊。创办近30年来,发表了大量国际统计学届的重要研究成果,是具有广泛国际影响力的综合性统计学理论期刊。

Statistica Sinica 官网链接:

http://www3.stat.sinica.edu.tw/statistica/

#post-12170
ntry-header

日前,我中心杨立坚教授当选国际工程技术协会杰出会士,以表彰他突出的学术能力和学术贡献。杨立坚教授是清华大学统计学研究中心资深聘教授,美国统计协会会士、国际数理统计学会会士、国际统计学会会员。研究方向为时间序列,函数型及高维数据的统计推断,以及统计学对经济学、金融学、农学、食品科学、地理学和遗传学的应用。

国际工程技术协会是非营利性国际组织,旨在促进国际范围内科学、工程和技术的创新与发展。除传统的科学、工程和技术学科以外,国际工程技术协会还涵盖了金融工程、金融计量经济学、金融统计、数学、统计学、社会科学和商学学科。此外,国际工程技术协会也致力于多学科的协同发展,推动世界科学和工程技术的进步。目前,国际工程技术协会的成员包括来自科学,工程技术和相关领域的5000多名工程师、博士和教授,并有超过100位世界范围内知名学者和专家被选为会士及杰出会士,包括诺贝尔奖、图灵奖、菲尔兹奖、沃尔夫奖、约翰·贝茨·克拉克奖章等获得者。

杨立坚,因对工程与技术做出的出色、严谨、有深刻洞察力和富于创新性的贡献,以及为了促进协会的目标的无私奉献,经国际工程技术协会全体会员授权,今日当选为国际工程技术协会杰出会士。

国际工程技术协会联席主席:

Ramesh K. Agarwal, Michael E.Auer, James C. Crabbe

2020年4月21日”

原文链接:

http://www.ieti.net/news/detail.aspx?id=240

#post-12162
ntry-header

2020年3月1日,我中心2017级博士生张园园为第一作者,清华大学机械工程系季林红教授为通讯作者的论文“Prediction of working memory ability based on EEG by functional data analysis”正式发表在神经科学SCI期刊 Journal of Neuroscience Methods第333卷(https://doi.org/10.1016/j.jneumeth.2019.108552, 333)。该文首次建立了以脑电信号预测工作记忆能力的多重函数型线性模型。由于使用样条函数,该模型直观易懂,计算快捷简便,理论性质可靠,基于随机抽取的122名大学生志愿者训练集,以闭眼静息态下,8个脑前区导联的脑电信号,对20名志愿者测试集进行工作记忆能力的预测,其确定系数R2在多次随机试验下的中位数为68%,最低值大于50%,最高值72%。

由张园园与我中心2018级博士生黄昆组成的杨立坚团队,从2018年12月开始分析季林红团队的大学生志愿者脑电与认知能力数据,到最终完成论文,始终坚持“面向应用,背靠理论,写好算法”的统计学思想。他们依托近10年来团队在函数型数据方向的研究成果,与机械工程系吴芳芳教授和硕士生王健凯组成的季林红团队高效合作,把样条回归估计脑电信号(EEG)的光滑轨迹,张量样条回归估计协方差函数,样条估计函数型主成分(FPCs)与得分(FPC scores)等深刻的统计学前沿理论,结合LASSO回归,转化为快速准确分析脑电数据的算法,用6个月时间很好地解决了工作记忆能力预测的问题,完成了这篇跨学科应用论文。自2019年12月该文线上发表,作者已多次收到Neurology Congress 2020等神经科学领域国际会议的邀请。

2020年2月4日,张园园作为第一作者完成的另一学术论文“Two-step estimation for time varying ARCH models”在线发表于统计学SCI期刊Journal of Time Series Analysishttps://doi.org/10.1111/jtsa.12522 )。这篇与托雷多大学终身教授刘嵘,邵琴合作的19页重磅论文+27页在线补充材料,从理论上严格证明了对于带有时间缓变尺度的非平稳ARCH时间序列,用去除样条函数估计的尺度趋势之后的ARCH残差序列,计算ARCH系数的最小二乘估计LSE与直接用观测不到的平稳ARCH序列计算有相同的渐近正态分布。另一方面,以残差序列计算的极大似然估计MLE的渐近正态分布则不同于以观测不到的平稳ARCH序列计算的MLE。该文提出的方法被用于估计标准普尔(S&P)500从1950到2018年每日回报率的时间缓变尺度以及隐藏的ARCH参数,清楚地揭示了金融波动率水平随时间的长期缓慢增长,特别是2008年全球金融危机前后波动率尺度的大幅增长。该文在2019年7月荣获国际泛华统计协会(International Chinese Statistical Association)颁发的中国会议青年研究者奖(ICSA China Conference Junior Researcher Award),是4位获奖者中唯一的学生,也是唯一不是来自美国高校的获奖者。

张园园同学谦虚刻苦,潜心研究,在攻读博士学位两年半期间,在函数型数据与时间序列方向各发表了1篇重要论文,入选工业工程系“未来教授培养计划”。关于非参数回归相关系数曲线同时置信带的硕士学位论文,于2018年发表在统计学期刊TEST,同年获得北大-清华统计论坛优秀海报奖。目前张园园在美国爱荷华州立大学王丽教授指导下系统学习二元样条回归理论,并研究高频金融数据分布等新课题。

#post-12161
ntry-header

为了响应国家教学改革号召、应对大数据时代需求,推动全国高校统计学科教学事业的发展,清华大学统计学研究中心于2019年11月30日发起并召开2019统计学教学改革研讨会。会议旨在优化统计学相关课程教学体系,并为统计学科教学工作者搭建沟通与交流的平台。来自北京大学、中国人民大学、中国科学院、中央财经大学、西南财经大学、东北师范大学、山东师范大学、北京工业大学、北京林业大学、北京师范大学、首都师范大学、上海纽约大学等全国13家高校近40名学者出席了本次研讨会。与会专家学者们充分肯定了本次研讨会召开的必要性,并积极建言,希望通过此次研讨会能切实地推动全国高校统计学的教学改革工作。

 

清华大学统计学研究中心讲师邓婉璐博士、侯琳副教授

清华大学统计学研究中心讲师邓婉璐博士作为本次会议的组织者及主持人,简要介绍了此次会议举办的背景、中心的教学概况、本次会议的主要议题及预期会议目标。随后,清华大学统计学研究中心副教授、本科生统计学辅修教学工作负责人侯琳博士代表清华大学统计学研究中心致欢迎辞。美国国家医学院院士、哈佛大学生物统计系林希虹教授亦通过视频发表致辞。林教授在致辞中说,这个会议办得非常及时,随着数据科学变得越来越重要,在全世界范围内吸引了越来越多的学生,这对统计和数据科学的人才培养和教学带来非常好的机遇和不小的挑战。例如如何使现代统计方法更有效、更有影响力地解决科学问题;现代统计的核心知识技能是什么;如何改进课程体系以满足时代需求,应当添加哪些课程,例如大数据计算等;充分利用MOOC等教学资源帮助国内统计教学。最后林老师祝愿本次会议圆满成功。

与会专家发言

随后,来自全国多所高校的12名教学骨干分别就“教学理念、教学体系探讨”和“教学方式、教学经验分享”两个主题发言,并开展深入讨论。中国人民大学吕晓玲老师首先分享了对传统统计学中核心课程《数理统计》的反思与改革探索,引发广泛共鸣和热烈讨论;北京大学的张志华老师则从宏观角度、大数据时代发展的大格局上指出统计学中引入《机器学习》相关课程的必要性。西南财经大学的周凡吟老师和李可老师从人才需求角度出发,分享了对课程体系的思考和新兴教学方式MOOC的实践经验;山东师范大学的赵强老师根据多年学科建设经验阐述了“省属院校统计学专业建设发展过程中遇到的困难与思考。” 东北师范大学的蔺杉老师基于“以学生为中心、以需求为导向”的指导思想,分享了通识课和专业课等课程建设经验及教学经验,探讨了如何在理科课程中实现立德树人的价值塑造。中国人民大学黄丹阳老师、周静老师指出传统教学应对实际数据分析的欠缺,分别依托《线性回归分析》、《统计软件应用》等课程生动展示了案例教学的成功教学经验。

与会专家发言

中央财经大学的潘蕊老师分享了成功的翻转课堂、结合视频与讨论的新式教学法,并指出不仅要纵向培养好统计本专业学生,更要横向培养其他专业学生对统计学的兴趣,以此推动统计学科的蓬勃发展;北京工业大学的赵旭老师则以国家级精品课程和青教赛具体课件为例,分享如何抓住学生的兴趣点的经验技巧。针对统计学科的交叉功能,中科院的李欣海老师从生态学领域对统计方法的需求出发,分享其在教学当中的经验与遇到的问题,并同各位老师深入探讨;北京大学的张云俊老师则分享了其教授医学领域学生统计相关课程时,培养学生的统计学思维模式独特方法,指出应更重视思想而非技术细节。

最后,与会的专家学者针对现场提出的问题在教学理念加强应用导向、教学体系中增设机器学习课程、吸收新教学方式提高教学效果等方面达成共识,也留有部分问题有待进一步思考。有学者表示,此次会议是其开展统计教学工作多年来首次参与的统计学科内部专注教学的研讨会,具有特殊意义。与会者一致认为应该以此为契机,将之办成系列会议。会议探讨的内容切合实际,意义深远,统计学教学的改革工作任重道远,正是需要一线的教学工作者结合自身经验,不断的交流与思考,才能推送国内统计学教育稳步前进,共促我国统计学科的发展与进步。

#post-12142
ntry-header

2019年11月20日,清华大学统计学研究中心俞声副教授与哈佛大学Yichi Zhang、美国布莱根妇女医院Tianrun Cai作为共同第一作者的论文“High-throughput Phenotyping with Electronic Medical Record Data Using a Common Semi-supervised Approach (PheCAP)”于Nature Protocols平台在线发表。哈佛大学Tianxi Cai教授与布莱根妇女医院Katherine Liao博士是论文的共同通讯作者。[1]

基于电子病历的表型提取(EMR-based phenotyping)是利用电子病历促进生物医学研究的一项重要应用,可以大幅提高研究队列的建立速度、降低研究成本、扩大样本数量。目前,行业内仍然广泛使用基于ICD疾病诊断编码等的初级方法,对患者诊断判断的准确性相对较低。俞声副教授与Tianxi Cai教授自2015年起提出一系列统计方法,在尽可能控制人力成本的前提下,有效提升了表型提取的速度和准确性。

Nature Protocols期刊主要面向经过多年实践验证的、可形成标准的生物医学实验方法。本次发表的方法基于俞声、Tianxi Cai等较早提出的半监督表型提取技术[2]。目前,俞声、Tianxi Cai已开发出并发表多项无监督高通量表型提取技术[3,4]。这些技术已在美国多项精准医学研究项目中使用,未来亦有望成为基于电子病历的医学研究的标准实验方法。

参考文献

1     Zhang Y, Cai T, Yu S, et al. High-throughput phenotyping with electronic medical record data using a common semi-supervised approach (PheCAP). Nat Protoc 2019;:1–19. doi:10.1038/s41596-019-0227-6

2     Yu S, Chakrabortty A, Liao KP, et al. Surrogate-assisted feature extraction for high-throughput phenotyping. J Am Med Inform Assoc 2017;24:e143–9. doi:10.1093/jamia/ocw135

3     Yu S, Ma Y, Gronsbell J, et al. Enabling phenotypic big data with PheNorm. J Am Med Inform Assoc 2018;25:54–60. doi:10.1093/jamia/ocx111

4     Liao KP, Sun J, Cai TA, et al. High-throughput multimodal automated phenotyping (MAP) with application to PheWAS. J Am Med Inform Assoc 2019;26:1255–62. doi:10.1093/jamia/ocz066

#post-12131
ntry-header

近日,杨振宁先生受我中心杰出访问教授汤家豪院士之邀访问清华大学统计学研究中心。

统计学研究中心师生热烈欢迎杨先生到访 侯禹珊 摄

杨振宁先生的到访受到统计学研究中心师生的热烈欢迎。同学们都很珍惜这个同“国宝级科学家”见面交流的机会,并称呼此次活动为“硬核追星”。

 

邓柯副教授(左)向杨振宁先生介绍中心情况 侯禹珊 摄
杨振宁先生浏览中心年报 侯禹珊 摄
杨振宁先生于统计学研究中心 侯禹珊 摄

杨先生首先在中心副主任邓柯副教授的介绍下,参观统计学研究中心,对清华大学统计学科的建设以及人才培养等情况进行了了解。提及与统计学科的渊源,杨先生说,当时他在西南联大读书时,统计学课程的教师是著名的数学家、统计学家许宝騄先生。提及当年的种种趣事,杨先生仍记忆犹新,把他记忆中许先生的往事同当今的统计学者分享。

杨振宁先生同中心学生座谈 侯禹珊 摄

与中心博士研究生的座谈环节原本计划半小时,但最后活动持续了近一个半小时。杨先生精神矍铄、思路清晰、声音洪亮,无不令在场学生印象深刻,现场完全感受不到这是一个97岁高龄的老人。杨先生跟中心博士研究生分享,如果当下对于学术方向的选择感到焦虑是很正常的,因为大多数学者在此时期都有相同感受。做学术研究还是要从自身的兴趣点出发,作为统计这一大学科方向,下设的如数理统计、文本分析、金融统计、生物医学统计等不同的学科分支,要选择自己最感兴趣的方向深入思考,才能挖掘出新的问题,新的发现。

汤家豪教授提及他近日为中心学生们开设的英文论文写作指导短期课程,指出英文学术论文的撰写也是当下学生们普遍遇到的难题。杨先生随即分享了他年轻时提高英文水平的办法——阅读。并推荐了用不查生词的方法阅读海明威等作家的原版小说,是当时他亲测有效的提升英语水平的方法。

同学们纷纷表示,与杨先生这一世界顶尖的科学家现场座谈的经历令他们印象深刻,深受鼓舞和触动。

杨振宁先生与中心师生合影 侯禹珊 摄
#post-12105
ntry-header

近日,美国国家科学院院士、美国艺术与科学学院院士及爱尔兰皇家科学院院士,美国华盛顿大学统计和社会学教授阿德里·拉夫里(Adrian E.Raftery)院士访问清华大学统计学研究中心。

阿德里·拉夫里教授出席“汤家豪院士杰出访问教授聘任仪式”并致辞 陶宇心 摄

拉夫里教授受邀出席10月14日在紫光国际会议中心举办的“汤家豪院士清华大学杰出访问教授聘任仪式”,并在仪式上对汤家豪教授的受聘表示热烈的祝贺,对清华大学统计学研究中心——这支年轻又充满活力的团队表示高度的肯定。

拉夫里教授和中心副主任邓柯副教授座谈 田芸 摄

随后,拉夫里教授到访清华大学统计学研究中心,同中心教员代表亲切座谈,从学科建设、人才培养、学术研究等多方面了解中心情况。

拉夫里教授与中心学生代表座谈 侯禹珊 摄
中心的博士研究生亦借此机会同拉夫里教授座谈,分别结合自身的时间序列、深度学习、医药统计、知识图谱等统计学科研方向和科研进展中遇到的实际问题,同拉夫里教授进行交流,拉夫里教授认真听取汇报,并给出指导与建议。

 

#post-12104