【学术活动】阿肯色州立大学数学系张庆洋助理教授访问我中心并作学术报告

ntry-header

2019年12月23日，阿肯色州立大学数学系张庆洋助理教授访问我中心并作学术报告，报告题目为Direct Estimation of Differential Networks Under High-Dimensional Nonparanormal Graphical Models

#post-12152

ntry-header

2019年12月16日下午，中国历代人物传记资料库 (CBDB)北京小组第二次工作研讨会在清华大学成功举办。

CBDB两位执行委员会委员哈佛大学东亚语言文明系包弼德教授和巴克内尔大学东亚研究系陈松副教授，哈佛大学统计系刘军教授，清华大学统计学研究中心邓柯副教授，CBDB高级项目经理王宏甦先生共同出席研讨会。

来自CBDB清华小组、北大小组的研究生们汇报了半年来的工作进程以及研究进展。工作围绕数字人文主题和CBDB数据库，结合人文和统计学知识，对自然语言处理、专名标准化、诗歌平仄分析等研究问题展开深入讨论。

#post-12149

ntry-header

2019年12月16日，约翰霍普金斯大学计宏凯教授访问我中心，并做特邀报告，报告的题目是Global Prediction of Gene Regulatory Landscape Using Bulk and Single-cell Rna-seq。

#post-12148

ntry-header

2019年12月12日，新加坡国立大学统计与应用概率系助理教授赵安琪博士访问我中心，并做学术报告，报告题目为 Randomization Based Causal Inference from Split-plot Designs.

#post-12147

ntry-header

2019年12月9日，清华大学统计学论坛成功举办，本次论坛邀请到中国医学科学院医学信息研究所医学信息创新研究中心主任李姣博士，报告由统计学研究中心副教授俞声博士主持，报告题目为Understanding Biomedical Knowledge: from Literature, Clinical Guidelines to EHRs。

#post-12144

ntry-header

为了响应国家教学改革号召、应对大数据时代需求，推动全国高校统计学科教学事业的发展，清华大学统计学研究中心于2019年11月30日发起并召开2019统计学教学改革研讨会。会议旨在优化统计学相关课程教学体系，并为统计学科教学工作者搭建沟通与交流的平台。来自北京大学、中国人民大学、中国科学院、中央财经大学、西南财经大学、东北师范大学、山东师范大学、北京工业大学、北京林业大学、北京师范大学、首都师范大学、上海纽约大学等全国13家高校近40名学者出席了本次研讨会。与会专家学者们充分肯定了本次研讨会召开的必要性，并积极建言，希望通过此次研讨会能切实地推动全国高校统计学的教学改革工作。

清华大学统计学研究中心讲师邓婉璐博士作为本次会议的组织者及主持人，简要介绍了此次会议举办的背景、中心的教学概况、本次会议的主要议题及预期会议目标。随后，清华大学统计学研究中心副教授、本科生统计学辅修教学工作负责人侯琳博士代表清华大学统计学研究中心致欢迎辞。美国国家医学院院士、哈佛大学生物统计系林希虹教授亦通过视频发表致辞。林教授在致辞中说，这个会议办得非常及时，随着数据科学变得越来越重要，在全世界范围内吸引了越来越多的学生，这对统计和数据科学的人才培养和教学带来非常好的机遇和不小的挑战。例如如何使现代统计方法更有效、更有影响力地解决科学问题；现代统计的核心知识技能是什么；如何改进课程体系以满足时代需求，应当添加哪些课程，例如大数据计算等；充分利用MOOC等教学资源帮助国内统计教学。最后林老师祝愿本次会议圆满成功。

随后，来自全国多所高校的12名教学骨干分别就“教学理念、教学体系探讨”和“教学方式、教学经验分享”两个主题发言，并开展深入讨论。中国人民大学吕晓玲老师首先分享了对传统统计学中核心课程《数理统计》的反思与改革探索，引发广泛共鸣和热烈讨论；北京大学的张志华老师则从宏观角度、大数据时代发展的大格局上指出统计学中引入《机器学习》相关课程的必要性。西南财经大学的周凡吟老师和李可老师从人才需求角度出发，分享了对课程体系的思考和新兴教学方式MOOC的实践经验；山东师范大学的赵强老师根据多年学科建设经验阐述了“省属院校统计学专业建设发展过程中遇到的困难与思考。” 东北师范大学的蔺杉老师基于“以学生为中心、以需求为导向”的指导思想，分享了通识课和专业课等课程建设经验及教学经验，探讨了如何在理科课程中实现立德树人的价值塑造。中国人民大学黄丹阳老师、周静老师指出传统教学应对实际数据分析的欠缺，分别依托《线性回归分析》、《统计软件应用》等课程生动展示了案例教学的成功教学经验。

中央财经大学的潘蕊老师分享了成功的翻转课堂、结合视频与讨论的新式教学法，并指出不仅要纵向培养好统计本专业学生，更要横向培养其他专业学生对统计学的兴趣，以此推动统计学科的蓬勃发展；北京工业大学的赵旭老师则以国家级精品课程和青教赛具体课件为例，分享如何抓住学生的兴趣点的经验技巧。针对统计学科的交叉功能，中科院的李欣海老师从生态学领域对统计方法的需求出发，分享其在教学当中的经验与遇到的问题，并同各位老师深入探讨；北京大学的张云俊老师则分享了其教授医学领域学生统计相关课程时，培养学生的统计学思维模式独特方法，指出应更重视思想而非技术细节。

最后，与会的专家学者针对现场提出的问题在教学理念加强应用导向、教学体系中增设机器学习课程、吸收新教学方式提高教学效果等方面达成共识，也留有部分问题有待进一步思考。有学者表示，此次会议是其开展统计教学工作多年来首次参与的统计学科内部专注教学的研讨会，具有特殊意义。与会者一致认为应该以此为契机，将之办成系列会议。会议探讨的内容切合实际，意义深远，统计学教学的改革工作任重道远，正是需要一线的教学工作者结合自身经验，不断的交流与思考，才能推送国内统计学教育稳步前进，共促我国统计学科的发展与进步。

#post-12142

ntry-header

2019年11月29日，由清华大学统计学研究中心发起并组织的“2019年清华大学统计学博士生论坛”在北京国际会议中心成功举办。统计学博士生论坛是清华大学统计学研究中心的传统活动，其设立的目标是为青年统计学者提供了一个学术交流的平台，以提高统计学者的专业知识及专业素养。来自清华大学统计学研究中心的逾30名在读博士生参与了此次论坛，博士学者们根据个人的研究方向，分享了他们的研究成果以及在研究过程中遇到的问题。在场学者们积极发言，分享观点，讨论热烈。

徐嘉泽
TopWORDS2: Meta Pattern Discovery and NER

林毓聪
Longdistance Entity Relation extraction with Article Structure Embedding and Graphinformation

郭瀚民
Detecting Local Genetic Correlations with Scan Statistics

李杰
Statistical Inference for the Stationary Mean of Functional Moving Average

刘朝阳
Alternative Re-randomization Criteria in Causal Inference

袁正
Unsupervised Chinese Medical Terms Extraction

钟晨
Location and Scale Invariant Simultaneous Confidence Band for Comparing Variance Function in Nonparametric Regression

朱珂
Confidence Intervals for Sparse High- dimensional Vector Auto-regression

潘长在
The Extensions of Profile Hidden Markov Model in Chinese Text Mining

黄昆
Simultaneous Confidence Band for the Mean of Functional Data Contaminated with Infinite Moving Average Errors

宋泽宁
Oracally Efficient Estimation for ARMA Time Series with Trend

杨萱铃
Double Absolute AR Model: An Alternative to GARCH-in-Mean

罗赛迪
Canwe Observe Larger Structural Dimension in Sliced Inverse Regression?

余博
Detectionof Shared Genetic Architecture Between Complex Diseases While Preserving Dependency Structure

罗声旋
Bilingual Sentence Pairs Generation with Aligned Documents

按照博士生培养方案，中心二年级及以上的博士生每年都要汇报自己的研究进展。作为统计学研究中心的品牌系列活动之一，清华大学统计学博士生论坛给在读博士们提供了一个展示自己科研成果和学术沟通的平台，为师生搭建了交流分享的桥梁。大家在论坛上积极提问，切磋技艺，相互交流，受益匪浅。

#post-12141

ntry-header

2019年12月2日，京东健康集团首席科学家吴元清博士率团队访问我中心，并做数据科学论坛报告，报告的题目是ABC（A I+ Big data + Cloud）健康。

#post-12139

ntry-header

2019年11月20日，清华大学统计学研究中心俞声副教授与哈佛大学Yichi Zhang、美国布莱根妇女医院Tianrun Cai作为共同第一作者的论文“High-throughput Phenotyping with Electronic Medical Record Data Using a Common Semi-supervised Approach (PheCAP)”于Nature Protocols平台在线发表。哈佛大学Tianxi Cai教授与布莱根妇女医院Katherine Liao博士是论文的共同通讯作者。[1]

基于电子病历的表型提取（EMR-based phenotyping）是利用电子病历促进生物医学研究的一项重要应用，可以大幅提高研究队列的建立速度、降低研究成本、扩大样本数量。目前，行业内仍然广泛使用基于ICD疾病诊断编码等的初级方法，对患者诊断判断的准确性相对较低。俞声副教授与Tianxi Cai教授自2015年起提出一系列统计方法，在尽可能控制人力成本的前提下，有效提升了表型提取的速度和准确性。

Nature Protocols期刊主要面向经过多年实践验证的、可形成标准的生物医学实验方法。本次发表的方法基于俞声、Tianxi Cai等较早提出的半监督表型提取技术[2]。目前，俞声、Tianxi Cai已开发出并发表多项无监督高通量表型提取技术[3,4]。这些技术已在美国多项精准医学研究项目中使用，未来亦有望成为基于电子病历的医学研究的标准实验方法。

参考文献

1 Zhang Y, Cai T, Yu S, et al. High-throughput phenotyping with electronic medical record data using a common semi-supervised approach (PheCAP). Nat Protoc 2019;:1–19. doi:10.1038/s41596-019-0227-6

2 Yu S, Chakrabortty A, Liao KP, et al. Surrogate-assisted feature extraction for high-throughput phenotyping. J Am Med Inform Assoc 2017;24:e143–9. doi:10.1093/jamia/ocw135

3 Yu S, Ma Y, Gronsbell J, et al. Enabling phenotypic big data with PheNorm. J Am Med Inform Assoc 2018;25:54–60. doi:10.1093/jamia/ocx111

4 Liao KP, Sun J, Cai TA, et al. High-throughput multimodal automated phenotyping (MAP) with application to PheWAS. J Am Med Inform Assoc 2019;26:1255–62. doi:10.1093/jamia/ocz066

#post-12131

ntry-header

2019年11月27日，清华大学统计学论坛在伟清楼209成功举办。本次报告邀请了上海罗氏制药医学部的吴婷博士。报告由清华大学统计学研究中心助理教授吴未迟博士主持。报告的题目是“真实世界研究在药品管理周期的应用和价值”。

#post-12138