【学术活动】埃默里大学张菁菲副教授学术报告

ntry-header

2023年3月27日，埃默里大学张菁菲副教授“云”访问我中心，与中心教员交流，并做学术报告，报告的题目是Network Community Detection: New Algorithms and Goodness-of-fit Tests。

#post-12405

ntry-header

2023年3月20日，香港中文大学（深圳）数据科学学院姚建峰教授、于天维教授、刘瑾副教授、宋方达助理教授到访清华大学统计学研究中心，并出席“清华大学统计学研究中心-香港中文大学(深圳)数据科学学院交流研讨会暨统计学前沿研讨会”，会议由中心李东副教授发起并主持。双方研究团队在会上交流各自研究方向、分享最新研究成果，并针对未来可能合作的方向展开讨论。

首先，来自香港中文大学（深圳）数据科学学院的于天维教授、刘瑾副教授和宋方达助理教授发言，分别围绕生物信息学、空间转录组、统计基因组学等研究方向介绍各自科研进展。

随后，清华大学统计学研究中心李东副教授、侯琳副教授、俞声副教授、刘汉中副教授、杨朋昆助理教授发言，介绍最新研究动态及科研成果。

会后，香港中文大学（深圳）数据科学学院姚建峰教授为清华统计中心师生做特邀报告，报告的题目是：Weight Matrices Spectra in Deep Learning and Early-stopping。统计中心四十余师生聆听报告，针对报告提及的研究问题与姚建峰教授现场互动，姚教授耐心解答。

#post-12403

ntry-header

3 月 25 日，清华大学统计学研究中心携手清华大学交叉信息研究院、微软亚洲研究院联合组织机器学习理论与基础模型研讨会。来自国内外机器学习领域的学术界、工业界一线学者将在研讨会上分享他们的最新研究。我们诚挚地邀请您参会，一起探讨、交流学术动态并展望未来！

本次研讨会旨在以理论视角分析深度学习中的关键组成部分，议程将涵盖深度学习最新理论与优化算法，基础模型的理解与实践进展。

我们希望将关注该问题的不同领域的研究人员和从业者聚集在一起，以交流最新的研究思想和成果，探讨未来机器学习理论研究的方向。我们相信通过本次研讨会，参会者将可以与其他同行、专家和学者进行深入交流和合作，为机器学习理论的发展注入新的动力和活力。

活动信息

活动时间

3 月 25 日（星期六）

8:30 —16:40

参会信息

线下：北京市海淀区丹棱街5号微软大厦

线上：Microsoft Teams

报名成功后将收到具体参会信息

注册报名

扫描二维码注册报名

报名截止时间：3 月 17 日

扫码进群

欢迎扫码加入活动专属讨论群

演讲嘉宾

日程安排

8:30 – 8:40

Introduction of the Workshop

Session 1

8:40 – 9:05

Faster Neural Network Training, Algorithmically

Jonathan Frankle

9:05 – 9:30

Bayesian Interpolation with Deep Linear Networks

Boris Hanin

9:30 – 9:55

Variational Principles for Mirror Descent and Mirror Langevin Dynamics

Maxim Raginsky

9:55 – 10:20

How Does Sharpness-Aware Minimization Minimize Sharpness?

Zhiyuan Li

10:20 – 10:35

Coffee break

Session 2

10:35 – 11:00

Analysis of a Toy Case for Emergence

Sebstien Bubeck

11:00 – 11:25

Beyond Neural Scaling Laws: Towards Data Efficient Deep Learning

Surya Ganguli

11:25 – 11:50

Why Can GPT Learn In-Context?

Language Models Implicitly Perform Gradient Descent as Meta-Optimizers

Li Dong

11:50 – 12:15

Flow Straight and Fast: A Simple and Unified Approach

to Generative Modeling, Domain Transfer, and Optimal Transport

Qiang Liu

12:15 – 13:30

Lunch Time

Session 3

13:30 – 13:55

Condensation in Deep Learning

Zhiqin Xu

13:55 – 14:20

Adapting to Distribution Shifts: Recent Advances in Importance Weighting Methods

Masashi Sugiyama

14:20 – 14:45

Which Graph Neural Network can Provably Solve Practical Problems?

Di He

14:45 – 15:10

Contrastive Learning Is Spectral Clustering On Similarity Graph

Yang Yuan

15:10 – 15:25

Coffee Break

Session 4

15:25 – 15:50

On the Theoretical Understanding of Mixup

Kenji Kawaguchi

15:55 – 16:15

Benign Overfitting in Two-layer Convolutional Neural Networks

Yuan Cao

16:15 – 16:40

Environment Invariant Linear Least Squares

Cong Fang

主办单位

清华大学交叉信息研究院

https://iiis.tsinghua.edu.cn/

微软亚洲研究院理论中心

MSR Asia Theory Center

清华大学统计学研究中心

#post-12402

ntry-header

2023年3月13日，中国科学院数学与系统科学研究院张新雨研究员访问我中心，与中心教员座谈，并做特邀报告，报告的题目是Optimal Weighted Random Forests。

#post-12401

ntry-header

2023年2月，清华大学统计学研究中心侯琳副教授课题组在Nature Communications上发表了题为Quantifying portable genetic effects and improving cross-ancestry genetic prediction with GWAS summary statistics的研究论文^[1]，课题组2022届郭瀚民博士为该文的共同第一作者，侯琳副教授和威斯康辛大学麦迪逊分校吕琼石助理教授为该论文的共同通讯作者，威斯康辛大学麦迪逊分校的缪嘉诚为共同第一作者，宋格非、赵梓杰为本文的共同作者。

多基因风险评分是基于全基因组关联分析实验的复杂疾病遗传风险预测算法，对疾病的精准预防和治疗有重要应用价值。现有方法主要基于欧洲人群的全基因组关联分析研究，相应模型在欧洲人群中有较好的预测效果，但在其他人群中预测效果欠佳。研究团队针对跨种族遗传风险预测问题开展研究,首先发展了挖掘种族间局部遗传相关性的统计方法，进一步提出基于相关性区域注释的贝叶斯多基因风险评分方法，实现跨种族疾病遗传信息迁移；经模拟数据和实际数据验证，该方法可以显著提高疾病风险预测的准确性。此外，研究团队还开发了实现上述算法的软件包X-Wing^[2]，将该方法应用于英国、日本等生物样本库（UK Biobank, Biobank Japan）。测试结果显示，该方法可以显著提高样本中的非欧人群遗传风险预测准确性，对改善种族间遗传资源不平衡的现状具有重要意义。

#post-12398

ntry-header

2023年3月7日，武汉大学焦雨领副教授访问我中心，与中心教员座谈，并做学术报告，报告的题目深度学习的理论探究：逼近、估计、优化与表示。

#post-12397

ntry-header

近日，清华大学统计学研究中心邓柯副教授与清华大学地球系统科学系的专家团队以及来自欧洲、中国、美国的多个研究团队合作，将国际航空旅行数据与经典的流行病传播模型相结合，对 2020年初新冠疫情的全球传播进行了定量研究。研究论文在国际顶级综合性期刊Proceedings of the National Academy of Sciences (PNAS)在线发表，标题为“How to avoid a local epidemic becoming a global pandemic”。

该论文所建立的量化模型表明：（1）减少国际航空旅行以及在到达一个国家时实行强制入境检疫，在减缓疫情全球传播上具有有效性；（2）相较于采取入境检疫，减少全球航空旅行可以更有效地减少全球疫情传播；（3）减少传播源国家的航空旅行对于阻止疾病向世界各地区传播有着最重要的意义。基于以上研究结果，论文建议开发“数字孪生工具”为未来大规模疫情防控决策提供精准信息。论文讨论了数字孪生模型的设计标准，以及获得必要的国际航空旅行在线数据的可行性。

该论文的一项主要创新为：相较于传统方法，该论文所建立的数字孪生模型，可以根据航空旅行实时数据，及时调整模型参数估计；进而，可以不同防控措施进行快速的效果评估，从而更有效地减缓甚至阻止流行病的全球传播。

论文链接：https://www.pnas.org/doi/epdf/10.1073/pnas.2220080120

#post-12396

ntry-header

2023年2月27日，华东师范大学於州教授访问我中心，与中心教员座谈，并做学术报告，报告的题目是当神经网络遇上随机森林。