ntry-header
图片

7月10日上午,清华大学在主楼接待厅举行统计与数据科学系成立大会。这是清华大学优化学科布局、服务国家战略的重要举措。

清华大学校长、中国科学院院士李路明,国家统计局党组成员、副局长蔺涛,清华大学数学科学中心主任、求真书院院长、中国科学院外籍院士丘成桐,中国数学会理事长、上海科技大学副校长、中国科学院院士席南华,哈佛大学统计系和生物统计系教授、美国国家科学院院士、美国国家医学院院士林希虹,宾夕法尼亚大学沃顿商学院讲席教授、国际数理统计学会主席蔡天文,哈佛大学教授、清华大学统计学研究中心荣誉主任刘军,中国科学院院士陈松蹊出席大会并致辞。清华大学副校长、中国科学院院士姜培学主持大会并宣读统计与数据科学系成立决定。相关领域专家学者、学会代表和学校相关单位负责人等百余人参加成立大会。

图片

与会嘉宾共同揭牌

会上,李路明,蔺涛,姜培学,中国科学院数学与系统科学研究院研究员、中国科学院院士严加安,刘军,琶洲实验室(黄埔)主任、西安交通大学原副校长、中国科学院院士徐宗本,陈松蹊,林希虹共同为统计与数据科学系揭牌。

图片

李路明讲话

李路明向与会来宾表示欢迎,向长期关心支持学校发展的社会各界表示感谢。他说,数据已经成为国家基础性战略资源。在全球科技竞争中,只有下好数据这个“先手棋”,才能占据优势地位、牢牢把握未来发展的主动权。清华大学成立统计与数据科学系,就是为了加强统计学与数据科学基础研究,积极促进学科交叉融合,把发展科技第一生产力、培养人才第一资源、增强创新第一动力更好结合起来,主动服务国家大数据战略实施和数字中国建设。

李路明回顾了学校在统计学与数据科学相关领域的发展历程并表示,当前,新一轮科技革命和产业变革深入发展,人类社会正在加速进入数字文明时代。面对崭新的发展机遇,一流大学作为国家战略科技力量的重要组成部分,理应有所作为,也必须有所作为。希望统计与数据科学系肩负历史使命、抓住历史机遇,落实立德树人根本任务,加强培养模式创新和课程体系建设;坚持目标导向和自由探索相结合,凝练基础研究关键科学问题,开展多学科交叉研究;充分激发创新创造活力,加强关键核心技术协同攻关,更好发挥数据要素作用,支撑发展新质生产力;深化高水平科技开放合作,搭建国际化交流平台,主动融入全球创新网络,切实肩负起构建人类命运共同体的科技创新使命。

图片

蔺涛、丘成桐、席南华、林希虹、蔡天文、刘军、陈松蹊致辞(从左至右,从上至下)

蔺涛向清华大学统计与数据科学系成立表示祝贺,希望以此为契机进一步加强国家统计局和清华大学的合作,打造一流学术研究平台,形成一批具有原创性和影响力的研究成果,共同为以中国式现代化全面推进中华民族伟大复兴作出新的更大贡献。

 

丘成桐回顾了与统计学、数据科学相关领域顶尖学者的交流经历并表示,希望统计与数据科学系与数学中心以及求真书院展开密切的合作,共同推动基础科学领域取得新的更大进步。

 

席南华代表中国数学会祝贺清华大学统计与数据科学系成立并表示,期待未来清华的智力资源在统计与数据科学领域大放异彩,有力促进统计与数据科学的长远发展。

 

林希虹说,清华统计与数据科学系的成立,既能极大促进清华乃至中国统计与数据科学的发展,又能更有效地促进多个科学领域的交叉研究。

 

蔡天文表示,当前统计与数据科学学科的发展尤为重要,一方面能够吸引顶尖专家学者研究统计学与其他科学领域交叉的前沿问题,另一方面也能培养造就大批优秀人才。

 

刘军表示,统计与数据科学系将致力于发展有较大社会影响力的统计思想和方法;发挥清华在工科、商科、医科、生命科学、社会科学等方面的有利条件,深入开展与这些领域的密切合作;发展互联网技术、大数据分析、人工智能等领域中的统计方法;培养一流统计与数据科学人才。

 

陈松蹊表示,统计学是以数据为研究对象的基础学科。未来统计学可以在统计与数据科学基础理论、人工智能和机器学习的统计基础理论、以及其他学科交叉的重点领域发力,实现以数据为其他学科赋能。

图片

活动现场

统计与数据科学发展研讨会同期举行。徐宗本,普林斯顿大学讲席教授、比利时皇家科学院外籍院士范剑青分别以“大模型的极限理论”和“统计数据科学与经济社会”为题作主题报告。

 

清华大学在统计学与数据科学相关领域具有深厚的积累。我国概率统计学科的奠基人许宝騄1930年转入清华大学改学数学,1933年从算学系毕业,他是中国早期从事概率论和数理统计学研究并达到世界先进水平的一位杰出学者。1979年,清华大学重建数学系,并布局概率统计等方向,培养出以林希虹院士为代表的一批杰出统计学家。自2000年来,数学系教授林元烈、杨瑛始终致力于推动统计学科建设,并于2008年促成“统计讲席教授团”的设立,举办统计学讲座、开设统计学课程,极大地促进了统计学科的发展。2011年学校获批统计学一级学科博士学位授权点,2015年统计学研究中心成立仪式举行。清华工业工程系也为统计学发展提供了诸多支持。经过各方数十年地不懈努力,清华大学统计学在学术研究、学科建设、人才培养、社会服务等方面取得了长足进步,在数理统计、生物健康统计、统计机器学习及应用、经济与金融统计、工业统计与运筹学、交叉数据科学等重点应用方向形成了特色优势。

 

未来清华大学统计与数据科学系将紧密围绕国家大数据战略、人工智能行动以及《数字中国建设整体布局规划》,立足“四个面向”的战略导向,针对国家重大需求、重大战略、重要部门,培养国际一流的统计学与数据科学领域综合性、创新型高层次人才,以全球视野对标世界一流,努力将统计与数据科学系建设成为国内外知名的产学研一体化学术重镇。

图片

#post-16534
ntry-header

8月23日下午,清华大学统计与数据科学系2024级研究生开学典礼成功举办。统计系全体教师、2024级新生和部分在校生代表出席典礼,值得一提的是,这也是清华大学统计与数据科学系成立以来的首届开学典礼。

典礼由统计系负责研究生工作的刘汉中老师主持。 刘军老师首先代表统计系对新同学们的到来表示欢迎。刘老师强调,大家在科研路上要自发的学习,学会发掘有意义的问题,并且针对未知的问题要葆有一份钻研精神。希望同学们作为统计与数据科学系成立后的第一届新生能够找到自己的科研兴趣,做出有意义的成果。 随后,邓柯老师介绍统计系概况。邓老师回忆了清华大学统计学科的发展历史和在此过程中一代代清华统计人的不懈努力。今年是建系以来首届研究生入学,邓老师表示,希望同学们树立良好的学风,为未来的清华统计学子做好带头作用。同时,邓老师也对同学们普遍关心的系馆建设进度、学生工位规划方案等细节进行分享。同学们纷纷表示期待。 俞声老师向同学们简要介绍系研究生培养情况。俞老师希望大家能够在未来的日子里始终保持对科研的热情,能够找到自己真正感兴趣的科研方向,和导师进行有效磨合,做有意义的课题而非拘泥于发表顶刊文章。俞老师还强调了大家在博士期间严守纪律的重要性。 三年级博士研究生赵政昀同学代表统计系在校生发言。赵政昀分享:“虽然统计系的同学人数不多,但无论你感兴趣的是滑雪、舞蹈、健身、动漫,你都能找到志同道合的伙伴。而清华园本身也是一个广阔的天地,有兼顾专业性和休闲社交的体育代表队,有涵盖几乎你能想到的所有领域的上百家社团,有丰富的校园内的文娱活动,这些都等待有兴趣的你前去探索”。赵政昀也祝福学弟学妹,在统计系度过充实,最好能偶尔感受到幸福的五年。 研究生新生代表陈诗睿发言。陈诗睿同学强调了作为一名研究生,大家的学习模式会从“学习已知”变为“探索未知”,需要更加具有创造性的思维模式与独立分析问题的能力。希望大家在未来可以永远保持好奇心,保持探索的激情。最后,陈松蹊老师总结发言。陈老师首先以轻松幽默的方式回忆了自己的求学生涯中的一些趣事,这些故事不仅让新生们感受到了学术研究的乐趣,也展示了学术探索过程中的挑战与成长。陈老师还强调了对学术研究热情的重要性。他鼓励新生们要培养和保持这份热情,让它成为自己学术探索的动力。此外,陈老师还特别提到了科研写作能力的培养。科研写作不仅是展示研究成果的手段,更是深化理解和思考问题的过程。良好的写作能力可以帮助研究者更清晰地表达自己的思想,更有效地与同行交流,从而提升研究的影响力。

#post-16652
ntry-header
与会师生合影

2024年6月6日,第八届北大-清华统计论坛成功举办,论坛由北京大学统计科学中心和清华大学统计学研究中心联合发起,本年度由清华大学统计学研究中心承办。除清北两校师生外,还受到了很多兄弟高校和业界的学者关注及参与。本届论坛由清华大学统计学研究中心林乾副教授主持。

陈松蹊院士致辞

中国科学院院士陈松蹊教授受邀致开幕词。陈松蹊提到,北大-清华统计论坛在美国国家科学院院士、加州大学伯克利分校郁彬教授的建议下由两校共同发起,至今已成功举办八届。论坛也见证了两校乃至全国统计学科的发展。陈松蹊回顾了两校统计人对中国统计学作出的诸多努力与贡献。“清北人一直在坚持、坚守、谋求发展,为解决国家重大问题培养数据分析人才,为数据赋能提供新质生产力。”最后,陈院士勉励所有统计人要练好学问、学术、学科的内功,鼓励交叉合作,共同推动统计学的发展。

清华大学杨宇红教授作大会报告

清华大学杨宇红教授作大会报告,杨老师介绍其近期与合作者在协变量偏移(Covariate shift)、自变量与因变量存在回归关系时,构建迁移学习误差界(Error bound)方面的工作。研究团队给出了在各种情况下学习回归关系的最小最大速率(minimax rate),并据此结合具体案例,分析源数据、目标数据大小关系对于两者在迁移学习中协同效应的影响。

北京大学王汉生教授作大会报告

北京大学王汉生教授作大会报告,王老师介绍了团队在分析超高维文本数据以估计法外因素对判刑结果影响方面所做的工作。在该项研究中,研究团队提出混合条件回归(Mixture Conditional Regression)以建模这一问题,将更多自变量纳入考虑,并在实际数据上获得了更好的估计结果,其预测准确度相较传统线性回归模型取得了明显的提升。

海报展示环节
随后是海报展示与评选环节,参会师生针对科研成果展开交流与讨论。经过两校老师从海报质量、工作难度、创新性和科学性四个维度对学生的海报进行严格考核及评分,清华大学白露佳、韩庭萱,北京大学苏武、何沛予荣获“第八届北大-清华统计论坛优秀海报奖”,获奖同学分别做成果汇报展示。此外,清华大学宋爽、北京大学顾嘉荣获“第八届北大-清华统计论坛优秀毕业生奖”。

北京大学姚方教授、清华大学侯琳副教授为“优秀海报奖”获得者颁奖
陈松蹊院士、清华大学杨宇红教授为“优秀毕业生”获得者颁奖
两校教师与本年度毕业生合影留念

 

#post-16421
ntry-header

2024年5月27日,北卡罗来纳大学教堂山分校Danyu Lin教授访问我中心,与中心教员座谈,并作特邀报告,报告的题目是Evaluating the Effectiveness of COVID-19 Vaccines。

Danyu Lin教授
Danyu Lin教授于统计中心
与会师生合影
#post-16350
ntry-header

#post-16270
ntry-header

清华大学统计学研究中心

2024年优秀大学生统计与数据科学交流会

(优秀大学生夏令营)

招生简章

清华大学统计学研究中心将于2024年5月24日至5月26日举办“优秀大学生统计与数据科学交流会暨优秀大学生夏令营”活动。活动旨在为有志于进入统计学和数据科学领域深造的优秀大学生提供开拓学术视野、了解学术前沿的机会,也为有意向申请我中心2025级直博生的同学提供了解中心科学研究、学科方向及研究生培养相关事宜的窗口。


一、项目介绍

在为期3天的交流活动中,同学们将有机会与中心教员互动,了解统计学与数据科学学术前沿、产业应用、未来发展的最新动态。
清华大学统计学研究中心为全程参加活动的夏令营学员颁发“优秀大学生夏令营”结业证书。
夏令营的申请和参与过程不收取任何费用。


二、日程安排

在线申请:
2024年3月20日12:00开始
2024年4月10日12:00截止
入选通知:2024年4月下旬
活动时间:2024年5月24日-26日


三、申请资格

  • 2025年应届本科毕业生
  • 统计学、数学、计算机、自动化、经济学等具有良好数理背景的专业
  • 对统计学和数据科学有浓厚兴趣,有志于相关领域的科学研究工作
  • 专业课成绩优秀,排名名列前茅,或者有一定研究成果
  • 英语达到大学英语六级水平(450分以上),或者有较高的GRE、TOEFL、IELTS成绩


四、申请方式

申请人在申请期间内(2024年3月20日至4月10日),登录清华大学统计学研究中心官方网站在线报名系统在线填写申请信息(唯一报名途径)
将申请材料整合为一个PDF格式的文件上传,文件名为(姓名+学校)
所需材料包括:

  • 个人简历
  • 个人陈述(介绍个人学习及学术研究经历,及未来的学习研究设想)
  • 成绩单及排名证明(需加盖教务部门公章)
  • 英语成绩证明
  • 补充材料(获奖证明、研究成果证明等)
  • 提交三封推荐信,请推荐专家发送邮件到stat_ug@tsinghua.edu.cn,
    主题为:XX大学XX同学2024夏令营推荐信


五、联系方式

地址:清华大学伟清楼212室
电话:010-62791242(仅接受学生本人电话咨询)

#post-16186
ntry-header

因教学工作需要,清华大学统计学研究中心拟招聘教学系列讲师1名,详情如下:

 

  • 招聘职务:讲师
  • 所需专业:统计学
  • 学位要求:博士

 

岗位描述:

  • 主讲本科生课程,每年教学工作量不少于256学时,且教学效果良好;
  • 参与教学创新与改革的研究与实践,并承担教材编写工作;
  • 参与统计学研究中心公共服务,及其他教学相关工作。

 

资格条件:

  • 1. 具有统计学博士学位;
  • 2. 能熟练阅读英语文献并能用英语进行口头学术交流;
  • 3. 热爱教学工作,认真努力,有责任心,能积极主动参与课程及教材建设,有良好的沟通表达能力和团队合作精神。

 

所需材料:

  • 1. 个人简历(中英文)
  • 2. 教学和公共服务情况
  • 3. 最具代表性成果材料3-5项
  • 4. 三封推荐信

 

请将上述材料发送至stat_recruit@tsinghua.edu.cn。邮件主题请注明“姓名-应聘教学系列讲师”。

#post-16028
ntry-header

2023年12月18日,西湖大学杨剑教授访问我中心,与中心师生座谈,并做特邀报告,报告的题目是Mapping Genes for Complex Human Traitsand Diseases。

杨剑教授报告现场
杨剑教授与中心侯琳副教授课题组交流科研工作
杨剑教授与中心师生合影
学术报告现场

 

#post-15843
ntry-header

2023年11月23日,香港中文大学(深圳)官永涛教授访问我中心,与中心教员交流,并做特邀报告,报告的题目是Group Network Hawkes Process。

官永涛教授与中心吴未迟副教授
官永涛教授与中心李东副教授
官永涛教授
报告现场
与会师生合影
#post-15758
ntry-header

2023年11月4日,清华大学统计学博士生论坛成功举办。该活动是清华大学统计学研究中心的传统活动,其设立的目标是为青年统计学者提供学术交流和分享的平台,以提高统计学者的专业知识及专业素养。同学们的科研方向涵盖统计理论基础研究、数据分析方法等多个方面,针对各自的研究成果和科研动态进行全方位展示。

活动由中心研究生工作主管俞声副教授组织并主持

俞老师提到,统计学者们需要保持脚踏实地的态度,既要深入理论研究,又要紧密结合实际问题,为社会和行业提供有力的解决方案。统计学的魅力在于它不仅是一门严密的理论体系,更是解决现实问题的重要工具,它能帮助我们更好地理解复杂的数据背后隐藏的规律,为决策提供科学依据。俞老师鼓励青年学者们不仅要在学术研究上精益求精,还要保持对实际问题的敏感性,积极参与到社会的发展和进步中去。

博士生论坛风采

黄栋 Sampling induced subgraphs and testing correlated Erdos-Renyi graphs
李易诚
Generalization error curves of analytic spectral algorithms over hilbert spaces under power-law decay
卢鑫
Debiased regression adjustment in completely randomized experiments with moderately high-dimensional covariates
赵政昀
PMC-patients, a large-scale dataset of patient summaries for retrieval-based clinical decision support systems
王羽超
High-dimensional statistics multi-group quadratic discriminant analysis via projection
韩庭萱
Rerandomization criteria of 2K factorial design–taking the importance of covariates and factorial effects into consideration
马沄
On the best approximation by finite Gaussian mixtures
于丁一
Chasing the heat: unraveling urban hyperlocal air temperature mapping with mobile sensing and statistical methods
周墨钦
TopWORDS-relation: extracting relations from domain-specific chinese texts via a relational dual-dictionary model
卢伟灏
Optimal rate of kernel regression in large dimensions
张皓博
Optimal rates of kernel ridge regression under source condition in large dimensions
付子初
HEAT-CF: Inference of heterogeneous perturbation effects in single-cell CRISPR screening experiments at single cell resolution
 陆瑶 Single-cell eQTL analysis at finer resolution
徐曼芸
On the optimality of sliced average variance estimate in high dimensions
蔡乐衡
Simultaneous inference for mean function of partially observed functional data
易盈淮
Inference for ARMA time series with mildly-varying trend
罗天派
Simultaneous inference for monotone and smoothly time varying functions under complex temporal dynamics
冯永真
Testing conditional quantile independence with functional covariate
李弘梓
Treatment effect estimation under covariate-adaptive randomization with heavy-tailed outcome
#post-15665