ntry-header

近日,统计学研究中心2017级博士研究生李杰,2020级博士研究生胡祺睿斩获国际统计学会 (International Statistical Institute, ISI) 颁发的国际统计学会2021年度简·丁伯根奖一等奖(2021 ISI Jan Tinbergen Award Division A First Prize)。

总部在荷兰的国际统计学会(ISI)是全球三个权威统计学学术组织之一,旨在引领、支持和促进全世界对统计学的理解、发展和良好实践。ISI 颁发的各类荣誉奖项都被国际统计学界高度认可。简·丁伯根奖命名于获得1969年首个诺贝尔经济学奖的荷兰学者简·丁伯根,是从每两年举行一次的世界统计学大会(World Statistics Congress, WSC)青年统计学者(1987年以后出生)提交的论文中评选的最佳论文(https://www.isi-web.org/events/isi-awards/tinbergen-award)。其中Division A的获奖论文必须解决一个对广大发展中国家具有实际意义的应用统计问题。自2019年开始,获奖者已不再限于发展中国家。自2013年至2021年,共有来自多个国家的14人获奖,其中3位华人,李杰和胡祺睿是第一次获得一等奖的华人。除此之外,西安电子科技大学数学与统计学院研究生韩路于2013年获二等奖。

今年共有3人获奖。李杰和胡祺睿获得2500欧元奖金,受邀免注册费参加于7月11日至16日在荷兰海牙举行(最终因疫情在线举办)的国际统计学会第63届世界统计学大会(The 63rd ISI World Statistics Congress),并在简·丁伯根奖会场(Jan Tinbergen Awards Session)做了30分钟的邀请报告。

李杰和胡祺睿的获奖论文“非参数回归分析空气污染物浓度的预测区间”(Prediction Interval of Air Pollutants Concentration by Nonparametric Regression Analysis)将非参数回归模型应用于局部平稳时间序列的趋势,分析了由中国环境监测总站高级工程师张凤英博士提供的西安市2013年到2020年间6种主要空气污染物的每日浓度数据,并构造出了未来5日各空气污染物浓度的预测区间。论文提出用样条回归(Spline regression)估计趋势函数,核回归(Kernel regression)估计方差函数,对所得的近似平稳序列拟合自回归(AR)模型,再用核分布(Kernel distribution estimator)方法估计其误差的分位数后,得到了带趋势项自回归时间序列的数据驱动多步向前预测区间。相比于季节性差分整合移动平均自回归(Seasonal ARIMA)等传统方法产生的预测区间,论文中方法得到的预测区间不仅长度更窄,还具有更好的预测精度和覆盖率。该方法有效解释了空气污染物浓度数据潜在的动态变化规律,并可以精确预测未来五到七日空气污染物的浓度,在污染物管理和早期预防方面有着广泛的应用价值。特别值得一提的是李杰和胡祺睿的获奖论文是在无指导教师直接参与的条件下完成的。

官网新闻链接:https://www.isi-web.org/news-newsletter/20555-2021-isi-jan-tinbergen-awards

 

#post-12271
ntry-header

2021年9月6日,香港大学朱柯助理教授通过线上平台与我中心教员深入交流,并进行线上学术报告,报告的题目是How effective is the regional joint environmental policy in China? Evidence from inverse difference-in-differences。

 

#post-12270
ntry-header

#post-12269
ntry-header

2021年8月23日,香港大学李国栋教授通过线上平台与我中心教员深入交流,并进行线上特邀报告,报告的题目是High-Dimensional Low-Rank Tensor Autoregressive Time Series Modelling。

#post-12268
ntry-header

#post-12267
ntry-header
今日,国家自然科学基金委员会发布《关于2021年国家自然科学基金集中接收申请项目评审结果的通告》(国科金发计〔2021〕51号),我中心杨立坚教授、俞声副教授获得国家自然科学基金面上项目资助;王天颖助理教授、杨朋昆助理教授、胡志睿助理教授获得国家自然科学基金青年项目资助。

负责人

项目类型

项目名称

杨立坚

面上项目

相依函数型数据的统计分析:理论与方法

俞声

面上项目

数据驱动医学知识图谱建设的基础算法研究

王天颖

青年项目

高维异质性数据中的整合分位数回归模型:统计推断理论及其在生物遗传学方面的应用

胡志睿

青年项目

基于贝叶斯模型及计算方法研究物种趋同进化的基因调控机制

杨朋昆

青年项目

大规模域空间上统计推断的性能极限及高效算法

#post-12266
ntry-header

      近日,我中心邓柯副教授课题组在统计国际顶尖期刊 Journal of the American Statistical Association (JASA)发表题为“Partition-Mallows Model and Its Inference for Rank Aggregation”的研究论文,提出了一种推断排名聚合的新方法。曾在邓柯课题组工作的朱万闯博士是该文的第一作者,姜瑛恺博士和刘军教授为共同作者,邓柯副教授是论文的通讯作者。

排名聚合是指如何聚合从不同信息源获得的关于某些个体的排序,从而得到一个更加‘精确’的排序。例如,有m位评委为n名运动员的能力进行排序。排名聚合致力于对这m个排序进行整合分析以得到一个新的排序,能够更加准确地反映n名运动员能力的高低。现实中,m位评委的可靠性可能会存在差异,部分可靠性较低的评委可能会误导排名聚合的结果。开发基于数据驱动的方法来自动识别不同评委的可靠性,并据此优化排名聚合的结果,具有重要的实际意义。

邓柯和刘军等人曾于2014年在JASA发表了题为“Bayesian Aggregation of Order-Based Rank Data”的论文中,提出了一种基于划分模型(partition model)的排名聚合方法BARD。BARD将排序对象划分为两个组别,“相关个体组”和“背景个体组”,并假设可靠性高的评委们会以更高的概率将中的个体排位于中的个体之前。该方法能够在有效识别评委可靠性的同时,通过弱化可靠性较差的评委在排名聚合中贡献,来消除他们可能带来的负面作用。但是,该方法简单忽略了两个组别中各个体的差异,从而在很大程度上损失了组内排名的信息。从应用的角度看,这是该方法的一个重要局限性。

本文在上述工作的基础上,采用更加精细的 Mallows模型对组别的组内排名进行了建模,将partition模型和Mallows 模型的优势结合起来,得到了能力更强的排名聚合模型Partition-Mallows model。该模型构建了对具有复杂结构的排名数据进行定量描述的一般框架,在充分利用组间及组内的排名信息的基础上,不仅可以有效识别评委可靠性的差异,还能够产出更有效率的排名聚合。我们从理论上证明了该方法的可靠性,并通过大量的计算机模拟和实证研究验证了该方法在处理具有分组结构的排名聚合问题上具有明显优势。

图源:论文原文

该研究工作获得中国国家自然科学基金(Grants 11771242 & 11931001)、北京智源人工智能研究院(Grant BAAI2019ZD0103)和美国国家科学基金(Grants DMS-1903139 and DMS-1712714)的资助。

论文链接:https://doi.org/10.1080/01621459.2021.1930547

 

#post-12265
ntry-header

2021年7月22日,宾夕法尼亚州州立大学邬荣领教授访问我中心,并做特邀报告,报告的题目是:Learning High-order Dynamical Interactome Networks from Big Static Data。

邬荣领教授在统计学研究中心
报告现场
邬荣领教授(右)在邓柯副教授带领下参观统计学研究中心
#post-12264
ntry-header

近日,我中心邓柯副教授课题组在应用统计国际顶尖期刊The Annals of Applied Statistics (AOAS)发表题为“Rapid Design of Metamaterials via Multitarget Bayesian Optimization”的研究论文,提出了电磁超材料快速设计的新方法。曾在邓柯课题组攻读博士学位的杨洋博士(清华大学2015级博士生)是该文的第一作者,邓柯副教授与深圳光启高等理工研究院副院长季春霖博士作为论文的共同通讯作者联合指导了相关研究和论文撰写。

电磁超材料由大量人工设计建造的结构单元构成,能呈现出光学隐身、聚焦等自然材料所不具备的超常电磁性能,在许多领域具有重要应用,在学术界和工业界都引起了广泛的关注。然而,传统的电磁超材料设计一般是借助不断试错的探索性实验进行的,缺乏有理论保证的系统方法,需要耗费大量时间和计算资源,严重制约了电磁超材料的实际应用。

该论文将电磁超材料设计问题凝练为一个多目标优化问题,提出了一种基于贝叶斯优化的协同设计方法,大幅提高了设计效率,实现了电磁超材料的快速设计。该方法首先根据实际问题的背景,将一个结构单元的无穷维响应曲线降维成两个简单响应(即响应曲线的均值和方差),并用高斯过程对这两个简单响应进行建模;进而,利用这些简单响应的统计模型构建起便捷的代理模型,对不同结构单元的响应给出定量预测,并同步考虑复杂电磁超材料所涉及的多个设计目标来构造联合采集函数,在贝叶斯优化的框架下选择最有利的实验设计路径。论文从理论上证明了该方法的有效性,并通过计算机模拟实验验证了该方法具有远超已有方法的计算和搜索效率。

从理论的角度看,该论文首次为复杂电磁超材料的设计建立了具有理论保证的系统方法;从应用的角度看,该论文提出的方法对复杂电磁超材料的设计效率有了数量级上的提升。相关方法的应用不仅局限于电磁超材料设计领域,还有潜力拓展到许多具有类似问题的应用场景。该项工作是统计学习和材料工程两个领域交叉融合的成果,是重要应用问题驱动交叉学科研究的一个成功实例。

该研究工作获得国家自然科学基金(Grant 11931001 & 11771242)、北京智源人工智能研究院(Grant BAAI2019ZD0103)、超材料电磁调制技术国家重点实验室和广东省超材料微波射频重点实验室的资助。

论文链接:http://dx.doi.org/10.1214/20-AOAS1426

#post-12263
ntry-header

#post-12262