ntry-header

清华大学统计学研究中心17级博士研究生张心雨与中心杰出访问教授汤家豪教授(Howell Tong)合作撰写的研究论文“Asymptotic theory of principal component analysis for time series data with cautionary comments”于今年年初正式发表于Journal of the Royal Statistical Society: Series A (Statistics in Society)期刊。学术圈过往研究中经常直接对时间序列数据进行主成分分析而忽略其自相关性,针对这种误用,本文给出了时间序列主成分分析的统计推断性质和正确建模流程,并得出结论:如果忽视数据间的相关性而直接进行统计推断,可能会对主成分的变量载荷做出误导性的过度解释。

主成分分析是统计学和数据科学中最常用的多元统计分析工具之一,但应用中也存在诸多误用现象。典型误用是:对于时间序列数据,仍然使用独立数据假设下的理论结果。该论文强调了这种误用可能带来的问题。论文证明了时间序列主成分分析下的特征值和特征向量的中心极限定理,并给出其协方差的估计方法。论文关注方差比例和主成分载荷的统计推断,前者决定了主成分的数量,后者有助于主成分含义的解释。论文的研究结果表明:在这种误用下,方差比例的统计推断仍然较为可靠,但是主成分载荷的统计推断会产生较大变化。论文着眼于一个投资组合管理的实例分析,以此提供了时间序列数据正确使用主成分分析的流程和案例。

论文链接:

‍https://rss.onlinelibrary.wiley.com/doi/10.1111/rssa.12793‍

#post-12334
ntry-header

#post-12333
ntry-header
2022年5月26-29日,清华大学统计学研究中心优秀大学生夏令营活动成功举办。本届夏令营共收到来自95所高校的351名同学的申请,经过层层筛选,来自清华大学、北京大学、北京师范大学、中国人民大学、中国科学技术大学、吉林大学、上海交通大学等多所国内知名高校的共42名同学成功入营。

申请者学校分布
申请者专业分布
夏令营活动由中心李东副教授主持

 

王天颖、杨朋昆、张静怡三位助理教授介绍研究方向

在线笔试现场
在线笔试现场

数据分析环节

经过理论考试与数据分析考查,最终评选出优秀营员10名,荣誉营员20名。

同时也欢迎各位同学在9月份研究生推免工作中报考清华统计中心!期待与大家在清华园相聚!

 

#post-12332
ntry-header

2022年5月23日,圣母大学赵子锋助理教授通过线上平台与我中心教员交流,并进行线上学术报告,报告的题目是Optimal Change-point Testing for High-dimensional Linear Models with Temporal Dependence。

线上报告截图
与会人员合影

 

#post-12331
ntry-header

2022年5月16日,美国国立卫生研究院陆致用博士通过线上平台与中心教员交流,并做特邀报告,报告的题目是:PubMed & Beyond: Biomedical Text Mining for Knowledge Discovery。

陆致用博士线上特邀报告
与会教员合影
#post-12329
ntry-header

2022年5月9日,加州大学戴维斯分校Hao Chen副教授通过线上平台与我中心教员交流,并进行线上学术报告,报告的题目是A Universal Nonparametric Event Detection Framework for Modern Data。

与会教员云合影
#post-12327
ntry-header

2022年4月25日,清华大学交叉信息研究院张景昭助理教授访问我中心,并作学术报告,报告的题目是Convergence in Deep Learning does not Require Finding Stationary Points。

报告现场
与会教员合影
#post-12325
ntry-header

清华大学统计咨询中心受国家食品安全风险评估中心(以下简称CFSA)周萍萍研究员委托,希望针对不同咖啡产品中呋喃(furan)及其衍生物的相关性分析问题给出具有优良统计学特性的解决方案。清华大学统计学研究中心邓柯副教授及周墨钦咨询师(2019级博士生)运用多元统计分析方法对不同咖啡产品中呋喃(furan)及其衍生物的潜在相关结构和异质模式进行了分析,协助食品安全专家更深入地认识了相关污染物在咖啡产品中的分布模式和规律。相关论文“Analysis of furan and its major furan derivatives in coffee products on the Chinese market using HS-GC–MS and the estimated exposure of the Chinese population”发表于食品科学技术领域的顶级期刊《Food Chemistry》(IF: 7.514;H-index: 221)。CFSA曹佩研究员为该文的第一作者,周萍萍研究员为通讯作者,邓柯副教授及周墨钦同学为共同作者参与了论文撰写。

本研究基于改进的顶空气相色谱-质谱法(HS-GC-MS)分析了在中国市场上采集的咖啡样本中的呋喃及其衍生物的浓度,利用多元统计分析方法和可视化技术揭示了样本数据的内在结构,发现不同类型的咖啡产品的呋喃浓度水平和分布模式存在异质性,建议应加强对咖啡产品生产过程中的呋喃及其衍生物的控制研究。

论文链接:

https://www.sciencedirect.com/science/article/abs/pii/S0308814622007853

#post-12323
ntry-header

2022年04月18日,首都师范大学邹国华教授作客清华大学统计学论坛特邀报告,报告的题目是Asymptotic distribution theory for model averaging based on information criterion。

#post-12322
ntry-header

近日,我中心邓柯副教授团队与北京大学人民医院胸外科团队合作在胸外科经典期刊《欧洲心胸外科杂志》(European Journal of Cardio-Thoracic Surgery,简称EJCTS)发表题为“Detection of blood stains using computer vision-based algorithms and their association with postoperative outcomes in thoracoscopic lobectomies”的研究论文,提出了一种基于计算机视觉的术中出血识别与计量方法,并首次将手术视频分析与临床预后关联分析相结合,为手术预后提供指导。

北京大学人民医院博士研究生许昊和中心21级博士研究生韩庭萱为本文的共同第一作者,中心邓柯副教授和北京大学人民医院的周健副教授、王俊院士为本文的共同通讯作者,中心19级博士研究生王海沣参与工作。

如今,胸外科手术已逐渐转向微创(Minimally Invasive Surgery,简称MIS)范式。与开胸手术相比,视频辅助胸腔镜手术(Video Assisted Thoracoscopic Surgery,简称VATS)因其较少的术后急性期、较小的肺功能损害、较低的术后发病率以及较短的住院时间,已成为治疗早期和局部晚期非小细胞肺癌患者的标准方式。在VATS手术期间,数码相机将手术过程拍摄为视频。手术视频中包含大量有关患者术中出血情况的信息,例如出血的时段、冲水操作后的出血状况等。如何通过对手术视频的分析准确有效地量化VATS视频中的血迹,并提取能够反映手术状态、与预后显著相关的变量是一项尚未解决的挑战。

本文使用北京大学人民医院胸外科2020年行肺叶切除术的275例手术视频,利用图像背景信息,提出了一种基于RGB通道动态阈值的血迹像素识别算法,对血迹像素的判别准则进行实时调整,并在血迹像素识别任务中取得准确性99.1%,特异性98.9%,敏感度99.2%的效果。该方法具有运算简单快速、准确性高的特点,适用于长时间、高清晰度的视频分析。对术中血迹像素进行识别后,本文提取基于血迹像素占比的变量用以刻画术中出血情况,并与患者预后指标进行关联分析,得到了具有统计学显著性的变量,由此形成临床预后方案,为预后管理提供指导。

论文链接:

https://academic.oup.com/ejcts/advance-article-pdf/doi/10.1093/ejcts/ezac154/43152865/ezac154.pdf

#post-12319