ntry-header

清华大学统计学研究中心17级博士研究生张心雨与中心杰出访问教授汤家豪教授(Howell Tong)合作撰写的研究论文“Asymptotic theory of principal component analysis for time series data with cautionary comments”于今年年初正式发表于Journal of the Royal Statistical Society: Series A (Statistics in Society)期刊。学术圈过往研究中经常直接对时间序列数据进行主成分分析而忽略其自相关性,针对这种误用,本文给出了时间序列主成分分析的统计推断性质和正确建模流程,并得出结论:如果忽视数据间的相关性而直接进行统计推断,可能会对主成分的变量载荷做出误导性的过度解释。

主成分分析是统计学和数据科学中最常用的多元统计分析工具之一,但应用中也存在诸多误用现象。典型误用是:对于时间序列数据,仍然使用独立数据假设下的理论结果。该论文强调了这种误用可能带来的问题。论文证明了时间序列主成分分析下的特征值和特征向量的中心极限定理,并给出其协方差的估计方法。论文关注方差比例和主成分载荷的统计推断,前者决定了主成分的数量,后者有助于主成分含义的解释。论文的研究结果表明:在这种误用下,方差比例的统计推断仍然较为可靠,但是主成分载荷的统计推断会产生较大变化。论文着眼于一个投资组合管理的实例分析,以此提供了时间序列数据正确使用主成分分析的流程和案例。

论文链接:

‍https://rss.onlinelibrary.wiley.com/doi/10.1111/rssa.12793‍

#post-12334
ntry-header

#post-12333
ntry-header
2022年5月26-29日,清华大学统计学研究中心优秀大学生夏令营活动成功举办。本届夏令营共收到来自95所高校的351名同学的申请,经过层层筛选,来自清华大学、北京大学、北京师范大学、中国人民大学、中国科学技术大学、吉林大学、上海交通大学等多所国内知名高校的共42名同学成功入营。

申请者学校分布
申请者专业分布
夏令营活动由中心李东副教授主持

 

王天颖、杨朋昆、张静怡三位助理教授介绍研究方向

在线笔试现场
在线笔试现场

数据分析环节

经过理论考试与数据分析考查,最终评选出优秀营员10名,荣誉营员20名。

同时也欢迎各位同学在9月份研究生推免工作中报考清华统计中心!期待与大家在清华园相聚!

 

#post-12332
ntry-header

2022年5月23日,圣母大学赵子锋助理教授通过线上平台与我中心教员交流,并进行线上学术报告,报告的题目是Optimal Change-point Testing for High-dimensional Linear Models with Temporal Dependence。

线上报告截图
与会人员合影

 

#post-12331
ntry-header

#post-12330
ntry-header

2022年5月16日,美国国立卫生研究院陆致用博士通过线上平台与中心教员交流,并做特邀报告,报告的题目是:PubMed & Beyond: Biomedical Text Mining for Knowledge Discovery。

陆致用博士线上特邀报告
与会教员合影
#post-12329
ntry-header

#post-12328
ntry-header

2022年5月9日,加州大学戴维斯分校Hao Chen副教授通过线上平台与我中心教员交流,并进行线上学术报告,报告的题目是A Universal Nonparametric Event Detection Framework for Modern Data。

与会教员云合影
#post-12327
ntry-header

#post-12326