主成分分析是统计学和数据科学中最常用的多元统计分析工具之一,但应用中也存在诸多误用现象。典型误用是:对于时间序列数据,仍然使用独立数据假设下的理论结果。该论文强调了这种误用可能带来的问题。论文证明了时间序列主成分分析下的特征值和特征向量的中心极限定理,并给出其协方差的估计方法。论文关注方差比例和主成分载荷的统计推断,前者决定了主成分的数量,后者有助于主成分含义的解释。论文的研究结果表明:在这种误用下,方差比例的统计推断仍然较为可靠,但是主成分载荷的统计推断会产生较大变化。论文着眼于一个投资组合管理的实例分析,以此提供了时间序列数据正确使用主成分分析的流程和案例。
https://rss.onlinelibrary.wiley.com/doi/10.1111/rssa.12793
王天颖、杨朋昆、张静怡三位助理教授介绍研究方向
数据分析环节
经过理论考试与数据分析考查,最终评选出优秀营员10名,荣誉营员20名。
同时也欢迎各位同学在9月份研究生推免工作中报考清华统计中心!期待与大家在清华园相聚!
2022年5月23日,圣母大学赵子锋助理教授通过线上平台与我中心教员交流,并进行线上学术报告,报告的题目是Optimal Change-point Testing for High-dimensional Linear Models with Temporal Dependence。
2022年5月16日,美国国立卫生研究院陆致用博士通过线上平台与中心教员交流,并做特邀报告,报告的题目是:PubMed & Beyond: Biomedical Text Mining for Knowledge Discovery。
2022年5月9日,加州大学戴维斯分校Hao Chen副教授通过线上平台与我中心教员交流,并进行线上学术报告,报告的题目是A Universal Nonparametric Event Detection Framework for Modern Data。
2022年4月25日,清华大学交叉信息研究院张景昭助理教授访问我中心,并作学术报告,报告的题目是Convergence in Deep Learning does not Require Finding Stationary Points。
清华大学统计咨询中心受国家食品安全风险评估中心(以下简称CFSA)周萍萍研究员委托,希望针对不同咖啡产品中呋喃(furan)及其衍生物的相关性分析问题给出具有优良统计学特性的解决方案。清华大学统计学研究中心邓柯副教授及周墨钦咨询师(2019级博士生)运用多元统计分析方法对不同咖啡产品中呋喃(furan)及其衍生物的潜在相关结构和异质模式进行了分析,协助食品安全专家更深入地认识了相关污染物在咖啡产品中的分布模式和规律。相关论文“Analysis of furan and its major furan derivatives in coffee products on the Chinese market using HS-GC–MS and the estimated exposure of the Chinese population”发表于食品科学技术领域的顶级期刊《Food Chemistry》(IF: 7.514;H-index: 221)。CFSA曹佩研究员为该文的第一作者,周萍萍研究员为通讯作者,邓柯副教授及周墨钦同学为共同作者参与了论文撰写。
本研究基于改进的顶空气相色谱-质谱法(HS-GC-MS)分析了在中国市场上采集的咖啡样本中的呋喃及其衍生物的浓度,利用多元统计分析方法和可视化技术揭示了样本数据的内在结构,发现不同类型的咖啡产品的呋喃浓度水平和分布模式存在异质性,建议应加强对咖啡产品生产过程中的呋喃及其衍生物的控制研究。
论文链接:
https://www.sciencedirect.com/science/article/abs/pii/S0308814622007853
2022年04月18日,首都师范大学邹国华教授作客清华大学统计学论坛特邀报告,报告的题目是Asymptotic distribution theory for model averaging based on information criterion。