ntry-header

#post-15751
ntry-header

#post-15716
ntry-header

2023年11月4日,清华大学统计学博士生论坛成功举办。该活动是清华大学统计学研究中心的传统活动,其设立的目标是为青年统计学者提供学术交流和分享的平台,以提高统计学者的专业知识及专业素养。同学们的科研方向涵盖统计理论基础研究、数据分析方法等多个方面,针对各自的研究成果和科研动态进行全方位展示。

活动由中心研究生工作主管俞声副教授组织并主持

俞老师提到,统计学者们需要保持脚踏实地的态度,既要深入理论研究,又要紧密结合实际问题,为社会和行业提供有力的解决方案。统计学的魅力在于它不仅是一门严密的理论体系,更是解决现实问题的重要工具,它能帮助我们更好地理解复杂的数据背后隐藏的规律,为决策提供科学依据。俞老师鼓励青年学者们不仅要在学术研究上精益求精,还要保持对实际问题的敏感性,积极参与到社会的发展和进步中去。

博士生论坛风采

黄栋 Sampling induced subgraphs and testing correlated Erdos-Renyi graphs
李易诚
Generalization error curves of analytic spectral algorithms over hilbert spaces under power-law decay
卢鑫
Debiased regression adjustment in completely randomized experiments with moderately high-dimensional covariates
赵政昀
PMC-patients, a large-scale dataset of patient summaries for retrieval-based clinical decision support systems
王羽超
High-dimensional statistics multi-group quadratic discriminant analysis via projection
韩庭萱
Rerandomization criteria of 2K factorial design–taking the importance of covariates and factorial effects into consideration
马沄
On the best approximation by finite Gaussian mixtures
于丁一
Chasing the heat: unraveling urban hyperlocal air temperature mapping with mobile sensing and statistical methods
周墨钦
TopWORDS-relation: extracting relations from domain-specific chinese texts via a relational dual-dictionary model
卢伟灏
Optimal rate of kernel regression in large dimensions
张皓博
Optimal rates of kernel ridge regression under source condition in large dimensions
付子初
HEAT-CF: Inference of heterogeneous perturbation effects in single-cell CRISPR screening experiments at single cell resolution
 陆瑶 Single-cell eQTL analysis at finer resolution
徐曼芸
On the optimality of sliced average variance estimate in high dimensions
蔡乐衡
Simultaneous inference for mean function of partially observed functional data
易盈淮
Inference for ARMA time series with mildly-varying trend
罗天派
Simultaneous inference for monotone and smoothly time varying functions under complex temporal dynamics
冯永真
Testing conditional quantile independence with functional covariate
李弘梓
Treatment effect estimation under covariate-adaptive randomization with heavy-tailed outcome
#post-15665
ntry-header

2023年11月3日,北京生物医学统计与数据管理研究会(以下简称BBA )2023第四季度研讨会成功举办。本次会议以“智慧研究与智慧医疗”为主题,由北京生物医学统计与数据管理研究会主办,清华大学统计学研究中心和百济神州(北京)生物科技有限公司(以下简称百济神州)联合承办。会议由北京生物医学统计与数据管理研究会秘书长、百济神州统计编程高级总监李友主持,来自高校、医疗机构和医药科技行业等单位的多位专家及学者出席会议并参与研讨。

北京生物医学统计与数据管理研究会秘书长、百济神州统计编程高级总监李友

会议伊始,北京生物医学统计与数据管理研究会副理事长、清华大学统计学研究中心邓柯副教授致辞。邓柯提到,BBA多年来积极推动学术研讨会的组织和发起工作,在学界与产业界之间起到重要的桥梁作用,也在智慧医疗建设等热点研究领域引发了很多有意义的思考与讨论。清华大学也非常荣幸能够参与本次会议的组织,共同推动数据科学、智慧医学与医疗行业的交叉融合。邓柯表示,数据科学可以在医疗领域有重要的应用,期待各位专家与学者用统计学与数据科学的方法,做出更多前沿、重要的工作,共同促进智慧医疗产业的发展,使医疗健康领域高效且惠及民生。

北京生物医学统计与数据管理研究会副理事长、清华大学统计学研究中心邓柯副教授

本次会议的特邀报告嘉宾分别是清华大学统计学研究中心的刘汉中副教授、北京大学第三医院临床流行病学研究中心的李楠副主任、百济神州的高级副总裁郭翔博士和高博医疗集团副总裁、高灵智腾首席运营官尚华。四位嘉宾分别围绕因果推断前沿方法及应用、AI辅助临床决策、数据科学助力临床开发和数智化在临床研究中的应用的主题做特邀报告。

随后,报告嘉宾与博济医药首席统计学家李新旭博士、默沙东研发(中国)有限公司生物统计与科学决策部门总监吴海燕博士共同参加了圆桌讨论环节。各位专家学者分别从学界和业界的角度出发,针对智慧医疗的未来发展方向、可能遇到的难题与可能的解决办法以及BBA在推动智慧医疗发展方面可以发挥的作用等话题展开深入交流。

专题讨论嘉宾

最后,会议由百济神州高级副总裁郭翔博士做闭幕致辞。郭翔提到,BBA不仅为学术界与产业界搭建了沟通交流的平台,也促进了数据科学与医疗行业的交叉融合。期待在未来的智慧医疗领域,BBA能够继续发挥桥梁作用,推动数据科学与医疗健康领域的创新与发展。

与会学者合影
#post-15651
ntry-header

2023年11月7日,由海关总署主办的“2023非关税贸易措施高质量发展论坛在上海国家会展中心隆重召开,该论坛作为“第六届中国国际进口博览会”配套高峰论坛之一引起广泛关注。论坛以“智慧海关助力贸易安全与通关便利化”为主题,围绕“智慧监管筑牢国门生物安全边境”、“规制一致性推动智慧通关便利化”等议题展开探讨。海关总署总工程师韩森代表海关总署致欢迎词,芬兰农林部部长萨丽艾萨叶女士、中国科学院院士陈松蹊、中国工程院士沈建忠、单杨、庄松林等专家学者分别发言,来自海关总署各司局及地方海关的官员及专家、相关专业机构代表、知名企业家及多国驻华使节百余人受邀出席了论坛。

在本次论坛中,陈松蹊院士作了题为“运用统计学智慧推进通关便利化”的主题发言。陈院士在发言中指出随着 “一带一路”战略取得巨大成功,中国以自身的快速发展带动全球贸易格局发生了深远的变化。面对新形势、新机遇,运用前沿技术手段推动通关便利化,在严守国门安全的前提下,提高通关的规范化、智能化水平,更好地服务于国家“高质量发展”和“一带一路”战略,具有重大的经济效益和政治意义。然而,从科学逻辑上来讲,“推动通关便利化”与“守护国门安全”却是一对矛盾:推动通关便利化,客观上以简化口岸查验措施为前提;但这势必会削弱海关在口岸发现潜在问题的能力,为守护国门安全带来隐患。如何处理好这对矛盾,在有效推动通关便利化的同时,强化而不是削弱国门安全,是对中国海关管理能力的一大考验。要做好这件事情,从科学逻辑上讲,只有一种途径,那就是:持续提升中国海关的风险感知和预警能力,在口岸查验强度降低的情况下,大幅度提高查验的针对性和精准度,从而保证国门安全。要实现这个目标,运用科学、系统的方法,对错综复杂的政务大数据进行有效治理,并实施有目标、有深度、高质量的政务大数据分析,是重中之重。作为一门系统研究数据采集、处理、分析、解读的学科,统计学是实现上述目标的核心基础,由统计学所产生的数据智能是建设智慧海关的关键力量。

 

陈松蹊院士还在发言中特别介绍了清华大学统计学中心邓柯副教授团队与海关总署在“进出口食品安全风险评估监管”和“技术性贸易措施综合指数研究”等方面的合作成果,为统计学科与海关总署更紧密的合作打下了良好的基础。陈院士还指出运用统计学理论与方法更好更快地推动“智慧海关”建设,仍有巨大的空间;充分运用海关口岸贸易数据,深入研究由于国际贸易所引起的“碳排放国际转移”,将对于我国更好应对碳排放挑战具有重大的战略意义。相关发言在与会听众中引起了强烈共鸣。

央视新闻对论坛活动进行了报道。在新闻视频中,高度评价了统计学在海关大数据分析和智慧海关建设中所发挥的作用,并特别播报了陈松蹊院士的发言片段。详细报道请点击如下视频链接观看。

#post-15638
ntry-header

2023年11月6日,中国科学技术大学曾靖副教授访问我中心,与中心教员座谈,并做学术报告,报告的题目是:

Robust Sliced Inverse Regression: Optimal Estimation for Heavy-Tailed Data in High Dimensions。

曾靖副教授
报告现场
与会教员合影
#post-15624
ntry-header

#post-15609
ntry-header

#post-15598
ntry-header

近日,2023年自然语言处理实证方法会议(The 2023 Conference on Empirical Methods in Natural Language Processing,简称为EMNLP 2023)公布了论文接受结果,我中心邓柯老师课题组博士研究生潘长在同学的研究论文“TopWORDS-Poetry: Simultaneous Text Segmentation and Word Discovery for Classical Chinese Poetry via Bayesian Inference”入选“主会长文”单元。自然语言处理实证方法会议(EMNLP)是自然语言处理和人工智能领域的顶级会议,由国际计算语言学协会的语言数据特别兴趣小组 (SIGDAT) 组织于 1996 年发起,是在早期超大型语料库研讨会 (Workshop on Very Large Corpora, WVLC) 基础上发展起来的。

潘长在同学的入选论文针对于中国古典诗歌的文本分析展开研究,力图运用贝叶斯统计方法解决这类特殊文本的命名实体识别和分词问题。中国古代诗歌具有独特的写作风格和格律要求,富含在其他通用文本中罕见的特殊诗歌词汇,其分析至今仍充满挑战。

潘长在的论文从中国古典格律诗歌主要具有两种模式(如图一所示)的事实出发,建立了一种可以对诗歌文本分词进行有效指导的贝叶斯先验分布;并将这个先验分布与无监督中文分析方法TopWORDS的分析框架相结合,提出了一种同时进行文本分词和词语发现的无监督中国古代诗歌分析方法TopWORDS-Poetry,可以借助诗歌本身隐含的格律信息对诗歌文本进行精准分词,并有效发现诗歌中的特殊词汇(如人名、地名、典故等)。

将该方法应用到《全唐诗》诗歌文本的分析,我们通过小样本人工验证证实了TopWORDS-Poetry方法能够挖掘出大量有意义的人名、地名、文学典故等词汇,并在诗歌分词上有优良的表现。相关实验还表明,TopWORDS-Poetry方法相比于通用大语言模型ChatGPT和文献中其他已有方法,在综合表现上有明显的优势。

该论文是清华大学数字人文团队共同合作的成果,潘长在是第一作者,邓柯副教授作为通讯作者与清华大学中文系的李飞跃副教授共同指导了相关研究工作。清华大学数字人文团队由来自清华大学人文学院、计算机系和统计学研究中心3家单位的学者组成,凝聚了横跨文科、工科、理科的跨学科交叉研究力量,致力于运用前沿人工智能技术和统计学方法,解决新兴交叉领域“数字人文”中的重要问题。

该研究工作得到了国家科技部创新研究计划、清华大学国强研究院、北京市自然科学基金的支持。

 

#post-15584
ntry-header

#post-15581