ntry-header

2021年05月24日,西南财经大学佘睿副教授通过线上平台与中心教员深入交流,并进行线上学术报告,报告的题目是:Location-adaptive Change-point Testing for Time Series。

#post-12253
ntry-header

我中心2017级博士研究生袁正和阿里巴巴达摩院刘一佳、谭传奇、黄松芳、黄非合作的论文 “Improving Biomedical Pretrained Language Models with Knowledge” 被自然语言处理会议NAACL-BioNLP接受并在线发表。该工作利用医学实体知识增强预训练语言模型,在多个医学命名实体识别和关系提取任务上得到了更好的表现。代码和模型开源请见https://github.com/GanjinZero/KeBioLM

预训练语言模型在多种自然语言处理任务上十分有效。区别于通用文本,医学文本有独特的术语和风格;并且医学领域中已经构建了含有大量医学实体的知识图谱。基于这两点,该工作提出了KeBioLM来增强医学预训练模型。KeBioLM利用医学论文数据库PubMed作为训练语料,通过SciSpaCy将自由文本与UMLS知识图谱中的医学实体知识相结合。KeBioLM含有两个Transformers层:第一个层用于从文本中提取医学实体并学习实体表示;第二个层用于融合文本和实体的信息来增强文本表示。

为了验证KeBioLM在医学自然语言处理任务上的有效性,该工作在医学自然语言理解和推理榜单BLURB上得到了87.1(命名实体识别)和81.2(关系提取)的平均分,超过了之前的基线模型PubMedBERT模型0.8和0.6分。该工作还通过UMLS的知识探针说明KeBioLM相比之前的预训练语言模型学会了更多的医学知识。

论文在线链接:

https://www.aclweb.org/anthology/2021.bionlp-1.20/

#post-12252
ntry-header

#post-12251
ntry-header

#post-12250
ntry-header

2021年5月17日,上海纽约大学王丹助理教授与中心教员深入交流,并进行线上学术报告,报告的题目是:Estimating and Forecasting Volatility using Leverage Effect。

#post-12249
ntry-header

为响应国家对高等教育改革的号召、促进后疫情时代的统计学教育适应社会发展的最新需求,基于2019年“第一届统计学教学改革研讨会”的讨论,清华大学统计学研究中心将于2021年6月25-26日举办“第二届统计学教学改革研讨会”,同从事一线教学的各位统计学者立足教学理念、教学体系、培养模式、教学方式四个维度,进行进一步深化探讨,欢迎各位老师报名参加!

【会议地点】:清华大学校内或附近

【会议时间】:2021/06/26  (周六)

【报到时间】:2021/06/25(周五)

【报名日期】:即日起至2021/06/15

【联系人】:

王江典:wangjiangdian@tsinghua.edu.cn

报名可发送“姓名、单位、教学课程、联系方式”至王江典老师邮箱。

#post-12248
ntry-header

#post-12246
ntry-header

2021年5月7日,斯坦福大学何子淮助理教授通过线上平台与中心教员深入交流,并进行线上学术报告,报告的题目是:Identification of Putative Causal Loci in Whole-genome Sequencing Data via Knockoff Statistics。

#post-12247
ntry-header

#post-12245
ntry-header

2021年4月26日,佐治亚理工大学杨世昊助理教授通过线上平台与中心教员深入交流,并进行线上学术报告,报告的题目是:Inference of Dynamic Systems form Noisy and Sparse Data via Manifold-constrained Gaussian Process。

#post-12244