ntry-header

会议概况

2018年11月9日至11日,“国际计算统计协会亚洲分会25周年大会暨中国现场统计学会计算统计分会第二届年会”在中国北京会议中心举办。此次会议的主题为“统计计算:数据科学的挑战与机遇”。会议由The Asian Regional Section of the International Association for Statistical Computing(简称IASC-ARS)和Chinese Association for Statistical Computing (简称CASC)联合主办,清华大学统计学研究中心协办。本次会议致力于促进统计计算在现代数据科学中的进一步发展,同时也为统计计算和数据科学专家之间提供了学术交流与合作的平台。来自亚太地区的70余名学者与近百位国内专家参加了本次会议。

会议主席致辞

会议于10日上午拉开帷幕。本次会议的联合主席、中国现场统计学会计算统计分会理事长、清华大学统计学研究中心副主任邓柯教授首先致开幕词。他指出,在现如今的大数据时代背景下,统计计算面临着诸多挑战和机遇,如何更精准的分析挖掘数据,并发挥其现实意义是值得统计学者们深入思考的问题,同时也是此次会议所探讨的主题。邓柯理事长对中国现场统计学会计算统计分会的基本情况进行了介绍,希望以本次理事会为契机,加强国内外在统计计算的方面的深入合作,共同推动学术研究与交流。

CASC理事长邓柯教授致辞

作为会议的联合主席,国际计算统计协会亚洲分会主席Philip L.H. Yu教授发表致辞,他指出此次会议是两个协会共同合作,以促进统计计算的发展,并对国际计算统计协会亚洲分会的情况进行了介绍。

IASC-ARS主席Philip L.H. Yu教授

主会场特邀报告

本次会议的主会场邀请报告精彩纷呈,重磅云集。刚刚全职加入清华大学的美国国家科学院院士Donald B. Rubin 教授,哈佛大学统计系刘军教授,香港大学Wing Kam Fung教授,多伦多大学与北京大学双聘教授姚方教授四位统计学“大咖”在主会场做了精彩报告。首先,刘军教授为我们带来了他在贝叶斯先验分布上的研究。针对几种常用先验的现有方法,刘军教授指出:不同的先验需要不同计算策略,这使得实际操作很复杂。如果有一个整合的方法来简化抽样和优化,则可以促进贝叶斯方法在实际中的应用。基于这种想法,他介绍了一种新的先验分布 Neuronized prior,这种先验采用激活函数的形式,是对现有某些先验的整合和扩展,达到了算法和估计上的高效性,从而降低了用贝叶斯方法做模型选择的难度。

刘军教授做大会特邀报告

Wing Kam Fung教授针对基于重抽样的假设检验,提出了一种新的蒙特卡洛评估方法。在模拟中,循环次数通常很大,使得计算量大,这自然引发学者思考是否可以让内循环次数减小。pooling的方法正是基于这样的思想,但是这种方法的有效性还不甚清楚。Wing Kam Fung教授提出了n-times pooling resampling-based method,介绍了这种方法的理论性质,并模拟来展示。这种方法精度高、计算快,适用于对高计算量的检验进行评估。

Wing Kam Fung教授做大会特邀报告

随后,姚方教授分享了他在函数型数据上的研究。他针对黎曼函数型数据,即函数取值在黎曼流形上的函数型数据,提出了一个分析框架。采用内蕴几何的方法,介绍了intrinsic Riemannian functional principal component analysis (iRFPCA) ,得到了其估计和收敛性,并拓展至intrinsic Riemannian functional linear regression (iRFLR),最后介绍了其应用实例。

姚方教授做大会特邀报告

主会场的最后一位演讲者,Donald B. Rubin 教授介绍了现代计算对于统计的两大贡献:交互计算和复杂展示。并以MNAR模型为例,指出现代统计计算使得我们能以一种系统化可理解的方式来探索这个模型。四位专家的前沿研究引发与会学者的强烈反响。

Donald B. Rubin教授做大会特邀报告

颁发学术顾问聘书

CASC的创建和发展得到众多前辈学者的大力支持。Donald B. Rubin院士、Wing Hung Wong院士、耿直教授、刘军教授一直对CASC高度关注,并欣然同意担任学会的学术顾问。在本次会议上,邓柯理事长代表学会给四位顾问颁发聘书。

颁发学术顾问聘书

分会场剪影

本届会议其后的日程由六大模块十九个分会场组成,内容涵盖了统计计算、复杂数据、高维数据、网络分析、时间序列、生物医药、分布理论、统计预测、机器学习等多个话题,来自海内外多所高校和研究机构的专家学者报告研究成果,展开了深入交流。

现场交流

与会人员合影

#post-12007
ntry-header

在大数据的时代背景之下,大数据的普及和数据科学技术的平民化为各行各业的从业人员提出了新的机遇和挑战。为满足各界人士对数据科学技术强烈的学习愿望以及数据科学飞速发展的需求,清华大学统计学研究中心在2018年暑期特别推出“数据科学与大数据技术集训班”,将数据分析的理念、方法与实现技术融为一体,结合数据科学实践,为学生提供了多元化的短期集中培训。

2018年6月29日,清华大学工业工程系统计学研究中心“数据科学与大数据技术集训班”顺利开班。本次集训班为期6天,共计60学时。成功培训来自中国电子科技集团、飞利浦公司、北京积水潭医院等产业界人士以及来自北京大学、北方工业大学、首都经济贸易大学等高校师生逾50人次。

本期集训班由统计学研究中心原班人马倾力打造,课程包括数据分析的统计方法与原理、数据科学的原理与技术、数据科学编程技术与平台、数据科学实战等四大模块,为有志进入数据科学产业的学生及产业界人士奠定了更加坚实的理论和应用基础。同时也为学员提供了全方位的技能训练,以及知识更新和技能提升的机会。

#post-11974
ntry-header

       为了促进人工智能和医学影像的互联互通,提升智能医学影像分析研究的国际影响力,同时为医学影像与人工智能两个领域的专家建立深度战略合作的平台,清华大学统计学研究中心携手广州柏视医疗科技有限公司,于2018年6月15日举办“智能医学影像分析研讨会”。会议由美国普渡大学统计系终身教授朱宇教授以及广州柏视医疗科技有限公司董事长、中山大学数据科学与计算机学院教授陆遥博士共同召集。70余位国内外医学影像和人工智能领域顶尖专家和企业代表出席了本次会议,对医学影像中应用人工智能的思想、方法和实践进行了深度交流,并探讨了行业趋势、典型案例,和技术动态。

哈佛大学统计系终身教授——刘军 致开幕词

广州柏视医疗科技有限公司董事长、中山大学数据科学与计算机学院教授—陆遥博士 特邀报告:医学影像智能分析及其应用

美国伊利诺理工大学副教授—Kenji Suzuki   特邀报告:Deep Learning-based AI in Medical Image Processing and Computer-aided Diagnosis

西门子医疗影像与知识业务科研合作经理—茅海萼  特邀报告:影像医学:结构化与精准化

美国康奈尔大学助理教授—王飞    特邀报告:图卷积网络在医学影像分析中的应用

北京大学副教授—董彬    特邀报告:“Deep Revolution” in Image Restoration and Beyond

美国圣母大学副教授—史弋宇    特邀报告:Quantization of Fully Convolutional Networks for Accurate Biomedical Image Segmentation

美国佐治亚大学教授—马平    特邀报告:Automatic cancer segmentation and detection with a novel machine learning algorithm

飞利浦(中国)投资有限公司解决方案架构师—怀晓晨    特邀报告:IntelliSpace Discovery: One Platform For Clinical Research华南理工大学副教授—吴凯      特邀报告:基于多维度信息融合的精神分裂症人工智能辅助诊断系统

深圳迈瑞生物医疗电子股份有限公司总监—朱磊   特邀报告:迈瑞医疗超声智能化进展

清华大学副教授—孔令杰   特邀报告:Wavefront Engineering For High-speed Volumetric Imaging In Deep Tissue

中国科学院自动化所特聘研究员—谢启伟     特邀报告:脑微观重建研究

南开大学副教授—吴春林    特邀报告:A General Truncated Regularization Framework for Contrast-Preserving Variational Signal and Image Restoration: Motivation and Implementation

美国阿肯色大学副教授—吴敬先     特邀报告:Unsupervised Bayesian Learning of Cancer Detection with THz Imaging

专题讨论主持人朱宇教授

医学影像为医疗提供基础支撑,是临床最重要的诊断依据之一。由于医疗资源配置不均衡、培训的规范性及水平有待提高,基层影像诊断的误诊漏诊率偏高。人工智能技术的发展,尤其是深度学习等新技术在图像和文本分析等领域的融合应用,推动了医学人工智能的快速发展。相信通过本次分析研讨会,能促进人工智能通过和医学技术的结合,赋能影像医学及肿瘤诊疗,实现减少大量简单重复性劳动,辅助医生提升工作效率的现实意义。

与会人员合影

#post-11966
ntry-header

2018年清华大学统计学研究中心优秀大学生夏令营于6月8日至10日成功举行。此次活动吸引了全国各高校超300名本科生报名参加,经过几轮筛选,最终录取了来自清华大学、中国人民大学、南开大学、中国科学技术大学、山东师范大学、西北师范大学等19所高校的36位同学了本次活动。

学术报告 学员考核
颁发证书

#post-11962
ntry-header

为更好地推动国内统计学科的发展,有效促进统计学者之间的交流与合作,同时延续和弘扬北京大学和清华大学两个兄弟院校之间的团结协作传统,“第三届北大-清华统计论坛”于2018年6月3日在北京大学光华管理学院成功举办。本次论坛由北京大学统计科学中心和清华大学统计学研究中心共同举办,来自海内外高校的150余位师生参与了本次论坛。

北京大学商务统计与经济计量系联合系主任、北京大学统计科学中心联席主任陈松蹊教授致开幕词,回顾了北大与清华两校统计学科间合作研究的深厚渊源,同时也表达了对未来的美好愿景。

北京大学统计科学中心讲席教授周晓华教授做特邀报告:Statistical Methods in Precision Medicine。

清华大学统计学研究中心杨立坚教授做特邀报告:Generalized Additive Model: Theory,Methods and Applications over Thirty Years。

随后,北大、清华两校同学进行海报展示,交流、讨论近期的研究成果。

      经两校老师现场考核、评分,北京大学王亚平同学荣获“优秀毕业生奖”,北京大学李伟、清华大学姜瑛恺、张园园荣获“优秀海报奖”。

师生合影

 

#post-11959
ntry-header

2018年5月25日,第十一届中国R会议在北京揭开帷幕,清华大学统计学研究中心副主任邓柯教授受邀出席会议,并在主会场作特邀报告。报告的主题是“统计学与健康中国”。

邓柯教授

 

邓柯教授结合近年来在医疗大数据分析、食品安全监管、卫生技术评估等领域的研究和实践,深入地探讨统计学在实施“健康中国”战略中的巨大机遇与挑战。同时也呼吁更多的统计界学者关注相关的统计学研究与应用,共推统计学发展,使其在落实国家战略中发挥关键作用。

会议现场
  • 邓柯教授简介

邓柯,副教授,清华大学统计学研究中心副主任,博士生导师。2008年获北京大学统计学博士学位,同年进入哈佛大学统计系从事研究工作,历任博士后、副研究员,2013年加入清华大学。2014年当选中国数学会概率统计学会第十届理事会理事,2015年当选中国医疗保健国际交流促进会医学数据与医学计量分会常务委员,2017年当选中国现场统计研究会计算统计分会首任理事长、中国现场统计研究会环境与资源分会常务理事,2018年当选国际计算统计学会亚太地区分会理事。他还获得了“科学中国人(2016)年度人物”的荣誉称号。

#post-11956
ntry-header

会议通知

尊敬的各位同道:

由清华大学统计学研究中心、广州柏视医疗科技有限公司联合主办的智能医学影像分析研讨会将于2018年6月15日在北京清华紫光国际交流中心召开。

医学影像为医疗提供基础支撑,是临床最重要的诊断依据之一。由于医疗资源配置不均衡、培训的规范性及水平有待提高,基层影像诊断的误诊漏诊率偏高。人工智能技术的发展,尤其是深度学习等新技术在图像和文本分析等领域的融合应用,推动了医学人工智能的快速发展。人工智能通过和医学技术的结合,赋能影像医学及肿瘤诊疗, 可减少大量简单重复性劳动, 辅助医生提升工作效率。

本次大会将深入探讨智能医学影像分析的热点问题,邀请国内外医学影像和人工智能领域的顶尖专家和企业代表,共同交流在医学影像中应用人工智能的思想,方法和实践,探讨行业趋势、典型案例,和技术动态,以期建立医学影像专家和人工智能专家间的深度战略合作,促进人工智能和医学影像的互联互通,提升智能医学影像分析研究的国际影响力。

本次大会不收注册费。衷心希望全国医学影像、人工智能的同行共同参与这一学宴,在此谨代表本次大会组委诚挚地邀请您并热切期待您的参与!

 

会议联系:

田女士  清华大学统计学研究中心     010-62786091

刘女士  广州柏视医疗科技有限公司  15300099673

组委会邮箱:stats@tsinghua.edu.cn

 

#post-11948
ntry-header

2018年5月8日,美国Suffolk大学商学院大学生交流访问团到访清华大学统计学研究中心。中心副主任邓柯教授以及杨立坚教授接待访问。几位教授分别从校园生活、学术研究、职业发展等几个方面介绍中心情况,并同来访学生亲切交流。随后我中心研究生姜瑛恺、杨洋、汪子栋、林毓聪作为学生代表向来访学生介绍统计学科的知识体系以及实际应用,并带领访问团学生参观清华校园,体验校园生活。

#post-11946
ntry-header

2018年4月16日,【统计学论坛·特邀报告】在清华大学主楼接待厅成功举办。报告的主讲人是美国国家科学院院士、斯坦福大学统计系王永雄教授。作为清华大学107周年校庆的系列活动之一,王永雄教授的特邀报告从信息发布伊始即受到校内师生的广泛关注,活动现场更是气氛热烈,座无虚席。

报告现场

本次报告的主办单位为清华大学工业工程系统计学研究中心,并由统计学研究中心副主任邓柯副教授担任主持人。报告的题目是Mini-batching in Markov Chain Monte Carlo Inference。

王永雄 教授

王教授首先介绍问题背景。即在抽样问题中,如果目标分布不能很容易地直接抽样,用Markov Chain Monte Carlo (以下简称MCMC) 方法可以有效地解决这个问题。构造一条马氏链,使得它的极限分布是目标分布,迭代多次之后可以近似地得到目标分布的样本。Metropolis-Hastings (MH) 算法是 MCMC 方法中最常用的算法之一。当我们要抽参数的后验分布时,M-H 算法计算 M-H ratio 的时候需要用到全部数据。但是当数据量很大时,这个方法就不会有很高的效率。如果用 mini-batch 的方法,每次只需要计算少量数据的信息,可以有效地提高效率。由此引入了报告主要研究的问题 mini-batch tempered MCMC。

实现这个方法运用了统计学里经典的参数扩张 (parameter augmentation) 的办法。通过构造一个比参数空间更高维的分布,并在这个分布上运用mini-batch M-H 算法,抽到的样本取边缘分布,即可得到我们想要的参数的样本。通过数学方法可以证明,得到样本的极限分布是参数后验分布的一个回火版本 (tempered version)。随机模拟和实际数据两个例子表明,MINi-batch Tempered MCMC (MINT) 算法能得到和 Tempered MCMC 方法类似的样本数据,但是计算和用时方面有显著地提高。

 

第二个问题是由于 MINT 算法抽样得到的样本并不是真的后验分布,只是后验分布升温后的一个版本。如果我们想要得到真实的后验分布的样本,王教授介绍了 equi-energy (EE) sampler的办法(Kou, Zhou and Wong, 2006)。原来的EE方法可以有效地解决分布多峰(multi-mode)的问题,但是对后验分布抽样时,MCMC方法每一步还是需要所有数据的信息。把 MINT 和 EE 方法结合起来,可以得到 MINi-batch Tempered Equi-Energy (MINTEE) 算法。MINT可以有效地从高温分布中抽样;EE方法要求从最高的温度开始,在每个温度中都抽相应的马氏链,并不断更新EE set,最低温分布就是目标分布,可以得到想要的样本。同样地,MINTEE 方法在实际应用中有很高地效率,计算复杂度也比EE方法小。

 

第三部分王教授介绍了 cone move 的方法。在机器学习里面流行的Langevin Dynamics方法,每次马氏链更新的时候,proposal distribution 的期望会沿着梯度方向,而这种方法会使 proposal distribution 的反向概率 (reverse probability) 很小,从而导致 M-H ratio 也非常小,马氏链很难转移出去,抽样效率低。王教授介绍的方法是提出一个新的proposal distribution,空间上像是把两个圆锥反向按顶点接在一起,它在正负梯度上有着相同的概率,这样每次马氏链的转移是可逆的(reversible),效率会更高一些。

 

最后的提问环节,老师和同学们讨论了和 MINT 方法相关的问题:能否把 MINT 方法运用在 Gibbs 抽样的框架之下?MINTEE 方法中,不同温度下的马氏链可不可以在不同温度之间进行转移等等。王教授回答到,在Gibbs抽样中运用mini-batch方法是十分有趣也十分有挑战的问题,期望看到更多的相关的进展。对于后一个问题,在parallel tempering方法中,多条马氏链可以在不同温度之间交换,而在EE sampler方法里,高温的马氏链可以帮助指导或影响低温的马氏链,低温对高温是不会有影响的。

 

世界范围内统计学科顶尖院士的特邀报告是统计学论坛的传统活动,每一学年均如期举办,它为清华的师生提供了一个和学术大咖近距离沟通交流的机会,获得一致好评与称赞。

现场合影
#post-11934
ntry-header

2018年4月14日,医疗大数据与卫生技术评估论坛在文津国际酒店举行,本次论坛由清华大学统计学研究中心医疗大数据中心和国家卫生健康委员会卫生技术评估重点实验室(复旦大学)联合主办。清华大学统计学研究中心的战略合作伙伴——Analysis Group,作为协办单位为本次论坛提供了大力支持。哈佛大学生物统计系系主任林希虹教授,人力资源和社会保障部社会保险事业管理中心熊先军书记,美国国家科学院院士、斯坦福大学王永雄教授,北京大学刘国恩教授,清华大学邓柯副教授,Analysis Group吴琼博士,复旦大学陈英耀教授,北京大学人民医院王杉教授,哈尔滨工业大学王亚东教授课题组刘博副教授,中电数据服务有限公司首席应用官肖辉先生,英国谢菲尔德大学Praveen Thokala教授,清华大学张学工教授,Analysis Group韩思蒙博士,杜兰大学施李正教授,天津大学吴晶教授,国家食品安全风险评估中心风险监测部肖革新副主任等医疗领域学界和业界人士参加了本次论坛,并展开了热烈的讨论。

论坛现场

首先,清华大学统计学研究中心副主任邓柯副教授作为主办方负责人介绍到场嘉宾,并向本次论坛的组织方和出席嘉宾致谢。

林希虹 教授

随着哈佛大学生物统计系系主任林希虹教授的开幕致辞,论坛正式拉开帷幕,林教授列举了数据科学鼎盛时代,医疗领域的几大方向,如人类基因组计划、电子病历数据等,充满挑战和机遇,希望我们能迎难而上,共同将人类医疗向前迈一大步。

熊先军 书记

作为本次论坛正式报告的首位出场专家,人力资源和社会保障部社会保险事业管理中心熊先军书记,根据30年的从业经验,从卫生经济学(PE)是什么切入,论述了卫生经济学在政府决策中的重要作用。

王永雄 教授

随后,美国国家科学院院士、斯坦福大学王永雄教授对电子病历中的精准医学的研究谈了几点自己的思考。从电子病历中抓取的临床数据和人类基因组测序的基因数据有机结合,是未来精准医疗的突破点,国内目前亟需加大财政投入力度,建设人群基因库。

刘国恩 教授

北京大学刘国恩教授从中国2010年之后经济增长缓慢的现象说起,分享了不同学者对经济形势的看法,进而从经济学角度肯定了医疗在未来经济学中的重要地位。

邓柯 副教授

清华大学邓柯副教授则从医学自然语言处理的统计学方法为切入点,介绍了具体的无监督的文本分析方法在电子病历中的成功应用,带大家领略到统计模型在处理医疗电子病历中的重要潜力。

吴琼 博士

业界专家Analysis Group的吴琼博士,介绍了在卫生技术评估中识别最优人群的重要性和具体实现方式,寻找满足最少标准的最大目标人群,对临床试验、决策制定、医疗服务都是非常重要的。

陈英耀 教授

复旦大学陈英耀教授从中国卫生技术评估的发展现状和展望展开设想,从卫生技术面临的挑战和引导案例出发,阐述了卫生技术评估需要综合考虑诸多因素,有效性评价、伦理评价、评估和评审等,最后提出希望未来厘清各方利益关系,通过需求倒逼HTA发展的展望。

王杉 教授

北京大学人民医院的王杉教授作为论坛下午的第一位演讲嘉宾,从实际应用出发,阐明了大数据在医疗领域的应用场景,如达芬奇机器人、智慧人工器官、智慧医政等,并从数据共享和如何有效提取数据方面介绍中国了医疗数据带来的特殊性和挑战性。

张学工 教授

随后,清华大学的张学工教授对中国医疗面临的挑战进行了补充,根据自身的切实体会阐述了中国医疗不够精准和医疗不够普惠的问题,并提出一些建议,希望能改革医疗数据管理制度,从建立健全“个人大数据”和“全民大数据”方面入手,解决医疗大数据共享的法律困境。

肖辉 先生

中电数据服务有限公司首席应用官肖辉先生,首先介绍中电数据的发展现状,主题是大数据、大健康、大发展,围绕惠民、惠企、惠政这一总体规划,数据安全这一核心,希望能通筹建国家公司、地方分公司以及与国外公司合作,促进产业的发展。

Praveen Thokala 教授

来自英国谢菲尔德大学的Praveen Thokala教授则分享了英国的健康技术评估的制度和方法,对我国相关领域的研究和发展有重要的借鉴意义。

刘博 副教授

哈尔滨工业大学王亚东教授课题组的刘博副教授陈述了目前我国基因组研究的现状,分析了大规模基因组快速比对的技术挑战,并介绍了在相关领域的最新成果。

韩思蒙 博士

最后的演讲者是来自Analysis Group的韩思蒙博士,韩博士介绍了医疗大数据在真实世界的应用场景,通过大量案例的分析,总结出了医疗大数据、统计学方法和计算平台的支持是证据产生的重要手段。

圆桌讨论
精彩纷呈的圆桌讨论环节使论坛的气氛达到高潮。参与嘉宾分别是王永雄教授、施李正教授、吴晶教授、肖革新副主任以及肖辉先生,邓柯副教授担任主持人,嘉宾们围绕中国医疗大数据的发展的挑战和机遇问题进行了深入探讨。王永雄教授认为产业和政府需要增强合作,将基因组数据整合起来;吴晶教授提到应将医保融入医疗大数据,加强中外医疗的合作;施李正教授则认为要从政府对人才的需求和提高研究质量方面解决目前的问题;肖辉提到要解决技术方面存在的问题、完善法规和相关体系;肖革新副主任希望从数据质量、数据交流、机制创新、政府决策需要、老百姓和企业的需求方面,提升未来的供给制改革。
       论坛在陈英耀教授的闭幕词中圆满结束。陈教授提到,这次医疗大数据与卫生技术评估论坛是一个多学科多领域参与的盛会,为国际和国内专家交流合作提供了很好的机会,希望这个论坛能继续发展并延续,共同推进医疗和卫生领域的发展。

与会人员合影

 

媒体报道:http://finance.ifeng.com/a/20180420/16161350_0.shtml

(来源:凤凰网)

#post-11933