【学术活动】北京大学周晓华教授访问我中心并做学术报告

ntry-header

2017年11月27日，【统计学论坛·特邀报告】在清华大学伟清楼209成功举办。报告邀请到北京大学兼华盛顿大学生物统计系周晓华教授。周教授身兼北京大学北京国际数学研究中心生物统计及生物信息实验室主任，北京大数据研究院中医大数据中心主任，北京大学医疗与健康大数据中心副主任等多个职位。周晓华教授的研究主要集中在医学检验、因果推断分析、缺失数据、脑科学、卫生经济卫生服务等领域，致力于发展新的统计方法。本次报告由清华大学统计学研究中心邓柯副教授主持。

本次报告由清华大学统计学研究中心邓柯副教授主持。

报告的主题是“在对照组异构的随机化试验中，对二值响应变量的因果推断”。

周教授首先介绍了问题的背景。在因果推断中，一个常用的假设是个体处理效应稳定假设(Stable Unit Treatment Value Assumption, SUTVA)。SUTVA假定每个个体的潜在变量值(potential outcome)不会受到其他个体的处理分配(treatment assignment)的影响，并且要求对任一个体，每种处理不能有多种版本。通常假定只有试验组和对照组，并且每组只有一个版本。在有些实际情况中，要求对照组的个体不接受治疗是不现实的。相反，他们会选择不治疗或接受不同版本的治疗。这样原来的假设就不成立，也导致了对照组异构的现象。

周教授结合实际，以“自闭症治疗方案的因果推断问题”为切入点，对个体进行分类讨论并对数据建模。分配到试验组的个体有选择治疗和不选择治疗两种情况。而对照组的个体分成3种：不接受治疗，接受和试验组治疗方案一样的治疗，以及接受其他治疗方案。

周教授指出，治疗方案的因果效应在统计学意义下是不可识别的，原因是参数的个数较多。但是如果用一些不等式约束，把不可识别的参数消去，则可以得到因果效应的估计值的上下界。由此，在得到的区间是有信息的情况下，可以得出治疗方案是有作用的结论。

在提问环节，与会学者提出了若干可以推广问题的想法：1. 把响应变量扩展到实数空间(连续型变量)。2. 加上协变量(covariate)可以对估计更精准。3. 估计因果效应的上下界本质上是个优化问题，即在可行域内求解因果效应的最大最小值。希望以此切入，引发统计学科进一步深刻的研究和思考。

#post-11908

ntry-header

2017年11月24日，【统计学论坛·特邀报告】在清华大学伟清楼209成功举办。报告邀请到复旦大学统计系朱仲义教授。这次报告由清华大学统计学研究中心杨立坚教授主持。

本次报告的主题是“基于分位数回归的面板数据的聚类”。朱教授首先提出，在面板数据分析中，我们经常用固定效应(fixed effect)来刻画个体效应。根据假设个体斜率(slope)是齐次(homogeneous)的，来改善斜率的估计。然而,无论是在统计学中，还是在经济领域，将齐次的斜率(slope)分组，此限制条件较为苛刻。其次，朱教授介绍了在面板数据分析中有很多方法可以将斜率分组来解释，比如：混合模型(mixed model)，加罚模型(penalized model)，K-means方法等。与条件均值模型(mean model)比较而言,分位数回归缺少可加性，处理起来相对困难。他还补充介绍了面板数据和纵向数据的区别和联系。接着，朱教授详细介绍了利用面板数据模型对个体分组(类似于聚类)，他指出，这种方法的难度在于处理内生的固定效应(fixed effect)项，如果忽略这个因素则估计有偏。他提出了一种类似K-means的方法来对个体分组。这是一种新的两步法迭代算法，利用复合分位数进行聚类，充分利用不同分位数的信息，找到一最佳分位数进行分组。该算法第一步：先估计每个个体，处理固定效应项；第二步：分组后对系数最小化目标函数。

最后，朱教授给出了参数估计量的渐进理论性质，并且展示了其在模拟数据和实际经济增长数据中的表现。

#post-11907

ntry-header

#post-11906

ntry-header

#post-11905

ntry-header

2017年11月20日，【统计学论坛·特邀报告】在清华大学伟清楼209成功举办。本次报告邀请到前香港中文大学大学秘书长、中国文化研究所所长陈方正先生。报告由清华大学统计学研究中心副教授李东主持。

本次报告的主题为“构建中国古代电子文献库”。

首先，陈先生介绍了建立电子文献库的目标与历史梗概：1967年，中国文化研究所成立；1986年陈先生参与其中；1988-2002年，研究所完成了传世文献（先秦两汉）的电子化；1996-2002年，研究所完成了出土文献（简帛、金文、甲骨文）的电子化。然后，陈先生介绍了他在任中国文化研究所所长期间，两支分别由刘殿爵先生和饶宗颐先生主持的传世文献计划和出土文献计划的团队人员和分工情况，以及两支队伍开展的一系列具体工作和其中所遇到的各种困难。接着，陈先生分别介绍了两支团队在1988-2002年间所取得的成果。陈先生还展示了传世文献的字数、字频等统计特征和《论语》逐字索引，以及由出土文献团队编成的《殷周金文集成译文》和《甲骨文字形表》样例。

最后，陈先生分享了他对整个计划的回顾与反思，回忆了其间协调各方面专家学者共同合作而做出的努力，简谈了整个计划对中国古代文化研究的意义。

#post-11904

ntry-header

为了促进国内青年统计和数据科学学者间的学术交流和合作，更好地推动统计学和数据科学的发展，同时加强与国内外各兄弟院校之间的协同合作，清华大学统计学研究中心于2017年11月17日-19日在京召开“2017清华大学青年统计学者论坛” (2017 Tsinghua Symposium on Statistics and Data Science for Young Scholars)。

#post-11903

ntry-header

#post-11902

ntry-header

2017年11月13日，中国物联网应用与推进联盟——清华大学统计学研究中心合作研讨会在清华大学舜德楼顺利召开，会议就双方合作可能性进行深入探讨。参加会议的专家学者结合新时代智能交通重点“中国铁路改革发展方向与基础——智能铁路策划”和大数据的整体概况以及清华大学统计研究中心的研究方向深度剖析，纵向挖掘。旨在通过此次座谈，能切合实际的把数据统计学科最前沿的理论、最先进的技术应用到智能交通和智能铁路建设的实践当中。

座谈会现场

此次会议由清华大学统计学研究中心副主任邓柯副教授和铁道部信息中心原党委书记兼主任、中国物联网应用与推进联盟理事长吴建中共同主持。来自中国物联网应用与推进联盟、铁总信息中心、清华大学统计学研究中心、清华大学数学系、清华大学工业工程系、紫光软件系统有限公司以及恩普特科技股份有限公司的近30名专家学者出席了此次会议。

座谈会现场

首先，吴建中理事长介绍了智能交通和智能铁路的发展概况，以及所面临的特殊形势，并进一步提出新一轮运输业改革发展的方向和高铁运输安全控制及新的“客货并重”的概念。他指出“智能铁路”是新时代中国铁路改革与发展的基础，要用人工智能手段来推动中国铁路改革。

吴建中理事长

随后，中国铁路总公司信息中心总工程师孙远运介绍了现阶段铁路总公司的总体规划，并提出铁路大数据应用可以从促进铁路业务增长、优化铁路运输效率、降低铁路运输成本、提高铁路安全系数以及提升铁路运输的服务质量五个方面切入。

孙远运总工程师

中国物联网应用与推进联盟专家组组长刘二宅则提到，安全和效益问题是高铁改革的主导方向，要通过铁路系统的智能优化形成高效率运营并实现新发展。

刘二宅组长

清华大学工业工程系党委书记李志忠教授阐述了运营物流、铁路运输和工业工程的天然联系，清华-青岛数据科学研究院执行副院长韩亦舜介绍了清华大学数据科学研究院的发展现状。紫光软件系统有限公司总经理章雷、恩普特科技股份有限公司营销总经理邵海霞分别介绍了公司的主营业务和核心技术，他们也都表示希望能通过这次会议与高校以及交通运输产业、中国物联网应用与产业联盟建立更加广泛深入的合作。