11月13日,中国人民大学朱利平教授访问我中心并做学术报告:Measuring and testing interval quantile dependence.
11月2日-11月3日,2017杭州统计研讨会(2017 Hangzhou International Statistical Symposium)在美丽的杭州成功举办。论坛由中国计算统计分会主办,清华大学统计学研究中心、浙江大学数学科学学院承办。
本次会议邀请了近50名中国及日本的统计学者,会议学术报告精彩纷呈,涵盖统计理论、方法和应用研究,及大数据分析等多个领域,现场学术气氛热烈。本次会议的成功举办为统计学者提供了良好的学术交流平台,有力地促进了中日统计学界间的学术交流与合作。
附件:会议手册.PDF
10月23日,香港大学李伟强教授访问我中心,并做学术报告:Realized covariance matrices modelling based on the matrix-F distribution.
2017年10月20日,浙江大学副教授黄正行访问我中心并做学术报告:医学临床中的人工智能技术。本次报告分成了两个部分:第一部分是医学人工智能的回顾和总论。在第二部分中,黄教授对医学人工智能的研究现状做了详尽的综述,并提炼出了研究热点分析与展望。
2017年10月16日,中国科学院系统生物学重点实验室执行主任陈洛南教授访问我中心并做学术报告:Quantifying direct associations in a network based on data.
2017年10月09日, 滴滴出行研究院副院长、美国密歇根大学终身教授及密歇根大学大数据研究中心的管理委员会成员叶杰平博士访问我中心,并做学术报告 Big Data at Didi Chuxing.
2017年9月25日,我中心顾问委员会成员,斯坦福大学统计系王永雄教授访问我中心,认真听取了中心研究生汇报近期研究工作的进展,并为大家一一解答了研究过程中遇到的问题,使同学们对自己未来学习中需要努力的方向有了更加明晰的认识。
9月25日,弗吉尼亚大学医学院助理教授臧充之,哈佛大学丹娜法伯癌症研究院研究员李炜,以及德州大学西南医学中心助理教授李博访问我中心并做系列报告:Mini-Symposium on Cancer Computational Biology.
发明名称:
基于统计词典模型的未登录词发现和分词系统及方法
专利号:
201410299453.9
发明人:
邓柯;刘军
授权公告日:
2017年08月15日
摘要:
本发明提供一种基于统计词典模型的未登录词发现和分词方法,应用于计算装置中,该方法包括:接收步骤,接收用户输入的文本;构建步骤一,构建初始词典;构建步骤二,利用EM算法和模型选择技术对初始词典进行筛选以得到最终词典;计算步骤,利用对数似然比统计量来计算最终词典中词汇的统计显著性以得到最终词典中词汇的重要性得分,并根据最终词典中词汇的重要性得分对输入文本中所有识别出来的未登录词由高到低进行排序;分析步骤,根据最终词典,通过计算和分析输入文本的每种分词方式的条件概率来实现对输入文本的分词。