3月26日上午,由beat365平台主办的青年统计学者论坛系列学术讲座之三在中原楼7楼会议室成功举办。本场讲座共分两部分,分别由beat365平台统计学系焦雨领副教授、beat365平台余吉昌博士主持。本次讲座邀请到了国内统计学领域的多位专家与优秀青年学者的参加,旨在提供交流合作的平台。
首先来自中山大学的王学钦教授给我们带来题为“Sure Independence Screening Adjusted for Confounding Covariates with Ultrahigh Dimensional Data ”的报告,王教授认为在候选基因变异的检验过程中经常会遇到一些干扰性问题,尤其是对于超高维数据来说,这些干扰变量的存在不仅会降低统计功效,而且可能会引入虚假遗传相关性,王在报告中他通过CDC-SIS方法对模型中存在的该问题进行了解决,王教授认为该方法在实际运用中具有更大的灵活性。
中国人民大学尹建鑫副教授的讲座主题为“Large Dimensional Penalized Maximum Likelihood Estimation and Variable Selection in Geostatistics”他向我们介绍对于高维空间数据的分析,在高斯过程的空间线性模型中会面临相关变量的选择和参数估计的问题,在此报告中,尹副教授分别使用最小惩罚二乘估计和最大惩罚似然估计进行了相关介绍。
华东师范大学於州副教授的报告主题为“WIRE:A New Approach For Dimension Reduction and Variable Selection for Multiple Response Data”,於副教授首先向我们介绍了降维的相关知识,之后,他向我们展示了一种对于处理多重响应变量的降维和变量选择的新方法,即WIRE法。
首都师范大学周洁博士给我们带来的报告为“An Inference on Cumulative Markers with Informative Occurrence Times and Terminal Event”,对于纵向数据和标记数据,他介绍说两者是存在区别的,纵向数据的关注点通常在于均值,而对于标记数据,通常研究其累积结果,周博士通过对以往研究的梳理建立联立模型,对估计量的渐进性质进行了详细的解释。
华中师范大学晏挺副教授向我们报告了“A Goodness-of-fit Test for the Highest Dimensional Stochastic Block Model”,他认为建立随机块模型对于发现网络数据中的社团结构,是一种非常有效的方法,而其中一个最根本的问题是如何进行拟合优度检验。
至此,本场讲座的上半部分结束,老师们进入短暂的茶歇时间,在进行学术交流的同时适当的放松身心。
下半场的讲座由beat365平台的余吉昌博士主持。
来自北京大学的助理教授林伟以“Low-Rank Recovery from Large Count Data”题,首先向我们详细讲述了两类数据,微生物相关数据与文本数据,对于微生物数据,它具有稀少性,存在很多零变量值,对于处理这些零变量,通常的方法是在模型中加入常数项等,本报告中,林伟主要想我们介绍了低秩矩阵复原计数的方法来解决此类数据。
西南财经大学常晋源副教授向我们做题为“Testing for High-Dimensional White Noise Using Maximum Cross Correlations”的报告,他向我们展示了如何使用最大交*相关来对高维白噪声进行检验,并指出,相对于传统的白噪声检验,这种检验方法具有更好的统计特性与应用范围。
首都师范大学胡涛副教授报告了“Regression Analysis of Current Status Data in the Presence of A Cured Subgroup and Dependent Censoring”,对于当前状态数据,他介绍说,当前状态数据属于失效时间数据的一种,通常出现在肿瘤遗传性实验中与流行病学调查中等,胡副教授通过对以往学者研究的回顾,使用回归分析法对于存在相依删失数据的情况进行了分析。
复旦大学高凤楠助理教授的报告主题为“On the Statistical Estimation of Preferential Attachment Model ”,他首先向我们展示了两种网络结构,指数网络与无标度网络,指出PA网络模型对于社会网络、合作网络等是一种比较广泛的建模方式,此外,对于PA模型,他还对相关统计参数问题进行了解释。
上海财经大学刘旭助理教授的报告题目为“Integrative Analysis of Genetical Genomics Data Incorporating Network Structures ”,他介绍说,对于传统基因遗传数据,通常使用QTL与eQTL方法研究,但是使用传统线性模型时,基因数据中存在的干扰数据可能会影响基因表达,因此他结合了工具变量利用网络结构来建立模型,并依此来改善估计结果。
今天上午的讲座至此已经结束,在上述十场报告中,在场的师生不时被各位教授广博精深的学问所感染,各位教授对师生提出的问题进行了详细的讲解,希望接下来的系列讲座能够举办的更加成功。