1月9日、1月10日上午,在北院卓远楼305会议室,统计与数学学院成功举办了“2019统计学沙龙暨学科建设咨询会”。宾夕法尼亚州立大学统计系马彦源教授、北卡罗莱纳大学夏洛特分校蒋建成教授、威斯康辛大学麦迪逊分校王亚珍教授、东北师范大学数学与统计学院郑术蓉教授、厦门大学王淳林博士、南方科技大学蒋学军博士应统计与数学学院邀请做了6场精彩的学术报告,并对我校统计学科的建设及发展提出了很多宝贵的建议。本次统计学沙龙暨学科建设咨询会由统计与数学学院院长石磊教授主持,统数学院的师生同参会专家进行了深入的交流。
参会专家的报告内容如下:
宾夕法尼亚州立大学统计系马彦源教授做了题为“一种基于样条的半参方法的非参数测量误差模型”的学术报告,介绍了依托一种完全不同的基于样条的半参方法,马教授的团队构造的一类同时估计密度函数和回归方程均值的非参方法,可以达到与没有测量误差之场合相同的半参收敛速率。带有测量误差的随机变量的概率密度函数的半参估计被认为是极其困难的,原因在于估计的收敛速率严重依赖于测量误差的特性,可能慢到仅仅是样本量的对数。基于相同的原因,带有测量误差的回归方程的估计也可能只有相同的缓慢的收敛速率。传统的基于卷积的方法的收敛速率缓慢,原因在于测量误差密度函数的傅立叶变换会以非常快的速率收敛到零,而该项非常不走运地出现在传统方法表达式的分母上。依托这种完全不同的基于样条的半参方法所构的了一类同时估计密度函数和回归方程均值的非参方法,可以达到与没有测量误差之场合相同的半参收敛速率。
东北师范大学数学与统计学院郑术蓉教授做了题为“高维相关矩阵的检验”的学术报告,报告指出,相关结构的假设检验由于其非常重要的实际用途和一系列理论挑战吸引了非常多的研究的注意。本文聚焦于推导一类适用于高维场合下检验单一样本、两样本、多样本相关结构的一般框架。该框架适用于样本量和变量维数同时趋于无穷的场合,其检验统计量适用于备择假设稠密和稀疏场合。研究团队系统性地考察了统计量在原假设下的渐近分布、功效函数和无偏性。经历了非常困难的理论推导,解决了非独立场合下样本相关矩阵的理论性质等问题。模拟研究和实际数据分析表明这个方法是非常有效的。
厦门大学王淳林博士做了题为“带有零膨胀结构的非负值多重样本的半参推断”的学术报告,报告内容为:在非负多重样本数据中,常常出现高比例的零观测值的情况,而这种情况是非标准的。报告聚焦于针对这类数据结构的非常重要且基础性的统计推断问题。本工作的一个独特特点是目标总体是由一个退化到零点的分布和一个有偏的取正值的成分的混合构成。报告提出了针对这类多重样本的半参数密度比例模型。在半参数框架下,可以在不设定潜在分布的情况下探查所有样本中的信息。报告的第一部分是检验多重样本的异质性,提出了一种基于经验似然比的异质性检验,并证明了该检验统计量在原假设下依分布收敛到chi^2-分布。同时,报告人还提出了一种非参数bootstrap过程。该过程在原假设和备择假设下的相合性也被建立起来。报告的第二部分考察了对于这类多重分布的均值的推断问题,建立了经验似然比统计量。该统计量在一般的原假设下具有chi^2-型极限分布。上述结构构造了一种新的检验,并且向下蕴含均值的等价性检验。报告的最后部分,给出了模拟研究和实际数据分析的一些结果。
南方科技大学数学系蒋学军博士做了题为“回归中基于成对距离的异方差检验”的学术报告,蒋学军博士团队的研究在非线性回归模型中提出了一个异方差非参数检验,该检验基于样本中数据点之间的成对距离。 该检验的检验统计量为一个U统计量, 从而使得U统计量的相关理论可以适用于本问题。检验统计量的渐近零分布较为复杂, 但蒋博士团队的研究可以导出其计算上可行的bootstrap近似, 并证明该bootstrap算法的正确性。该检验方法可以几乎最优速率探测到任何异于原假设的局部备择假设。检验统计量得收敛速率不依赖于协变量的维数, 这将大大削弱维数诅咒带来的影响。讲座最后,蒋博士提供了三个模拟分析和一个真实数据示例, 用于评估所提检验方法的表现并验证其应用价值。
北卡罗莱纳大学夏洛特分校蒋建成教授做了题为“稀疏回归中变量选择的分布式计算”的学术报告。报告主题为基于有限内存约束下的惩罚似然方法,研究海量数据背景下高维回归中的变量选择问题,其中,有限内存约束是指内存仅能存储数据的一个小规模子集。一个自然的策略是将数据分解为一组子集并分别以不同的机器(模型)加以拟合,然后将各个数据子集下所得估计量加以整合,得到选模型。然而,这个方法无法控制伪发现率。本文中,蒋建成教授提出了一个计算上有效的方法来提纯结果,该方法基于带折叠凹惩罚函数的一般似然函数。在参数个数随着样本量增大的情景下,为所得到的估计建立了一些渐近性质。在一些正则条件下,获得了神谕性质和估计的渐近分布。研究团队通过模拟分析评估了所提出的方法。
威斯康辛大学麦迪逊分校王亚珍教授做了题为“金融数据科学中的波动性研究”的学术报告,王教授的研究指出,资产收益的波动性问题是资产定价、证券投资组合及风险管理的理论和实践中的核心问题。在金融经济学中,基于布莱克-斯科尔斯、扩散、GARCH、随机波动模型和期权价格隐含波动率,日水平波动的建模和预测得到了广泛的研究。在当今时代,幸赖于技术革新,我们可以从各地区市场的各种金融工具(交易工具)的平台上获得各种高频金融数据,规模上则涵盖从交易个体的买卖出价到其总体分布等。高频数据的可获得性激发了对于更好的波动性分析的研究兴趣。本报告包括低频和高频金融数据的统计分析,将展示报告人在基于高频和低频联合数据的波动性分析方面的近期工作。
参会专家简介:
马彦源教授,麻省理工博士,宾夕法尼亚州立大学统计系教授,主要研究方向是半参数方法,测量误差模型,已经在Journal of the Royal Statistical Society, Series B, Annals of Statistics, Journal of the American Statistical Association, Biometrika, Journal of Econometrics 等国际统计学、计量经济学顶级期刊发表论文四十余篇。是国际顶级统计系期刊Journal of the American Statistical Association和Biometrics的副主编。
蒋建成教授,北卡罗莱纳大学夏洛特分校教授,统计学研究生事务处主任,南开大学讲座教授,《Statistica Sinica》《Artificial intelligence-AI in finance》等期刊副主编。
王亚珍教授,现任威斯康辛大学麦迪逊分校的统计学教授,并于2015年至2018年担任该校统计系主任。他于1992年获得加州大学伯克利分校统计学博士学位(Ph.D.),现为美国统计学会(ASA)和国际数理统计学会(IMS)会士(fellow),并担任美国国家科学基金会(NSF)项目主持人;美国统计学会(ASA)、国际数理统计学会(IMS)和泛华统计学会(ICSA)多个委员会委员;学术期刊《Statistica Sinica》和《Statistics and Its Interface》的主编;《Annals of Statistics》 《Annals of Applied Statistics》《Journal of the American Statistical Association》 《Journal of Business & Economic Statistics》《Statistica Sinica》《Econometrics Journal》的副主编。研究领域包括金融计量经济学、统计机器学习、量子计算、高维统计推断、非参数曲线估计、小波和多尺度方法、变点分析、长记忆过程、序限制推断。
郑术蓉教授,东北师范大学数学与统计学院教授,博导,主要从事高维数据分析、大维随机矩阵、不对称系数的研究。曾完成国家自然科学基金面上项目、青年项目各1项,现正主持国家自然科学基金优秀青年基金1项。在Journal of the American Statistical Association、Annals of Statistics、Biometrika、Bioinformatics等顶级统计学期刊上发表论文数十篇。出版图书章节两章。在高等教育出版社以及Cambridge University Press合作出版中、英文著作各一部。博士论文《线性不等式约束下的EM算法》曾分别获得“2006年吉林省优秀博士论文”和“2006年全国优秀博士论文提名”。
王淳林博士,加拿大滑铁卢大学统计学博士(2017),自2017年8月起任厦门大学经济学院统计系与王亚南经济研究院助理教授。他的主要研究方向包括经验似然,bootstrap方法,带约束的统计推断,半参数与非参数统计推断等。近年来研究成果发表于Computational Statistics and Data Analysis,Journal of Multivariate Analysis等统计学期刊。
蒋学军博士,南方科技大学数学系助理教授,博士生导师,支部书记。2009年博士毕业于香港中文大学,10-13年任职中南财经政法大学副教授,13年07月加入南方科技大学,入选深圳市海外高层次人才孔雀计划,深圳市优秀教师,南方科技大学杰出教学奖(2018),主持有国家自然科学基金(青年,面上)、广东省自然科学基金(2项)、深圳市科创委项目、深圳市技术委托开发项目、广东省教学改革项目等。蒋博士主要从事金融统计与计量、分位数回归、变量选择、高维数据降维,生存分析及贝叶斯应用等研究工作。已在统计学主流期刊和相关金融、经济等交叉学科期刊上发表SCI&SSCI论文40余篇。