《发散维度下若干复杂模型的加权平均估计》第1章给出了模型平均方法的研究背景和研究现状。在第2章中基于Stein引理和似然函数,针对发散维度的Poisson回归模型提出了一种具有无偏性的**权重选取准则。在候选模型全被误设的情形下,本章证明了模型平均估计的渐近**性,在候选模型集合中包含正确模型的情况下,证明了参数模型平均估计的相合性。特别地,在该研究中候选模型的维数以及个数都可以随着样本量的增加而增加,故该模型平均方法能够处理发散维度数据的情形。
针对单指标模型,《发散维度下若干复杂模型的加权平均估计》第3章基于交叉验证方法提出了**权重的选取准则,为了更好地利用不同形式的连接函数并提升整合后模型的预测能力,这里的权重聚焦于候选模型的预测值而非参数的估计。在允许协变量和候选模型个数可以发散的情形下,本章给出了模型平均估计渐近**性的结论,当候选模型集合中存在正确模型时证明了权重值将渐近地全部分配在这些正确模型上,为了处理协变量维数大于样本量的情形,本章还提出了基于正则化的模型平均方法并证明了渐近**性。第4章考虑到支撑向量机模型可以很好地应用于高维分类数据,利用模型平均方法处理了该模型在变量选择上的不确定性并提高了分类精度。为了减轻计算负担,还提供了一种包含预筛选过程的模型平均算法,并证明了该模型平均估计在hinge风险意义下的渐近**性。第5章提出了许多需要进一步研究的问题。《发散维度下若干复杂模型的加权平均估计》除了理论研究之外,还进行了大量的模拟研究并将模型平均方法应用于经济相关领域,其结果表明《发散维度下若干复杂模型的加权平均估计》中所提出的模型平均方法在预测能力以及稳健性上常常优于其他常见的模型选择/平均方法。
模型平均是处理模型不确定性的一种重要方法,通过给不同的候选模型赋予不同的权重来提升整合后模型的稳健性和预测能力。在近几十年间被国内外众多学者进行了广泛的理论研究,其应用领域也遍布统计学、经济学、生物医学等等。随着大数据时代的到来,发散维度和高维数据给模型平均的研究带来了新的挑战和机遇,然而模型平均在这方面的研究工作相对较少。故此,本书将聚焦于发散维度和高维情形下的模型平均理论研究。
本书第1章给出了模型平均方法的研究背景和研究现状。在第2章中基于Stein引理和似然函数,针对发散维度的Poisson回归模型提出了一种具有无偏性的最优权重选取准则。在候选模型全被误设的情形下,本章证明了模型平均估计的渐近最优性,在候选模型集合中包含正确模型的情况下,证明了参数模型平均估计的相合性。特别地,在该研究中候选模型的维数以及个数都可以随着样本量的增加而增加,故该模型平均方法能够处理发散维度数据的情形。针对单指标模型,本书第3章基于交叉验证方法提出了最优权重的选取准则,为了更好地利用不同形式的连接函数并提升整合后模型的预测能力,这里的权重聚焦于候选模型的预测值而非参数的估计。在允许协变量和候选模型个数可以发散的情形下,本章给出了模型平均估计渐近最优性的结论,当候选模型集合中存在正确模型时证明了权重值将渐近地全部分配在这些正确模型上,为了处理协变量维数大于样本量的情形,本章还提出了基于正则化的模型平均方法并证明了渐近最优性。第4章考虑到支撑向量机模型可以很好地应用于高维分类数据,利用模型平均方法处理了该模型在变量选择上的不确定性并提高了分类精度。为了减轻计算负担,还提供了一种包含预筛选过程的模型平均算法,并证明了该模型平均估计在hinge风险意义下的渐近最优性。第5章提出了许多需要进一步研究的问题。本书除了理论研究之外,还进行了大量的模拟研究并将模型平均方法应用于经济相关领域,其结果表明本书中所提出的最优模型平均方法在预测能力以及稳健性上常常优于其他常见的模型选择/平均方法。
本书的撰写得到了首都师范大学邹国华教授和中国科学院张新雨研究员的指导和建议,也得到了首都经济贸易大学统计学院及国家自然科学基金青年项目(编号:12201431)的资助。
由于时间仓促及作者的水平有限,书中的错误和缺点在所难免,希望广大读者给予批评指正。
邹家辉,首都经济贸易大学统计学院讲师,中国科学院数学与系统科学研究院博士,香港城市大学访问学者。研究方向包括:模型平均、集成学习、子抽样。在Econometnc Reviews,IEEE Transactions on Information Theory,Journal of Systems Science and Complexity等期刊以及会议AISTATS上发表多篇学术论文,并主持一项国家自然科学基金青年项目。
第1章 绪论
1.1 研究背景
1.2 研究现状
1.3 本书主要内容与创新点
第2章 发散维度Poisson回归模型的模型平均方法
2.1 引言
2.2 模型框架与估计
2.2.1 Poisson回归的模型平均估计
2.2.2 权重选取准则
2.3 渐近性质
2.3.1 渐近最优性
2.3.2 回归系数平均估计的相合性
2.3.3 高维模型的模型平均方法
2.4 蒙特卡洛模拟
2.4.1 模拟的设计和实施
2.4.2 模拟结果
2.5 飞行员CEO和企业创新能力的关系
2.6 总结
2.7 附录
2.7.1 相关引理及证明
2.7.2 定理2.1的证明
2.7.3 定理2.2的证明
2.7.4 实际数据的其他结果
第3章 发散维度的单指标模型的模型平均方法
3.1 引言
3.2 模型框架与估计
3.2.1 单指标模型的模型平均方法
3.2.2 模型平均框架
3.3 渐近性质
3.3.1 渐近最优性
3.3.2 权重的收敛性
3.4 基于正则化条件和预筛选的模型平均方法
3.4.1 正则化的模型平均估计
3.4.2 基于预筛选的模型平均方法
3.5 模拟研究
3.5.1 模拟设置
3.5.2 比较方法与评价指标
3.5.3 模拟结果
3.5.4 高维情况的设计
3.6 实际例子的结果
3.6.1 金融发展与收入分布
3.6.2 公司的销售增长
3.7 总结
3.8 附录
3.8.1 推论3.2所需的条件
3.8.2 相关引理及证明
3.8.3 定理3.1的证明
3.8.4 定理3.2的证明
3.8.5 推论3.1的证明
3.8.6 推论3.2的证明
……
第4章 支撑向量机的模型平均方法
第5章 总结与展望
参考文献