发散维度下若干复杂模型的加权平均估计_邹家辉著，张宝学，裴艳波编_9787523001059

　　《发散维度下若干复杂模型的加权平均估计》第1章给出了模型平均方法的研究背景和研究现状。在第2章中基于Stein引理和似然函数，针对发散维度的Poisson回归模型提出了一种具有无偏性的**权重选取准则。在候选模型全被误设的情形下，本章证明了模型平均估计的渐近**性，在候选模型集合中包含正确模型的情况下，证明了参数模型平均估计的相合性。特别地，在该研究中候选模型的维数以及个数都可以随着样本量的增加而增加，故该模型平均方法能够处理发散维度数据的情形。
　　针对单指标模型，《发散维度下若干复杂模型的加权平均估计》第3章基于交叉验证方法提出了**权重的选取准则，为了更好地利用不同形式的连接函数并提升整合后模型的预测能力，这里的权重聚焦于候选模型的预测值而非参数的估计。在允许协变量和候选模型个数可以发散的情形下，本章给出了模型平均估计渐近**性的结论，当候选模型集合中存在正确模型时证明了权重值将渐近地全部分配在这些正确模型上，为了处理协变量维数大于样本量的情形，本章还提出了基于正则化的模型平均方法并证明了渐近**性。第4章考虑到支撑向量机模型可以很好地应用于高维分类数据，利用模型平均方法处理了该模型在变量选择上的不确定性并提高了分类精度。为了减轻计算负担，还提供了一种包含预筛选过程的模型平均算法，并证明了该模型平均估计在hinge风险意义下的渐近**性。第5章提出了许多需要进一步研究的问题。《发散维度下若干复杂模型的加权平均估计》除了理论研究之外，还进行了大量的模拟研究并将模型平均方法应用于经济相关领域，其结果表明《发散维度下若干复杂模型的加权平均估计》中所提出的模型平均方法在预测能力以及稳健性上常常优于其他常见的模型选择/平均方法。

　　模型平均是处理模型不确定性的一种重要方法，通过给不同的候选模型赋予不同的权重来提升整合后模型的稳健性和预测能力。在近几十年间被国内外众多学者进行了广泛的理论研究，其应用领域也遍布统计学、经济学、生物医学等等。随着大数据时代的到来，发散维度和高维数据给模型平均的研究带来了新的挑战和机遇，然而模型平均在这方面的研究工作相对较少。故此，本书将聚焦于发散维度和高维情形下的模型平均理论研究。
　　本书第1章给出了模型平均方法的研究背景和研究现状。在第2章中基于Stein引理和似然函数，针对发散维度的Poisson回归模型提出了一种具有无偏性的最优权重选取准则。在候选模型全被误设的情形下，本章证明了模型平均估计的渐近最优性，在候选模型集合中包含正确模型的情况下，证明了参数模型平均估计的相合性。特别地，在该研究中候选模型的维数以及个数都可以随着样本量的增加而增加，故该模型平均方法能够处理发散维度数据的情形。针对单指标模型，本书第3章基于交叉验证方法提出了最优权重的选取准则，为了更好地利用不同形式的连接函数并提升整合后模型的预测能力，这里的权重聚焦于候选模型的预测值而非参数的估计。在允许协变量和候选模型个数可以发散的情形下，本章给出了模型平均估计渐近最优性的结论，当候选模型集合中存在正确模型时证明了权重值将渐近地全部分配在这些正确模型上，为了处理协变量维数大于样本量的情形，本章还提出了基于正则化的模型平均方法并证明了渐近最优性。第4章考虑到支撑向量机模型可以很好地应用于高维分类数据，利用模型平均方法处理了该模型在变量选择上的不确定性并提高了分类精度。为了减轻计算负担，还提供了一种包含预筛选过程的模型平均算法，并证明了该模型平均估计在hinge风险意义下的渐近最优性。第5章提出了许多需要进一步研究的问题。本书除了理论研究之外，还进行了大量的模拟研究并将模型平均方法应用于经济相关领域，其结果表明本书中所提出的最优模型平均方法在预测能力以及稳健性上常常优于其他常见的模型选择/平均方法。
　　本书的撰写得到了首都师范大学邹国华教授和中国科学院张新雨研究员的指导和建议，也得到了首都经济贸易大学统计学院及国家自然科学基金青年项目（编号：12201431）的资助。
　　由于时间仓促及作者的水平有限，书中的错误和缺点在所难免，希望广大读者给予批评指正。

你还可能感兴趣

我要评论