本书内容涉及金融学中的统计模型和数据分析的诸多内容,与一般偏重于单纯介绍理论知识和模型的著作不同,它把统计模型和金融模型联系在一起,寓统计学知识于金融学之中,并且用R软件做出了完美的应用程序。主要内容包括收益、固定收益证券、探索性数据分析、建模一元分布、再抽样、多元统计模型、Copulas、时间序列模型、证券投资组合理论、回归、协整分析、固定资产定价模型、因子模型和主成分分析、GARCH模型、风险管理、贝叶斯数据分析和MCMC、非参数回归和样条。
前言本书是我在康奈尔大学教授金融工程研究生“金融工程统计”这一课程期间撰写完成的.这些学生原本已有投资组合管理、固定收益证券、期货、随机微积分等知识基础,因此我着重讲解了本书第4~9章和第17~20章的内容,包括统计学、数据分析和R软件的操作等.这些章节对于一个学期的课时来说已经绰绰有余.我在课程中并没有涉及回归(第12~14章、第21章)和第10章更为高级的时间序列,因为这些内容已包含在其他课程中.在过去,我选择不讲解协整分析的内容(第15章),但我会在今后的课程中讲解.由于金融工程的研究生会把第三个学期的大部分时间运用在投资银行或对冲基金这样的课题项目上.作为几个项目的指导教师,我认识到也有必要介绍协整分析的内容.本书也可以作为其他学科的教材使用.要讲授本书的大部分内容,一般需要两个学期的课时.一学期需要着重讲解金融知识,可以选择第11章和第16章关于投资组合以及CAPM的内容,而忽略一些统计内容,例如第8章、第18章和第20章关于copula模型、GARCH模型和贝叶斯统计的内容.有些熟悉我出版的《Statistics and Finance: An Introduction》一书的读者可能会问这两本书有何不同.本书相比较早出版的书来说内容进一步深化了,并且更广泛地涉及统计学的知识.正如书名所示,本书更注重实际的数据分析而非仅仅是一本导论.第8章、第15章、第20章中引入了一些新的知识:copula函数、协整分析、贝叶斯统计.除了一些数据与《Statistics and Finance: An Introduction》有类同之外,本书完全使用R软件处理计算、数据分析、绘图等工作,而前书则使用SAS和MATLAB软件.书中几乎全部案例的相关数据都能在R数据库中找到,因此读者可以自行再现这些案例.在第20章中,执行马尔可夫链蒙特卡罗过程时R软件需要安装R2WinBUGS软件包来执行WinBUGS这一命令.本书与前书有一些重叠之处,尤其在第2章、第3章、第9章、第11~13章、第16章中有许多内容是从前书中借鉴而来的.而与《Statistics and Finance: An Introduction》不同的是,本书并没有涉及期货定价和行为经济学的内容.阅读本书之前,最好掌握一定量的微积分、向量、矩阵、概率论和随机过程以及统计学的知识,达到金融工程、数学、统计学等相关专业大三或大四学生的专业知识水平.本书提供一个附录来帮助读者回顾一些概率论与统计学的内容,但附录意在给予参考而无法帮助零基础的同学熟悉这些知识.同时,也建议读者具备一定程度的计算编程能力,具备一些金融的基本概念也会有所帮助.本书并不会讲解R软件如何编程,但每章都有一个“R实验室”来处理和模拟数据.学生可以通过这些内容和R软件的帮助手册《An Introduction to R》学习更多关于R软件函数相关内容(帮助手册可以在CRAN网站上找到,也可以通过R的在线帮助获得).另外,本书也会对案例中用到的那些R函数进行讲解.有时R代码会用于介绍一些分析过程,例如第11章中使用二次规划寻找切线资产组合的案例.对于有意使用R软件的读者,每章最后的文献注记中介绍了一些R相关书目.我的“金融工程统计”课程的学生对R软件的了解程度不尽相同.有精通R编程的学生,同时也有零基础的学生,但大部分学生之前都接触过其他编程语言.对于那些之前没有接触过R软件的学生,一般需要老师的帮助来熟悉R实验室的操作,而自学的学生也最好先对R有一定了解,之后再尝试了解书中的案例.David Ruppert于纽约伊萨卡岛2010年7月
David Ruppert 康奈尔大学运筹学和信息工程学院统计科学教授、Andrew Schultz, Jr.工程学教授,主要讲授统计学、金融工程等课程。他的研究领域包括渐近理论、半参数回归、函数型数据分析、生物统计、模型校准、度量误差和天文统计学。Ruppert教授拥有密歇根州立大学统计学博士学位,是美国统计协会和数理统计协会会员,并曾获得 Wilcoxon奖。 Ruppert教授发表了100多篇科技论文,撰写了4部著作: 《Transformation and Weighting in Regression》 《Measurement Error in Nonlinear Models》《Semiparametric Regression》和《 Statistics and Finance: An Introduction》。
目录
前言
第1章引言
1.1文献注记
1.2参考文献
第2章收益
2.1引言
2.1.1净收益率
2.1.2总收益率
2.1.3对数收益率
2.1.4股息调整
2.2随机游走模型
2.2.1随机游走
2.2.2几何随机游走
2.2.3对数价格是对数正态的几何随机游走吗
2.3文献注记
2.4参考文献
2.5R实验室
2.5.1数据分析
2.5.2模拟
2.6习题
第3章固定收入证券
3.1引言
3.2零息债券
3.3有息票债券
3.4到期收益率
3.4.1计算到期收益率的一般方法
3.4.2即期汇率
3.5期限结构
3.5.1引言:利率取决于到期时间
3.5.2期限结构的描述
3.6连续复利
3.7连续的远期利率
3.8价格对收益率的敏感性
3.9文献注记
3.10参考文献
3.11R实验室
3.11.1计算到期收益
3.11.2 绘制收益曲线
3.12习题
第4章探索性数据分析
4.1引言
4.2直方图和核密度估计
4.3顺序统计量、样本CDF与样本分位数
4.3.1样本分位数的中心极限定理
4.3.2正态概率图
4.3.3半正态图
4.3.4QQ图
4.4正态性检验
4.5箱形图
4.6数据变换
4.7变换几何
4.8变换核密度估计
4.9文献注记
4.10参考文献
4.11R实验室
4.12习题
第5章单变量分布建模
5.1引言
5.2参数模型与简约性
5.3位置参数、尺度参数和形状参数
5.4偏度、峰度和矩
5.4.1JarqueBera检验
5.4.2矩
5.5重尾分布
5.5.1指数和多项式尾部
5.5.2t分布
5.5.3混合模型
5.6广义误差分布
5.7从对称分布创建偏度
5.8基于分位数的位置、尺度和形状参数
5.9最大似然估计
5.10MLE的Fisher信息和中心极限定理
5.11似然比检验
5.12AIC与BIC
5.13验证数据和交叉验证
5.14由最大似然法拟合分布
5.15剖面似然
5.16稳健估计
5.17带有参数变换的变换核密度估计
5.18文献注记
5.19参考文献
5.20R实验室
5.20.1收入数据
5.20.2DAX收益
5.21习题
第6章再抽样
6.1引言
6.2偏差、标准差和MSE的自助法估计
6.3自助法置信区间
6.3.1正态近似区间
6.3.2自助法t区间
6.3.3基本的自助法区间
6.3.4百分位数置信区间
6.4文献注记
6.5参考文献
6.6R实验室
6.7习题
第7章多元统计模型
7.1引言
7.2协方差和相关矩阵
7.3随机变量的线性函数
7.3.1两个或更多随机变量的线性组合
7.3.2独立与和的方差
7.4散点图矩阵
7.5多元正态分布
7.6多元t分布
7.7用最大似然来拟合多元t分布
7.8椭圆轮廓密度
7.9多元有偏t分布
7.10Fisher信息矩阵
7.11多元数据自助法
7.12文献注记
7.13参考文献
7.14R实验室
7.14.1股票收益
7.14.2拟合多元t分布
7.14.3拟合一个二元t分布
7.15习题
第8章copula
8.1引言
8.2特殊copula
8.3高斯copula和tcopula
8.4阿基米德copula
8.4.1弗兰克copula
8.4.2Clayton copula
8.4.3Gumbel copula
8.5秩相关
8.5.1肯德尔的tau相关系数
8.5.2斯皮尔曼相关系数
8.6尾部相关
8.7计算copula
8.7.1最大似然
8.7.2拟最大似然估计
8.7.3计算元高斯分布和元t分布
8.8文献注记
8.9参考文献
8.10R实验室
8.10.1模拟copula
8.10.2对收益数据拟合copula
8.11习题
第9章时间序列模型:基础知识
9.1时间序列数据
9.2平稳过程
9.2.1白噪声
9.2.2预测白噪声
9.3估计平稳过程的参数
9.4AR(1)过程
9.4.1弱平稳AR(1)过程的性质
9.4.2收敛到平稳分布
9.4.3非平稳AR(1)过程
9.5AR(1)过程的估计
9.5.1残差与模型检验
9.5.2最大似然和条件最小二乘
9.6AR(p)模型
9.7滑动平均过程
9.7.1MA(1)过程
9.7.2一般的MA过程
9.8ARMA过程
9.8.1后向算子
9.8.2ARMA模型
9.8.3ARMA(1,1)过程
9.8.4ARMA参数估计
9.8.5差分算子
9.9ARIMA过程
9.10单位根检验
9.11自动选择一个ARIMA模型
9.12预测
9.12.1预测误差和预测区间
9.12.2通过模拟计算预测限
9.13偏自相关系数
9.14文献注记
9.15参考文献
9.16R实验室
9.16.1Tbill比率
9.16.2预测
9.17习题
第10章时间序列模型:更多主题
10.1季节性ARIMA模型
10.1.1季节性和非季节性差分
10.1.2乘法ARIMA模型
10.2时间序列的BoxCox变换
10.3多变量时间序列
10.3.1互相关函数
10.3.2多变量白噪声
10.3.3多变量ARMA过程
10.3.4使用多变量AR模型预测
10.4长记忆过程
10.4.1长记忆平稳模型的需要
10.4.2分数阶差分
10.4.3FARIMA过程
10.5自助法时间序列
10.6文献注记
10.7参考文献
10.8R实验室
10.8.1季节性ARIMA模型
10.8.2VAR模型
10.8.3长记忆过程
10.8.4一个ARIMA过程的基于模型的自助法
10.9习题
第11章投资组合理论
11.1权衡预期收益和风险
11.2一种风险资产和一种无风险资产
11.3两种风险资产
11.4结合两种风险资产与一种无风险资产
11.4.1两种风险资产的切线资产组合
11.4.2结合切线资产组合和无风险资产
11.4.3ρ12的效果
11.5卖空
11.6N个风险资产投资组合的风险有效
11.7再抽样和有效投资组合
11.8文献注记
11.9参考文献
11.10R实验室
11.11习题
第12章回归:基础知识
12.1引言
12.2直线回归
12.2.1最小二乘估计
12.2.2β∧1的方差
12.3多元线性回归
12.4方差分析、平方和以及R2
12.4.1AOV表
12.4.2自由度
12.4.3均值平方和和F检验
12.4.4调整R2
12.5模型选择
12.6共线性和方差膨胀
12.7偏残差图
12.8中心化预测变量
12.9正交多项式
12.10文献注记
12.11参考文献
12.12R实验室
12.13习题
第13章回归诊断
13.1回归诊断简介
13.1.1杠杆值
13.1.2残差
13.1.3库克距离
13.2检验模型假设
13.2.1非正态分布
13.2.2非常数方差
13.2.3非线性
13.2.4残差相关性和伪回归
13.3文献注记
13.4参考文献
13.5R实验室
13.6习题
第14章回归:高级主题
14.1带有ARMA误差的线性回归
14.2线性回归的理论
14.2.1相关噪声的影响和异方差性
14.2.2回归的最大似然估计
14.3非线性回归
14.4从零息债券价格估计远期利率
14.5双边变换回归
14.6只变换因变量
14.7二元回归
14.8线性化一个非线性模型
14.9稳健回归
14.10回归和最佳线性预测
14.10.1最佳线性预测
14.10.2最佳线性预测的预测误差
14.10.3回归是经验最佳线性预测
14.10.4多元线性预测
14.11回归对冲
14.12文献注记
14.13参考文献
14.14R实验室
14.14.1带ARMA噪声的回归
14.14.2非线性回归
14.14.3因变量变换
14.14.4二元回归:谁得到了空调
14.15习题
第15章协整
15.1引言
15.2向量误差校正模型
15.3交易策略
15.4文献注记
15.5参考文献
15.6R实验室
15.6.1中等规模公司股票价格协整分析
15.6.2收益的协整分析
15.6.3模拟
15.7习题
第16章资本资产定价模型
16.1CAPM简介
16.2资本市场线
16.3β值和证券市场线
16.3.1有关β值的例子
16.3.2CML和SML的比较
16.4证券特征线
16.4.1通过多元化降低特有风险
16.4.2假设合理吗
16.5一些投资组合理论
16.5.1对市场投资组合风险的贡献
16.5.2SML的推导
16.6β值的估计和CAPM的检验
16.6.1用回归估计β值
16.6.2检验CAPM
16.6.3α值的解释
16.7CAPM在投资组合分析中的应用
16.8文献注记
16.9参考文献
16.10R实验室
16.11习题
第17章因子模型和主成分
17.1降维
17.2主成分分析
17.3因子模型
17.4用时间序列回归拟合因子模型
17.4.1Fama和French三因子模型
17.4.2资产回报率的期望和协方差的估计
17.5截面因子模型
17.6统计因子模型
17.7文献注记
17.8参考文献
17.9R实验室
17.9.1主成分分析
17.9.2时间序列回归拟合因子模型
17.9.3统计因子模型
17.10习题
第18章GARCH模型
18.1引言
18.2估计条件均值和方差
18.3ARCH(1)过程
18.4AR(1)/ARCH(1)模型
18.5ARCH(p)模型
18.6ARIMA(pA,d,qA)/GARCH(pG,qG)模型
18.7具有厚尾的GARCH过程
18.8拟合ARMA/GARCH模型
18.9作为ARMA模型的GARCH模型
18.10GARCH(1,1)过程
18.11APARCH模型
18.12具有ARMA/GARCH误差的回归
18.13ARMA/GARCH过程的预测
18.14文献注记
18.15参考文献
18.16R实验室
18.17习题
第19章风险管理
19.1风险管理的必要性
19.2一个资产的VaR和ES的估计
19.2.1VaR与ES的非参数估计
19.2.2VaR与ES的参数估计
19.3用自助法计算VaR与ES的置信区间
19.4用ARMA/GARCH模型估计VaR与ES
19.5一个投资组合的VaR与ES的估计
19.6多项式尾部的VaR估计
19.7帕雷托分布
19.8持有期与置信系数的选择
19.9VaR与多样化
19.10文献注记
19.11参考文献
19.12R实验室
19.13习题
第20章贝叶斯数据分析和MCMC
20.1引言
20.2贝叶斯定理
20.3先验分布和后验分布
20.4共轭先验
20.5后验中心极限定理
20.6后验区间
20.7马尔可夫链蒙特卡罗方法
20.7.1Gibbs抽样
20.7.2其他蒙特卡罗抽样方法
20.7.3MCMC输出的分析
20.7.4WinBUGS
20.7.5MCMC收敛性和混合的检验
20.7.6模型DIC和pD的比较
20.8多层先验
20.9协方差矩阵的贝叶斯估计
20.9.1多元正态分布的协方差阵估计
20.9.2多元t分布的尺度矩阵的估计
20.9.3协方差矩阵的非共轭先验
20.10一个平稳过程的采样
20.11文献注记
20.12参考文献
20.13R实验室
20.13.1MCMC拟合t分布
20.13.2AR模型
20.13.3MA模型
20.13.4ARMA模型
20.14习题
第21章非参数回归和样条函数
21.1引言
21.2局部多项式回归
21.3线性光滑器
21.3.1平滑矩阵和有效自由度
21.3.2AIC和GCV
21.4多项式样条函数
21.4.1具有一个结的线性样条函数
21.4.2具有多个结的线性样条函数
21.4.3二次样条函数
21.4.4p阶样条函数
21.4.5其他的样条基
21.5惩罚样条函数
21.6文献注记
21.7参考文献
21.8R实验室
21.8.1工资、教育和经验的加法模型
21.8.2短期利率的一个扩展CKLS模型
21.9习题
附录A来自于概率、统计和代数的事实