Stata是一个全面而综合的统计软件包,计量统计功能非常强大,目前已经成为欧美高校和研究机构*为推崇的计量统计软件之一,国内的用户也越来越广泛,由*初的医学领域向经济、金融、管理、统计和社会学等其他学术领域快速扩散。本书将统计学的一般原理与Stata的具体应用相结合,运用大量经济、统计分析案例,比较适合经管类专业本科学生学习使用。
全书共分八章,内容涉及统计数据的管理、数据的图示、统计数据的描述统计、参数估计与假设检验、变量间统计关联性分析、时间序列、主成分分析与因子分析、聚类分析等。
本书是福建省教育厅2017年高等学校创新创业教育改革项目(创新创业教育改革试点专业——金融工程)的成果之一。
当前,我们所处的社会、经济、生活环境中,到处存在着基于调查数据通过统计方法研究得到结论的情况,因此对数据进行统计、分析和学习变得尤为重要。统计学是通过收集、整理、分析数据等手段,以推断所研究分析对象的本质,甚至预测该对象未来的一门综合性学科,其思想和各种统计数据对政府、社会乃至我们的工作和日常生活,都有着不可忽视的影响。Stata是一个全面而综合的统计软件包,计量统计功能非常强大,应用越来越广泛,由最初的医学领域向经济、金融、管理、统计和社会学等其他学术领域快速扩散。本书从经管类专业课程的实用性出发,将统计学的一般原理与Stata的具体应用相结合,使学生在掌握社会经济统计的一般原理和方法的同时,利用Stata软件对数据进行系统的统计分析,了解数据描述及统计推断的基本概念,熟悉实际工作中需要用到的统计方法,以培养和锻炼学生分析问题、解决问题的能力。
全书共八章。第一章主要介绍了统计学的一些基本问题,目的是使读者对统计学有一个基本的了解。第二章介绍了统计数据的图示法,主要通过不同的图示,对不同类型的数据进行图形展示和分析。第三章介绍了统计的基本描述方法,主要讨论如何使用一些数据统计量对数据进行概括性的度量。第四章参数估计与假设检验是统计推断的重要内容,主要介绍了各参数的估计方法以及对参数的假设检验方法。第五章主要内容是随机变量的统计关联性,区分了变量之间的关系,通过列联分析与方差分析,考察变量间的统计关联性。第六章介绍时间序列,包括时间序列的分析与预测,以及几个常见的时间序列模型的应用。第七章介绍了主成分分析与因子分析,主要通过对多变量数据进行分析,在减少分析指标的同时,避免信息损失。第八章是聚类分析,主要介绍了聚类分析的应用领域及具体的分析过程。
本书的编写特别感谢福建师范大学协和学院经济与法学系金融教研室的支持,感谢2008~2017级学生在统计教学上的配合,以及学院各部门领导和老师在写作过程中提供的各种支持与帮助。
由于编者水平所限,书中难免有疏漏之处,请读者多提宝贵意见,以便我们进一步修改和完善。
编者
前言
第一章统计数据的管理1
第一节统计学概述2
一、统计数据的类型2
二、基本概念3
第二节Stata的数据管理4
一、变量命名原则与取值5
二、数据的管理6
练习题30
第二章数据的图示32
第一节条形图与饼图33
一、条形图34
二、饼图38
第二节直方图与箱线图41
一、直方图41
二、箱线图44
第三节散点图与曲线
标绘图46
一、散点图46
二、曲线标绘图52
练习题54
第三章统计数据的描述统计59
第一节分布集中趋势的
测度60
一、均值60
二、分位数63
三、频数与众数65
四、各度量值的比较67
第二节分布离散程度的
测度68
一、极差与四分位差68
二、方差与标准差69
三、标准化与标准误71
四、离散系数73
第三节偏度系数与峰度
系数74
一、偏度系数74
二、峰度系数75
第四节正态性检验和数据
转换78
一、直方图图示分析78
二、正态分位图分析78
三、正态性统计检验80
四、改变数据的分布81
练习题84
第四章参数估计与假设检验87
第一节抽样与抽样分布88
一、常用的抽样方法89
二、抽样分布91
第二节参数估计的基本
原理92
一、估计量与估计值92
二、点估计、区间估计与
置信区间93
三、区间估计94
四、样本容量的确定100
第三节假设检验103
一、假设检验的概述104
二、假设检验的步骤104
三、假设检验中的两类
错误105
四、统计量的假设检验
方法106
练习题115
第五章变量间统计关联性
分析117
第一节变量间的统计
关联性118
一、变量间的统计关系119
二、关联关系分析方法119
第二节列联分析120
一、列联表的基本格式120
二、列联分析的主要内容120
三、百分比化列联表121
四、Stata案例分析121
五、卡方检验125
六、几种常用的关联度测量
方法127
第三节方差分析129
一、方差分析的基本知识129
二、单因素方差分析132
三、双因素方差分析136
四、协方差分析144
练习题146
第六章时间序列148
第一节时间序列与时间序列
分析149
一、时间序列及其类型149
二、时间序列分析及其
类型150
第二节时间序列的构成因素及
趋势分析151
一、时间序列的构成因素151
二、时间序列的长期趋势
分析153
三、趋势分析与指数平滑的
Stata实现154
第三节ARIMA模型162
一、随机过程163
二、自回归模型164
三、移动平均模型165
四、自回归移动平均
模型166
五、自回归单整移动平均
模型166
六、Stata案例分析167
第四节VAR模型175
一、向量自回归模型176
二、VAR模型的稳定性177
三、Granger因果检验177
四、VAR模型中滞后阶数p的
确定方法178
五、脉冲响应分析与方差
分解179
六、Stata案例分析181
练习题186
第七章主成分分析与因子
分析188
第一节主成分分析190
一、主成分分析的基本
思想191
二、主成分分析的基本
原理191
三、主成分的性质193
四、主成分分析的步骤193
五、Stata分析195
第二节因子分析202
一、因子分析的基本思想203
二、因子分析的基本
模型和统计量分析203
三、因子分析的计算206
四、因子分析的Stata操作209
练习题220
第八章聚类分析222
第一节聚类分析的基本
思想223
一、聚类分析方法224
二、聚类分析中距离的
度量225
三、系统聚类分析233
第二节动态聚类法242
一、动态聚类分析中应注意的
问题243
二、动态聚类分析
步骤244
练习题252
参考文献253