管理学分析方法
——spss线性回归分析
行者管理 杨燕
回归分析
(一)回归分析内涵
1、含义:回归分析是指通过一个变量或一些变量的变化解释
另一个变量的变化。因果关系预测一般采用回归分析方法
预测。
2、回归的分类
(1)按自变量的个数分
①一元线性回归:y=a+bx (有一个自变量)
②多元线性回归:
(有两个或两个以上的自变量)
(2)按回归曲线的形态分
①线性(直线)回归
②非线性(曲线)回归
回归分析
(二)回归分析的主要内容
1、从一组数据出发,确定因变量和自变量的关系式;
2、对关系式中的参数进行估计,并进行统计检验;
3、筛选自变量,即从大量自变量中找出影响显著的,剔除不
显著的;
4、用求得的回归模型进行预测;
5、对预测结果进行分析、评价。
(三)回归分析的作用
通过回归分析找出变量之间的关系,并确定之间的因果关系,
通过数学模型预测因变量的发展。
一元线性回归
一、一元线性回归模型
存在偏差 最小二乘法
X为自变量的取值, 为因变量的取值,a为拟合线上经过Y轴上的
点截距,b为拟合线上的斜率
Y=a+bx
Y
X
一元线性回归
二、一元线性回归spss操作过程
1.创建一个数据文件
数据文件的创建分成三个步骤:
(1)选择菜单 【文件】→【新建】→【数据】新建
一个数据文件,进入数据
编辑窗口。窗口顶部标题为“spss 数据编辑器”。
(2)单击左下角【变量视窗】标签进入变量视图界
面,根据试验的设计定义每个变量类型。
(3)变量定义完成以后,单击【数据视窗】标签进
入数据视窗界面,将每个具体的变量值录入数据库
单元格内。
图1 奖金-销售量表
一元线性回归
以奖金-销售量表图1做回归分析
2、绘制散点图
打开数据文件,选择【图形】-【旧对话框】-【散点/点状】
图2
选择简单分布,单
击定义,打开子
对话框,选择X
变量和Y变量,
如图3
单击确定提交系统
运行,结果见图4
所示
图3
一元线性回归
从图上可直观地看出奖金与销售量之间存在线性相关关系
图4 散点图
销
售
量
奖金
一元线性回归分析
3、简单相关分析
选择【分析】—>【相关】—>【双变量】,打开对话框,将
变量“销售量”与“奖金”移入变量(variables)列表框
点击确定运行,结果如表5 所示
一元线性回归分析
从表中可得到两变量之间的皮尔逊相关系数为,
双尾检验概率p值尾<,故变量之间显著相关。
根据奖金与销售量之间的散点图与相关分析显示,奖
金与销售量之间存在显著的正相关关系。在此前提下
进一步进行回归分析,建立一元线性回归方程。
表1
一元线性回归
4、线性回归分析
步骤1:选择菜单栏“
【分析】—>【回归】
—>【线性】”,打开
线性回归 对话框。将
变量销售量y移入【因
变量】列表框中,将
奖金x移入【自变量】
列表框中。在【方法
】框中选择【进入】
选项,表示所选自变
量全部进入回归模型。
一元线性回归分析
步骤2:单击
【统计量】
按钮,如图
在【统计量
】子对话框。
该对话框中
设置要输出
的统计量。
这里选中估
计、模型拟
合度复选框。
一元线性回归分析
步骤3:单击
【绘制】
按钮,在
【图】子
对话框中
的标准化
残差图选
项栏中选
中正态概
率图复选
框,以便
对残差的
正态性进
行分析
步骤4:单击【
保存】按钮,
在【保存】
子对话框中
【残差】选
项栏中选中
【未标准化
】复选框,
单击【继续
】这样可以
在数据文件
中生成一个
变量名尾
res_1 的残
差变量,以
便对残差进
行进一步分
析。
一元线性回归分析
其余保持Spss默认选项。在主对话框中单击确定按钮,执行线性回归
命令,其结果如下:
•表3给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted
RSquare)、估计标准差(Std. Error of the Estimate)以及Durbin-Watson统
计量。从结果来看,回归的确定系数和调整的可决系数分别为和,
即销售量的95%以上的变动都可以被该模型所解释,拟和优度较高。
表2
表3
一元线性回归分析
表4给出了回归模型的方差分析表,可以看到,F统计量为
,对应的p值为0,所以,拒绝模型整体不显著的
原假设,即该模型的整体是显著的。
表4
一元线性回归分析
表5给出了回归系数、回归系数的标准差、标准化的回归系数值以及
各个回归系数的显著性t检验。从表中可以看到解释变量x及常量其t统
计量对应的p值都小于显著性水平,因此,在的显著性水平
下都通过了t检验。变量x的回归系数为,即奖金每增加1%,销
售量就增加。
表5
为了判断随机扰动项是否服从正态分布,观察图5所示的标准化残差
的P-P图,可以发现,各观测的散点基本上都分布在对角线上,据此
可以初步判断残差服从正态分布。
图5
一元线性回归分析
4、建立回归模型:
根据一元回归模型:
把表5中“非标准化回归系数”栏目中的
“B”列系数代入上式得预报方程:
多元线性回归分析
一、多元线性回归模型
影响因变量的自变量有两个或两个以上的时候,称之为
多元,如果他们之间有线性关系,就是多元线性回归。
多元线性回归分析在spss分析过程和一元线性回
归分析差不多,下面列出不同点
多元线性回归分析
1、做散点图
多个变量则做出散点图矩阵、重叠散点图和三维散点图
重叠散点图 三维散点图
多元线性回归分析
2、在【线性回归】对话框中【方法】
自变量筛选方法
က�全回归法-Enter
က�向前删除法-Forward
က�向后删除法-Backward
က�逐步回归法-Stepwise
က�强迫剔除法-Remove
多元线性回归
二、多元线性回归分析的要点
在多元线性回归中,有多个自变量,应当首
先绘制各自变量与因变量之间的关系散点图,
观察其与因变量之间是否具有线性关系。然
后,将自变量进行组合,生成若干自变量的子
集,再针对每一个自变量的子集生成回归分析
报告。比较调整后的R2值,挑选最优的自变
量子集,生成回归分析模型。
多元线性回归
三、线性回归检验
(一)复相关系数R及判定系数R2
确定系数又叫判定系数,为回归的误差平方和占总误差平方和
的比例,是对线性方程拟合优度的检验。
R=S回/S总 (-1<R<1)
1、R=1时,样本点完全落在回归直线上,表示y与x完全线性正
相关,R=-1时,表示y与x完全线性负相关
2、当0<R<1时,表示y与x有一定线性正相关
3、当-1<R<0时,表示y与x有一定线性负相关
4、当R=0时,表示y与x之间不存在线性相关关系
总结:R越接近1拟合度就越好
多元线性回归
(二)回归直线意义的F检验
1、က�统计量F=平均回归平方和/平均残差平方和。若F值过小说
明自变量对因变量的解释力度很差,拟合的回归直线没有
意义,相反若概率值(SPSS中以sig表示,越小越好)
2、F>Fa且P<Pa,说明回归模型解释力度强,反之亦然。
3、F假设
H0:所有的B值都低于0,H1:至少有一个B不等于0
(1)F(K-1,n-k)>Fa,则拒绝H0假设,即P<Pa(sig)
(2)F(K-1,n-k)<Fa,则不拒绝H0假设,即P>=Pa(sig)
注:可查F-分布表得Fa的值。
(三)T检验
1、是对回归方程每一个回归系数检验。
2、T检验方法与F检验方法差不多,在spss分析结果表中以sig
表示,即P值越小就说明回归系数与因变量的相关度高。
3、假设检验
H0:B1=0 B2=0, H1:B1≠0 B2 ≠0
注:查T-分布表
(四)残差的独立性检验
Durbin-Watson检验的参数D的取值范围是
0<D<4,与2越接近表示残差与自变量越独立。
见下图
多重共线性问题
1、多重共线性的标志
R平方较大但没有几个显著的t统计量,预示着多重共线性的
存在。实际上,有可能回归方程的F统计量高度显著,而每
个t统计量不显著
一对或多对解释变量的简单相关系数相对比较高可能意味着
多重共线的存在
2、多重共线性克服在运用spss分析时,可采用逐步回
归法来克服多重共线性问题
看例子 “农民工流动的问题及需求分析——基于多元线性回归分
析” “云南主要农产品出口贸易对云南经济增长的影响——基于
多元线性回归模型的实证分析”