MBA智库文档经济统计回归模型.ppt

统计回归模型.ppt

下载

Suencrew

44页 | 977KB | 0次下载 |

5.0

(1人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

统计回归模型牙膏的销售量软件开发人员的薪金酶促反应投资额与国民生产总值和物价指数回归模型是用统计分析方法建立的最常用的一类模型数学建模的基本方法机理分析测试分析通过对数据的统计分析，找出与数据拟合最好的模型不涉及回归分析的数学原理和方法通过实例讨论如何选择不同类型的模型对软件得到的结果进行分析，对模型进行改进由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系，建立合乎机理规律的数学模型。牙膏的销售量问题建立牙膏销售量与价格、广告投入之间的模型预测在不同价格和广告费用下的牙膏销售量收集了30个销售周期本公司牙膏销售量、价格、广告费用，及同期其它厂家同类牙膏的平均售价基本模型 y ~公司牙膏销售量 x1~其它厂家与本公司价格差 x2~公司广告费用 x1, x2~解释变量(回归变量, 自变量) y~被解释变量（因变量） 0, 1 , 2 , 3 ~回归系数 ~随机误差（均值为零的正态分布随机变量） MATLAB 统计工具箱模型求解 [b,bint,r,rint,stats]=regress(y,x,alpha) 输入 alpha(置信水平,) b~的估计值 bint~b的置信区间 r ~残差向量y-xb rint~r的置信区间 Stats~ 检验统计量 R2,F, p y~n维数据向量输出由数据 y,x1,x2估计 结果分析 y的%可由模型确定 F远超过F检验的临界值 p远小于= 2的置信区间包含零点(右端点距零点很近) x2对因变量y 的影响不太显著 x22项显著可将x2保留在模型中模型从整体上看成立销售量预测价格差x1=其它厂家价格x3-本公司价格x4 估计x3 调整x4 控制价格差x1=元，投入广告费x2=650万元销售量预测区间为 [，]（置信度95%）上限用作库存管理的目标值下限用来把握公司的现金流若估计x3=，设定x4=，则可以95%的把握知道销售额在  29（百万元）以上模型改进 x1和x2对y的影响独立两模型销售量预测比较区间 [，] 区间 [，] 控制价格差x1=元，投入广告费x2=百万元预测区间长度更短 x2= x1= 交互作用影响的讨论价格差 x1= 价格差 x1= 加大广告投入使销售量增加（ x2大于6百万元）价格差较小时增加的速率更大完全二次多项式模型 MATLAB中有命令rstool直接求解软件开发人员的薪金资历~ 从事专业工作的年数；管理~ 1=管理人员，0=非管理人员；教育~ 1=中学，2=大学，3=更高程度建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性，作为新聘用人员薪金的参考分析与假设 y~ 薪金，x1 ~资历（年） x2 = 1~ 管理人员，x2 = 0~ 非管理人员 1=中学2=大学3=更高资历每加一年薪金的增长是常数；管理、教育、资历之间无交互作用教育线性回归模型 a0, a1, …, a4是待估计的回归系数，是随机误差模型求解 R2,F, p 模型整体上可用资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大学程度薪金比更高的多148 a4置信区间包含零点，解释不可靠! 残差分析方法结果分析残差全为正，或全为负，管理—教育组合处理不当残差大概分成3个水平， 6种管理—教育组合混在一起，未正确反映。应在模型中增加管理x2与教育x3, x4的交互项进一步的模型增加管理x2与教育x3, x4的交互项 R2,F有改进，所有回归系数置信区间都不含零点，模型完全可用消除了不正常现象异常数据(33号)应去掉去掉异常数据后的结果 R2：   F： 226  554  36701 置信区间长度更短残差图十分正常最终模型的结果可以应用模型应用制订6种管理—教育组合人员的“基础”薪金(资历为0）中学：x3=1, x4=0 ；大学：x3=0, x4=1；更高：x3=0, x4=0 x1= 0； x2 = 1~ 管理，x2 = 0~ 非管理大学程度管理人员比更高程度管理人员的薪金高大学程度非管理人员比更高程度非管理人员的薪金略低对定性因素(如管理、教育)，可以引入0-1变量处理，0-1变量的个数应比定性因素的水平少1 软件开发人员的薪金残差分析方法可以发现模型的缺陷，引入交互作用项常常能够改善模型剔除异常数据，有助于得到更好的结果注：可以直接对6种管理—教育组合引入5个0-1变量酶促反应问题研究酶促反应（酶催化反应）中嘌呤霉素对反应速度与底物（反应物）浓度之间关系的影响建立数学模型，反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系设计了两个实验：酶经过嘌呤霉素处理；酶未经嘌呤霉素处理。实验数据见下表: 方案底物浓度(ppm) 反应速度处理 76 47 97 107 123 139 159 152 191 201 207 200 未处理 67 51 84 86 98 115 131 124 144 158 160 / 基本模型 Michaelis-Menten模型 y ~ 酶促反应的速度, x ~底物浓度 1 , 2 ~ 待定系数底物浓度较小时，反应速度大致与浓度成正比；底物浓度很大、渐进饱和时，反应速度趋于固定值。酶促反应的基本性质实验数据线性化模型经嘌呤霉素处理后实验数据的估计结果对1 , 2非线性参数参数估计值（×10-3）置信区间（×10-3） 1 [ ] 2 [ ] R2= F= p= 线性化模型结果分析 x较大时，y有较大偏差 1/x较小时有很好的线性趋势，1/x较大时出现很大的起落参数估计时，x较小（1/x很大）的数据控制了回归参数的确定 [beta,R,J] = nlinfit (x,y,’model’,beta0) beta的置信区间 MATLAB 统计工具箱输入 x~自变量数据矩阵 y ~因变量数据向量 beta ~参数的估计值R ~残差，J ~估计预测误差的Jacobi矩阵 model ~模型的函数M文件名 beta0 ~给定的参数初值输出 betaci =nlparci(beta,R,J) 非线性模型参数估计 function y=f1(beta, x) y=beta(1)*x./(beta(2)+x); x= ; y= ; beta0=[ ]; [beta,R,J]=nlinfit(x,y,’f1’,beta0); betaci=nlparci(beta,R,J); beta, betaci beta0~线性化模型估计结果非线性模型结果分析画面左下方的Export 输出其它统计结果。拖动画面的十字线，得 y的预测值和预测区间剩余标准差s= 其它输出命令nlintool 给出交互画面参数参数估计值置信区间 1 [ ] 2 [ ] 混合反应模型 x1为底物浓度， x2为一示性变量 x2=1表示经过处理，x2=0表示未经处理 β1是未经处理的最终反应速度 γ1是经处理后最终反应速度的增长值 β2是未经处理的反应的半速度点 γ2是经处理后反应的半速度点的增长值在同一模型中考虑嘌呤霉素处理的影响混合模型求解用nlinfit 和 nlintool命令估计结果和预测剩余标准差s= 2置信区间包含零点，表明2对因变量y的影响不显著参数参数估计值置信区间 1 [ ] 2 [ ] 1 [ ] 2 [ ] 简化的混合模型简化的混合模型形式简单，参数置信区间不含零点剩余标准差 s = ，比一般混合模型略大估计结果和预测参数参数估计值置信区间 1 [ ] 2 [ ] 1 [ ] 一般混合模型与简化混合模型预测比较简化混合模型的预测区间较短，更为实用、有效预测区间为预测值  Δ 实际值一般模型预测值 Δ(一般模型）简化模型预测值 Δ(简化模型） 67 51 84 … … … … … 191 201 207 200 注：非线性模型拟合程度的评价无法直接利用线性模型的方法，但R2 与s仍然有效。酶促反应反应速度与底物浓度的关系非线性关系求解线性模型求解非线性模型嘌呤霉素处理对反应速度与底物浓度关系的影响混合模型简化模型投资额与国民生产总值和物价指数问题建立投资额模型，研究某地区实际投资额与国民生产总值 ( GNP ) 及物价指数 ( PI ) 的关系 20 10 19 9 18 8 17 7 16 6 15 5 14 4 13 3 12 2 11 1 物价指数国民生产总值投资额年份序号物价指数国民生产总值投资额年份序号根据对未来GNP及PI的估计，预测未来投资额该地区连续20年的统计数据时间序列中同一变量的顺序观测值之间存在自相关以时间为序的数据，称为时间序列分析许多经济数据在时间上有一定的滞后性需要诊断并消除数据的自相关性，建立新的模型若采用普通回归模型直接处理，将会出现不良后果投资额与国民生产总值和物价指数基本回归模型投资额与 GNP及物价指数间均有很强的线性关系 t ~年份， yt ~ 投资额，x1t~ GNP, x2t ~ 物价指数 0, 1, 2 ~回归系数 t ~对t相互独立的零均值正态随机变量基本回归模型的结果与分析 MATLAB 统计工具箱剩余标准差 s= 没有考虑时间序列数据的滞后性影响 R2＝，拟合度高模型优点模型缺点可能忽视了随机误差存在自相关；如果存在自相关性，用此模型会有不良后果参数参数估计值置信区间 0 [ ] 1 [ ] 2 [ ] R2= F= p= 自相关性的定性诊断残差诊断法作残差 et~et-1 散点图大部分点落在第1, 3象限大部分点落在第2, 4象限自相关性直观判断在MATLAB工作区中输出 et为随机误差t 的估计值自回归性的定量诊断 ρ~自相关系数 0, 1, 2 ~回归系数 ρ= 0 ρ> 0 ρ< 0 如何估计ρ 如何消除自相关性 D-W检验 ut ~对t相互独立的零均值正态随机变量 D-W统计量与D-W检验检验水平,样本容量，回归变量数目检验临界值dL和dU 由DW值的大小确定自相关性广义差分变换以*0, 1 , 2 为回归系数的普通回归模型原模型 DW值无自相关有自相关新模型步骤不能确定投资额新模型的建立 DWold < dL 作变换原模型残差et 样本容量n=20，回归变量数目k=3，= 临界值dL=, dU= 总体效果良好剩余标准差 snew= < sold= 投资额新模型的建立参数参数估计值置信区间 *0 [ ] 1 [ ] 2 [ ] R2= F= p= 新模型的自相关性检验 dU< DWnew < 4-dU 新模型残差et 样本容量n=19，回归变量数目k=3，= 临界值dL=, dU= 还原为原始变量一阶自回归模型一阶自回归模型残差et比基本回归模型要小模型结果比较投资额预测对未来投资额yt 作预测，需先估计出未来的国民生产总值x1t 和物价指数 x2t 设已知 t=21时， x1t =3312，x2t= ŷt 较小是由于yt-1=过小所致

联系我们

智库文档公众号

客服微信

统计回归模型.ppt

下载

标签

相关专题更多

联系我们

意见反馈

标签

相关专题 更多

联系我们

意见反馈

相关专题更多