第12章 回归分析预测法
回归分析预测法概述
一元线性回归分析预测法
多元线性回归分析预测法
非线性回归分析预测法
回归分析预测法概述
回归分析预测法概念
【小知识12-1】
“回归”这个概念,是1877年美国遗传学家高尔顿(F•Gaolton)提出来的。他是在研究了人类身高的遗传性时,发现父母身高在子女身高遗传上有回归现象。此后,回归的含义被进一步扩大,现被广泛应用于变量间的数量关系分析。
(资料来源:杭中茂:《职业教育观》,中国商业出版社 1999)
回归分析预测法概念
回归分析预测法是预测学的基本方法,它是在分析因变量与自变量之间的相互关系,建立变量间的数量关系近似表达的函数方程,并进行参数估计和显著性检验以后,运用回归方程式预测因变量数值变化的方法
回归分析预测法概述
回归分析预测法的具体步骤
回归分析预测法的具体步骤
1)确定预测目标和影响因素
2)进行相关分析
3)建立回归预测模型
4)回归预测模型的检验
5)进行实际预测
【小思考12-1】
如何预计未来五年小家电需求为目的的市场预测?
答:应该从它的因变量-就是未来五年小家电的需求量和对于影响和制约预测目标的因素——自变量来分析。
【观念应用12-1】
运用回归法进行定量预测,必须有以下三个条件:
1预测对象与影响因素之间必须存在因果关系,而且数据点在20个以上为好;
2过去和现在的数据规律,能够反映未来;
3数据的分布确有线性趋势,可采用线性解;如不是线性趋势,则可用非线性解。
一元线性回归分析预测法
12.2.1 一元线性回归预测法概念
12.2.1 一元线性回归预测法概念
一元线性回归预测法,是指影响经济变化的众多因素中有一个起决定作用的因素,且自变量与因变量的分布呈线性趋势的回归,用这种回归分析来进行预测的方法
一元线性回归分析预测法
一元线性回归分析预测法的使用
【观念应用12-2】
根据经验,企业的商品销售额同广告费支出之间具有相关关系。某企业1990年至1999年的商品销售额和广告费支出的资料如表12-1所示。
表12-1 某企业商品销售额与广告费支出表
广告费支出
(万元)
商品销售额
(百万元)
6777
3013
4508
241
157
合计
49
144
289
400
529
676
841
1024
1225
1600
16
49
81
144
196
289
400
484
625
729
28
84
153
240
322
442
580
704
875
1080
7
12
17
20
23
26
29
32
35
40
4
7
9
12
14
17
20
22
25
27
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
年份
(资料来源:徐国强著:《管理统计学》,上海财经大学出版社 1998)
预测该企业2002年的广告费支出为35万元,要求在95%的概率下预测该年的商品销售额。
【分析提示】
1)进行相关分析。在坐标系上将广告费支出和商品销售额的数据标出,形成散点图,可以发现呈现直线趋势。从而判定二者呈一元回归。
2) 建立回归方程。
回归方程为:
,关键是求参数a、b的值。
根据表12-1计算的有关数据,利用最小平方法可以求出:
所求回归方程是:
3)、进行检验。
(1)相关系数:
取显著性水平α=,df=n-2=8。查相关系数临界值表得:
因为
,说明广告费支出与商品销售额存在很强的正相关关系。
(2)决定系数
检验和F检验.决定系数
检验和F检验都是用来检验回
归方程线性关系的显著性,二者在检验原理上大体相同,均借助了方差分析:
其中:
:总变差;
:剩余变差;
:回归变差。
表12-2
241
157
合计
7
12
17
20
23
26
29
32
35
40
4
7
9
12
14
17
20
22
25
27
1
2
3
4
5
6
7
8
9
10
时间
决定系数
利用回归变差、点变差、总变差的比重说明回归直线的代表性,
若这个比例越大,则说明x与y之间关系越密切,回归直线代表性越好。一般地
的取值在0~1之间。
F检验法将自变量作为一个整体来检验与因变量之间的线性关系是否显著。其计算为:
取显著性水平α=,df1=1,df2=n-2=8。查F分布表得:
因为F>
,说明广告费支出与商品销售额线性关系显著。这与决定系数
检验结论一致。
4)进行预测。
(1)点预测。2002年的广告费支出预计为35万元。
万元代入回归方程:
百万元。
即:2002年的商品销售额可望达到百万元。
(2)区间预测。
①计算估计标准误差
因为
,df=8,查t分布表,得
②当广告费支出达到
万元时,商品销售额的预测区间为:
即:若以95%的把握程度预测,当广告费支出达到35万元时,商品的销售额在
百万元之间。
【小思考12-2】
一元线性回归分析预测法与上一章中介绍的趋势延伸分析预测法有什么区别?
答:回归分析是基于时间的内在的因素进行远期预测,而趋势延伸预测是基于时间上的动态预测。
多元线性回归分析预测法
多元线性回归分析预测的概念
【小知识12-3】
一元线性回归模型是将影响因变量的原因归结一个主要因素上。当影响应变量变化的因素有多个时一元线性回归模型就无法准确地判断多个变量之间的关系
多元线性回归分析预测的概念
影响因变量的因素有两个或两个以上,且自变量与因变量的分布呈线性趋势的回归,用这种回归分析来进行预测的方法就是多元线性回归预测。
多元线性回归分析预测法
多元线性回归分析预测的使用方法
【观念应用12-3】
如何使用多元(以二元为例)线性回归分析选择预测区间?
【分析提示】
多元(以二元为例)线性回归分析的步骤如下:
1)建立线性方程。
参数
、
、
仍使用最小平方法推算,得到:
将相关数据代入上述方程组,得到系数:
、
、
所以,二元线性回归方程为:
2)检验
利用复相关系数检验回归方程整体显著性。
简捷公式为:
取一个特定的
计算出df=n-k-1(k为自变量个数)
查相关系数临界值表得到:
如果
说明
、
与
线性关系显著。
3)、预测
(1)点预测:将
,
代入()得到预测值
(2)区间预测
计算估计标准误差:
进制
取
,df=n-3 查t分布表:得到
所以,预测区间为:
非线性回归分析预测法
(选修)
非线性回归分析预测法
指数曲线模型
【小知识 12-4】
用手工方法进行定量分析有很多的局限性,当变量较多,数据量较大的时候,无法进行分析,电子计算机的应用与发展为我们进行回归分析提供了优越条件。筛选变量拟合模型,求解参数,测定相关系数,检验显著水平,计算估计标准误差,分析预测因变量的置信区均可以在计算机上进行操作。
指数曲线模型
非线性回归分析预测法
幂函数模型
幂函数模型
非线性回归分析预测法
双曲线模型
双曲线模型
非线性回归分析预测法
对数模型
对数模型
【小思考12-4】
回归分析预测法中,为什么要进行检验,以测定变量间的相关关系?
答:相关关系的大小直接反映了变量的密切程度,从而说明二者进行回归分析更可信。
非线性回归分析预测法
多项式模型
多项式模型
1)二次模型
2)三次模型
【小实训】
如何预计未来五年高校入学需求为目的的市场预测?
【实训建议】
应该运用一元回归分析法确定其因变量-就是未来五年高校需求量和对于影响和制约预测目标的因素——每年高校的录取的人数和高中毕业人数(自变量)来分析。
本章小结:
本章介绍了回归分析预测法的基本步骤、确定目标及影响因素,进行相关分析,建立回归模型,检验回归模型,最后进行实际预测。
这一章中通过案例详细介绍了一元线性回归分析预测法和多元线性回归分析预测法。在预测过程中,关键是回归模型的检验及估计标准误差的计算。
。
主要概念和观念
主要概念:回归分析预测法
一元线性回归分析预测法
多元线性回归分析预测法
主要观念:回归分析预测法的运用
一元回归分析预测法的运用
多元回归分析预测法的运用
综合案例
【综合案例1】
多种预测方法在市场销售中的应用
奥伯梅尔公司是美国流行滑雪服市场上的主要供应商。它的产品是由远东、欧洲、加勒比海地区以及美国的一些企业加工的。该公司几乎所有的产品,每年都要重新设计,以适应款式、面料和颜色的变化。直到20世纪80年代中期,公司的设计和销售周期都是相对简单的,包括设计产品,生产样品,3月份向零售商展示样品;接受零售商订货后,在3、4月份接受供应商订货;10月份在奥伯梅尔公司的本着中心收货;然后立即向零售商店送货。这种方法有效地运用了30多年。加工合同是以确认的订单为依据签订的,而秋季交货又为有效的生产提供了充分的时间。
然而,80年代中期,这种方法不再有效。首先,随着公司的销售量增加,在生产高峰期生产能力受到制约。在夏季关键的几个月中,它无法从高质量的滑雪服加工厂预订到足够的生产能力,以保证加工出满足全部订货要求的产品。结果,它只得根据对零售商订货的预测,在上一年的11月份,或者在商品销售之前大约一年,就开始预订加工能力。
其次,降低生产成本和增加产品品种的压力,迫切要求公司建立更加复杂的供应链。为了克服供应链变长、供应商能力限制以及零售商要求尽早交货的困难,奥伯梅尔公司采用各种方法来缩短交货期。然而,这些努力并未解决缺货和不断降价的问题。公司生产仍有约一半是根据需求预测安排的。在生产高度复杂多变的时尚产品的行业,这是很大的危险。奥伯梅尔公司依靠一个由其各个职能部门经理组成的专家小组,对公司每一种产品的需求进行一致性预测。但是,这项活动并不特别有效。例如,在1991-1992年度销售期,有几款女式风雪大衣比原先的预测多销售了200%,同时,其他款式的销售量比预计销售量低了15%。
为了改进预测,奥伯梅尔公司责成专人来考察这些问题,由此提出了“正确响应”(accurate response)的方法。他们认识到,问题在于公司不能预测人们将买什么。。生产风雪大衣的决策,实质上是就“风雪大衣会有销路”这一判断在打赌。为了规避这种风险,必须寻求一种方法,来确定在“早期订货”之前生产哪些产品是最安全的,哪些产品应该延期到从“早期订货”收集到可资利用的信息后再生产。
同时,他们发现,专家小组的初步预测尽管有些是不符合实际的,但约有一半是相当准确的,与实际销售量的误差不到10%。为了在获得实际订货之前确定哪些预测可能是准确的,他们考察了专家小组的工作方式。专家小组传统上是对每一咱款式和颜色都通过广泛的讨论达成一致性预测。于是,该公司对德尔菲法进行改进。公司决定请专家小组的每一位成员对每一种款式和颜色作出独立预测。采用这种方法,个人要对自己的预测负责。
这种改革非常有价值。首先,一致性预测往往并非真正意义上的一致。小组中的主要成员,如资深经理,常常过度地影响集体预测的结果;如果每个人都必须提出自己的预测,就可消除这种过度的影响。其次,也是更重要的,新方法有利于对预测结果进行统计处理,以得出更精确的预测结果。
通过独立预测过程确实获得了重要发现。例如,虽然对两种款式大衣预测的平均趋势可能是一样的,但个人预测值的离中趋势却截然不同。例如,每个人对Pandro大衣的预测值都接近平均值,面对Entice宽松大衣的预测值却是分散的。因此,对Pandro大衣的预测可能比对Entice宽松大衣的预测更可行。1992-1993年度销售期末,公司验证了上述假设——当专家小组每位成员所作的预测相类似时,所获得的一致性预测将趋于更加精确。因此,利用个人预测之间的差异,可以有效地估计预测精度。
对于如何处理需求就可预测的品种,公司也获得了重要发现,即尽管零售商需求是不可预测的,从而使精确预测成为不可能,但是,奥伯梅尔公司零售商的总体购买模式却惊人的相似。例如,只要根据最初的20%的订货来修正专家小组的预测,预测精度就能显著提高。随着订货的增加,预测精度会不断改善。
接着,他们开始着手设计一种能够识别和利用上述信息的生产计划方法。设计这种方法关键是要认识到,在销售初期,当公司还未接到订货时,所预订的加工能力是“非反应性”的,即生产决策完全是根据预测而不是根据实际市场需求作出的。以“早期订货程序”为起点,随着订货信息的渗入,所确定的加工能力变得具有“反应性”了。这时,公司可以根据市场信息提高预测精度,从而作出生产决策。
最后要重视由于预测失误所造成的机会损失。预测失误将导致库存过少或过多。库存过少导致缺货可能失去潜在的顾客,造成销售额损失;库存过多可能导致不得不降价促销,减少企业的利润。因此,必须估计缺货和降价所造成的损失。但是,我国企业通常缺乏这方面的信息,特别是由于缺货所造成的销售额损失的信息。然而,估计销售额外负担损失是非常重要的,即使精确的会计也不十分有用。例如,美国的狄拉德百货公司提供了一个很好的范例。当顾客在该公司的一家商店没有买到所需的商品时,公司就从它的另一家商店把那种商品邮寄给顾客,而且不增加额外的费用。公司起初的目的只在于改进顾客服务,从而增加销售额。然而,它却附带得到了一个重要的收获——更好地了解到每一家商店的真实需求,从而能更好地估计销售额损失和预测需求。
(资料来源:[美]小卡尔.迈克丹尼尔著:<<当代市场调研>>,机械工业工业出版社 1999)
【综合案例2】
抽样调查样本容量的确定
“电脑世界”在西南部的几个州经营连锁电脑超市,它希望获得更多的关于其现有客户特点方面的信息,但公司目前并不打算请一家商业性的市场调研公司来进行这项工作。“电脑世界”的市场部主任乔·兰根(Joe Langan)目前正在得克萨斯州立大学攻读EMBA课程。在学习期间,他认识了劳拉·盖茨(Lara Gates)博士,劳拉负责教授市场调研课程。乔了解到每学期劳拉博士带的班都会为一些公司做市场调研方面的项目,并且得到了参加学习的学生和企业人士的肯定。乔与劳拉博士沟通后,商定由她带的班为“电脑世界”进行调研。
劳拉成立了负责各方面研究的几个,卜组。布莱恩·巴克勒(Biyan Buckler)是负责制定样本计划的小组中的一员。这个小组与乔进行最初会谈后认为,简单随机抽样法比较适合这一项目。而样本量大小的确定就由布莱恩负责。他明确了调研的一个主要目的是分别按人口和心理因素来估计“电脑世界”的客户的构成和比例。此外,他还确认了公司要总体估计值不超过实际值的±%。他记起以前的统计课曾经讲过,你可以对抽样的结果进行推断,但仅仅是带有几分可靠性的推断,千万不能过于肯定。据此他认为小组应该做出这样的推断,如“实际总值不超过抽样估计值的±%的可靠度为95%”。他将这一想法与小组其他成员以及乔进行了讨论,他们都认为误差不超过±%的可靠程度为95%这种说法可以接受。为了达到这些要求,他正努力寻找计算所需样本容量的方法。
(资料来源:[美]拉里.帕西著:《市场调研》,机械工业出版社 1999)
【综合案例3】
KFC(肯德基)在广州进行调查的内容
一、项目背景
KFC(肯德基)为全球最大的快餐连锁企业之一,20世纪80年代进入中国市场。与同是美国本土的麦当劳比较,KFC的产品具有明显特点,顾客对象亦不一样。在中国主要城市及周边地区,KFC的扩展虽不及竞争对手麦当劳快,但总体来看,北方,如北京、上海的经营较南方如广州好。个中原因较为复杂,但有一点是明确的,广东是中国经济上最富有、观念上最开放、市场前景最广阔的省份,但KFC的经营状况却远远不及麦当劳。
委托者提出的两个问题是:
①谁是KFC的主要竞争者,它们和KFC真正的差别在什么地方?
②在广东主要城市扩展市场,KFC应该如何进行商业布局?
前一个问题是较为独立的,可以从消费者、竞争者的角度进行比较,比较的内容包括目标市场、产品、促销卖点等;后一个问题则是较为规范的网点研究,研究需要考虑的因素有:
①目前KFC的布局现状和特征,比方说在什么地方存在布点,店址有什么样的商业特征,离竞争者店址有多远,等等。
②影响KFC布局的主要因素,如消费习惯、竞争者的压力、产品组合、人口流动特点、店址租期及租金,等等。上述因素中,哪几个因素是最关键的,改变这些因素的可能性。
③现有KFC网点的周边环境。按照委托者要求,依据商业惯例,研究者要考虑及解决的问题主要有三个:
1.布点城市的选择
布点的城市主要由委托方提出,考虑因素包括该城市的居民收入水平、人口规模、饮食消费习惯及当地的相关政策与法规等等。总体上看,广东省内大中型城市均具有良好的市场前景,但为了减少风险,循序渐进,城市选择应分步进行,首选城市包括广州、深圳和东莞。
2.布点方法的选择
根据什么来进行商业布点,存在不同的意见。为简化问题,我们采用“三图重叠”的方法来比较预选点。所谓“三图重叠”是在一张平面地图上分别描述竞争图、收益图和成本图。竞争图是指已有的能与KFC竞争的其他快餐店,如麦当劳,收益图是描述预选点的人流总量和构成,及其在此基础上的市场容量所形成的预期收益,成本图则是预选点租金及其他费用。一般来说,人流量愈大的地点,商业价值愈高,租金及相关成本愈大。因此,选址要兼顾两个方面。但考虑竞争状态而进行店址选择有两种完全不同的做法,一是紧邻竞争者店址选址,以多样性选择凝聚人流;二是独立选址,完全避开竞争者店址。当然,不管如何,KFC要求有足够的人流做支持,因此,一般的店址选择要求为当地繁华商圈或准繁华商圈。
3.相关背景资料
背景资料对支持选址十分重要,这些资料一方面可以了解和透视当地的消费水准和消费者偏好,另一方面又可印证KFC在世界其他各地选址的经验和规律。根据来源和性质差异,背景资料分为直接资料和间接资料,又可分为定性资料和定量资料,相对而言,当地居民的饮食消费偏好对选址的作用十分重要。
二、广州选址的背景资料
1.广州市概况(1997年)
广州市总面积7 平方公里,常住人口万人,其中农业人口万人,非农业人口万人;流动人口万人(1995年%抽样调查)。年海外旅208,01万人次,年国内旅游万人次。商业网点万个;商业餐饮网点万个。
2.居民收入
(1)居民与居民家庭收入
收入是反映生活水准的基本指标,同时制约或影响消费行为及偏好。有关资料表明,中国家庭的平均年收人为人民币10400 元,中位值为人民币8000元,其中城市居民收入中位值为人民币10000元,高于农村家庭收入。在中国特大型城市中,历次调查表明,广州居民收入仅次于深圳,高于上海、北京、沈阳、武汉、重庆、南京等城市。
(2)个人月收入
个人月收入指个人月固定平均收入,固定收入包括工资、津贴、奖金、利息及其他相对稳定的收入源。调查表明,1998年6月,广州居民月平均收入为1 元,其中人均收入600~1000元的家庭最多,占%。
(3)家庭月收人
家庭月收入指家庭月实际收入。调查表明,1998年6月,广州居民家庭月平均收入为3400元,其中2500元以下收入段的家庭最多,占%。
(4)家庭收入支出构成
食物开支占家庭总收入的比重变化是衡量人们生活水平的重要指标,1985—1998年,广州居民的恩格尔系数从下降至。各主要年度的恩格尔系数分别是:1985年为;1990年为;1995年为;1997年为。
调查表明,1997年与1995年、1996年比较,广州居民主要消费种类的支出比例变化不大,衣食住行、文化娱乐、人际交往等方面的支出逐年增长。相对而言,饮食支出的比重略有下降,教育学习费用、消费节余比重有较大提高,其中,居民消费节余年均增长在4%左右。
3.消费品
广州市居民家庭的耐用消费品拥有量和普及率在国内城市中仅次于深圳,居第二位。居民家庭的主要耐用商品的普及率在80%以上的包括彩电(95%)、电话(85%)、冰箱和洗衣机;普及率在40%一80%的有空调机(59%)和VCD音响(47%);普及率在40%以下的有电脑、手机。
4.家庭结构
居民家庭结构的显著变化是广州社会变化的重要特征之一,调查表明,家庭规模日趋缩小。平均每户人口数由1995年的人下降到1998年的人。同时,多代家庭的比重明显下降。这些变化,对家庭消费能力、消费方式等一系列的社会经济生活带来重要的影响。
5.居住条件
住房是一种典型的家庭消费,以家庭为单位来反映住房状况比个人平均占有面积更有说服力。调查表明,广州家庭居住面积80平方米以上的超过一半。居民住房的楼龄超过5年的占61%,楼龄在5年以下的为39%。
6.用餐习惯
近年来,广州市居民饮食条件和水平有较大的提升,尽管饮食支出比例逐步下降,但考虑到国内物价,特别是食品价格水平和收入的增长幅度,广州市居民的饮食支出额依然有一定的提高。
饮食地点:广州市居民一日三餐均在家用餐的家庭比例不足20%,而“一般不是”的比例为%;全家一起在家中用餐最多的是晚餐,占%,午餐的比例不足50%,早餐的比例也只有%。
饮食方式:居民对晚餐最为看重。在“您认为一日三餐中,哪一餐最重要?”这个问题上,%的居民回答是“晚餐”,选择午餐的比例低于选择早餐的比例,只占%。其中早餐、午餐较为简单,晚餐则较丰盛。
如果把饮食内容从另一个角度分为中餐、西餐和快餐,以5分制来表示个人感受,调查表明,得分最高的为中餐,达分;其次是快餐,为分;最后是西餐,仅为分。
如果把每天至少一餐食用快餐(盒饭、各类快餐店或集体食堂等)的人称为快餐一族,调查表明,这类人超过被访者的一半,约达60%。年龄较轻为这类人的主要特征。
选择快餐原因较为多样,但归纳起来,一是方便、简单、实惠;二是工作及生活环境限制。前者倾向于“自愿”,后者反映出“被迫”。调查表明,相对而言,约40%的人为“自愿”;60%的人为“被迫”。快餐一族的人群特征是:年龄特征:20—29岁的比例达35%,高于整体人口比例近15个百分点。
性别特征:男性高于女性约9个百分点。
学历特征:低文化程度与高文化程度相对较少,中等文化程度(高中、大专)的比例明显偏高,两者之和约占40%,高于整体人口30%的比例。
职业特征:以打工一族为多。
另外,流动人口较多(约占40%)。
7.饮食观念
食在广州是一个永恒的消费主题。在有60%的人认为广州人在中国大城市中处于中等偏上生活水平的大背景下,广州人最自豪的地方出人意料却又合情合理,那就是“食在广州,吃得好”,居民认同的比例高达%。
(1)时间观念
时间观念能从某种程度上反映出一个社会的现代意识,亦直接影响人们的饮食方式。
调查采用一组命题方式来测试人们的饮食观念,包括时间观念,结果,对于“饮食上我们非常在乎时间因素”,较多人倾向于认同,对于“花太多时间在家做饭不值得”认同比例亦多于不认同比例,这些都说明时间观念对广州居民的饮食方式影响不小。
(2)营养、环境、费用观念
中国饮食讲究色、香、味、营养、环境等各种因素,当然对消费者而言还必须考虑到费用。
营养观念:较多广州居民重视饮食的营养价值,认同比例达37%。
环境观念:愈来愈多的广州人日益重视饮食的环境气氛,认同比例为27%。
费用观念:相对而言,最多的广州人更在乎饮食费用,认同比例达51%。
(3)家庭观念
在中国文化中,饮食和家庭是分不开的,但这种观念渐渐被改变,调查表明,对于“家庭是最好的饮食场所”,认同的公众比例为50%。
(资料来源:蓝潮著:《助你成为营销高手》,珠海出版社 1998)