“回归直线法”在公司理财中的应用研究
摘 要:介绍了回归直线法的由来,给出了相关性检验的两种方法:相关系数法和方差分析法,在此基础
上,又给出了误差估计的 !种简单方法:最大误差法、平均误差法和标准差法,使“回归直线法”在公司理财
中的广泛应用,不仅具有可操作性,同时更具有可靠性 )
关键词:回归直线;相关性检验;误差估计 )
中图分类号:,#"#)" 文献标识码:- 文章编号:"$$$./0%+(#$$%)$".$$!0.$%
“回归直线法”在公司理财中是被经常采用的
一种定量分析方法,无论是在成本性态分析,还是
在销售预测、成本预测、利润预测及资金预测中,
都有广泛的应用,但人们往往忽略了相关性检验
及其误差估计,因而也就失去了回归直线法的应
用价值,试想,如果用回归直线法进行下年销售预
测的销售量为 #$$$台,误差多少不知道,或估计
误差为 "$$$$台,那么,这种销售预测还有什么实
际意义呢?本文重点介绍回归直线的相关性检验
及其误差估计 )
" 回归直线法的由来
回归直线法也称直线回归法,最小二乘法或
最小平方法,名称的由来都有各自的历史 )“回归”
名称的由来归功于英国统计学家高顿 1·2(3’4
("0## 5 "6"")和他的学生皮尔森 7·89:;<’4
("0/+—"6!+),他们在研究父母身高与其子女的
遗传问题时,发现高个子父辈的儿子们的平均高
度要低于他们父辈的平均高度,矮个子父辈的儿
子们的平均身高要高于他们父辈的平均身高,也
就是说,没有出现父辈个子高其儿子更高,父辈个
子矮其儿子更矮的两极分化现象,而都是朝标准
身高(+6 )+6=4>?)靠近 )为了描述这种有趣的现象,
高顿引进了“回归”这个名词来描述父辈身高 <
与子代身高 = 的这种直线关系 >
= @ !! >A! B $ >/"+<
说明子代的身高朝着标准身高“回归”,为了
纪念高顿这个伟大的统计学家,以后被引申到把
研究一个或一组非随机变量来估计或预测某一个
随机变量的观察值时,所建立的数学模型及所进
行的统计分析,统称为“回归”分析 >
“最小二乘法”是德国数学家高斯 2:;(C;=9D;=>?
2:E<<("AAA—"0//)于 "0$/年提出的,它是根据一
定时期内一系列的历史数据资料(即平面上 8 个
点),(<",=#)、( <#,=#)、⋯、( <8,=8),运用数理统
计中常用的最小平方法原理,对所取得的历史数
据加以计算,建立起自变量 < 与因变量 =F 之间的
直线方程
=F @ 0 B ?<
该直线与其它直线相比,可以使历史数据 ="、=#、
⋯=8 与直线上相应各点纵坐标 =
F
"、=
F
#、⋯ =
F
8 误差
的平方和最小,即"
8
6 @ "
(=6 5 =
F
6)
# 最小 >在此,取误差
平方和作为总误差的量度,是因为取误差代数和,
将会有正负抵消,若取误差绝对值之和,又不便于
数学处理 >这样,“最小”也即误差平方和最小,所
谓“二乘”是指平方运算,此即为“最小二乘法”或
最小平方法 !具体求解过程,只要将误差的平方和
!
"
# ! "
($# # $
$
#)
% !!
"
# ! "
($# # % # &’#)%
作为 %、& 的二元函数
((%,&)!!
"
# ! "
( $# # % # &’#)% 利用数学分析
的极值原理,分别令一阶偏导数
"(
"%
! &
"(
"&
{ ! &
通过解 %、& 的二元一次方程组得
& !
"!
"
# ! "
’#$# #!
"
# ! "
’#!
"
# ! "
$#
"!
"
# ! "
’%# #(!
"
# ! "
’#)%
% !
!
"
# ! "
$# # &!
"
# ! "
’#
" ! $
# #
&’#
其中:’# !
!
"
# ! "
’#
" $
# !
!
"
# ! "
$#
"
% 回归直线的相关性检验
根据回归直线法,无论任何一组历史数据资
料(’#、$#)# ! "、%、⋯⋯、",都可利用最小二乘法
求得回归直线 $$ ! % ’ &’ 而不需要事先假定 $ 与
’ 具有线性相关关系,也就是说,虽然所求直线 $$
! % ’ &’ 与其它所有直线相比,各点纵坐标 $$ # 与
历史数据 $# 之误差平方和最小,但并不等于能很
好地拟合历史数据所确定的各个点(即 ’ 与 $ 不
一定相关),有时这种拟和甚至毫无意义,因此,必
须进行相关性检验,所谓“相关性检验”,就是验证
所有的历史数据( ’#,$#)( # ! "、%、⋯⋯ ")是否大
致在一条直线上 !
所采用的方法,有方差分析法和相关系数法,
根据统计学原理,在概率为正态分布的情况下,随
机变量出现在期望值 ( "个标准差范围内的概率
有 )* !%)),出现在期望值 ( %个标准差范围内的
概率有 +, !--),出现在期望值 ( .个标准差范围
内的概率有 ++ ! /%)(期望值! !!
"
# ! "
$#*#,其中:*#
为第 # 个 随 机 变 量 的 概 率,标 准 差 " !
!
"
# ! "
($# #!
#)%
# " )!因此,随机变量出现在期望值 ( .
个标准差之外的概率为 & ! %*) ! & ! &&%*,而单侧
概率只有 & !"-) ! & !&&"-,我们不妨认为,实际值
与期望值的最大误差不超过 ( . 个标准差,即实
际值一般都在区间[! # .",! ’ ."]上,为便于查
表,取随机变量出现在期望值 ( . 个标准差之外
的概率# ! & ! &&,(#称为显著性水平或检验水
平)!在此基础上,介绍相关系数法和方差分析法 !
% !" 相关系数法
相关系数法就是计算相关系数
+ !
"!
"
# ! "
’#$# #!
"
# ! "
’#!
"
# ! "
$#
["!
"
# ! "
’%# #(!
"
# ! "
’#)%]["!
"
# ! "
$%# #(!
"
# ! "
$#)%# ]
.
然后利用相关系数临界值表["]查出 +(#,"),若 + 0
+(#,"),说明 ’ 与 $ 存在线性关系,从而可建立直
线方程 $$ ! % ’ &’,否则,说明 ’ 与 $ 不存在线性
关系,建立直线方程 $$ ! % ’ &’ 毫无意义 !
例 " 某公司生产甲种产品,)年来的成本资
料如表 ":
表 " 成本资料表
年份 "+ 1 " "+ 1 % "+ 1 . "+ 1 - "+ 1 , "+ 1 )
总产量 ’
(千件)
-* ,. ,, )* +& "")
总成本 $
(万元)
,& ,- ,) )- *, "&-
试用相关系数法确定产量 ’ 与成本 $ 是否存
在线性关系,建立回归直线方程,若预计 "+ 1 /年
总产量为 "%,千件,预测总成本为多少?
解:有关计算见表 %:
表 % 相关系数法计算结果
期数 " 产量 ’# 成本 $# ’#$# ’%# $%#
" -* ,& %-&& %.&- %,&&
% ,. ,- %*)% %*&+ %+")
. ,, ,) .&*& .&%, .".)
- )* )- -.,% -)%- -&+)
, +& *, /),& *"&& /%%,
) "") "&- "%&)- ".-,) "&*")
! -.& -". .%-&* .-."* .&)*+
相关系数
+ ! ) 1 .%-&* # -.& 1 -".
() 1 .-."* # -.&%)() 1 .&)*+ # -".%# )
! ")*,*
#%"&&* 1 ".,),
! & !++*)
+.第 "期 单昭祥:“回归直线法”在公司理财中的应用研究
万方数据
查相关系数临界值表,得 !(! "!!",#)$ ! " %&’%(
! !(! "!!),#)
(相关系数表没有 !(! "!!),#),这里! $ ! " !!))
从而有
! $ ! " %%*# + !(! "!!),#),# 与 $ 存在线性关系 "
从而可建回归联立直线方程,求出
% $ # , (&’!* - ’(! , ’"(
# , (’("* - ’(!&
$ ! "*!&
& $ ’"( - ! "*!& , ’(!# $ "" " (# 得到回归直
线方程
# $ "" "(# . ! "*!&$
"%%/年预测总成本 # $ "" "(# . ! "*!& , "&)
$ """ "#"(万元)
& "& 方差分析法
设 ’&" $
"(#( - #
0
()
&
) - & ’
&
& $"
)
( $ "
(#0 ( - #
-)&
方差分析法就是计算
*! $
’&&
’&"
$() - &)
"
)
( $ "
(#0 ( - #
-)&
"
)
( $ "
(#( - #
0
()
&
然后利用 * 分布表[&]查出 *!(",) - &)值,
若 *! + *!(",) - &),说明 $ 与 # 存在线性关
系,从而可建立直线方程 #0 $ & . %$
例 & 根据例 "资料,利用方差分析法验证 #
与 $ 的线性相关性
解:利用例 " 的计算结果,可得回归直线方
程:#0 $ "" "(# . ! "*!&$
并据以进行有关计算如表 (:
表 ( 方差分析法计算结果
期数 #( $( #0 ( #
- ( #( - #
0
()
& ( #0 ( - #
-)&
" )! ’* ’% "*)# #* "*( ! "!&" (#! "!"(
& )’ )( )( "*## #* "*( ! "!"* &&( "%&"
( )# )) )) "’/! #* "*( ! "&*" "/* "’%!
’ #’ #* #) "*%# #* "*( ( ")%) * "#!*
) *) %! *( ")’! #* "*( & ""(& &"# "(*’
# "!’ ""# "!’ "(%& #* "*( ! "")’ "&#’ "#)#
" ’"( ’"( # "&!" &&)& "!/&
在这里,易知 #- $
"
)
( $ "
#(
) $
"
)
( $ "
#0 (
) $ #* "*(
*! $() - &)
"(#
0
( - #
-)&
"(#( - #
0
()
& $(# - &)
&&)& "!/&
# "&!"
$ "’)& "/")
查 * 分布表 *!(",) - &)$ *! "!!)(",’)$ (" "((
由于 * $ "’)& "/")#*! "!!)(",’)$ (" "((
也即 # 与 $ 存在线性相关关系,从而,回归直
线方程
#0 $ "" "(# . ! "*!&$
有意义 "利用它预测 "%%/年总成本具有可信和可
靠性,"%%/年预测总成本
# $ "" "(# . ! "*!& , "&) $ """ "#"(万元)
( 回归直线的误差估计
误差估计的方法很多,简单的误差估计有以
下 (种:
( "" 最大误差法
最大误差法是用历史数据各期实际值与预测
值误差绝对值除以该期对应的自变量,取其最值,
乘以预测期自变量,作为最大误差的一种方法 "
在例 &中,各期误差绝对值除以该期自变量,
其最大值
$ 123{
4 5" - 5
0 4
3"
,
4 5& - 5
0
& 4
3&
,⋯⋯,
4 56 - 5
0
6 4
36
123{! 7"’’’* ,
!"&’
)( ,
! 7)(
)) ,
" 7*%#
#* ,
" 7’#
%! ,
! 7(%&
""# }
$ "7*%##*
最大误差 $ "7*%##* , "&) $ (7’*)(万元)
相对于总成本 """ 7#"万元,最大误差不超过
( 7’*)万元,显然是可允许的 7
( 7& 平均误差法
平均误差法是用距预测期最近的 6期历史数
据中,每期实际值与预测值误差的绝对值除以该
期自变量,求和后乘 "6,再乘预测期的自变量,作
为估计误差的一种方法 7
在例 &中,取 6 $ (
平均误差 $( 4 #’ - #) 7*%# 4#* .
4*) - *( 7)’ 4
%! .
4"!’ - "!’ 7(%& 4
""# ),
"
( , "&)
$ "7%/*(万元)
相对于预测总成本 """ 7#"万元,平均误差在
" 7%/*万元左右,显然是可允许的 7
!’ 辽宁大学学报 自然科学版 &!!’年
万方数据
! "! 标准差法
标准差法是用标准差与置信概率的关系来进
行误差估计的一种方法 "
在例 #中,期望总成本!$!
%
& $ ’
!"(& $"! $ %) #)!
(万元)
标准差"$
!
*
& $ ’
(!" +!)
#
# $ $ ’, #-’(万元)
’,,.年实际总成本 ! 与期望值 %) #)!的最大
误差不超过 / !标准差,即 0 ! + %) #)! 0 1 ’, #-’ 2 !
$ 3) ##!(万元)#当然,历史数据越多,这种误差估
计就越可靠 #
通过上面误差估计,’,,.年实际成本 ! 与预
测总成本 ’’’ #%’万元的误差在 ’ #,.)万元左右,
最大误差一般不超过 ! #-)3万元,即 0 ! + ’’’ #%’ 0
1 ! #-)3万元,显然也在标准差法的估计范围内 #
总之,回归直线法的实质是以直线代替曲线,
因此,不论在成本性态分析,还是在销售预测、成
本预测、利润预测、资金预测以及其它方面,都必
须进行相关性检验和误差估计,否则,其结果就不
可靠 #
参 考 文 献 :
[’] 袁荫棠 "概率与数理统计[4]"北京:中国人民大学
出版社,’,,5,.:#,附表七,附表六 "
[#] 孙柄耀 "数据处理与误差分析基础[4]"郑州:河南
大学出版社,’,,5,%:’"
!"# $%%&’()*’+, -#.#)/(" +0 1’,#)/ -#2/#..’+, 3#*"+4 ’,
5+6%),7 8’,),(#
6789 :;<=>?&<*@
(%&’’()( &* +,-"$(-- ./0"$"-1231"&$,4"3&$"$) 5$"6(2-"1!,78($!3$) ’’55!%,%8"$3)
!"#$%&’$: A;&B <CD&EFG &*DC=HIEGB D;G =C&@&* =J F&*G<C CG@CGBB&=* KGD;=H <*H LC=M&HGB DN= KG<*B =J GCC=C GBD&K<>
D&=*:E=CCGF<D&=* E=GJJ&E&G*D <*H <*<FOB&B =J M<C&<*EG" P* D;&B Q<B&B,@&MGB DN= B&KLFG KG<*B =J GCC=C GBD&K<D&=*:
K<?&KIK GCC=C,<MGC<@G GCC=C <*H KGD;=H =J BD<*H<CH HGM&<D&=*,K<RGB F&*G<C CG@CGBB&=* KGD;=H D;<D &B N&HGFO IBGH
&* E=KL<*O J&*<*E&<F K<*<@GKG*D ;<B *=D =*FO =LGC<Q&F&DO QID <FB= CGF&<Q&F&DO "
()* +,%-#: CG@CGBB&=* F&*G;E=CCGF<D&M&DO DGBD;GCC=C GBD&K<D&=* "