統計應用上常見的謬誤
统 计 应 用 上 常 见 的 谬 误
谢邦昌 辅仁大学统计系教授兼主任
叶瑞铃 辅仁大学应用统计研究所研究生
壹、绪论
让统计结果更接近事实
一、研究动机
「统计」是一门新兴的科学,可号称是人类在二十世纪的十个伟大发现之一。自二十世纪初,从Neyman、Pearson及Fisher等人发表一连串开拓性论文之后,「统计」便不断地蓬勃发展,一直到今天,不论在自然科学或是社会科学的各个领域中,都找得到它的踪迹。事实上,它已成为我们生活中的一部份。
随着现代科学的不断发展,「统计学」不仅早已从「数学」中独立出来,而也已成为在社会科学研究上的一种专门的学科。今日在科学研究中,「统计分析」的应用早已有其不可或缺的重要地位,不仅于此,在一般人的生活周遭上的应用上,甚至在个人理财活动中都少不了统计分析的应用。因此,将统计学当成一种解决问题、寻求真相的「工具」,咸信将使「统计」对人们的生活产生更大的影响及帮助。
「统计」的应用范围极广,其方式主要在搜集、整理、陈示、分析及解释资料。并可在较少的成本花费下将吾人有兴趣的事物之全体(注1)抽出一部份来观察与研究(注2),然后根据所得到的信息用科学的数量方法来推测所欲了解的事实。所以根据以上所述,统计学又分为叙述统计与推论统计两大部份。现在各方面的研究工作者无一不将统计学视为最有帮助的工具之一,除了在一般的学术研究之外,尤其在工商业的各项业务,如财务、工管、销售等,都需要应用统计资料及统计方法来作分析及推论,方能使各项工作顺利完成(注3)。
近年来,统计确实已受到学界及工商业界的普遍应用;不管是学术研究论文、期刊,或者是政府出版品,乃至于民间企业刊物、杂志等,都可看到统计应用的大幅成长与统计专业程度的要求明显提高。但阅读与参考这些文献、资料的读者往往只专注于统计数字的大小,而忽略了数字背后的涵义,殊不知不少数字可能因为统计分析方法的误用而导致结果推论的错误。因此,探讨一般常见的统计分析应用上的误用情形,为本研究的第一个动机。
研究统计的人都一直深信着统计数字中永远隐藏着某些事实的真相,等待人类的智慧去寻找。多年前有位学者说:「Statistics may not tell the true, but it never lies.」(注4)。这句话反应出统计数字也许不能告诉我们真相,但是它绝对不会撒谎,只有人们才会这么做。因此,如何使统计数字说出真话,并找出统计误用的原因及补救的方法,为本研究的第二个动机。
二、研究目的
统计理论继续不断的发展,其所论述的范围及应用的层面愈来愈广,统计除了可叙述数据、推论数据外,更重要的是其「预测性」的功能。因此,如何善用统计分析工具以帮助完成决策与验证实验假设,实已成为企业经营管理与科学研究之重要课题。以周密的设计,搜集完整的有关资料,经过适当的统计分析所得的结果作为依据,才能使所冒的风险与失策的可能愈小,而迅速得到预期的目的(注5)。
综合以上所述与研究动机,遂引发本研究之目的:
(1)探讨统计分析应用上常见的错误情形。
(2)了解统计分析误用的原因及探讨其补救的方法。
三、研究范围
统计的应用与分析方法的范围甚广,本研究仅就下列二部份进行探讨:
(1)学术研究部份:针对各类学术论文之「研究设计」、「资料分析」、「论文撰写」部份加以讨论。
(2)日常生活应用部份:如「民意调查」、「收视率调查」等等生活上常见的统计应用方面加以讨论。
本研究先针对上述二个范畴中常犯的错误情形加以讨论,其次以实际的情形举例说明,并讨论其改进与补救方法。
此外,文内所提之例子并不列出其出处,一方面维护他人写作之权益,另一方面保障并尊重其隐私权。
注释
1.在统计的术语中称之为母体。
2.在统计的术语中称为母体的任何部份集合为样本。
3.蔡宗儒(淡江大学统计系讲师),「统计与生活」,社
教资料杂志,第二0二期,p4。
4.郑天泽(政治大学统计研究所副教授),「统计之应用
」,社教资料杂志,第二0二期,p3。
5.颜月珠(台湾大学财务金融学系教授),「商用统计
学」,三民书局八版,民国82年8月。
贰、统计应用常犯的谬误
在本部份,将分别针对实务应用上在统计分析时常见之错误情形,经归纳与整理后分述于后。
一、抽样方法的不适当
样本是否能代表母体 ?
1.「抽样方法」概论
基本上,抽样理论包含三个主要的部份-抽样、估计、推论。「抽样」在于给予从母体抽取样本的规则;「估计」在于利用样本统计给予母体值的点估计;「推论」在于给予母体值的区间估计。在本部分仅针对「抽样」部份进行探讨。
抽样方法在统计中的重要性可由图2-1中清楚的看出。
图2-1 抽样对统计之重要性图示
为了解母体的性状,经由抽样调查,并以其结果推测母体,此为统计推论的必要过程(注1)。抽样方法选择的适当与否,不仅影响着如何估计,而其精确(precision)度及误差(error),皆关系着整个样本是否可有效的推估母体。
此外,在实务应用上,抽样方法也涉及两个重要的因素:即「效率」与「成本」。提高效率与降低成本为每个从事研究或调查者所追求的目标。
抽样方法可分为:机率抽样与非机率抽样两种。在此我们可简单的将两者加以区别:「机率抽样」可推估母体;「非机率抽样」因其较主观而产生偏歪样本,故只能找出母体的某些特性,而未必能推估母体。故一般较严谨的调查或研究其抽样皆以前者方式为之。而常见的机率抽样又可分成:单纯随机抽样(simple random sampling)、分层随机抽样(stratified random sampling)、部落抽样(cluster sampling)、系统抽样(system sampling)、多阶段抽样(multi-stage sampling)。非机率抽样则以任意抽样(convenience sampling)、判断抽样(judgement sampling)、配额抽样(quote sampling)为代表。
选择抽样方法时之基本考虑为:样本结构是否和母体结构有一致性。因此这也是为何在完成抽样后必须作适合度检定的理由,基于此项大原则我们才可选择适合母体结构的抽样方法。在此对各抽样方法及其特殊步骤不作多述,仅将其优、缺点及适用时机列于表2-1。
表2-1 各种抽样方法之比较
抽样方法
优点
缺点
适用时机
简单随机抽样法
分层抽样法
部落抽样法
系统抽样法
1.母体名册完整时,直接由母体中随机抽出样本,方法简单。
2.由于抽出机率均等,较易估计母体总值及抽样误差。
1.层间差异愈大,层内差异愈小。
2.适当分层抽样推论之误差,恒较简单抽样为低。
3.可得到各层之估计值。
1.当部落间差异愈小,部落内差异愈大,则抽出样本统计精确度愈高。
2.部落内样本较为集中,访查员行动半径不大,可节省调查人力及费用。
1.随机起号仅需抽出一个,以后累加即可。
2.当个体序列成随机出现时,其推估精确度和简单抽样相同。
1.通常推算结果之精确度,较分层集体、分段抽样法为低。
2.由于抽出样本较为分散,所需调查人力费用较高。
3.无法估计子母体特征。
分层后之样本数据,其整理推算工作,通常较简单抽样为繁。
1.以部落为抽样单位,各项整理统计费用将会增加,故一般多采成对抽取,便于估计误差。
2.通常在各部落内分子无甚差异时,将增加部落间差异,调查结果误差必大。
3.各部落内含个体多寡不同时,亦使误差加大。
1.当母体名册和个体单位数不完整时,无法采用。
2.遇有个体成某种周期序列,又恰与抽样间隔相近时,则抽样误差较大。
1.母体较小且知道抽样单位的数量。
2.有较完整的母体名册。
3.单位访问成本较为固定。
4.母体名册是有关母体信息的唯一来源。
1.当样本的分层达到各层的抽样单位的特性尽量接近,而层与层之间的差异尽可能地扩大时使用。
2.当母体中的特殊单位较多或分布不均匀时,为避免抽样误差亦使用之。
1.当母体成若干部落,且部落与部落间个体同质,而同一部落内个体异质时使用。
2.当无法取得母体集团名册或划样样本对象为前提时使用。
1.母体有现成次序的场合时使用。
2.使用此法时于划分间隔抽取的母体,其所有个体的排列次序必须是随机的。
抽样方法
优点
缺点
适用时机
多阶段抽样法
任意抽样法
判断抽样法
配额抽样法
1.多阶段抽样法为群集与分层抽样之折衷办法,兼取两者之优点。
2.配合行政区域抽样,抽取手续与调查管理均较便利。
根据调查者自身的方便程度,不依据特定的抽样原则,具有经济、方便之优点。
可由人为意志自由选择调查对象,不受抽样设计条件之各种限制,容易进行调查。
适用于母体集团无法取得,且抽样手续简便,为营销研究者所乐于使用。
分段抽样之误差可能加大,且整理分析较其它抽样复杂。
调查结果容易产生偏误,如盲人摸象。
调查结果无法推估母体平均数及抽样误差,如选择不当,其误差可能甚大。
合乎条件之样本难得,抽样之误差也未能估计。
当母体集团分布广而散时,如以一段式抽样,势必耗时、耗费,此时则以多段式抽样弥补其缺失。
由调查者主观决定。
由调查者主观决定。
由调查者主观决定。
最后要提到的是,选择一个适合的抽样方法固然重要,但抽样过程的处理不当亦可造成人为的疏失,而导致结果的错误增加,亦是值得注意的问题。
2.常犯的错误情形
由以上说明我们可知:抽样方法对整个统计分析的过程与结果影响甚大。而一般影响调查者对抽样方法之选择的因素不外乎(1)正确性、(2)方便性、(3)时间、(4)费用。此四项因素往往无法兼顾,这也是为何一些研究者在其研究论文中常会提及因时间、经费不足等之研究限制了!事实上,在抽样方法上的错误也多半因此四项因素而发生。
我们常发现:许多以「××商品之消费行为之研究」、「××与△△之关系性研究」或「××商品之市场调查」等为题之研究或调查,其研究母体为所有消费者或所有某一特定族群,但调查者往往会先将抽样母体定为台北市、台中市、高雄市三区(此一观念类似部落抽样法之部落定义),在从其中用简单随机抽样、分层抽样或部落抽样等方法抽出若干样本数来统计分析,最后则用这些样本来代表所有的母体,如此以偏盖全的说法,更别说抽样及估计误差之估算了!
更甚者,一些如收视率调查、民意调查等的数据数据在此方面的错误与影响更大;因为这些数据大多会透过媒体的报导而误导消费者,进而影响其判断与决策。在日常生活中这类错误讯息层出不穷,如某报纸报导:「××电视公司八点文件连续剧收视率突破40﹪,勇冠三台。」如某报纸民意测验结果:「×××候选人民众支持率达50﹪,大幅领先其它两位候选人。」但在相信这些数字之前,我们至少应先了解其抽样方法是否正确与适当,否则它们根本毫无意义可言!
二、样本大小的问题
勿又要马儿好,又要马儿不吃草
1.决定样本大小
由于任何一种抽样方法都无法包含母体中的每一成员(除普查以外),因此抽样误差由此发生。抽样误差和样本的大小有着密切的关系;一般来说,抽样误差通常随样本的大小之增加而降低。此点由中央极限定理(Central Limit Theorem)可看出端倪(注2)。此外,在实务上我们通常如下计算抽样误差(Sampling Error):
简而言之;
x
由 1.期望值:E(P)= (n:样本数)
n
P(1-P)
2.变异数:V(P)=
n
3.机率:P P ×
故 ×=≒1
由上可知,抽样误差通常以 来计算,样本愈趋近于无限大,则抽样误差愈小。由此也可看出样本大小对抽样误差之重要性。
话虽如此,由先前所述,我们也应注意:若是抽样计划不好则样本愈大可能偏离母体愈远,造成更大的误差发生,故选择适当的抽样方法则不但可降低抽样误差且可加以估计。
2.常犯的错误情形
同样的,在日常生活中我们常发现:不少统计分析结果往往因为其样本数过少而导致结果的不正确。因为常常研究者或调查者可能因为节省时间、成本等因素,而以较小的样本进行统计分析,因此也使得结果不正确。所以,当我们阅读某项统计结果时,最基本上应注意其样本数的大小及其抽样误差的推估,而媒体也应将此基本要项注明以建立其传播的责任。
此外,在实务上我们从选择了适当的抽样方法到将数据搜集后,接下来就是如何计算估计值,但在大多数的情况下,研究者或调查者往往忽略了抽样方法的不同而应搜集不同的样本大小数据,而常常采用在简单随机抽样方法下的计算方式,其结果也就值得怀疑。
在此需要强调:抽样误差的发生和抽样方法的适当与否及样本之大小有密切的关系,有时过大的样本亦会导致结果的偏差,且会浪费时间与金钱的成本,因此唯有选择适当的抽样方法、审慎决定抽样样本的大小,并配合研究的方向,方能提高调查结果的正确性,这也是较具实质意义的作法。
三、P-值的误用
仅以P-值大小来作推论是值得怀疑的
-值和样本大小的关系
提到P-值之误用,大部份的研究者或调查者都会认为P-值和抽样样本数目的大小有关。样本数目愈大则会使得P-值变小,虽具有统计分析上的意义,但却不具研究或调查的价值;而抽样样本过小则会导致P-值过大,促使检定力(即所谓统计的"power",注3)的不足,进而使得统计假设不易达到其显著水平。
在多数的研究论文中发现;研究者往往在检定分析时会以P-值<作为是否达到统计分析意义之标准。如某一硕士论文以「百货公司商店印象与消费者购买决策之相关性研究」为题,在其分析结果中提到:以对假设Y:「不同百货公司商品消费群与人口统计变量无关」做独立性检定,结果在年龄、职业与月平均收入三项之P-值<,达到显著水平,故可拒绝上述之虚无假设Y。在此要特别注意的是;在统计分析上对使用P-值时应特别考虑其样本数目是否适中,才能对假设作进一步的推论,如此才有统计上之意义。
以上所云为一般观念上P-值在统计分析上的运用,以下将讨论一些常见的谬误。
2.常犯的错误情形
以上述硕士论文为例,本假设是以-独立性检定及Pearson相关系数(或相等之无母数法)来检定「不同百货公司商品消费群与人口统计变量无关」之假设,它是一种变量以名义尺度表示的相关性测定,故在样本数适中时,这类分析的常犯错误就是过分引用P-值。需知P-值在此情况下所检定的是母体的相关系数(p)是否为零,亦即是检定不同百货公司商品消费群与人口统计变数有没有相关。当P-值小于显著水平()时,我们只能推翻虚无假设(),表示两者间有其相关(如上述的年龄、职业与月平均收入等三项),但P-值本身并无说明相关程度的强弱,且在样本数目不太小时,样本相关系数(r)大于或时都有可能达到统计意义,但大多数的研究者或调查者却都即以P-值<已达显著水平而大作文章,关于此点是值得怀疑的。
除此之外,有些人对单尾与双尾P-值之报告会显得没有差异,如上述之以-独立性检定为一右尾之单尾检定,但有些论文中却常以报告中的双尾P-值来做单尾检定的叙述,此乃因为一般统计报表中所显示的多为双尾P-值的因素,而报表研读者对分析报表之经验不足或判读错误又形成了另一个错误。
另一常见的错误是当比较三个或以上不同组别的时候(如MANOVA),研究者或调查者往往只使用一个P-值来报告不同组别的差异情形,虽然ANOVA的P-值非常小(通常<),但因并未进一步实施多重比较(multiple comparison),而却又在结论中提出各组间比较性之关系性叙述(如A组最好,而B组又比C组好),研究者或调查者如此光以ANOVA的P-值来推论多重比较之结果是过于大
意的。
四、型Π错误(Type Π Error )的忽视
β值太大容易否定两变量既有的关系
1.哲学观点与统计学观点
许多统计应用之研究或调查中,研究者或调查者通常着重型Ι错误的机率α,而采用相当严苛的标准,在此情形下,却忽略了型Π错误的增加,则可能导致统计分析结果的错误。
社会科学与自然科学有一项很大的差异;自然科学的法则(Law)大都是普遍性法则(Universal Laws),它是指「每X事件发生后,Y事件就会发生」;而社会科学截至今日为止尚未找到符合如此的法则,然在社会科学中所使用的法则仅能被称为统计法则(Statistical Law)(注4)。由此可知统计对社会科学的重要性。
自波普(Poper)提出否证论后,统计学的发展亦受到影响。简单来说,否证论即「不论有多少次的成功,只要有一次的失败就足以推翻整套理论」。当然,如前所述,在社会科学中并没有普遍性法则存在,任何理论被测试时,或是任何"被研究关系"被证实时,都会面临机率的问题,为了强调确认程度(the Degree of Confirmation)的提升,所以在欲否定的虚无假设上,即被设定了如此严苛的标准(通常α=或)。
在此对型Ι错误与型Π错误之定义不再赘述。在一般的研究中,研究者是在寻找一些变量间的关系,所以在统计检定时,会有如下之形式:
:A与B无关
:A与B有关
在一般情形中讨论α,也就是在「A与B事实上无关」的情形下却认为「A与B有关」。严格的α值意味着否定论的说法-不要随意地认定关系。而从另外一方面来考虑,在「A与B事实上有关」的情形下,而被认为「A与B无关」,这种错误是比较轻微的。
2.常犯的错误情形
根据上述所述,对此必须提出二项批判:第一:从效果面来看,被否定的机会太大,而就此认定研究或调查失败是过于草率的,其原因可能只是β值太大而造成的失败。第二:社会科学研究的范围太大,往往一项关系被否定后再被研究之机率不大,因此,在每次统计检定时,附上β值的计算应有其必要性。由此可知,对型Π错误之重要性忽视而导致β值之忽略,是最容易造成的错误。
其次,若是抽样样本不够大,就算达到假设之显著水平,亦无法被证实。以t检定为例:
t之计算方式,简单来说可由两部份组成:
t = ×
式中,r表示两个变量间之相关程度,是受两个变量间关系的强弱而定,r/则可以解释成作用力(Effect Size),df则可解释成样本大小对统计值t的贡献度,可称之为研究力(Study Size),将此概念化可转换成下式:
显著性检定=作用力×研究力
作用力是指变量间关系性之强弱对显著性检定之影响,研究力是指样本大小对显著性检定之影响。
举一个例子,若在两个变量间关系强度不弱时,假定为,其作用力已达中度之水平(注5)。如果采用α=双尾检定,在总样本数只有100个的情况下,则关系被证实出来的机会不到六成,如果α=时,则机会立刻下降至不到四成。由此可见,如果研究的样本不够大,就算是有关系存在的事实,也无法被证实。
Cohen曾提出一套测定α及β相对严重性的指标,称之为β/α比,即在一定的作用力及固定的样本大小下,每设定一个α值,就相对产生一个β值(注6)。藉此观念,可整理出如表2-2的计算值(注7)。
表2-2 作用力与显著水平之关系
effectt size() and significance level(.05 and .10)
N α=
r=.10
.05 .10
r=.30
.05 .10
r=.50
.05 .10
10
20
30
40
50
60
70
80
90
100
120
140
160
180
200
300
400
500
600
700
800
900
1000
19 9
19 9
18 8
18 8
18 8
18 8
17 8
17 8
17 8
17 7
16 7
16 7
15 6
15 6
14 6
12 5
10 4
8 3
6 2
5 2
4 1
3
2
17 8
15 6
13 5
10 4
9 3
7 2
6 2
4 1
4 1
3
2
1
13* 5+
7* 2+
3 1
2
Note:Entries are to nearest integer;blanks indicate values<1.
*For r=.70 these ratios would drop to 6 and <1,respectively.
+For r=.70 these ratios would drop to 2 and <1,respectively.
由表2-2可了解到问题的严重性,当关系强度不是很高时(r=),如果样本数不是很大(样本数不超过100),型Π错误的机率将高出型Ι错误机率很多,此意味着:很容易忽略或否认两个变量间既有的关系。
五、问卷「信度」未建立
未建立信度或使用不当的判定信度方法,可能以偏概全
1.信度评估的概念
「可靠度评估」(reliability evaluation)在问卷调查时又称为「信度评估」,在今日各种科学的量化研究中是很重要的一环,问卷的信度与效度如未建立,则整个投入时间、人力与金钱等资源的研究或调查很可能结果毫无可信之处。
在问卷信度评估的过程中,常用到不同的统计方法加以分析,可是许多研究者或调查者通常不了解「信度」的内容其实甚为广泛,可概略分为再测信度(test-retest reliability)、客观性(objectivity)、内部一致性(internal consistency)等多个项目,因此往往在此情况之下其研究或调查结果因为没有建立信度而变得毫无价值。
不同种类的信度、不同种类的数据及不同的实验设计都需要以不同的统计指标作为评估的方式,很多时候在同一份问卷的审查过程中需要用到多种的指标以判定其可信的程度。
譬如,我们可能需要以「内在等级相关」(Intra-Class Correlation,简称ICC)系数评定其再测信度;再以Cronbach's α审定其内部一致性;有时候还需要以「重复测验变异分析」(Repeated Measures ANOVA)来找出是在问卷问题本身、亦或是不同的访员、甚至是不同的研究对象方面发生了不可信的因素。
2.常犯的错误情形
在许多研究与调查中发现:问卷信度未建立的情形不在少数,这使得研究或欲调查问题根本无法得到确实的答案与结果,且未建立信度的问卷所得到的数据往往不仅没有结构可言,其结果更可能过于主观与发生以偏概全的情形。
在此所说的「以偏概全」,是指某些研究或调查,仅以一种统计方式来证明整份问卷的可信度。Cronbach's α点估计的方法是在一般研究中最常出现的问卷信度分析法,但不少研究或调查仅以Cronbach's α点估计值超过,就认为问卷可信而实施访问,虽然这些研究者或调查者在Cronbach's α的使用上、计算上或解释上并无错误,但殊不知Cronbach's α这一指针仅显示以一个总分代表类似的问题是否合理,而不能仅以此一指标有信度就认为整份问卷可正式实施访问。
此外,在前面提及的「再测信度」方面,许多人虽然在经过文献探讨后,能够选择合适的研究方法,如「皮尔森相关系数」(Pearson Correlation Coefficient)、「内在
等级相关系数」等,然而,在很多时候他们并没有对这些系数的优劣做更深入的探讨,只由它们高于预设的水平即可(一般常用的临界标准为),在此要提出的是:「皮尔森相关系数」、「内在等级相关系数」在问卷不太可信的情况下,其值仍可能偏高而超过的临界点(注8)。比如说当有系统偏差(systematic bias)时,皮尔森相关系数有时会接近于1;而当问卷中有不少问题属重复性问题时,ICC很可能高于,且多数使用者在使用ICC时,不知道ICC有好几种,而应在不同的情况下使用不同的ICC(关于ICC之使用在此不多述及)。故以此说来,研究者与调查者在使用时需格外小心。
六、多变量分析中对自变项之选择问题
自变项的选择不应先使用单变项方法来决定
1.自变项的选择过程
在此以线性复回归来解释在一般使用多变量分析时常见的操作现象,即是因为多变量分析有多个自变项,故大部份人便会在进行多变量分析前,先以单变项方法(如简单线性回归)分析,试图在众多的自变项中先找出具有统计意义之项目纳入复回归分析中。
使用此一方法具有下列两种好处:首先,假如某些变项在单变项或多变量中都具有统计意义或都不具统计意义,则对于结果与解释都不会造成太大的影响。另一方面,某些自变量在简单回归中达到意义,但到了复回归中
却意义全失,如此的情形一般也都能找到统计上的原因,此外,通常如果在分析之前先检查各自变项间的「相关矩阵」(correlation matrix),也不难发现其原因。
2.常犯的错误情形
以上所述是多变量分析中自变项之一般选择方法,但我们也发现许多文献中在应用多变量分析时,其自变项的选择完全仅依照研究者或调查者主观的判断而产生,甚至一般的商业调查中更无文献的探讨而以经验法则来设计问卷,如此似乎过于武断而容易主导统计分析的结果,这是一般最常见的谬误情形。
然若依循上述之方法,则最常发生的问题是把单变项分析时,达不到统计意义的变项先行删除掉,研究者或调查者认为很有可能这些自变项如果被放在复回归中分析的话,很有可能不会有意义,但若其一旦有意义而又被先前淘汰掉的话,则数据内的含意便会流失。如此一来,则对统计分析的结果可能造成无法估测的影响。
七、统计方法正确,但程序编写错误
类别性数据在程序编写时须以虚拟变量处理
1.问题可能发生的原因
大部份的人在从事某项研究或调查工作时,都会做充分的资料查证、分析与相关理论、文献的探讨,其中当然免不了会参考其它研究或调查,只要有相同的架构及目的,便采用数据中所用到的统计方法;既然有例可循,依此分析自然可将统计方法选择错误的机率降至最低。但可惜的是,一般研究论文或调查资料中对统计分析的过程及其运算过程并无完整且深入的提及,不少研究者或调查者在一知半解的情况下,依样画葫芦的结果却造成了更严重的错误,而这些错误往往并不是在研究架构或统计方法选择中发生,而是在软件的使用与程序的编写中所犯下的错误。
此外,由于各种统计软件操作使用方法不一,统计报表的研读方法也不尽相同,在使用者对该软件不熟悉且信心缺乏的情况下,在操作过程与研读报表上发生错误的情形也是经常发生的。
2.常犯的错误情形
一般发生在统计程序编写错误的情形中,除了人为操作的错误外(如键入字符错误等),较常见的是「连续变项」与「类别变项」间的数据转换问题。如某一硕士论文在探讨银行从业人员的工作满意度中的压力与压力来源的问题时,在分析影响压力感高低的因素时,因为「压力」在量化后其值介于0与100分之间,为一种连续性的变项,所以该研究者以「逐步线性复回归」(stepwise multiple linear regression)分析,若在「常态分布」、「线性关系」、「相同变异」等统计分析前提都符合的情况下,选
择此一方法并无不合理之处。但在此要注意的是,在这些自变项中有颇多的类别性数据,有些是两分的(binary,如性别),有些是有排序的(ordered,如教育程度),还有一些是不排序的(unordered,如不同部门),这些自变量在程序编写时均需以「虚拟变量」(dummy variable)方式处理。然在键入数据的过程中,一般每一个变项都先以1、2、3...,等代号输入,必须先转换成虚拟变量始可放入复回归中,再行检定其统计意义。唯不少人并未做虚拟变量的转换,而直接把输入的类据(即1、2、3...,等)作为自变项的数值,所跑出来的结果自然是错误的。如此的情形,相信应不少见才对。
八、统计方法前后不一致而互相矛盾
应用统计方法时须符合前提假设与使用时机
1.问题可能发生的原因
一个研究或者是调查工作,一定有其欲研究、调查之问题与目的,然后依循此问题与目的,经过充分的文献探讨,再进行到研究的设计、数据分析与结论。这是一个个部份环环相扣的过程,而在量化研究中调查问卷的更是需要依照研究的目的、理论的应用等来设计,再以适合的统计分析方法来得到欲知的结果。
但在某些研究或调查中发现,许多被采用的研究方法是依照问卷的问题来随意采用的;比如说,碰到自变项与依变项皆为连续性的数据时,就应用「相关分析」、「复相关分析」等。而当依变项为连续性数据,而自变项为类别性数据时,则马上会考虑「变异数分析」、「t考验」等。若依变项与自变项两者皆为类别性数据时,则又会使用「考验」。但这些使用者往往并不知道各种分析方法之前提假设与使用时机,甚至有些问卷设计毫无理论支持,更遑论使用适当的分析方法了。
归咎原因,这种统计方法前后矛盾的情形乃是因为研究者或调查者对研究方法或统计分析理论的不熟悉所致,而此种情况,最常出现在一些商业杂志的意向调查中,其结果也常常过于主观而不正确。
2.常犯的错误情形
所谓统计方法前后不一致,举例来说,某商研所之硕士论文研究国中学生对饮料的购买行为,该研究以购买地点为依变项,而该变项之测量以李克五点量表给分(1-5分),故为一连续性的变项,此外该研究依购买频率将国中生分为高、中、低三种消费群。在此,研究者认为三种消费群的购买地点之变异数差距太大,而购买地点不论在任何消费群都不太依循常态分布,故他以无母数方法之威克森等级和测验(Wilcoxon rank sum test)处理;而当他试着了解购买地点与其它变项(如信息来源等)个别之关系时,都以Pearson相关分析,这样的分析方法看起来是可以接受的。可惜的是,当他进一步了解在有意义的变项(即上述之信息来源等,在计算Pearson相关分析时之P-值少于者)调整后,各消费群的购买地点是否仍有显示差
异时,却使用了复回归分析法。我们知道,在使用复回归时,必须遵循一些统计的前提假设,其中两个假设便是「常态分布」及「相同变异」,而这两个假设,尤其是「相同变异」对统计结果的影响甚巨,偏偏在该研究论文内又如前述地使用了威克森等级和测验和Pearson相关分析,直接与间接的否定了这两个假设的可能性。这类型前后互相矛盾的统计方式,也是应当特别注意及避免发生的。
九、统计图表利用不当
统计图表应视统计数据的特性来选用
1.统计图表之应用
统计图表在统计应用方面亦是非常重要的一部份,因为文图的整合可使阅读数据者能清楚的从图表中知道数据的特性及研究或调查所想要表达的结果,而好的统计图表的运用则更可以吸引读者的视线而增加阅读的兴趣。
更重要的是,在许多趋势分析上,统计图的运用能使读者一目了然,举例而言,在统计图中最简单与常见的要算是曲线图,它能利用线条的变化性,明白的显示出以往的情况,使读者容易地去预测出未来的发展趋势,如图2-2所示。
图2-2 ××公司十年内营运收入统计表
由图2-2中可知,该企业的营业收入除在1987至1989年间是下降外,整体而言是逐年成长的。另外,在实务的运用上,我们也可由图表中立即来分析分析究竟是何原因导致该年度区间内使得收入下降,如此一目了然即是统计图表的优点所在。
除此之外,在日常生活中一些常见的统计图表还有如区域图、柱形图、横条图、折线图、茎状图、散布图、饼图等等,然而在运用与解读上应特别注意各种图形的特性,以免造成事倍功半的缺失。
2.常犯的错误情形
在运用统计图表时应注意数据本身的特性,要知道并非每一类型的资料都能运用在各类的统计图中,运用不得当,不但无法指导读者了解数据的特性,更反而容易误导读者歪曲数据的正确性。而读者在阅读统计图表时,也应特别注意资料的横轴(X轴)与纵轴(Y轴)的单位,以免误解它所表示的意义。
一般常容易造成读者发生上述错误的就是:原点不是零的统计图。如图2-3。
图2-3 ××市消费者物价指数图
由图2-3中可清楚的看出,纵轴底端指数从80往上加,并非由零开始,纵使图中的数据并无错误,但往往会让粗心或匆忙的的读者误解,认为该指数是由中途开始攀升的。
其次另一个常见的例子就是,某些统计图的横坐标或纵坐标所用单位容易让读者混淆,若不仔细分析则会产生误解,如图2-4。
图2-4 ××地区失业率
由上图可看出,其纵轴为百分比(﹪),而每一单位基数为1累加,光由该图看来会使人觉得××地区失业率起伏很大,但若了解上述说明,则会发现事实上是本图使读者产生的误解。
最后要提醒统计图表读者的是,要真正了解统计资料的结果光靠统计图表是不行的,还要熟读统计文献的内容,更甚者,还要弄清楚各项数据所运用的理论及其所代表的意义。尤其在一些生活应用上的财务分析、经济等方面的图表更是如此,例如,你光看着某一项期货日指数曲线节节上升,但要知道有时指数上升未必是利多的的情况,此点相信是更重要的事。
十、其它
最后,提到一些较无法归类的错误。
第一,我们在某些论文中会发现,在名词的选择上会使人产生误解。举个简单的例子,在很多研究消费者行为的文献中都会提及知觉(perception)理论与认知(recognition)理论,但往往并没有严格的区别其不同处,使得非此学术领域的读者往往会觉得两者似乎是相同的,如此说来似乎对统计分析上的影响不大,但有时会发现连研究者本身都对该名词产生混淆,再作统计推论时则会使结果被误导。而且在一些医学研究中若发生名词选用错误的情形,严重者,则会产生不可预测的后果。
第二,有些研究或调查所犯的错误,则是在整篇文章中,不论是「方法」或者是「结果」部份,都没有提到研究或调查中所使用的统计方法为何?而在「结果」或「讨论」中,却有P-值(或其它统计值)的报告,这些P-值等的背后所使用的方法是对是错则根本无法评估,这种情形亦是屡屡见到。
注释
1.颜月珠(台湾大学财务金融学系教授),「商用统计
学」,三民书局八版,民国82年8月,P197。
2.同注1,P222。
中央极限定理(Central Limit Theorem)的定义:
设一机率函数f(x),其均数为u,变异数为;由其中抽取样本大小为n的样本,得样本均数为,令,则当n时,Z的分配以标准常态分配为其极限。亦即不论母体为何种分配,当样本大小n时,样本均数的抽样分配均以常态分配为其极限,其E()=u,V()=。
3.卢成皆、李瑛慈,「医学研究中常见之统计分析谬
误」,中国统计学报,第33卷第2期,民国84年6月,
P285。
D. Hunt, Mondern Marketing Theory:Critical
Issues in the philosophy of Marketing Science, Ohio,
Cincinnat, .:South-western Publishing Co,chap5.
. cohen, Statistical power Analysis for Behavioral
Sciences, Academic Press, New York, .
6.同注5。
7.同注5。
8.同注3。
参、结论与建议
非专业的统计方法所得的结果是值得怀疑的
一、结论
统计方法在日常生活中或学术领域上可以帮助我们从一堆繁杂的数据数据中,藉由一些统计量的计算、估计和检定,来了解母体的特性。但数字本身是死的,重要的是我们如何去解释这些数字,如何赋予它们特殊的意义,所以,在我们看一个统计数字及别人给它下的推论时,应该不要随便轻易地相信它,因为有时候,数字是很耸动的,这时就可能会有某些人为了某些目的或因对统计的不了解,而利用统计数字说谎或误用了统计。我们在阅读统计资料时应做一个聪明的读者,不要被这些误用统计的情形所蒙骗。
在此提供五项原则来帮助我们去省思所得到的统计数字,是不是真的有足够的把握去下那样的结论,及它的正确度有多少。
1.原则一:Who Say So?
我们常常可看到,不论在报章或杂志上的文章内容有如此的陈述:「根据某某调查显示....」或是「某某研究报告指出....」我们一定要非常注意接下来的结论,真的
是所谓正确的统计分析结果吗?就如先前所说的,统计数字虽能说话,但它所表达的言语全靠这些研究或调查者来诠释,因往往我们看不到这些分析与推论的过程,而是直接面对他们给我们的结论,那我们如何知道是谁说的呢?若是有人刻意利用统计数字来歪曲事实,那岂不是让读者误会了无辜的统计数字了。
2.原则二:How Does He Know?
你一定看过一些很明显的大标题,看了让人吓一大跳,例如,在×年×月×日的某报纸刊载了如此的标题:「每三对夫妻中,就有一对有婚前性行为。」如果我们就如此相信了,那似乎这篇报导就有违统计学所应负的社会责任了,因为它并无说明如何统计分析而得知的结果,而使得读者被欺骗或误导。
因此,在阅读某些乍看是统计的资料时,我们绝对不能依它的结论而下推论,我们应该先想到一个问题:「他如何知道的?」在一般的研究调查中,这就牵涉到方法与信度的问题,如前章节所述,在此不多做补述。
3.原则三:What's Missing?
在一般的文献中,多数的研究者与调查者在其有限的篇幅中,并不会详列统计分析的过程与计算步骤,更甚
者,在某些文章中亦不会告诉我们有多少抽样样本、用何种抽样方法、问卷如何设计、研究如何设计、信赖区间为何等等,或许连研究调查的日期都不得而知,但往往这些没有出现的讯息,涵盖了足以让我们分析数据的可信度与其它重要的意义,因此,在我们阅读一份统计资料时,应该察觉它是不是遗漏些什么重要的信息,然后再决定该如何下定论。
作为一个理智的统计资料运用者,应时时警惕资料是否完整,千万别只是随便一翻,这样难保不会使自己误信了有偏误的统计推论。
4.原则四:Did Somebody Change The Subject?
或许,你也曾看过如此的广告词:「根据调查,使用××品牌的人,其满意度远高于使用其它品牌的人。」但这有可能指示广告商的一种营销策略而已。看统计文献的时候,最怕的就是因不了解统计分析的过程而被误导,要知道,调查的母体不同则推论的结果当然也就不同。不少人会妄将统计的主题改变而使读者有错误的认知。当然,读者必须自己做好把关的工作,因为文章的作者或许不是故意的偏歪事实,但可确信的是,最后将事实偏歪的可能是读者你自己。
举一个例子,在一本「家庭社会学」中提到:「美国1984年的离婚率是47﹪。」乍看之下,表示每两对夫妻中,就有一对会离婚,但事实是如何?好险在书中的附注有说明此一离婚率的计算,是由全年离婚夫妻对数除以该年新婚夫妻对数,再乘以100,但此一算法容易引起读者的恐慌与争议,因为离婚和新婚的人基本上是没有关连的,所以,另一种较合理的计算方式为:全年的总离婚对数除以该年的总结(已)婚对数,再乘以100,如此似乎较合情合理。
5.原则五:Does It Make Sense?
这是一个最重要的问题,即是:「如此的推论有意义吗?」以一个××报纸的收视率调查为例;某时间八点档连续剧收视结果如下,华视36﹪、台视34﹪、中视26﹪,故华视大获全胜。但仔细分析之,这样的推论有意义吗?这里的数字是否能下如此的推论,其信赖区间并未提及,且抽样是否偏重于某一地区而导致抽样误差,如此光是2﹪的差距,就能分辨出收视情形的优劣似乎是太危言耸听了。
由此可知,统计数字本身是无辜的,但看人如何去解释与赋予其正确的意义,在阅读统计资料时,千万应警觉该推论是否确实可信。
二、建议
最后,针对前述各项统计应用上常见的错误提出几点建议。
1.在样本大小与抽样方法方面
一般人常迷信大量的样本,但事实上若大量而有偏差的样本,表面上虽看似不错,但事实上只是一再的重复其偏差而已,反而将导致结论的误差更加严重。
因此,唯有慎选适当的抽样方法,选取较小规模的随机样本,并尽可能的降低抽样误差、反应误差及无反应误差等,并提高问卷的回收率。故根据所要研究的方向,选取合适的抽样方法才能提高调查结果的正确性,如此也是较具实质意义的。
2.在P-值的误用方面
在如前述的P-值和相关系数间的问题,可藉由其它统计方法之计算来增加P-值的引用正确性。
如信赖区间之计算,它除了可以了解样本相关系数的变异情形外,亦可以检查这一区间是否包含可靠度定义之标准,以做出适当的结论。
3.在统计检定力方面
型Π错误被忽视的严重性是有其讨论的必要的。虽然教科书中常有如下的叙述:「型Ι错误比较严重,故可不理会型Π错误。」但要知道β值的计算是会影响整个统计检定力。
欲增加作用力的影响可藉由四个方面着手(注1):第一:选用适当的统计值,例如在组间或组内有线性回归关系存在时,选用r比t值好,因为t值无法取得线性回归之趋势。第二:α值之设定,在可容许的范围内适度提高α值,而使β值下降,或是在一般显著水平下,检定结果不具显著性时,应将P值计算出来。第三:样本大小的调整,样本愈大时,β值及α值可以同时兼顾。第四:作用力大小亦可影响检定力,如果作用力愈大,则β值愈小,但是作用力是被研究的对象,通常是一个未知数。
4.多变量分析中自变项的选择方面
依照一般决定多变量分析中自变项之方法中,发生单变项中不具统计意义,但于多变量分析中有统计意义的原因,大致可归纳如下:(1)「干扰因子」(confounding factor)的关系,(2)数据本身的问题。
欲解决此一问题,前者如Y与X1本来是有显著相关的,但却受到干扰因子X2的影响,所以当把Y与X1作简单回归分析时,X1不一定有意义,假如把X1与X2都纳入复回归分析的话,再把X2的「效果」(effect)「调整」(adjust)后,则X1便会达成统计意义。后者,因为数据本身的问题较常见的为「遗漏值」(missing value)的删除问题,故减少遗漏值是一条可行的办法。
5.程序编写错误方面
欲知道是否发生变量转换上的错误,可使用察看自由度的方法,部份作者会将回归结果以表格方式发表,当以原始数据分析,软件势必将此变项视为连续性数据处理,其自由度等于1,否则自由度自然应是该变项所含之层次(level)数目减1。
除此之外,若没有自由度报告的话,有时亦可以凭「参数估计」(parameter estimate)判断,因为三个层次(level)之变项会变为两个「虚拟变数」,而每个「虚拟变量」均被软件视为一个自变项,所以会有两个参数估计值,连续性自变项则只有一个估计值。
比较困难的是当自变项为两分变项时,不论以「虚拟变量」或连续性数据方式处理,其自由度均为1,亦只有一个参数估值,此时唯有依经验与察看上下文来判断而已了。
6.统计方法前后不一致与统计图表不当利用方面
为避免此类问题发生,希望使用统计分析之研究者应注意,若对统计方法一知半解,很容易造成论文内容不同程度的谬误,应该知道光靠参考已发表的论文是不够的,因为论文篇幅有限,详细的数据分析过程往往不会在论文中介绍,所以应与统计专家合作,请教正确的统计方法、分析过程与结果阐释。
此外,亦建议常用统计图表的作者,在使用图表时亦应提升图表的适合性,避免图表的误用导致数据特征的偏颇,而使读者蒙受其害。
注释
Rosenthal and Ralph L. Rosnow, Essentials of
Behavioral Research:Methods and Data Analysis,
McGRAw-HILL, Inc, New York, .,1991,2nd.
editor,P452.
肆、附录
附录一:统计在生活上的应用
一般人对「统计」的概念似乎仍停留在一些主观的刻板印象之中,人们总是误把统计和「数学」联想在一起;认为统计总是在玩弄一些数字上的游戏,因此认定统计应为某种应用数学,所以统计就应和数学一样没有什么实用的价值可言。这点是必须加以澄清的;实际上,「统计」确实是以「数学」中的部份理论为基础,但它仅是以其为运算工具,而配合现实环境中我们所关心的相关问题,发展出一种透过运用资料搜集、汇总、整理及分析的科学方法,来解决与达成我们的需求。所以,「统计」和人们确实有着密不可分的关系。
以下,让我们来看看「统计」究竟在人们日常生活中是如何发挥它的影响力。兹将一般常见的应用分述如下:
一、民意调查统计:
选举前为了解选民对各政党及候选人的意向所做的调查,或是对某项政府施政与重要公共政策实施前后所做的调查皆属此一范畴。这类调查主要皆属于对统计抽样理论之实际应用,故抽样母体之代表性往往决定了调查结果的适用范围。
二、收视率调查统计:
随着有线电视的快速普及,竞争激烈的电视台间为了解其节目收视率,于是兴起了此一调查,而广告商亦对其相当重视,一方面欲了解广告的收视率,另一方面需了解某一类型的节目收视率,以决定广告推出的时间是否有较大之效益。而此一调查结果亦往往因抽样母体及资料收集技巧(访员电话访问、计数器等)之好坏而决定调查结果之信度。
三、运动统计:
运用于各种球类比赛中相关资料的搜集,如球员攻守统计、球队战绩胜负等,以做为教练与球迷分析与参考之用。值得一提的是,目前不少职业运动皆成为赌徒一掷千金的工具,此一资料恰可提供他们下注的依据。
四、人口统计:
有关出生率、死亡率、妇女生育率、平均生育子女数等与整体人口结构间关系性的探讨都属之。此类数据往往可提供政府施政之参考,如未来人口数的预估可提供生育计划的推动,而今日人口高龄化的问题亦仰赖此类信息的提供。
五、气象统计:
从前人对天气的预估往往依循「经验法则」来判断天气的好坏,但随着今日气象科学的进步,气象学家除了配合高科技气象观测工具外,更大量运用统计方法来辅助推估气象结果,使得气象预测的精确性大幅提高,除一般的气温、湿度、降雨机率外,乃至于地震、海啸等天然灾害之预测亦包含在内,使得人们在日常生活中得到了方便,也得到了安全上的保障。
六、交通统计:
航空、铁、公路运输对其客、货运量之分析与预估,道路、停车场的兴建、停车位的规划与各种车辆成长的关系等,都可经过适当的统计分析来提供决策者作为参考。近年来,由于经济、贸易的持续成长,各港口进港船舶数与载运货物总吨数的分析与预测,亦是有关单位所重视的问题。而电力负荷预估、电讯业务的成长等,更是目前新信息时代来临与民生关系最密切的课题。
七、工业统计:
大则为了解工业结构之转变与预测未来发展速度,小则为提升工业生产质量,统计早已成为工业发展中不可或缺的重要工具。尤其在质量制程管理方面,如何在可能影响产品质量的因素中筛选出重要的因素,以及如何找出最适当的因素组合以生产出最优良的产品,这些都是工业统计上最重要的发展方向。
八、教育与心理统计:
在教育与心理学的研究领域内,统计的仰赖甚深,例如欲对各种教育方法评估时,必须藉由统计分析的结果加以印证;另一方面,在心理学上的各种测验数据,亦都必须应用统计方法来分析。
九、社会统计:
探讨离婚率、妇女劳动参与率、青少年犯罪率、自杀率与失业率等等各种社会现象,经过统计分析过程并将其结果提供有关单位作参考,以采取适当的因应措施。
十、生物医学、药学统计:
统计应用于此一领域上的研究愈来愈多。医学上的种种研究所得到的资料,若能佐以适当的统计分析,往往将会有突破性的发现,并更能受到学界的认同。而任何一种药物从开始研究到发表上市,往往需要投入庞大的时间与金钱,而在此过程中,如何证明新开发出来的药比目前使用的药更具疗效且不会有副作用,都必须藉由统计分析的结果来加以证明。近年来统计在此一领域的发展已独具一格。
与我们日常生活有关的「统计」除了上述十种之外,其它还有如「政府统计」、「保险统计」、「工程统计」、「劳动统计」及新兴的「环保统计」等等无法一一列举,但综合言之,在每种学科或学门的名称之后,只要加上「统计」二字,即代表着统计在该学科或学门上的特殊应用,由此可见,「统计」与我们日常生活上确实有着极其密切的关系。
附录二:生活中常用的统计分析方法介绍
我们知道,由于近年来计算机科技日新月异,新的、处理迅速、功能强大的中央处理器发展快速,且因成本降低而普及到了一般社会大众。拜计算机之赐,亦使得统计学家及决策者得以轻松地处理大量的数据,甚至仿真(simulation)出结果,更加促进了统计之发展与人性化的应用,并使之与生活更加紧密的结合在一起。
当然,在日常生活中应用的统计方法实在很多,因此,在此仅介绍一些较为常见的统计方法:
一、回归分析法:
当我们对一个因变量与自变量的关系发生兴趣时,回归分析是最常被使用到的工具。此种分析一般常被归类在横断面的分析。例如研究某产品销售数量与该地区人口统计变量间之关系时,我们便可利用回归分析的方法来建立模式,更可利用此模式代入搜集的数据而预测想要的结果。
以上述的例子来看,销售量为因变量,而人口统计变量中的(1)每月所得平均、(2)年龄,则为两个自变量,然而,销售量(Y)的决定,并不完全由每月所得平均(X1)及年龄(X2)所决定,可能还有其它因素会影响到销售量,因此在模式中我们给予误差项(ε)。故在线性关系的假设下,则可得到线性回归模式:
Y=β0+β1X1+β2X2+ε
其中β0、β1及β2为需要估计的参数,再利用最适当的统计方法推导出β0、β1及β2的最佳的估计式,分别假设为b0、b1及b2。因此,我们可建立回归直线:
Y=b0+b1X1+b2X2
我们便可利用此一模式来推测在一定的月平均收入及年龄下之销售量。如此决策者便可知道对其目标消费者应投入多少成本,以节省开支。
举个更简单的例子,假如X的个数只有一个,则可将X及Y的关系以图形来表示,如下图中的点为真值,直线则为预测值。
销售量与年龄的回归直线图
二、时间数列分析法:
回归分析的方法虽然实用,可是对于和时间有关的数据便不适用。而一般处理和时间有关的资料所使用的方法则为时间数列分析法。时间数列分析为一纵断面的分析,使用依时间出现顺序的先后数据来作为统计数列,进行分析探讨。例如一个国家的经济成长率、股市每日成交量等皆属之。由此我们可知,时间数列为一种动态的分析,而前述的回归分析则为静态分析。
事实上,时间数列分析在数据的处理及计算上常较回归分析来的繁复,经常被使用的为ARIMA模式,在此并不作详述。根据时间数列分析方法分析的结果亦可以提供决策者作为重要的参考依据。以下兹举出一简单图示来表示时间数列数据。
由上图可明显的看出;台湾产业结构中三级产业在各年度的波动情形,其中服务业逐年上升,而农业与工业则逐年下滑,证明台湾已随经济发展,而有逐渐随欧美先进国家产业发展轨迹跟进之趋势。
三、多变量分析法:
我们在日常事物上所面临的决策,大多不能以一个变量完全决定。例如,要了解企业在某段时间经营活动的成绩,就必须分析其「损益表」,而损益表中主要的三个部份:「收入」、「费用」和「纯益」也就是描述欲分析企业经营成果的三个变量。由此可知,多变量分析近来愈来愈受重视与运用,但多变量分析之计算经常远较单变量分析来的复杂与困难。所幸近来拜计算机软件快速发展之赐,在此方面的问题已被克服,故现今此种分析方法已被广泛的应用到经济、财务、社会及心里等各领域的研究中。
由于多变量分析的方法实在太多,在此便无法一一介绍。
附录三:统计在理财活动上的应用
讲到「投资」,相信会马上引起许多人高度的兴趣,因为「台湾钱淹脚目」早已不是新闻了!但我们都知道,投资都会有风险(risk),如期货、黄金、股票、房地产等等,其中风险的高低往往决定了投资利益的大小,因此各投资人实在应该在投资前事先充分搜集相关资料,以做好「避险」的动作,以免届时大笔资金活生生地被套牢。
究竟「统计」在理财投资活动中可扮演着什么样的角色呢?以下兹以股票投资为例作一番探讨。按照趋避风险的理财步骤;首先,我们必须将手边可运用的资金,按照各种投资目标所可能发生的风险,加以分配并设立获利离场点与停损点,而这其中牵涉的两大环节-风险与期望值(expected value),就是基础统计被利用的地方,若以此作为进场与离场的依据,在获得相当利润时即可离场,即使不幸损失也应当会在可容忍的限度之内。
谈到实务方面,由统计方法所推导出来的各项指标,则是所谓投资者作为买卖参考的时机点。如一般投资者常使用的MACD线(指数平滑异同曲线),乃是运用慢速与快速移动的MA线(平均线)聚合与分离的原理,加以双重平滑运算,藉以判断买进或卖出的一种征兆。在一般技术分析的领域中,MA线是绝对不可缺少的指标工具。而MA线则是利用统计学中的「移动平均」(moving average)之原理,将每天收盘时的股价予以移动平均,求出一个趋势值。在此简略介绍两种MA线的计算方法:
一、算数移动平均数:
以十日的移动平均线(即短期移动平均线)为例,即为最近十日收盘价之总和,除以十即为当日的移动平均数,连接前十日的移动平均数即立即构成一条十日移动平均线。公式如下:
Pn+Pn-1+....+P1 n日收盘价总和
An=------------------------ =-----------------
n 采样日数
二、线型加权移动平均:
以六日加权移动平均数为例,第一天的收盘价乘以1,第二天乘以2,以此类推至第六天乘以6,然后除以(1+2+3+4+5+6)即为当日之加权移动平均数。此种计算方式是考虑较接近当日的数天前之股价有较大之影响力始然。其公式如下:
a1Pn+a2Pn-1+....+anP1
Wn=-----------------------------------
a1+a2+...+an
而由计算得出之MA线,可再利用股友们熟知的葛兰碧(Granville. J.)八大法则(注1)来判断买卖的时机。除此之外,我们亦可利用移动平均线找出「黄金交叉」与「死亡交叉」等 。
大多数的投资者都对风险评估格外的重视,投资者希望在接受的风险水平之下,达到最大的获利空间。在此也提供一些简单的统计工具来作为参考的准则。例如我们先将欲购买的公司股票,个别去计算其公司股票的期望报酬率,再计算此期望报酬率之变异数。将变异数开根号即为标准差,最后将投资报酬率之标准差除以期望报酬率得之变异系数,来作为相对风险指标。公式如下:
标准差
变异系数= ---------------
投资报酬率
所以,若采用较理性的作法是选取较小的变异系数,和最大的投资报酬率公司的股票来购买。一般来说,投资报酬率愈高的公司,风险也会愈大。
注释
1.葛兰碧(Granville. J.)八大法则:(参考对照图形)
一、移动平均线的买进时机:
(1)移动平均线止跌盘旋,而且股价日线从平均线下方往上方突破时,是买进信号。
(2)股价日线稍稍降在移动平均线下方,立即突破平均线而向上时,可谨慎买进。
(3)股价日线在平均线上方下跌,在未降到移动平均线之下,却重行上升时,可以买进。
(4)股价日线在平均线下方,突然暴跌,远离平均线时可以加码买进。
二、移动平均线卖出时机:
(1)移动平均线上升盘旋,而且股价日线从平均线上方往下方突破时卖出。
(2)股价日线稍稍在移动平均线上方,立即突破平均线而下跌时,谨慎卖出。
(3)股价日线在平均线下方上升,但未突破移动平均线,却再度下跌时宜卖出。
(4)股价日线在平均线上方,突然暴涨,远离平均线时最好卖出。
股价
时间
参考文献
一、中文部份
1.蔡宗儒(淡江大学统计系讲师),「统计与生活」,社
教资料杂志,第二0二期,p4。
2.郑天泽(政治大学统计研究所副教授),「统计之应用
」,社教资料杂志,第二0二期,p3。
3.颜月珠(台湾大学财务金融学系教授),「商用统计
学」,三民书局八版,民国82年8月,P197、P222。
4.卢成皆、李瑛慈,「医学研究中常见之统计分析谬
误」,中国统计学报,第33卷第2期,民国84年6月,
P285。
5.王淑芬,「投资学」,华泰书局,民国77年9月二版,
P266、267。
二、英文部份
. cohen, Statistical power Analysis for Behavioral
Sciences, Academic Press, New York, .
Rosenthal and Ralph L. Rosnow, Essentials of
Behavioral Research:Methods and Data Analysis,
McGRAw-HILL, Inc, New York, .,1991,2nd.
editor,P452.
D. Hunt, Mondern Marketing Theory:Critical
Issues in the philosophy of Marketing Science, Ohio,
Cincinnat, .:South-western Publishing Co,chap5.
page 6
ƼC¦1
m i l l i o n
1 9 8 5 - 1 9 9 5 ( y e a r )
8 5
8 6
8 7
8 8
8 9
9 0
9 1
9 2
9 3
9 4
9 5
0
1 0 0
2 0 0
3 0 0
4 0 0
x x F o o d s e r v i c e c o m p a n y I n c o m e