酵熙黑
物产生影响.乱伐森林.乱扔垃圾就会
破坏我们的生态环境。
需要指出的是,在我们关注事物之
间相互关系的时候.可能会发生一些似
是而非的关系。比如说在城市中冰淇淋
销量与儿童交通事故之间似乎存在着一
定的关系。事实上,冰淇淋的销量并不
直接导致儿童交通事故的发生,一般来
说.儿童喜欢吃冰淇淋.尤其在天热的
时候.而夏天正值儿童放假期间.上街
的机会更多一些.于是就形成这样一种
又像又不像的关系。这样的关系在统计
上称为伪关系或假相关。我们再举一个
有趣的例子。据说以前在丹麦的乡村.
有一种鹳的数量的多少与那里的婴儿的
多少有比较高的对应关系。以至于在当
地形成了“鹤可以带来孩子”的说法。其
实这纯属一种巧合而已.它们之间并无
真正的因果关系。因此,我们观察事物
之间相互关系的同时.应当对这种关系
的真伪加以甄别才对。
我们不仅应当善于观察之间的关
系,而且也应该注意到它们之间是一种
什么样的关系。这里我们介绍3对常用
的统计概念:(1)正相关和负相关。正相
关是指一种事物与另外一种事物呈相同
的方向发展,如多吃肉尤其是肥肉就容
易使人体脂肪增多。负相关是指一种事
物与另一种事物呈反方向发展。如我们
在集贸市场买东西时.买的数量多,它
的价格就可能更便宜。(2)简单相关和多
重相关。简单相关是指具有某种联系现
象的数量仅限于2个。而多重相关则是
指具有某种联系的现象数量至少是3个。
(3)线性相关和非线性相关。如果把两个
现象相互之间关系的观察资料放在一个
二维坐标中,这些点大致呈直线状,我们
就说这种关系是线性相关(或直线相关):
如果不是呈直线状而呈曲线状,那么这种
关系就称为非线性相关(或曲线相关)。
统计对事物之间相互关系的研究分
析是一个完整的过程。归结起来有以下
几个方面:(1)从数量(指对某种现象所
搜集的统计资料)来看现象是否真的具有
某种关系:(2)找出这种相互关系的形
式:(3)计算出现象之间的关系系数(通
常也叫相关系数),以确定事物之间相互
关系的强弱程度。(4)对统计相关性加以
总体检验。仍然以开车系安全带为例子.
平均数日a背后
平均数谁都不陌生,不用说学过统
计学的饱学之士,就是上过中学的彬n
道。当然,这里所说的只是算术平均数,
不包括几何平均数、调和平均数等常人
少见的学问。平均数的使用是很广泛
的,它既可以用来比较两个总体水平的
高低,也可以用来判断一个总体单位的
地位。比如,两个班的物理平均分数分
别是79分和80分,我们可以据此认为
后者的物理成绩优于前者;同样,一个
学生的考试成绩如果高于全班平均分数
的话,我们也可以认为这个学生不错。
喜欢比较,也许是我们的爱好,也许是
市场竞争使然。平均数,特别是人们熟
悉的算术平均数,更是我们用来进行比
较的好标准。在动不动就搞量化考核的
今天,平均数真是大有用武之地。
平均数出自于总体所有单位,每一
个总体单位都会对它的高低产生影响。
从使用的角度来看,以它做标准的确是
既简单又实用。但是正因为它是所有总
体单位的综合结果,在以平均数为判断
基准的时候,还应考虑其总体的分布情
况,否则可能会出现事与愿违的结果。是
否进入小康,这是个热门话题。收入,在
捉村是人均纯收入,在城市是人均可支
配收入,就成了小康评价体系中不可缺
少的指标。当然这两个指标都是通过抽
样调查得到的,严格来说是样本平均数。
如果这两个人均收入超过了一定的标
准,我们即使不能完全进入小康,因为还
得考虑其他指标所反映的因素,但也离
夕齐勘/文
它不远矣。不论人均纯收入,还是人均可
支配收入,它们的总体分布情况如何?也
就是说,到底有多少家庭在平均水平之
上,有多少又在其下呢?这在做判断时是
不能不考虑的。如果假定收入的总体分
布是正态分布,那么平均数、中位数和众
数是一致的。此时即使平均数达到小康
水平,也有一半的家庭迈不进小康的门
槛。实际情况是收入的分布通常是偏斜
的,即少数高于平均数,多数低于平均
数。在这种条件下,凭借平均数的高低来
做论断,恐怕会遭至多数人的非议。
同样的道理,衡量农民负担的轻重
与否也和平均数有密切的关系。徒民负
担不超过上年人均纯收入的5%,是经常
见诸于报章的一项判断标准。同样的负
担对于收入超过平均水平的人来说,当
然是可以接受的。而对于低于平均水平
的,就难免怨声载道。平均数来自于众
多的个体数据,但它决不等于个体数
据,而且作为个人来说,也只能从自己
的现实处境来判断负担的轻重,至于平
均水平的大小,总是离自己很遥远的。
说一句题外话,真正做到负担合理的前
提是,搞清每一户的收入,再按一定的
比例计算他们的负担。不过这太难了,
难于上青天。由此需要增加的调查费用
恐怕也无法承担。
使用平均数简单清晰,但应该留意
它的背后。平均不等于平等,与公平更
有不小的距离。瓣
(作者单位:中国统计出版社)
的数量进行统计时.观察数量虽然应当
尽可能要多,但限于各种因素,我们仍
然无法得到全部情况(统计上叫总体‘),
所掌握的资料相对于全部情况来说只是
一部分(统计上叫样本)。样本对总体来
说是否具有代表性还需要统计检验。只
有经过检验,这种相关关系才得以真正
确定。(5)一旦事物之间的相互关系确实
成立,那么我们就可以根据一个事物的
情况推断另一个事物的情况,有时候对
同一个事物可以用现在的情况来推断未
由于确定事物相关关系的形式、相
关系数的计算、统计相关的总体性检验
等.其技术性相对较强.可以依靠统计
专家加以解决。对于非专业人员来说知
道有这么一个概念和这么~个过程就可
以了。但是,对于统计具有这样的功能,
是不是也可以称之为一种魅力。事实上,
大量的统计结论不仅影响着我们的经济,
也影响着我们的生活,使得我们的经济
和生活得以健康的发展,我们是否应当
感谢统计学,感谢统计人。瓣
(作者单位:中国统计出版社)