平均数是统计学中最常用的统计量,用来表明平均数是统计学中最常用的统计量,用来表明
资料中各观测值相对集中较多的中心位置。平均数资料中各观测值相对集中较多的中心位置。平均数
主要包括有:主要包括有:
算术平均数算术平均数((arithmetic meanarithmetic mean))
中位数中位数((medianmedian))
众数众数((modemode))
几何平均数几何平均数((geometric meangeometric mean))
调和平均数调和平均数((harmonic meanharmonic mean))
一、算术平均数
算术平均数是指资料中各观测值的总和除
以观测值个数所得的商,简称平均数或均数,
记为。
算术平均数可根据样本大小及分组情况而
采用直接法或加权法计算。
(一)直接法
主要用于样本含量n≤30以下、未经分组
资料平均数的计算。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
设某一资料包含设某一资料包含nn个观测值:个观测值: xx11、、xx22、、……、、xxnn,,
则样本平均数可通过下式计算:则样本平均数可通过下式计算:
((3-13-1))
其中,其中,ΣΣ为总和符号;为总和符号; 表示从第一个观测表示从第一个观测
值值xx11累加到第累加到第nn个观测值个观测值xxnn。当。当 在意义上已明在意义上已明
确时,可简写为确时,可简写为ΣΣxx,(,(3-13-1)式可改写为:)式可改写为:
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【【例例】】 某种公牛站测得某种公牛站测得1010头成年公牛的体头成年公牛的体
重分别为重分别为500500、、520520、、535535、、560560、、585585、、600600、、
480480、、510510、、505505、、490490((kgkg),求其平均数。),求其平均数。
由于由于 ΣΣxx=500+520+535+560+58 =500+520+535+560+58
+600+480+510+505+49 +600+480+510+505+49
=5285 =5285,,
nn=10=10
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
得:
即10头种公牛平均体重为 kg。
(二)加权法
对于样本含量 n≥30 以上且已分组的资
料,可以在次数分布表的基础上采用加权法计
算平均数,计算公式为:
(3-2)
式中: —第i组的组中值;
—第i组的次数;
k —分组数
第i组的次数fi是权衡第i组组中值xi在资料
中所占比重大小的数量,因此将fi 称为是xi的
“权”,加权法也由此而得名。
【例】 将100头长白母猪的仔猪一月
窝重(单位:kg)资料整理成次数分布表如
下,求其加权数平均数。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
表表33——1 1001 100头长白母猪仔猪一月窝重次数分布表头长白母猪仔猪一月窝重次数分布表
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
利用(3—2)式得:
即这100头长白母猪仔猪一月龄平均窝重
为。
计算若干个来自同一总体的样本平均数的
平均数时,如果样本含量不等,也应采用加权
法计算。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【例】 某牛群有黑白花奶牛 1500
头,其平均体重为750 kg ,而另一牛群有黑
白花奶牛1200头,平均体重为725 kg,如
果将这两个牛群混合在一起,其混合后平均体
重为多少?
此例两个牛群所包含的牛的头数不等,要
计算两个牛群混合后的平均体重,应以两个牛
群牛的头数为权,求两个牛群平均体重的加权
平均数,即
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
即两个牛群混合后平均体重为 kg。
(三)平均数的基本性质
1、样本各观测值与平均数之差的和为零,
即离均差之和等于零。
或简写成
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
2 2、样本各观测值与平均数之差的平方和为最小,、样本各观测值与平均数之差的平方和为最小,
即即离均差平方和为最小离均差平方和为最小。。
((xxii- )- )2 2 < (< (xxii- a- a))22 (常数(常数a≠ a≠ ))
或简写为:或简写为: <<
对于总体而言,通常用对于总体而言,通常用μμ表示总体平均数,有限表示总体平均数,有限
总体的平均数为:总体的平均数为:
((3-33-3))
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
式中,N表示总体所包含的个体数。
当一个统计量的数学期望等于所估计的总
体参数时,则称此统计量为该总体参数的无偏
估计量。
统计学中常用样本平均数( )作为总体
平均数(μ)的估计量,并已证明样本平均数
是总体平均数μ的无偏估计量。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
二、中位数
将资料内所有观测值从小到大依次排列,位
于中间的那个观测值,称为中位数,记为Mdd。
当观测值的个数是偶数时,则以中间两个观
测值的平均数作为中位数。当所获得的数据资料
呈偏态分布时,中位数的代表性优于算术平均数。
中位数的计算方法因资料是否分组而有所不
同。
(一)未分组资料中位数的计算方法
对于未分组资料,先将各观测值由小到大
依次排列。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
1、当观测值个数n为奇数时,(n+1)/2
位置的观测值,即x(n+(n+11)/2)/2为中位数:
Mdd=
2、当观测值个数为 偶 数 时 , n/2和
(n/2+1)位置的两个观测值之和的1/2为
中位数,即:
(3-4)
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【例】 观察得9只西农莎能奶山羊的
妊娠天数为 144 、 145、 147、 149、
150、151、153、156、157,求其中位
数。
此例 n=9,为奇数,则:
Mdd= =150(天)
即西农莎能奶山羊妊娠天数的中位数为
150天。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【【例例】】 某犬场发生犬瘟热,观察得某犬场发生犬瘟热,观察得1010只仔只仔
犬发现症状到死亡分别为犬发现症状到死亡分别为77、、88、、88、、99、、1111、、1212、、
1212、、1313、、1414、、1414天,求其中位数。天,求其中位数。
此例此例nn=10=10,为偶数,则:,为偶数,则:
((天天))
即即1010只仔犬从发现症状到死亡天数的中位数为只仔犬从发现症状到死亡天数的中位数为
天。天。
(二)已分组资料中位数的计算方法(二)已分组资料中位数的计算方法
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
若资料已分组,编制成次数分布表,则可利用次数分布若资料已分组,编制成次数分布表,则可利用次数分布
表来计算中位数,其计算公式为:表来计算中位数,其计算公式为:
((33——55))
式中:式中:L L —— 中位数所在组的下限;中位数所在组的下限;
i i —— 组距;组距;
f f —— 中位数所在组的次数;中位数所在组的次数;
n n —— 总次数;总次数;
c c —— 小于中数所在组的累加次数。小于中数所在组的累加次数。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【【例例】】 某奶牛场某奶牛场6868头健康母牛从分娩到第头健康母牛从分娩到第
一次发情间隔时间一次发情间隔时间 整理成次数分布表如表整理成次数分布表如表 33——2 2 所所
示,求中位数。示,求中位数。
表表33——2 682 68头母牛从分娩到第一次发情间隔时间头母牛从分娩到第一次发情间隔时间
次数分布表次数分布表
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
由表3-2可见:i=15,n=68,因而中位
数只能在累加头数为36所对应的“57-71”这
一组,于是可确定L=57,f=20,c=16,
代入公式(3-5)得:
(天)
即奶牛头胎分娩到第一次发情间隔时间的
中位数为天。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
三、几何平均数
n 个观测值相乘之积开 n 次方所得的方
根,称为几何平均数,记为G。它主要应用于
畜牧业、水产业的生产动态分析,畜禽疾病及
药物效价的统计分析 。 如畜禽 、水产养殖的
增长率,抗体的滴度,药物的效价,畜禽疾病
的潜伏期等,用几何平均数比用算术平均数更
能代表其平均水平。其计算公式如下:
(3-
6) 下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
为了计算方便,可将各观测值取对数后相
加除以n,得lgG,再求lgG的反对数,即得G
值,即
(3-7)
【例】 某波尔山羊群1997-2000年
各年度的存栏数见表3-3,试求其年平均增长
率。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
表3-3 某波尔山羊群各年度存栏数与增长率
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
利用(3-7)式求年平均增长率
G=
=lg-1[(–)]
=lg-1()=
即年平均增长率为或%。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
四、众四、众 数数
资料资料 中出现次数最多的那个观测值或次数最多中出现次数最多的那个观测值或次数最多
一组的组中值,称为众数,记为一组的组中值,称为众数,记为MM00。。
如表如表2-3 2-3 所列所列 的的 5050枚受精种蛋出雏天数次数枚受精种蛋出雏天数次数
分布中,以分布中,以2222出现的次数最多,则该资料的众数为出现的次数最多,则该资料的众数为
2222天。天。
又如又如 【【例例】】 所所 列列 出出 的的 次数分布表中,次数分布表中,
5757--7171这一组次数最多,其组中值为这一组次数最多,其组中值为6464天,则该资天,则该资
料的众数为料的众数为6464天。天。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
五、调和平均数
资料中各观测值倒数的 算术平均数 的倒
数,称为调和平均数,记为H,即
(3-8)
调和平均数主要用于反映畜群不同阶段的
平均增长率或畜群不同规模的平均规模。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【【例例】】 某保种牛群不同世代牛群保种的规模某保种牛群不同世代牛群保种的规模
分别为:分别为:00世代世代200200头,头,11世代世代220220头,头,22世代世代210210
头;头; 33世代世代190190头,头,44世代世代210210头,试求其平均规模。头,试求其平均规模。
利用(利用(33--99)式求平均规模:)式求平均规模:
((头头))
即保种群平均规模为即保种群平均规模为头。头。
对于同一资料:
算术平均数>几何平均数>调和平均数
上述五种平均数,最常用的是算术平均数。
第二节 标准差
一、标准差的意义
用平均数作为样本的代表,其代表性的强
弱受样本资料中各观测值变异程度的影响。仅
用平均数对一个资料的特征作统计描述是不全
面的,还需引入一个表示资料中观测值变异程
度大小的统计量。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
全距(极差)是表示资料中各观测值
变异程度大小最简便的统计量。但是全距
只利用了资料中的最大值和最小值,并不
能准确表达资料中各观测值的变异程度,
比较粗略。当资料很多而又要迅速对资料
的变异程度作出判断时,可以利用全距这
个统计量。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
为 了 准 确 地 表示样本内各个观测值的变
异程度 ,人们 首 先会考虑到以平均数为标准,
求出各个观测值与平均数的离差,( ) ,
称为离均差。
虽然离均差能表示一个观测值偏离平均数的
性质和程度,但因为离均差有正、有负 ,离均
差之和 为零,即( ) = 0 ,因 而 不 能
用离均差之和Σ( )来 表 示 资料中所有
观测值的总偏离程度。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
为了解决离均差有正 、有负,离均差
之和为零的问 题 , 可先求 离 均 差的绝
对 值 并 将 各 离 均 差 绝对 值 之 和 除
以 观 测 值 个 数 n 求 得 平 均 绝 对 离
差,即Σ| |/n。虽然平均绝对离差可
以表示资料中各观测值的变异程度 ,但由
于平均绝对离差包含绝对值符号 ,使用很
不方便,在统计学中未被采用。
我们还可以采用将离均差平方的办法来解决
离均差有正、有负,离均差之和为零的问题。
先将各 个离 均差平方,即 ( )2 ,再
求 离均差平方和 , 即 ,简称平方和,
记为SS; 由 于 离差平方和 常 随 样 本 大 小
而 改 变 ,为 了 消 除 样 本大小 的 影 响 ,
用平方和 除 以 样 本 大 小, 即 ,求
出离均差平方和的平均数 ;
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
为了使所得的统计量是相应总体参数的无 偏
估计量,统计学证明,在求离均差平方和的平均
数时,分母不用样本含量n,而用自由度 n-1,
于是,我们 采 用统计量 表示资料
的变异程度。
统计量 称 为 均 方 (
mean square缩写为MS),又称样本方差,
记为S2,即
S2= (3-9)
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
相应的总体参数叫 总体方差 ,记
为σ2。对于有限总体而言,σ2的计算
公式为:
(3-10)
由于 样本方差 带有原观测单位的 平
方单位,在仅表示一个资料中各观测值的
变异程度而不作其它分析时 , 常需要与
平均数配合使用 ,这 时应 将平方单位还
原,即应求出样本方差的平方根。统计学
上把样本方差 S2 的平方根叫做样本标准
差,记为S,即:
(3-11)
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
由于
所以(3-11)式可改写为:
(3-12)
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
相应的总体参数叫总体标准差,记
为σ。对于有限总体而言,σ的计算公式
为:
(3-13)
在统计学中,常用样本标准差S估计
总体标准差σ。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
二、标准差的计算方法
(一)直接法
对于未分组或小样本资料 , 可直
接利用(3-11)或(3-12)式来计
算标准差。
【例】 计算10只辽宁绒山羊产绒量:
450, 450, 500, 500, 500,550,
550, 550, 600, 600,650(g)的
标准差。
此例n=10,经计算得:Σx=5400,
Σx2=2955000,代入(3—12)式得:
(g)
即10只辽宁绒山羊产绒量的 标准差 为
。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
(二)加权法
对于已制成次数分布表的大样本资料,可
利用次数分布表,采用加权法计算标准差。计
算公式为:
((33--1414))
式中,f为各组次数;x为各组的组中值;
Σf = n为总次数。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
【例】 利用某纯系蛋鸡200枚蛋重资
料的次数分布表(见表3-4)计算标准差。
将表3-4中的Σf、Σfx、 代入(3-
14)式得:
((gg ) )
即某 纯 系 蛋 鸡200枚 蛋 重的标准差为
。。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
表表33--4 4 某纯系蛋鸡某纯系蛋鸡200200枚蛋重资料次数分布枚蛋重资料次数分布
及标准差计算表及标准差计算表
三、标准差的特性三、标准差的特性
(一)(一)标准差的大小,受资料中每个观测值的影标准差的大小,受资料中每个观测值的影
响,如观测值间变异大,求得的标准差也大,反之则响,如观测值间变异大,求得的标准差也大,反之则
小。小。
(二)(二)在计算标准差时,在各观测值加上或减去在计算标准差时,在各观测值加上或减去
一个常数,其数值不变。一个常数,其数值不变。
(三)(三)当每个观测值乘以或除以一个常数当每个观测值乘以或除以一个常数aa,则所,则所
得的标准差是原来标准差的得的标准差是原来标准差的aa倍或倍或1/a1/a倍。倍。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
(四)在资料服从正态分布的条件下,资
料中约有%的观测值在平均数左右一
倍标准差( ±S)范围内;约有%
的观测值在平均数左右两倍标准差(
±2S)范围内;约有%的观测值在平
均数左右三倍标准差( ±3S) 范 围内。
也就是说全距近似地等于6倍标准差,可用
(全距/6)来粗略估计标准差。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
第三节 变异系数
变异系数是衡量资料中各观测值变异
程度的另一个统计量 。
标 准差与平均数的比值称为 变异系
数,记为C·V。
变异系数可以消除单位 和 (或)平
均数不同对两个或多个资料变异程度比较
的影响。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
变异系数的计算公式为:
(3-15)
【例】 已知某良种猪场长白成年母
猪平均体重为 190kg, 标准差为,
而大约克成年母猪平均体重为196kg,标准
差为,试问两个品种的成年母猪,那一
个体重变异程度大。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%
由于,长白成年母猪体重的变异系数:
大约克成年母猪体重的变异系数:
所以,长白成年母猪体重的变异程度大于
大约克成年母猪。
下一张 主 页 退 出 上一张
%E7%BB%93%E6%9E%84%E5%8A%9B%E5%AD%A6CAI%E8%AF%BE%E4%BB%