Quality Management
质量管理学
任务一 收集质量特性数据
33
任务二 整理与显示数据
任务三 统计分析方法的应用
22
11
质量管理方法
质量管理方法
1.了解质量特性数据的含义、类型与收集方法;
2.掌握数据排序、数据分组的方法;
3.熟知数据特征的描述;
4.掌握参数估计、假设检验、相关分析、回归
分析等统计分析方法。
任务一 收集质量特性数据
快速收集数据,抢占市场先机快速收集数据,抢占市场先机
作为广东省佛山市某大型陶瓷公司的市场总监,李总这段时间特别忙:一系列作为广东省佛山市某大型陶瓷公司的市场总监,李总这段时间特别忙:一系列
新产品已经研发成功,准备在最短时间内推向市场,抢占市场份额。新产品已经研发成功,准备在最短时间内推向市场,抢占市场份额。
为了对系列新品进行准确的价格定位、制定差异化的推广策略,李为了对系列新品进行准确的价格定位、制定差异化的推广策略,李
总要求销售助理联系五个大区的销售经理,尽可能全面地收集竞品的市场价格、总要求销售助理联系五个大区的销售经理,尽可能全面地收集竞品的市场价格、
销售情况以及推广活动等信息。销售情况以及推广活动等信息。
两天后,销售助理小张战战兢兢地向他报告,仅仅收集到四个大区的部分市场两天后,销售助理小张战战兢兢地向他报告,仅仅收集到四个大区的部分市场
数据,另外一个大区经理因为出差无法及时提供数据。李总并不着急,递给小张一数据,另外一个大区经理因为出差无法及时提供数据。李总并不着急,递给小张一
叠报表:叠报表:““这是全国各销售网点的销售人员针对新品收集的市场调研材料,以及同这是全国各销售网点的销售人员针对新品收集的市场调研材料,以及同
类产品的价格、销量、定位、市场占有率等市场数据,你把这些整理出来就行。类产品的价格、销量、定位、市场占有率等市场数据,你把这些整理出来就行。””
小张非常诧异,无法理解李总如何在两天时间内完成这么烦琐的数据收集小张非常诧异,无法理解李总如何在两天时间内完成这么烦琐的数据收集
工作!工作!
李总解释道:李总解释道:““昨天下班前我用信息机通知全国各区销售总监、区域经理,要求他们今昨天下班前我用信息机通知全国各区销售总监、区域经理,要求他们今
天早上九点前把同类产品的价格、销量、定位、市场占有率等市场数据发给我。天早上九点前把同类产品的价格、销量、定位、市场占有率等市场数据发给我。” ”
数据信息是企业重要的战略资源,
合理有效地使用正确的数据能指导企
业领导作出正确的决策,提高企业
的竞争力。不合理地使用不正确的数
据(差的数据质量)可导致决策的失败,
正可谓差之毫厘、谬以千里。
任务一 收集质量特性数据
波动性是指在相同的生产技术条件下生产出
来的一批产品,其质量特性数据由于受到操作者、
设备、材料、方法、环境等多种因素的影响而总
存在着一定的差异。
1. 波动性
任务一 收集质量特性数据
规律性是指当生产过程处于正常状态时,其
质量数据的波动是有一定规律的。
2. 规律性
任务一 收集质量特性数据
二、二、 质量特性数据的类型质量特性数据的类型
1. 计数值数据 2. 计量值数据
任务一 收集质量特性数据
(一)定量数据(一)定量数据
计数值数据是指在有限的区间内只能取有限个
整数值的数据,其取值只能是大于或等于零的整数,
否则将失去其实际意义,如铸件内的气孔个数、一
批产品中不合格品的件数等。
1. 计数值数据
任务一 收集质量特性数据
计数值数据又可分为计件值数据和计点值数据。
(1)计件值数据,表示具有某一质量标准的
产品个数,如总体中合格品数、一级品数。
(2)计点值数据,表示个体(单件产品、单位
长度、单位面积、单位体积等)上的缺陷数、质量问
题点数等,如检验钢结构构件涂料涂装质量时,构
件表面的焊渣、焊疤、油污、毛刺数量等。
任务一 收集质量特性数据
计量值数据是指在某个区间上的可能取值具有
连续性的数据,即在该区间内可以取无穷多个实数
值。常见的计量值数据有质量、面积、长度和体积
等。此外,一些属于定性的质量特性,可由专家主
观评分、划分等级而使之数量化,得到的数据也属
于计量值数据。
2. 计量值数据
任务一 收集质量特性数据
定性数据是用来
描述质量的定性特征
的数据。
任务一 收集质量特性数据
(二)定性数据(二)定性数据
三、三、 质量特性数据的收集质量特性数据的收集
任务一 收集质量特性数据
(一)全数检验(一)全数检验
全数检验是对总体中
的全部个体逐一观察、测
量、计数、登记,从而
获得对总体质量水平
评价结论的方法。
小小 案案 例例
外国公司怎样才能更加稳妥地进入中国市场?
哈根达斯是一个国际著名的冰淇淋品牌。在进入中国冷饮市场前曾经做了大
量细致的市场调查工作。公司认为首先要确定进入中国市场的“登陆滩”。公司
从居民的收入水平、消费习惯、对外来产品的接受能力等方面对中国几个大城市
作了调查,结果表明上海是最理想的首选地。同时调查结果还表明,上海对中国
其他地方消费观念的影响作用也十分明显。
接下来哈根达斯着手研究的是通过什么渠道将产品推进上海的千家万户。调
查结果显示上海市民选购冷饮的基本地方是:食品商场、大卖场、超市和便利店。
但是对具体的品牌选择上有明显的“购买场所与品牌”的倾向。一些早期进入上
海冷饮市场的国际品牌有自己的专卖店(与著名零售商业合作)。而中外合资的
便利店中顾客都是较高收入者和追求新奇的年轻人,这部分人是国际品牌在上海
的领先采用者。所以,哈根达斯选择在特定便利店与顾客“见面”的销售方式。
最早可以选择那些开设在高中、大学校园附近的和高档住宅区邻近的便利店,稳
定一段时间使顾客形成购买习惯。
任务一 收集质量特性数据
小小 案案 例例
产品包装设计的调查结果表明,哈根达斯若像可口可乐那样“中国化”可能
会影响它的品牌形象,所以公司决定在包装设计上尽量维持原有特征。
最后的调查目标是“上海消费者会接受的价格水平”。“和路雪”也是外来
者,它已经成为上海消费者最熟悉的食品商品品牌,价格已经作了几次调整,成
为大众化冷饮,而哈根达斯要独树一帜,就必须差异化营销。由于哈根达斯的产
品定位是高档冰淇淋,价格不能低,这样才能避免陷入原定目标顾客的“价廉无
好货”的思维定势。
近年来的实践证明,哈根达斯制定的营销策略实现了既定目标。在年轻人中
的普及率、忠诚度都达到并稳定在一定的水平。
任务一 收集质量特性数据
任务一 收集质量特性数据
(二)随机抽样检验(二)随机抽样检验
抽样检验是按照随机抽样的原则,从总体中
抽取部分个体组成样本,根据对样品进行检测的
结果,推断总体质量水平的方法。
抽样检验抽取样品不受检验人员主观意愿的
支配,每一个体被抽中的概率都相同,从而保证
了样本在总体中的分布比较均匀,有充分的代表
性;同时它还具有节省人力、物力、财力、时间
和准确性高的优点;它又可用于破坏性检验和生
产过程的质量监控,完成全数检测无法进行的检
测项目,具有广泛的应用空间。
1.
简单随机
抽样
2.
分层抽样
3.
系统抽样
4.
整群抽样
5.
多阶段抽样
任务一 收集质量特性数据
随机抽样方法分为:
简单随机抽样又称纯随机抽样、完全随机抽样,
是对总体不进行任何加工,直接进行随机抽样,获取
样本的方法。
简单随机抽样是指从含有N个单位的总体中随机
抽取n个单位作为样本,使得每一个容量为n的样本都
有相同的机会(概率)被抽中,这样的抽样方式也称
纯随机抽样。简单随机抽样是最基本的抽样方法。
1. 简单随机抽样
任务一 收集质量特性数据
采用简单随机抽样方式抽取样本,先要将总体各
个单位进行编码,后按随机原则抽取若干数码,所有
中选数码所对应的单位即构成样本。具体做法如下。
任务一 收集质量特性数据
(1)抽签法。当给总体各单位编号后,把号码
写在结构无效的签上,将签混合均匀后即可以从中抽
取。采用这种方法简便易行,然而对较大的总体来说,
编号做签工作量很大,而且混匀有困难,所以,这种
方法的应用具有一定局限性。
任务一 收集质量特性数据
(2)随机数字法。随机数字可以借助于计算机
获得,也可应用随机数表,其中随机数表方法应用较
为普遍。表中数字是按照完全随机的方法排列的。利
用随机数表进行抽样时,首先要给每个总体单位编号,
据编号的最大位数确定将要使用随机数表的列数,然
后从表中任意一列、任意一行开始,由纵向或横向划
线取数,遇到属于总体单位编号范围内的数组就确定
为样本单位,然后继续往下找。如果要求不重复抽样
时,遇到重复出现的数字(组)就弃之,直到取足要
求的单位数为止。
2. 分层抽样
任务一 收集质量特性数据
分层抽样又称分类或分组抽样,是指在抽样之前
先将总体划分为若干层(类),然后从各个层(类)
中抽取一定数量的单位组成样本的抽样方式。
任务一 收集质量特性数据
例
子
某大学的经济管理学院想对2015年的毕业生
进行一次调查,以便了解他们该年度的就业倾向。
该大学经济管理学院共有5个专业:工商管理、经济
贸易、市场营销、经营管理、物流管理。2015年共有
4 500名毕业生,其中工商管理专业1 050名,经济贸易专业
850名,市场营销专业1 150名,经营管理专业1 150名,
物流管理专业300名。使用分层抽样,假定要选取450
人作为样本单位,各专业应抽取的人数分别为:工商
管理专业105名,经济贸易专业85名,市场营销专业
115名,经营管理专业115名,物流管理专业30名。
任务一 收集质量特性数据
分层抽样是一种常用的抽样方式。它主要具有以下优点。
(1) 分层抽样既可以对总体进行估计,也可以对各层
的子总体进行估计。
(2) 分层抽样既可以按自然区域分层,也可以按行政
区域进行分层,这样使抽样的组织和实施都比较方便。
(3) 分层抽样的样本分布在各个层内,从而使样本在
总体中的分布比较均匀。
(4) 分层抽样可以提高估计的精度。
任务一 收集质量特性数据
3. 系统抽样
系统抽样,也称等距抽样或机械抽样,是指先将
总体各单位按某种顺序排列,并按某种规则确定一个
随机起点,然后,每隔一定的间隔抽取一个单位,直
至抽取n个单位形成一个样本的抽样方式。
任务一 收集质量特性数据
系统抽样也是一种常用的抽样方式,它主要具有以下优点。
(1)简便易行。当样本容量很大时,简单随机抽样要逐个
使用随机数字表抽选也是非常麻烦的,而系统抽样有了总体元素
的排序,只要确定出抽样的起点和间隔后,样本元素也就随之确
定,而且可以利用现有的排列顺序。
(2)系统抽样的样本在总体中的分布一般也比较均匀,由
此抽样误差通常要小于简单随机抽样。如果掌握了总体的有关信
息,将总体各元素按有关标志排列,就可以提高估计的精度。
整群抽样(cluster sampling),也称集团抽样
或分群随机抽样,是将总体划分成若干群,然后以群
作为抽样单位,从中抽取部分群,再对抽中的各个群
中所包含的所有单位进行观察的抽样方式。
4. 整群抽样
任务一 收集质量特性数据
整群抽样具有以下优点。
(1) 不需要有总体元素的具体名单而只要有群的名单
就可以进行抽样,而群的名单比较容易得到。
(2) 整群抽样时群内各元素比较集中,对样本进行调
查比较方便,节约费用。当群内的各元素存在差异时,整群
抽样可以提供较好的结果,理想的情况是每一群都是整个总
体的一个缩影。在这种情况下,抽取很少的群就可以提供有
关总体特征的信息。但是,如果实际情况不是这样,那么整
群抽样的误差会很大,相应地,效果也就很差。
任务一 收集质量特性数据
5. 多阶段抽样
任务一 收集质量特性数据
多阶段抽样又称多级抽样。上述抽样方法的共同
特点是整个过程中只有一次随机抽样,因而统称为单
阶段抽样。但是当总体很大时,很难一次抽样完成预
定的目标。多阶段抽样是将各种单阶段抽样方法结合
使用,通过多次随机抽样来实现的抽样方法。
怎样称翡翠的重量
假设有一颗价值很高的翡翠,想用一架天平尽可能准确地称
出它的重量有多少,通常天平总会有些误差。为得到更准确的结
果,可以在天平上重复称5次,得到数据,这是含有误差的数据,
误差多大,由种种偶然性的因素(环境因素、人操作不当之类)
所决定,其值在各次称量时都可能不同,无法确知,但遵从一定
的概率规律。一般人使用的方法是取5次称量结果的平均值。一
般来讲,这比只称一次要准确,其实这正是统计学中常用的一个
重要方法。
任务二 整理与显示数据
任务二 整理与显示数据
数据整理是根据调查研究的目的,运
用科学的方法,对调查所获得的数据进行
审查、检验,分类、汇总等初步加工,
并以集中、简明的方式反映调查对象总体
情况的过程。数据整理是数据研究的重要
基础,是提高调查数据质量和使用价值的
必要步骤,是保存数据的客观要求。
任务二 整理与显示数据
数据的检查是指对所收集的数据的完整
性和准确性进行检查。
数据检查的目的是为了甄别出符合研究
要求的有效数据,剔除无效数据的干扰和影
响,为进一步的统计整理打好基础,从而提
高统计分析结果的准确性。针对问卷调查而
言,数据检查的主要内容就是问卷的完整性
和准确性。
一、一、 数据的检查数据的检查
二、二、 数据的校订数据的校订
所谓数据的校订,是
指根据研究目的和研究设
计,对数据做进一步的补
充和修正,以满足统计
研究的要求。
任务二 整理与显示数据
三、三、 数据的排序数据的排序
数据排序就是将数据按
照数值大小、类别等级等规则进行重新
排列。特别是当数据类型是定量数据,且数据的
数量较为庞大时,通过数据排序更
有助于突出一些明显的特征和趋
势,并且可以为后面的分组、众
数、中位数等统计计算提供便利。
任务二 整理与显示数据
四、四、 数据的分组数据的分组
数据分组是根据统计分析的需要,将
数据总体按照一定的分组标志,分成若干
个组成部分。分组有助于显现数据的类别差
异、结构情况或数量上的层次性,也有助于简
化后续的一些统计计算,是整理数据时被广泛
采用的一种方法。
任务二 整理与显示数据
任务二 整理与显示数据
四、四、 数据的分组数据的分组
数据分组是根据统计分析的需要,
将数据总体按照一定的分组标志,分成
若干个组成部分。分组有助于显现数据
的类别差异、结构情况或数量上的层次
性,也有助于简化后续的一些统计计算,
是整理数据时被广泛采用的一种方法。
对于定性数据,
可以根据统计分析
的需要按照数据的
类别或等级对数据
进行分组。
任务二 整理与显示数据
1. 定性数据分组方法
任务二 整理与显示数据
抽取某种产品100
个,通过检验,有特等
品20个、一等品49个、
二等品28个、残次品3
个。
分组方案一:将该数据按照表述中的等级分为四组,显示出具体的
产品等级情况。
分组方案二:只考虑产品的合格率,也可以采用另一种分组形式,
将其直接分为两组,即合格产品97个、残次品3个。
这两种分组方案各有其针对性,为更直观地显示其类别结构情况,
可以采用饼图将这两种分组方案分别表示出来,如图下图所示。
任务二 整理与显示数据
对定量数据进
行分组的关键是确
定组数、组距及组
限。
任务二 整理与显示数据
1. 定性数据分组方法
任务二 整理与显示数据
(1)组数。
对于定量数据分组的组数不存在严格的规定,确定
组数主要应参考数据的数量和集中程度。但组数既不宜
过多也不宜过少,因为过多或过少都不便于观察数据的
特征和规律。美国学者斯特奇斯()提出了
一个关于确定组数的经验公式:
式中,K为组数;n为数据个数。
任务二 整理与显示数据
(2)组距。
组距可以由组数得到,组距用字母h表示:
式中,K为组数;R为全距,是n个待分组数据中最大
值与最小值的差。
任务二 整理与显示数据
(3)组限。
在确定了组距之后,就需要确定具体的组限,并进
而确定最终的组数。组限就是各个相邻组之间的具体分
界值,也就是每一个组的两个端值。
一个组取值范围的下限用字母L表示,上限用字母U
表示。组限范围必须包含所有的数据值,即第一组的下
限要小于或等于数据中的最小值,而最末组的上限则应
大于或等于数据中的最大值。
任务二 整理与显示数据
(4)组中值。
组中值是一个分组的上限和下限的中间值,即:
对于开口组的组中值,通常是以其邻近组的组距来
进行计算。即:
分组数据频数柱形图
任务二 整理与显示数据
一个组的组中值体现了该组数据的一个平均水平,
可以作为一个标志值来近似代表整组数据的数值,可
以用柱形图将每组数据的个数更加直观地表示出来:
五、五、 数据特征的描述数据特征的描述
任务二 整理与显示数据
((一)集中趋势一)集中趋势
常见的计算
方法有:
1. 算术平均数
2. 几何平均数
3. 中位数
4. 众数
计算公式是:计算公式是:
任务二 整理与显示数据
1. 算术平均数
任务二 整理与显示数据
(1)简单算术平均数。对于未分组的n个数据x1
,x2,x3,……,xn,其简单算术平均数的计算公式
为:
计算公式是:计算公式是:
任务二 整理与显示数据
(2)加权算术平均数。当数据经过分组处理后,
设其组数为n,各组的组中值依次为x1,x2,x3,
……,xn,各组的频数依次为f1,f2,f3,……,fn
,那么其加权算术平均数为:
计算公式是:计算公式是:
计算公式是:计算公式是:
任务二 整理与显示数据
2. 几何平均数
计算公式是:计算公式是:
任务二 整理与显示数据
3. 中位数
计算公式是:计算公式是:
任务二 整理与显示数据
4. 众数
(1)当数据的分布状态基本对称时,算术平均数、
众数和中位数三者的数值非常接近,甚至几乎相同。
数据分布基本对称时,
算术平均数、众数及
中位数的关系
任务二 整理与显示数据
5. 算术平均数、众数及中位数的关系
(2)当数据的分布状态不对称时,算术平均数、众
数和中位数则取值不同。
数据分布呈正偏态时,算术平均数、
众数及中位数的关系
数据分布呈负偏态时,算术平均数、
众数及中位数的关系
任务二 整理与显示数据
任务二 整理与显示数据
((二)离散趋势二)离散趋势
离散趋势也称离中趋势,用以表
征数据离散的程度。对应于数据的集
中趋势,用以度量数据离散趋势的常
用方法包括对应于算术平均数的平均
差、方差与标准差、离散系数,对应
于中位数的四分位差,以及对应于众
数的异众比率。
任务二 整理与显示数据
2.
方差与
标准差
3.离散系数 4.
四分位差
5.
异众比率
1.平均差
离散趋势的
常用方法
任务二 整理与显示数据
1. 平均差
平均差是各个数据与它们算术平均数的离差绝对值的算
术平均数,用.表示。其取值越大,也就表示数据的离散程
度越大。
对于未分组的数据,平均差的计算公式为:
对于已分组的数据,可以采用加权平均差的计算公式:
任务二 整理与显示数据
(1)方差与标准差的定义。
方差与标准差,是测度定量数据离散程
度时最重要、最常用的统计指标。方差是各
个数据与它们算术平均数的离差平方的平均
数,通常用σ2表示。方差的算术平方根就是
标准差,也称均方差,通常用σ表示。
2. 方差与标准差
任务二 整理与显示数据
(2) 总体方差与标准差。
首先对总体数据的方差与标准差进行计
算。总体容量记为N,则总体数据可以依次表
示为X1,X2,X3,……,Xn,总体平均数记
为X。那么,对于已分组及未分组的总体数据,
方差和标准差的计算公式分别为(K为组数):
任务二 整理与显示数据
未分组总体数据的方差:
任务二 整理与显示数据
已分组总体数据的方差:
任务二 整理与显示数据
未分组总体数据的标准差:
任务二 整理与显示数据
已分组总体数据的标准差:
任务二 整理与显示数据
(3) 样本方差与标准差。
样本方差与总体方差在计算上存在着细
微的区别:总体方差是用总体数据的个数去
除离差平方和;而样本方差则是将样本数据
个数先减去1,然后再去除离差平方和。
任务二 整理与显示数据
为区别于总体方差和标准差,样本方差
用s2表示,样本标准差用s表示。样本容量记
为n,样本数据依次为x1,x2,x3,……,xn
,样本平均数用x表示。所以对于已分组及未
分组的样本数据,其方差和标准差的计算公
式分别为(k为组数):
任务二 整理与显示数据
未分组样本数据的方差:
任务二 整理与显示数据
已分组样本数据的方差:
任务二 整理与显示数据
未分组样本数据的标准差:
任务二 整理与显示数据
已分组样本数据的标准差:
任务二 整理与显示数据
3. 离散系数
(1)离散系数的含义。
其数值的大小一方面与数据值绝对量的整体水平有关,
即当离散程度相当时,数据值绝对量的整体水平越高,其
离散趋势的测度值自然也就越大,反之亦然;另一方面,
其测度值的大小也与数据值的计量单位有关,当数据值采
用不同的计量单位时,其离散趋势测度值的绝对量也就相
应不同。
任务二 整理与显示数据
离散系数,也称变异系数,就满足了这种要求,它消
除了数据值绝对量水平高低以及计量单位不同对考察离散
程度相对水平的影响。离散系数是采用离差值与平均数的
比值,通常用百分数表示。
任务二 整理与显示数据
(2) 标准差系数及公式。
离散系数有多种计算方法,但最常用的是标准差系数。
标准差系数就是数据的标准差与其相应的均值之比,公式
为:
式中,Vσ为总体标准差系数;Vs为样本标准差系数。
任务二 整理与显示数据
4. 四分位差
四分位差是对应于中位数对集中趋势的刻画,用以描述
数据离散程度的一种方法。类似于中位数选取在数列中间位置
的数据值的思想,应用四分位差时,可以将数列进行四等分,
选取位于四分之一和四分之三位置上的两个数据值,分别记为
Q1和Q3。那么四分位差就等于Q3减去Q1的差值,用
QD(quartile deviation)表示,即:
任务二 整理与显示数据
5. 异众比率
对应于众数对数据集中趋势的测度,可以在此基础
上用异众比率度量其数据的离散趋势。异众比率是非众
数(组)的频数占总频数的比重,通常用Vr表示。其具
体的计算公式为:
式中,fm为众数(组)频数。
任务三 统计分析方法的应用
医院的新规定是否有帮助
对于新生儿的管理,国外过去传统的做法是让婴儿母亲看一眼新生婴儿后,就将婴
儿放到单独的婴儿房间中去喂养,8小时后再放回母亲身边。为了研究新生儿出生后将
孩子放在母亲身边是否会增进日后母子的感情,研究人员从临产的孕妇中随机地抽出28
个孕妇,进而随机地将其分成两组,每组14个孕妇。一组按传统方式,即前8小时单独
喂养;另一组按试验方式,一直放在母亲身边。但在试验中要注意有两个随机性:一是
28个孕妇应随机抽出,二是在将28个孕妇分出两组时也应保持随机,因为只有随机性才
能避免试验结果的系统偏差并能够控制随机误差。
在婴儿成长的一段时间里,试验者要将这28个母亲每人的有关行为进行记录,如对
于哭叫的婴儿是否立即抱起来及搂抱的时间长短,对于孩子定期体检和孩子生病的关心
程度等。然后对每个母亲按其对孩子感情的由浅到深的程度打分。其中,0分是对孩子
毫无感情,12分表示感情最深。经过整理得出,新的试验方式得分较高,即婴儿出生后
就放在母亲身边能加深母子感情。
要证实这一判断,可以用假设检验方法检验两个总体(两种方式)的均值是否相等。
利用置信区间和假设检验的对偶性,即置信区间和假设检验是同一问题的两个方面,计
算两个总体均值之差的95%的置信区间。在试验中不难得到如下试验方式的得分数据值
X1和对应的频数f1,如下表所示。
得分数据值 X1 和对应的频数 f1
— —
任务三 统计分析方法的应用
传统方式的得分数据值X2和相应的频数f2,如下表所示。
— —
任务三 统计分析方法的应用
— —
任务三 统计分析方法的应用
利用两个总体均值之差置信区间公式得到:
由于两种方式得分均值之差的95%置信区间是(-,+)即
(,),试验方式比起传统方式的得分要明显地多2~6分,说明两种方式的差
异是明显的。另外,我们也可将(,)看成一个假设检验的区间,由于这个区
间没有能够覆盖原假设 H0:μ1-μ2=0(两种方式无差别)的数值,因而不能接受原假
设 μ1-μ2=0,可以认为 μ1-μ2≠0。在该例子中μ1>μ2 是明显的。
— —
任务三 统计分析方法的应用
任务三 统计分析方法的应用
上述这个试验是教授等在1972年发表的著名论文《母爱》(Maternal
Attachment)中所做的。这个结论的可靠性取决于样本的随机性和代表性。显然,这个试验的样
本(28个母亲)是不大可能从美国这一国家的全部孕妇中抽出的,而是从某一地区的孕妇中抽出
的,那么这一地区的教育水平、生活收入等特点就会对试验结果产生影响。事实上,样本抽取地
区的老百姓生活水平较低,许多家庭是依靠社会保障和社会救济生活的。由于这一
样本的特殊性,那么是否对所有的美国妇女来说这一试验的结果都有效呢?即对于所
有的妇女当新生婴儿出生后母子在一起能有益于母子感情的加深呢?其他的科学家也做
过相似的试验,回答是肯定的。但研究又发现,越是生活贫困的母亲,越希望新生
婴儿能留在自己身边,所产生的母子感情越深厚,影响的时间越深远。这一研究
成果的发表在20世纪70年代产生了较大的轰动和影响,许多医院的妇科病房都改
进了婴儿喂养方式,从出生后就将孩子留在母亲身边,并一直延续至今,而证明
这一试验的方法就是上述讨论的假设检验的统计方法。
一、一、 参数估计参数估计
任务三 统计分析方法的应用
(一)点估计(一)点估计
点估计也称定值估计,是指通过
计算样本的参数值,估计对应整体参
数的一个具体数值。例如,用袋装食
品质量的样本平均数作为其总体平均
质量的估计值。在点估计的各种方法
中,最常见的有矩估计法和最大似然
估计法。
任务三 统计分析方法的应用
(二)区间估计(二)区间估计
区间估计是依据抽取的样本,根据一
定的正确度与精确度的要求,构造出适当
的区间,作为总体分布的未知参数或参数
的函数的真值所在范围的估计。例如,人
们常说的有百分之多少的把握保证某值在
某个范围内,即是区间估计的最简单的应
用。区间估计的基本思想就是依照一定的
概率保证程度,用样本统计量估计总体参
数的取值范围。
任务三 统计分析方法的应用
在区间估计中,一个重要的概念是置信度,也
称置信水平或置信概率。置信度用1-α表示,其中
α(0<α<1)代表一个较小的概率。
将需要估计的总体参数记为θ,而θL和θU是由样本
确定的两个统计量,如果对于给定的α,满足:
就称(θL,θU)是参数θ的置信度为1-α的置信区间。
该区间的两个端点θL、θU分别称为置信下限和置信
上限。
商 店 选 址
张先生是台湾某集团的企划部经理,在今年的规划中,集团准
备在某地新建一家零售商店。张先生目前正在做这方面的准备工作。
其中有一个项目便是进行市场调查。在众多信息中,经过该地的行
人数量是要考虑的一个很重要的方面。张先生委托他人进行了两个
星期的观察,得到每天经过该地人数如下:
544,468,399,759,526,212,256,456,553,259,469,
366,197,178。
如果设立商店要求的最低行人数为520人,那么,根据观察到的
上述数据,能否支持设店的决策呢?
把14天经过该地的人数作为样本,商店开张后经过该地的人数
作为总体。显然,这是参数估计问题。根据样本数据,可计算得出
样本均值为403人,样本标准差为人。设置信度为95%,则可
估计出平均每天经过此地的人数,如下表所示。
小
案
例
任务三 统计分析方法的应用
结果表明,在95%的置信度下,行人数为306~500人。这个结
论意味着,如果要观察100天,则有95天的行人数位于这一区间内。
那么如果设立商店要求行人数最低不低于520人,显然在这一地点建
立商店是不明智的。
小
案
例
任务三 统计分析方法的应用
区间估计的结果
1.
无偏性
2.
一致性
3.
有效性
任务三 统计分析方法的应用
(三)评价估计量的标准(三)评价估计量的标准
1. 无偏性
任务三 统计分析方法的应用
无偏性的直观意义是没有系统性误差。虽然每个可
能样本的估计值不一定恰好等于未知总体参数,但如果
多次抽样,应该要求各个估计值的均值等于总体参数的
均值,即从平均意义上看,估计量的估计是没有偏差的。
这一要求称为无偏性,如下图所示。一般来说,这是一
个优良的估计量必须具备的性质。例如,样本均值x和样
本比例p分别满足:
任务三 统计分析方法的应用
有偏和无偏估计量示例
任务三 统计分析方法的应用
按照无偏性的要求,样本标准差 是
不能作为总体标准差σ的估计量的,因为它不满足无偏
性的要求(证明从略)。可以证明,样本修正标准差
是总体标准差σ的无偏估计量。
2. 一致性
任务三 统计分析方法的应用
一致性要求用样本估计量估计和推断总体参数时要
达到:样本容量n充分大时,样本估计量充分靠近总体
参数,即随着n的无限增大,样本估计量与未知的总体
参数之间的绝对离差任意小的可能性趋于实际的必然性。
根据概率论中的大数定律可知,当样本容量越来越大时,
样本均值与总体均值的偏差小于任意给定的正数的可能
性趋近于1的概率,即几乎是一定发生的。因此,样本
估计量是总体参数的一致估计量,如下图所示。
任务三 统计分析方法的应用
两个不同容量样本的样本统计量的抽样分布
3. 有效性
任务三 统计分析方法的应用
有效性要求样本估计量估计和推断总体参数时,作为
估计量的标准差比其他估计量的标准差小。如果一个无偏
估计量在所有无偏估计量中标准差最小,即:
式中, 为任意一个无偏估计量,则 是有效估计
量,或称该估计量具有有效性。显然,如果某总体参数具
有两个不同的无偏估计量,希望确定哪一个是更有效的估
计量,应该选择标准差小的那个。估计量的标准差越小,
推导出接近于总体参数估计的值的机会越大,如下图所示。
任务三 统计分析方法的应用
两个无偏点估计量的抽样分布
二、二、 假设检验假设检验
1. 2. 3. 4. 5.
建立假设
选取适当的检验统计量
确定显著性水平
对检验统计量进行计算
判断假设是否成立
任务三 统计分析方法的应用
(一)假设检验的步骤(一)假设检验的步骤
任务三 统计分析方法的应用
(二)双侧检验与单侧检验(二)双侧检验与单侧检验
根据显著性水平α可以得到临界值,也就是将检验统计量的取
值范围划分为接受区域和拒绝区域。拒绝区域表示检验统计量小概
率在其中取值的区域。根据实际问题不同,拒绝区域可能是在检验
统计量分布的两端,也可能是在其分布的某一侧,这两种情形分别
称为双侧检验和单侧检验。单侧检验依据拒绝区域是在左侧还是在
右侧,可以分为左单侧检验和右单侧检验。
当需要分析的问题是总体平均数等参数是否发生了变化,而不
必关心或区分它是变大或者变小时,就应该采用双侧检验。此时,
原假设表述为等式,而备择假设是用“≠”符号表示的不等式。
(1) 做假设检验之前,应注意资料本身是否有可比性。
(2)当差别有统计学意义时,应注意这样的差别在实际应用
中有无意义。
(3)根据资料类型和特点选用正确的假设检验方法。
(4)根据专业及经验确定是选用单侧检验还是双侧检验。
任务三 统计分析方法的应用
(三)假设检验的注意事项(三)假设检验的注意事项
任务三 统计分析方法的应用
(6)判断结论时不能绝对化,应注意无论接受或拒绝检验
假设,都有判断错误的可能性。
(7)报告结论时应注意说明所用的统计量,检验的单双侧
及P值的确切范围。
(5)当检验结果为拒绝无效假设时,应注意有发生Ⅰ类错
误的可能性,即错误地拒绝了本身成立的 ,发生这种错误的
可能性预先是知道的,即检验水准多么大;当检验结果为不拒绝
无效假设时,应注意有发生 Ⅱ 类错误的可能性,即仍有可能错
误地接受了本身就不成立的 ,发生这种错误的可能性预先是
不知道的,但与样本含量和Ⅰ类错误的大小有关系。
三、三、 相关分析相关分析
任务三 统计分析方法的应用
(一)相关关系的类别(一)相关关系的类别
(1)
1. 函数关系
函数关系是指变量之间存在一种严格的确定性的依存关
系,即某一变量发生变化则另一变量也随之发生变化,而且
有确定的值与之相对应。
任务三 统计分析方法的应用
(2)
2. 相关关系
相关关系也是变量之间确实存在的一种依存关系,但这
种依存关系在数量上并不是严格对应的。所以,在相关关系
中,对于某一变量的每一个数值,可以有另一个变量的若干
数值与之相对应。因而在实际问题中,很多具有相关关系的
变量或现象,都可以表现出一定程度上的因果关系。
对于线性相关关系,可以通过计算协方差等,得到用以表征
两个变量间线性相关程度的定量指标——相关系数r:
式中,相关系数r的取值介于-1与1之间,即-1≤r≤1。
任务三 统计分析方法的应用
(二)线性相关关系(二)线性相关关系
当r>0时,表示两个变量为正相关;当r<0时,两个变
量则为负相关;当r=0时,表明两个变量间没有线性相关关
系;而当|r|=1时,则表示两个变量是完全线性相关关系,即
为严格的直线函数关系。
对于r的其他取值,代表的线性相关程度依次为:
0<|r|≤——微弱相关;
<|r|≤——低度相关;
<|r|≤——中度相关;
<|r|<1——高度相关。
任务三 统计分析方法的应用
四、四、 回归分析回归分析
一元回归分析
按照涉及的
自变量的多少
多元回归分析
任务三 统计分析方法的应用
(一)回归分析的分类(一)回归分析的分类
线性回归分析
按照自变量和因
变量之间的关系
类型
非线性回归分析
任务三 统计分析方法的应用
任务三 统计分析方法的应用
如果在回归分析中,只包括一个自变量和
一个因变量,且二者的关系可用一条直线近似
表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,
且因变量和自变量之间是线性关系,则称为多
元线性回归分析。
相关分析是回归分析的基础和前提,回归分
析则是相关分析的深入和继续。具体来说,回归
分析需要依靠相关分析来表现变量之间数量变化
的相关程度,而相关分析也需要通过回归分析来
表达变量之间数量相关的具体形式。
任务三 统计分析方法的应用
(二)回归分析与相关分析的关系(二)回归分析与相关分析的关系
回归分析的主要目的是通过一个变量或一些
变量的变化来解释另一个变量的变化。其主要内
容和步骤为:首先,依据对问题的具体判断,将
变量分为自变量和因变量;其次,确定适合的数
学方程式作为回归模型,描述变量间的相关关系;
再次,针对变量的不确定性,对回归模型进行统
计检验;最后,应用回归模型,根据自变量来估
计、预测因变量,得到最终的分析结论。
任务三 统计分析方法的应用
X、Y是具有线性相关关系的两个变量,对于
某个确定的x值,其对应的y值虽有波动,但随机误
差的期望值应该为零,由此得一元线性回归方程的
表达式为:
任务三 统计分析方法的应用
(三)一元线性回归分析(三)一元线性回归分析
1
2
3
4
5
确定变量
建立预测模型
进行相关分析
计算预测误差
确定预测值
任务三 统计分析方法的应用
(四)回归分析的步骤(四)回归分析的步骤
五、五、 方差分析方差分析
任务三 统计分析方法的应用
方差分析也是质量管理中常用
的统计技术之一,主要针对多个总
体的均值是否有显著性差异的检验
问题。
方差分析事实上就是对观测数
据影响因素的数量分析。
谢谢观看!
Thanks!