商务智网()
方差分析(ANOVA)
一、方差分析的基本思想
1. 方差分析的概念
方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析和两因素方差分析即配伍组设计的方差分析。
2. 方差分析的基本思想
下面我们用一个简单的例子来说明方差分析的基本思想:
如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,
患者:
健康人:
问该地克山病患者与健康人的血磷值是否不同?
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:
(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。
而且:SS总=SS组间+SS组内 v总=v组间+v组内
如果用均方(即自由度v去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
3. 方差分析的应用条件
应用方差分析对资料进行统计推断之前应注意其使用条件,包括:
(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。
(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。
(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。
二、方差分析的主要内容
根据资料设计类型的不同,有以下两种方差分析的方法:
1. 对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。
2. 对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。整个方差分析的基本步骤如下:
(1) 建立检验假设;
H0:多个样本总体均数相等。
H1:多个样本总体均数不相等或不全等。
检验水准为。
(2) 计算检验统计量F值;
(3) 确定P值并作出推断结果。
三、多个样本均数的两两比较
经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
1. 多个样本均数间两两比较
多个样本均数间两两比较常用q检验的方法,即 Newman-kueuls法,其基本步骤为:
建立检验假设-->样本均数排序-->计算q值-->查q界值表判断结果。
2. 多个实验组与一个对照组均数间两两比较
多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q’界值表
老鼠的6σ改善
时间:2050年6月14日早上8点,地点:A镇地下的一座老鼠王国内 鼠国王正在巡查他那引以为豪的仓库,仓库是存放他的各项储备的地方,可是这次的巡查却令他非常的失望,因为他发现了此月的库存量又比上月下降了6个百分点,并且还有下降的趋势,国王大怒,质问大臣们为什么会这样,大臣们你一言我一语说了许多原因,听得国王昏头转向,这时只听有名的G博士说:"大王,最近我在下水道中捡到一本关于6σ改善的书,他所改善的对象就是有许多原因但不知道究竟是哪种原因影响的变化,通过寻找致命的因子,使其最佳化的一种改善方法。"国王听后大喜,并马上要求G 博士成立6σ改善队对库存减少进行改善,为期15天。
其实G博士也只是刚刚开始学习这种新的方法,不过他已经对这种技法产生了浓厚的兴趣,并且对这次的改善充满了信心,接到国王的命令后他马上开始行动了,先后吸收了三名队员来参加,他们分别是L君,Z君,和R君。L君是一位电脑高手并且头脑灵活, Z君则是一位设计冶工具的能手,而R君是管理部的高干,有丰富的管理经验和良好的鼠际关系,对整个王国的运营和体制非常熟悉。
此时的老鼠王国已经是拥有一万子民的大国,城堡也已经颇具规模,有自已的军队和一批技术能手,还具有一些管理天才,他们已经掌握了如何使用电脑,如何设计反灭鼠器的工具等一系列的高端科技,而此时也是王国的一个过渡时期,因为此时的王国不但要时刻和邻镇的B王国争夺地盘和鼠才,而且还需要时刻抵防人类的新式的灭鼠技术,还要和猫王国处理好猫鼠关系,所以鼠国王认为只有不断的强化自己的国防力量和储备,培养高科技的鼠才,王国才有出路,而刚巧在这个时候储备上出了问题,着时让他大伤脑筋,幸亏有G博士这样的鼠才,不过他也有些怀疑这种新的改善方法究竟行不行!
得到国王的支持,G博士和他的队员们无比喜悦,但是G博士更感觉肩负的压力越来越重,因为经过 前一段分析,他深感到他这次活动的重要性,是关系到整个王国的存亡,也意识到要达成目标简直是不可完成的任务,因为摆在他眼前的问题点实在是太多,这些都在一点点的抹杀他的自信心,最关键的是时间,在短短15天的时间内,他能够完成吗?
根据计划安排,活动要开始测定阶段了,测定阶段的要点是测定系统安定化和把握现况定改善方向,对于测定G博士确实有一些头痛,因为目前的鼠国子民一万,要收集每只鼠的效率数据是一件庞大的工程,而且数据的真假还有待考证,这和鼠国的组织有密切的关系,鼠国子民基本上可以分为两大鼠群,脑力鼠群和劳力鼠群,他们之间的比例为1:9,既脑力鼠群1千,劳力鼠群9千,脑力鼠群内又分为A,B,C三等级,劳力鼠群分A,B,C,D,E,F共六等级,F级鼠主要出去活动,每一百个F级由一个E级来负责管理,10个E级由一个D级来管理,3个D级由一个C级来管理,所有的C级由一个B级来管理,一个A级直接管这个B级,且定期向国王汇报整理业绩,脑力鼠群组织也一样。劳力鼠群的业务主要有:出外打仗,伐木,挖矿,修建,偷窃等,而脑力鼠群的业务主要有:治工具设计,兵器设计,电脑软件设计,医疗,数据整理,品质分析等。由于等级较多,且各等级之间差别较大,导致各种权力纷争也不少,并且出现各等级之间勾心斗角,相互猜疑,不合作不协调的事时有发生,还有下一级怕上一级责怪自已无能而刻意隐瞒真相,上报的数据都是很高很好的状态!这给G博士的改善带来极大的阻力,G 博士知道倘若先不扭转这样的局势,他是不会成功的,就这个问题他和队员们已经开了两天的会来检讨方案。最后他们检讨出一套新的组织方案--竞争集团制,由R君马上起草,并交给国会检讨,国王和元老们看过后展开激烈的讨论,最终决定试用半年!于是国王立即召集B级以上鼠员动员大会,实施竞争集团制组织!新的组织方案大体如下:1)全国分为十个大集团,每个集团包含以前的每一个阶层,即每个集团是独立的;2)每个集团制定每个集团的储备目标,基准和目标由G博士的精英改善队制定;3)此目标由精英改善队统一管理,每月进行评价,评价内容包括报告的含金量及全员的参与度,最佳的给予奖励,最差的寻找原因,并树立对策;4)裁军50%用于生产,兵权集中在国王手上,减少军用开资!5)制定秒管理制度,即规定一系列活动的平均时间和规格,精确到秒,超出规格检讨原因,6) G博士的精英改善队采用周别管理,制定每个集团的业务曲线可视化,每周定期发表!
实行新的组织方案虽然受到了少数派的敌对,但多数鼠辈都非常支持,新组织的推行增加了全民的竞争意识和自律改善思想,对G博士的改善起到了极积的推进作用,使收集数据也变得简单化!
协助新组织方案推行的同时,G博士的改善也进入了分析阶段,分析阶段是把一系列的预备因子寻找出来验证,是否为致命的影响改善核心的因子,G博士邀请了各个级别的两个代表来一次座谈会,探讨影响鼠效率的有哪些因子,最后总结五个方面:1.鼠际关系,细部可分为上司和下属的关系,同级别的关系,下属和上司之间的关系2. 鼠本身的问题,细部内容有身体健康问题和鼠的心理问题3.王国的待遇问题,细部内容有住房问题,吃饭问题,提级问题4.工具的问题,细部包括兵器的精良,治工具的精度,运输的改进5.各项储备的来源的难易,细部包括水电的来源,矿藏的来源,食物的来源和木材的来源等。
得出这些因子后,G 博士按照层层分析的逻辑图表达出来,然后复印1万份采用民意调查分发给每一只鼠来选择重要因子,收集回来分析结果发现重要的因子有如下四条:1)上司和下属的关系难相处;2)鼠的心理问题,即对打仗和偷窃的恐惧;3)提级问题;4)食物的来源太难,因为靠偷窃而来。
重要因子导出后G博士的改善队开始提出改善案了,对于第一个问题的方案:组织一次优秀干部评选活动,每级评选一个,然后听取各优秀鼠员的经验,找出共同点适用到各级干部;第二个问题的方案:成立思想教育部,主要教育内容为宿命论,宣传十八月后又是一条好汉的思想;第三个问题的方案:可以自行组织改善队,若成功者累积三件可以额外提升;第四个问题方案:根据牛吃的是草挤出的是奶的道理研制一台制造食物的设备或直接窃取人类的机器。
各改善案提出后经国会检讨后实施,并制定出日程计划及担当,在6月30号终于全部改善完了,并且完成目标120%,G博士为管理因子制定如下计划:1)新组织方案持续运行2)每年组织一次优秀干部评选活动3)思想教育部每月上四次课,两年一个循环4)成立改善检讨部门对各改善队成果检讨,并按规定给予提级5)成立开发部研讨会制造食物的机器。至此,G博士的改善可告一段落了,剩下的只是持续管理。
在庆功宴上,国王问G博士的感想是什么,G博士感概道:"最大的感想就是有一个好老大一直支持我们,关注我们的活动,没有您我们不会成功!"宴会后,L,Z,R君一起问G 博士:"下一个改善是什么?
使用CUSUM图检测细小的过程偏移
charts (. X –R, P-charts, etc.), so named after the pioneering work of Dr. Walter Shewhart1. 为了监控一个过程,品质人员经常使用休哈特控制图(比如X-R,P图等),这种图是因为Walter Shewhart1博士的先驱工作而得名的。 It can be shown that if there are sharp, intermittent changes to a process, these types of charts are highly effective. However, if one is interested in a small, sustained shift in a process, other types of control charts may be preferred, for example the Cumulative Sum (CUSUM) chart, originally developed by Page2 (1954). With exponential increases, an Exponentially Weighted Moving Average (EWMA) chart may be appropriate; for an example see Bower3 (2000). 可以看出如果过程中有剧烈的持续的变化发生时,这些类型的图是非常有效的。然而,如果需要对过程中存在的细小、固定的偏移进行监控时,或许可以优先考虑其它类型的控制图,比如累积和(CUSUM)图,最初是由Page2(1954)提出的。通过增加指数的处理方法,一种指数加权移动平均(EWMA)图可能是更加合适的;具体例子参见Bower3 (2000)
新手之--柏拉图
柏拉图
一种逐项递减的柱形图, 最大的一项放在最左边. 每个柱子代表一种问题(或原因). 显示了每种原因对整个问题的影响程度
此方法基于柏拉图原理 (80/20), 即我们问题的80%是可以用 20% 的原因来解释.
柏拉图能辨别首先应该处理的“少数但重大”的问题(或原因) . 怎么做柏拉图?
列出所有的相关因素. 2.用同样的测量单位对这些因素进行量测. 3.按照这些因素的量测值排序, 而不是它们的等级. 4.计算这些项目的累积占有率及其测量值来作出柱形和连线图. 5.首先解决最重要的问题. 6.如果可以获得数据的话,可以从不同分类的角度进行反复多次的柏拉图分析
单边规格是否能做X-bar R chart
最近一位会员给我email来了很多他们公司在运用spc的问题。其中一个问题是: 单边规格是否能做X-bar R chart?
根据我个人的经验回答是:" 当然能做"
但是这位会员提出说,以前问过其它的几位咨询师,他们对此的看法与我不同。
下面我谈谈我个人的观点,希望大家指正.
1,为什么我一看到这个问题就回答,"当然能做"
大家都应该知道,在应用spc时的一个误区就是SPC控制线总与规格挂钩. 也就是说SPC的控制线的产生与产品的规格无关 。所以说无论是单边规格,还有双边规格,这都不影响SPC控制线.
2, SPC控制线的产生.
SPC控制图的应用原则是在过程处于稳定状态,过程能力达到以上(基本)。 控制线的计算是根据历史数据计算,通俗的讲就是”监控现有过程能力与历史过程能力是否一致”. 例如历史上某尺寸的平均值为 平均极差为 那么它的控制线就为 UCL=+* = 下控制线为LCL=*= (分组为5) , 如果极差平均为 ,UCL= LCL= . 极差平均的大小代表历史过程的波动. 根据历史质量水平控制现有流程与历史相比是否发生变化,而这一切都与规格是单边或双边无关.
3,单边规格我们担心什么?
单边规格有两种,一种是大于某个值到正无穷,一种是小于某个值到0.( 到负无穷的比较少见 为什么会担心单边规格无法做X-bar R 图? 最关键的担心是数据有一个正无穷方向 或 无穷接近于0的波动. 但是我认为这种担心是没有必要的. 任何一个数据特牲在过程稳定的情况下波动都是有一定范围的. 关键在于工序的稳定,这也是应用spc的前题条件, 担心数据大范围的波动是由于没有考虑到这一点. 举个例子: 某公司铜线上打端子,要求端子受力大于20磅而不脱离铜线. 这是一个典型的正无穷的例子,而实际上在打端子机处于稳定状态上测出的数据是受力平均值为40磅,而最大只能够达到56磅,并不会向正无穷发展.
4,单边规格我们需要注意什么?
1)数据是否正态分布,应用的spc的基础是数据的正态分布。单边规格的数据有更多可能是非正态分布数据特性,如产品的寿命. 非正态数据需要转换成正态数据才可以应用SPC。(minitab中有此功能
2) 数据的异常处理。X-bar chart 1, 数据的非良性波动,超出控制线按正常的spc的处理方法,如停机查找原因进行改善再生产.(如规格是>20,数据向小于20方向波动) 2,数据的良性波动(如规格为>20,数据向大于20方向波动 这种情况,超出控制线不必停机。因为当超出控制线时,产品的品质是向良性发展的,但还是需要进行原因分析,这个原因的研究结果,可以做为把产品做的更好的改善方法. R chart : R chart的波动要参照X-bar chart ,按上例情况,如果R的超控是由于X均值向非良性波动,则按正常的spc处理方法处理. 如果R的超控是由于X 均值向良性波动,参照上面处理Xbar chart 超控方法处理. 当然还要其它情况,总之要参照X 均值的情况进行灵活处理,而不是死板的按SPC规则进行处理. 以上只是举了一个单边规格大于某个值到正无穷的例子,小于某个值到0也是同样的道理.
5,我们来模拟一个例子. 参照上面那个铜线打端子的例子. 受力规格为>20磅 . 我们用minitab生成200行 平均值为40 ,标准差来的正态分布的随机数. 然后做控制图,分组为5. 数据最大值为: 55 最小值为 26 cpk= 并生成上下控制线,可以看出单边规格并没有影响我们制作X-bar R chart
为什么不用SPC?
某咨询师H应邀到一五金加工厂M进行咨询。在咨询过程中,M厂的品质经理W先生提出一个问题:"我们厂为了控制加工零件的弹力,专门购置了硬度计来控制来料铜片的硬度。我们每一卷铜片来料都经过了IQC硬度检测,但是在加工过程中还是发现铜片硬度出现问题,我们开始认为可能是一卷中铜片的硬度不均匀造成的,但经我们多次分析,一卷铜片的硬度并没有明显的差异,"W先生又补充说:"不过,铜片硬度异常出现的次数并不多,很难捕捉到出现的规律"。 咨询师H开始了分析,他先查看了工厂历史异常铜片的一些相关数据,没有发现什么明显的问题。他又要来了IQC的来料检查记录,当他看了IQC的来料检查记录,心里就明白了一半了。咨询师H就此问题询问了IQC主管:" 你们是如何测试铜片的来料硬度的?" IQC主管王先生说:"我们从每一卷来料中任意的位置剪下一块进行硬度测量,每片测量一次,硬度测量结果如果在我们定的规格内就接受,如果不在规格内我们就再测量两次进行确认,如果合格就接受,不合格就拒收。" 咨询师H发现问题的原因正如他看到来料检查记录时感觉的一样。 咨询师H对品质经理W先生分析了一下问题的原因:"铜片的问题正是来源于来料检查上,由于你们对每一个样本只测量一次,所以当测量出现问题时就是很难发现。测量有几种情况:1,你们测量能够得到正确的结果,这种情况下不会有什么问题 2,你们的测量不能够得出正确的结果 a,当来料是合格的,如果你们的测量结果判定是不合格,你们就会重新确认,这样也能及时发现误判情况. b,当来料不合格,如果测量结果判定是合格,就会发生误判情况。" H对W经理说:"你们所发生的异常就是b种情况造成的。" 品质经理W先生听了后一下明白:"没错,就是这个问题,以前一直没有注意到,我们每个样本只测量一次是错误的做法,很容易导致误判,正确的做法应该每个样本最少测量3次以上,这样可以大大减少测量误判的机率。" 咨询师H说:"没错,这样就可以有效避免类似问题出现。不过,我还有一个更好的控制来料铜片硬度的方案告诉你," 咨询师H接着说:"为什么不用SPC来控制质量关键点? 如果按你们以前的记录表的方式记录数据,只要数据不超出规格就行了,就无法从数据中得到更多有效信息,对供应提供的铜片的质量的波动无法进行有效的监控。" 咨询师H系统的对W先生介绍了运用SPC的方法。 根据目前的情况我们可以选择SPC控制图中的X平均值与极差R控制图。根据不同的供应商分别制作控制图,每份样本测量三次,当作一组数据。首先我们可以根据最近的30次来料的数据计算出供应商的工序能力(CPK),如果,工序能力小于1,就必须要求供应商进行改善品质,否则我们就考虑更换新的供应商。如果工序能力大于我们就认为供应商的制造铜片品质良好,可以选为长期供应商。然后我们通过连续的25组数据计算控制图的上下控制界线,X平均值代表每一次来料的硬度,如果X控制图出现超出控制界线或与控制图异常判定规则相符的情况,应及时进行分析,如果数据测量没有问题,则有可能供应商的产品品质与以前比较发生了变异,应及时通知供应商对来料进行改善,并要求供应商提供相应的原因分析,对策报告。R控制图代表了三次测量的最小差异,如果R控制图出现异常,表明测量系统有问题,应立即进行测量系统分析,找出原因,并进行改善。 咨询师H咨询最后又提醒品质经理W先生" 1,现在用SPC的控制线来取代以前的用规格来要求供应商,实际上要求是加严了,但又是合理的,因为SPC是根据历史数据计算控制线的,以前能够做到,现在也应该做到,不过你们必须通知供应商你们现在应用的控制方法,提醒供应商进行配合。2,SPC不仅仅是作图,最重要的是对图表上的异常点进行及时的分析,及时解决问题,否则SPC会流于行式,起不到作用。 3,SPC必须在过程稳定,工序能力足够的情况下才可以用,否则SPC无法应用。4,必须注意培训,确保SPC能被正确理解和运用。5,建议W公司全面推行SPC质量管理系统,企业将会受益于此。 SPC统计过程控制 品管大师朱兰曾说过:"21世纪是质量的世纪",在品质管理我们最常听说的一个概念就是SPC 。SPC作为一种非常有效的品质工具在全世界被广泛应用,并且被纳入了QS9000质量体系标准中. SPC即统计过程控制(Statistical Process Control)。于1924年美国品管大师 .Shewhart休哈特发明,它是生产过程中的一种记录图表,用于连续的生产过程中,实时监控过程中关键的质量参数,它能及时判定生产过程是否发生变异或者有发生变异的趋势,从而及时采取措施进行改进,把质量隐患消灭在萌芽状态,真正达到防患于未然,减少或避免坏品的产生,以达到提高产品品质,节约成本的目的。 在生产过程中,产品的各种参数波动是不可避免的。波动分为两种:正常波动和异常波动。正常波动是偶然性原因(不可避免因素)造成的。它对产品质量影响较小,在技术上难以消除,在经济上也不值得消除。异常波动是由系统原因(异常因素)造成的。它对产品质量影响很大,可以采取措施避免和消除。 SPC主要是应用统计技术对生产过程进行实时监控,科学的区分出生产过程中产品质量的随机波动与异常波动,从而对生产过程的异常趋势及时提出报警,以便生产管理人员及时发现异常, 采取对策。
控制图用平均值加减三个标准差(±3s)作为控制界线。控制图上有三条横线,中心一条为中心线(Central Line, CL),一般用红色实线绘制,在上面有一条称为上控制界限(Upper Control Limit ,UCL),在下面有一线条称为下控制界限(Lower Control Limit ,LCL),一般用红色虚线绘制,用来表示变异的范围。
SPC控制图按数据的性质可以分为计量控制图,和计数控制图.依用途可以分为控制用控制图,分析用控制图.实际应用中需根据不同的情况进行选用不同的控制图. SPC可以为企业带来的好处。 SPC 是一个全过程全时段的监控工具,实施SPC可以帮助企业有效的评估和监控过程,对过程变异及时有效的报警,能够作到"事前"预防和控制。 SPC是一种有效的过程控制工具,实施SPC能够为企业提高产品品质,降低成本,减少返工和浪费,提高劳动生产率,增强企业核心竞争力, 赢得客户满意。 SPC的发展方向--无纸化, 信息化。 传统的SPC系统中,原始数据是手工抄录,然后人工计算、打点描图,在很多企业管理人员印象中,SPC意味着大量的报表,复杂的计算,繁琐的打点描图,是一件耗时耗力的工作。现代随着计算机在企业的普及, SPC越来越接近无纸化,信息化.对于传统行业,一般采用人工输入计算机,然后再利用专用软件进行统计分析, 生成各种控制图表。在高速度、大规模、重复性自动化生产的制造型企业里,SPC系统已更多采取利用数据采集设备自动进行数据采集,实时传输到计算控制中心进行数据分析的方式。信息化的好处在于工厂中可应用无纸化SPC,避免了过去复杂计算与繁琐打点描图工作,让SPC控制图的绘制非常方便简单,并且有利于数据的保存和SPC的推广,另外对于数据的调用和及时性也比传统的纸上作业有很大的改善,工程或质量人员在办公室中通过电脑就能够及时了解到生产过程中每个控制点的控制状态。目前市场有很多专门的SPC软件销售,这些软件都具有人工输入数据或者直接进行数据采集就能自动生成你需要的各种报表功能和异常自动提醒报警功能,企业内部通过服务器就能实现数据信息的及时共享