July 2012 Revision
Minitab简介与基本图形
Minitab基本概况
1972年产生于美国宾州州立大学(The Pennsylvania State
University)
1983年Minitab Inc.成立
市场对象:学术教学、工业统计、一般统计
特点
界面简洁
容易学习和掌握
被广泛应用:4000所以上的大学,财富500一半以上的企业都在应用Minitab
六西格玛领域应用最多的统计软件
Minitab基本概况-背景
Minitab基本概况-背景
最新版本
Minitab基本概况 – 主画面
会话窗(Session Window):
输出结果
数据窗:
工作表(Worksheet)
待处理的原始数据
会话窗(Session Window) -输出统计结果
列表头:数据类型
默认-数值数据
T-文本数据
D-日期数据
列名称
同一列内数
据类型相同
数据方向
输入数据回车后光标移动的方向
默认向下
工作表
直接从键盘输入
从其他程序中剪切并粘贴
Minitab中的随机数发生器
直接打开其他形式的文件
Excel表
文本文件
数据库文件
……
工作表 – 数据输入到Minitab的方法
数据输入例子 – 从 Excel 输入数据
三种类型的文件
Project文件:后缀为MPJ-如:
Worksheet文件:后缀为MTW-如:
Graph文件:后缀为MGF-如:
特点和相互关系
Project文件中可以包含Worksheet文件和Graph文件
Worksheet文件和Graph文件可以单独存储
Minitab自带学习文件
全部为Worksheet文件
路径为 C:\Program Files\MTBWIN\Data
Minitab的文件类型
Minitab基本功能
项目
文件操作
工作表
文件操作
工作单/图表打印
最近打开的文档
备注:内容和操作与
Excel相似
建立新的文件
下拉式菜单-文件
a. 建立新的工作单(Worksheet)文件
文件>新建>OK
工作单被加入到原来的项目文件中
b. 建立新的项目(Project)文件
File>New(Ctrl+N)>Minitab Project>OK
选择是否要保存前面的项目文件
文件-建立新的文件
工作表的
单元格编辑
备注:内容和操作与
Excel相似
下拉式菜单-编辑
工作分离
合并单操作
堆叠/拆分
行列倒置
数据排序
数据拷贝
编码
数据类型转换
下拉式菜单-数据
打开文件:Database>
文件>打开工作表>文件类型>
文件-行列倒置
输入C2-C32
文件-行列倒置
文件-行列倒置-结果
把同一类型(同为数值/文本/时间)
的分组数据放入一列
Minitab数据统计分析最方便的数据
排列方式
文件-堆叠
文件-堆叠-结果
文件-改变数据类型
实际为数值型的数据可以在数
值型和文本型之间相互转换
文件-改变数据类型-结果
产生随机数
下拉式菜单-计算
备注:Minitab的核
心统计功能
下拉式菜单-统计 & 图形
下拉式菜单-编辑器 & 工具
下拉式菜单-窗口
窗口层叠
窗口平铺
帮助
统计指南
教程指南
Minitab主网页
下拉式菜单-帮助
帮助-帮助菜单
帮助-统计指南
Minitab基本操作
Control E – 显示前一个动作的操作菜单
Alt+Tab - 在窗口应用程序间切换
例1 :由 Minitab 至 PowerPoint 转换制作简报
例2:由 Excel 复制数据至 Minitab
操作内容相同时,Minitab中的快捷键与Windows系统中的操作键一
致,如Control C(复制) / Control V(粘贴 )
快捷键
以树状结构来浏览完整的 Minitab
Project 或浏览不同的窗口
更好地来连结对话窗的输出,图表,
及工作表
项目管理器(Project Manager)
显示对话文件夹(Show Session Folder Ctrl+Alt+M)
显示工作单文件夹(Show Worksheets Folder Ctrl+Alt+D)
显示图表文件夹(Show Graph Folder Ctrl+Alt+G)
显示信息(Show Info Ctrl+Alt+I)
显示历史(Show History Ctrl+Alt+H)
显示报告簿(Show ReportPad Ctrl+Alt+R)
显示相关文件(Show Related Documents Ctrl+Alt+L)
对话窗(Session Window Ctrl+M)
当前数据窗(Current Data Window Ctrl+D)
项目管理器(Project Manager Ctrl+I)
关闭所有图表(Close All Graphs)
项目管理器
项目管理器-显示对话文件夹
双击图标,跳到 Session 输出
浏览与 Session 输出相关的图形
编辑标题
删除指定输出
… …
项目管理器-显示工作单文件夹
管理工作单
工作单平铺
工作单重命名
把工作单移至当前工作窗口
保存工作单
关闭工作单
… …
管理图表
图表平铺
图表重命名
保存图表
关闭图表
… …
项目管理器-显示图表文件夹
提供当前工作表的信息:
列名称
列数量
缺少数据的数量
数据类型 (数字,文本,日期/时间)
列描述
… …
项目管理器-显示信息
项目管理器-显示历史
以指令语法格式,
提供所有已执行过
的命令
… …
项目管理器-显示报表
ReportPad 为一简易的文字处理工具
制作,排列,或编辑项目工作的报告
把 ReportPad 的內容移至功能更为强大
的文字处理程序,以进一步编辑及编排
输出
报表的做法
在对话窗Session状态下,选
种需要的内容(结果输出或图表)
点击右键,弹出对话框
选择“Append to Report”
在报表内可以对其内容进行编辑
复制/剪切/粘贴/删除
字体
位置
报表的编辑
报表的转移
可根据需要对报表进行
存档
打印
拷贝/转移至Word
(选中报表>点击右键>选择)
报表的转移-结果
项目管理器-对话窗
项目管理器-当前数据窗
项目管理器-项目管理器
项目管理器-关闭所有图表
CTRL - C ALT-TAB CTRL - V
Minitab™ PowerPoint®
制作简报-示例
July 2012 Revision
基本图形
Basic Graphing
基本图形
� 特性要因图
� 控制图
� 柏拉图
� 散布图(点图)
� 直方图
� 时间序列图
� 箱形图
学习目标
要理解数据,很重要的部分就是用图形展示数据。
它帮助我们以目测的方法判断数据,并以图形对统计数据加以补充。
图形展示
散点图
柏拉图
趋势图
方箱线图
点图
直方图
AVERAGE•
TIME OR SEQUENCEX AXIS
•
•
• •
•
GPM
x
X
Y
x x
x
x
x
x
x
x
x
x
xx
x
x
x
x
基础图形
xx
x
x
x
x x
x
x
x
x
x
x
x x
x
x
X
Y
表示两变量之间的简单关系。
1. 散点图
优点
确定两变量之间是否有关系
显示可能强烈影响分析的潜在点
揭示对分析有帮助的数据的模式(如:二次曲
线)
关注关键问题
为什么使用?
通过将数据出现的相对频率或大小在逐步下降的条块图
中排列,使得将改善关注点集中在潜在影响最大的问题
上。
2. 柏拉图
它有什么用?
帮助团队将注意力集中在最大影响的原因上。
基于柏拉图原理 :20%的原因产生80%的问题 – 杠杆
原理的思维。
用简单、能迅速理解的格式展示问题的相对重要性。
2. 柏拉图
> 质量控制示例.MTW
追踪趋势
为何使用 ?
让团队研究在特定时间段里已观测的数据之
趋势或模式。
3. 时间序列图
它有什么用?
监控一个或多个流程在一段时间的绩效以探
测趋势或模式。
让团队比较实施解决方案前后的测量绩效。
将关注点放在对流程有真正关键的改变上。
追踪对预测趋势有用的信息。
测
量
Y轴
平均•
时间或系列 X轴
•
•
• •
•
画出数据
看一看采集的数据。如果没有明显的趋势,计算平均
值或算术中项。平均值是测量数据之和除以数据点数。
也可以使用中位数,但均值更常用于测量样本的“集中
性”。在均值处画一条直线。
不要每次有新数据增加时就重新画平均线。当流程或主要条件有重大改变
时再重新计算和重画,且仅使用在确认改变后的数据点。
3. 时间序列
TIP:使用运行图时的危险是将数据的每一个变化都
视为重要的倾向。
控制图是时间系列图的特殊例子。
数据解析
注意平均线的位置。它对客户需求或规格来说是否在正
确的位置?它对你的经营目标来说是否在正确的位置?
3. 时间序列
> ABC 销售人员.MTW
>新市场数据.MTW
4. 控制图
为何使用?
通过研究变异和其根源监察,控制和改善流程绩效。
它有什么用?
将注意力集中在探测和监视流程的变异上。
区分变异特殊原因和普通原因,作为部门和管理层的行动指南。
作为对流程持续控制的工具。
帮助改进流程,使之一贯并可预测地产出更高质量、更低价格和更有效的
能力。
提供讨论流程绩效的共通语言。
UCL
_
X
LCL
UCL
_
X
LCL认识变异的来源
练习
假定机器A,B,C制造相同的产品(范围图受控)。
假定产品输出变量的目标值是100mm。
练习
回答下列问题:
哪台机器有变异?
各台机器的中心点?
哪台机器可预测?
哪台机器有特殊原因变异?
你愿意哪台机器加工你的产品?
哪台机器最容易修理?
为什么?
5. 箱线图
为何使用?
给你一个对数值的图形化总结并帮助你识别极限数价值。
它有什么用?
箱线图由下列组成:
矩形方框大致代表了中间的50%数据。
线段向两边延伸代表了数据的一般范围。
界外点由符号表示(远离其他数据的数值)。
500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 (元)
| | ||||||| ||
|
2400 3200 4500
57001000
第1四分值 第3四分值
最大值
*12800
界外点
最小值
中值
Q2
|
工资分布箱形图(以元为单位)
箱形图
箱形图能够体现:
中心趋势(中值)
数据分布(全距)
数据分布(四分-将数据分为四个相等的部分)
界点外(极端数值)
箱形图
+
* 界外点
75百分点(第三四分位数,或Q3)
最小分布
(= Max {低实际数据值, Q1 - (Q3-Q1) } )
最大分布
(= Min {高实际数据值, Q3 + (Q3-Q1) } )
25百分点(第一四分位数,或Q1)
中值(50百分点)
均值
箱形图
平均分布
| | | |
正态分布
| |
倾斜分布
箱形图对应分布
图象比较两个或多个样本能以以箱形图在同一尺度上进行。
应该在进行正式假设检验之前进行图象比较,以确定这表面上的区别是
否显著。
150 155 160 165 170 175 180 185 190 195 mm
| ||||||| ||
流程A | |
流程B
| | *
两个流程是否有分别?
以箱形图比较样本
在可预测结果之外的点
对边界线的解释通常较困难;
异常值需给予特别考量
已获知特殊原因的可以剔除 ( 因此保留过往记录是重要的 )
否则,最好的行动是:
将异常值视为特殊的、分离的分布,发生的时间为X%。你必须这样
报告。
将分布余下的值正常对待—如:计算均值,标准差,概率图等,按
基本分布解释。
异常值
用Minitab作箱线图有多种方法:
图形 -> 箱线图
统计-> 基本统计量->显示描述性统计-> 图形
统计-> 方差分析 -> 单因子 -> 图形
箱线图
>地毯.MTW
在点图中,一个圆点代表一个数据点。
很容易看到数据分布的位置和散布情况。
能判定数据是均匀分布或簇拥在一起。
对于小样本量(特别是<10)的数据,点图很有用。
如果数据个数太多,数据点会拥挤在一起,难以解释。
点图对于比较2组(或多组)数据很有帮助。
6. 点图
用Minitab制作点图有以下几种方法:
图形 -> 点图
统计-> 基本统计-> 显示描述性统计-> 图形
统计-> 方差分析 -> 单因子 -> 图形
6. 点图
7. 分布图
通过对同一变量的多个数据绘制图表,可描述任何流程或系统的表
现:
在一时间段内
产品之间
不同的机器、生产线等
这些数据点的累计可视为数值的分布。
分布可用下列图形表示:
直方图
正态曲线或其它平滑分布
将同样的数据按区间分组并注明其出现的次数,每个区间的高度是由一
段时间内数据掉进区间的次数所决定的。
7a. 直方图
40
30
20
0
Access Time (ms)
F
re
qu
en
cy
10
流程中心,分布和形状
为何使用?
总结在一段时间内收集的来自流程的数据,并以条图形式表达其频率分布。
7a. 直方图
它能做什么?
展示不同的数据值出现的相对频率。
展示数据的中心、变异和形状。
快速了解数据的根本分布。
为流程未来的的表现提供有用的预测。
指出流程是否有变化。
协助回答问题:“流程能否满足客户的要求?”
将数据以容易理解的方式表达。
直方图例子
客户要求
流程
集中
流程
太高
流程
太低
集中趋势 –流程分布是
否集中,太高或太低
变异 –数据的分布如何
?变异是否太大
客户要求
流程在客户要求
之内
流程变异过大
7a. 直方图(续)
直方图是频率分布的图形展示,可帮助我们评估数据的形状,中心和散
布情况。
当数据个数不少于30时,用直方图比较合适。
数据的总跨度被分成若干个相等的区间(区间、组、柱等)。
累计落入每个区间的观测值的个数,画出直方图。
直方图
术语:
A. 纵坐标,表示观测值的频率。
B. 频率,指落入每个区间的观测指的个数,用柱的高度表示。
C. 区间/组/柱,把观测值的总跨度等分而成。
D. 众数组, 频率最高的区间。
E. 横坐标, 代表变量值。
直方图
对于同一组数据,使用不同的区间数会影响分布的形状。
一般的指引是,优先考虑整齐的区间,分成5到15组。
直方图
用Minitab制作直方图有多种方法:
图形 -> Histogram
统计-> 基本统计-> 显示描述性统计-> 图形
职位安排时间
22 26 30 19 22 31 34 29 28 18
16 22 31 24 26 36 28 33 36 24
26 27 35 14 26 30 33 26 31 36
28 33 18 26 29 30 22 30 24 31
27 21 28 35 32 28 33 28 23 25
举例:
记录50个职位中的每个职位安排所需要的时间
直方图中,利用竖条将数据分类。每个竖条的高度代表每组有多少
个数据。
F
re
qu
en
cy
0
10
20
10 15 20 25 30 35 40 Days
1
4
10
12
3
20
直方图是否显示了数据收集的时间顺序?
直方图
哪个图最能描述出数据
集的形状?
形状是什么样的?
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 (days)
0
10
20
10 15 20 25 30 35 40 Days
点图和直方图
个别点 提供数据的基础
统计总结 中心和变异趋势的快速测量
直方图 数据的透彻理解
分布 描述和促进对数据的理解
图 确认分布假设
综合所有工具