第十二章 统计表与统计图
(Statistical Table & Statistical Graph)
广东药学院 张丕德
▲ 统计表(statistical table)是表达统计分析结果中数据和统计指标的表格形式;
▲统计图(statistical graph)是用点、线、面等各种几何图形来形象化表达统计数据。
第一节 统计表
一、统计表的编制原则和结构
1.编制原则
◆重点突出,简单明了
◆主谓分明,层次清楚
◆数据准确、可靠,文字和线条尽量从简
2.结构
▲标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。
▲标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位。
▲线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。
▲数字:用阿拉伯数字表示。 无数字用“—”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。
▲备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。
1.简单表 统计表的主语只有一个层次
如表12-1,每一行可用一个完整的句子表达,第一行可读为“某地1988年老年人口60~年龄组死亡率为‰,死亡百分比为%”。
二、统计表的种类
2. 复合表 统计表的主语有两个以上层次
如表12-2。将老人的年龄和性别结合起来分组,可以分析不同年龄、性别的老年人的死亡率和死亡百分比。
三、编制统计表的注意事项
1. 统计表不一定是唯一的,同一份数据经过标目重排或分解组合,可以根据需要构造不同形式的统计表,如表12-2也可以转换成表12-3,便于将男女的死亡率、死亡百分比放在一起对比。也可以把复合表分解为多个简单表。
2.避免内容混杂,表达不清,结构混乱。若标目层次多于四个以上,统计表就会变得繁冗,尽量少用。
表12-4 存在问题
▲ 标题不够明确,而且未注明时间、地点。
▲ 发病季节、年龄和职业三项指标无可比性,放在一
起,内容繁杂。
▲ 标目设计不合理,“人数”、“%”多次重复,不
便于比较分析。
▲ 表内文字和线条过多。内容较多,层次复杂,表格
中数据罗列无条理,较难读懂。
可以将其分为三个表,表12-5、12-6、12-7,具体修改如下。
例 某医院用麦牙根糖浆治疗急慢性肝炎161例,疗效资料如表12-8,指出其缺点并加以改进。
问题: 标题过于简单;主谓安排不合理,标目组合重复。可进行如下修改,见表12-9。
第二节 统计图
一、统计图的制作原则和结构
1. 统计图的制作原则
▲必须根据资料的性质、分析目的选用适当的统计图,由于统计图不能精确地显示数据大小,所以经常需要与统计表一起使用。
▲一个图一般只表达一个中心内容,表达一个主题,即一个统计指标。
▲绘制图形应注意准确、美观,图线粗细应用适当,定点准确,不同事物用不同线条(实线、虚线、点线)或颜色表示,给人以清晰的印象。
2.统计图的结构
▲标题:其作用是简明扼要地说明资料的内容、时间和地点,一般位于图的下方中央位置并编号,便于说明。
▲图域:即制图空间,除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框架表示。
2.统计图的结构
▲标目:分为纵标目和横标目,表示纵轴和横轴数字刻度的意义,一般有度量衡单位。
▲图例:对图中不同颜色或图案代表的指标注释。图例通常放在横标目与标题之间,如果图域部分有较大空间,也可以放在图域中。
2.统计图的结构
▲刻度:即纵轴与横轴上的坐标。刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右。绘图时按照统计指标数值的大小,适当选择坐标原点和刻度的间隔。
二、常用统计图
1.直条图(bar chart)
2.构成图:圆图(pie chart)
百分比条图(percent bar chart)
3.线 图(line graph)
4.直方图(histogram)
5.箱式图(box plot)
6.散点图(scatter chart)
1.直条图(bar chart)
▲ 用相同宽度的直条长短表示相互独立的某统计指标值的大小。直条图按直条是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式两种。
▲ 绘制直条图时应注意:一般以横轴为基线,表示各个标志,纵轴表示各标志相应的值;纵轴尺度必须从“0”开始,而且要等距;直条的宽度要相等,直条之间的间隔要等距,通常与直条的宽度相等或略小。
▲单式条图:具有一个统计指标,一个分组因素。
图12-1 某省1978年四个地区脊髓灰质炎发病率
▲复式条图:具有一个统计指标,两个分组因素。
图12-2 某地1952年与1972年三种疾病死亡率比较
2.构成图
▲ 圆图(pie chart)是以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。
绘制圆图时应注意:以圆形的360°角为100%,将各构成部分的构成比(%)乘以°,即得各组成部分应占的圆心角度数,以某刻度(比如相当于时钟12点的位置)为起点,顺时针按圆心角度数大小或者自然顺序排列各个扇形;不同的扇形用不同的颜色或花纹区别;也可以简要注明文字和百分比。
如根据表12-12绘成的图12-3。
图12-3 复方猪胆囊治疗单纯型老年气管炎近期疗效比较
▲百分比条图
百分比条图(percentage chart)也是一种构成图,用矩形条子的长度表示100%,而用其中分割的各段表示各构成部分的百分比。如根据表12-12绘成的图12-4。
图12-4 复方猪胆囊治疗老年性气管炎近期疗效比较
3.线图(line graph)
线图是用线段的升降来表示指标的连续变化趋势,适用于描述一个变量随另一个变量变化的趋势。通常纵坐标是因变量或统计指标,横坐标是解释变量。
▲普通线图:横轴和纵轴都是算术尺度。
▲半对数线图:(semi-logarithmic linear chart) :横轴是算术尺度,纵轴是对数尺度.
如根据表12-13绘成的图12-5 为普通线图。
如将表12-14的数据绘制成普通线图,见图12-6,呈现
出白喉死亡率线条的坡度比伤寒、副伤寒死亡率线条变
化快,如果绘制成半对数线图,见图12-7,
则白喉死亡率与伤寒、副伤寒死亡率变化快慢速度相差不大。
图12-6 某地1949~1958年白喉、伤寒、副伤寒死亡率(线图)
图12-7 某地1949~1958年白喉、伤寒、副伤寒死亡率(半对数线图)
注 意
▲横轴代表分组标志,纵轴代表统计指标。横轴和纵轴的刻度都可以不从“0”开始;
▲用短线依次将相邻各点连接即得线图,不应将折线描成光滑曲线;
▲线图中只有一条线,称为单式线图。若有两条及以上的线条,称为复式线图;
▲在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不同。
4.直方图(histogram)
直方图(histogram)用直条矩形面积代表各组频数,各矩形面积总和代表各组频数的总和。它主要用于表示连续变量频数分布情况。如根据频数表12-15绘成的频数分布图12-8。
图12-8 某市某年150名3岁女孩身高频数分布
绘制直方图时应注意:
▲纵轴的刻度必须从“0”开始,而横轴的刻度按实际范围制定;
▲各矩形的高度为频数或频率,宽度为组距。如果各组段的组距不同要调整各矩形的高:矩形高度=组段频数/组距。
5.箱图(box plot)
箱图用于比较两组或多组资料的集中趋势和离散趋势,箱图的中间横线表示中位数,箱子的长度表示四分位数间距,两端分别是P75 和P25,箱图最外面两端连线表示最大值和最小值,或P5 和P95 ,异常值另作标记。箱子越长表示数据离散程度越大。中间横线若在箱子中心位置,表示数据分布对称,中间横线偏离箱子正中心越远,表示数据分布越偏离中位数。
根据表12-16(第4版表6-7)绘成的图12-10,可以看出,第Ⅰ窝数据离散程度最大,第Ⅲ窝基本对称且中位数最大。
图12-9 10窝大鼠分别用四种饲料喂养60天后体重增加量箱图
6.散点图(scatter chart)
散点图(scatter chart)用点的密集程度和变化趋势来表示两指标之间的直线相关关系。如根据表12-17绘成的图12-10。
图12-10 15名8岁男孩身高与坐高散点图