统计学 第三章 统计表与统计图
目 录
2第三章 统计表与统计图
3第一节 统计表
3一、统计表的结构
3二、统计表的分类
4三、统计表设计规则
4第二节 用Excel做透视表
4一、什么是透视表
4二、如何做平面透视表(二维)
7三、如何做立体透视表(三维)
8第三节 用Excel汇总统计表
8一、完全相同型的合并
9二、不完全相同型的合并
11第四节 统计图
11一、统计图的结构
11二、统计图的种类
12第五节 用Excel做统计图
12一、直方图、折线图与曲线图
14二、条形图
15三、饼图
16英文摘要与关键词
16习 题
第三章 统计表与统计图
通过本章的学习,我们应该知道:
什么是规范的统计表
如何用Excel做透视表
如何用Excel汇总统计表
什么是规范的统计图
如何用Excel做各种统计图
经过整理的数据资料,需要展现出来,可以用统计表,也可以用统计图。用表不仅可以节省大量的文字叙述,而且更为集中醒目、条理分明,也便于数据的对比分析与积累;用图的特点是:形象、鲜明、直观,能够清晰地显示现象之间的相互关系。
第一节 统计表
一、统计表的结构
统计表是把由统计调查所得来的、经过整理的数据,按一定顺序排列而形成的表格。统计表可分为广义统计表和狭义统计表两种。广义的统计表,包括统计工作各阶段中所用的一切表格;狭义的统计表专指分析表和容纳各种统计资料的表格,即通常所说的统计表。狭义的统计表是统计分析的重要工具,这是因为,它清楚地、有条理的显示统计资料,并能直观地反映统计分析特征。
统计表的结构,从形式来看,其构成要素包括:总标题、横行标题、纵栏标题、数字资料四个部分。总标题置于表的正上方,是统计表的名称,它简明扼要地说明全表的基本内容。横行标题和纵行标题一般被置置放于统计表的第一列和第一行,它表示所研究问题的类别名称和指标名称。如果是时间序列数据,横行标题和纵行标题也可以是时间,如果当数据较多时,一般会将时间放在横行标题的位置。表的其余部分是具体的统计数据。表外附加内容一般放在统计表的下方,主要包括资料来源、指标的注释和必要的说明等。统计表的一般结构如表所示。
表 2004-2006年国有农场基本情况
项目
单位
2004
2005
2006
农场数
个
1928
1923
1896
职工人数
人
耕地面积
千公顷
农业机械总动力
亿瓦
资料来源:《中国统计年鉴(2007)》(电子版) *本表为农垦系统数据
二、统计表的分类
1. 简单表,指未经任何分组的统计表,也叫做一览表。简单表一般按时间顺序排列,或者按个体的名称排列。它是对原始资料进行初步整理所采用的形式,如表。
2. 简单分组表,指只用一个标志分组形成的统计表,也叫做分组表。运用简单分组表可以说明不同类型现象的特征,以揭示现象内部的结构,以便分析现象之间的相互关系,如表。
表 2007年某地区工业企业按固定资产分组的企业与职工数统计表
按固定资产分组(万元)
企业个数
职工人数
400以下
5
2250
400-600
10
6029
600-800
12
9280
800以上
3
3140
合 计
30
20699
3. 复合分组表,指按两个或两个以上标志进行分组的统计表,简称复合表。复合分组表可以通过多个标志,对总体进行更为深入地分析与研究,如表。
表 2007年某财经大学师资状况
职务
年龄
性别
人数
高级职称
(教授、副教授)
45岁以上
男
50
女
30
45岁以下
男
80
女
40
非高级职称
(讲师、助教)
45岁以上
男
40
女
10
45岁以下
男
110
女
50
三、统计表设计规则
统计表的设计应尽可能做到简洁,清晰,准确,醒目,便于使用者进行比较、分析以及阅读。设计时应遵循如下规则。
1. 统计表的各类标题应十分简明,并确切地反映与概括资料的主要内容以及所属的地区和时间。纵横各栏的排列特别要注意表述资料的逻辑性。
2. 横行和纵栏,一般先列各个项目,后列总体。若无必要列出全部项目时,就应先列总体,后列其中一部分重要项目。内容不宜罗列太多和过于庞杂。
3. 表中应有计量单位栏。当表中只有一种计量单位时,可在表的右上端注明。若有几个计量单位时,横行的计量单位可专设“计量单位”一栏,纵栏的计量单位可与纵栏标题写在一起,用小括号标明。
4- 表中数字填写要整齐,上下位数要对齐,同栏数字的单位,小数位要一致。如遇相同数字必须照填,不能用“同上”或“同左”代替。无数字的空格要用“——”表示。如遇缺乏资料的空格时,要用“……”表示,以免被误认漏报。
5. 当统计表栏数较多时,通常要加编号,并说明其相互关系,横行各栏与计量单位各栏可用甲、乙、丙等文字标明;纵列各栏可用(1)、(2)、(3)等数码标明。
6. 统计表的表式为开口式,即表的左右两端不封闭(不画纵线),表的上下端线通常用粗线或双线,表内如有两个或两个以上不同的内容,也要用粗线或双线隔开。
7. 借用他人数据资料时,统计表应加注解,说明资料出处,一般在统计表的下端注明“资料来源”。
第二节 用Excel做透视表
一、什么是透视表
数据透视表是Excel提供的特别精彩的表分析功能,是一种可以对大量数据快速汇总和建立交叉表的动态工作表。我们能按照需要,随意地把数据库中的数据重新排列、组织、计算,形成新的数据理解视图。制作数据透视表的方法是在数据透视向导的引导下通过三个步骤来完成。它不仅可以是平面的透视表,还可以是立体的透视表。
二、如何做平面透视表(二维)
【例】 现有王氏公司2007年各季度在各个地区销售9种产品的情况,数据库的四个字段是:地区、季度、商品代号、销售额,数据位置是A1:D50(见图)。要求制作按地区和季度交叉分类的销售额总和的平面透视表。
【解】
Excel解决方案
① 选择数据库表区域:选中当前数据库表中的任一个单元格,系统会自动把整个数据库表作为数据来源区域。
② 启动数据透视表指南:单击菜单条中的“数据”—“数据透视表与数据透视图”,系统弹出一个数据透视表向导对话框,见图。如果数据来源区域不是Excel的当前数据库表,可以选中对话框中的“外部数据库”等项。
③ 单击“下一步”按钮,系统弹出一个对话框要求确认源数据区域,如图。
④ 单击“下一步”按钮,系统弹出一个对话框要求指定结果存放的地点,如图。
⑤ 单击“完成”按钮,在工作表上出现透视表的雏形,如图。
⑥ 按提示将字段名拖拽到相应的位置。本例将“地区”放在横行标题,“季度”放在纵行标题,“销售额”放在中间,并求和,结果如图,即完成本题所要求的透视表。
⑦ 双击左上角的“求和项”,系统会弹出一个对话框,用以控制数据透视表中的数据生成,如可以生成平均数、最大值等,如图。
⑧ 点击“地区”和“季度”旁边的下拉菜单,可以进行选择显示。
图 数据透视表向导3步骤之1
图 数据透视表向导3步骤之2
图 数据透视表向导3步骤之3
图 工作表上平面数据透视表雏形
图 按要求生成的平面数据透视表(二维)
图 “数据透视表选项”对话框
三、如何做立体透视表(三维)
【例】仍用上例的数据,要求制作按商品、地区和季度交叉分类的销售额平均值立体透视表。
【解】立体表透视表的制作基本与平面表一致,从第五步形成透视表雏形后略有不同。
Excel解决方案
① - ④ 同例
⑤ 单击“完成”按钮,在工作表上出现透视表的雏形,如图。
⑥ 按提示将字段名拖拽到相应的位置。本例将“商品代号”放在页字段,”“地区”放在行字段,“季度”放在列字段,“销售额”放在中间,此时得到的透视表中的数据是总和数。
⑦ 双击左上角的“求和项”,系统会弹出一个对话框,选择“平均值”,按“确定”按钮,即得到我们需要的立体透视表,如图。
⑧ 点击“商品代号”、“地区”和“季度”旁边的下拉菜单,可以进行选择显示。如在“商品代号”旁边的下拉菜单中选择“C”,就可以得到仅显示C商品在各地区各季节的销售额平均值。如图。
图 工作表上立体数据透视表的雏形
图 按要求生成的立体数据透视表(三维)
图 选择商品“C”后的立体数据透视表
第三节 用Excel汇总统计表
Excel能对多个工作表和工作簿内相类似的数据进行合并计算,将合并的结果放到一张合并工作表内。这一功能可以用来把各门市部的销售收入合并为各销售区的销售收入,再把销售区的数据合并到总公司;或是统计部门用此功能将月度资料汇总成季度资料,再将其汇总成年度资料。这里的合并计算,不仅仅指求和计算,还可以计算平均数、最大值、最小值等11种指标。
要合并的多张工作表,可以是标题排列顺序完全相同的表,也可以不完全相同。如果是完全相同,Excel按各工作表内对应位置对各单元格施行合并计算;如果是不完全相同,可以要求Excel根据各个源工作表内数据的行、列标题来进行合并,合并计算那些有相同行和相同列标题的单元格内的数据,而不管行、列标题在各个源工作表内的位置次序。
一、完全相同型的合并
对于各个要合并计算的工作表,不仅行、列标题完全一样,而且次序也完全一样,但各个数据区的位置可以不一样。这种合并可以按照存放合并数据的目标工作表单元格或区域的选取。
【例】现有宏大计算机公司某月上、中、下旬销售利润表,如图,要求汇总各旬情况,完成月度销售利润表。
图 宏大计算机公司上旬销售利润表(中、下旬表类似)
【解】
Excel解决方案
① 将表格的文字部分复制到另一个工作表中,并适当修改,该表将存放汇总的结果。
② 选定一个目标区域,本例B3:E11,即只选要显示合并数据的位置,注意文本、日期等数据是不能参与合并的。
③ 选取“数据”—“合并计算”,弹出“合并计算”对话框,见图。
④ 在“函数”列表框内选取合并的计算方式,预选为求和,不改变时可以跳过。
⑤ 在“引用位置”文本框内,通过选取或直接键入方式确定源区域。如果源区域位于打开的工作表上,可以通过鼠标单击加拖动方式。
⑥ 单击“添加”按钮,将“引用位置”文本框内的区域加入到“所有引用位置”列表框内。
⑦ 重复第五、六步,将所有源区域(可达255个)添加到“所有引用位置”列表框内。
⑧ 注销“标记位置”复选钮组内的“首行”、“最左列”选择框,注销(也可选)“与源数据链接”选择框。如果选中“与源数据链接”选择框,结果在目标工作表内生成分级显示;最后单击“确定”按钮,完成汇总。见图。
图 “合并计算”对话框
图 汇总结果
特别注意 在做报表汇总时,第一,要留足适当大空间给目标区域,否则合并计算结果要覆盖原有数据,造成数据丢失。第二,只有数值数据参与合并计算,文本和公式不能进行合并计算。
二、不完全相同型的合并
当源工作表上数据的行列标题位置不完全相同时,要使用行、列标题进行合并计算。这种方法最为灵活方便,容许每个源区域的实际位置不同。
【例】 某计算机总公司下属宏大公司、正大公司和光大公司1-4月的销售量统计报表已上报,要求汇总出分品种、分月份的销售量,这三个公司销售品种是不同的。
【解】
Excel解决方案
① 新建一张工作表用以存放汇总的结果,将光标移至存放结果的左上角。
② 选取“数据”—“合并计算”,弹出“合并计算”对话框。
③ 在“函数”列表框内选取合并的计算方式,预选为求和,不改变时可以跳过。
④ 在“引用位置”文本框内,通过选取或直接键入方式确定源区域。如果源区域位于打开的工作表上,可以通过鼠标单击加拖动方式。单击“增加”按钮,将“引用位置”文本框内的区域加入到“所有引用位置”列表框内。
⑤ 重复上一步,将所有源区域(可达255个)增加到“所有引用位置”列表框内。
⑥在“标记位置”复选钮组选中“首行”、“最左列”选择框,注销(也可选)“与源数据链接”选择框。见图。
⑦ 最后单击“确定”按钮,生成汇总结果,见图 上方。
⑧ 如果在第⑥步选中“与源数据链接”选择框,其结果如图下方,它有两点不同:一是Excel自动创建分级显示符号,它可以查看数据的来源;二是如果源数据区域中的数据被修改,则汇总表的数据也随之改变,而前者不会发生变化。
图 “合并计算”对话框
图 合并统计表(上方是不加链接的,下方是加链接的)
第四节 统计图
一、统计图的结构
统计图是统计资料的一种表达方式,它可以简洁直观地表示统计表中枯燥的数据,可以帮助我们从众多的数据中发现规律,可以更迅速、更有效地传递信息,给人以明确而深刻的印象。
图 1990-2006年中国三次产业的增加值
我们看图,这是一张统计图,是反映中国三次产业增加值的发展状态的趋势图。观察图形我们可以看出统计图基本包括以下几部分:
(1)标题,统计图一般包括图表标题、数值轴(X、Y)标题
(2)坐标轴和网格线,坐标轴和网格线构造了绘图区的骨架,借助坐标轴和网格线,我们可以更容易读懂统计图。
(3)图表区和绘图区,统计表的所有内容都在图表区内,包括绘图区。统计图绘制在绘图区内。
(4)图例,图例用来标明图表中的数据系列。图有三个序列,我们用不同颜色的线条来区别不同的数据系列,在图例中对其进行说明。
二、统计图的种类
统计图的种类很多,常用的有用于辅助统计分析的直方图、趋势图、散点图;有擅长直观表现数据的柱形图、饼图、圆环图等。Excel提供了14种标准图表类型,见图,每种标准图表类型还可以包含几种不同的子类型,我们可以根据自己的要求决定采用哪种图形来表现数据。
图 Excel中标准图表类型
第五节 用Excel做统计图
一、直方图、折线图与曲线图
【例】上一章完成了树苗高度的次数分布表,根据表的数据绘制直方图、折线图和曲线图。
【解】
(1)直方图(histogram)是在平面坐标上,以横轴根据各组组距的宽度标明各组组距,以纵轴根据次数的高度标示各组次数绘制成的统计图。纵轴的左侧标明次数,右侧标明频率,如果没有频率,直方图只在左侧标明次数。如图所示。
图 树苗高度分布的直方图
图是依据等组距式变量数列绘制的直方图。对于不等组距式变量数列,由于组距不同,频数的差异不能直接表明变量分布的特征。绘制直方图时,应先计算出各组的频数密度,之后再以组距为宽度,以频数密度为高度绘制,频数密度=频数÷组距。所以从表面上看,是以直方条的高度表示次数,但实际上直方图是以面积来表示次数的。
(2)折线图(polygon)是在直方图的基础上,用折线连接各个直方形顶边中点,并在直方图形两侧各延伸一组,使折线与横轴相连。也可根据各组组中值与次数求出各组的坐标点,并用折线连接各点而成。折线所覆盖的面积等于直方图条形的面积,表示总次数。图是根据直方图图.基础上绘制的折线图。
图 树苗高度分布的折线图
(3)当变量数列的组数非常多时,折线便趋于一条平滑的曲线,它是一种概括描述变量数列分布特征的理论曲线。曲线图是连续型随机变量频数分布常用的形式。曲线图绘制的方法出在折线图的基础上,将连接各组次数坐标点的折线加工修匀为比较平滑的曲线,如图所示。
图 树苗高度分布的曲线图
从直方图到折线图再到曲线图这样的作图路线,是我们获得现象分布状态的一般方法。有些现象的分布状态是相对固定的,比如人口的死亡率的曲线一般都是U字型的,又称为浴盆曲线;经济学中的供给曲线是正J字型曲线,表现随着价格的增加,供给量以更快的速度增加;需求曲线是倒J字形曲线,表现为随着价格横轴的增加,需求量以较快的速度减少。正态分布曲线是一个左右完全对称的倒U字型,即钟型曲线,但大部分现象所呈现的状态还是像上例中的倒U字型,但往往会或左或右地有些偏斜,具体的计量将在下章论述。
我们还可以用折线图来反映累积频数或频率的状态,这类图形中最著名的是洛伦茨曲线(Lorentz curve),它反映了收入分配的公平与否。
在Excel的数据分析工具中有“直方图”功能,它可以帮助我们快速的计算次数、累积频率。
Excel解决方案
① 打开文件准备好数据,本例的资料存放在A1:A111;列出各组的上限,本例的资料存放在C1:C9
② 调用菜单“工具”—“数据分析”—“直方图”,如图
③ 填写输入区域、接受区域与输出区域,如图
④ 选中“柏拉图”、“累积百分率”和“图表输出”后按确定
⑤ 输出结果如图,表格有两部分:前三列是按给定分组上限顺序给出次数与累积频率;后三列是次数从大到小排列的次数与累积频率。输出的图形叫柏拉图,又称为排序直方图,是按次数从大到小做的直方图和累积曲线
⑥ 输出图形的初始状态很难看,可以双击感觉不满意的地方,进行修饰
图 “直方图”分析工具
图 “直方图”分析工具输出结果
二、条形图
条形图(bar chart)是用宽度相同的条子的高低或长短表示数据变动特征的图形。条形图可以横置也可以竖置,有单式、复式和分段式等多种形式。
条形图和直方图很相似,但两者是有区别的:条形图的“条”是可以分开的,而直方图的“条”是紧靠在一起的;条形图用高度(或长度)表示次数,多用于反映分类数据,直方图用面积表示次数,多用于反映数值型数据。
【例】根据数据集03中的数据,我们汇总2007年度考核的情况如表,绘制条形图
表 2007年度职工考核情况表
考核等级
人数
优
54
良
53
中
98
合格
5
不合格
4
合 计
214
【解】图与图是Excel工作表与制图结果的部分截图。
Excel解决方案
① 打开文件或者键入数据,准备好建立图表的数据
② 调用菜单“插入”—“图表”或单击“常用”工具栏中“图表向导”按钮
③ 如图所示的“图表向导”,选择“柱形图”的第一个子类型,按“下一步”
④ 数据区域选点A1:B6,按“下一步”
⑤ 填写标题、选择图例和数据标志等,按“下一步”
⑥ 选“作为其中的对象插入”,按“完成”后在工作表中生成一个粗糙的竖着的条形图
⑦ 双击感觉不满意的地方,进行修饰
我们还可以在“图表向导”中选择“条形图”来绘制横着的条形图,方法类似。
用Excel绘制条形图(竖置)
图 用Excel绘制的条形图(横置)
三、饼图
饼图(pie chart)是用圆形或圆内扇形的面积来表示数据值大小的图形。在饼图的绘制中,每个圆面积代表100%,如何分别绘制各部分所占的百分比并换算成圆的角度。
【例】根据数据集01中的数据,绘制2003年三次产业增加值的饼图,以反映产业的结构比例。
【解】图是Excel工作表与制图结果的部分截图。
Excel解决方案
① 打开文件或者键入数据,准备好建立图表的数据
② 调用菜单“插入”—“图表”或单击“常用”工具栏中“图表向导”按钮
③ 如图所示的“图表向导”,选择饼图第二个子类型,按“下一步”
④ 数据区域选点B1:D2,按“下一步”
⑤ 填写标题、选择图例位置、选择数据标志的表现方式,按“下一步”
⑥ 选“作为其中的对象插入”,按“完成”后即在工作表中生成一个粗糙的立体饼图
⑦ 双击感觉不满意的地方,进行修饰
图 用Excel绘制饼图
教师:无论是制表还是制图,Excel都为我们准备了良好的操作平台,大家一定要多练、多实践,它能提高我们处理数据的效率,事半功倍。
英文摘要与关键词
Statistical data can be illustrated on a statistical table or the statistical graph. Statistical tables includes simple tables, simple grouped tables and compound grouped tables. It’s structure includes a total title, row title, column title and digital data. The structure of a statistical graph includes the title, the coordinate axis and gridding lines, the graph and plot area and the legend. It also includes types of histograms, trend graphs, scatter diagrams, stem and leaf display, bar chart and so on. The purpose of graphical presentation is to display data accurately and clearly. In the following paragraph we will introduce the plot method for a histogram, polygon, curve chart, bar chart and pie chart. We will use Excel because of its ability to present the data from many angles and collect various statistical reports.
A histogram is a vertical bar chart in which the rectangular bars are constructed at the boundaries of each class. When plotting a histogram, we display the random variable of interest along the horizontal axis and the vertical axis represents the number, proportion, or percentage of observations per class interval. A percentage polygon is formed by having the midpoint of each class represent the data in that class and then connecting the sequence of midpoints at their respective class percentages. Smoothing the polygon will produce the curve chart.
We demonstrate how categorical data can be organized and presented in the form of tables and charts. A Summary table for categorical data is similar in format to the frequency distribution table for numerical data, just like Table . In bar charts, each category is depicted by a bar, the length of which represents the frequency or percentage of observations falling in a category. The pie chart is based on the fact that a circle has 360 degrees. The pie is divided into slices according to the percentage in each category.
Key Words: statistical table, statistical graph, histogram, polygon, bar chart, pie chart
习 题
一、单项选择题
1. 统计表的结构从形式上看包括( )、横行标题、纵栏标题、数字资料四个部分。
A.计量单位 B. 附录 C. 指标注释 D. 总标题
2.如果统计表中数据的单位都一致,我们可以把单位填写在( )。
A.左上角 B. 左下角 C. 右上角 D. 左下角
3. 现有某公司2007年各季度在各个地区销售各种产品的情况,数据库的四个字段是:地区、季度、商品、销售额。如果要反映各种商品在各地区和各季度的销售情况,应该绘制( )。
A.地区和商品的二维透视图 B. 季度和商品的二维透视图
C.地区、季度和销售额的三维透视图 D. 地区、季度和商品的三维透视图
4. 用Excel汇总第二季度中三个月份的资料,用( )功能。
A.透视表 B. 合并计算 C. 单变量求解 D. 分类汇总
5. 小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?( )
A. 直方图 B. 散点图 C. 饼图 D. 折线图
6. 小钱收集了上海、江苏和浙江三省2007年三次产业的增加值的资料,如果要反映2007年这三个省三次产业的结构,用什么图形最为合适?
A. 直方图 B. 散点图 C. 饼图 D. 折线图
二、多项选择题
1. 统计表可以分为( )( )( )( )( )。
A. 简单表 B. 复杂表 C. 简单分组表 D. 复杂分组表 E. 复合分组表
2. 完整的统计图应包括( )( )( )( )( )。
A.标题 B. 坐标轴和网格线 C. 图表区 D. 绘图区 E. 图例
3. 下面这张表的资料用什么图形表现比较合适?( )( )( )( )( )。
A. 直方图 B. 散点图 C. 饼图 D. 折线图 E. 茎叶图
某地区税收收入构成表
税收类型
数额(万元)
销售税
2812000
所得税
2790000
执照税
185000
营业税
535000
其他税
37800
4. 统计局住户处收集了3000户居民八月份消费的详细情况,如果要按月消费额的多少反映居民消费结构,用什么图形表现比较合适?( )( )( )( )( )。
A. 直方图 B. 散点图 C. 饼图 D. 折线图 E. 茎叶图
三、制表、制图
1. 根据数据集03,按“性别”和“教育程度”计算相应的平均工资。
2. 根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。
3. 根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。
4. 根据数据集01中C列的“国内生产总值”指标,绘制1952-2006年GDP的趋势图。
5. 仿照例题,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。
PAGE
PAGE 17
第 PAGE 17 页