统计学实验实习指导书
统计教研室编著
实验一 用Excel搜集与整理数据
实验目的:掌握用EXCEL进行数据的搜集整理和显示
实验步骤:
一、用Excel搜集数据
搜集数据的方法有多种,可以采用统计报表、典型调查、重点调查或抽样调查,以后我国的统计调查将以抽样为主,所以我们在这里介绍一下如何用Excel进行抽样。
使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或无关标志,具体可参见本书有关抽样的章节,编号后,将编号输入工作表。
【例13-1】假定有100个总体单位,每个总体单位给一个编号,共有从1到100个编号,输入工作表后如图13-1所示:
图:13-1总体各单位编号表
输入各总体单位的编号后,可按以下步骤操作:
第一步:单击工具菜单,选择数据分析选项(若无数据分析选项,可在工具菜单下选择加载宏,在弹出的对话框中选择分析工具库,便可出现数据分析选项),打开数据分析对话框,从中选择抽样。如图13-2所示:
图13-2数据分析对话框
第二步:单击抽样选项,弹出抽样对话框。如图13-3
图13-3 抽样对话框
第三步:在输入区域框中输入总体单位编号所在的单元格区域,在本例是$A$1:$J$10,系统将从A列开始抽取样本,然后按顺序抽取B列至J列。如果输入区域的第一行或第一列为标志项(横行标题或纵列标题),可单击标志复选框。
第四步:在抽样方法项下,有周期和随机两种抽样模式:
“周期”模式即所谓的等距抽样,采用这种抽样方法,需将总体单位数除以要抽取的样本单位数,求得取样的周期间隔。如我们要在100个总体单位中抽取12个,则在“间隔”框中输入8。
“随机模式”适用于纯随机抽样、分类抽样、整群抽样和阶段抽样。采用纯随机抽样,只需在“样本数”框中输入要抽取的样本单位数即可;若采用分类抽样,必须先将总体单位按某一标志分类编号,然后在每一类中随机抽取若干单位,这种抽样方法实际是分组法与随机抽样的结合;整群抽样也要先将总体单位分类编号,然后按随机原则抽取若干类作为样本,对抽中的类的所有单位全部进行调查。可以看出,此例的编号输入方法,只适用于等距抽样和纯随机抽样。
第四步:指定输出区域,在这里我们输入$A$14,单击确定后,即可得到抽样结果,如图13-4
图13-4等距抽样结果
二、用Excel进行统计分组
用Excel进行统计分组有两种方法,一是利用FREQUENCY函数;二是利用数据分析中的“直方图”工具。我们介绍一下后者的操作方法。
【例13-2】我们采用第三章例3-1,把50名工人的月产量资料输入工作表,如图13-5所示:
图13-5工人月产量资料
然后按以下步骤操作。
第一步:在工具菜单中单击数据分析选项,从其对话框的分析工具列表中选择直方图,打开直方图对话框。如图13-6所示:
图13-6直方图对话框
第二步:在输入区域输入$A$1:$J$5,在接收区域输入$A$9:$A$15。接收区域指的是分组标志所在的区域,假定我们把分组标志输入到A9:A15单元格,注意这里只能输入每一组的上限值,即130,160,190,220,250,280,310。
第三步:选择输出选项,可选择输入区域、新工作表组或新工作薄。我们在这里选择输入区域,可以直接选择一个区域,也可以直接输入一个单元格(代表输出区域的左上角),这里我们推荐只输入一个单元格(本例为A7),因为我们往往事先并不知道具体的输出区域有多大。
第四步:选择图表输出,可以得到直方图;选择累计百分率,系统将在直方图上添加累积频率折线;选择柏拉图,可得到按降序排列的直方图。
第五步:按确定按钮,可得输出结果如图13-7:
图13-7频数分布和直方图
应当注意,上图实际上是一个条形图,而不是直方图,若要把它变成直方图,可按如下操作:
用鼠标左键单击任一直条,然后右键单击,在弹出的快捷菜单中选取数据系列格式,弹出数据系列格式对话框,如图13-8所示:
图13-8数据系列格式对话框
在对话框中选择选项标签,把间距宽度改为0,按确定后即可得到直方图,如图13-9所示:
图13-9调整后的直方图
三、用Excel作统计图
Excel提供的统计图有多种,包括柱形图、条形图、折线图、饼图、散点图、面积图、环形图、雷达图、曲面图、气泡图、股价图、圆柱图、圆锥图等,各种图的作法大同小异。
【例13-3】我们这里采用第三章表3-13的资料,看一下如何作饼图。首先把数据输入到工作表中,如图13-10所示:
图13-10河北省主要市2001年人口情况
按以下步骤可作出饼图:
第一步:选中某一单元格,单击插入菜单,选择图表选项,弹出图表向导对话框。如图13-11:
图13-11图表向导对话框
第二步:在图表类型中选择饼图,然后在子图表类型中选择一种类型,这里我们选用系统默认的方式。然后单击下一步按钮,打开源数据对话框。如图13-12所示:
图13-12源数据对话框
第三步:在源数据对话框中填入数据所在区域,单击完成按钮,即可得如13-13所示的饼图:
图13-13饼图
实验二用EXCEL计算描述统计量
实验目的:用EXCEL计算描述统计量
实验步骤:
EXCEL中用于计算描述统计量的方法有两种,函数方法和描述统计工具的方法。
一、 用函数计算描述统计量
常用的描述统计量有众数、中位数、算术平均数、调和平均数、几何平均数、极差、四分位差、标准差、方差、标准差系数等。一般来说,在Excel中求这些统计量,未分组资料可用函数计算,已分组资料可用公式计算。这里我们仅介绍如何用函数计算。
(一)众数
【例13-4】:为了解某经济学院新毕业大学生的工资情况,随机抽取30人,月工资如下:
1560 1340 1600 1410 1590 1410 1610 1570 1710 1550 1490 1690 1380 1680 1470 1530 1560 1250 1560 1350 1560 1510 1550 1460 1550 1570 1980 1610 1510 1440
用函数方法求众数,应先将30个人的工资数据输入A1:A30单元格,然后单击任一空单元格,输入“=MODE(A1:A30)”,回车后即可得众数为1560
(二)中位数
仍采用上面的例子,单击任一空单元格,输入“=MEDIAN(A1:A30)”,回车后得中位数为1550。
(三)算术平均数
单击任一单元格,输入“=AVERAGE(A1:A30)”,回车后得算术平均数为1535。
(四)标准差
单击任一单元格,输入“=STDEV(A1:A30)”,回车后得标准差为。
二、 描述统计工具量的使用
仍使用上面的例子,我们已经把数据输入到A1:A30单元格,然后按以下步骤操作:
第一步:在工具菜单中选择数据分析选项,从其对话框中选择描述统计,按确定后打开描述统计对话框,如图13-14所示:
图13-14描述统计对话框
第二步:在输入区域中输入$A$1:$A$30,在输出区域中选择$C$1,其他复选框可根据需要选定,选择汇总统计,可给出一系列描述统计量;选择平均数置信度,会给出用样本平均数估计总体平均数的置信区间;第K大值和第K小值会给出样本中第K个大值和第K个小值。
第三步:单击确定,可得输出结果,如图13-15所示:
图13-15描述统计输出结果
上面的结果中,平均指样本均值;标准误差指样本平均数的标准差;中值即中位数;模式指众数;标准偏差指样本标准差,自由度为n-1;峰值即峰度系数;偏斜度即偏度系数;区域实际上是极差,或全距。(可见中文版的翻译有问题)
实验三 用EXCEL进行时间序列分析
实验目的:用EXCEL进行时间序列分析
实验步骤:
一、测定增长量和平均增长量
【例13-5】:根据1995-2001年河北省国内生产总值,计算逐期增长量、累计增长量和平均增长量。如图13-16
图13-16用EXCEL计算增长量和平均增长量资料及结果
计算步骤如下:
第一步:在A列输入年份,在B列输入国内生产总值。
第二步:计算逐期增长量:在C3中输入公式:=B3-B2,并用鼠标拖曳将公式复制到C3:C8区域。
第三步:计算累计增长量:在D3中输入公式:=B3-$B$2,并用鼠标拖曳公式复制到D3:D8区域。
第四步:计算平均增长量(水平法):在C10中输入公式:=(B8-B2)/5,按回车键,即可得到平均增长量。
二、测定发展速度和平均发展速度
【例13-6】:以1995-2001年河北省国内生产总值为例,说明如何计算定基发展速度、环比发展速度和平均发展速度。如图13-17
图13-17用EXCEL计算发展速度和平均发展速度资料及结果
第一步:在A列输入年份,在B列输入国内生产总值。
第二步:计算定基发展速度:在C3中输入公式:=B3/$B$2,并用鼠标拖曳将公式复制到C3:C8区域。
第三步:计算环比发展速度:在D3中输入公式:=B3/B2,并用鼠标拖曳将公式复制到D3:D8区域。
第四步:计算平均发展速度(水平法):选中C10单元格,单击插入菜单,选择函数选项,出现插入函数对话框后,选择GEOMEAN(返回几何平均值)函数,在数值区域中输入D3:D8即可。
三、计算长期趋势
【例13-7】:我们用某企业某年12个的总产值资料来说明如何用移动平均法计算长期趋势。如图13-18
图13-18用EXCEL计算长期趋势资料及结果
第一步:在A列输入月份,在B列输入总产值。
第二步:计算三项移动平均:在C3中输入“=(B2+B3+B4)/3”,并用鼠标拖曳将公式复制到C3:C12区域。
第三步:计算四项移动平均:在D4中输入“=SUM(B2:B5)/4”,并用鼠标拖曳将公式复制到D4:D12区域。
第四步:计算二项移正平均数:在E4中输入“=(D4+D5)/2”,并用公式拖曳将公式复制到E4:E11区域。
四、计算季节变动
【例13-8】:利用某种商品五年分季度的销售额资料,说明如何用移动平均趋势剔除法测定季节变动。如图13-19
图13-19用EXCEL计算季节变动资料
第一步:按图上的格式在A列输入年份,在B列输入季别,在C列输入销售收入。
第二步:计算四项移动平均:在D3中输入“=SUM(C2:C4)/4”,并用鼠标拖曳将公式复制到D3:D19区域。
第三步:计算趋势值(即二项移动平均)T:在E4中输入“=(D3+D4)/2”,并用鼠标拖曳将公式复制到E4:E19区域。
第四步:剔除长期趋势,即计算Y/T:在F4中输入“=C4/E4”,并用鼠标拖曳将公式复制到F4:F19区域。
第五步:重新排列F4:F19区域中的数字,使同季的数字位于一列,共排成四列。
第六步:计算各年同季平均数:在B29单元格中输入公式:=average(B25:B28);在C29中输入公式=average(C25:C28);在D29中输入公式=average(D24:27);在E29中输入公式=average(E24:E27)。
第七步:计算调整系数:在B31中输入公式:=4/sum(B29:E29)
第八步:计算季节比率:在B30中输入公式:=B29*$B$31,并用鼠标拖曳将公式复制到单元格区域B30:E30,就可以得到季节比率的值,具体结果见图13-20:
图13-20用EXCEL计算季节变动结果
实验四 用EXCEL进行指数分析
实验目的:用EXCEL进行指数分析
实验步骤:
指数分析法是研究社会经济现象数量变动情况的一种统计分析法。指数有总指数与平均指数之分,在这一节我们介绍如何用Excel进行指数分析与因素分析。
一、用Excel计算总指数
【例13-9】:图中是某企业甲、乙、丙三种产品的生产情况,以基期价格p作为同度量因素,计算生产量指数。如图13-21
图13-21用EXCEL计算总指数资料及结果
计算步骤:
第一步:计算各个p0q0:在G2中输入“=C2*D2”,并用鼠标拖曳将公式复制到G2:G4区域。
第二步:计算各个p0*q1:有H2中输入“=C2*F2”,并用鼠标拖曳将公式复制到H2:H4区域。
第三步:计算Σp0q0和Σp0q1:选定G2:G4区域,单击工具栏上的“Σ”按钮,在G5出现该列的求和值。选定H2:H4区域,单击工具栏上的“Σ”按钮,在H5出现该列的求和值。
第四步:计算生产量综合指数Iq=Σp0q1/Σp0q0:在C6中输入“=H5/G5”便可得到生产量综合指数
注意:在输入公式的时候,不要忘记等号,否则就不会出现数值。
二、用Excel计算平均指数
现以生产量平均指数为例,说明加权算术平均法的计算方法。
【例13-10】:图中的A1:A4区域内是某企业生产情况的统计资料,我们要以基期总成本为同度量因素,计算生产量平均指数。如图13-22
图13-22用EXCEL计算平均指数资料及结果
计算步骤:
第一步:计算个体指数 k=q1/q0:在F2中输入“=D2/C2”。并用鼠标拖曳将公式复制到F2:F4区域。
第二步:计算k*p0q0并求和。在G2中输入“=F2*E2”并用鼠标拖曳将公式复制到G2:G4区域。选定G2:G4区域,单击工具栏上的:“Σ”按钮,在G5列出现该列的求和值。
第三步:计算生产量平均指数:在C7中输入“=G5/E5”即得到所求的值。
三、用Excel进行因素分析
【例13-11】:我们还用上面的例子,有关资料如图13-23
图13-23用EXCEL进行因素分析资料及结果
进行因素分析的计算步骤如下:
第一步:计算各个p0*q0和∑p0q0:在G2中输入“C2*D2”,并用鼠标拖曳将公式复制到G2:G4区域。选定G2:G4区域,单击工具栏上的“∑”按钮,在G5出现该列的求和值。
第二步:计算各个p0*q1和∑p0*q1:在H2中输入“=C2*F2”,并用鼠标拖曳将公式复制到H2:H4区域。选定H2:H6区域,单击工具栏上的“∑”按钮,在H5出现该列的求和值。
第三步:计算各个p1*q1和∑p1*q1:在I2中输入“=E2*F2”,并用鼠标拖曳将公式复制到I2:I4区域。选定I2:I4区域,单击工具栏上的“∑”按钮,在I5出现该列的求和值。
第四步:计算总成本指数:在C6中输入“=I5/G5”,即求得总成本指数。
第五步:计算产量指数:在C7中输入“=H5/G5”,即得产量指数
第六步:计算单位成本指数:在C8中输入“=I5/H5”即求得单位成本指数
实验五 用EXCEL进行相关与回归分析
实验目的:用EXCEL进行相关与回归分析
实验步骤:
我们用下面的例子进行相关和回归分析:
【例13-12】:10个学生身高和体重的情况如下:
学生
身高(公分)
体重(公斤)
1
2
3
4
5
6
7
8
9
10
171
167
177
154
169
175
163
152
172
160
53
56
64
49
55
66
52
47
58
50
要求对身高和体重作相关和回归分析。
一、用EXCEL进行相关分析
首先把有关数据输入EXCEL的单元格中,如图13-24
图13-24 EXCEL数据集
用EXCEL进行相关分析有两种方法,一是利用相关系数函数,另一种是利用相关分析宏。
1.利用函数计算相关系数
在EXCEL中,提供了两个计算两个变量之间相关系数的方法,CORREL函数和PERSON函数,这两个函数是等价的,这里我们介绍用CORREL函数计算相关系数:
第一步:单击任一个空白单元格,单击插入菜单,选择函数选项,打开粘贴函数对话框,在函数分类中选择统计,在函数名中选择CORREL,单击确定后,出现CORREL对话框。
第二步:在array1中输入B2:B11,在array2中输入C2:C11,即可在对话框下方显示出计算结果为。如图13-25所示:
图13-25CORREL对话框及输入结果
2.用相关系数宏计算相关系数
第一步:单击工具菜单,选择数据分析选项,在数据分析选项中选择相关系数,弹出相关系数对话框,如图13-26所示:
图13-26相关系数对话框
第二步:在输入区域输入$B$1:$C$1,分组方式选择逐列,选择标志位于第一行,在输出区域中输入$E$1,单击确定,得输出结果如图13-27
图13-27相关分析输出结果
在上面的输出结果中,身高和体重的自相关系数均为1,身高和体重的相关系数为,和用函数计算的结果完全相同。
二、用EXCEL进行回归分析
EXCEL进行回归分析同样分函数和回归分析宏两种形式,其提供了9个函数用于建立回归模型和预测。这9个函数分别是:
INTERCEPT 返回线性回归模型的截距
SLOPE 返回线性回归模型的斜率
RSQ 返回线性回归模型的判定系数
FORECAST 返回一元线性回归模型的预测值
STEYX 计算估计的标准误
TREND 计算线性回归线的趋势值
GROWTH 返回指数曲线的趋势值
LINEST 返回线性回归模型的参数
LOGEST 返回指数曲线模型的参数
用函数进行回归分析比较麻烦,我们这里介绍使用回归分析宏进行回归分析。
第一步:单击工具菜单,选择数据分析选项,出现数据分析对话框,在分析工具中选择回归,如图13-28
图13-28数据分析对话框
第二步:单击确定按钮,弹出回归对话框,在Y值输入区域输入$B$2:$B$11,在X值输入区域输入$C$2:$C$11,在输出选项选择新工作表组,如图13-29所示:
图13-29回归对话框
第四步:单击确定按钮,得回归分析结果如图13-30所示
图13-30EXCEL回归分析结果
在上面的输出结果中,第一部分为汇总统计,MultipleR指复相关系数,R Square指判定系数,Adjusted指调整的判定系数,标准误差指估计的标准误,观测值指样本容量;第二部分为方差分析,df指自由度,SS指平方和,MS指均方,F指F统计量,Significance of F指p值;第三部分包括:Intercept指截距,Coefficient指系数,t stat指t统计量。
实验六 用统计软件进行预测
实验目的:用EXCEL进行预测
实验步骤:
【例13-13】:某煤矿某年1-11月份采煤量如下表:
月份
产量
月份
产量
1
2
3
4
5
6
7
8
9
10
11
12
一、用移动平均法进行预测
具体步骤:
第一步:将原始数据录入到单元格区域A2:A12,如图13-31所示:
图13-31EXCEL数据集
第二步:选择菜单条上的“工具”——“数据分析”命令,弹出如图13-32所示的对话框:
图13-32数据分析对话框
第三步:在“分析工具”框中选择“移动平均”,单击“确定”按钮,弹出移动平均对话框,相应作如下输入,即可得到如图13-33所示的对话框:
(1) 在“输出区域”内输入:$A$2:$A$12,即原始数据所在的单元格区域。
(2) 在“间隔”内输入:3,表示使用三步移动平均法。
(3) 在“输出区域”内输入:B2,即将输出区域的左上角单元格定义为B2。
(4) 选择“图表输出”复选框和“标准误差”复选框。
13-33移动平均对话框
第四步:单击“确定”按钮,便可得到移动平均结果,如图13-34所示:
分析:在图中,B4:B12对应的数据即为三步移动平均的预测值;单元格区域C6:C12即为标准误差。
13-34移动平均分析结果
二、用指数平滑法进行预测:
第一步:将原始数据输入到单元格B2:B12;
第二步:选择菜单条上的“工具”——“数据分析”命令,弹出如图13-35所示的对话框:
图13-35数据分析对话框
第三步:在“分析工具”中选择“指数平滑”,单击“确定”按钮,弹出一个对话框,作相应输入,即可得到如图13-36所示的对话框;
13-36指数平滑对话框
第四步:单击“确定”按钮,即可得到指数平滑结果,如图13-37所示:
图13-37指数平滑结果
三、趋势预测法进行预测
第一步:把相关数据输入到EXCEL中,其中月份输入A1-A11单元格,月产量输入B1-B11单元格,如图13-38所示:
图13-38EXCEL数据集
第二步:在工作表中选择一个空的单元格。在这里我们选择D2单元格。
第三步:选择插入下拉菜单。
第四步:选择函数选项。
第五步:当函数对话框出现时:在函数类别框中选择统计,在函数名字中选择FORECAST(预测),如图13-39所示:
图13-39粘贴函数对话框
第六步:单击确定按钮,出现预测对话框,在x中输入12,在know-y’s中输入B1:B11,在know-x’s中输入A1:A11,如图13-40所示:
图13-40FORCAST对话框
第七步:单击确定按钮,预测结果出现在D2单元格中,如图13-41所示:
图13-41趋势预测法预测结果
实验七 用EXCEL进行参数估计和假设检验
实验目的:用EXCEL进行参数估计和假设检验
实验步骤:
在EXCEL中,进行参数估计只能使用公式和函数的方法,而假设检验除以上两种方法外,还可以使用假设检验工具。
一、用EXCEL进行区间估计
【例13-14】:某饭店在7星期内抽查49位顾客的消费额(元)如下: 15 24 38 26 30 42 18 30 25 26 34 44 20 35 24 26 34 48 18 28 46 19 30 36 42 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26
求在概率90%的保证下,顾客平均消费额的估计区间。如图13-42:
图13-42参数估计数据及结果
计算方法如下:
第一步:把数据输入到A2:A50单元格。
第二步:在C2中输入公式“=COUNT(A2:A50)”,C3中输入“=AVERAGE(A2:A50)”,在C4中输入“STDEV(A2:A50)”,在C5中输入“=C4/SQRT(C2)”,在C6中输入,在C7中输入“=C2-1”,在C8中输入“=TINV(1-C6,C7)”,在C9中输入“=C8*C5”,在C10中输入“=C3-C9”,在C11中输入“=C3+C9”。在输入每一个公式回车后,便可得到上面的结果,从上面的结果我们可以知道,顾客平均消费额的置信下限为,置信上限为。
关于总体方差的估计、总体比例的估计等可按类似方法进行。
二、用EXCEL进行假设检验
用EXCEL函数和公式进行假设检验与参数估计类似,大家可以自已做一下,我们这里介绍一下假设检验工具的使用。
在EXCEL中,假设检验工具主要有四个,如图13-43所示:
图13-43数据分析对话框
平均值的成对二样本分析实际上指的是在总体方差已知的条件下两个样本均值之差的检验,准确的说应该是Z检验,双样本等方差检验是总体方差未知,但假定其相等的条件下进行的t检验,双样本异方差检验指的是总体方差未知,但假定其不等的条件下进行的t检验,双样本平均差检验指的是配对样本的t检验。
我们介绍一下Z检验。
【例13-15】:某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽一个样本进行硬度测试(表示耐磨性的一种考核指标)其结果如下:
合镍铸件(X) 72
合铜铸件(Y)
根据以往经验知硬度,,且,试在水平上比较镍合金铸件硬度有无显著提高。
计算步骤如下:
第一步:输入数据到工作表。
第二步:单击工具菜单,选择数据分析选项,弹出对话框后,在其中选择双样本平均差分析,弹出对话框如图13-44所示:
图13-44双样本平均差分析对话框
第三步:按上图所示输入后,按确定按钮,得输出结果如图13-45:
图13-45双样本平均差分析结果
在上面的结果中,我们可以根据P值进行判断,也可以根据统计量和临界值比较进行判断。如本例采用的是单尾检验,其单尾P值为,大于给定的显著性水平,所以应该接受原假设,即镍合金铸件硬度没有明显提高;若用临界值判断,得出的结论是一样的,如本例Z值为,小于临界值,由于是右尾检验,所以也是接受原假设。