一、什么
是统计
第一节 统计一词的含义
1
关于什么是统计,仁者见仁,智者见智,关于什么是统计,仁者见仁,智者见智,
早在早在18691869年第年第77次国际统计会议上,有人统计,次国际统计会议上,有人统计,
统计学的定义就有统计学的定义就有183183种之多,以至于惊叹种之多,以至于惊叹““
统计学家现在还不能统计统计学家现在还不能统计‘‘统计统计’’的定义的定义””。。
统计的多重含义:统计的多重含义:统计工作,统计工作,统计资料,统计资料,
统计学统计学
2
统计工作统计工作是人们为了说明所研究对象的某是人们为了说明所研究对象的某
种种数量数量特征特征和和数量数量规律性,而对该现象的数规律性,而对该现象的数
据进行收集、整理与分析的活动过程。据进行收集、整理与分析的活动过程。
统统计计资资料料是是通通过过统统计计工工作作所所获获得得的的能能够够说说
明明现现象象总总体体某某种种特特征征的的数数据据以以及及与与之之相相联联系系
的的文文字字、、图图表表等等资资料料的的总总称称,,是是统统计计实实践践活活
动的成果。动的成果。
3
统计学是一门研究社会经济和自然现统计学是一门研究社会经济和自然现
象的数量方面的方法论科学。象的数量方面的方法论科学。
是一门关于如何搜集、表现、分析、解是一门关于如何搜集、表现、分析、解
释数据,从而认识现象数量特征和数量释数据,从而认识现象数量特征和数量
规律的方法论科学。规律的方法论科学。
***
统
计
学
*** 统统计计学学源源于于实实践践,,
是是对对实实践践的的理理论论
概概括括和和总总结结,,又又
用于指导实践。用于指导实践。
4
《《不不列列颠颠百百科科全全书书》》的的定定义义::统统计计学学是是::
““关于收集和分析数据的科学与艺术关于收集和分析数据的科学与艺术””
统计并不仅是计算,而是一种分析和判断。统计并不仅是计算,而是一种分析和判断。
学学统统计计要要有有一一定定的的数数理理基基础础,,但但不不能能以以数数
学的逻辑思维来学统计学的逻辑思维来学统计。。
5
统计统计是一种是一种““活活””的、的、““具体具体””的计量思的计量思
维,维,必须结合实际。必须结合实际。
统计思维注重观察思考和调查研究;注重统计思维注重观察思考和调查研究;注重
定量分析与定性分析的结合,注重从事物的定量分析与定性分析的结合,注重从事物的
发展和对比上看问题。发展和对比上看问题。
6
统计学与数学的区别:统计学与数学的区别:
((11))数数学学研研究究的的是是抽抽象象的的数数量量规规律律性性,,而而统统计计
学学研研究究的的是是具具体体的的、、实实实实在在在在的的数数量量规规律律性性。。
数数学学研研究究的的是是没没有有量量纲纲或或单单位位的的数数,,而而统统计计学学
研究的是有具体实物内容或计量单位的数据。研究的是有具体实物内容或计量单位的数据。
7
((22))数数学学研研究究使使用用的的是是纯纯粹粹的的演演绎绎,,而而统统计计学学
是演绎与归纳相结合,且占主导地位的是归纳。是演绎与归纳相结合,且占主导地位的是归纳。
数数学学家家可可以以端端坐坐家家中中,,凭凭借借纸纸笔笔和和聪聪明明的的大大
脑脑,,从从假假设设的的命命题题出出发发而而推推导导出出漂漂亮亮的的结结果果。。而而
统统计计学学家家则则必必须须深深入入实实际际收收集集数数据据,,才才能能有有所所作作
为为,,没没有有大大量量数数据据的的归归纳纳,,统统计计学学家家就就得得不不出出任任
何有益的结论。何有益的结论。
8
二
、
统
计
研
究
对
象
的
特
点
数量性和总体性数量性和总体性
11.数量性.数量性 ::统计总是用数字作为语统计总是用数字作为语
言来表述事实。言来表述事实。
① ①从数量上认识事物的性质和规律,从数量上认识事物的性质和规律,
是统计研究的基本特点;是统计研究的基本特点;
② ②统计研究的不是抽象的数量,而是统计研究的不是抽象的数量,而是
有特定内容的具体数量。统计是在质的有特定内容的具体数量。统计是在质的
规定性下研究与所研究现象内容性质密规定性下研究与所研究现象内容性质密
切联系的具体数量。切联系的具体数量。
9
22.总体性:.总体性:研究大量个别事物构成的现象研究大量个别事物构成的现象
整体的数据。整体的数据。
① ①统计研究的不是个体的数量,而是总体统计研究的不是个体的数量,而是总体
的数量;即统计研究的是群体现象的数量方的数量;即统计研究的是群体现象的数量方
面,是现象总体的数量特征和数量关系。面,是现象总体的数量特征和数量关系。
② ②现象的数量规律,只有在总体中才能体现象的数量规律,只有在总体中才能体
现出来。现出来。
10
例例一一,,婴婴儿儿的的性性别别比比例例,,由由人人类类社社会会长长期期
遗遗传传和和发发展展所所形形成成,,古古今今中中外外大大致致相相同同((大大
约为约为107107::100100或或::)。)。
人人类类性性别别比比例例的的研研究究,,是是统统计计学学的的起起源源之之
一一,,也也是是统统计计方方法法探探索索的的最最早早的的数数量量规规律律性性
之一。之一。
20002000年年普普查查大大陆陆总总人人口口12658351265835万万人人,,
性性比比为为::,,男男性性人人口口多多个个百百
分点,多分点,多41274127万人。万人。
统计
数据
的内
在规
律
11
例例二二,,投投掷掷硬硬币币。。 投投掷掷一一枚枚质质量量均均匀匀的的硬硬币币,,
出出现现正正面面和和反反面面的的概概率率各各为为1/21/2;;投投掷掷一一枚枚骰骰子子出出
现现11~~66点的概率各为点的概率各为1/61/6。。
大量试验结果表明频率接近于概率。大量试验结果表明频率接近于概率。
频率频率:在:在nn次重复试验中,事件次重复试验中,事件AA出现了出现了kk次,次,
则则k/nk/n为事件为事件AA发生的频率。发生的频率。
概率概率::如果随着试验次数的增加,事件如果随着试验次数的增加,事件AA的频率的频率
逐渐稳定于某个常数逐渐稳定于某个常数PP附近,则称附近,则称PP为事件为事件AA的概的概
率(概率是频率的稳定值,率(概率是频率的稳定值,是随机事件发生可能是随机事件发生可能
性大小的度量。性大小的度量。 )) 12
1818世世纪纪法法国国科科学学家家蒲蒲丰丰投投掷掷钱钱币币40404040次次,,
正面正面20482048次,频率次,频率;;
2020世世纪纪英英国国科科学学家家皮皮尔尔逊逊投投掷掷钱钱币币1200012000
次次,,正正面面60196019次次,,频频率率;;2400024000次次,,正正
面面1201212012次,频率次,频率。。
南南非非数数学学家家John John KerrichKerrich二二战战时时期期在在集集中中
营投掷营投掷1000010000次,正面次,正面50675067次,频率次,频率
13
14
15
16
三
、
统
计
的
功
能
和
作
用
国国家家统统计计局局表表述述了了((政政府府))统统计计的的三三大大功功
能:能:提供信息,实行咨询,执行监督。提供信息,实行咨询,执行监督。
统统计计的的信信息息职职能能是是统统计计最最基基本本的的职职能能,,指指统统
计计提提供供反反映映现现象象的的本本质质特特征征的的数数据据资资料料,,作作为为
各级政府和企事业单位进行管理和决策的依据。各级政府和企事业单位进行管理和决策的依据。
17
统计的咨询职能统计的咨询职能指利用掌握的统计数据资料,指利用掌握的统计数据资料,
根据各级政府和企事业单位的需要,深入开展根据各级政府和企事业单位的需要,深入开展
综合分析和专题分析,为他们提供各种可供选综合分析和专题分析,为他们提供各种可供选
择的建议和对策方案。择的建议和对策方案。
统计的监督职能统计的监督职能指根据统计调查和分析,用指根据统计调查和分析,用
数据及时、准确地反映经济、社会、科技的运数据及时、准确地反映经济、社会、科技的运
行状况,对其实行全面、系统的定量检查、监行状况,对其实行全面、系统的定量检查、监
测和预警,以促使经济、社会、科技按照客观测和预警,以促使经济、社会、科技按照客观
规律的要求向前发展。规律的要求向前发展。
18
统计的三种职能相互联系、相辅相成、缺统计的三种职能相互联系、相辅相成、缺
一不可。采集和提供统计信息是统计最基本一不可。采集和提供统计信息是统计最基本
的职能,是统计咨询职能和监督职能能够得的职能,是统计咨询职能和监督职能能够得
以发挥的前提;统计咨询职能是统计信息职以发挥的前提;统计咨询职能是统计信息职
能的延续和深化;统计监督职能是在统计信能的延续和深化;统计监督职能是在统计信
息和统计咨询职能基础上的进一步拓展。息和统计咨询职能基础上的进一步拓展。
19
列列宁宁说说::““统统计计是是社社会会认认识识最最有有力力的的武武
器之一器之一” ”
希腊哲学家、科学家阿基米德有一句名希腊哲学家、科学家阿基米德有一句名
言:言:““如果给我一个支点,我就能用杠杆如果给我一个支点,我就能用杠杆
搬动整个地球搬动整个地球””。。
20
英英国国著著名名统统计计学学家家高高尔尔顿顿爵爵士士说说::““某某
些些人人不不喜喜欢欢统统计计这这个个名名词词,,但但我我却却发发现现其其中中
充充满满了了乐乐趣趣,,…………它它们们处处理理各各种种复复杂杂现现象象的的
能能力力是是非非凡凡的的,,它它们们是是追追求求科科学学的的人人从从荆荆棘棘
丛生的困难阻挡中开辟道路的最好工具。丛生的困难阻挡中开辟道路的最好工具。””
21
我国著名经济学家、人口学家马寅初先生曾我国著名经济学家、人口学家马寅初先生曾
经说过一段极为精辟的话:经说过一段极为精辟的话:
“ “学者不能离开统计而研究,政治家不能离开学者不能离开统计而研究,政治家不能离开
统计而施政,事业家不能离开统计而执业统计而施政,事业家不能离开统计而执业” ” 。。
22
有人说:有人说:““没有统计,其它科学可以存没有统计,其它科学可以存
在,但是很渺小在,但是很渺小””
一个医生说:一个医生说:““医学若无统计就不是科医学若无统计就不是科
学学””
一留美学者说:一留美学者说:““统计是统计是2020世纪人类最世纪人类最
伟大的发现之一伟大的发现之一””
23
一位资深的海外统计学家说:统计就和柴、一位资深的海外统计学家说:统计就和柴、
米、油、盐、酱、醋、茶一样,存在的时候米、油、盐、酱、醋、茶一样,存在的时候
并不是很突出,一旦不见了,人生就是黑白并不是很突出,一旦不见了,人生就是黑白
的了。的了。
美国美国SCIENCFYSCIENCFY有一篇文章列出近百年来最有一篇文章列出近百年来最
有用的科学,统计高居前十名。有用的科学,统计高居前十名。
24
香香港港城城市市大大学学管管理理科科学学系系介介绍绍统统计计专专业业时时用用了了四四
句话:句话:
各大机构和国际企业均设立完善的信息系统;各大机构和国际企业均设立完善的信息系统;
统计是信息系统中不可缺少的一项功能;统计是信息系统中不可缺少的一项功能;
所有具规模的企业均视数据库为所有具规模的企业均视数据库为““金矿金矿” ” ;;
统计学便是开采这个统计学便是开采这个““金矿金矿””的最有效工具的最有效工具。
25
台台湾湾辅辅仁仁大大学学谢谢邦邦昌昌教教授授说说““统统计计即即生生活活,,
统计即人生统计即人生””
平均数平均数——中庸法则中庸法则
平均数代表中间水平,集中趋势;人生一平均数代表中间水平,集中趋势;人生一
切行为,应既不过分自我膨胀,也不过分自切行为,应既不过分自我膨胀,也不过分自
我矮化,适中而行,保持平衡的心性,才能我矮化,适中而行,保持平衡的心性,才能
乐观进取,发挥潜能。乐观进取,发挥潜能。
26
变异数变异数——谨慎法则谨慎法则
管管子子曾曾说说::““不不明明于于数数欲欲举举大大事事,,如如舟舟之之无无
楫楫而而欲欲行行于于大大海海也也” ” ,,人人生生之之路路崎崎岖岖坎坎坷坷,,高高
低不平,不可未知其详贸然而行。低不平,不可未知其详贸然而行。
随机抽样随机抽样——公平法则公平法则
积极工作,公平竞争;善于观察,把握机会。积极工作,公平竞争;善于观察,把握机会。
27
常态分布常态分布——自然法则自然法则
人人生生应应以以自自然然为为法法则则,,不不宜宜燥燥进进、、亦亦不不可可消消
极极,,不不轻轻易易放放弃弃,,也也不不执执著著于于自自己己力力所所不不能能及及
之事;自己战胜自己,才是强者。之事;自己战胜自己,才是强者。
以以博博大大的的胸胸怀怀容容纳纳不不同同意意见见,,有有如如沧沧海海之之不不
择细流,凡事包容,自易成大功大业。择细流,凡事包容,自易成大功大业。
28
统统计计学学是是一一门门关关于于数数据据的的科科学学,,只只要要研研究究和和
分分析析数数据据,,就就要要用用到到统统计计学学;;统统计计又又是是一一种种重重
要要的的分分类类手手段段,,只只要要有有分分类类的的问问题题,,就就要要用用到到
统计学。统计学。
统统计计学学几几乎乎可可以以用用于于一一切切领领域域,,各各种种事事物物所所
具具有有的的内内在在数数量量规规律律性性都都可可以以借借助助统统计计方方法法加加
以探索。以探索。
29
11、、破破译译英英文文密密码码 对对字字母母互互换换这这种种密密码码方方
法法,,借借助助于于统统计计学学中中的的次次数数分分布布,,比比较较字字母母出出
现现的的频频率率。。一一般般而而言言,,各各字字母母出出现现的的频频率率是是有有
规规律律的的,,有有人人曾曾以以一一段段话话400400个个英英文文字字母母作作基基
础础,,列列出出各各字字母母频频率率,,如如aa::32/40032/400,,bb::
6/4006/400,,ee::52/40052/400,,jj::2/4002/400,,qq::1/4001/400,,zz
::1/4001/400;;比比较较密密码码中中字字母母的的频频率率常常能能有有效效进进
行判断。行判断。
30
22、鉴别文章作者、鉴别文章作者
““红红楼楼梦梦””后后4040回回是是否否为为曹曹雪雪芹芹所所写写,,““水水浒浒
传传””有有7070回回本本、、100100回回本本、、120120回回本本,,后后几几十十回回是是
否出自施耐庵一人之手?否出自施耐庵一人之手?
弄弄清清这这些些问问题题当当然然是是文文学学家家和和史史学学家家的的事事,,
但统计可助一臂之力,提出有说服力的数据。但统计可助一臂之力,提出有说服力的数据。
31
《红楼梦》后《红楼梦》后4040回出自谁的手笔?回出自谁的手笔?
《《红红楼楼梦梦》》一一书书共共120120回回,,一一般般认认为为前前8080回回为为
曹曹雪雪芹芹所所写写,,后后4040回回为为高高鹗鹗所所续续,,长长期期以以来来对对
这个问题一直有争议。这个问题一直有争议。
19851985、、19861986复复旦旦大大学学李李贤贤平平教教授授带带领领他他的的学学
生作了这项有意义的工作。生作了这项有意义的工作。
32
他他们们创创造造性性的的想想法法是是将将120120回回看看成成是是120120个个样样
本本,,然然后后确确定定与与情情节节无无关关的的虚虚词词作作为为变变量量((所所以以
要要抛抛开开情情节节,,是是因因为为在在一一般般情情况况下下,,同同一一情情节节
大大家家描描述述的的都都差差不不多多,,但但由由于于个个人人写写作作特特点点和和
习习惯惯的的不不同同,,所所用用的的虚虚词词是是不不会会一一样样的的)),,数数出出
每每一一回回里里变变量量出出现现的的次次数数,,作作为为数数据据,,用用多多元元
分析中的聚类分析法进行分类。分析中的聚类分析法进行分类。
33
分分析析结结果果果果然然表表明明120120回回分分属属两两类类,,即即前前8080回回为为
一一类类,,后后4040回回为为一一类类,,有有说说服服力力地地证证实实了了全全书书不不
是出自同一人的手笔。是出自同一人的手笔。
前前8080回是否为曹雪芹所写回是否为曹雪芹所写??
通通过过对对曹曹雪雪芹芹的的其其它它著著作作的的类类似似分分析析,,证证实实用用
词手法完全相同,断定前词手法完全相同,断定前8080回为曹雪芹一人手笔。回为曹雪芹一人手笔。
34
NEXT
后后4040回是否为高鹗所写回是否为高鹗所写??
论证结果推翻了后论证结果推翻了后4040回是高鹗一个人所写。回是高鹗一个人所写。
这这个个论论证证在在红红学学界界轰轰动动很很大大,,支支持持了了红红学学界界观观
点,使红学界大为赞叹。点,使红学界大为赞叹。
类似的典型事例还有莎士比亚诗的鉴别类似的典型事例还有莎士比亚诗的鉴别
35
33、、““挑战者挑战者””号灾难的教训号灾难的教训
19861986年年11月月2828日日,,美美国国““挑挑战战者者””号号航航天天
飞飞机机发发射射几几秒秒钟钟后后即即发发生生爆爆炸炸,,所所有有宇宇航航员员
遇遇难难,,所所有有贵贵重重的的设设备备和和计计划划安安排排的的试试验验全全
部毁灭。部毁灭。
36
《《美美国国统统计计学学家家》》杂杂志志9090年年55月月期期刊刊披披露露,,事事后后
所所查查明明的的原原因因是是OO环环失失灵灵。。OO环环是是热热敏敏感感的的,,热热事事
故故和和温温度度关关系系的的散散点点图图表表明明,,温温度度足足够够高高时时,,没没
有有热热事事故故发发生生。。而而发发射射时时温温度度仅仅为为313100FF。。
令令人人难难以以置置信信的的是是,,在在寻寻找找温温度度与与事事故故的的关关系系的的
一一张张图图中中略略去去了了这这些些数数据据,,而而认认为为热热事事故故与与温温度度
之间没有关系。之间没有关系。
37
44、为品牌取一个好的名字:、为品牌取一个好的名字:
中中美美纯纯水水有有限限公公司司欲欲为为其其新新推推出出的的一一种种纯纯水水产产
品品起起一一个个合合适适的的名名字字,,为为此此专专门门委委托托了了当当地地的的策策
划咨询公司,取了一个名字划咨询公司,取了一个名字““波澜波澜””。。
一个好的名字至少应该满足两个条件:一个好的名字至少应该满足两个条件:
((11))会会使使消消费费者者联联想想到到正正确确的的产产品品““纯纯水水””
;;((22))会会使使消消费费者者产产生生与与正正确确产产品品密密切切相相关关的的联联
想,如想,如““纯净纯净””、、““清爽清爽””等。等。
38
后后来来中中美美纯纯水水有有限限公公司司委委托托调调查查统统计计研研究究所所,,进进
行行了了一一次次全全面面的的市市场场研研究究,,在在调调查查中中还还包包括括简简单单的的
名称测试。名称测试。
由由直直观观图图可可以以看看出出,,““波波澜澜””((Name5Name5))与与““洗洗
衣衣机机””((Product7Product7))产产品品相相联联系系,,引引起起的的感感觉觉是是““
兴奋兴奋””,因此,因此““波澜波澜””不是合适的纯净水品牌名称。不是合适的纯净水品牌名称。
中中美美纯纯水水公公司司的的产产品品是是““纯纯水水””((Product2Product2)),,
他他 们们 如如 果果 想想 要要 使使 该该 名名 称称 给给 人人 们们 一一 种种 ““纯纯 净净
””((Feel4Feel4))的感觉,的感觉,
39
调查的代码和含义如下:调查的代码和含义如下:
代码代码 含义含义 代码代码 含义含义 代码代码 含义含义
Name1Name1 玉泉玉泉 Product1 雪糕 Feel1Feel1 清爽清爽
Name2 雪源 Product2Product2 纯水纯水 Feel2 甘甜
Name3 春溪 Product3 碳酸饮料 Feel3 欢快
Name4 期望 Product4 果汁饮料 Feel4Feel4 纯净纯净
Name5Name5 波澜波澜 Product5 保健食品 Feel5 安闲
Name6 天山绿 Product6 空调 Feel6 个性
Name7Name7 中美纯中美纯 Product7Product7 洗衣机洗衣机 Feel7Feel7 兴奋兴奋
Name8 雪浪花 Product8 毛毯 Feel8 高档
40
那那么么““中中美美纯纯””((Name7Name7))将将是是最最好好的的商商品品名名
称称。。如如果果想想要要使使该该名名称称给给人人们们一一种种““清清爽爽
””((Feel1Feel1))的的感感觉觉,,那那么么““玉玉泉泉””((Name1Name1))
将将是是最最好好的的商商品品名名称称。。中中美美纯纯水水公公司司接接受受了了调调
查查统统计计研研究究所所的的建建议议,,没没有有用用““波波澜澜””这这个个名名
称称,,而而用用了了““中中美美纯纯””作作为为品品牌牌的的名名称称。。实实践践
证明,它的确是一个成功的品牌名称。证明,它的确是一个成功的品牌名称。
41
第
二
节
统
计
学
的
发
展
简
史
统统计计学学作作为为一一门门独独立立的的学学科科至至今今不不过过三三百百
多年的历史。多年的历史。
在在统统计计学学的的产产生生过过程程中中,,有有三三个个源源头头,,并并
形形成成了了著著名名的的三三个个学学派派::国国势势学学派派、、政政治治算算
术学派、数理统计学派术学派、数理统计学派
国国势势学学派派(( 记记述述学学派派 ))对对统统计计学学的的产产
生生和和发发展展的的影影响响主主要要体体现现在在其其名名称称和和研研究究对对
象上(即国家显著事项)。象上(即国家显著事项)。
42
1717世世纪纪中中叶叶,,德德国国的的大大学学教教授授海海门门尔尔..康康
令令在在大大学学开开设设了了一一门门新新课课程程 ““国国势势学学””,,向向
统治者提供治国之术。统治者提供治国之术。
阿阿亨亨瓦瓦尔尔继继承承和和发发展展了了康康令令的的思思想想,,认认为为
国国势势学学就就是是研研究究国国家家显显著著事事项项的的学学问问,,他他在在
其其著著作作《《近近代代欧欧洲洲各各国国国国势势学学纲纲要要》》中中首首次次
将将国国势势学学改改名名为为StatistikStatistik即即统统计计学学,,后后该该德德
语词汇被译为英文语词汇被译为英文StatisticsStatistics,,沿用至今沿用至今。
43
政治算术学派(政治算术学派(有实无名的统计学派有实无名的统计学派))::以英国以英国
人威廉人威廉..配第的《政治算术》的问世为标志。配第的《政治算术》的问世为标志。
书中采用数量对比分析的实证方法来表达其思书中采用数量对比分析的实证方法来表达其思
想和观点,为统计科学的创立奠定了方法论基础。想和观点,为统计科学的创立奠定了方法论基础。
马克思称他是马克思称他是““政治经济学之父,在某种程度上政治经济学之父,在某种程度上
也可以说是统计学的创始人也可以说是统计学的创始人””。(。(政府统计创始政府统计创始
人人))
44
政政治治算算术术学学派派的的另另一一著著名名代代表表人人物物是是英英国国
人人约约翰翰..格格朗朗特特,,他他在在16621662年年出出版版了了《《关关于于死死
亡亡表表的的自自然然观观察察与与政政治治观观察察》》一一书书。。通通过过大大量量
观观察察的的方方法法,,研研究究并并发发现现了了人人口口与与社社会会现现象象中中
重重要要的的数数量量规规律律性性,,如如新新生生儿儿的的性性别别比比例例107107
::100100、、男男性性在在各各年年龄龄组组的的死死亡亡率率均均高高于于女女性性,,
新新生生儿儿和和大大城城市市人人口口死死亡亡率率较较高高等等等等。。((人人口口
统计创始人)统计创始人)
45
数理统计学派数理统计学派 1919世纪中叶,凯特勒(比利时)世纪中叶,凯特勒(比利时)
将概率论正式引进统计学,用大数定律研究现象将概率论正式引进统计学,用大数定律研究现象
的数量规律性,提出了误差理论,丰富了统计方的数量规律性,提出了误差理论,丰富了统计方
法体系,把统计方法发展成为既可应用于自然现法体系,把统计方法发展成为既可应用于自然现
象、也可应用于社会现象的通用方法,使统计学象、也可应用于社会现象的通用方法,使统计学
产生了质的飞跃,为近代统计学奠定了基础。产生了质的飞跃,为近代统计学奠定了基础。
46
后后人人把把凯凯特特勒勒开开创创的的统统计计学学称称为为数数理理统统计计学学,,
并逐渐形成数理统计学派。并逐渐形成数理统计学派。
数数理理统统计计学学::以以概概率率论论为为基基础础,,以以抽抽样样为为核核
心心,,研研究究随随机机变变量量((不不确确定定的的量量))的的数数量量规规律律,,
是具有普遍性的纯方法论科学。是具有普遍性的纯方法论科学。
47
描述统计 推断统计
理论统计 应用统计
第
三
节
统
计
学
的
分
类
统计学的
类型
48
一、理论统计学与应用统计学一、理论统计学与应用统计学
理理论论统统计计学学是是研研究究如如何何对对数数据据进进行行搜搜集集、、整整
理理、、分分析析最最基基本本的的原原理理、、原原则则和和方方法法的的科科学学。。
是应用统计学共同的理论基础。是应用统计学共同的理论基础。
所所谓谓统统计计学学是是一一门门通通用用方方法法论论科科学学,,是是就就理理
论统计学而言。论统计学而言。
理论统计学包括描述统计学和推断统计学。理论统计学包括描述统计学和推断统计学。
49
应应用用统统计计学学是是运运用用于于某某一一特特定定领领域域的的统统计计理理论论
和方法。和方法。
应应用用统统计计学学的的不不同同分分支支所所应应用用的的基基本本方方法法都都是是
一一样样的的,,即即描描述述统统计计学学和和推推断断统统计计学学的的主主要要方方法法。。
但但由由于于各各领领域域都都有有特特殊殊性性,,统统计计方方法法在在不不同同领领域域
的的应应用用中中就就具具有有了了不不同同的的特特点点。。应应用用统统计计学学除除了了
包包括括各各领领域域通通用用的的方方法法,,也也包包括括特特定定领领域域特特有有的的
方法。方法。
50
二、描述统计学与推断统计学描述统计学与推断统计学
描述统计学描述统计学是研究对客观现象的数量特征进行是研究对客观现象的数量特征进行
计量、观察、概括、表述的基本原理、原则和方计量、观察、概括、表述的基本原理、原则和方
法的科学。法的科学。
描述统计的主要内容包括:确定所要研究现象描述统计的主要内容包括:确定所要研究现象
的数量特征、设计用来说明现象数量特征的统计的数量特征、设计用来说明现象数量特征的统计
指标、搜集和整理数据、计算统计指标并用图表指标、搜集和整理数据、计算统计指标并用图表
显示之。显示之。
所论不超出已有数据。所论不超出已有数据。
51
推推断断统统计计学学是是研研究究如如何何根根据据部部分分((样样本本))数数据据
推推断断总总体体数数量量特特征征的的方方法法的的科科学学。。根根据据样样本本所所提提
供供信信息息对对样样本本所所来来自自的的总总体体((母母体体))的的性性质质作作出出
推断,称为推断,称为统计推断统计推断
为为了了保保证证推推断断的的精精确确度度和和可可靠靠度度,,推推断断统统计计学学
需需要要研研究究样样本本的的抽抽取取方方式式方方法法、、样样本本的的大大小小、、样样
本本的的分分布布、、样样本本估估计计量量的的选选择择、、对对总总体体特特征征进进行行
估计或推断的方法、误差的计算和控制等问题。估计或推断的方法、误差的计算和控制等问题。
52
00
2525
5050
Q1Q1 Q2Q2 Q3Q3 Q4Q4
¥
xx = 30 = 30 ss22 = 105 = 105
样样
本本
总体总体
描述统计学是整个统计学的基础,
推断统计学是现代统计学的核心。
53
描述统计与推断统计的关系
反映反映
客观客观
现象现象
的数的数
据据
总体内在的总体内在的
数量规律性数量规律性
推断统计推断统计
(利用样本信息和概率(利用样本信息和概率
论对总体的数量特征进论对总体的数量特征进
行估计和检验等行估计和检验等
概率论概率论
(包括分布理论、大数定律(包括分布理论、大数定律
和中心极限定理等)和中心极限定理等)
描述统计描述统计
(统计数据的搜集、整理、(统计数据的搜集、整理、
显示和分析等)显示和分析等)
总体数据总体数据
样本数据样本数据
图图1-1 1-1 统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程
54
第
四
节
统
计
学
的
基
本
概
念
一、统计总体和总体单位
二、标志和指标
三、变异和变量
四、统计指标和统计指标体系
55
一
、
统
计
总
体
和
总
体
单
位
⒈总体:它是指客观存在的、在同一
性质基础上结合起来的许多个别事物
(单位)组成的整体。同质性是统计
总体的主要特征。
2. 总体单位:它是指构成统计总体的
个别事物。即构成总体的各个事物。
如果说统计总体是集合的概念,那
么总体单位就是集合体的元素。
56
总体
总体
单位
57
3. 总体与总体单位的相互关系
随着研究目的的不同, 总体与总体单位可以互相
转化。
如:研究一个企业的职工基本情况,则该企业的
全部职工构成总体,每一个职工是总体单位;若
研究一个城市的企业情况时,则该市所有企业是
总体,每一个企业又成为总体单位,而企业的职
工人数只是单位的标志。
58
二
、
标
志
和
指
标
1. 标志
⑴概念: 用来说明总体单位特征的
名称。
如:职工性别、工资水平等
59
⑵标志的种类
①品质标志: 表示事物质(属性)的特征,其
具体表现用文字表示。如:性别、职务、专业、
所有制类型等。
②数量标志: 表示事物量(单位数量)的特征,
其具体表现用数字表示。如:年龄、产值、身
高、体重等。
⑶标志值:是数量标志的具体表现。又称变
量值。
60
⒉统计指标
⑴概念:它是反映社会经济现象总体数量特
征的概念和具体数值。其构成主要有两部分:
指标名称:指标内容和所包括的范围,即指
标质的规定性。
指标数值:指数量的特征是指标量的规定性。
统计指标离不开数值。
61
举例:2000年我国进出口总额4700亿美元。
则名称—进出口额,
数值—4700亿美元。
62
⒊指标和标志的区别和联系
⑴区别:
①指标是说明总体数量特征的概念,而标
志是说明总体单位特征的概念。前者范围
大些, 后者的范围小些;
②指标都是用数值表示的, 而标志有的是用
数字表示, 有的是用文字表示。
③指标值是由数量标志值汇总得出来的,
而标志值则不一定通过汇总。
63
⑵联系:
许多统计指标是由各总体单位的数量标志值汇
总而来的;
指标和标志之间存在转化关系.
64
三
、
变
异
和
变
量
1.变异:统计上标志和指标都是可变的,
其具体表现各不相同,这就是变异。
标志变异可分为属性变异和数量变异。
如:性别标志分男、女;职工人数有60人、
70人等变化。
2.变量:可变的数量标志。
3.变量值:变量的具体数值。如年龄15、
16、30岁等.
65
4.变量的分类:
⑴按计数的特点分为:
①连续变量:指其数值连续不断,在相邻的两
值之间可无穷分割,表现为无穷小数。如:粮
食产量有500-600公斤,600-700公斤等
②离散变量:变量值只能表现为整数。如人口
数是270人,950人等。
66
⑵按其性质不同分:
①确定性变量:能在事先确定下来的变量。如中
奖人数等。
②随机性变量:由各种因素引起,数值随机而成,
有多种可能性,事先无法确定。如中奖号码等。
67
四
、
统
计
指
标
与
统
计
指
标
体
系
⒈统计指标的特点
⑴统计指标都能用数量表示;
⑵统计指标说明总体的综合特征;
⑶一个统计指标说明总体现象的
一个侧面。
68
⒉ 统计指标的分类
⑴按反映总体现象的内容不同, 可分为:
①数量指标: 它说明总体规模大小和数量多少。一
般用绝对数表示,其数值随总体范围大小而变化。
②质量指标: 它说明总体内部数量对比关系和一般
水平。反映现象发展程度和经济效果,其数值大
小与总体范围大小无直接关系。
69
⑵按其数值的具体表现形式不同 ,
可分为:
①总量指标:表现形式为绝对数。
②相对指标:表现形式为相对数。
③平均指标:表现形式为平均数。
数量指标用绝对数表示,质量
指标用相对数和平均数表示。
70
⒊统计指标体系
由若干个相互联系的统计指标组成的
一个整体称为统计指标体系。
例:各地区城市设施水平指标体系:
人均房屋使用面积
人均居住面积
城市人口用水普及率
城市煤气普及率
每万人拥有公共汽(电)车
人均拥有铺装道路面积
人均公共绿地面 积
每万人拥有公共厕所
71
对安徽财贸学院的学生状况进行调查
安徽财贸学院的所有学生是总体
安徽财贸学院的每一位学生是总体
单位
性别、民族是品质标志
年龄、体重、身高是数量标志,也
称变量
安徽财贸学院学生人数是数量指标
安徽财贸学院学生平均年龄、四级
通过率是质量指标
72
第
五
节
统
计
学
在
经
济
管
理
中
的
应
用
统计学
经济学
管理学
医学
工程学
社会学
工商管理工商管理
会计审计会计审计
金融学金融学…
73
统统计计学学是是一一门门关关于于数数据据的的科科学学,,只只要要研研究究和和分分析析
数数据据,,就就要要用用到到统统计计学学;;统统计计又又是是一一种种重重要要的的分分类类
手段,只要有分类的问题,就要用到统计学。手段,只要有分类的问题,就要用到统计学。
几几乎乎所所有有学学科科都都要要研研究究和和分分析析数数据据,,也也几几乎乎所所有有
学学科科都都要要进进行行分分类类,,因因而而统统计计学学与与几几乎乎所所有有学学科科都都
有或多或少的联系。有或多或少的联系。
74
统统计计学学几几乎乎可可以以用用于于一一切切领领域域,,各各种种事事物物所所具具
有有的的内内在在数数量量规规律律性性都都可可以以借借助助统统计计方方法法加加以以探探
索。索。
但但统统计计方方法法只只是是帮帮助助其其他他学学科科探探索索内内在在的的数数量量
规规律律性性,,而而这这种种数数量量规规律律性性的的解解释释((和和由由数数量量规规
律律性性进进而而研研究究各各学学科科内内在在的的规规律律))只只能能由由各各学学科科
的研究完成。的研究完成。
75
泰罗在伯利恒钢铁厂当工程师时,发现装卸工在泰罗在伯利恒钢铁厂当工程师时,发现装卸工在
装卸货物时,都使用同样大小和样式的铁铲,这样装卸货物时,都使用同样大小和样式的铁铲,这样
效率很低,一个工人平均每天只能装卸效率很低,一个工人平均每天只能装卸1616吨货物。吨货物。
泰罗挑选了一批标准体力的工人进行实验。发现每泰罗挑选了一批标准体力的工人进行实验。发现每
铲的重量约为铲的重量约为2121磅时,效率最高。故建议工厂应根磅时,效率最高。故建议工厂应根
据装卸不同的货物使用不同大小和形状的铁铲,目据装卸不同的货物使用不同大小和形状的铁铲,目
的是使每铲的重量达到的是使每铲的重量达到2121磅。同时他建议合理安排磅。同时他建议合理安排
休息时间,并相应提高工人工资。这样一来,实验休息时间,并相应提高工人工资。这样一来,实验
组的工人每天能完成组的工人每天能完成5959吨的工作量。吨的工作量。
泰罗铁铲的实验
76
淘米 洗菜 煮饭
29分钟
切菜 炒菜
淘米 煮饭
22分钟
洗菜 切菜 炒菜
2分钟 7分钟 20分钟
3分钟 9分钟
2分钟 20分钟
7分钟 3分钟 9分钟
生活中的系统工程
77
统计在商务和经济中的应用
11、会计、会计 会计师事务所在对其客户进行审计时要会计师事务所在对其客户进行审计时要
使用统计抽样程序。例如,一个事务所想确定列使用统计抽样程序。例如,一个事务所想确定列
示在客户资产负债表上的应收帐款金额是否公正示在客户资产负债表上的应收帐款金额是否公正
地反映了应收帐款的实际金额,而应收帐款的数地反映了应收帐款的实际金额,而应收帐款的数
量是如此之大,查看和验证每一帐户要花费太多量是如此之大,查看和验证每一帐户要花费太多
的时间和费用。审计人员从帐户中选择一个子集的时间和费用。审计人员从帐户中选择一个子集
作为样本,以样本帐户的准确性判断列示在客户作为样本,以样本帐户的准确性判断列示在客户
资产负债表上的应收帐款金额是否可以接受。资产负债表上的应收帐款金额是否可以接受。
78
22、财务、财务 财务顾问利用各种各样的统计信息了财务顾问利用各种各样的统计信息了
解、指导他们的投资建议。在股票例子中,通过对解、指导他们的投资建议。在股票例子中,通过对
比单个股票的信息和股票市场平均状况信息,可以比单个股票的信息和股票市场平均状况信息,可以
得出单个股票的价值高估还是低估的结论。得出单个股票的价值高估还是低估的结论。
79
33、、市市场场 零零售售结结帐帐柜柜台台的的电电子子扫扫描描盘盘正正用用
于于收收集集各各种种市市场场调调研研应应用用的的数数据据。。数数据据供供应应商商和和信信
息息资资源源公公司司从从零零售售店店购购买买POSPOS扫扫描描数数据据,,处处理理数数据据,,
然然后后向向制制造造商商出出售售数数据据的的统统计计摘摘要要。。在在19961996年年,,制制
造造商商为为取取得得这这类类扫扫描描数数据据,,每每一一类类产产品品平平均均花花费费
387325387325美美元元((有有助助于于为为各各类类产产品品建建立立未未来来的的市市场场战战
略;还可分析促销和销售额之间的关系)。略;还可分析促销和销售额之间的关系)。
80
44、、生生产产 各各种种统统计计质质量量控控制制图图用用于于监监测测生生
产产过过程程的的产产出出。。((例例如如,,xx条条形形图图监监测测平平均均产产
出出,,监监测测填填充充饮饮料料过过量量或或不不足足,,修修正正生生产产过过
程)。程)。
55、、经经济济 例例如如预预测测通通货货膨膨胀胀率率,,需需要要了了解解
生产价格指数、失业率、生产能力利用等。生产价格指数、失业率、生产能力利用等。
——2121世世纪纪管管理理经经典典教教材材系系列列
经济教材译丛经济教材译丛. . 美《商务与经济统计》美《商务与经济统计》
81
Thank you very
much!
82