PHARMACOECONOMIC
S
徐州医学院卫生事业管理学教研室
谷玉明
研究设计与描述统计研究设计与描述统计 59-徐州医学院卫生事业管理教研室徐州医学院卫生
事业管理教研室
教学要求
了解:调查设计
熟悉:研究设计的基本内容
掌握:研究设计的基本原则,统计中的
几个基本概念、计量资料的描述
指标、计数资料的描述指标。
10/30/2022 2徐州医学院卫生事业管理教研室
第一节 研究设计
(一)确定研究目标
研究目标可分为总目标与具体
目标。总目标是描述研究期望得到
的总结果;具体目标是描述研究的
某一步骤或某一方面期望得到的具
体结果。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 3徐州医学院卫生事业管理教研室
第一节 研究设计
(二)确定研究对象
研究对象是根据研究目标而定
的,在临床研究中患者的入组条件
要具体,如病种、病情、年龄等。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 4徐州医学院卫生事业管理教研室
第一节 研究设计
(三)确定研究对象的数量
观察数量太少,很难得到确切
结果,数量太多也是浪费,同时影
响工作质量。最佳数量应通过统计
学的计算来确定。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 5徐州医学院卫生事业管理教研室
第一节 研究设计
(四)确定观察指标
可分为客观指标和主观指标,
客观指标是可以测量的,主观指标
是个人的感觉与反映。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 6徐州医学院卫生事业管理教研室
第一节 研究设计
(五)设立适当的对照
只有通过对照,才能凸显出试
验研究的处理因素或干预措施的效
果。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 7徐州医学院卫生事业管理教研室
第一节 研究设计
(六)随机化分组
是指每个研究对象被到各组的
概率是相等的,而不是有意或无意
地按某种倾向把研究对象分配到对
照组或试验组。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 8徐州医学院卫生事业管理教研室
第一节 研究设计
(七)制定完备的原始记录表
在临床研究中,哪些项目应该
记录需要仔细考虑。记录表中应包
括检查和核对时所需要的项目。也
应该包括研究分析用的项目。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 9徐州医学院卫生事业管理教研室
第一节 研究设计
(八)考虑统计分析方法
在研究设计中要考虑到最后资
料分析时所需要的统计分析方法,
据此对搜集资料的方法与内容提出
进一步的要求。
一.
研
究
设
计
的
基
本
内
容
10/30/2022 10徐州医学院卫生事业管理教研室
(一)研究设计的基本要素
第一节 研究设计
二.
基
本
原
则
与
方
法
1、处理因素( treatment factor )
2、受试对象( subject )
3、试验效应( experimental effect )
降压药 高血压病人 血压值
处理因素 受试对象 实验效应
其他因素 其他效应
10/30/2022 11徐州医学院卫生事业管理教研室
(一)研究设计的基本要素
第一节 研究设计
二.
基
本
原
则
与
方
法
例:药剂、手术方法、毒物
确定处理因素的注意事项:
(1)抓住实验中的主要因素
(2)明确处理因素和非处理因素
(3)处理因素必须标准化
1、处理因素( treatment factor )
10/30/2022 12徐州医学院卫生事业管理教研室
(一)研究设计的基本要素
第一节 研究设计
二.
基
本
原
则
与
方
法
2、受试对象( subject )
例:人、动物
(1)受试对象的选入标准
明确规定受试对象选入标准、纳入标准、排除标准
(2)受试对象的控制
受试对象的一致性、受试对象影响因素的控制
10/30/2022 13徐州医学院卫生事业管理教研室
(一)研究设计的基本要素
第一节 研究设计
二.
基
本
原
则
与
方
法
3、实验效应(experimental effect)
处理因素作用于受试对象的结果,通过观察指
标表达。观察指标应客观、精确。
(1) 客观性:主观指标和客观指标。
(2) 精确性:准确度(accuracy)和精密度
(precision)
10/30/2022 14徐州医学院卫生事业管理教研室
(一)研究设计的基本要素
第一节 研究设计
二.
基
本
原
则
与
方
法
准确度与精密度
10/30/2022 15徐州医学院卫生事业管理教研室
(二)研究设计的原则
1、对照(control)原则
目的在于使处理因素和非处理因素
的差异有一个科学的对比。
对照有空白对照、试验对照、标准
对照、自身对照、相互对照、历史对照。
第一节 研究设计
二.
基
本
原
则
与
方
法
10/30/2022 16徐州医学院卫生事业管理教研室
(二)研究设计的原则
2、重复(replication)原则
指各处理组的试验单位都有一定的
数量,即考虑到样本含量的大小。
第一节 研究设计
二.
基
本
原
则
与
方
法
10/30/2022 17徐州医学院卫生事业管理教研室
(二)研究设计的原则
3、随机化(randomization)原则
第一节 研究设计
二.
基
本
原
则
与
方
法
随机分组:每个受试对象以机会均等的原
则被随机地分配到各个处理组中。
随机抽样:总体中每一个观察单位以机会
均等的可能性被抽取。
10/30/2022 18徐州医学院卫生事业管理教研室
(三)几种常见的研究设计方法
1、完全随机设计(completely random
design)
将观察单位完全随机地分配到实验
组与对照组或几个对比组中去。
第一节 研究设计
二.
基
本
原
则
与
方
法
10/30/2022 19徐州医学院卫生事业管理教研室
(三)几种常见的研究设计方法
2、配对设计(paired design)
配对实验设计的两种情况:
(1)同源配对:同一受试对象用两种不同
的实验方法;受试对象自身实验前后的
对比 。
(2)非同源配对:将具有相同条件的实验
对象配成对子。
第一节 研究设计
二.
基
本
原
则
与
方
法
10/30/2022 20徐州医学院卫生事业管理教研室
(三)几种常见的研究设计方法
3、随机区组设计(randomized block
design)
(1)将多方面条件相近的受试对象配成一组,称作一
个区组(block)。
(2)每个区组的受试对象个数 取决于 对比组组数。
(3) 每个区组的受试对象被随机地分配到各对比组中。
配对设计的扩展,故又称配伍组设计配对设计的扩展,故又称配伍组设计
第一节 研究设计
二.
基
本
原
则
与
方
法
10/30/2022 21徐州医学院卫生事业管理教研室
(三)几种常见的研究设计方法
4、盲法设计
是指在试验结束前,患者和执行的
医务人员都不知道谁被分配在试验组或
对照组,这样可以避免来自患者和医务
人员两方面的偏性。
第一节 研究设计
二.
基
本
原
则
与
方
法
10/30/2022 22徐州医学院卫生事业管理教研室
(一)调查计划
1、确定调查项目和调查表
2、搜集原始资料的方式
3、制定调查的组织计划
第一节 研究设计
三.
调
查
设
计
10/30/2022 23徐州医学院卫生事业管理教研室
(二)调查方法
1、普查(census)
2、抽样调查(sampling survey)
3、典型调查
4、病例对照研究(case-control
study)
5、定群研究(cohort study)
第一节 研究设计
三.
调
查
设
计
10/30/2022 24徐州医学院卫生事业管理教研室
(三)基本抽样方法
1. 单纯随机抽样 (simple random
sampling)
2. 系统抽样 ( systematic sampling )
3.分层抽样( stratified sampling )
4.整群抽样 ( cluster sampling )
第一节 研究设计
三.
调
查
设
计
10/30/2022 25徐州医学院卫生事业管理教研室
1、总体与样本
population
and sample
总体:根据研究目的确
定的同质研究对象的全
体(集合)。分有限总
体与无限总体。
样本:从总体中随机抽
取的一部分有代表性观
察单位。
第二节 描述统计
一
、
基
本
概
念
10/30/2022 26徐州医学院卫生事业管理教研室
2、随机抽样 random sampling
为了保证样本的可
靠性和代表性,需
要采用随机的抽样
方法(在总体中每
个个体具有相同的
机会被抽到)。
抽样研究的目的是用样本推断总体。
第二节 描述统计
一
、
基
本
概
念
10/30/2022 27徐州医学院卫生事业管理教研室
3.资料类型
用仪器、工具等测量方法获
得的数据,即为计量资料
(measurment data)。也叫定
量数据。
特点:有计量单位,如患者的身高(cm)、体重(kg)、血
压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)
计量资料
第二节 描述统计
一
、
基
本
概
念
10/30/2022 28徐州医学院卫生事业管理教研室
计数资料
按某种属性分类,然后清点
每类的数据,称计数资料
(count data)。也叫定性数
据。
特点:无固有计量单位,如肤色(黑、白)、血型
(ABO)、职业(工农兵)、性别(男女)
第二节 描述统计
一
、
基
本
概
念
10/30/2022 29徐州医学院卫生事业管理教研室
等级资料
按某种属性的不同程度分成等级后分组计数,
汇总各组观察单位数得到的资料为等级资料
(ranked data)。有大小顺序,所以也叫有序
分类资料。
①癌症分期:早、中、晚。
②药物疗效:治愈、好转、无效、死亡。
③尿蛋白: ±,+,++,+++及以上
第二节 描述统计
一
、
基
本
概
念
10/30/2022 30徐州医学院卫生事业管理教研室
三类资料间关系
例:一组20~40岁成年人的血压
<8 低血压
8 正常血压
12 轻度高血压
15 中度高血压
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例数
计量资料
等
级
资
料
计数资料
第二节 描述统计
一
、
基
本
概
念
10/30/2022 31徐州医学院卫生事业管理教研室
4、参数与统计量 parameter and statistic
参数:总体的统计指标,
如总体均数、标准差,
采用希腊字母分别记为
μ、σ。
总体 样本
抽取部分观察单位
统计量统计量
参参 数数
统计量:样本的统计指标,如样本均数、标准差,采
用拉丁字母分别记为 。
推断
第二节 描述统计
一
、
基
本
概
念
10/30/2022 32徐州医学院卫生事业管理教研室
5、频率与概率
(1)频率 (frequency)
样本的实际发生率称为频率。设在相同条
件下,独立重复进行n次试验,事件A出现f
次,则事件A出现的频率为f /n。
医疗工作中所说的发病率、死亡率、治愈
率等都是频率。显然,频率具有如下性质:
0≤f(A)≤1
第二节 描述统计
一
、
基
本
概
念
10/30/2022 33徐州医学院卫生事业管理教研室
(2)概率(probability)
是描述随机事件发生的可能性大小的数值。
(1)必然事件: P(A)=1
(2)不可能事件: P(A)=0
(3)随机事件(偶然事件):0<P(A)<1
(4)小概率事件:P≤ 或 P≤小概率
事件,统计学(习惯)上认为不大可能发生。
第二节 描述统计
一
、
基
本
概
念
10/30/2022 34徐州医学院卫生事业管理教研室
6、误差 error
误差:实际观察值与客观真实值之差
(1)系统误差
(systematic error)
(2)随机误差
(random error)
第二节 描述统计
一
、
基
本
概
念
10/30/2022 35徐州医学院卫生事业管理教研室
在实际观测过程中,由受试对象、研究者、仪
器设备、研究方法、非实验因素影响等原因造成的
有一定倾向性或规律性的误差。流行病学称之为偏
倚(bias)。
特点:观察值有系统性、方向性、周期性的偏离
真值。
可以通过严格的实验设计和技术措施消除。
1、系统误差
第二节 描述统计
一
、
基
本
概
念
10/30/2022 36徐州医学院卫生事业管理教研室
2、随机误差
排除上述误差后尚存的误差,受多种无法控制
的因素的影响。
特点:大小方向不一的随机变化。
随机测量误差
——提高操作者熟练程度可以减少这种误差。
随机抽样误差:由抽样造成的样本统计量和总体
参数间的差异。
——不可避免,但有一定的分布规律,可估计。
第二节 描述统计
一
、
基
本
概
念
10/30/2022 37徐州医学院卫生事业管理教研室
计
量
资
料
的
描
述
计量资料的
特征
均数
几何均数
中位数
众数
调和均数
集中趋势
全距
四分位间距
方差
标准差
变异系数
离散趋势
偏度系数
分布形状
峰度系数
第二节 描述统计
10/30/2022 38徐州医学院卫生事业管理教研室
一、算术均 数(均数) Mean
意义:均数是描述一组数据的集中趋势(Central
Tendency)或平均水平的最常用统计指标。用符
号 表示样本均数,μ表示总体均数。
计算:
1、直接法(基于原始数据)
2、加权法(基于频数表)
10/30/2022 39徐州医学院卫生事业管理教研室
组段 组中值(X0) f fX0
(1) (2) (3) (4)=(2)(3)
6~ 7 1 7
8~ 9 3 27
10~ 11 6 66
12~ 13 8 104
14~ 15 12 180
16~ 17 20 340
18~ 19(Xc) 27 513
20~ 21 18 378
22~ 23 12 276
24~ 25 8 200
26~ 27 4 108
28~30 29 1 29
合计 120 2228
表5-1 加权法计算均数
x0=(组段上限+组段下限)/2
d fd
-6 -6
-5 -15
-4 -24
-3 -24
-2 -24
-1 -20
0 0
1 18
2 24
3 24
4 16
5 5
6 -
26
一、算术均 数(均数) Mean
例5-1
抽样调
查某地
120名
18岁
~35岁
健康男
性血清
铁含量
,见右
表,试
计算均
数。
10/30/2022 40徐州医学院卫生事业管理教研室
本例
(μmol/L)
简捷法
(μmol/L)
适用条件:适用于对称分布资料,尤其是正态或近似正态
分布资料。
10/30/2022 41徐州医学院卫生事业管理教研室
二、中位数 Median
意义:是反映一组数据集中趋势的位置指标,
在全部实测值中有一半数值比它小,有
一半数值比它大。常用符号M表示。
百分位数常用符号Px表示,是排序后的
全部实测值的某百等份分割值,即在全
部实测值有X%个数值比它小,1-X%个
数值比它大,中位数就是一个特定的百
分位数,即M=P50。
10/30/2022 42徐州医学院卫生事业管理教研室
计算:中位数为全部实测值排序后的中间数值
或中间两个数值的算术均数。
1、直接法(基于原始数据)
如果 n 是奇数, 即为序列的中间值
如果 n 是偶数, 则为两个中间值的均值
二、中位数 Median
10/30/2022 43徐州医学院卫生事业管理教研室
2、内插法
(基于频
数表)
为Px所在组
的下限
为该组段
的频数
为该组段
的组距
为总频数
为该组段之前
的累计频数
二、中位数 Median
10/30/2022 44徐州医学院卫生事业管理教研室
表5-2 某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)
组段 频数 频率 累计频数 累计频率
(1) (3) (4) (5) (6)
6~ 1 1
8~ 3 4
10~ 6 10
12~ 8 18
14~ 12 30
16~ 20 50(fL)
18~(L) 27(fM) 77
20~ 18 95
22~ 12 107
24~ 8 115
26~ 4 119
28~30 1 120
120 100
二、中位数 Median
10/30/2022 45徐州医学院卫生事业管理教研室
适用条件:资料不限,但最常用于非对称分布资
料。
二、中位数 Median
10/30/2022 46徐州医学院卫生事业管理教研室
三、方差 Variance
意义:若要克服极差和四分位数间距不能反
映每个观察值之间的离散情况的缺点,就
必须全面考虑到每个观察值。
结果虽不为0,
但又受观察例数影响。因此可取离均差平
方和的均值,简称方差或均方。总体方差用
σ2表示,样本方差用S2表示。
10/30/2022 47徐州医学院卫生事业管理教研室
计算:
总体方差
样本方差
自由度(degrees
of freedom)
从频数表计
算样本方差
三、方差 Variance
10/30/2022 48徐州医学院卫生事业管理教研室
四、标准差 Standard Deviation
意义:标准差是方差的算术平方根,度量单位与
原变量一致。与方差一样只取正值。二者都反映
总体中观察值之间的变异程度,数值越小,变异
程度越小;反之亦然。
计算:
总体标准差
样本标准差
适用条件:适用于对称分布资料,尤其是正态
或近似正态分布资料。
10/30/2022 49徐州医学院卫生事业管理教研室
标准差计算示例一
X X2
78 6084
91 8281
79 6241
96 9216
78 6084
72 5184
81 6561
68 4624
76 5776
73 5329
792 63380
某大学《药物经济学》抽考成绩
可用SPSS、SAS、
PEMS等软件计算
10/30/2022 50徐州医学院卫生事业管理教研室
标准差计算示例二
组段 X0 f fX0 fX0X0
(1) (2) (3) (4)=(2)
(3)
(5)=(2)
(4)
6~ 7 1 7 49
8~ 9 3 27 243
10~ 11 6 66 726
12~ 13 8 104 1352
14~ 15 12 180 2700
16~ 17 20 340 5780
18~ 19 27 513 9747
20~ 21 18 378 7938
22~ 23 12 276 6348
24~ 25 8 200 5000
26~ 27 4 108 2916
28~30
29 1 29 841
合计 120 2228 43640
表5-3 频数表法计算标准差
可用SPSS、SAS、
PEMS等软件计算
10/30/2022 51徐州医学院卫生事业管理教研室
第一节 常用相对数
计数资料的描述性指标主要是相
对数,即两个有联系指标之比,常用的
有率、构成比、相对比。
第二节 描述统计
计
数
资
料
的
描
述
10/30/2022 52徐州医学院卫生事业管理教研室
第一节 常用相对数
意义:说明某现象发生的频率或强度。常以百分率
(%)、千分率(‰)、万分率(1/万)、十万分率
(1/10万)等表示。
计算:
某时期内发生某现象的观察单位数
率= ×比例基数
同期可能发生某现象的观察单位总数
比例基数的选择主要根据习惯用法和
使计算的结果能保留1~2位整数。
第二节 描述统计
一
率
10/30/2022 53徐州医学院卫生事业管理教研室
例例5-5 5-5 某医院某医院19981998年在某城区随机调年在某城区随机调
查了查了85898589例例6060岁及以上老人,体检发岁及以上老人,体检发
现高血压患者为现高血压患者为28232823例,高血压患病率例,高血压患病率
为为:
2823/8589×100%=%2823/8589×100%=%
一
率
第二节 描述统计
10/30/2022 54徐州医学院卫生事业管理教研室
意义:表示事物内部某一部分的个体数与该事物
各部分个体总和之比,用来说明各构成部分在
总体中所占的比重或分布,又称构成比,通常
以100%为比例基数。
计算:
某一组成部分的观察单位数
构成比= ×100%
同一事物各组成部分的观察单位总数
二
构
成
比
第二节 描述统计
10/30/2022 55徐州医学院卫生事业管理教研室
疾病构成
1990年 1998年
死亡人数 构成比(%) 死亡人数 构成比(%)
恶性肿瘤 58 40
循环系统 44 44
呼吸系统 37 29
消化系统 19 18
传 染 病 32 18
合计 190 149
表5-5 某医院90年和98年住院病人五种疾病死亡情况
构成比特点:
1、说明同事物的k个构成比的总和应为100%。
2、某一部分比重变化会影响其它部分的比重。
二
构
成
比
第二节 描述统计
10/30/2022 56徐州医学院卫生事业管理教研室
意义:相对比简称比,是两个有关指标之比,说明两
指标间的比例关系。两指标可以是性质相同的,也
可以是性质不同的,但互不包含。通常以倍数或百
分数(%)表示。
计算:
相对比=甲指标/乙指标(%)
当甲指标>乙指标用倍数表示,
甲指标<乙指标用百分数表示。
常用的有每千人口医生数、医院门诊人次与病
床比、性别比等。
三
相
对
比
第二节 描述统计
10/30/2022 57徐州医学院卫生事业管理教研室
1、构成比不能代替率。
2、计算相对数应有足够数量。
3、正确计算合并率,对分组资料计算合并率(平
均率),不能简单地由各组率相加求平均而得,
需用合计的有关实际数计算。
4、注意资料的可比性,在比较相对数时,除了比
较因素外,其余的影响因素应尽可能相同。
5、样本率(或构成比)也有抽样误差,下结论时
应进行参数估计和假设检验。
四
应
用
相
对
数
的
注
意
事
项
第二节 描述统计
10/30/2022 58徐州医学院卫生事业管理教研室
徐州医学院卫生事业管理学教研室
联系电话:联系电话:13382653368 1395229818813382653368 13952298188
Email:13382653368@:13382653368@
10/30/2022 59徐州医学院卫生事业管理教研室