T
J
Y
J
C
统计与决策
2007年第5期(总第237期)
一种基于 的统计决策方法
■高培旺 周 艺
模糊数排序
在一些系统评估和决策问题中,系
统信息来源于抽样调查的统计数据,这
样的信息相对于整体来说,是不完全、不
确定的,其定量刻划应该是模糊的。本文
引入了基于模糊隶属度的模糊数来表示
所获得的系统信息,然后根据模糊数的
比较关系,对系统信息进行综合处理,给
出排序,由此对系统选择方案作出更加
切合实际的评估和决策。
一、问题描述及分析
考虑 n种供选择评估的同类产品方
案:S1,S2,⋯,Sn,评估因素有 m个:F1,F2,
⋯,Fm,现采用抽样统计的评估方法,从
某个整体中随机挑选有代表性的人员 t
个对所有产品按不同因素进行优劣评
分,用[0,1]区间的一个数或子区间表
示,分值越高,评价也越高。不妨设第 i
个人对产品 Sj在因素 Fk下的评分为 pijk
(i=1,2,...,t5 j=1,2,...,n5 k=1,2,...,m),根据
这些信息,对这 n种产品进行综合评估
及决策。
在这个问题中,评分区间[0,1]是一
个论域 U,它表示某种产品在不同因素
评价中的优劣程度的定量范围。考察评
价结果“好”,这是 U上的一个模糊集,
用A表示。我们规定,A中的元素取值越
大,意味着评价“越好”。现在,我们根据
抽样调查的评分统计结果,确定模糊集
A的模糊隶属度A(x)。
将论域 U=[0,1]划分为 r个典型的
互不相交的小区间 δi(i=1,2,⋯,r),满足
r
i=1
"δi=U,要求有一个且只有一个小区间
包含评估人员的评分值 pijk,不妨设评分
值选在小区间 δi上的评估人员有ti(i=1,
2,...,r)人,则 ti/t可表示为 δi对于 A
的隶属频率。如果将抽样调查的统计试
验无限做下去,隶属频率将稳定在某一
个值Ai处,这个稳定值Ai就是 δi对于 A
的隶属度。当然,这样做是不现实的。为
此,我们只要设计出合适的抽样调查方
案,包括明确考察的整体、抽样方法、抽
样子样及容量等等,做好抽样试验,就能
得到符合实际的抽样结果。这样只需通
过几次试验的观察分析,就可选择一个
适当的隶属频率作为隶属度。由于隶属
函数 A(x)是论域 U上的连续函数,根据
问题的实际情况,模糊集 A应该是一个
凸模糊集,为此我们选择满足上述要求
的函数类来近似反映隶属函数 A(x)的分
布特征。以小区间 δi的中点 xi为节点,
则可取得 r组对隶属函数 A(x)的拟合数
据点
(xi,
ti
t
)(i=1,2,...,r) (1)
根据(1)画出散点图进行观察,假设
符合散点图总体特征的函数类是 Gam-
ma分布函数类
φ(x)=xkeλx+a (0≤x≤1) (2)
其中a,λ,k为拟合系数。对上式两
边取对数,将其转换为线性拟合曲线
lnφ(x)=a+λx+klnx (0≤x≤1) (3)
采用线性最小二乘法将式(3)拟合数
据点(1),则拟合系数 a,λ,k满足正规方
程
(φ0,φ0)(φ1,φ0)(φ2,φ0)
(φ0,φ1)(φ1,φ1)(φ2,φ1)
(φ0,φ2)(φ1,φ2)(φ2,φ2
%
&&
’
(
))
*)
a
λ
%
&&
’
(
))
*k
=
(A,φ0)
(A,φ1)
(A,φ2
%
&&
’
(
))
*)
(4)
这里,φ0(x)=1,φ1(x)=x,φ2(x)=lnx为基函数,
且,(φi,φj)=
r
k=1
+wkφi(xk)φj(xk),(A,φj)=
r
k=1
+wkA
(xk)φj(xk)(i=0,1,2,3,j=0,1,2,3),w1,
w2,...,wr是 r组拟合数据点(1)的权重。
如未特别说明,所有权重置为1。
将方程组(4)的解代入(2)中,即可确
定凸模糊集 A的一个近似隶属函数 φ
(x),由此我们还可通过计算事后标准误
差
SE= 1
r
r
i=1
+[ti
t
-φ(xi)]
2, (5)
来进行曲线拟合优度分析,以选择更合
适的拟合函数类型。
一旦确定了隶属函数 A(x),A就成
为论域 U上的一个模糊数,它在 λ(0≤
λ<1)水平下的截集Aλ是一个区间数。
二、模糊数的比较与系统决策
由于模糊数在 λ(0≤λ<1)水平下的
截集都是区间数,因此,模糊数的比较最
终要转化为区间数的排序关系。我们给
出如下的定义:
定义 1 设[a,b],[c,d]为两个区间
数,若 c>b,则称区间数[c,d]大于[a,b],
记作[c,d]>[a,b]或[a,b]<[c,d]。
定义 2 若两个区间[a,b]和[c,d]
的交集不空,即有[a,b]∩[c,d]≠%,则称
这两个区间数是互相关联的,此时,定义
P([a,b]≤[c,d])=maxT0,1-max(0,b-c)
d-a
U
为区间数[a,b]≤[c,d]的可能(信)度。若
有 n+1个区间数[c,d]和[ai,bi](i=1,2,⋯ ,
n),记 P([ai,bi]≤[c,d])=αi,则称 α=min
Tα1,α2,⋯,αnU为[c,d]是所有区间数中的
最大区间数的可能度。
区间数比较的可能度具有下述性
质。
性质 1 若 P([a,b]≤[c,d])=P([a,
b]≥[c,d]),则 P([a,b]≤[c,d])=P([a,b]
≥[c,d])=,且两个区间数相等,记作
[a,b]≤[c,d]。
性质 2 若 b≤c,则 P([a,b]≤[c,
d])=1;若a≥d,则P([a,b]≤[c,d])=0。
性质 3 P([a,b]≤[c,d])+P([a,b]
≥[c,d])=1。
根据上述区间数大小关系的定义及
性质,给定置信水平 λ,我们可以对 n种
产品在某个因素下的模糊数Ai(i=1,2,⋯
,n)的 λ截集 Aiλ进行比较、排序。显然,
Aiλ越大,对应的产品在某个评价因素下
的评价就“越高”。注意到我们所讨论的
问题是多因素评价,因此,我们必须对所
有的因素进行综合评估。设产品i在第j
个评价因素下对应的模糊数为 Aij(i=1,2,
⋯ ,n5 j=1,2,⋯ ,m),其 λ截集为 Aijλ,令
Ri=(Ai1λ,Ai2λ,⋯ ,Aimλ),对 m个评价因
素赋予不同的权重 ρj(j=1,2,⋯ ,m),则
根据区间数的加、乘运算法则,可计算产
品i的综合评价区间数为
Aiλ=Ri·ρ(i=1,2,⋯,n) (5)
其中,ρ=(ρ1,ρ2,⋯ ,ρm)T。
将Aiλ按从大到小的顺序进行排列,
如果是相互关联的,则按可能度的大小
排列。不妨设有
JUECECANKAO决策参考
31
T
J
Y
J
C
统计与决策
2007年第5期(总第237期)
Ai1λ≥Ai2λ≥⋯≥Ainλ (6)
据此,我们可在(置信水平下作出决
策:Ai1λ=max1≤i≤n
Aiλ对应的产品 i1应该是评
价“最好”的。根据决策人的资源状况,应
选择 Aiλ在(5)中排序最前(大)的一种或
几种相应产品进行投资生产。
三、应用
某公司新设计三种类型 (A、B、C)的
服装,现需要进行销售前景的预测评估,
以便决策生产哪(几)种类型的产品。考虑
三种基本因素(F1、F2、F3),其中,F1代表花
色式样的受欢迎程度,F2代表耐穿程度,
F3代表价格的合理性。现随机抽取有代
表性的 10位顾客对每种类型的产品进
行评分(分值可以是区间[0,1]内的数,也
可以是其中的一个小区间),对 A、B、C
型的评分结果分别于表1、2、3所示。
首先,对上述三种服装类型的评分
值进行适当分组,其中 A型服装在因素
F1下的评分分组结果见表4。
由此我们得到 5个离散数据点:
(,),(,),(,),
(,),(,)。这些离散数据
点的总体分布特征基本符合 Gamma分
布函数类。于是,以(3)式按线性最小二乘
法拟合这些离散数据点,得到 A型服装
在因素F1下评估的近似模糊数为
A11(x)≈+(0≤x≤1)
其图形如图1所示。可见,这确实是
一个凸模糊集且拟合效果较好。现取置
信水平 λ=进行决策,则所有评估人
员对 A型服装在因素 F1下的评分为区
间数[,]。
类似地,根据表 1-3中的评分值,分
组后得到的离散数据点的分布特征也大
致符合Gamma分布函数类。由此我们可
以分别得到 A、B、C型服装在因素 F1、
F2、F3下评估的近似模糊数为(0≤x≤1):
A12(x)≈+
A13(x)≈+
A21(x)≈+
A23(x)≈+
A31(x)≈+197
A32(x)≈+
A33(x)≈+
这些拟合函数的拟合效果都比较好,即
SE都较小,
其中,φ12(x)
=+
的 拟 合
状 况 见 图
2。它们在域
值 λ=
下的截集分
别是区间数
[,
],
[,
],
[,
],[,
],[, ],[, ],[,
],[,]。若取三个因素的权重
向量为 ρ=(,,),则对 A型服装
的综合评分为
R1·ρ=[,]×+[,]×
+[,]×=[,]
对B型服装的综合评分为
R2·ρ=[,]×+[,]×+
[,]×=[,]
对C型服装的综合评分为
R3·ρ=[,]×+[,]×+
[,]×=[,]
由 于 P ([,]≤[,
])=maxH0,1-max(0,)
I
≈<,最后,根据区间数比较关系
的定义及性质,可得
[,]>[,]>[,
]
据上述区间数的排序关系,在置信
水平 λ=下可作出决策:A型服装最
受欢迎,应优先开发生产;在资金许可的
前提下,可依次选择 C型服装,B型服装
进行开发。
四、结束语
关于置信水平 λ的选取,应根据 λ
的意义来结合实际要求。λ越大,当然
Aijλ截集 Aij(隶属于 Aij的程度就越高,但
同 时 包 含
评 估 人 员
的 范 围 变
小了,一些
评 估 人 员
的 评 估 结
果 也 许 会
由 此 被
“截”掉。另外,评分统计数据及其分组情
况对隶属函数 A(x)的分布特征有很大的
影响。由于在统计数据(1)中,节点是以小
区间 δi的中点 xi作代表的,因此,在分
组过程中应控制每个小区间 δi的长度不
能太大。总之,如何适当地选取置信水平
λ,怎样确定并剔除明显不符合 A(x)分布
特征的统计数据,以及近似隶属函数类
型的选取等都是值得认真思考的问题。
(作者单位/广西财经学院金融系)
(责任编辑/浩天)
表1 对A型服装的评分
F1 [,] [,] [,]
F2 [,] [,] [,]
F3 [,]
表2 对B型服装的评分
F1 [,]
F2 [,]
F3 [,] [,]
表3 对C型服装的评分
F1 [,] [,]
F2 [,]
F3 [,]
表4 对A型服装在因素F1下的评分分组
分组结果 [0,] (,] (,] (,] (,)
评分人数ti 0 1 4 5 0
图1 服装类型A在因素F1下的模糊数图 2 服装类型A在因素F2下的模糊数
JUECECANKAO决策参考
32