基金项目: 教育部博士学科点专项科研基金资助项目:心理动态特征及性格机器人基础研究(20010007016)
基于脑信息特征人才选拔的决策模型
毕路拯 1,李志祥 2,吴平东 1, 刘莹 2, 陈冬冰 1,王刚 2
(1.北京理工大学机械与车辆工程学院, 北京 100081
2.北京理工大学经济与管理学院,北京 100081)
摘要:本文对脑信息特征和它的宏观检测方法进行了介绍,并以管理人员和技术人员选拔为例介绍了基于脑
信息特征的人才选拔的决策模型的确定方法。首先通过脑信息处理宏观检测方法得到管理人员和技术人员
表征脑信息特征的数据,根据这些数据利用基于统计学习理论的支持向量机的方法建立了基于脑信息特征
的管理人员和技术人员选拔的决策模型。并对决策模型进行了改进提出了结合专家经验的人才选拔方法。
实验分析表明该模型和选拔方法是可行的。这为人才选拔方面的研究提供了一种新的研究思路。
关键词: 脑信息特征; 支持向量机;决策模型;人才选拔
Decision Model of Personnel Selection Based on Brain Information Trait
BI Lu-zheng1, LI Zhi-xiang2,WU Ping-dong1,Liu Ying2 ,Chen Dong-bing1,Wang Gang2
(1 School of Mechanical and Vehicle Engineering, Beijing Institute of Technology,
Beijing 100081,China; 2 School of Management and Economics, Beijing Institute of
Technology, Beijing 100081,China;)
Abstract: In this paper, Brain Information Trait and it’s detection approach are introduced, and then the decision
model of selection of managing personnel and technical personnel is presented. Firstly, brain information trait is
gotten by the detection approach of macro-movement of brain information processing, and the decision model of
selection of managing personnel and technical personnel is established by support vector machine theory based on
brain information trait. Finally, a personnel selection method combined with expert’s knowledge is proposed
according to the amelioration of the decision model. Experiment proves that the decision model and the selection
approach are feasible. The study provides a new solution to personnel selection.
Key words: Brain Information trait; Support Vector Machines; Decision model; Personnel selection
本研究的基本出发点认为脑的基本功
能是接收外界信息,对这些信息作出合适的
处理并作出决策或行为反应以适应外界环
境。脑在进行信息处理时如除去所处理信息
的具体内容,则信息处理过程是一种运动过
程,其运动特征直接支配人对外表现的行为
或动作特征。文献[1] 中提出了一种脑信息处
理运动特征的宏观检测方法,该方法是使受
试者在一定时间段内连续进行简单逻辑判
断作业,通过手写或计算机操作,记录下受
试者的脑信息处理运动的宏观作业量曲线,
这条曲线就表征了脑信息处理运动特征(以
下简称为脑信息特征)。图 1 就是不同受测
者的脑信息处理运动的宏观作业量曲线,它
们反映了不同的脑信息处理的特性,而这些
特性又直接决定了人的能力特征和行为特
0
20
40
60
80
100
1 16 31
作
业
量
(
完
成
的
作
业
个
数
)
作业的时间间隔 t /min
0
20
40
60
80
100
1 16 31
0
20
40
60
80
100
1 16 31
(a) (b) (c)
图 1 不同受测者的作业量曲线
征。
如果能够利用现有各职业人群的表征
脑信息特征的数据,从机器学习的角度建立
各职业人员选拔的决策模型,那么将对人们
进行职业选择和单位进行人员配置起到很
强的辅助作用,这也为这方面的研究提供了
一种新的思路。
本文就是以脑信息特征为基础,从机器
学习角度出发 ,利用基于统计学习理论
(Statistical Learning Theory 或 SLT)的支持
向量机(Support Vector Machine, 简称 SVM)
方法,初步建立了一种人员选拔的决策模型
和方法。
1 统计学习理论和支持向量机
1.1 统计学习理论
统计学习理论是一种专门研究小样本
情况下机器学习规律的理论[2]。该理论针对
小样本统计问题建立了一套新的理论体系,
在这种体系下的统计推理规则不仅考虑了
对渐近性能的要求,而且追求在有限信息的
条件下得到最优结果。基于统计学习理论的
支持向量机方法是建立在 VC 维理论和结构
风险最小化原理基础上的,根据有限的样本
建立的模型可以获得最好的推广能力
(Generalization Ability)。
1. 2 支持向量机[3]
支持向量机就是结构风险最小化归纳
原理的算法实现。
SVM 用于模式识别的基本思想就是构
造一个超平面作为决策面,使得正、负模式
之间的空白(margin)最大。
对于两类问题,将两类样本描述为:
{ } { } diiii Rxyliyx ∈−∈= ,1,1,,...,1,,
其中: l为样本数, d 为输入维数。
设用 d 维空间中的超平面来划分这两类样
本,在线性可分情况下就会有超平面使得这
两类样本完全分开。将该超平面描述为:
0=+• bxw (1)
对于给定的训练集,找到最优超平面就是求
解如下的最优化问题:
2
2
1)(min ww =Φ (2)
满足约束条件:
( ) libxwy ii ,...,2,1,01 =≥−+• (3)
根据对偶原理,式 2 的最优化问题可以
转化为求解如下优化问题:
∑ ∑∑
= = =
•−=
l
i
l
i
l
j
jijijii xxyyW
1 1 12
1)(max ααααα (4)
满足约束:
∑
=
=
l
i
iiy
1
0α , lii ,,2,1,0 L=≥α (5)
对于线性不可分问题和非线性判别函
数有:
( )∑ ∑∑
= = =
•−=
l
i
l
i
l
j
jijijii xxkyyW
1 1 12
1)(max ααααα (6)
满足约束:
∑
=
=
l
i
iiy
1
0α , liC ,,2,1,0 L=≤≤α (7)
其中 :C 为大于零的常数 , ( )ji xxk • 为
SVM 核函数.
最终得到的判别函数为:
∑
=
+= s
N
i
iii bxxKyxd
1
),()( α (8)
其中: sN 是支持向量个数, iα 是支持向量
ix 对应的系数, iy 是 ix 对应的类别标识,b
是偏移量。
最后通过判断判别函数 ( )xd 的符号来
实现对样本 x分类。
2 基于 SVM 的人才选拔的决策模型
基于 SVM 的人才选拔的决策模型从本
质上讲就是将 SVM的理论用到分类,根据训
中国科技论文在线
练样本学习确定各类人员的分界面。下面就
以管理人员和技术人员为例来具体分析。
训练样本
要想根据脑信息处理特征来建立管理
人员和技术人员选拔的决策模型,首先就要
有表征管理人员和技术人员的脑信息特征
的数据,然后以这些已经标记好类别的数据
作为训练样本。根据支持向量机的理论来建
立人员选拔的决策模型。
本研究以 xx大学高级经理班 82人和xx
公司技术人员 164 人作为训练样本,利用脑
信息处理运动的宏观检测方法得到每个样
本的 30 行作业量作为样本的特征。同时标
记出每个样本的类别(下文中类别“+1”表
示为管理人员一类,类别“-1”表示为技术
人员一类),这样就得到了训练样本数据,
如表 1 所示。
.
决策模型
确定了训练样本后,根据前面介绍的基
于统计学习理论的支持向量机算法,由式 8,
取核函数为径向基函数,就可得到如式 9 所
示的决策模型。
(9)
其中: x 为 30 行作业量组成的向量;
sN 为支持向量的个数; jy 为输出值(当
输出为管理人员时, 1=jy ;当输出为技术
人员时, 1−=jy ); jα 为支持向量对应的
拉 格 朗 日 系 数 ; b 为 偏 值 ;
−−= 2
2
2
)(
exp),( σ
j
j
xx
xxK 。
决策模型的形式确定后,就要通过 SVM
的训练算法来确定决策模型的系数。
SVM 的训练算法主要包括两大类:一类
是经典的 QP 算法,它占用的内存容量大, 训
练速度慢。另一类就是改进算法,大多数这类
算法的一个共同的思想就是循环迭代:将原
问题分解成为若干子问题,按照某种迭代策
略,通过反复求解子问题,最终使结果收敛
到原问题的最优解。John C. Platt 在文献[4]
提出 SMO(Sequential Minimal Optimization
或 SMO)算法。它将工作样本集的规模减到
最小——两个样本。之所以需要两个样本是
因为等式线性约束的存在使得同时至少有
两个 Lagrange 乘子发生变化。由于只有两个
变量,而且应用等式约束可以将其中一个用
另一个表示出来,所以迭代过程中每一步的
子问题的最优解可以直接用解析的方法求
出来。这样,算法避开了复杂的数值求解优
化问题的过程;此外,Platt 还设计了一个两
层嵌套循环分别选择进入工作样本集的样
本,这种启发式策略大大加快了算法的收敛
速度。标准样本集的实验结果证明,SMO
表现出在速度方面的良好性能。
对于本研究采用 SMO 方法进行训练,
其 他 参 数 取 C=10, 核 函 数 参 数
10002 2 =σ 。即可确定式 9 的参数,得到
决策模型。
选拔方法
根据决策模型就可以得到如下的选拔
方法。
首先根据脑信息特征检测方法得到测
试样本的测试结果,然后代入式 9 求出
)(xd ,如果 ,0)( >xd 则将该受测者归为管
理人员,否则将该受测者归为技术人员。
为了进一步提高人才选拔的精度,同时
∑
=
+= s
N
j
jjj bxxKyxd
1
),()( α
特
征
类别
第 1
行 作
业量
第 2
行 作
业量
… 第 29
行 作
业量
第 30
行 作
业量
+1 70 61 … 76 74
+1 86 79 … 78 86
+1 61 59 … 67 65
….. ….. …. … … ….
-1 78 72 … 69 71
-1 74 66 … 70 71
-1 82 76 … 77 79
….. ….. …. . … ….
表 1 训练样本数据
中国科技论文在线
充分利用专家经验,.对决策模型做如下改
进:
其中: 101 12 <<<<− CC
改进后的决策模型,对那些容易错分
的样本或者是那些特征不明显(即可作管理
人员又可作技术人员)的样本就由专家来判
别,这样能够充分利用机器和专家的特长,
充分发挥两者的优势。当 1C 和 2C 的绝对值
取的越大,则由专家进行判断的样本数越
多,由机器判断的样本数越少,决策模型的
正确率就越高。
3 实验分析
为了验证本研究提出的决策模型的有效
性,特进行如下的实验分析。从 xx 大学的
高级经理班另取 20 人,从 xx 公司技术人员
中另取 40 人作为测试样本,对模型进行分
析。
原始决策模型的实验分析
首先,将测试样本的数据代到决策模型
式 9,求出 )(xd ,如果 ,0)( >xd 则将该受
测者归为管理人员;否则将该受测者归为技
术人员。并将决策结果和实际类别进行比
较,从而得到决策模型正确率的估计。表 2
即为测试数据的实验结果。根据表 2 可以得
到决策模型的正确率为 48/60=80%。
改进后模型的实验分析
同样,将测试样本的数据代到决策模型
式 10 中,取 −=C , =C ,试验
结果如表 3 所示。最终可以得到由专家决策
的占 18/60=30%,由机器决策的占 70%。改
进后的决策模型的正确率为( 60-7 )
/60=%。
4 结论
本文以脑信息特征检测方法为工具,利
用 SVM 理论,初步建立了管理人员和技术
人员选拔的决策模型和选拔方法,实验表明
该方法是可行的。对于多职业人员选拔则属
于多分类问题,但是基于 SVM 的多分类器
的构造可以通过组合多个二分类器来实现。
具体的方法有一对一,一对多等方法[5]。因此
本研究提出的方法也具有推广性。
由于本文采用的训练样本的特征都是
脑信息处理特征,因此今后还要研究如何将
样本的非运动特征融合进决策模型,以提高
决策的正确性。另外今后还应研究如何将本
文提出的方法和其他的人才选拔方法进行
集成,建立实用的人才选拔体系。
参考文献
[1] 毕路拯,吴平东,陈之龙等. 脑信息处理的特
性 检 测 研 究 [J]. 北 京 理 工 大 学 学 报 ,
2003,24(2):121-124.
[2] 边肇祺,张学工,等.模式识别[M]. 北京:清华大
学出版社 ,2000..
[3] 张学工. 关于统计学习理论与支撑向量机[J].
自动化学报,2000,26(1):32-43..
管理人员一类
由专家进行决策 (10)
技术人员一类
)(xd 决策结果 实际
值
结果
比较
-1 +1 错误
+1 +1 正确
+1 -1 错误
-1 -1 正确
… … … …
表 2 原始决策模型的实验结果
)(xd 决 策 结果
实际值 结果比较
-1 -1 正确
1 -1 错误
专家决策 -1 正确
1 +1 正确
… … … …
表 3 改进后模型的实验结果
( )
( )
( )
<
≤≤
>
2
12
1
Cxd
CxdC
Cxd
中国科技论文在线
[4] J. Platt, Fast Training of Support
Vector Machines using Sequential
Minimal Optimization, in Advances
in Kernel Methods - Support Vector
Learning, B. Schölkopf, C. Burges,
and A. Smola, eds., MIT Press, to
appear, 1998.
[5] 卫保国,王爱民,沈兰荪.一种新的多类模式识
别 支 撑 向 量 机 [J]. 模 式 识 别 与 人 工 智
能.2002,15(2):178-181.
中国科技论文在线