应用马尔可夫链评价教学质量
【摘要】 目的: 讨论教学质量评估中的一种定量分析方法——时齐马尔可夫链评估
法[1],并阐明该评估方法的理论依据及其实施程序。方法:利用学生历年的成绩建立
一个马尔可夫链[2],运用 SAS的 IML模块进行统计分析。结果: 指出时齐马尔可夫链
评估法较之其他教学质量评估法更显合理,更具有实用性和有效性。结论: 教学质量的
时齐马尔可夫链分析着眼于教学过程,注重“ 历史 经历”,从而为更准确地评价教学质
量提供了可能。
【关键词】 教学质量 时齐马尔可夫链 评估 转移概率矩
建立教学质量评估体系,对于提高 教育 教学质量有着积极的意义。如何建立 科学 而
有效的教学质量评估方法,充分发挥教与学两方面的积极性、互动性和创造性,是摆在教
学研究面前的重要课题。
在对比评估不同班级的教学效果时,往往以每个班学生的期末 考试 成绩为依据,根
据各班考试成绩的变化趋势来判断其优劣。事实上,这样评估方法会带来极大的片面性。
因为不同班级(专业)的学生基础存在差异,这让评估的结论偏颇,失去公正性。为了能
客观、公正地评价各个班级(专业)的教学效果,必须剔除班级(专业)之间学生的基础
差异这一因素的影响。笔者经过比较分析,建议对教学质量的评价使用时齐马尔可夫链
(Time Homogeneous Markov Chain)评估法。
马尔可夫链评估法是一种以概率论和随机过程理论为基础,建立随机数学模型分析现
实活动变化 发展 过程中数量关系的一种定量分析方法[3]。其研究的是一类重要的随
机过程,研究对象的状态 Xn (n=1,…,k)是不确定的,其状态空间为 I,它有时可取 K种
状态,有时甚至可取无穷多种状态。在建立随机数学模型时,时间变量被离散化。我们希
望通过建立两个相邻时刻研究对象取各种状态的概率之间的联系来研究其变化 规律 ,而
马尔可夫链评估法研究的也是一类状态转移问题。即研究对象的转移矩阵决定了马尔可夫
链模型的性质
若对任意的 i,j∈I,马尔可夫链{Xn,n∈T}的转移概率 pij(n)与 n无关,则称马
尔可夫链为时齐的(对时间齐次的)[4]。故对任意 k步转移概率 pij(n,k)都与 n无关,
且均可由一步转移概率决定[5]。根据教学规律与教学质量评估的需要,时齐马尔可夫
链评估法恰到好处地体现其在教学质量评估中的实用性与有效性
1 原理与方法
数学模
在教学效果指标的量化过程中,时齐马尔可夫链评估法是将一个总体(如一个年级、
一个班甚至一个小组)的个体(学生)在某次考试中获得的成绩划分为若干等级——优、
良、中、及格和不及格,对应地将考试分数划分为 90~100分、80~89分、70~79
分、60~69分、0~59分 5个等级。然后以各等级学生人数占总人数之比作为状态变量
[6],总体各自的学生前一学期的考试成绩为初始状态,并用向量(概率分布序列)表示
R(t) = (X1(t) X2(t) X3(t) X4(t) X5(t)
其中 t(t∈N)是时间,显然有5i=1Xi(t)=1
我们根据马尔可夫过程的无后效性[7],研究当 t变化时,状态向量 R(t)的变化规
律,从而对教学效果进行评估
设经过第一次考试,一个总体的学生中获得优、良、中、及格和不及格的学生分别为
ni (i = 1,2,3,4,5),则状态向量 R(1) =( n1n n2n n3n n4n n5n ) 被称
作初始向量[8]
为了考察教学效果,继续分析下一次考试中,上述各等级学生的变化情况。若经第二
次考试后,原来获得优等成绩的 n1名学生中,仍保持优等者为 n11人,下降为“良”者
有 n12人,下降为“中”者有 n13人,下降为“及格”者有 n14人,下降为“不及格”者
为 n15人,于是我们得到第一次考试成绩的转移概率为( ni1n ni2n ni3n
ni4n ni5n ),这一转移变化情况用矩阵表示为 P =( niini )5×5 =〔pij〕
P称为转移概率矩阵[9]。容易看出
① 5J=1pij=1 (pij≥0, i=1,2,3,4,5
② R(2) = R(1) P
R(2)=(5i=1ni1n 5i=1ni2n 5i=1ni3n 5i=1ni4n 5i=1ni5n
根据时齐马尔可夫链的性质[10],我们有
① R(t+n)= R﹙t﹚Pn (n∈N
② R(t)的极限为时齐马尔可夫链在平稳状态下的概率分布:linn→∞R﹙t﹚= R 。
这里要说明的是:在平稳状态系统内部各等级学生之间的微观变化依然存在,但各等
级的学生的相对比例不再发生变化。特别地,如果矩阵 P为分块对角,表示每一等级的学
生均可向任一等级变动,则根据马尔可夫链的无后效性(要预测“将来”的状态,只需清
楚“现在”已知的状态,而“过去”的状态不起任何作用),体系的极限状态与体系的初
始状态关系甚微,即与 R(1)无关,而一切由转移概率矩阵 P决定[11]。所以,马尔可夫
过程转移概率矩阵 P在教学评估中的意义是至关紧要的。学生考试成绩的变化反映了学生
内在心理状态、外部社会影响、教师授课方式等综合的变化。因此,转移概率矩阵 P是教
学质量、教学条件、学生内在心理状态、外部社会影响等因素的集中反映。由马尔可夫过
程的极限状态可知:当这些影响学生考试成绩的因素稳定时,学生在这种设定情况下的总
体上可能达到的程度,而这一可能达到的程度与学生原有的基础无关。于是,在理论研究
上我们可运用马尔可夫过程的极限分布作为教学效果的量化指标,从而也解决了因学生基
础存在差异而无法以学生的成绩去评估教学质量的难题
计算 步骤
为了方便研究问题,我们不妨将求教学系统状态转移概率矩阵 P的极限向量的步骤归
纳如下
① 分层抽样,在我校(广东药学院)的二级学院(公共卫生学院)抽出预防医学方
向 M、N两个班。为方便说明问题,摘录“M班 02–03上学期与 02–03下学期考试成绩转
移情况表”(原始资料来源于广东药学院教务处),如表 1所示,列出各班级的学生考试成
绩等级转移情况表,其中第 6列表明该生在两次考试中成绩转移情况,如:i→j意为该生
由 i等转移到 j等。(这里计算学生在两次考试中成绩转移情况,求相同的 i→j在表中
出现的频数,运用了 SAS软件的 Print过程与频数表。)表 1 M班 02–03上学期与 02–
03下学期考试成绩转移情况表(略
② 计算转移概率矩阵 P,矩阵 P中元素 pij由下式确定:pij=nij5j=1nij
i,j={1,2,3,4,5}
③ 求出转移概率矩阵 P的极限向量。
由马尔可夫链的遍历性定理知:对于不可分、非周期的马尔可夫链的 n步转移概率矩
阵〔p(n)ij〕,由无后效性有: linn→∞p(n)ij=x
这里,xj与 i无关。此时,x≥0 , X = { xj} = ( x1 ,x2 ,x3 ,x4 ,x5)≠ 0为状
态 R(t)平稳分布,且满足 X=XP,即 X[I–pij] = 0 (I为单位方阵),或[I–pij]
x1x2x3x4x5=00000
故转移概率矩阵 P的极限向量 X是其转置矩阵 PT=[pji]的特征值为 1的特征向量。
考虑到 PT的特征方程的线性相关性,我们可删去方程组中的任一方程,而用约束
条件5i=1xi=1 替代。
④ 解出向量 X = (x1 ,x2 ,x3 ,x4 ,x5),即为 P的极限向量[12]。根据最大项原
则,可取 max{ x1 ,x2 ,x3 ,x4 ,x5}所在等级表示工作质量等级,通过 S = 80x1 + 70x2
+ 60 x3 + 50x4 + 40x5算出教学质量评估综合得分进行量化比较评价
特别的,当转移概率矩阵 P为分块对角矩阵时,特征方程[I–pji] X= 0无唯一
解。此时,可通过增加约束条件,使方程组的解具有唯一性[13]。比如,若[pji]形
如 p11p12p1300p21p22p2300 p31p32p3300000p44p45000p54p5
则有 x4 + x5 = x4(1) +x5 (1),其中 x4(1)、x5 (1)分别为初始向量 R(1)中的两分
量
实例分
广东药学院公共卫生学院预防医学方向 M、N两个班自 02年入学始到 07年毕业所学
科目基本相同,且由不全同的教师担任其课程。倘若在一次考试中,M班的平均成绩都高
于 N班。能否认为 M班的教学效果比 N班的教学效果优秀呢? 其实不然,因为 M、N两个
班入学时,各班学生的基础存在一定的差异。为了能将学生的基础差异这一因素排除,我
们采用时齐马尔可夫链评估法。
分析 M、N两个班第 1学期到第 9学期共 9次期末考试的平均成绩及每相连两次考试
的所属等级转移情况。计算相同的 i→j在表中出现的频数,求得相应的转移概率矩阵,
算出 P(n)M、PT(n)M、P(n)N、PT(n)N(此处运用统计软件 SAS的 IML模块)
① 求 PT(n)M的特征值为 1的特征向量:
解方程 [I -PT(n)M] XTM=
解之 XM=( 0 0
② 求 PT(n)N的特征值为 1的特征向量
解方程 [I-PT(n)N] =
解之 XN =(0 0)
根据最大项原则,我们的结论是:N班的教学效果良好,而 M班的教学效果只属中等
水平。
为了进一步说明两个班的教学效果的定量指标,预先给每个等级确定分值如“优”为
80,“良”为 70,“中”为 60,“及格”为 50,“不及格”为 40,则:
SM=×80+×70+×60 =
=×70+×60+×50 =
由此可见,SM≈SN,即 M班教师的教学效果与 N班的一致。
为了验证时齐马尔可夫链评估法的灵敏性, 计算 M、N两个班各自 9个学期的总平均
分及标准差。运用统计软件 SAS的 Means过程,得出 M 班 9个学期的总平均分 M=
,标准差是 SM = ;而 N班 9个学期的总平均分是 N=
,标准差是 SN = 。可见,M≈N,即这两个班九个学期的总平均成
绩极为相近,而且 SM≈SN ,表明 M班内学生的成绩之间变异与 N班一致,即两个班成绩
离散趋势一致。跟时齐马尔可夫链评估法得到的结果完全吻合
时齐马尔可夫链评估法较灵敏地反映了教学过程的 发展 变化状况,结论是客观的。
从所给的数据作简单分析,虽然两个班级在校 9个学期的期末 考试 平均成绩可作比较并
粗略得出我校的教学质量,但两个班的基础存在一定差异,这样得出的评价是不符合现实
的。在教学质量对比评估过程中,由于各班学生的来源各异、基础不等…,这都是必须考
虑的因素。上例中,广东药学院公共卫生学院预防医学方向 M、N两个班经过 5年的 教育
栽培,M班最终的平均成绩为 ,而 N班是 ,换言之,M班的教学效果与
N班的教学效果基本持衡。由此推出广东药学院公共卫生学院的教学效果比较均衡
2 讨论
教学质量的时齐马尔可夫链分析着眼于教学过程,注重“ 历史 经历”[14]。因
此,对于有着前后因果联系的教学过程,此方法较其他教学评估的方法更合理。也正如
此,在教学过程的诸多方面得到卓有成效的应用
① 教学工作质量的对比评估[15]。在评估过程中,由于学生的来源各异,基础不
等,因此仅仅依据学生的学习成绩,几次课堂教学听课,学生评教、教学抽检来评价教师
的教学或学校管理工作的质量,则存在片面性。而时齐马尔可夫链评估法提供了解决这一
矛盾的有效手段。通过上例的演示,可见它是一种较合理的教学评估法
② 教学实验或实习的对比评价。在教学实验或实习评比中,由于各种外部条件得到
较严格控制,同时该方法剔除了一些差异问题,因而能得到较准确的结果,为实验或实习
提供有 参考 价值且有一定可信度的数据
③ 教师的因材施教情况的分析。由于转移概率矩阵 P本身包含着大量信息,可以从
中分析到学生各层次之间的变化状况。而且,时齐马尔可夫链分析的过程中也得到了教学
效果的各类数据,教师能对教学实践作出自我检测,从而有针对性地采取多种措施,探索
教学 规律 ,改进教学方法,做到因材施教
④ 试卷分析和标准考试的质量分析
⑤ 教材选用、教学内容的合理性分析
⑥ 双语教学的效果评价
⑦ 学生的学习成绩的预测
⑧ 体育 教学中学生的身体素质的变化分析。
不过,最佳的方法也不可能是完美无缺的,作为一种定量分析方法——时齐马尔可夫
链评估法 自然 也有它的局限性。首先它忽略了学生在两次考试之间的特定外部气氛(如
家庭或社会环境的差异);其次忽略了前次考试成绩的优劣对学生的心理影响(如骄傲或自
卑,满不在乎或压力重重等);再则,试题的命题风格,评卷教师的宽严,以及考试课题
自身特点,考试方法,考题的难易等;另外,学生学习成绩可能有升降,不同的等级变化
到另外的一个等级或等级不变所反映的教学水平是不一样的,如将一个等级为不及格的学
生学习成绩提高到优秀,显然就比将一个等级中等的学生学习成绩提高到优秀要困难得
多。以上这些因素无不直接或间接影响到学生考试平均成绩的高低,它们不可分离的都在
转移概率矩阵 P中体现出来。因此,仅用“分数”对教学质量进行评估是不够 科学 的。
教学质量的马尔可夫链评估是以考试成绩为依据的,因此,考试的质量直接影响到马尔可
夫链分析的质量。剖析这种局限性有助于我们在实践工作中正确地加以应用,并不断加以
改进,渐臻完善。充分考虑到这些因素,时齐马尔可夫链评估法能够更加客观,更加符合
实际地反映出教学水平
【参考 文献 】
1 黄歌润,盛炜.教学质量评估的一种统计方法.应用概率统计, 1996,12(1):
108~110.
2 复旦大学,编.概率论.第 3册(随机过程).北京:高等教育出版社,1981.
3 中山大学数学力学系,编.概率论与数理统计.下册.北京:高等教育出版社,
1987,304~314.
4 刘次华.随机过程及其应用.第三版.北京:高等教育出版社,2004,48~80.
5 . MarKov Chains with Stationary Transition robabilities, 1960,
5~12.
6 .“An Example of Statistical Analysis of the Text of Eugene
Onegin Illustrating the Association of Trials into a Chain,” Bulletin de
I’Acadamie Imperiale des Sciences de ,1913,6(7):153~162.
7 陆大全.随机过程及其应用.北京:清华大学出版社,2002.
8 冯虹,邹华,魏文元.马尔可夫链在教学质量评价中的应用,天津师大学报(自然
版),1999,19(1):5~9.
9 楼世博.模糊数学.北京:科学出版社,1985,85~130.
10 胡迪鹤.随机过程论——基础理论及应用.武汉:武汉大学出版社,2001.
11 贺国侠.马尔可夫链方法在体育专业教学质量评价中的应用.西安体育学院学报,
1999,16(3):30~32.
12 梁方楚.教学质量评价的马尔可夫链法.宁波教育学院学报, 2000,2:30~32.
13 杨茂祥,李国兴.教学质量评估的数学模型.西北轻 工业 学院学报, 1996,4:
107~112