第 1页 共 9页
高校生源质量的评价模型与实证研究
陈军 1 ,熊娟 2
1 中南大学网络中心,湖南长沙(410083)
2 中南大学现代教育技术中心,湖南长沙(410083)
摘要:本文根据教育评价理论和数理统计原理,借鉴地理信息学中等高线的概念,提出了高
校生源质量评价及其图形化显示的一种创新方法。 通过对高校招生录取成绩数据的统计分析
表明,本文方法具有评价结果准确可靠、直观和可操作性强的特点。实证研究验证了高校的
生源质量与其排名呈正相关,这说明优质生源是高校人才培养和可持续发展的保障。
关键词:生源质量 教育评价 实证研究 等高线
中图分类号:G40,G40051
文献标识码:A
1. 引言
2007 年全国参加高等学校入学考试的考生约 925 万人,平均录取率为 % [1] ,这说
明中国的高等教育已进入了大众化教育阶段。高等教育的大众化进程中,高校的生源质量能
否得到保证成为从事高等教育管理、教学工作和从事高等教育理论研究的专家、学者所关注
的问题。高校的生源质量不仅与高校的办学水平、教学和科研质量有着直接或间接的关系,
而且与高校的排名密切相关。 《美国新闻与世界报道》(U. S. News & World Report)每年推
出全美大学排行榜,排行榜的 7 个一级指标中就包含了权重为 15%学生素质指标 [2] ,学生素
质一级指标又分为入学接受率,高中成绩排名(前 10%或 25%)和 SAT/ACT(Scholastic
Assessment Test/American College Test)成绩等二级指标;国内的一些大学评价研究 [3] 也将生
源质量列为重要指标。由此可见,生源质量是大学评价指标体系中的重要影响因素。重庆大
学陈静 [4] 利用综合因子分析法构建了评价模型对本校的生源质量进行了分析,并认为高校的
生源质量受高校的办学质量、办学环境、社会认同、价值取向、毕业生就业、学校地理位置
等多种因素的影响,该文对高校生源质量作了较为细致的分析和研究,但没有涉及不同高校
生源质量的横向比较,而且需要掌握录取考生的全部原始数据,可操作性不强。本文在我国
高校现行招生考试和录取的基本框架下,根据教育评价理论和数理统计原理,借鉴地理信息
学中等高线的概念,进行高校生源质量评价的数学模型及其图形化显示的创新研究。
2. 评价模型的建立
考试作为测量人们掌握或具有的知识、观念、情感、智慧、能力的程度和水平的一种手
段,是对测量对象的精神属性的测量,一般只能进行粗略的间接测量,无法像对物质对象的
第 2页 共 9页
物理属性那样采用特定的测量工具、根据统一的标准进行精确的直接测量。尽管考试测量存
在各种各样的弊端而饱受诟病,但考试仍然是古今中外广泛采用的测量手段。通过一次科学
的考试所得的评价结果—高考分数, 在一定程度上还是能比较科学地反映出学生对其知识的
掌握程度、智力水平的高低和综合能力等 [5] 。本文在中国高校历年招生录取的大量实际数据
基础上对考生的录取成绩进行统计分析和实证研究, 建立基于高校招生考试录取数据的生源
质量评价模型,有助于高校从宏观上掌握学校的生源质量,直接指导学校的招生工作。
评价方法的选择
教育评价是依据考试测量的目的和测量的结果, 对被评价对象的能力或倾向的变化做出
价值判断的系统过程。教育评价依据的不同的目标、标准与方法,可以分为绝对评价、相对
评价和自身差异评价三种类型 [6] 。绝对评价又称为目标参照评价,是以被评价对象集合以外
的既定准则或要达到的教学目标为标准, 研究被评价对象集合中每个被评价对象的成绩是否
达到既定标准或达到既定标准的程度的方法, 绝对评价的实质是将被评价对象的现状与既定
标准进行的比较;相对评价又称为常模参照评价,是指以被评价对象的成绩与被评价对象集
合的平均成绩或常模相互比较来确定其成绩的适当等级的评价方法, 相对评价的实质是确定
被评价对象在被评价对象集合中的相对位置;自身差异评价又称为个体内差异评价,是指将
被评价对象集合中的各个被评价对象的过去和现在进行比较, 或者把一个被评价对象的若干
属性相互比较的方法, 自身差异评价实质上是一种对被评价对象自身纵向评价和横向评价后
所做出的判断。
设被评价对象的集合为 1 2 3 { , , , , } n X X X X X = L ,绝对评价的既定标准或相对评价的
常模为M ,则上述三类评价方法如图 1 所示。
图 1 教育评价方法
在教育评价的实践中,通常把绝对评价和相对评价结合起来加以应用,如在高校的招生
考试中,试题依据中学的教学大纲和教材编制,采用评分方法评定考生的成绩属于绝对评价
方法;但在高校的录取时,由于受招生计划的限制,录取是采用相对评价方法来实现的。评
价方法的选择直接影响评价结果的客观性和可靠性,选择适合的评价方法至关重要。由于相
对评价方法所关注的是被评价对象在被评价对象集合中的相对位置,具有甄别性、选择性的
特点,特别适用于人才的选拔。因此,本文采用相对评价方法来建立生源质量的评价模型。
数据的归一化
教育评价中的定量分析方法包括百分制法、分项评分法和标准分法。采用百分制法来确
定被评价对象之间的知识及能力的差异, 或被评价对象自身一段时间内的发展和变化的差异
第 3页 共 9页
是不科学的,主要原因是在非标准正态分布下分数不具有同一测量尺度,不具备可加性和可
比性;分项评分法虽然体现了教育质量评价的多因素性,也能比较客观地反映现实情况,但
指标体系的科学性和合理性较难掌握,因此分项评分法也存在局限性;而标准分法不仅可以
进行绝对评价,也可以进行相对评价,其评价的结果客观性较强,因此标准分法是教育评价
中一种重要的定量分析方法。
由于目前我国高校的入学考试实行分省、市和自治区自主命题的形式,各省、市和自治
区的高考试题不同,其试题的难度系数也存在差别,这就导致不同年份、不同省、市和自治
区的原始考试成绩数据失去可比性,因此,需要采用标准分法对这些高考成绩数据进行归一
化(normalization)处理。标准分法是将原始分数与其平均数之差除以标准差所得的商数,
它以标准差为单位,度量原始分数离开某平均数的距离,是一个相对分数,它表明了一个原
始分数在集合中所处的位置。标准分法有 Z 标准分法和T 标准分法两种。Z 标准分法的计
算公式为:
i
i
X X
Z
S
-
= (1)
1
1 n
i
i
X X
n =
= å (2)
2
1
1
( )
n
i
i
S X X
n =
= - å (3)
其中, i X 为第 i名学生的原始分数,X 为原始分数的平均值,S 为原始分数的标准差, i Z
为第 i名学生的Z 标准分数。Z 标准分数的意义是:Z 标准分数为 0 的原始成绩是被评价
对象集合的平均分,Z 标准分数大于 0 或小于 0 的原始成绩分别高于或低于被评价对象集
合的平均分。 Z 标准分法的缺点在于Z 标准分数有小数出现,且有正负之分,不易理解。
这样造成应用的不便,因此经线性变换引入T 标准分法,其计算公式为:
T Z a b = + (4)
其中,T 表示T 标准分数,Z 表示Z 标准分数,a 为基分,b 为扩大系数。令 50 a = ,
10 b = ,则公式(4)变为 50 10 T Z = + 。T 标准分法实质上是Z 标准分法的变形,经过
线性变换后得到的T 值都是正整数。T 标准分数实质上是一个以 50 分为平均分,以 10 为
标准差的标准分,T 值大于或小于 50 时,被评价对象的原始成绩分别高于或低于被评价对
象集合的平均分。
显然,T 标准分法不受考试难度和评分标准宽严的影响,可以比较客观地反映被评价对
象在被评价对象集合中的相对位置,比较适合高校的生源质量评价。但是,T 标准分法在高
校的招生录取生源质量评价的实际应用中由于受到种种客观条件的制约导致无法实现。首
先,在现有的条件下,无法得到所有考生原始分的精确数据,也就无法计算每个省、市和自
治区考生原始分的平均值和标准差;其次,标准分转换的正态分布原理及标准差指标等统计
学专业术语并非普罗大众所熟知的概念,标准分的转换全部由计算机来完成,当考生及家长
拿到转换后的标准分通知单时,其标准分数既与原始分数的估分无直接的联系,又无法对其
第 4页 共 9页
进行验证和核实。因此,本文提出以省、市和自治区为单位进行数据的归一化处理,然后按
最高分加权进行生源质量评价的新方法。这种按最高分加权归一化处理的基本思想是,把各
省、市或自治区考生的文、理科最高分视为满分进行线性变换,其计算公式为:
max
i
i
kX
R
X
= (5)
其中, i X 为第 i名考生的原始总分, max X 为某省、 市或自治区的文科或理科的最高总分, i R
为第 i名考生的相对总分, k 为变换系数,考虑到习惯, k 取值为 100。例如,湖南省 2006
年高考理科总分最高分为 655 分,那么湖南省 2006 年所有考生的理科成绩就可以按照公式
(5)进行数据的归一化处理,不需要计算原始分数的平均值和标准差,也无须查标准正态
分布表。这种数据归一化处理方法简单明了,目的明确,将各省、市和自治区考生的高考总
分按文、 理科进行数据的归一化处理后, 就可以对这些数据进行统计分析和生源质量的评价。
受篇幅所限,本文仅以高校国际编码为 10056 和 10533 的两所高校(下简称 A 高校和 B 高
校)2006 年在山东省的高考理工科录取成绩作为分析和评价的原始数据,两所高校录取成
绩经上述归一化处理后的结果如表 1 所示。
表 1 两所高校录取成绩归一化处理后的数据
分数 93 92 91 90 89 88 87 86 85 84 83 82
A 8 26 22 11 3 3 2 1 1 4 7 4
人数
B 0 1 1 5 19 19 37 36 4 0 0 0
(数据来源:
评价的数学模型
设 1 2 , , , n X X X L 为总体 X 的一个简单随机样本
[7] ,定义:
1 1
1 1
, ( ) , ( 1, 2, )
n n
k k
k i k i
i i
A X B X X k
n n = =
= = - = å å L (6)
其中, k A 为样本的k 阶原点矩, k B 为样本的k 阶中心矩,特别地, 1
1
1 n
i
i
A X X
n =
= = å 为样
本均值; 2 2 2
1
1
( )
n
n i
i
B S X X
n =
= = - å 为样本方差; *2 2
1
1
( )
1
n
i
i
S X X
n =
= -
- å 为样本修正方差。
通常,样本方差即指样本修正方差 *2 S ,并记为:
2 2
1
1
( )
1
n
i
i
S X X
n =
= -
- å (7)
容易证明:
*2 2 2
1
1
1
n
i
i
S X nX
n =
æ ö
= - ç ÷ - è ø
å (8)
第 5页 共 9页
本文采用样本均值 X 和样本方差 2 S 这两个统计量进行考生成绩数据的统计分析。通过
样本方差分析可以得到每个样本与被评价对象均值之间偏离的离散程度。样本方差 2 S 的值
越小,说明这个子样本与被评价对象均值的偏离程度越小,子样本均值的可信度越高;而样
本方差 2 S 的值越大,子样本值与被评价对象均值的偏离程度越大,子样本均值的可信度就
越低。将表 1 中的数据代入公式(6)和(7) ,可以得到这两所高校的样本方差分析结果(表
2) 。
表 2 所高校生源质量的样本方差分析结果
高校 X 2 S
A
B
从表 2 可知,A高校的样本均值稍大于 B 高校的样本均值,这说明 A高校 2006年在山东省
理工科的生源质量略优于 B 高校;B 高校的样本方差小于 A 高校的样本方差,这说明 B 高
校 2006 年在山东省理工科的录取成绩相对离散程度稍小,即 B 高校 2006 年在山东省理工
科的高考录取成绩比 A高校的高考录取成绩更为集中。
表 3 两所高校在部分省、市和自治区录取分数加权平均值
年度 2005 年 2006 年
省、市、自治区 A B A B
安徽
福建
广西
河北
湖北
湖南
宁夏
山东
四川
云南
重庆
上述样本均值的计算采用的是算术平均方法,没有充分考虑同一分数段考生人数的影
响,显然不尽合理。加权平均比算术平均能更科学地反映考生成绩的平均值。一般而言,计
算平均数确定权数的原则应该是, 凡是能够反映各变量值在总体平均数中的地位和作用的就
可以作为权数,反之,不能起到上述作用的不能成为权数 [8] 。生源质量评价的准确与否和权
数(weight number)的选择有直接的关系。本文以各分数段的人数与总人数的比值为权,按
公式(9)计算两所高校的加权平均分,实现以单一指数来反映不同高校在同一省、市和自
治区内录取的生源质量状况。
1
1
n
j
i m
i
j
j
f
X X
f =
=
æ ö
ç ÷
ç ÷ = ×
ç ÷
ç ÷
è ø
å
å
% (9)
第 6页 共 9页
上式中,X % 为加权平均值,n为录取的考生人数,m为分数段个数, i X 表示第 i个考生的
分数值, i f 则表示第 j 个分数段上的录取人数。采用公式(9)经计算得到 A高校和 B 高校
在部分省、市录取分数的加权平均值(表 3) 。
3. 评价结果的图形化显示
尽管通过表格可以表示高校生源质量的评价结果并进行比较,但表格中的数据既不形
象,也不直观。而图形是显示和分析复杂数据的理想方式,利用图形形象、直观、逼真的特
点,通过图形化的方法来显示生源质量评价的结果更为合理、有效。下面借助科技绘图及数
据分析软件 Origin将表 1 和表 3 中表示高校生源质量的数据进行图形化。
生源质量等高线
借鉴地理信息学中等高线(contour lines)的概念,将经过处理的标准分数看成是海拔
高度,分数从内向外依次呈降序排列。等高线上数据点的数量表示在这一分数段上录取的人
数,在同一等高线上,数据点愈密集,表示在这一分数上录取的人数愈多。现以 A、B 两所
高校 2006 年在山东省理工科的招生数据(表 1)为例生成生源质量等高线。需要说明的是,
由于获取原始数据的途径有限,在收集数据的过程当中,根据上述高校网站所公布的各专业
当年在山东省高考招生的分数,选择最高分和最低分两个分数,通过公式(5)的归一化数
据处理,在 Origin中实现这两所高校招生数据的图形化显示。图 2 和图 3分别为 A高校和
B 高校 2006 年在山东省理工科的生源质量等高线。
图 2 A高校生源质量等高线 图 3 B高校生源质量等高线
从图 2 可知,A 高校生源质量等高线中心处的数据点分布较为密集,尤其是在 93 分和
94 分等高线上的数据点较多,而边缘处的数据点分布较为稀疏,这说明 A 高校的录取分数
较为集中地分布在高分区域。而在图 3 中,B 高校生源质量等高线上的数据点大部分都集中
在中部,而且各等高线上数据点的稀疏程度基本一致,换而言之,B 高校的录取分数较为集
中地分布在中等成绩区域。
第 7页 共 9页
生源质量垂降线
利用 Origin中垂降线(vertical drop line)的绘图功能,通过表 3中的数据来表示 A、B
两所高校在同一省、市和自治区内录取的生源质量状况的差异。图 4 和图 5 中带空心方块的
垂降线和带实心方块的垂降线分别表示 A、B 两所高校的生源质量,虚线表示 A、B 两所高
校的生源质量差异。从图中可以看出,A、B 两所高校 2005 和 2006 年在山东省理工科的招
生情况良好, 加权平均值都集中在中等成绩以上, 相比之下, A高校的生源情况要略胜一筹。
值得注意的是,B 高校 2006 年在宁夏、四川和重庆三省、市的生源质量和 A高校存在较大
差距,B 高校在上述三省、市的实际网上录取过程表现为第一次投档数小于计划数,生源不
足,这说明 B 高校在这三个省、市的招生工作还需要进一步加强,同时也从另一角度证明
了本文提出的生源质量评价方法的可靠性。
图 4 两所高校在部分省、市和自治区理工科的生源质量垂降线(2005年)
图 5两所高校在部分省、市和自治区理工科的生源质量垂降线(2006年)
武书连 [9] 等学者在对中国大学排名的研究中将 A高校排在第 16 位, 将 B 高校排在第 18
位,本文从生源质量的角度出发得出的研究结果与武书连的研究相当吻合,这在一定程度上
说明了高校生源质量与高校排名存在着正相关性。高校的生源质量不仅对高校的教学、科研
和管理举足轻重,而且在相当大的程度上影响着高校的声誉。总之,一流的高校需要优质的
生源作为人才培养和高校可持续发展的保障。
第 8页 共 9页
4. 结论和展望
本文根据中国高校历年招生录取的大量实际数据,借鉴评价理论,通过数学建模、统计
分析和实证对高校生源质量进行了研究。 文中提出的高校生源质量评价数学模型和图形化显
示的创新方法能够对高校的生源质量进行科学的评价和比较,方法具有评价结果准确可靠、
直观,可操作性强和适应中国现有招生录取模式的特点。文中生源质量的实证研究在一定程
度上验证了高校生源质量与大学排名存在着正相关性。显然,只要能够采集到足够的原始数
据,本文方法不仅适用于同一院校不同时间的纵向比较,而且也适用于不同院校同一时间的
横向比较, 这对高校管理者从宏观上掌握生源质量状况和直接指导高校的招生工作具有一定
的理论价值和积极的现实意义。然而,高校生源质量的高低不仅仅取决于高考成绩,而是与
考生的思想道德素质、科学文化素质、身心素质、审美素质、劳动技能素质和创新能力等诸
多要素有关。仅凭高考成绩来确定生源质量也许并不全面,但在我国现行的高校入学考试和
招生录取的框架下本文方法仍不失其实用性。 下一步的研究将在本文提出的高校生源质量评
价数学模型的基础上, 对国内高校的生源质量按招生录取批次分专业进行全面的纵向和横向
比较,并通过网页实时发布评价结果。
本文得到中国教育和科研计算机网湖南主节点主任黄烟波教授的支持和鼓励, 中南大学
网络中心黄家林教授就有关具体的理论和方法提出了非常有价值的指导性建议, 中南大学商
学院湛毅青教授对本文的见解也富有建设性。对此,笔者谨致谢意。
参考文献
[1] 中国教育在线高考频道.2007年全国各省市高考录取人数及录取率统计[EB/OL].
uai_xun_3075/20070820/,2007年 8月 20日
[2] U. S. News & World Report.Undergraduate Ranking Criteria and Weights[EB/OL]..
edu/userdocs/,Friday, August 31, 2007
[3] 浙江大学大学评价研究课题组.大学评价和学科评价:指标体系设计探讨[J].评价与管理,2005年
第 1期:3242
[4] 陈静.高校招生生源质量分析与评价模型研究[D].重庆,重庆大学,2006年 3月:13
[5] 王秀卿.高等学校招生考试理论研究[M].北京:航空工业出版社,1994年 1月
[6] 陆书环,傅海伦.数学教学论[M].北京:科学出版社,2004年 3月
[7] 贺才兴,童品苗,王纪林等.概率论与数理统计[M].北京:科学出版社,2000年 1月:190192
[8] 高嘉英.如何确定平均数的权数[J].北京统计,2002年第 10期:3940
[9] 武书连,吕嘉,郭石林.2007中国大学评价[J].科学学与科学技术管理,2007年第 1期:165174
Evaluation Model and Empirical Study on the
Quality of Admitted Students of Colleges and Universities
Jun CHEN 1 , Juan XIONG 2
1 Network Center, Central South University, Changsha, PRC, 410083
2 Center of Modern Educational Technique, Central South University, Changsha, PRC, 410083
Email:chenjun@, xiongjuan@
Abstract
According to the educational evaluation theory and mathematical statistic principle, and referring
to the concept of contour lines in geography, this article proposes an innovative method to
第 9页 共 9页
evaluate the quality of admitted students of universities and to show its diagrams. The statistical
analysis on the enrollment data of universities shows that the result is accurate, reliable, intuitive
and feasible, and the case study demonstrates the positive correlation between universities’ quality
of admitted students and the universities’ ranking. This shows that the highcaliber students are the
guarantee in personnel training and sustainable development.
Keywords: quality of admitted students, educational evaluation, empirical study, contour lines
作者简介:
陈军:男。1964 年生。中南大学网络中心副教授,硕士生导师,博士研究生。研究方向:
计算机网络,网络教育技术。
熊娟:女。1984 年生。中南大学现代教育技术中心 2006 级硕士研究生,研究方向:网络教
育技术。