心理科学进展 2007,15(3):567~576 Advances in Psychological Science 项目组合在结构方程模型中的应用 卞 冉 车宏生 阳 辉 (北京市应用实验心理重点实验室,北京师范大学心理学院,北京 100875) 摘 要 项目组合(item parceling)是对同一量表中的若干项目进行整合并形成新的观测指标的过程。虽然一直以来它都是一个有争议的议题,但随着其在结构方程模型中的应用日益广泛,它越来越受到研究者重视。文章从项目组合的基本逻辑、优缺点以及具体方法等方面对项目组合的研究进行了概括,并在此基础上提出了使用的具体建议:(1)根据研究的目的与具体情境选择是否需要组合;(2)组合之前必须首先确定概念的维度性;(3)项目组合最好建立在一定的理论基础上等等。未来的研究可以深入探讨各种组合方法对模型拟合以及参数估计的影响以及项目组合在一些SEM高阶应用中的效果,并进一步与项目反应理论等测量理论相结合。 关键词 项目组合,项目小组,结构方程模型。 分类号 B841 1 引言将其作为潜变量的指标处理。但如果每个概念的测[3]在心理学研究特别是现场研究中,我们常用含量项目较多,便会对模型的整体拟合不利;而遗有若干项目的问卷或量表来对某些概念进行测量,弃部分项目以简化模型的做法也被研究者证明并[1][4]从而进一步达到探索这些概念间关系的目的。结不可取。因此,项目组合的方法应运而生。 构方程模型技术的出现,为这种研究范式提供了强项目组合(item parceling)是对同一量表中的有力的工具。结构方程模型(structural equation 若干项目进行整合(加和/或平均)并形成新的观测model,SEM)是用来检验外显变量与潜在变量之指标的过程。项目组合后生成的项目小组(parcel)[2]间假设关系的一种全包式统计取向,它融合了因与量表分或分量表的区别在于,项目小组反映的是素分析与路径分析两种统计技术。相比于传统的多单个因子、维度或潜变量,而一系列分量表及量表元回归技术,它的优势在于能在估计结构关系时有分反映的是若干独立或相关的潜变量。 效控制测量误差的影响。换句话说,它可以同时对近年来,随着项目组合技术在SEM中的应用测量模型与结构模型进行分析,测量模型反映的是日益广泛,对这种方法的争议也越来越多。我们到量表(外显变量)与概念(潜变量)之间的联系;底是否该使用项目小组来代替项目?如果使用,我结构模型反映的则是我们感兴趣的潜变量之间的们该如何对项目进行组合?给我们带来便利的同联系。这样做,保证了在探讨概念关系之前,概念时,它还会带来什么样的问题?本文试图从项目组本身的构想效度得到检验。 合的基本逻辑、方法以及其优缺点等方面对这些问测量模型中,要保证概念的构想效度,很重要题进行探讨。 的一个标准就是概念要被恰当的外显指标2 项目组合的基本逻辑 (manifest indicators)充分代表。每个潜变量指向在结构方程模型产生之前,项目组合就已经是多少个指标比较合适?这些指标的性质如何?如一个备受争议的话题。这种技术曾广泛应用于人格何选择恰当的指标才能既保证概念的构想效度,又[5]测验以及成就测验中。早在20世纪初,Spearman能使结构关系的估计不产生偏差?常用做法是以与Thurstone在对人类智力结构进行探索时就使用个体项目(individual items)为基本的分析单元,[6]了项目组合的方法。他们在因素分析中使用测验总分而不是项目分作为分析的基本单元,并假设在 同一测验下的不同项目是同质的。虽然他们并没有收稿日期:2006-07-29 解释这种做法的内在原理是什么,但结果是使用测通讯作者:车宏生,E-mail:chehongsheng@ 567
-568- 心理科学进展 2007年 验分比使用项目分效率更高,得到“困难因子”表又分属3个大的维度,分别为非工作定向(difficulty factor)的可能性更低。在此之后,其他(non-work orientation)、自由(freedom)与个人关一些能力测验中也都延用这种使用整体测验得分注(human/personal concern)。 代替个体项目得分进行因素分析的方法。 首先,完全分散模型是我们最常见到的模型,1956年,Cattell最早提出了“项目组合”这一它以个体项目作为概念(或其维度、成分)的外显概念,并把这种方法应用于人格研究领域。在他建指标,对概念的表征最为具体。对于WAPS来说,构16PF人格量表的过程中,由于涉及大量项目8个因子(分隔性、金钱等)都由其所属的4个项(1552个),使用传统的因素分析就遇到了巨大困目作为指标,因子之间允许自由相关,这即是一个难。所以,Cattell借用前人组合项目的做法,在项最简单的完全分散模型。 目组合的基础上进行因素分析。Cattell甚至认为他部分分散模型与完全分散模型有一点不同即倡导的这种方法是他的研究中“最重要的技术贡在于各因子的外显指标不再是个体项目,而是项目[7]献”。在此之后,项目组合技术开始得到广泛应的组合。还是以WAPS为例,8个因子没有发生变用。特别是20世纪70年代后随着结构方程模型技化,但其外显指标都由4个变成了2个。这两个指术的兴起,项目组合方法在应用SEM技术的实证标是由4个项目两两组合(求和/或求平均)而成。研究中出现得越来越多。而不同的学者对这种方法形象一点说,如果完全分散模型对概念的表征是原的称谓也不尽相同。除项目小组之外,也有学者把子化,那么部分分散模型对概念的表征就是分子[8]项目组合之后的产物称为合成项目(composite)、化。 [9][10]分量表(subscale)、小量表(miniscale)、聚同样,部分聚合模型比部分分散模型就更为抽[11]合项目(aggregated item)、项目集(item cluster)象、简单一些,它使用各分量表的总分或平均分作[12][13]、分测验(testlet)等等。最近一项研究对几为因子的外显指标,而不再是个体项目或项目小种教育与心理学期刊1989年以来应用SEM的实证组。具体到WAPS,与部分分散模型相比,其一阶研究进行了回顾,发现其中有近20%使用了项目组因子变成了三个维度(非工作定向、自由与个人关[14]合技术。虽然使用这种技术的实证研究越来越注),外显指标由项目小组变成了8个分量表分。 多,但对其原理进行深入探讨的研究却很少,更多最后,完全聚合模型对概念的表征最为简单,的研究只是关心它的实践应用性。项目组合的内在它直接使用三个维度分(非工作定向、自由与个人逻辑是什么?它的合理性又在什么地方? 关注)来作为概念(工作价值观)的外显指标。在从本质上讲,项目组合涉及到的是数据分析的某些情况下,它甚至直接使用量表分来整体代表概基本单元问题,也即概念表征的深度问题。Bagozzi念,如对工作满意度的测量,我们通常最后把所有等人的研究指出,在心理学特别是组织心理学研究项目合并形成一个整体满意度分数来代表工作满中,我们使用项目对概念的表征通常有四种不同的意度。 聚合层次(level of aggregation),分别为完全分散可以看到,完全分散模型到完全聚合模型实际(total disaggregation)、部分分散(partial 上是一个连续体,反映了我们对概念表征具体程度disaggregation)、部分聚合(partial aggregation)与的不同。我们可以根据研究的具体情境以及目的的[15]完全聚合(total aggregation)。我们以Pryo(r1983)不同而选择适合的模型。一般我们仍以个体项目作编制的工作取向问卷(Work Aspect Preference 为分析的最基本单元(完全分散模型),它可以使Scale,WAPS)为例来对这四种模型进行详细说明。我们对概念的测量模型做出细致的分析。但如果量该量表是用来测量人们与工作相关的价值观,含有表包含的项目过多,而且我们又试图同时对概念之52个项目,共13个分量表,每个分量表4个项目。间关系作一番探讨的话,这种模型势必会变得非常在这里为了简化,我们选择其中的8个分量表进行复杂而很有可能导致拟合不佳。很多研究者在此种说明,分别为分隔性(detachment)、金钱(money)、困难之下走向另一端,即完全聚合模型,使用维度生活方式(lifestyle)、创造性(creativity)、独立性分甚至是量表分直接对概念进行表征。这样做带来(independence)、自我发展(self-development)、了模型的简约与探讨结构关系的方便,但牺牲了测同事(coworkers)及安全(security)。这8个分量量模型,结果可能对路径系数的估计产生偏差。所
第15卷第3期 项目组合在结构方程模型中的应用 -569- [13,21]以,使用项目组合方法的部分分散模型与部分聚合更符合正态分布;将分类变量项目组合后,项[5]模型实际上就是试图在这样一个连续体中找到一目小组也更具连续性。 个权衡点,以恰当的深度反映概念,既保证概念的 指标性质 构想效度,又能在简化模型的同时使参数估计不受作为指标,项目小组比个体项目更具充分性与[16]影响。那么,项目组合具体是在哪些方面实现这恰当性。其中原因首先在于项目小组比单个项目有[22]样的目的呢?这种技术又有哪些不足之处?下面更高的信度。这类似于心理测量中的量表越长信我们将分别对项目组合的优势和劣势进行详细的度越高的现象。根据Spearman-Brown公式,当量阐述。 表内包含的项目数增多时,其信度就会逐渐增高。所以,由若干个项目组合而成的项目小组,其信度3 优势与劣势 显然比单个项目要高。 优势 同样,使用项目小组代替项目,还提高了指标在结构方程模型中使用项目组合的方法,其优之间的相关与共同度。当指标之间的相关或共同度势已被很多研究者所认同。Little等人将项目组合的较低时,说明指标的质量不高,结果概念效度会受优势总结为两个方面:心理测量学的与模型水平的到影响。有研究者曾发现,当使用量表分作指标时[17]。具体来说,心理测量学优势主要体现在潜变量其相关(~)要显著高于项目指标(~)指标的性质上,包括指标信度、分布属性等;而模[23]。这从一个侧面说明使用个体项目并不比使用整型水平的优势则涉及模型拟合、参数估计等方面。 合分数(项目小组)能更有效代表概念。在经典测 统计假设 验理论(CTT)框架下,项目得分(X)是由三部i当使用SEM对模型进行估计时,我们最常用分组成:真分数(T)、独特成分(S)与随机误差ii的估计方法是最大似然法(ML)或一般最小平方(e)。若以项目为指标,由于系统误差与随机误差i[4]法(GLS)。这两种方法都建立在正态理论的统(S与e)的存在,项目信度较低,必然造成我们ii计假设之上,即要求数据为连续型并满足多元正态从统计上低估指标之间的相关,使指标共同度下降分布(multivariate normality)。但是,这种假设在[16]。而如果使用项目小组为指标,其信度比单个项多数情况下并不能得到满足。比如,很多时候我们目高,系统误差降低,故一定程度上提高了指标间研究获得的“连续型”数据都是使用Likert式量表的共同度。 收集而来,严格意义上说这样的数据只能是分类型其次,使用项目小组有效减少了指标数,使得或顺序型,我们只是近似把它们作连续型数据处[17]我们犯α错误的可能降低。在10个项目的相关理。另外,有些研究希望获得的数据本身就是分类矩阵中,45个相关中就有两个显著的相关可能是由型,如二分变量。在如此情况下若坚持应用ML或机会造成;而如果这10个项目组合成若干个项目GLS方法对数据进行分析,必然会对模型拟合指数小组,则由机会造成的指标相关就会显著减少。 [18]以及参数估计的标准误产生难以预计的影响。虽另外,项目组合还可以更有效避免指标之间可然也有一些其他估计方法能够对非正态数据进行能存在的多重共线性、过多的误差相关以及指标交分析,如渐进分布自由(ADF)方法,但它们往往[24]叉负荷等现象。使用项目作为分析的基本单元,[19]需要极大的样本量或不能给出模型拟合指数。 一个常见的问题是部分项目之间由于本身存在的使用项目组合的优势之一便是校正非正态数内容相似等原因而产生过高相关。这种相关的直接据。它可以将非正态分布的数据以及分类变量的数后果是变量之间的多重共线性,或者造成项目之间据变得正态化与连续化,以符合ML与GLS的统计误差相关、交叉负荷的出现以及虚假因子的产生。[20]假设。由于项目小组是若干项目的和/或平均,所所有这些现象都与项目之间共享某些独特变异(或以其与单个项目相比,量表间距更多更密,因而分系统误差,如方法变异)有关。若我们不对这些相布属性也就更好。一个5点计分的项目只有5个可关进行估计,必然会造成模型拟合不佳;而估计它能的值,但将3个这样的项目组合后,取值范围就们又会使结果难以解释。使用项目组合的方法,事扩大成了13个。许多研究也都证明,对非正态数先将这些高相关项目进行组合,以尽量消除或减少据进行项目组合后,所得到的项目小组比原始项目污染变异,可以有效解决这些问题。
-570- 心理科学进展 2007年 模型拟合 一手的、最为原始的信息,取而代之的是经过合成许多研究者都认为改善模型拟合是项目组合的指标。项目层面未被分析,因而遗漏掉了大量有[25]方法的最大优势。从理论上来说,对一个概念的用信息。早在项目组合技术产生时,许多研究者就测量当然是使用越多指标越好;但从实践的角度,提出这一批评。他们认为,因素分析等技术只有建[6]指标越多,模型的拟合不一定越好。很多研究发现,立在项目水平才真正有效。Eysenck等人指出,“项SEM的模型拟合指标对于样本容量(N)、每个因目是构成量表的基石,因素分析应该从这一层次开[36]子的指标个数(p/f)以及样本与参数比(N/t)都十始”。他们发现,使用同一组数据,项目因素分[26~28]分敏感。通常样本越大,对拟合指数越有利,析与项目小组因素分析的结果很不一致。这说明由但当样本量较小时,p/f与N/t就显得比较重要了。于项目层面信息的缺失,项目组合可能造成维度缩p/f为多少才能使模型拟合达到最佳?这个问题一减或扭曲。也有学者认为,好的模型拟合结果和改直以来都有争议,一般认为是每个因子3~4个指标善的参数估计并不意味着项目小组能更好代表概为好;而很多研究者也都接受N/t最小为5:1的标念;同样的数据使用不同的项目组合,结果会很不[29,30]准。 一样,我们有必要重视组合之前项目水平的信息[37]所以,项目组合后,一方面改善了指标的分布。 性质与信度,另一方面也减少了要估计的参数点, 维度性 [31]使得模型的拟合指数提高。与使用项目作指标的当若干个项目所代表的潜变量不是单维,或其模型相比,组合模型更简约,N/t更大,特别在样维度尚不清楚时,对其进行组合可能会使结果产生本较少的情况下它也更容易达到5:1甚至更大的标意想不到的问题。许多研究者甚至认为只有在潜变准。实证或模拟研究的结果也都证实,经过项目组量单维(unidimensionality)的情况下才能对项目进[5,15,32~34][17]合,模型的总体拟合指数要更好。 行组合。 [35]最后,使用项目组合的模型拟合更趋稳定。事实上,如果一个潜变量是多维结构的以项目为分析单元,往往会使模型迭代次数过多而(multidimensional),那么以其项目组合得到的项造成模型不稳定,并使得测量模型的参数估计标准目小组就也可能是多维的。以这样的多维项目小组误增大。这样一来,模型解的外部效度很难保证。作为指标,将会使因素负荷的估计产生偏差,使之而使用项目小组就可以有效避免这一问题。 无法正确反映潜变量的变异,并给我们理解和解释 模型参数估计 潜变量的本质带来困难。而且,在这样带有一定偏很多时候,我们使用SEM的主要目的是为了差的测量模型基础上得到的结构关系也会有偏差。探求变量之间的参数关系而不是获得一组模型拟所以,如果一个潜变量的指标是由若干多维项目小合指数。很多研究者会因为研究所涉及的变量太多组组成,那么我们就将不可能明确这个潜变量的内造成模型过于复杂而舍弃测量模型,转而使用完全涵到底是什么;它与其他潜变量的关系也将难以解聚合模型。这样一来,就会使模型的参数估计产生释。这样,多维项目小组可能会给我们的测量模型一定的偏差。这种情况常常出现在SEM的一些高与结构模型都带来难以预料的问题。 阶应用上,如潜在增长模型(latent growth model) 模型错误设定 等。为了更好地获得参数的无偏估计,同时又能保正如我们在前面所说的,使用项目组合可以使证模型拟合指数在可接受范围内,项目组合不妨是模型自由估计参数减少,从而提高模型拟合指数。一种更为理想的选择。 但也有研究者认为,减少自由估计参数的同时会造 劣势 成模型自由度(df)下降,这将影响模型的统计力[25]与其优势相比,项目组合的劣势较少受到研究(statistical power)。换句话说,使用组合在提者关注。多数研究对项目组合的批评主要集中在以高模型拟合的同时,也减弱了我们识别错误设定模下几个方面:信息完整性、维度性(dimensionality)型的能力,从而造成我们犯β错误的机会大增。如与模型错误设定(misspecification)。 Bandalos的研究发现项目组合会掩盖个别项目的多[38] 信息完整性 重负荷;而有研究者也对测量恒等性对个体项目进行组合也就意味着你将失去第(measurement invariance)中使用项目组合而产生
第15卷第3期 项目组合在结构方程模型中的应用 -571- 的偏差进行研究,他们通过对模拟数据的分析发 平衡取向 现,使用项目小组作潜变量指标比使用项目更容易虽然随机取向的组合方法比较简便,但其往往[39]错误接受负荷恒等的假设。 过于随意,更多的研究者还是按照一定的潜在规则项目组合在这一点上相当具有讽刺意味。因为对项目进行组合。其中最常用的一种是平衡取向[8,17]从实际应用的角度,很多研究者使用项目组合的目(item-to-construct balance)方法。这种方法以的就是为了使模型拟合指数更容易达到要求,从而一定的规则来使影响指标性质的因素在项目小组更容易被接受。而争论之处在于,很多时候客观事之间保持平衡,这些因素包括项目负荷以及项目之实是相对模糊的,我们并不知道正确的模型设定是间的相关等等。 什么。支持组合的人认为,项目水平所隐藏的误差保持项目负荷平衡的方法我们称之为单因子[8,41]会被组合所去除,所以以项目小组为分析单元的模法(single-factor method),也称主成分分析法。型将不再是错误设定;而持反对意见的人则认为对顾名思义,它设定量表所有项目负荷在单个因子项目进行组合从而去除误差的做法会改变数据的上,并以项目负荷作为引导。在组合时,首先把负本来面目,它会使模型设定产生问题。对这一问题荷最高的几个项目放到各个项目小组中去作为锚目前还没有好的应对措施,或许只能采取一种相对定项目,然后按照反方向加入次高项目进行平衡。折衷的办法,即进行项目组合之前先在项目水平对比如,如果我们要组合三个项目小组,就先挑出3模型进行检验,以确定可能存在的模型设定错误个最高负荷项目分别放在3个项目小组中;然后再[17]。 从剩下的项目中继续挑出负荷次高的3个项目,按另外,项目组合要求我们用适当的方法对项目照相反方向分别放入已有的3个项目小组,先前最进行整合,并形成新的分析数据,这必然增加了我高负荷项目配对第二轮的最低负荷项目。如果有更们的工作量。一些学者还提出,在临床领域,研究多项目,程序依此类推,直到所有项目都被平衡分者往往使用项目水平的分析来建立常模,在这种情配。 [17]境下,项目组合方法将无法适用。 另一种平衡取向方法为相关法(correlational [42]method)。其基本思路与单因子法十分类似,只4 组合方法 不过是平衡的对象由负荷变成了项目间相关。组合项目组合在实践中的广泛应用促使了各种各时,首先计算所有项目之间的两两相关。然后将相样具体组合方法的产生。早期Cattell就曾在探索性关最高的项目组合成项目小组;接着将余下项目中因素分析中使用过对称组合(radial parceling)的方相关最高的进行组合……依此类推,直到所有项目[40]法,而随着SEM的流行,组合方法依研究者研都被平衡分配。 究目的与侧重点的不同趋向于多元化发展。根据潜 实证取向 变量维度性的不同,项目组合的具体方法又分为单比平衡取向更进一步的是实证取向(empirical 维与多维两种情况。 driven)的方法,也称实证相等法(empirically 潜变量单维 equivalent method)。这种方法更依赖于项目小组某 随机取向 些特征在数据上的相等性。除项目负荷与项目间相随机取向(random assignment)的组合方法是关外,实证相等法还强调项目小组必须在平均数、所有方法中最简单的一种,即把项目随机分配到每方差与信度等特征上保持相等。所以,在组合项目一个项目小组中。这种方法的好处在于操作方便,小组时,应综合考虑这几方面的信息。研究发现,不需要在组合之前做任何额外的数据分析。其基本这种方法最能够提高模型整体拟合指数;但是,它假设在于,将项目随机组合,所得的项目小组在性[8]也是最耗费时间与精力的方法之一。 质上应该大致等同,即它们应该含有相等的平均 内容取向 数、公因子变异以及信度等等。但是,这种假设是前面介绍的几种方法都或多或少依赖于项目建立在所有项目对概念的测量是相同的这一基础间的实证关系,带有一定的数据驱动取向,而内容上的,一旦这一前提不能得到满足,以随机组合的取向(content-oriented)的方法则相反。这种组合[8]项目小组作为潜变量指标就会带来一定偏差。 方法建立在已有理论或研究者对项目内容的推理
-572- 心理科学进展 2007年 判断上。比如,有的概念虽然是单维,但其测量却模型。结果比较发现,内部一致性法得到的项目小分了若干方面(facets),我们可以从理论出发按这组内有更高的一致性,而领域代表法得到的项目小若干方面进行组合;有时,项目之间在内容描述上组之间相关更高;两种方法下模型拟合指数虽然较会有一定的相似性,我们也可以按这种相似性进行为一致且都较好,但在参数估计上领域代表法却表组合。有的研究者甚至将正向描述与反向描述的项现更好。与领域代表法得到较为良好、稳定的因素[43]目交叉组合建立项目小组,并认为这样做还可以负荷相比,内部一致性法所得的负荷较低且不稳定[17][44]有效克服反向描述项目带来的方法效应。 。因此Kishton与Widaman得出结论证明领域代 潜变量多维 表法更适合于多维组合。但也有研究者认为,领域当潜变量是多维结构时,组合方法及其可能带代表法也有其不足,它的项目小组组成是多维异质来的影响便趋于复杂。在潜变量结构已知的情况的,可能会带来另外的问题。 下,一般有两种具体的方法可以对项目进行组合,在此基础上,更多的研究者开始关注组合对测[41][45]分别为内部一致性法(internal-consistency 量模型本身的影响。Snell等与Hall等人通过approach)和领域代表法(domain-representative 模拟数据研究发现,当潜变量是单维时,若考虑额[44]approach)。 外的第二潜变量(unmodeled secondary construct)设想一个含有9个项目的量表由三个维度(A、的存在,组合便可能引起一系列的问题,包括概念B、C)组成,每个维度含三个项目(如A到A)。真实结构的扭曲、参数估计偏差以及拟合指数膨胀13那么,内部一致性法将会以维度为标准进行组合,等。这里的额外第二潜变量是指除了对所有项目解即第一个项目小组由A至A组成,代表维度A;释力最大的公因子之外,在某些项目之间存在的独13第二个项目小组由B至B组成,代表维度B;依特因子。针对这样因子的存在,Hall等人提出了两13此类推。这种方法类似于前面提到的部分聚合模种不同的组合方法:分隔法(isolated uniqueness 型,以低阶的维度分作为更高阶潜变量的指标。内strategy)与分配法(distributed uniqueness strategy)。部一致性法的优势在于它在组合的同时保持了每前者类似于内部一致性法,将那些在第二潜变量上个维度的单纯性,从而使潜变量的多维结构本质不有负荷的项目合并成项目小组;而后者类似于领域受组合的影响。本质上讲,这种方法强调的是项目代表法,是把在第二潜变量上有负荷的项目分配到小组内部的同质性(homogeneousness),它从理论各项目小组中。Hall等人发现,当第二潜变量独立出发,从上至下,不考虑项目小组之间的相似性。 于结构模型中其他内生潜变量时,分配法的模型拟与此相对,领域代表法则由项目出发,由下至合指数较分隔法差,参数估计也有一些偏差;而当上,考虑更多的是项目小组之间的相似性。以此方第二潜变量与其他内生潜变量有关时,这两种方法法组合项目小组时不仅包含维度内公因子变异,还都会带来参数估计的偏差,而分配法似乎拟合更包括各维度的独特变异,即每个项目小组由各维度佳。Hall等人对这种结果的解释是:当使用分配法的项目组合而成,项目小组内部为异质时,第二潜变量的影响被分配到各个项目小组(指(heterogeneous)。如第一个项目小组包含A、B标)中,这无形中使项目小组间的公共变异增大,11和C;第二个项目小组包含A、B和C等等。这从而造成公因子负荷增大。而使用分隔法则会使第1222样一来,每个项目小组都可以独自反映整个潜变量二潜变量的影响局限在一个项目小组中,其误差增的多维结构。 大并导致拟合变差。所以,分配法更容易导致拟合指数的膨胀以及参数估计偏差。Hall等人由此建议5 项目组合相关研究进展 组合时尽量不要使用分配法,而最好把相似的项目 关注测量模型 组合在一起。 许多研究者都认为对多维潜变量进行项目组在此研究的启发下,越来越多的研究者开始强合可能会对模型估计产生一些问题。但究竟会出现[32]调单维性这一组合前提。在前人研究的基础上,怎样的问题,一直很少有研究涉及。Kishton与Kim对此进行了详细阐述。他认为,项目组合的前Widaman曾使用内部一致性与领域代表两种方法提至少有两项:一是单维性,二是信度。即首先要对三维度的内外控量表进行组合,并分别建立CFA保证项目小组指标是单维,然后这些指标间要有高
第15卷第3期 项目组合在结构方程模型中的应用 -573- 信度以反映足够的公共变异。至于如何保证单维者使用单指标模型来使路径模型中的观测变量变性,Kim提出了4条具体的标准:(1)组成项目小为潜变量,前提条件是获得每个量表的信度值组的项目之间在理论上具有内容相关性。(2)在所(ρ)。这种模型以量表分作为潜变量的单一指标,xx22有项目小组中只存在一个公因子。(3)项目小组水并使用(1﹣ρ)(σ)来估计其误差(σ为指标xxxx[50]平的指标误差不相关。(4)误差与潜变量均不相关的观测变异)。这样,潜变量可以得到识别,并[6]。 且参数估计的偏差比路径分析要小。此外,越来越另外,近来有研究者开始对现有项目组合技术多的研究者开始在SEM中使用项目组合,即部分[46]的效度提出质疑。他们认为,使用项目小组的主分散模型来解决这一问题。而这几种方法在整体模要目的是为了提高测量的效度,但通过组合得到的型拟合、结构路径参数估计上有何差异,一直鲜有好的模型拟合结果并不代表项目小组就很好地反研究涉及。 映了我们所感兴趣的概念。这当中争议最大的地方在最近的一项研究中,Coffman和MacCallum在于项目组合舍弃了项目层面的信息,以往研究也同时使用模拟与真实数据对三种模型的拟合及参都是在项目小组层面对其效果进行检验,并与项目数估计情况进行比较,分别为项目组合的部分分散层面的结果进行比较。Hagtvet等人认为,这种单层模型、完全聚合的路径分析模型以及信度校正的单[37,47]面的研究模式可能会带来一些问题。当只考虑一指标模型。结果发现,在所有条件下,项目组合项目小组层面时,我们丢掉了项目信息,但实际上模型的结构路径参数估计都比路径分析模型要高;它们仍然可能在起作用。所以解决问题的方法是在大部分条件下,路径分析模型的参数估计值是最低测量模型中同时纳入项目与项目小组层面,形成双的,其次是信度校正模型,最高的是同质性项目组[51]层测量模型(two-facets measurement model),即在合模型。对此,Coffman等人的解释是路径分析项目小组层面下又加入了原始的项目层面,丰富了模型完全没有控制测量误差,而信度校正模型只是模型的信息,使拟合更准确。这种方法类似于二阶部分控制了测量误差。因为按照经典测量理论,误验证性因素分析,不同的是一阶因子变成了项目小差变异(独特变异)应包括随机误差与系统误差两组,而且在同一项目小组下,所有项目的负荷均被部分,而(1﹣ρ)所反映的却仅仅是随机误差。xx设为相等。Hagtvet等研究者希望以这种方法来为我所以用信度校正方法会造成对指标独特变异的低们诊断项目小组在多大程度上代替项目提供一个估,故使其在路径参数的估计上可能比项目组合模有效工具。 型有更大的偏差。所以Coffman等人建议,在应用 关注结构模型 SEM的实证研究中,最好不要使用完全聚合的路径在实证研究领域,绝大部分研究关注的是变量分析模型;如果有较好的信度指标,可以使用信度之间的联系,而不仅仅是某一概念本身。所以,人校正模型使路径模型变为潜变量模型;在三种模型们使用SEM的最终目的是对潜变量之间联系进行中,部分分散的项目组合模型应该是研究者的最佳探讨。当然,在这之前我们必须对所有潜变量的测选择。 量模型进行细致的检验,以保证其信效度。但是,6 结语 [48]并非所有研究都严格按照Anderson与Gerbing提尽管目前针对项目组合的研究还很少,但是项出的这种两步取向(two-step approach),相反,很目组合技术已在研究实践中得到广泛应用,以至于多应用SEM的实证研究更多采用完全聚合的路径它几乎成为一种“万能药”。但是,这种“万能药”[49]分析模型来探索变量之间关系。 目前似乎存在着滥用的危险。在SEM中采用项目正如我们在前面提到的那样,完全聚合的路径组合,是合理简化抑或投机取巧?这本身就是一个分析以量表总分或平均分来反映变量,实际上是直极富争议的话题。即使使用项目组合是合理的,那接以观测变量代替潜变量,其内在假设是不存在测它是否在任何时候都是必要的?如果项目层面的量误差。但这样的前提假设很明显不可能实现。所模型已经很好,项目组合又能为我们带来什么?我以,使用路径分析必然会给参数估计带来难以预料们应当如何使用这种技术才能使它达到最佳效的偏差。通常状况下,如果不考虑测量误差,变量果?显然,项目组合要不要使用、什么情况下使用、[29]之间的关系会被低估。为了解决这一问题,有学
-574- 心理科学进展 2007年 怎么使用等等已经成为非常重要的研究议题。 种影响?哪种组合方法占优?现有研究大多关心无论从理论上还是从实践上,我们都可以找出的是项目组合已经被使用了,它们会带来怎样的效大量理由来使用项目组合:它减少了参数估计数果;而还不太关心它们是怎么被使用的,各种组合量;提供更稳定的参数估计与更好的模型拟合;它的方法是否会给模型拟合、参数估计带来细微的差甚至可以改善指标的分布属性等等。但是,看到这异等等。另外,项目组合在一些SEM高阶应用中些合理性的同时我们也必须注意它可能会带来的的效果也有待检验。如它在多层模型、潜在生长模一些问题,其中最严重的是模型错误设定。即,通型以及调节作用检验中会扮演什么样的角色,需要过项目组合,你获得的可能是膨胀了的模型拟合指更多探索性的研究来揭示。最后,未来项目组合的数,这些指数会诱使你错误接受那些不正确的模研究也需要与不同的测量理论相结合,如项目反应型。所以在使用项目小组时,我们必须在好的模型理论(IRT)及概化理论(GT),以从更加广阔的视拟合与正确的反映变量关系之间做出一定的权衡。野来了解其内在作用原理。 不论一个模型拟合得再好,若它不能正确反映变量参考文献 之间的关系,它也没有任何意义。 [1] Hinkin T R. A review of scale development practices in the 针对这一点,我们在做出是否需要进行项目组study of organizations. Journal of Management, 1995, 21: 合的决定之前应该充分考虑研究的目的与具体情967~988 境。使用潜变量的实证研究,要么关注于指标与潜[2] 黄芳铭. 结构方程模式——理论与应用. 北京:中国税务变量之间的关系(测量模型),要么关注于潜变量出版社, 2005. 2~3 [3] Rogers W M, Schmitt N. Parameter Recovery and Model Fit 之间的联系(结构模型)。如果研究的目的侧重于Using Multidimensional Composites: A Comparison of Four 前者,那么最好不要使用项目组合,因为这样会使Empirical Parceling Algorithms. Multivariate Behavioral 其缺陷更加突显;相反,若研究目的侧重于后者,Research, 2004, 39(3): 379~412 项目组合会是一个不错的选择。但即使是在这种情[4] Yuan K-H, Bentler P M, Kano Y. On averaging variables in a 形下,我们仍需注意:好的拟合结果仍旧可能是通CFA model. Behaviormetrika, 1997, 24: 71~83 过增强测量模型并以结构关系为代价而得到的。 [5] Nasser F, Takahashi T. The effect of using item parcels on ad hoc goodness-of-fit indexes in confirmatory factor analysis: 对于项目组合的具体操作,我们将给出以下一An example using Sarason’s Reactions to Tests. Applied 些建议:(1)根据研究的目的与具体情境选择是否Measurement in Education, 2003, 16: 75~97 需要组合。(2)组合之前必须首先确定概念的维度[6] Kim S. Assessment of item parcels in representing latent 性。如果概念是单维的,随机取向的组合方法应该variables. Unpublished doctoral dissertation, University of 是最佳选择,因为它既经济又实用;如果概念是多Georgia, Athens, 2000 维结构,最好使用内部一致性法或分隔法进行组[7] Cattell R B, Burdsal C A Jr. The radial parcel double factoring design: A solution to the item-vs-parcel controversy. 合,或者在各个维度下分别组合,以尽量保持项目Multivariate Behavioral Research, 1975, 10: 165~179 小组内的同质性。(3)项目组合最好建立在一定的[8] Landis R S, Beal D J, Tesluk P E. A comparison of 理论基础上。在选择组合方法时,应该以理论驱动approaches to forming composite measures in structural 或内容取向优先,最好不要完全依赖于纯数据驱动equation models. Organizational Research Methods, 2000, 3: 的方法,否则结果将会变得难以解释。(4)组合时186~207 尽量使一个项目小组内含有更多项目,这样才会使[9] Oliver J M, May M J, Handal P J. The factor structure of the family environment scale: Factors derived from subscales. 项目组合的优势充分体现。(5)最后,如果概念的Journal of Clinical Psychology, 1988, 44(5): 723~727 内在结构未知或尚不清晰,不要使用项目组合,因[10] Prats D C. The effects of forming miniscales on the 为这种情况下组合会使概念内涵和结构变得模糊construct validity of the test anxiety inventory. Paper presented 而无法解释。 at the National Council on Measurement in Education, Boston, 随着项目组合在SEM中的应用越来越广,它1990 必然会受到更多的重视,并成为今后SEM领域的[11] Sykes R C, Ito K. The effect of rounding aggregated item ratings for constructed response items in mixed-item format 研究热点之一。未来项目组合研究的方向可能有:tests. Paper presented at the annual meeting of the National 各种组合方法会对模型拟合以及参数估计产生何
第15卷第3期 项目组合在结构方程模型中的应用 -575- Council on Measurement in Education, San Diego, CA, 1998 Old Dominion, 2005 [12] Wainer H, Kiely G L. Item clusters and computerized [25] Plummer B A. To parcel or not to parcel: The effects of item adaptive testing: A case for testlets. Journal of Educational parceling in confirmatory factor analysis. Unpublished Measurement, 1987, 24: 185~201 doctoral dissertation, University of Rhode Island, 2000 [13] Thompson B, Melancon J G. Using item “testlets” “parcels” [26] Takana J S. “How big is big enough?”: Sample size and in confirmatory factor analysis: An example using the goodness of fit in structural equation models with latent PPSDQ-78. Paper presented at the annual meeting of the variables. Child Development, 1987, 58: 134~146 Mid-South Educational Research Association, Tuscaloosa, AL, [27] Ding L, Velicer W F, Harlow L L. The effects of estimation 1996 methods, number of indicators per factor and improper [14] Bandalos D L, Finney S J. Item parceling issues in structural solutions on structural equation modeling fit indices. Structural equation modeling. In Marcoulides G A, Schumacker R E Equation Modeling, 1995, 2: 119~144 (Eds.), New developments and techniques in structural [28] Gerbing D W, Anderson J C. Improper solutions in the equation modeling Mahwah, NJ: Lawrence Erlbaum analysis of covariance structures: Their interpretability and a Associates, Inc, 2001. 269~296 comparison of alternate respecification. Psychometrika, 1987, [15] Bagozzi R P, Edwards J R. A general approach for 52: 99~111 representing constructs in organizational research. [29] 侯杰泰, 温忠麟, 成子娟. 结构方程模型及其应用. 北Organizational Research Methods, 1998, 1: 45~87 京:教育科学出版社, 2004. 125~136 [16] Little T D, Lindenberger U, Nesselroade J R. On selecting [30] Marsh H W, Hau K T, Balla J R, Grayson D. Is more ever indicators for multivariate measurement and modeling with too much? The number of indicators per factor in confirmatory latent variables: When “good” indicators are bad and “bad” factor analysis. Multivariate Behavioral Research, 1998, 33: indicators are good. Psychological Methods, 1999, 4: 192~211 181~220 [17] Little T D, Cunningham W A, Shahar G, Widaman K F. To [31] MacCallum R C,Widaman K F, Zhang S, Hong S. Sample parcel or not to parcel: Exploring the question, weighing the size in factor analysis. Psychological Methods, 1999, 4: 84~99 merits. Structural Equation Modeling, 2002, 9: 151~173 [32] Bandalos D L. The effects of item parceling on [18] Hu L-T, Bentler P M. Fit indices in covariance structure goodness-of-fit and parameter estimate bias in structural modeling: Sensitivity to underparameterized model equation modeling. Structural Equation Modeling, 2002, 9: misspecification. Psychological Methods, 1998, 3(4): 424~453 78~102 [19] Curran P J, West S G, Finch J F. The robustness of test [33] Gribbons B C, Hocevar D. Levels of aggregation in higher statistics to nonnormality and specification error in level confirmatory factor analysis: Application for academic confirmatory factor analysis. Psychological Methods, 1996, self-concept. Structural Equation Modeling, 1998, 5(4): 1(1): 16~29 377~390 [20] West S G, Finch J F, Curran P J. Structural equation [34] Nasser F, Takahashi T, Benson J. The structure of test modeling with nonnormal variables: Problems and remedies. anxiety in Israeli-Arab high school students: An application of In Hoyle R H (Ed.), Structural equation modeling: Concepts, confirmatory factor analysis with miniscales. Anxiety, Stress, issues, and applications. Thousand Oaks, CA: Sage, 1995. and Coping, 1997, 10: 129~151 56~75 [35] Nasser F, Wisenbaker J. A Monte Carlo Study Investigating [21] Hau K T, Marsh H W. The use of item parcels in structural the Impact of Item Parceling on Measures of Fit in equation modeling: Non-normal data and small sample size. Confirmatory Factor Analysis. Educational and Psychological British Journal of Mathematical Statistical Psychology, 2004, Measurement, 2003, 63(5): 729~757 57: 327~351 [36] Eysenck H J, Eysenck S B G. Personality structure and [22] Rushton J P, Brainerd C J, Pressley M. Behavioral measurement. London: Routledge & Kegan Paul, 1969 development and construct validity: The principle of [37] Hagtvet K A, Nasser F M. How well do item parcels aggregation. Psychological Bulletin, 1983, 94: 18~38 represent conceptually defined latent constructs? A two-facet [23] Cohen P, Cohen J, Teresi J, Marchi M, Noemi Velez C. approach. Structural Equation Modeling, 2004, 11: 168~193 Problems in the measurement of latent variables in structural [38] Bandalos D L. Assessing sources of error in structural equations causal models. Applied Psychological Measurement, equation models: The effects of sample size, reliability, and 1990, 14: 183~196 model misspecifications. Structural Equation Modeling, 1997, [24] Fletcher T D. The effects of parcels and latent variable 4: 177~192 scores on the detection of interactions in structural equation [39] Meade A W, Kroustalis C M. Problems with item parceling modeling. Unpublished doctoral dissertation, University of for confirmatory factor analytic tests of measurement
-576- 心理科学进展 2007年 invariance. Organizational Research Methods, 2006, 9: [46] Kim S, Hagtvet K A. The impact of misspecified item 369~403 parceling on representing latent variables in covariance [40] Barrett P, Kline P. Radial parcel factor analysis. Personality structural modeling: A simulation study. Structural Equation and Individual Differences, 1981, 2: 311~318 Modeling, 2003, 10: 101~127 [41] Snell A F, Hall R J, Foust M S. Are testlets created equal: [47] Hagtvet K A, Solhaug T A. Two-Facet Measurement Examining testlet construction strategies in SEM. Paper Methodology for Assessing Item Parcels: An application to presentation at annual meeting of the Academy of measuring political knowledge in secondary school. Management, Boston, 1997 Scandinavian Journal of Educational Research, 2005, 49(4): [42] Cramer D. Job satisfaction and organizational continuance 399~417 commitment: A two-wave panel study. Journal of [48] Anderson J C, Gerbing D W. Structural equation modeling Organizational Behavior, 1996, 17: 389~400 in practice: A review and recommended two-step approach. [43] Schau C, Stevens J, Dauphinee T L, Vecchio A D. The Psychological Bulletin, 1988, 103: 411~423 development and validation of the survey of attitudes toward [49] MacCallum R C, Austin J T. Applications of structural statistics. Educational and Psychological Measurement, 1995, equation modeling in psychological research. Annual Review 55: 868~875 of Psychology, 2000, 51: 201~226 [44] Kishton J M, Widaman K F. Unidimensional versus domain [50] Chan D. The conceptualization and analysis of change over representative parceling of questionnaire items: An empirical time: An integrative approach incorporating longitudinal example. Educational and Psychological Measurement, 1994, means and covariance structures analysis (LMACS) and 54: 757~765 multiple indicator latent growth modeling (MLGM). [45] Hall R J, Snell A F, Foust M S. Item parceling strategies in Organizational Research Methods, 1998, 1: 421~483 SEM: Investigating the subtle effects of unmodeled secondary [51] Coffamn D L, MacCallum R C. Using parcels to convert constructs. Organizational Research Methods, 1999, 2: path analysis models into latent variable models. Multivariate 233~256 Behavioral Research, 2005, 40: 235~259 Item Parceling Strategies in Structural Equation Modeling Bian Ran, Che Hongsheng, Yang Hui (Beijing Key Lab for Applied Experimental Psychology, Beijing Normal University, Beijing 100875, China) Abstract: Item parceling could be defined as a technique of composing two or more items assessing the same construct to a new manifest indicator. Although item parceling was controversial all the time, it attracted more and more researchers’ attention since this technique had been widely applied in structural equation modeling procedures. The purpose of this article is to discuss some important aspects about the research in this field, especially the rationale, the advantage and disadvantage, and the methods of parceling practice. On this base, we give some advice about how to construct item parcels, including (a) choosing to parcel or not to parcel according to the research goal and situation; (b) ensuring the dimensionality before parceling; and (c) building parcels on certain theories etc. Future research can focus on the impact of various parceling methods on the model fit and estimates, or the application of parceling in advanced SEM procedures and other measurement theories. Key words: item parceling, parcel, structural equation model.