温忠麟:预测视角下双因子模型与高阶因子模型的一般性模拟比较论文

预测视角下双因子模型与高阶因子模型的一般性模拟比较<span class="superscript">*</span

预测视角下双因子模型与高阶因子模型的一般性模拟比较*

温忠麟1汤丹丹1顾红磊2

(1华南师范大学心理应用研究中心/心理学院, 广州 510631) (2信阳师范学院教育科学学院, 信阳 464000)

摘要 高阶因子模型本质上是一种特殊的双因子模型, 应用中却常被当做双因子模型的竞争模型。已有研究以满足比例约束的双因子模型(此时等价于一个高阶因子模型)为真实测量模型产生模拟数据, 比较了用双因子模型和高阶因子模型作为测量模型的预测效果。本文使用不满足比例约束的双因子模型(此时不与任何高阶因子模型等价)为真实测量模型产生模拟数据进行比较, 所得结果与满足比例约束的双因子模型的结果有很大差别, 双因子模型结构系数的相对偏差较小、检验力较高, 但第Ⅰ类错误率略高。结论是, 在比例约束条件成立时可以使用高阶因子模型, 否则, 从统计角度看, 一般情况下使用双因子模型进行预测比较好。

关键词结构系数; 双因子模型; 高阶因子模型; 比例约束

1 引言

在心理、教育、管理等研究领域, 常用双因子模型(bifactor model)、高阶因子模型(high-order factormodel)拟合多维构念(multidimensional construct)。随着双因子模型的应用领域不断扩大, 不少研究者推荐使用双因子模型拟合多维构念 (Chen, Hayes, Carver, Laurenceau, & Zhang, 2012; Cucina & Byle, 2017; Hyland, Boduszek, Dhingra, Shevlin, & Egan, 2014; Salerno, Ingoglia, & Coco, 2017) 。

数理上, 高阶因子模型嵌套于双因子模型, 在负荷满足比例约束(proportion constrain)时, 两种模型等价(Schmid & Leiman, 1957; Yung, Thissen, & Mcleod, 1999)。此时, 一个高阶因子对应于一个全局因子, 解释所有题目的共同变异; 一阶因子被高阶因子解释后的残差对应于局部因子, 表示被全局因子解释后测量该因子的那些题目的共同变异(Chen, West, & Sousa, 2006)。一般情况下, 即不满足比例约束的条件下两种模型并不等价(Gustafsson & Balke, 1993; Schmid & Leiman, 1957), 但研究者常把两种模型作为竞争模型(Chen, et al, 2012; Chen, Jing, Hayes, & Lee, 2013; Cucina & Byle, 2017; Gu, Wen, & Fan, 2017a; Hyland, et al., 2014)。Chen等人(2006)基于实测数据比较了效标为显变量时, 两种模型的拟合指数和结构系数(structural coefficient, 又称效度系数)。徐霜雪、俞宗火和李月梅(2017, 后面简称徐文)模拟研究了效标分别为显变量和潜变量时, 两种模型的拟合指数和结构系数偏差。但徐文的研究目的和结论中所提到的双因子模型是一般的双因子模型, 而在其模拟研究中所使用的双因子模型却是满足比例约束的双因子模型(此时等价于一个高阶因子模型)。

如要一般地比较双因子模型和高阶因子模型, 真模型应该有两个——满足比例约束的双因子模型(此时等价于一个高阶因子模型)、不满足比例约束的双因子模型(此时不等价于任何一个高阶因子模型)。对于前一种真模型产生的数据(徐文已做), 无论用双因子模型还是高阶因子模型去拟合, 都是拟合了真模型; 而对于后一种真模型产生的数据(徐文未做), 用双因子模型是拟合了真模型, 用高阶因子模型则拟合了误设模型。

两种模型参数估计和检验的比较, 徐文只是比较了结构系数估计的相对偏差。其实还应当比较统计检验力、第Ⅰ类错误率(例见Gu, Wen, & Fan, 2017b;Wu, Wen, Marsh, & Hau, 2013), 才能做出比较全面的评价。此外, 徐文的模拟中将结构系数固定不变, 其实结构系数也作为模拟实验的条件进行设计比较好。而且, 为了比较检验力和第I类错误率, 这样的设计是必须的。本文增加了这方面的工作。

本文将通过蒙特卡洛(Monte Carlo)模拟, 用两种双因子模型(满足和不满足比例约束)产生数据, 研究效标分别为潜变量和显变量时, 双因子模型和高阶因子模型在预测视角下的表现, 系统比较结构系数的相对偏差、统计检验力、第Ⅰ类错误率等。

(3) 样本容量： 200, 500和1000。

2 模型概述

2.1 双因子模型

双因子模型又称为全局−局部因子模型(general-special factor model), 如图1中的M1所示。双因子模型假设同时存在全局因子(general factor)和局部因子(special factor), 全局因子解释所有题目的共同变异; 局部因子解释控制了全局因子后部分题目(测量了一个维度)的共同变异(Chen, et al., 2006; 顾红磊, 温忠麟, 2017)。该模型在很多领域都有应用, 如管理心理学、健康心理学、教育心理学等(Distefano, Greer, & Kamphaus, 2013; Howard, Gagné, Morin, & Forest, 2018; Wang, Fredricks, Hofkens, & Linn, 2016)。

(1) 全局因子的负荷：0.4, 0.5, 0.6和0.7。全局因子共12个题目, 每种条件下, 全部12个题目在全局因子上的负荷都相等(Reise, Scheines, Widaman, & Haviland, 2013; 徐霜雪等, 2017)。不满足比例约束条件的双因子模型的一个充分(但不必要)条件是, 不同题目在同一个局部因子上的负荷各不相等, 但在全局因子上的负荷相等。Mb每个局部因子的4个题目, 其负荷分别设置为0.4, 0.5, 0.6, 0.7。

, (1)

其中,是题目xi在全局因子G上的负荷,是题目xi在局部因子Sj上的负荷,是题目xi的测验误差。

该模型假设全局因子和局部因子不相关, 局部因子之间可以相关; 误差与全局因子、局部因子不相关, 且误差之间不相关。若局部因子之间也不相关, 则为正交双因子模型。和徐文一样, 本研究采用有3个局部因子、每个局部因子4个指标的正交双因子模型。

兼顾风险与收益的主动配电网非正常停运恢复策略//周天,郝丽丽,王昊昊,李威,李乃双//(13):136

图1 双因子模型M1和高阶因子模型M2

2.2 高阶因子模型

常见的高阶因子模型是二阶因子(second-order factor)模型, 如图1中的M2所示。高阶因子解释全部一阶因子(维度)的共同变异, 一阶因子解释相应维度的一组题目的共同变异(顾红磊, 温忠麟, 2017)。

Seminar教学的核心环节就是汇报工作，宣讲自己对于课题的研究成果、某种学术观点的认识见解，然后师生在此基础上展开讨论，这都需要研究生具有较强的综合表达能力。Seminar教学过程需要学生逻辑清晰地阐明学术观点，简明扼要、重点突出地回答师生提问，并能够围绕一个主题进行有理有据的辩论，科学理性地说服他人。通过上述过程，研究生可以在逻辑思维、口头交流、PPT展示、着装仪表等综合能力方面得到明显提高，有助于其完成研究生阶段的中期开题和毕业答辩。

假设一份测验由m个题目组成, 测量了一个高阶因子G和n个一阶因子, 则题目xi可以表示为(侯杰泰, 温忠麟, 成子娟, 2004)：

首先，我对意见箱爬得太高有意见。你猴子爬杆般蹿上去三四米高，我不但踮脚够不着，搬凳子也够不着；我只能扛梯子，才能够得着。可是我上哪找梯子去？我扛着梯子去提意见，唯恐天下人不知道我要去提意见了？什么，让我半夜扛梯子去？大半夜磕磕绊绊地，磕了东家的墙，撞了西家的灯，别人不得对我有意见？我吃饱了撑的？我有意见也不提了，但是我还是保留对高高在上的意见箱的意见。

, (2)

,(3)

其中,λij是题目xi在一阶因子Fj上的负荷,δi是题目xi的测验误差;hj是一阶因子Fj在高阶因子G上的负荷,Sj是一阶因子Fj被高阶因子G解释后的残差(简称为一阶因子的残差), 对应于双因子模型中的局部因子, 故两者都用符号S表示。该模型假设误差间不相关。本研究采用有3个一阶因子, 每个一阶因子4个题目的高阶因子模型。

由于周围光的噪声影响，原始PPG信号的波形具有毛刺，特征点不易识别。令Sr(n)表示原始PPG序列，其中n=0,1,...,1999表示样本编号。本文对Sr(n)进行跨度为15的滑动均匀滤波，得到滤波后的脉搏波序列Ss(n)，如公式（1）所示。滑动均匀滤波计算简单，在信号采集条件较为理想的情况下，能保持波形特征情况下消除毛刺。

2.3 两种模型的关系

高阶因子模型嵌套于双因子模型(Schmid & Leiman, 1957; Yung, et al., 1999), 任何一个高阶因子模型都可以转化为一个双因子模型。原来的高阶因子变成了全局因子, 一个题目xi在全局因子上的负荷ai等于该题目在一阶因子Fj上的负荷λij乘以该一阶因子在高阶因子上的负荷hj, 即ai=λijhj; 一阶因子Fj被高阶因子解释后的残差Sj变成了局部因子, 即一阶因子的残差相当于局部因子, 题目xi在局部因子Sj上的负荷就等于该题目在一阶因子上的负荷λij, 这不难将公式(3)代入公式(2)并与公式(1)比较推导出来(Demars, 2006; Schmid & Leiman, 1957)。

(2) 全局因子和局部因子的结构系数设置了三种组合：0.3、0.3; 0、0.3; 0.3、0。例如, 0、0.3表示全局因子对效标的效应为0, 3个局部因子对效标的效应都是0.3。

2.4 预测视角下两种模型的关系

S3 by x9-x12*; !S1-S3表示局部因子

(4)

其中,c表示全局因子G对效标的效应大小,cj表示局部因子Sj对效标的效应大小,e表示预测残差。这里的效应就是所谓的结构系数。Mplus程序见附录1。

通信公司具有庞大的人力资源管理系统，在实际的管理过程中，依然存在一定的问题。其中，人力资源管理理念滞后就是存在的问题之一。管理理念滞后的原因主要在于管理方式选择不当。目前，部分通信公司还采用职能制的管理方式，这种管理方式不利于大型的人力资源管理，随着通信行业的飞速发展，显然不适用于通信公司。还有部分通信公司采用分割制管理方式，其不利于企业管理者与员工很好的沟通，进而对于公司的发展会产生限制。总之，无论是哪种管理方式，都难以促使人力资源发挥应有的作用[1]。

图2 双因子模型Mb对效标变量的预测

在高阶因子模型中, 虽然可以直接考虑高阶因子和一阶因子对效标的作用, 但为了跟徐文的相应模型一致, 先建立如下模型。在高阶因子模型中, 高阶因子作为预测变量表示一阶因子之间的共同特质对效标的作用, 一阶因子的残差(正是双因子模型的局部因子)作为预测变量表示部分题目的额外共同特质对效标的作用, 如图3所示。当有n个一阶因子时, 公式为

(5)

其中,c表示高阶因子G对效标的效应大小,cj表示一阶因子的残差Sj对效标的效应大小,e表示预测残差。

图3 高阶因子模型Mh对效标变量的预测

对于上述高阶因子建模, EQS软件可以直接使用一阶因子的残差作为预测变量(Bentler, 1995), 但Mplus软件仅可以使用一阶因子作为预测变量(Muthén & Muthén, 2012)。把公式(3)代入公式(5)可得

以常规护理方式为对照组患者开展护理,包括接受患者电话咨询、发放健康知识手册等,观察组则在此基础上行网络健康护理干预,具体措施如下。

(6)

根据公式(6), 可以将一阶因子作为预测变量, 其对效标的效应与一阶因子的残差作为预测变量时一模一样, 但此时高阶因子对效标的效应为。因此, 在Mplus软件中, 可以把模型设置为高阶因子和一阶因子作为预测变量, 然后利用公式, 便可以转化为高阶因子和一阶因子的残差作为预测变量的结果。Mplus程序见附录2。

3 模拟研究

我们首先重复了徐文的模拟研究, 即真模型是满足比例约束的双因子模型。无论效标变量是显变量还是潜变量, 在估计偏差上得到的结果与徐文高度一致, 即满足比例约束的情形, 高阶因子模型结构系数的相对偏差比较小。此外还发现, 检验力方面, 若真模型是全局因子和局部因子同时作为预测变量, 整体上双因子模型的统计检验力较高。相应地, 无论真模型是全局因子还是局部因子作为预测变量, 都是高阶因子模型的第Ⅰ类错误率较小。为了节省篇幅, 这里不报告细节。

下面报告真模型为不满足比例约束的双因子模型的模拟研究, 这是徐文没有做的情形。虽然我们也考虑了效标为潜变量和显变量的两种设计, 但因为两种设计的结果高度一致, 所以下面只报告效标为潜变量的情形, 与徐文的一样, 效标潜变量有3个指标、标准化的负荷固定为比较有代表性的0.7 (也见Gu et al., 2017b)。模拟研究设计主要是针对预测变量的测量模型进行。

3.1 研究设计

真模型为不满足比例约束的双因子模型, 由符合下列条件的双因子模型Mb产生数据, 为与徐文对比, 参数设计尽量与徐文的设计一致, 但本文对结构系数也做了设计(在考虑用检验力和第I类错误率进行评价时是必须的)。

假设一份测验由m个题目组成, 测量了一个全局因子G和n个局部因子, 则题目可以表示为(叶宝娟, 温忠麟, 2012)：

Schmid和Leiman (1957)证明在满足比例约束时, 两种模型是等价的。比例约束是指, 在每个维度中, 全局因子的负荷和局部因子的负荷之比等于一个常数, 此常数为一阶因子在高阶因子上的负荷hj, 但不同维度中这个常数可以不同。然而, 一般的双因子模型是不满足比例约束条件的, 实际中也很难找到多维构念恰好可用满足比例约束条件的双因子模型去拟合。例如, 在Personality and Individual Differences期刊发表的关于双因子模型应用的文章中, 有33篇论文报告了因子负荷, 没有一个双因子模型是满足比例约束的。

与受到意识形态、精英意识、道德伦理、历史编纂原则四道筛子过滤制约的正史记载相比，民间口承叙事作为底层大众的日常生活方式，它更加贴近生活、贴近真实、贴近最为本能的民众诉求，这使它常常显现出非同寻常的爆发力和想象力，使其对历史的记忆和理解展现出极为必要的底层性与多元性。只有将历史“本文”与辽宁满族民间口承叙事“文本”并置，于二者的关联中寻找互补、印证、叠合、传承的要素，才能真正建构起完整而全面的满族区域文化历史。

(4) 用于估计的模型：双因子模型Mb和高阶因子模型Mh。

本模拟实验是4×3×3×2的混合设计, 前3个因素都是被试间因素, 最后一个因素是被试内因素。对于被试间因素, 共有36种水平组合。使用Mplus 7.4模拟生成1000个样本数据, 即每种组合重复1000次。

通过系统全面的排查、检测和分析，对兰考豫11井2017年6月水温、水位大幅度下降异常得出结论：①异常变化不是观测环境变化引起的；②异常变化不是观测系统故障引起的；③异常变化可能是井管老化微裂处突然出现较大裂隙后，井中地下水与井壁外地下水由于存在水力梯度形成对流造成的；④异常变化为地震前兆异常的可能性很小。

全局因子负荷、局部因子负荷、结构系数、样本容量为条件, 估计的模型——双因子模型和高阶因子模型为关注对象。据此可以在不同数据条件下进行比较, 包括模型拟合程度、结构系数的相对偏差、统计检验力、第Ⅰ类错误率, 还可以了解当全局因子和局部因子负荷、样本容量变化时, 比较指标的变化。

3.2 结果

本文除了和徐文一样报告了样本容量为1000的结果外, 同时报告样本容量为500和200的结果。

3.2.1 适当解

排除不恰当解的结果, 如不收敛、方差和标准误为负的情形, 仅考虑恰当解的情况。样本容量为1000时, 两种模型的收敛率都在99%以上。随着样本容量减少, 两种模型的收敛率降低, 但都在92%以上, 最大相差6%。同种情况下, 高阶因子模型的收敛率高于双因子模型。

3.2.2 模型拟合

当真模型满足比例约束条件时, 与双因子模型相比, 高阶因子模型结构系数的相对偏差较小(这和徐文的结果一致); 第I类错误率较低, 但检验力也较低。两种模型的拟合程度差别不大, 都达到拟合良好的标准。考虑到高阶因子模型比较省检(自由度更大), 当模型满足或近似满足比例约束条件时, 首选高阶因子模型进行预测, 尤其是样本容量较大时, 检验力较低的缺点会消失。

3.2.3 结构系数的相对偏差

相对偏差(relative bias)是指参数估计值的平均数和真实值之差除以真实值, 即, 用于衡量估计值的精度。一般认为, 相对偏差的绝对值在5%以内可以忽略(Hoogland & Boomsma, 1998), 在10%以内可以接受, 且可以认为是无偏估计(Reise et al., 2013)。和徐文一样, 本研究比较相对偏差的绝对值。

由于三个局部因子(一阶因子的残差)为预测变量时, 三条路径作用相同, 这里只考虑其中一条路径(S1因子的结构系数)的结果, 如图4所示。双因子模型结构系数的相对偏差比高阶因子模型的普遍较小, 但存在交互作用：样本容量较小而且全局因子负荷较低时, 双因子模型结构系数的相对偏差较大; 样本容量较大时, 双因子模型结构系数的相对偏差较小。85%的处理中, 双因子模型结构系数的相对偏差小于10%。随着样本容量的增加, 整体上两种模型结构系数的相对偏差变小。此外, 全局因子负荷越大, 双因子模型结构系数的相对偏差越小。

3.2.4 统计检验力

统计检验力(power)是指真值不为0时, 估计值显著不等于0的概率。统计检验力越接近1越好。由图5可见, 在所有条件下, 都是双因子模型的统计检验力比较高。样本容量越大, 两种模型的统计检验力都越高。此外, 全局因子负荷越大, 两种模型的统计检验力都越高。

3.2.5 第I类错误率

第I类错误率(type I error rate)是指真值为0时, 估计值显著不等于0的概率。一般认为第I类错误率越接近真值0.05越好, 在0.025~0.075之间是可以接受的(Bradley & James, 1978; Mackinnon, Lockwood, & Williams, 2004; Wu et al., 2013)。

和检验力的结果类似, 双因子模型的第I类错误率比较大(见图6)。当N= 1000时, 在模拟的各种条件下两种模型的第I类错误率几乎都在可接受范围。但在样本容量较小而且全局因子负荷较低时, 双因子模型的第I类错误率大于可接受的范围。全局因子负荷越大, 双因子模型的第I类错误率越接近0.05。

3.3 小结

本模拟研究是徐文没做的一个新研究, 产生数据的双因子模型不等价于任何一个高阶因子模型。多数情况下, 双因子模型结构系数的相对偏差比较小, 尤其是当N= 1000的时候, 双因子模型一致小于高阶因子模型。但在N小的时候, 两种模型的相对偏差大小比较没有一致的结果, 尤其是全局因子的负荷较小时。检验力方面, 各种情况下都是双因子模型的比较高。相应地, 无论真模型是全局因子还是局部因子作为预测变量, 都是双因子模型的第I类错误率比较大。

综合考虑质量成本及井下安装实际情况，选取方案1作为整体结构方案，智能调控装置整体结构三维模型如图5所示。

图4 不满足比例约束条件时结构系数的相对偏差

注：横轴G表示全局因子负荷(下同); 纵轴G-Bias%表示G因子的结构系数的相对偏差; S1-Bias%表示S1因子的结构系数的相对偏差。

图5 不满足比例约束条件时结构系数的统计检验力

注：G-Power表示G因子的结构系数统计检验力, S1-Power表示S1因子的结构系数统计检验力。

图6 不满足比例约束条件时结构系数的第I类错误率

注：G-I Error表示G因子的结构系数的第I类错误率, S1-I Error表示S1因子的结构系数的第I类错误率。

4 结论和讨论

徐文研究以满足比例约束的双因子模型(此时等价于一个高阶因子模型)为真实测量模型产生模拟数据, 比较了用双因子模型和高阶因子模型作为测量模型的结构系数。在其研究中, 无论使用的是双因子模型还是高阶因子模型, 都是拟合了真模型。本文使用不满足比例约束的双因子模型为真实测量模型产生模拟数据进行比较, 无论结果是否与徐文相同, 都是有意义的。徐文的模拟研究结果只能说明, 满足比例约束条件时, 高阶因子模型结构系数的相对偏差更小。但一般情况下比例约束条件是不满足的, 在此种情况下, 如果徐文的结果还正确, 则可将徐文结果推广到很一般的范围; 如果徐文结果不再正确, 则本文的意义更大。此外, 本文从多角度比较了两种模型的表现, 包括拟合指数、结构系数的相对偏差、统计检验力、第I类错误率。

一般认为, CFI (comparative fit index)和TLI (Tucker-Lewis Index)大于0.9, RMSEA (Root Mean Square Error of Approximation)和SRMR (Standardized Root Mean square Residual)小于0.08, 则模型整体拟合良好(Marsh, Hau, & Wen, 2004; 温忠麟, 侯杰泰, 马什赫伯特, 2004)。信息指数AIC、ABIC越小, 则模型拟合越好(Burnham & Anderson, 1998)。所有条件下, 双因子模型拟合较好。虽然高阶因子模型拟合比双因子模型差, 但也达到了拟合良好的标准。

当真模型不满足比例约束条件时, 使用高阶因子模型可以说是拟合了误设模型。即使高阶因子模型的拟合指数还是可以接受, 但比双因子模型拟合要差。更重要的是, 与高阶因子模型相比, 双因子模型结构系数的相对偏差普遍较小, 尤其是当N较大的时候。这与徐文的结果正好相反, 所以徐文的结果没有普遍性。此外, 各种情况下都是双因子模型的统计检验力较高, 相应地, 第I类错误率也略高(尤其样本容量比较小的时候)。总之, 当模型不满足比例约束条件时(通常的应用属于此种情况), 从统计角度不能说高阶因子模型比双因子模型还好。

那么, 是不是在预测视角下, 就优先考虑双因子模型呢？也不是, 而是应当从学科理论出发、结合研究目的选用模型。与双因子模型相比, 高阶因子模型不仅更加简洁, 而且其中的一阶因子比局部因子更容易理解。如果研究者使用高阶因子模型进行预测, 而整个模型已经拟合良好, 且各项评价指标也达到要求, 是可以接受的。但高阶因子模型可以接受, 并不能说它优于双因子模型。

高阶因子模型的高阶因子定义在一阶因子上而非观测变量(题目)上, 因此高阶因子对观测变量没有直接效应, 一阶因子相当于中介变量, 高阶因子对观测变量的作用完全通过一阶因子的作用实现(Gignac, 2008; 顾红磊, 温忠麟, 2017)。而双因子模型的全局因子和局部因子都直接定义在观测变量上, 对观测变量都是直接效应, 有时候更易解释全局因子、局部因子和效标变量之间的关系(Beaujean, Parkin, & Parker, 2014; Chen et al., 2006)。特别是当使用高阶因子模型结果不理想的时候, 双因子模型是值得考虑的替代模型。

本研究中发现若不满足比例约束条件, 样本容量为1000时, 双因子模型的第I类错误率基本上可以接受; 样本容量为500时, 近六成的处理中双因子模型的第I类错误率都在可接受的范围内。因此, 使用双因子模型时样本宜大一些, 比如不小于500。此外, 高阶因子模型尤其是双因子模型较难收敛, 样本容量越大越有助于提高收敛性, 而且大样本(如超过500)得到的预测偏差基本上在可接受范围, 也有较高的检验力。

有时候根据常用的拟合指数可能不知道是用双因子模型还是高阶因子模型拟合多维构念较好, 但模拟研究发现满足比例约束的双因子模型和不满足比例约束的双因子模型的信息指数(例如, AIC、ABIC)表现不一。对于AIC和ABIC, 满足比例约束条件时双因子模型的比较大, 而不满足比例约束条件时高阶因子模型的比较大。在实证研究中, 可以通过比较两种模型的AIC和ABIC判断哪个更适宜拟合多维构念。如果双因子模型的AIC、BIC较大, 倾向于选用高阶因子模型, 否则考虑使用双因子模型研究结构系数, 也便于进一步解释多维构念与效标之间的关系。

为了比较徐文结果, 本研究与徐文一样使用正交双因子模型。但正交双因子模型假设局部因子间不相关。在更一般的情况下, 即双因子模型的局部因子允许相关, 本研究结果是否全部成立, 有待进一步研究。

参考文献

Beaujean, A. A., Parkin, J., & Parker, S. (2014). Comparing Cattell-Horn-Carroll factor models: Differences between bifactor and higher order factor models in predicting language achievement. Psychological Assessment, 26(3), 789–805.

Bentler, P. M. (1995). EQS 6 structural equations program manual. Encino, CA: Multivariate Software.

Bradley, & James, V. (1978). Robustness? British Journal of Mathematical & Statistical Psychology, 31, 144–152.

Burnham, K. P., & Anderson, D. R. (1998). Model selection and inference: A practical information-theoretic approach. New York, NY: Springer.

Chen, F. F., Hayes, A., Carver, C. S., Laurenceau, J-P., & Zhang, Z. (2012). Modeling general and specific variance in multifaceted constructs: A comparison of the bifactor model to other approaches. Journal of Personality, 80(1), 219–251.

Chen, F. F., Jing, Y., Hayes, A., & Lee, J. M. (2013). Two concepts or two approaches? A bifactor analysis of psychological and subjective well-being. Journal of Happiness Studies, 14(3), 1033–1068.

Chen, F. F., West, S. G., & Sousa, K. H. (2006). A comparison of bifactor and second-order models of quality of life. Multivariate Behavioral Research, 41(2), 189–225.

Cucina, J., & Byle, K., (2017). The bifactor model fits better than the higher-order model in more than 90% of comparisons for mental abilities test batteries. Journal of Intelligence, 5(3), 27.

Demars, C. E. (2006). Application of the bi-factor multidimensional item response theory model to testlet- based tests. Journal of Educational Measurement, 43(2), 145–168.

Distefano, C., Greer, F. W., & Kamphaus, R. W. (2013). Multifactor modeling of emotional and behavioral risk of preschool-age children. Psychological Assessment, 25(2), 467–476.

Gignac, G. E. (2008). Higher-order models versus direct hierarchical models: A superordinate or breadth factor?. Psychology Science Quarterly, 50(1), 21–43.

Gu, H., & Wen, Z. (2017). Reporting and interpreting multidimensional test scores: A bi-factor perspective. Psychological Development and Education, 33, 504–512.

[顾红磊, 温忠麟. (2017). 多维测验分数的报告与解释: 基于双因子模型的视角. 心理发展与教育, 33(4), 504–512.]

Gu, H., Wen, Z., & Fan, X. (2017a). Structural validity of the Machiavellian personality scale: A bifactor exploratory structural equation modeling approach. Personality and Individual Differences, 105, 116–123.

Gu, H., Wen, Z., & Fan, X. (2017b). Examining and controlling for wording effect in a self-report measure: A Monte Carlo simulation study. Structural Equation Modeling: A Multidisciplinary Journal, 24(4), 545–555.

Gustafsson, J. E., & Balke, G., (1993). General and specific abilities as predictors of school achievement. Multivariate Behavioral Research, 28(4), 407–434.

Hau, K. T., Wen, Z., Cheng, Z. (2004). Structural equation model and its applications. Beijing, China: Educational Science Publishing House.

[侯杰泰, 温忠麟, 成子娟. (2004). 结构方程模型及其应用. 北京：教育科学出版社.]

Hoogland, J. J., & Boomsma, A. (1998). Robustness studies in covariance structure modeling: An overview and a meta- analysis. Sociological Methods & Research, 26(3), 329– 368.

Howard, J. L., Gagné, M., Morin, A. J. S., & Forest, J. (2018). Using bifactor exploratory structural equation modeling to test for a continuum structure of motivation. Journal of Management.44(7), 2638–2664.

Hyland, P., Boduszek, D., Dhingra, K., Shevlin, M., & Egan, A. (2014). A bifactor approach to modelling the Rosenberg Self Esteem Scale. Personality and Individual Differences, 66, 188–192.

Mackinnon, D. P., Lockwood, C. M., & Williams, J. (2004). Confidence limits for the indirect effect: Distribution of the product and resampling methods. Multivariate Behavioral Research, 39(1), 99–128.

Marsh, H. W., Hau, K. T., & Wen, Z. L. (2004). In search of golden rules: Comment on hypothesis-testing approaches to setting cutoff values for fit indexes and dangers in overgeneralizing Hu and Bentler's (1999) findings. Structural Equation Modeling: A Multidisciplinary Journal, 11(3), 320–341.

Muthén, L. K., & Muthén, B. O. (2012). Mplus user’s guide(7th ed.). Los Angeles, CA: Muthén & Muthén.

Reise, S. P., Scheines, R., Widaman, K. F., & Haviland, M. G. (2013). Multidimensionality and structural coefficient bias in structural equation modeling: A bifactor perspective. Educational and Psychological Measurement, 73(1), 5–26.

Salerno, L., Ingoglia, S., & Coco, G. L. (2017). Competing factor structures of the Rosenberg Self-Esteem Scale (RSES) and its measurement invariance across clinical and non-clinical samples. Personality and Individual Differences, 113, 13–19.

Schmid, J., & Leiman, J. M. (1957). The development of hierarchical factor solutions. Psychometrika, 22(1), 53–61.

Wang, M. T., Fredricks, J. A., Ye, F., Hofkens, T. L., & Linn, J. S. (2016). The math and science engagement scales: Scale development, validation, and psychometric properties. Learning and Instruction, 43, 16–26.

Wen, Z., Hau, K.T., & Marsh, H.W. (2004). Structural equation model testing: Cutoff criteria for goodness of fit indices and chi-square test. Acta Psychologica Sinica, 36(2), 186– 194.

[温忠麟, 侯杰泰, 马什赫伯特. (2004). 结构方程模型检验:拟合指数与卡方准则. 心理学报, 36(2), 186–194.]

Wu, Y., Wen, Z., Marsh, H. W., & Hau, K-T., (2013). A comparison of strategies for forming product indicators for unequal numbers of items in structural equation models of latent interactions. Structural Equation Modeling: A Multidisciplinary Journal, 20(4), 551–567.

Xu, S. X., Yu, Z. H., & Li, Y. M. (2017). Simulated data comparison of the predictive validity between bi-factor and high-order models. Acta Psychologica Sinica, 49(8), 1125– 1136.

[徐霜雪, 俞宗火, 李月梅. (2017). 预测视角下双因子模型与高阶模型的模拟比较. 心理学报, 49(8), 1125–1136.]

Ye, B., & Wen, Z. (2012) Estimating homogeneity coefficient and its confidence interval. Acta Psychologica Sinica, 44(12), 1687–1694.

[叶宝娟, 温忠麟.(2012). 测验同质性系数及其区间估计. 心理学报, 44(12), 1687–1694.]

Yung, Y-F., Thissen, D., & Mcleod, L. D. (1999). On the relationship between the higher-order factor model and the hierarchical factor model. Psychometrika, 64(2), 113–128.

附录1

TITLE: Bifactor model

DATA: FILE = p1.dat; !文件名

VARIABLE: NAMES = y1-y3 x1-x12; !变量命名

MODEL:

Y by y1-y3; !Y表示效标变量

S1 by x1-x4*;

S2 by x5-x8*;

中午我们在海鲜馆吃饭。我说别吃海鲜了，太贵。阿花调皮一笑，说不要给老板省钱，要给老板挣钱。跟老板出来吃饭，不要嫌贵，那是看不起老板。说完自个儿笑了。

在双因子模型中, 全局因子作为预测变量表示所有题目的共同特质对效标的作用, 局部因子作为预测变量表示在控制了全局因子的影响后, 部分题目的额外共同特质对效标的作用, 如图2所示。当有n个局部因子时, 公式为

G by x1-x12*;！G表示全局因子

G@1; S1-S3@1; G with S1-S3@0; S1-S3 with S1- S3@0;

Y ON G S1-S3;！全局因子和局部因子作为预测变量

应用型本科院校教师应具备过硬的专业能力，在教学能力方面，应具备较强的专业基础知识和师范技能；在工程实践能力方面，应具有实践操作能力和工程教学能力；在国际交流能力方面，应具备一定的外语交流能力和国际视野。只有建设出一支具备较高专业基础知识、应用研究能力、师范技能、实践操作能力等专业能力的师资队伍，才能保证我国应用型本科院校的健康可持续发展。

OUTPUT: stdyx;

附录2

TITLE: High-order factor model

5.实验室检查。取病变肠段粘液涂片，以生理盐水调匀，加盖玻片后进行显微镜检查，可见大量球虫卵(囊)。取少许病鸡的新鲜血便，加 10倍饱和盐水搅匀，用60目铜筛过滤，静置15分钟后用金属纹圈沾取上层液膜镜检，可发现大量球形裂殖体。

DATA: FILE = p1.dat; !文件名

VARIABLE: NAMES = y1-y3 x1-x12;!变量命名

MODEL:

Y by y1-y3; !Y表示效标变量

F1 by x1-x4;

F2 by x5-x8;

F3 by x9-x12; !F1-F3表示一阶因子

G by F1-F3*(h1-h3);！G表示高阶因子

实例一:If people were always kind and obedient to those who are crueland unjust,the wicked people would have it all their own way,they would never feelafraid,and so they would never alter,but would worse and worse.

G@1; F1-F3@1;

Y ON G*(d)

F1-F3*(c1-c3);！高阶因子和一阶因子作为预测变量

MODEL CONSTRAINT:

NEW (c); ！c为高阶因子和一阶因子的残差作为预测变量时, 高阶因子的结构系数。

c=d+h1*c1+h2*c2+h2*c2;

OUTPUT: stdyx ;

A general simulation comparison of the predictive validity between bifactor and high-order factor models

WEN Zhonglin1; TANG Dandan1; GU Honglei2

(1 Center for Studies of Psychological Application / School of Psychology, South China Normal University, Guangzhou 510631, China) (2 School of Education Science, Xinyang Normal University, Xinyang 464000, China)

Abstract

Mathematically, a high-order factor model is nested within a bifactor model, and the two models are equivalent with a set of proportionality constraints of loadings. In applied studies, they are two alternative models. Using a true model with the proportional constraints to create simulation data (thus both the bifactor model and high-order factor model fitted the true model), Xu, Yu and Li (2017) studied structural coefficients based on bifactor models and high-order factor models by comparing the goodness of fit indexes and the relative bias of the structural coefficient in a simulation study. However, a bifactor model usually doesn’t satisfy the proportionality constraints, and it is very difficult to find a multidimensional construct that is well fitted by a bifactor model with the proportionality constraints. Hence their simulation results couldn’t extend to general situations.

Using a true model with the proportionality constraints (thus both the bifactor model and high-order factor model fitted the true model) and a true model without the proportionality constraints (thus the bifactor model fitted the true model, whereas the high-order factor model fitted a misspecified model), this Monte Carlo study investigated structural coefficients based on bifactor models and high-order factor models for either a latent or manifest variable as the criterion. Experiment factors considered in the simulation design were: (a) the loadings on the general factor, (b) the loadings on the domain specific factors, (c) the magnitude of the structural coefficient, (d) sample size. When the true model without proportionality constraints, only factors (a), (c) and (d) were considered because the loadings on domain specific factors were fixed to different levels (0.4, 0.5, 0.6, 0.7) that assured the model does not satisfy the proportionality constraints.

The main findings were as follows. (1) When the proportionality constraints were held, the high-order factor model was preferred, because it had smaller relative bias of the structural coefficient, and lower type Ⅰ error rates (but also lower statistical power, which was not a problem for a large sample). (2) When the proportionality constraints were not held, however, the bifactor model was better, because it had smaller relative bias of the structural coefficient, and higher statistical power (but also higher type Ⅰ error rates, which was not a problem for a large sample). (3) Bi-factor models fitted the simulation data better than high-order factor models in terms of fit indexes CFI, TLI, RMSEA, and SRMR whether the proportionality constraints were held or not. However, the bifactor models were less fitted according to information indexes (i.e., AIC, ABIC) when the proportionality constraints were held. (4) Whether the criterion was a manifest variable or a latent variable, the results were similar. However, for the manifest criterion variable, the relative bias of the structural coefficient was smaller.

In conclusion, a high-order factor model could be the first choice to predict a criterion under the condition of proportionality constraints or well fitted for the sake of parsimony. Otherwise, a bifactor model is better for studying structural coefficients. The sample size should be large enough (e.g., 500+) no matter which model is employed.

Key words structural coefficient; bifactor model; high-order factor model; proportionality constraints

DOI:10.3724/SP.J.1041.2019.00383

收稿日期:2018-06-22

* 国家自然科学基金项目(31771245)资助。

通信作者: 温忠麟, E-mail: wenzl@scnu.edu.cn

分类号B841

标签：因子论文; 模型论文; 高阶论文; 变量论文; 系数论文; 哲学论文; 宗教论文; 心理学论文; 心理学研究方法论文; 《心理学报》2019年第3期论文; 国家自然科学基金项目(31771245)资助论文; 华南师范大学心理应用研究中心; 心理学院论文; 信阳师范学院教育科学学院论文;