SEM需要多大的样本量?

读书笔记 Kline, R. B. (2015). Principles and practice of structural equation modelling. Guilford publications. [pp. 14 - 16]

相比起“传统”方法来说,SEM更加需要“大样本”。那么,多大的样本叫做“大样本”呢?
因为影响SEM样本量需求的因素很多,所以我们很难得到一个简单的答案。
我们先来简单总结一下这些影响因素:
· 越复杂的模型、变量越多的模型,所需的样本量就越大。这是因为变量越多,我们在统计模型中需要进行的估计就越多。在这种情况下,为了让计算机得出准确的估计值,我们必须要有更大的样本量。
· 数据越“不完美”,需要的样本量就越大。什么是“不完美”的数据呢?比如非连续性变量、不符合正态分布的数据、不符合线性的数据、变量间有交互作用等情况。当然,我们需要在挑选SEM的估计方法时也小心谨慎,因为不同估计方法对数据的假设不同,所需的样本量也会有所差别。
· 信度越低,需要的样本量越大。也就是说,不太精确的数据需要较大的样本,以抵消测量误差可能带来的数据扭曲。另外,对于控制测量误差来说,潜变量模型比观察变量模型更佳有效,所以在潜变量模型中(一个construct内有多个indicators),所需样本量或许相较而言更少。
· 缺失数据越多,所需样本量就越大,用以补偿信息损失。
· 特殊的SEM模型可能会有独特的样本量需求。比如,对于因子分析来说,在以下几种情况中,样本量需求可能较大:各个因子中题项平均数量较少、不同因子在各题项中解释的方差比例不相等、有些题项与多个因子有明显的共线性、因子数量过多、以及各因子之间的协方差较小。
由于以上种种原因,对于SEM的样本量需求来说,并没有一条完美的法则。
那么我们可以尝试从两个主要的方面考虑SEM的样本量:
(1)为了得到适当统计精度所需的最小样本量;
(2)为了使SEM的显著性检验具有合理检定力所需的最小样本量。
在显著性检验中,当备选假设为真时,检定力是拒绝零假设的概率。所以,检定力>0.85或许是一个合理的标准。不过,需要注意的是,当二类错误(未能拒绝一个错误的零假设)的后果非常严重时,对检定力水平的要求就要更高。基于相应的模型,在SEM模型中达到合理检定力所需的样本量可能要比得到适当统计精度所需的要大很多。
后续我们可能还会提到如何使用RMSEA等其他指标来评估SEM模型中达到合理检定力所需的样本量,以下我们简单给出得到适当统计精度所需的样本量指标。
在潜变量模型中,如果所有估计变量(outcomes)都是连续变量、符合正态分布,并且模型估计方法是最大似然法,Jackson (2003)建议使用N:q规则。该方法建议研究者以样本量(N)与需要估计的模型参数量(q)之比来考虑最小样本量。推荐的比值为20:1。例如,如果共有q=10个参数需要估计,那么最小的样本量则是20q (N=200)。即使达不到该推荐比例,也需要达到10:1,也就是说,当q=10时,最小样本量为10q,也就是100。当N:q的值降到10:1以下时,信度会下降,分析过程中出现技术问题的风险也会升高。
基于这个规则,我们会发现,提出一个所谓的“最低样本量”几乎不可能。不过我们还是可以研究一下,在SEM的研究中,样本量一般是多大?
一些综述性文章发现,在运营管理(Shah & Goldstein,2006)和教育心理学(MacCallum & Austin,2000)领域,样本量的中位数大约是200。但是需要注意的是,如果模型很复杂、样本不符合正态分布、使用最大似然以外的方法、或者有缺失数据时,200的样本量可能就太小了。
另外,如果样本量小于100,那么几乎所有SEM模型的统计精度都会太高,除非模型非常非常简单,不过这么简单的模型可能理论意义也不大。
Barrett(2007)建议审稿人拒绝发表任何N<200的SEM分析(除非所估计的总体较小,限制了取样)。这显然不是实践中必须遵守的标准,但我们从中也可以体会到小样本SEM分析的问题。
并且,很多元分析发现,不少已发表的SEM研究样本量都偏小。例如,Westland (2010) 回顾了74项SEM研究,发现:
(1)这些研究的平均样本量约为375,只有应有样本量的50%;
(2)样本量的中位数约为260,仅为应有样本量的38%。而且在这种采样不足中,还存在数据负向偏度过大的问题;
(3)约80%的研究都有样本量不足的问题。

Jackson, D. L. (2003). Revisiting sample size and number of parameter estimates: Some support for the N: q hypothesis. Structural Equation Modelling, 10(1), 128–141.

Shah, R., & Goldstein, S. M. (2006). Use of structural equation modelling in operations management research: Looking back and forward. Journal of Operations Management, 24(2), 148–169.

MacCallum, R. C., & Austin, J. T. (2000). Applications of structural equation modelling in psychological research. Annual Review of Psychology, 51(1), 201–226.