SEM要不要考虑显著性检验呢?

读书笔记 Kline, R. B. (2015). Principles and practice of structural equation modeling. Guilford publications. [p. 17]

相比于其他传统的检验方法(比如ANOVA、多元线性回归),在SEM中,显著性检验的重要性要小很多!
其中,最核心的原因是,SEM以对模型整体的评估为核心,看待数据分析的角度也更宏观。在很多研究中,相对于模型来说,一条线、某个独立效应的显著与否或许并不是那么重要(更准确的讲,并不是SEM关注的核心)。
即使在一些研究中,某个独立效应的显著性是重点之一,SEM研究者也需要从更加宏观的角度去思考整个模型——是否要拒绝该模型?是否要修正该模型?如果要修正的话,如何修正?因此,我们可以看出,在SEM中,模型整体的判断要远高于独立效应的判断。
第二个原因则是SEM的大样本需求有时让显著性检验不那么准确。如果还不熟悉SEM的样本需求,可以关注一下之前的文章 :) 受过传统统计训练的小伙伴可能清楚,p值受样本量的影响很大。在大样本研究中,我们经常遇到一些非常显著(比如p < .0001)但效应量很小(比如Pearson r = .01)的情况。实际上,只要样本量够大,几乎所有不为0的效应都能显著!
反过来说,如果样本量较小,SEM中显著性检验的检定力就不足了,那么显著性检验本身的准确性就无从说起了。
第三个原因则是SEM的显著性检验有时收到软件、公式的影响。可能你会发现,同样的模型、同样的数据,用另一个软件或是另一个估计方法,p值就不同了。当然,这本身不是啥好事。不过言归正传,很小的差异在显著性检验里也会造成很大的分歧,因为显著性检验本身是一个【是或否】的二元范式。如果alpha level是0.05,那0.051和0.049则是天差地别。这种二元范式的影响我们后续可能再单独讲讲。
最后一个原因和显著性检验的二元范式有点关系,那就是,我们应该更关注于效应量的估计,而不是显著性水平。这不只是对SEM来说,对所有的统计分析都一样。不过,需要知道的是,与ANOVA或者多元回归这些以观测变量为基础的分析方法相比,SEM对效应量的估计更为准确。
就像Rodgers (2010)说的一样,统计学正经历从独立效应显著性判断到模型整体评估的转型,在这悄然发生的方法论变革中,SEM正是其中的重要一环。

参考文献与其他阅读:

Carver, R. P. (1993). The case against statistical significance testing, revisited. The Journal of Experimental Education, 61(4), 287–292. https://doi.org/10.1080/00220973.1993.10806591

Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.). (1997). What if there were no significance tests? Lawrence Erlbaum Associates Publishers.

Kline, R. B. (2013). Beyond significance testing: Statistics reform in the behavioral sciences. American Psychological Association.

Rodgers, J. L. (2010). The epistemology of mathematical and statistical modelling: A quiet methodological revolution. American Psychologist, 65(1), 1.