Perspectives

SEM要不要考虑显著性检验呢？

Shijie Wang

17 Feb 2021 • 3 min read

读书笔记 Kline, R. B. (2015). Principles and practice of structural equation modeling. Guilford publications. [p. 17]

相比于其他传统的检验方法（比如ANOVA、多元线性回归），在SEM中，显著性检验的重要性要小很多！
其中，最核心的原因是，SEM以对模型整体的评估为核心，看待数据分析的角度也更宏观。在很多研究中，相对于模型来说，一条线、某个独立效应的显著与否或许并不是那么重要（更准确的讲，并不是SEM关注的核心）。
即使在一些研究中，某个独立效应的显著性是重点之一，SEM研究者也需要从更加宏观的角度去思考整个模型——是否要拒绝该模型？是否要修正该模型？如果要修正的话，如何修正？因此，我们可以看出，在SEM中，模型整体的判断要远高于独立效应的判断。
第二个原因则是SEM的大样本需求有时让显著性检验不那么准确。如果还不熟悉SEM的样本需求，可以关注一下之前的文章 :) 受过传统统计训练的小伙伴可能清楚，p值受样本量的影响很大。在大样本研究中，我们经常遇到一些非常显著（比如p < .0001）但效应量很小（比如Pearson r = .01）的情况。实际上，只要样本量够大，几乎所有不为0的效应都能显著！
反过来说，如果样本量较小，SEM中显著性检验的检定力就不足了，那么显著性检验本身的准确性就无从说起了。
第三个原因则是SEM的显著性检验有时收到软件、公式的影响。可能你会发现，同样的模型、同样的数据，用另一个软件或是另一个估计方法，p值就不同了。当然，这本身不是啥好事。不过言归正传，很小的差异在显著性检验里也会造成很大的分歧，因为显著性检验本身是一个【是或否】的二元范式。如果alpha level是0.05，那0.051和0.049则是天差地别。这种二元范式的影响我们后续可能再单独讲讲。
最后一个原因和显著性检验的二元范式有点关系，那就是，我们应该更关注于效应量的估计，而不是显著性水平。这不只是对SEM来说，对所有的统计分析都一样。不过，需要知道的是，与ANOVA或者多元回归这些以观测变量为基础的分析方法相比，SEM对效应量的估计更为准确。
就像Rodgers (2010)说的一样，统计学正经历从独立效应显著性判断到模型整体评估的转型，在这悄然发生的方法论变革中，SEM正是其中的重要一环。

参考文献与其他阅读：

Carver, R. P. (1993). The case against statistical significance testing, revisited. The Journal of Experimental Education, 61(4), 287–292. https://doi.org/10.1080/00220973.1993.10806591

Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.). (1997). What if there were no significance tests? Lawrence Erlbaum Associates Publishers.

Kline, R. B. (2013). Beyond significance testing: Statistics reform in the behavioral sciences. American Psychological Association.

Rodgers, J. L. (2010). The epistemology of mathematical and statistical modelling: A quiet methodological revolution. American Psychologist, 65(1), 1.