单向有序列联表(列变量有序)的统计方法比较
- 培训职业
- 2025-05-04 15:46:49
在研究分组变量不同水平下结果变量的平均水平差异时,如果列变量是有序分类变量,即等级变量,使用Pearson检验只能推断构成比之间的差别,会损失关于等级的信息。这时,我们可以采用秩和检验或CMH检验(行均分,Row Mean Scores)来推断等级强度的差别。
秩和检验是一种非参数检验,用于检验总体分布位置是否相同。它用秩次代替原始数据,在一定程度上反映了原始数据大小或等级的信息。秩和检验对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。
如果分布形状相同,可以使用Kruskal-Wallis H检验比较中位数。但如果分布形状不同,只能使用Kruskal-Wallis H检验比较平均秩次。因此,检查这个假设非常重要,否则可能会导致结果解释错误。
Wilcoxon秩和检验将两组原始数据混合排序编秩,遇到相同数据,取平均秩次。分别将两组的秩次相加,得到两组的秩和。如果两组样本量不等,以样本量较小的组的秩和作为统计量;如果两组样本量相等,任取一组秩和作为统计量。
当满足一定条件时,可查界值表;当不满足条件时,可采用正态近似法计算统计量。由于秩为离散型数据,正态分布为连续型分布,所以分子部分减0.5进行连续性校正。
当存在较多相同秩次时,需对总体均数和总体方差进行校正。Kruskal-Wallis秩和检验和CMH检验的计算方法类似,具体计算公式和步骤可参考相关资料。
CMH检验,全称是Cochran-Mantel-Haenszel检验,适用于高维列联表的分析。它是在控制了某一个或几个混杂因素(分层变量)之后,检验二维表中行变量与列变量之间是否存在统计学关联。
在R语言中,可以使用不同的函数进行这些检验,如wilcox.test(),kruskal.test()等。具体操作步骤和参数设置可参考R语言相关文档。
多重随机标签