我用什么scipy统计检验来比较样本的含义?
假设样本量不相等,在以下情况下我应该使用什么样的测试来比较样本均值(如果以下任何一项不正确,请更正):
正态分布=真和方差齐性=真
scipy.stats.ttest_ind(sample_1, sample_2)
正态分布=真和方差齐性=假
scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False)
正态分布=虚假和方差齐性=真
scipy.stats.mannwhitneyu(sample_1, sample_2)
正态分布=虚假和方差齐性=虚假
???
快速回答:
正态分布=真 ,方差齐性=假 , 样本量> 30-50
scipy.stats.ttest_ind(sample1, sample2, equal_var=False)
好答案:
如果你检查中心极限定理,它说(来自维基百科):“在概率论中,中心极限定理(CLT)指出,在给定的条件下,独立随机变量的足够大数量的迭代的算术平均值,每个具有明确定义的(有限的)期望值和有限的方差,将近似正态分布,而与基本分布无关“
所以,虽然你没有正态分布的人口,但如果你的样本足够大(大于30或50个样本),那么样本的平均值将是正态分布的。 所以,你可以使用:
scipy.stats.ttest_ind(sample1, sample2, equal_var=False)
这是对两个独立样本具有相同平均(预期)值的无效假设的双面测试。 通过选项equal_var = False,它执行韦尔奇的t检验,该检验不假定相等的总体方差。
链接地址: http://www.djcxy.com/p/22119.html上一篇: What scipy statistical test do I use to compare sample means?