t 检验分类配对 t 检验(非独立t检验)非配对 t 检验(独立t检验)单/双侧 t 检验选择
小结:如果你有配对的数据, 意思就是你有一些受试者,对于每个受试者, 你都有两个测量结果,一个受试前和一个受试后的结果,那就用配对 t 检验。
如果你没有配对数据,就用非配对的 t 检验,不要去假设方差相等,因为这样不会使检验变得更为保守。
用双尾 t 检验,因为这可让数据自身来说明问题,而且更为保守一点。
t 检验分类t 检验主要有两大类: 配对和非配对 t 检验
配对 t 检验(非独立t检验)当你比较同一个受试对象前后两种状态时, 配对 t 检验则更有效:
例如:一群小伙伴在使用降血压的药物前后分别测量血压。这个例子中, 每个人都有一对测量结果——一个服药前的结果和一个服药后的结果。当你有像这样的"配对"的数据时,使用配对 t 检验
非配对 t 检验(独立t检验)当没有配对数据时,使用非配对的 t 检验。
比如说你有一组人,你测量他们的身高, 我们称之为A组,然后我们有另一组人,我们测量他们的身高, 我们称之为B组时,我们有不成对的数据,所以我们使用非配对的 t 检验。
非配对的 t 检验又可以分成2个类型:方差齐性和方差不齐
所谓方差齐性是指:
因为 t 检验是比较他们的均值是否一致。但是我们也要注意数据的分布情况。
首先提出两个总体方差没有差异的零假设。然后从两个研究总体中各抽取容量分别为两个样本,通过比较两个样本方差之间的差异,来推断两个总体方差之间的差异。如果两者方差无差异,认为他们来自同一个样本总体。
建议小伙伴不要选择默认两组中方差相等的检验,因为方差不等检验稍微保守一点。如果你的数据能通过更保守的 t 检验,那么你就知道你的数据是坚如磐石的!!!
单/双侧 t 检验选择双侧 t 检验是不可知论者对于数据,它没有一些先入为主的概念,它仅仅是通过检验两侧来看结果到底是怎么样的。
单尾 t 检验不那么保守,因为它需要你去定义结果的比较方向是什么。一般来说, 在学术期刊方面这不是一个好方法,一般情况下, 你想让数据本身来说明问题。
更加建议使用双侧 t 检验。
image.png
假设你有了一个新的癌症治疗方法,你对6个病人做了一个小的临床试验,上图是你的数据:红点代表接受你的新治疗方法的病人,黑点代表接受标准治疗的病人。
数据表明, 病人在新疗法治疗下取得了比标准疗法更好效果,然而, 结果缺有一点含糊不清(红黑有一个交叉点)。所以你进行了统计分析:
单侧检验给了你一个0.03的p值
双侧检验给了你一个0.06的p值
应该使用哪个P值呢??首先我们需要明确:
双尾P值检验的是新治疗是否更好, 更差或没有显著差异
单尾P值较小, 因为它不区分较差和无显著差异
这里难道不是数据显示新方法更好, 暗示着并不需要检测它是否更差吗?
问题就在这里了!!良好的统计习惯意味着在实验之前我们就需要选择所需的检验和对应的P值,而不是有了结果之后再去选择!!这就增加了我们报出虚假结果的可能性,让我们看看这是为什么:
image.png
X轴表示从小到大的测量值,Y轴代表我得到某些测量值的概率,然后我从这个数据分布里面取样:
这意味着一台计算机选取的三个数字具有很高可能性是来自于中心区域,但有时其中一个可能非常小或非常大。然后从完全相同的分布中再次取样,大多数情况下,这两组样本的双尾 t 检验应该给我一个大于0.05的p值(因为我们是从同一个样本中抽样得到的2组数据,大多数情况下样本会重叠,如上图)。
但偶尔的情况下, 样本间就不会重叠:
image.png
t 检验会给我一个小于0.05的p值,这被称为"假阳性", 5%情况下会发生。如果我们做了10000个类似数据双尾 t 检验:10000*5%=500, 所以我估计有500个假阳性结果。
如果模拟正常情况下的单尾测试,尽管我们仍正在使用0.05为显著性阈值,报出假阳性的几率从5%上升到了8%,因此, 你不能等到看到数据后才决定使用单尾p值。
对于癌症治疗, 显而易见的是我们必须了解它是改善还是使事情更糟,但实际上, 对于所有数据都有单尾或者双尾p值的选项,我们总是想知道一件事情的两面,所以当你进行选择的时候,要一贯的选择双尾的p值!!双尾的p值!!