科研助力:P值到底是什么？-外国语学院

科研助力:P值到底是什么？

在科研中P值是一个神奇的指标，但是现在又有种说法称P值已死。为什么？因为P值根本起不到我们期望的作用，甚至更绝望地说，P值根本就起不到这个作用。那究竟是怎么一回事情呢？那么，P值到底是干什么的？只是上帝派来玩弄我们的吗？它到底是真有用还是我们想的太多了？本文简单谈一下自己的一些小看法。

形状分割线

简单说一下P值的历史，P值是由统计学界最牛的人Fisher老先生（相当于物理领域的牛顿级别人物）提出并推动的，这来源于他以及以后由奈曼和皮尔逊发展的假设检验思想（假设检验会在以后文中专门介绍）。简单地说，如果你有一个50人的班级，已经知道你们班上50人的身高平均是4250px，如果现在给你1个人，身高是4750px，那么让你来判断，这个人是不是你们班的人？

对于这个问题，你会怎么判断呢？很明显，两种答案，要么是，要么不是。通常我们会假定他是这个班上的人，因为即使是平均身高4250px，但也不是所有人都4250px，肯定有高有矮，高的人是有可能达到4750px的。但是我们不得不承认，对于一个平均身高是4250px的50人来说，出现一个4750px高的人，这种几率是相当低的。这个“几率”就是P值。

换句稍微专业一点的术语来说，对于一个均值是4250px的总体，有人的身高比均值高500px，如果这个人真的是这个群体中的，那么出现500px这么大的差异的概率有多大？这个概率就是P值。如果这个概率很小（如P值=0.01），那就可以说，出现这么大的差异的概率只有百分之一。对于这么小的概率，我们认为它不大可能出现，也就是说，这个人不大可能是属于这个群里中的，更大的可能是属于其他群体中的。

现在还面临一个问题，P值到底小于多少，我们才能下结论认为这个人不大可能属于这个群体呢？换句说话，小于多少才算“不大可能”？现在我们通用的标准是0.05，也就是说，概率小于5%，就认为“不大可能”。那这个0.05是怎么来的呢？这个0.05也是Fisher老先生提出来的，可是他没有对此做任何解释，只是说他突然想起来了，或许觉得0.05是他的幸运数字吧，然后就用0.05了，然后我们就一直沿用了。不管0.05是Fisher老先生的一个偶然想法还是怎么样，起码我们真的就有了一个标准了。只要能统一，始终是好事的，尤其在以前的时候。不过在当前计算机已经超级发达的时代，有这么一个标准就不一定是好事了。很多人都曾有过这种经历，P值正好等于0.049或0.052之类的。等于0.049的，感觉神都在眷顾他；等于0.052的，恨不得一头去撞墙。也有人问过我，我的P值等于0.052，我可不可以四舍五入到0.05？

实际上，对于P值等于0.052之类的问题，也不用太烦恼。现在的杂志一般都要求提供具体的P值，而不是简单写为P比0.05多了千分之二的可能性，难道你觉得增加这千分之二的可能性可以让你推翻你的结论吗？我相信大多数人都不会这么认为。所以你大可不必纠结于想方设法非要改成小于0.05的事情，大大方方地把自己的P值放上，我想读者会有自己的判断的。如果一个杂志因为你的P值=0.052而拒绝承认你的结论，我想这个杂志也不值得发表。

目前仍有人认为P值代表了差异大小，认为P值越小，差异越大，因此力求一个小的P值。而事实上，P值跟差别大小没什么太大关系，真正有关的反而是其他因素，比如例数的多少，这是个很重要的因素。例数少的话，就容易出现一个大的P值。以前就有临床大夫质疑统计学，说：你看你们统计学，20个数据P值就大于0.05，我原封不动地复制成200个，P值就小于0.05，有统计学意义了。这不是在玩数字游戏吗？

我要说：你说的恰恰相反，20个数据时， P值大于0.05，不让你有统计学意义，是在给你一个提醒，说明你的数据不足以支持你的结论。就像是你治疗了20个人，即使都治好了，你如果宣称治愈率100%，估计没人会相信你。但是200个人就变成P值小于0.05，这正好说明了结论更可靠了，如果你对200个人治疗还是都治好了，那你这时候说治愈率100%，我相信一定会有更多的人相信你。所以，好好想想P值吧，它是有现实意义的。统计学不是数字游戏，而是让你的结论更有说服力。靠什么来体现你的结论的说服力呢，P值。

作者：杨老师（中国统计网特邀认证作者）

本文转自中国统计网