JAMA让把P值降到0.005，写论文的医生要哭了

这波让人窒息的操作……

前几天，JAMA又登了一篇雄文——建议在医学研究领域，将统计学常用的P值的阈值从原来的0.05下调至0.005。

知道P值是啥的朋友们大概已经反应过来了——这特么是要废了一半以上的研究的节奏啊！！！

为啥这个建议让人如此的方？感觉如此令人窒息？

咱还是先介绍一下P值是啥吧。

什么是P值

严格来说，P值指的是在一个特定的统计模型下，数据的某个汇总指标（例如两样本的均值之差）等于观测值或比观测值更为极端的概率。

通俗的理解，如果我们预先设定一个假设，从这个假设出发我们会得到一些假定的数据范围，P值呢，就是我们所得到的实际的样本观察结果或更极端结果不在假定数据范围之内的概率。

如果P值很小，说明原假设情况的发生的概率很小，同时，P值越小，我们拒绝原假设的理由越充分。

现有的标准把我们认定P值很小、小到有充分的理由拒绝原假设成立的阈值定为P<><>

正是因为P值可以一定程度的验证假设的正确与否，其运用已经得到广大科研工作者的广泛认可。

据估算，现有的科学论文中96%在其正文或者摘要中都白纸黑字的写着P<>

你做科学研究要是不P一下，差不多就相当于现在的自拍不PS一下一样，不敢见人。

然而，向来如此，就一定是对的吗？

有关P值的三个常见错误

事实上，关于P值的吐槽层出不穷。

甚至在2016年连美国统计学协会都专门发布了官方吐槽，认为P值已经被我们玩太多玩坏了，造成了相当程度的误解、迷信和滥用。

这种玩坏主要表现在三个方面，建议大家自我检测一下是不是中招。

一是认为P值代表假说为真的概率。

比如，有的研究的原假设为药物与安慰剂一样有效，计算出的P值为0.02。研究者就据此认为这个假说只有2%的可能性是真的，他们继续推论，原假说的对立假说，药物比安慰剂更有效，正确的概率就是98%。

且不说它的对立假说还包括安慰剂比药物更有效这另一种可能性，对立假说的概率绝对不能由原假说推导出来，需要另外设计实验去验证。

更严重的是，P值其实并不能衡量某条假设为真的概率，它只能只解释数据与假设之间的关系，并不解释假设本身。

二是忘记了“合理的推断过程需要完整的报告和透明度”而迷信P值，觉得只要把P值放出来就大功告成，可以开香槟庆祝了。

有的研究者可能使用了好几种分析的方法，而只报告P值最小的那项，这样缺乏完整性和透明度的研究得到的P值根本不能说明问题，相反，P值异常的小反而会使得人怀疑你研究的报告完整性和透明度。

三是仅仅用P值来得出科学结论、商业决策或制定政策。

P值或P<>

因此，成功的科学决策取决于很多方面，包括实验的设计，测量的质量，外部的信息和证据，假设的合理性等等。仅仅看P值是否小于0.05是非常具有误导性的。

以上关于P值的错误观念中招的人超多，除了要搞研究的医生，做流行病统计的卫生人员，还有学术杂志编辑，医学媒体编辑以及读者……哦还有教大家P值是啥的老师……在某些单位，面对这三个错误，搞不好会全军覆没……

事实上，约有三分之一的号称有统计学差异的P<>，而即使是正确的结论，也极少值得被运用于医学和卫生保健之中。

因此，反思、完善P值势在必行。

JAMA为啥要求降低P值

降低P值阈值的要求应运而生，也正是因为如此，JAMA才特别刊文提出建议将P值阈值调低至0.005。

JAMA在文中指出，这样做有不少好处。

一方面，将P值的阈值从0.05降低到0.005，可以将过去生物医学文献中所谓具有“统计学显著性”的结果，降格为仅仅是有“提示意义”。这对那些相信非黑即白二元论者特别有好处，免得他们因为P值的错误诱导选择了错误的科学结论。

另一方面，孟德尔随机化研究表明，过去以P<>

此外，以往的药物临床随机试验中，有相当大比例的P值在0.05到0.005之间，但是其样本数量却并不足以表明药物的治疗作用对患者的临床结局有帮助。严肃来看我们并没有足够的证据将这些药物投入后续的研究，以此可以节约相当的资源。

因此，虽然调低P值阈值有可能会无意中忽略掉一些可能正确的、具有有效治疗效果的结论，总体而言，其利是大于弊的。

要降P的话，我们该咋整

虽然JAMA这篇雄文并不是强制性的命令或者指南，但从P值本身的缺点来看，更改其阈值乃是大势所趋，我们还是应该尽早思考、应对这种改变。

首先，我们需要审视以往的研究结论，很多P值在0.05—0.005之间的研究，其结果到底准确与否可能需要审慎的回顾性研究，一些结果明显与临床经验不符的研究更应该尽早束之高阁，避免知错犯错。

第二，对于今后的医学研究，必须谨慎选择研究课题、采用大样本量的数据，更精心的构思、设计试验方法，才能使得结果符合更严格的P值需要。不说别的，万一你努力做了几年，得到P<>

此外，统计学研究方法并不只有一个P值，还有诸如95%可信区间、伪发现率、贝叶斯分析方法等等等等大量的统计学方法指标，可以用做P值的补充或者替代品。一定程度上的联合运用有助于弥补各个方法本身的漏洞，使得结论更为可信。

参考文献

[1].John P.A. loannidis. The Proposal to Lower P Value Thresholds to .005. JAMA. [2].Published online March 22, 2018. doi:10.1001/jama.2018.1536.

[3].ASA Statement on Statistical Significance and P-values.

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。