查看原文
其他

振聋发聩,新科诺奖得主William Kaelin发文批评当下论文数据“华而不实”

十一月 返朴 2022-06-12

点击上方蓝字“返朴”关注我们,查看更多历史文章



William G. Kaelin在获得拉斯克奖之后于2017年在Nature上发文提出“论文需要简化结论与主题,以更稳健和可靠的数据使论文更加可信”。真正的科学进步是用坚实的数据一砖一瓦砌成的,稻草堆砌的数据虚假繁荣切不可取。


原文 | William G. Kaelin Jr 编译 | 十一月
责编 | 兮


William G. Kaelin,哈佛大学医学院教授、HHMI研究员,与牛津大学的Peter J.Ratcliffe、约翰霍普金斯大学的Gregg L.Semenza于2016年和2019年分别获得拉斯克基础医学奖和诺贝尔生理学或医学奖。他们在细胞的低氧感应("for their discoverys of how cells sense and adapt to oxygen availability")方面做出了重要贡献。Kaelin的科研经历可谓是充满了各种曲折。针对于现今论文数据“华而不实”的情况,William G. Kaelin在获得拉斯克奖之后于2017年在Nature上发文提出“论文需要简化结论与主题,以更稳健和可靠的数据使论文更加可信”。这篇文章有很多值得当前学术界反思的地方,有些语句确实振聋发聩,BioArt全文编译如下,以飨读者!



当今,生物医学领域内的文章发表陷入了一种怪圈:虽然发表的文章越来越多,但有些数据却只能在很某些特殊的条件下才能重复出来,甚至有些无法重复。造成这一现象的原因有很多,但背后原因却鲜被提及。这些年来,科学家们就像是温水中被煮的青蛙一样,而这杯“逐渐升温的温水”就是这几十年来发表文章所需要的逐渐增多的要求和数据量。此外,发表论文的目的似乎已经从验证或者得到特定结论转变为希望得到一个尽可能宽泛的结论。这样的危险就在于,论文越来越像稻草堆砌的“豪宅”,而不是坚固的“砖房”。

图为William G. Kaelin实验室庆祝活动上订制的蛋糕。图片引自:Kaelin Lab


以当今的眼光来看,使我获得2016年拉斯克奖的那些论文(与Gregg Semenza和Peter Ratcliffe一起发现了细胞如何感知氧气,实际上也是今年获得诺贝尔奖的论文)中的结论大部分是浅显的、不可思议的,甚至很难被发表,比如其中一个结论是氧气信号通路竟然需要一种肿瘤抑制因子(VHL),这一结论放在今天会由于没有分子机制以及动物实验而遭受批评[1]。另外,HIF-1α需要氧依赖修饰的那篇论文也由于我们没能鉴定出相应的酶而差点被拒稿[2, 3]。但当时非常幸运的是,一位经验丰富的编辑同意发表该工作,并让其他的研究组寻找和鉴定该酶,而如今这种现象却很少见。
图为今年的诺奖得主Peter J.Ratcliffe近日爆出的一封1992年Nature的拒稿信,这张图片近日火遍很多社交媒体。面对Ratcliffe的工作,审稿人1认为很好,审稿人2认为遗传机制上理解低氧反应还不够,最后editor建议投稿到更专业的杂志而最终拒稿该工作。从发表时间看,相关工作有可能最终发表在1993年的PNAS上了(Maxwell, P. H., Pugh, C. W., & Ratcliffe, P. J. (1993). Inducible operation of the erythropoietin 3'enhancer in multiple cell lines: evidence for a widespread oxygen-sensing mechanism. PNAS, 90(6), 2423-2427.)。


是什么造成了如今这种“膨胀”的局面?其中一个因素是基金组织对于研究的影响力和转化能力的过分强调;另一方面是技术进步使得大量数据产生变得更加容易。这两个因素都鼓励审稿人和编辑要求更多的实验,这些实验要么是额外衍生的,要么与主要结论相去甚远,要么仅仅是为了增加数据的影响力。接收总是比拒稿更需要勇气。我担心审稿人在资金紧张的时候,更加倾向于要求更多的实验数据与结果,就像如今的状况一样。


在博后期间,我的工作是在活细胞中建立两个蛋白之间的共定位以及验证其相互结合,这些内容就足以发表一篇完整的文章。而现在,这些结果只能组成一张大图的某一个小方块儿,并且文章的其余部分要描述跨学科的数据并对论文主题进行阐述,这些数据需要对结论进行“升华”并最终达到表明该论文结论具有临床应用的要求。


不幸的是,这些要求就像是无底洞。从实验数据中进行结论推导,多样的数据的确是不可缺少的,因为任何单独的方法都有其缺陷和局限性。但是现今发表的文章已经从提出一个主要观点、并以多种方式得到证明的论文,发展到提出多个结论、但各有一根支柱性数据的论文。当下文章中最后所呈现的模式图往往显得结论太过牵强。


过于宽泛的要求会使同行评审系统超出能力范围。尽管我是一个经验丰富的审稿人,但依然发现论文中数据量爆炸使得文章阅读起来非常困难,而且经常会遇到那些并不是自己专业领域的数据。如果这种趋势继续下去,如果我想要对论文进行审阅,可能每次都得进行一个小长假才能把论文看完。编辑可能会成功地将具有互补背景的审稿人聚集在一起来审查这些宽泛的论文,但这样做的代价是会有多个专家需要花费时间来考察相同的实验。另外,审稿人往往不太仔细地检查补充材料,而补充材料恰恰是数据最薄弱的地方。因为论文发表与作者们的前途息息相关,这可能会鼓励比如挑选数据等不良行为,这样就会出现不完整、不一致或无法解释的数据。同时,我们应该认识到,当一篇论文坦率地承认数据的局限性和令人困惑的结果时,这是在加强和完善一个良好的科学环境,我们也应当鼓励这种行为。


“无知”是临床转化的真正瓶颈。我们不能再告诉基础科学家,他们工作的价值在于将基础理论的论文转化成临床应用。我们必须回到原点更仔细检查地原创性研究论文的实验设计和数据质量,以更加谦逊和谨慎的态度回顾过去。如限制性内切酶、酵母细胞细胞周期突变体和CRISPR-Cas9这些曾经被认为是实验中出现的古怪现象催生了后来的新发现、新应用,这些就是建立在谨慎回顾过去研究之上的。我们还应该更多地关注一篇论文的质量以及它是否促成了后来的发现,而不是关注个别论文发表在什么期刊上。


最后,在审查一篇论文时,主要的问题应该是它的结论是否正确,而不是如果结论正确的话是否重要。真正的科学进步是用坚实的数据一砖一瓦砌成的,稻草堆砌的数据虚假繁荣切不可取。

参考文献

[1] Iliopoulos, O., Levy, A. P., Jiang, C., Kaelin, W. G., Jr. & Goldberg, M. A. Negative regulation of hypoxia-inducible genes by the von Hippel-Lindau protein. Proceedings of the National Academy of Sciences of the United States of America 93, 10595-10599, doi:10.1073/pnas.93.20.10595 (1996).[2] Ivan, M. et al. HIFalpha targeted for VHL-mediated destruction by proline hydroxylation: implications for O2 sensing. Science 292, 464-468, doi:10.1126/science.1059817 (2001).[3] Jaakkola, P. et al. Targeting of HIF-alpha to the von Hippel-Lindau ubiquitylation complex by O2-regulated prolyl hydroxylation. Science 292, 468-472, doi:10.1126/science.1059796 (2001).



本文经授权转载自微信公众号“ BioArt”,原文可戳“阅读原文”查看。

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。



相关阅读

1  诺奖得主凯林的“十诫”:做实验的时间和论文数量是线性相关的 

2  文小刚:创新就是孩子的游戏

3  谢晓亮、邵峰:中国最缺的不是CNS,最需要的是原创性工作

4  沟通:让论文发表更顺畅 | 发表论文那些事儿

5  拒稿:生命不能承受之痛 | 发表论文那些事儿


近期热门

1  97岁化学诺奖得主每周工作50小时,错过诺奖电话因为在领另一个大奖!

2  专访新科物理学新视野奖得主,Caltech物理学家陈谐

3  黄昆给杨振宁的一封信:物理研究大多时间是做日常工作——纪念黄昆先生100诞辰

4  是时候打破复合维生素的神话了 | 117三人行

5  贸易战没压垮中国,数学教育的下滑会导致灾难 ——失数学者失天下


↓↓↓长按下方图片关注「返朴」,查看更多历史文章

点“在看”,分享给朋友吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存