打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
八成论文需深究? 脑科学上空的不确定性阴云<div></div>
Ingfei Chen 发表于  昨天13:03

Alulu /译)约翰·约安尼季斯(John Ioannidis)与我见面时正值下午4点,但他的眼下已深刻着疲惫的痕迹。过去几天里,他旋风般地造访了20个欧洲城市,举办演讲、与同事们开展头脑风暴,被时差折磨得精疲力竭。我发现他的办公室角落里放着两个形状奇怪的包,用于收纳他的运动装备——击剑中的重剑。对于这位言语温柔的教授来说,击剑这一爱好和他的形象颇为相符——他正是一位追寻科学真相的圣骑士。
 

约翰·约安尼季斯 (来源 tufts.edu)

 
约安尼季斯灵活掌握着两大武器:统计学逻辑,外加对证据的严格审视。在此之前,他曾对制药公司主持的临床试验发起挑战,直指其中各种关于药物及其他治疗方法的虚假论断。而现在,他的目光转向了大脑。针对神经科学研究的批评队伍日益壮大,他作为其中一员猛将,举证了诸多研究的设计、分析及报道方式中存在重大缺陷。
 
我们常能在报纸头条读到这样的研究,它们一边亮出大脑快照,一边号称发现了“爱”、“恐惧”、“信仰”和“政治”的神经机制,而约安尼季斯对此敲响了警钟。事实证明,在这些五颜六色的大脑扫描图像里,有相当一部分不过是海市蜃楼,掩盖了人类大脑的真实活动图景。
更严重的是,这些问题不仅仅是个别误导性新闻报道的专利。从探索基因与单个分子活动,到寻找大脑结构与精神疾病之间的联系,整个神经科学界上空都悬挂着大大的问号。“目前,绝大部分文献都不足以令我信任。”约安尼季斯说道,他是加利福尼亚州斯坦福大学医学院的一名流行病学家。
 
在一片担忧声中,我们对大脑的认识似乎注定将在充满不确定性的疑云中灰飞烟灭,你还会看到,大众媒体中越来越多的评论员开始痛击“神经科学狂热(neuromania)”。不过,我们仍须牢记过去一百年间神经科学领域取得的进步。尽管约安尼季斯和同事们得出的结论毫不留情,使得我们有理由重新审视既有的知识体系,但是,他们的观点理应激发出更多更具成效的努力,揭示大脑的奥秘。“神经科学正在持续前进。”美国国家心理健康研究所(National Institute of Mental Health, NIMH)的克里斯·贝克(Chris Baker)如是说。随着迷雾散去,更多模糊的理论终将明晰起来。
 
尽管在很久以前,“思想的起源问题”就已让哲学家绞尽脑汁,不过,直至1991年功能核磁共振成像(functional magnetic resonance imaging,简称fMRI)技术腾空出世后,人类这才引燃了与神经科学的一段热恋。fMRI的本质在于研究大脑中的血流,活动剧烈的脑区对应着更大的血流量。研究者利用不同的测试来考察人类的各项能力,譬如视觉、感觉、记忆和思维,在被试完成这些测试任务时,fMRI扫描可以得到代表大脑神经活动的亮斑。人们很快就被这些彩色影像所深深吸引。
 
然而,瞬时的神经活动能否揭示复杂的认知活动及行为背后的机制?一直以来,针对这一问题的质疑未曾断绝,但反对的声音并未引起公众的注意。直到2008年下半年,加州大学圣地亚哥分校的心理学家爱德华·沃尔(Edward Vul)与哈罗德·派希勒(Harold Pashler)发表了一篇评论文章,文中提到,大量fMRI研究结果将一些行为或性状指向某个或少数几个特定脑区的活动,这些结果可信度极低,二位作者也曾受其蒙骗。仔细检查完53篇此类研究论文之后,沃尔和派希勒等人得出结论,其中有一半的结果不值得信任。这些研究通过“具有严重缺陷”的方法得出了“好得令人不敢相信”的结果,二位作者大胆地将之戏称为“相关性巫毒(voodoo correlations)”。
 

重复提取

 
要想理解个中缘由,首先你需要知道的是,一次典型的全脑fMRI扫描可以得到100,000个又名“体元(voxel)”的三维像素点,对于分析工作来说,这个数据量可谓相当庞大。研究者们利用专业软件来寻找被特定认知活动“点亮”的一簇簇体元——譬如让被试观看图片、从而激发他们的共情或情绪反应。困难在于,真正的信号常淹没在体元中的随机波动中,后者就像一台天线没调好的电视机显示的雪花点。fMRI软件努力将这些噪声滤除,但软件毕竟不能创造奇迹,许多区域显示出的活动升高仍将是随机波动所导致,噪声的影响终难避免。
 
理想情况下,脑成像研究者应该使用两套扫描结果。其中一套扫描结果将用于寻找在实验中被强烈激活的体元。锁定目标区域后,再利用第二套扫描结果对之进行专门检查,以确定这些反应不是随机波动,最后一步才是测量激活区域的大小。但是,派希勒和沃尔发现,许多研究者并没有遵循这一法则,而是错误地在两次分析中使用同一套数据,如此一来,随机噪声的效应被放大,看上去就像与行为反应及特质存在相关。这种“重复数据提取”的行为让研究者得出的结论貌似激动人心,实为草率仓促,其中就包括不少关于人格特质起源的过简之论。例如,神经质(neuroticism)就被归因为大脑内一对杏仁状区域(学名为杏仁核)的活动增强,而杏仁核已知与恐惧等负面情绪有关。
 
确定该问题已在学界泛滥后,贝克和NIMH的同事们对2008年期间5种顶级期刊发表的所有fMRI研究进行了检查。共计134篇论文当中,有42%犯下了“重复提取”的错误(Nature Neuroscience, vol 12, p 535)。贝克的研究团队指出,类似的方法学错误在动物单神经元放电及遗传学研究里同样普遍存在。
 
不过,以上两篇评论文章都没有推翻这些问题论文得出的大体结论。“并不是说所有的结果都是无效的,”贝克在谈及这项工作时如是说道,“但让人对其可信度产生了怀疑。”
 
“相关性巫毒”一文引发了一场来回往复的大辩论。争议的起因之一在于,沃尔和派希勒在文中指明了他们批评的对象,一些学者认为这太过咄咄逼人。“给人感觉不大愉快。”奥斯丁德克萨斯大学的fMRI专家罗素·波德拉克(Russell Poldrack)说道,不过,他还是承认,文章吸引了大家的注意。“我认为,如果这篇文章措辞更温和一点,就不见得能有这样的影响力了。”
 
“我们有话直说,而且带着几分玩乐的心理。”派希勒说道,毫无后悔之意。他承认说,因为自己和沃尔均不从事脑成像研究,他们无需担心将来的论文发表或基金申请是否会受到阻碍。
 
纷争平息后,许多fMRI研究者意识到,批评者的核心论点是正确的。如今,相关性巫毒和重复提取现象逐渐变少。与此同时,德克萨斯大学的认知神经科学家塔尔·雅克尼(Tal Yarkoni)说,越来越多的学者认为,把复杂的人格特质归因至像杏仁核这样的个别脑区的想法到底还是一个“白日梦”,根据目前的主流观点,人格特质与“大量脑区复杂的交互作用”有关。
 
在研究者们奋力弥补方法漏洞的同时,另外一些质疑开始涌现,这回的问题同样致命。2012年,密歇根大学(University of Michigan)的一项令人大跌眼镜的研究表明,一个fMRI实验可以用将近7000种方法分析,而得到的结果可以是大相径庭的。既然有了这样的灵活度,神经成像研究者会不自觉地(或是故意地)依照最有利于产出结果的方法来进行数据分析。一项存心挖苦人的研究报道称,若采用错误的分析技术,即便是一条死三文鱼放进扫描仪,得出的结果也能让三文鱼的大脑看上去像是在“思考”一样。 
 
2013年5月,约安尼季斯发表了一篇振聋发聩的文章,他于文中指出,现存问题远比几项不完美的fMRI实验来得深远。他与英国布里斯托尔大学(University of Bristol)的实验心理学家凯瑟琳·巴顿(Katherine Button)和马库斯·穆纳佛(Marcus Munafo)等人合作,对48篇综述文章进行了分析,这些综述文章以阿尔茨海默病与慢性疼痛等神经疾病的致病风险因素与治疗方法为主题,深度讨论了共计730项实验。实验涉及了多种研究手段,包括认知功能检测、基因测序及临床试验。约安尼季斯的团队对其中每项研究的“统计功效(statistical power)”进行了估计,该指标反应了研究有多大几率检测到了真实存在的效应。
 
他们得出的结论是残酷的。研究的平均统计功效约为20%,很大一部分原因在于实验使用的被试量太小,即使数据通过了标准的统计检验,也不足以得出可靠的结论(Nature Reviews Neuroscience, vol 14, p 365)。换句话说,有4/5的研究可能错过了真实存在的生物效应或机制,从而得出错误的阴性结论。
 
但这并不是故事的全部。低统计功效带来的不确定性打击是双重的:你不仅可能错过眼皮底下的事实,而且“如果你的确找到了一些看似显著的结果,这些结果有很大的概率是假阳性的。”约安尼季斯说道。
 
对于研究大脑解剖构成的结构核磁共振成像(与功能核磁成像不同,后者关注的是时刻变化的神经活动)研究来说,形势更为严峻。在大脑结构异常与精神疾病(如抑郁症或自闭症)之间寻找联系的研究当中,平均的统计效力只有可怜的8%——也就是说,92%的研究未能找到真实存在的新发现,而且有相当一部分研究检测出了虚假的阳性结果。
 

数据挖掘

 
约安尼季斯与同事们进一步考察了fMRI研究及神经疾病相关动物实验中存在的偏倚现象,他们发现,与许多研究领域一样,神经科学研究论文倾向于报告阳性结果,其比例超过了应有的预期。其中原因部分在于,学术期刊较少发表阴性结果的研究。不过,约安尼季斯告诉我们,还存在另外一种可能,那就是“数据挖掘”——研究者们遍历各种数据拆分方式,有选择性地进行分析,不制造出利于文章发表的结果就誓不罢休。
 
要想知道具体某篇论文结果的正误以及问题文章的数量,就必须重复所有的实验,通常人们不会选择这样的做法。但是,根据自己在其他研究领域的经验,约安尼季斯认为,在当下已发表的神经科学论文当中,绝大部分都可能是错误的。“神经科学面临着极其严重的问题。”他说道。
 
这一毁灭性的的评论意味着什么?首先要明确的是,它并没有否定一切。能够经受时间考验的结论是值得信任的,而且约安尼季斯并未对教科书上关于大脑解剖结构和功能的经典论述提出质疑。譬如,大脑布罗卡区(Broca’s area)中风受损后,病人的言语功能出现明显的障碍,因此,我们可以肯定,该脑区与语言的产生有关。此类效应极其显著,即便在为数不多的人群中进行研究,也能显现出明确的效果,而且能被多条证据共同验证。
 
然而,面对那些更新的研究发现时,我们或许应当留个心眼,而不是急于全盘接受。考虑到神经科学家们研究的对象极其复杂,涉及认知任务、行为或人格特质背后的加工细节,这种态度就显得更有必要了。这些精细的加工机制很难量化,另一方面,因为大脑活动的模式太过模糊,要想将真正的信号从背景噪声中剥离出来,注定需要收集海量的数据。
 
不出意料,尽管有许多神经科学家同意约安尼季斯的核心结论,他还是刺痛了不少人的神经。很多人的顾虑在于,约安尼季斯的言论太过危言耸听。譬如,波德拉克就十分担心他的观点会“演变为一种全球性的极端怀疑主义,使得人们把整个神经科学领域看作一派胡言。”当然,这种说法并无道理。许多fMRI研究的成果经受住了时间的考验,例如短时记忆提取的任务总能激活前额叶,以及海马会在睡眠期间保持活跃,可能与记忆巩固的过程有关。
 
“如果每次在做出新成果后不久就会发现它其实不可靠,我是不会坚持做科研的。”波德拉克说道。他还补充说,尽管问题确实存在,“我们当中许多人都在尽己所能地解决这些问题。”但是,一些研究者担心,如果政府受到误导,可能会缩减神经科学实验室的经费,从而扼杀那些具有革新性的研究。
 
至于约安尼季斯,他坚持认为,要想维持大众对科学的信心,信息透明是最好的方法。“我不喜欢把事情藏着掖着。我更乐于发现问题、解决问题。”
 
他还为神经科学领域存在的诸多病症开出了一剂处方。例如,在探索微弱的、难以被检测的效应时,若想增大统计功效,最显而易见的方法就是加大被试量,譬如开展严谨的多中心研究(multi-centre studies)。另一方面,对于一些课题来说,如果你从单个被试身上收集到了足够多的数据,少量的被试同样能够产出可靠的结果。然而,在fMRI研究中增大被试量并不容易,因为仪器使用费可高达每小时500美元。不过,将研究经费分配给少数的大规模项目或许是一种更合理的行为。
 
另外一种解决方案是,鼓励脑科学家们将实验数据公开,并尝试重复他人的研究发现,从而排除掉一些假阳性的结果。例如,2010年,波德拉克和几位同事创建了一个网上fMRI开放项目(Open fMRI Project),研究者可以将收集到的原始数据上传,让其他研究者对这些数据进行重分析,以验证他们的结果。然而,重复实验是一项没有回报的工作,因为没有研究者会因为立场正确或核实他人研究成果而获得升职——只有发表令人感兴趣的新结果才能带来荣誉。
 
如果神经科学家们不管怎么做都深感步步艰难,遗传学研究领域的发展经历或能提供一些鼓励,后者在十年前遭遇了同样的困境。当时,该领域内涌现出一大批小规模研究,鼓吹某个特定基因在疾病和人格中的作用。而现在,随着大型研究的开展,外加数据报道和分享渠道的持续规范化,当年仅有1%可重复率的遗传学研究现如今已具备了90%的信度,约安尼季斯如是说。
 
目前,几个大型领头项目已经开始克服困难、接受挑战。以投资4千万美元的人类连接组计划(Human Connectome Project)为例,来自十数个研究机构的神经科学家正在建立一个描绘大脑神经环路的精细图谱。他们利用fMRI和一种名为“弥散成像(diffusion imaging )”进行大规模——被试量为1200人——扫描,所得数据将全面公开。项目承诺,它将以一种迄今为止最先进的方式,向人们呈现大脑解剖结构对思维和行为的影响。 
 

搭建桥梁

 
与此同时,启动在即的“脑计划(BRAIN Initiative)”项目将获得美国政府提供的总计1亿美元的经费。该项目旨在开发用于探寻大脑精细环路的新技术,寻求单神经元研究与大尺度fMRI脑图之间的联系。相关任务既涉及对现有技术的反思及改良——如能够让人用光脉冲控制神经元活动的“光遗传学(optogenetic)”方法——也包括发明全新的技术。
 
这一切努力或示意着一个新时代的到来,人类终于能够切实领会大脑的复杂性。加州大学伯克利分校的杰克·贾兰特(Jack Gallant)指出,该领域中尚有海量的宝藏等待我们去发掘,只要我们将目光投向全局。目前人们就像在用一台劣质显微镜观察大脑——部分原因在于,研究者往往只关注个别结果,而绝大部分的MRI数据都被弃置一旁。“我们错过了大量信息。”他说道。
 
关于面孔识别的研究就是一个很好的例子。对于大脑来说,面孔识别是一个颇为棘手的任务,想想人类那些变化多端的表情吧。典型的fMRI实验仅仅会对两种条件下的反应进行比较,比如给志愿者们呈现面孔或房子的图片。基于此类研究结果,神经科学家们曾认为一个脑区——也就是所谓的梭状回面孔区(fusiform face area, FFA)——会特异性地被面孔刺激激活。但是,随着进一步实验的积累,人们发现故事远非这么简单,面孔识别过程其实需要众多脑区合作才得以完成。
 
与此同时,不断成熟的神经成像技术也使得我们对大脑图景的理解日益精进。以贾兰特的实验为例,研究者们在被试观看视频片段的同时对他们进行全脑扫描,尽管总人数不多,单个被试数据对应时长可达数小时之久。通过这种方法,研究者们得到了大量类型各异的刺激所引起的大脑反应。一些常用的数据处理步骤会导致数据损失,于是,贾兰特的团队跳过了这些步骤,竭尽可能地从实验中提取出有意义的数据。
 
这些即将发表的研究结果显示,FFA甚至比人们之前想象的还要复杂——它可以被进一步细分为三个亚区。所有亚区都对面孔有反应,同时又分别参与了其他不同类别物体的加工,例如旗帜、十字架和蛇——功能多样的FFA就像一把用于视觉客体识别的瑞士军刀。但这并不意味着原先的“面孔区域”观点是错误的,只不过不够完善,贾兰特如是说。(不过,另有研究者指出,若想确认这一规律能够普遍适用于所有的大脑,而不仅仅是几名志愿者身上的个别现象,还需要更多实验提供证据。)
 
随着手头的“显微镜”日益先进,我们可以期待,将有越来越多这样的研究问世,向人呈现更具复杂性的大脑活动规律。但是,贾兰特说道,这些研究结果告诉我们,现今的主流理论所描绘的图景仅仅是冰山一角。例如,视觉研究已经斩获不少成就,然而,直至今日,还没有任何一台机器人的视觉可与人类匹敌,更不必说正确识别人脸了。至于情绪和道德判断一类高级认知过程的实现,目前仍是痴人说梦。
 
人类会有一天彻底揭开大脑的谜团吗?贾兰特对此保持了乐观的心态,他向我们指出,fMRI技术方才问世20年。在当时,大家都不清楚如何进行最恰当的实验设计,也不知道如何处理手头浩如烟海的数据。不过,贾兰特认为,研究者们终将从过去的错误——譬如重复提取——中吸取教训。脑科学研究总是在不断进步的,他说。
 
就连热爱击剑的约安尼季斯也同意这一观点,认为人们总有一天会从跌倒的地方爬起,修正过去对大脑的错误理解。问题在于,这一天何时能够到来?“如果要花几年的时间才能驳倒这些问题,无疑会浪费大量的精力。”正如他所说,“大脑比绝大多数系统都要复杂。”
 
说起高深程度,世上少有难题能比得上我们脑壳儿底下的这团迷云。毫无疑问,要想破解这一谜题,我们需要最精细的研究工具,以及最优秀的操作技术。

怀疑论者的“神经科学狂热”玩赏指南 

出问题的不光是神经科学家们的工具包,人们在对复杂性状和行为表现进行解释时,也经常掉进错误解读研究结果的陷阱。 
常常能够读到这样的报道,声称某些大脑活动或解剖结构与精神疾病倾向相关,例如,研究表明,杀人犯在观看他人受折磨的图片时,负责共情的脑区活动下降。辩方律师可能会把这一结果用作证据,为被告人减轻刑事责任;一些专家甚至开始思考,是否可能就此判定一个人更具犯罪倾向。然而,八成有许多完全没有犯罪意图的人在大脑扫描仪里显现出了同样的变化。(事实的确如此,已有研究发现,医生会抑制自己对疼痛的共情反应,从而更好帮助病人减轻痛苦。)而且,杀人犯大脑的异常可能是之前残暴行为产生的结果,而非原因。 
类似的“大脑中心论”还出现在关于药物滥用的讨论当中,认为后者其实是一种“大脑疾病”。毫无疑问,成瘾物质的确会对我们的神经环路带来长期影响,但是,正如精神病专家萨利·沙特尔(Sally Satel)和临床心理医生斯考特·利林菲尔德(Scott Lilienfeld)在著作《洗脑(Brainwashed)》(Basic Books, 2013)中所说的那样,这一观点低估了其他因素的作用,包括压力、朋友的影响、以及获取药物的难易程度。持有该观点的成瘾人士可能会放弃一些有用的心理学戒断策略,譬如回避那些可能激发欲望的外界刺激。沙特尔和利林菲尔德还指出,把黑锅都丢给大脑回路的做法可能会打击人们对自我控制的信念,虽然事实证明80%的成瘾患者都成功戒除了他们的不良嗜好。 
毫无疑问,脑科学对医学和法律领域具有巨大的推动作用,前景颇为可观。但是,我们应当牢记:无须将我们的命运,交由神经学主宰。 (编辑:游识猷

拓展阅读

你们都误会了,科学是个好大叔
赤裸裸的统计学:5大常见统计偏倚

编译来源

New Scientist, Hidden depths: Brain science is drowning in uncertainty、
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
永远不会有一个终极工具来研究大脑,除了它自己 |吐槽fMRI
818你不知道的神经营销优势(上)
2017年诺奖预测:脑成像重磅级研究解读
关于人类大脑的神经科学研究新进展
新研究:用神经网络解码大脑
AI通灵!类ChatGPT模型解码大脑信息,准确率高达82%
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服