近年来,公益慈善领域对数据驱动和科学实证的需求日益增长,尤其是在资金配置和项目评估方面,随机对照试验(RCT)因其严谨性和科学性被广泛认可。GiveWell作为领先的慈善评估机构,通过长期积累的RCT证据支持其推荐的顶级慈善项目。然而,2024年GiveWell资助的Institute for Replication(I4R)团队尝试复现这些基础RCT时,遭遇了前所未有的挑战。这一过程不仅揭示了当前科研数据管理的不足,也促使公益领域反思如何加强研究工作的透明度和可重复性。 GiveWell自2014年以来,已向其四大顶级慈善项目投入逾12亿美元,这些项目涵盖了防治疟疾的杀虫蚊帐(ITNs)、季节性抗疟药物预防(SMC)、维生素A补充(VAS)以及针对儿童接种疫苗的现金激励方案。每一项目的有效性都建立在大量RCT和系统性Meta分析的基础上,相关的关键文献包括Pryce等人关于杀虫蚊帐的2018年Meta分析、Meremikwu等人2012年关于季节性疟疾预防的研究、Imdad等人2022年关于维生素A补充的综述以及Neelson等人2021年对于健康服务现金激励的分析。
复现工作旨在核实这些RCT的数据和代码,通过联系论文作者获取原始资料,试图独立重复实验过程,验证结果的真实性和稳健性。这项工作体现了GiveWell推动科学严谨性和公益资金高效利用的决心。尽管如此,I4R团队面对的现实远比预期复杂。182篇涉及核心Meta分析的论文中,仅成功定位到170篇论文的作者邮箱地址,最终收到回复的只有41篇论文相关的作者,回应率不足10%。众多数据因年代久远、存储方式落后甚至遭遇物理破坏而丢失,不少作者指出,数据所有权归属机构复杂,大学或研究机构已无权直接提供数据。 数据流失是阻碍复现的主要瓶颈之一。
部分OCR研究人员坦言,1980年代的实验数据依赖实体卡片存储,部分数据因仓库环境恶劣被啮齿动物破坏,另外,有些数据以过时的软件格式保存,需要耗费大量时间才能提取利用。诸如期刊数据保留期限多为20年等政策限制,亦让更早期的试验难以获得支持。除此之外,轻量化的邮件方式未能有效引起研究者重视,许多邮件未被及时打开,部分作者缺乏数据共享的积极意愿,也大大降低了合作的可能性。 不同领域的回答差异明显。维生素A补充领域的研究者中有最多的回应,但多表示数据无法复得或解读成本昂贵;相比之下,季节性疟疾预防和杀虫蚊帐领域几乎无回应。现金激励项目表现略好,有部分数据存储在公开数据库(如世界银行微观数据库)或可通过许可获得,但代码和完整数据集依然缺乏共享。
这一挑战反映了科研文化和机制中尚未解决的根本问题。尽管开放数据和代码已成为科研诚信与可重复性的新标准,但现实中研究者面临知识产权、隐私伦理、技术支持等多重约束。此外,历史遗留问题加剧了复现困难,旧实验不是单纯的数据文件问题,更牵涉到实验设计、实施细节的完整再现。 GiveWell的此次探索表达了推动公益研究数据共享的呼声,未来可能采取更为深入的策略,通过建立研究助理资助、暖场沟通拓展合作关系以及激励机制促进数据整理和开放,尤其针对相对较新的证据库。另外,加强与伦理委员会和数据所有机构的协调,也是实现部分敏感数据共享的必要路径。 这场关于RCT复现的努力传递出两个重要信号。
首先,数据透明和开放共享对于确保科学发现的可信度至关重要,尤其当这些发现指导巨额资金流向影响千万人的健康与福利时。其次,科研界和资助机构需要协同制定合理政策,既保护研究对象权利,又保障数据能用于独立验证和政策制定,从而推动整个公益体系更加科学化和高效化。 展望未来,公益慈善领域的研究验证机制将迎来变革。GiveWell及其合作伙伴在经验教训基础上,已开始尝试构建更加系统和多层次的数据共享网络,倡导学术界普及使用现代数据管理平台,建立标准化数据存档及访问框架。与此同时,科研人员需要更积极参与复现和开放合作,资助机构应将数据管理纳入项目评审和奖励体系。 综上,GiveWell尝试复现其顶级慈善项目基础RCT的经验,既反映出当前科学研究实践的瓶颈,也昭示了公益领域向科学严谨性迈进的迫切需求。
借助现代信息技术和政策创新,公益数据共享规范必将逐步完善,未来更多随机对照试验将不仅仅是权威的单点证据,更成为可验证、可复核的公共资源,助推全球公益事业科学塑造更加坚实的基石。