人民网旧金山4月17日电 (邓圩 杨志宏)来自美国华盛顿大学的一项流行病数据研究表明,“封城”令武汉的新冠肺炎疫情基本传染数R0从2.7-4.2降到1,有效地阻断了更大规模疫情暴发。

  新冠疫情蔓延以来,R0、拐点、放平曲线,变成大家耳熟能详的热词。“约翰斯·霍普金斯大学如何成为全球疫情数据网红”“全球超100万人感染新冠!自然杂志揭秘帝国理工如何预测疫情趋势”“斯坦福教授声明疫情很快终结,不必恐慌”……这样标题的报道经常出现。

  很少有一个时刻,专业化的流行病学数据研究这样吸引大众关注;很少有一个时期,公众意识到准确理解数据变化对自己影响重大。流行病学数据研究项目是怎么兴起的?数据是怎么产生的? 数据研究和决策如何发生互动?人民网美西记者就这些问题先后采访了美国华盛顿大学陈迎庆教授和罗切斯特大学罗杰波教授。

  数据研究显示武汉“封城”效果显著

  在最近发表的一篇论文中,美国西雅图华盛顿大学陈迎庆教授研究团队,用统计模型分析了新冠病毒在武汉市的早期传播情况。这个模型依据病毒传播自然史,用每天新发病数,提出了疑似的发病前无症状传染途径。按照他们的分析,估算新冠病毒早期基本传染数R0约为2.7-4.2。但2020年1月23日开始,武汉封城后的4-5天内,实际传染数很快降至1,证明了“封城”策略有效阻断更大规模的暴发。

  陈迎庆教授也是美国ASA(美国统计协会)会士,他的研究项目更多关注于全球。在新冠疫情暴发期间,他的团队另一项研究以肯尼亚为研究对象,采集数据研究新冠疫情对艾滋病预防的影响。他认为,在人类社会活动如此发达的今天,任何传染病都具备了全球传染的可能。陈教授关心的颗粒度是多元化、多层次的,可以细致到病毒本身的基因序列演化和个人行为差异,也可以涵盖社区防疫、各国以及世界卫生组织(WHO)的政策影响。“更重要的一点是,这些项目是动态的,会随着时间不断地调整项目的数据采集和分析方向。”他说。

  大数据能够对控制流行病有用,还取决于一些条件。“能够及时、准确地采集各种数据,是有效的治疗和预防的前提。”陈教授举例说,中国的传染病数据检测系统很发达,过去也做得很成功,尤其是2009年内蒙爆发猪流感的时候,运作很有效。因为很有效,所以早期就遏制住了,也没有引起公众注意和恐慌。“这次COVID-19的隐匿性太强大,很多感染者前期并没有症状,很容易造成检测系统的错失和被动。”他说。

  始于九十年代人类基因组的研究,借助于日益提高的计算能力和算法,大大推动了利用大数据来研究人类健康和公共卫生的发展。传染病预防是遏制传染病进一步传播的关键,预防措施取决于对传染病本身的了解,从而对现有手段和资源的掌握、调度和实施。所以,大数据研究往往能够未雨绸缪。

  “抗击新冠病毒已经进行了几个月,世界各国人民已经付出了巨大牺牲,未来可能要进行长期的艰苦努力,相信大数据研究一定会继续积极促进科学决策,为人类文明胜利战胜新冠病毒做出贡献。”陈教授认为,这次新冠肺炎疫情灾害的影响是前所未有的。道高一尺,魔高一丈。当人类的抵御手段加强,病毒的感染和致病能力也会加强。人类已经无法回到小国相邻鸡犬相闻、老死不相往来的时代。要阻断病毒流行,需要更多的全球合作和协调,重视数据采集和共享,提高公共卫生决策和疾病预防的反应。

  大数据研究促进科学决策

  美国罗切斯特大学罗杰波教授目前正在研究比对不同城市的公交系统对疫情蔓延的影响,比如纽约和洛杉矶,华盛顿和西雅图。通过比对不同城市的应对,检查公交系统和干预手段在疾病流行中的影响,测定预防干预效果。

  罗教授指出,在数据采集方面,直接的追踪固然是个好办法,问卷调查也是一个好办法。但是由于各种社会和心理因素对结果的干扰,数据需要“清洗”才能相对准确。罗教授希望采用观察、间接、不干预的方式获取数据,例如调查谷歌搜索中,在特定时间、特定区域查找疾病关键词的频度,了解流行病区域分布情况;在社交媒体追踪人们情绪和关注点数据等。这是获取更准确研究结果的一个办法。

  他介绍,学术上大数据与流行疾病传染研究项目的兴起有很多因素,根本动力来自于用大数据研究促进社会健康的公益目的,来自于对疾病预防的意义。

  事实上,并没有一个机制或者“文件”保证这些研究机构的研究数据和成果能被运用于决策。但他们的确在决策中发生了重要作用。包括人们熟悉的疫情数据,目前被引用最多的就是约翰·霍普金斯大学的疫情数据,华盛顿大学的疫情数据,以及以留学生和硅谷工程师为技术团队的“一亩三分地”疫情数据,这些数据因为实时更新快,统计准确而为大家所信服。

  来自美国疾病控制与预防中心CDC的一份报告显示,正在美国流行的疫情让全美50个州选择隔离在家的政策。但很少为人所知,正是来自加州旧金山湾区圣塔克拉拉县的一份独特的早期研究报告帮助当地官员们意识到危机来临,并制定了美国首个防疫点,也成为美国最早宣布进入紧急状态、最早命令居家隔离、最早全州“关闭”的地方。

  今年2月底,1例无武汉旅行史的新冠疫情患者在圣塔克拉拉县发现,按照当时的政策,任何无武汉旅行史的人、或者无确认接触过已知感染者的人不能获得新冠病毒检测。但这位患者令当地敏感意识到这可能已经是社区扩散的开始。

  圣塔克拉拉县卫生局紧急上报美国CDC,联合加州卫生厅和CDC,一起做了小规模的流行病盯梢监视调查。从3月4日到3月15日进行的小规模研究,印证了社区传播的判断。“这很重要。因为它表明,这种疾病在社区中有传播,而且这种疾病的传播范围可能比以前所了解的更广,”圣塔克拉拉县卫生副局长乔治?韩博士说。“正因为如此,我们能够将这些数据作为一项数据,告知我们如何向公众提出建议和命令。”

  美国流行病数据研究机构如何运行?

  陈迎庆说,通常情况下,决策机构本身不会参与大数据科研项目的日常运作,但可以请求为项目提供数据支持、模型分析和疫情预报。无论是联邦政府还是地方政府,直接行政干预很少。有些时候,政府会用特定的招标来资助一些项目和科研网络。不同的研究团队,会通过各种方式来进行交流和学习。流行病数据研究的生态圈整体是有活力的,既有竞争也有合作。

  流行病数据研究公开向全社会提供,政府在学界研究中寻求决策的参考和依据,实际上是长期以来形成的社会生态链。

  而所谓国家级研究机构,比如NSF(美国国家科学基金会)、NIH(国立卫生研究院)、CDC的研究机构等,这些“国家队”往往并不解决尖端创新问题。罗杰波教授告诉记者,像NSF、NIH这些机构,内部负责管理资金、负责项目的科学家,他们的研究目标并不是攻克这个专业的顶尖问题,他们最重要的责任是始终不脱离学术界,始终保持对学术界创新和动态最敏感的触觉。一旦碰到相应问题,这些机构一定要最清楚去找谁来解决。

  不以营利为目的,参与政府招标项目也“非主流”,项目研究的经费从哪里来?陈迎庆教授告诉记者,项目的经费来源很多样。在美国,美国国立卫生研究院和疾控中心是项目最主要的经费资助机构。其他各种基金会,还有各类高校、科研机构以及商业机构,都投入大量经费支持此类研究。

  对学者来说,只要把研究触角放到新领域,致力于新研究,就会有“新钱”(新投资)。罗杰波教授解释,创新的、尖端的研究和探索往往是获得更多资金的资格。学术界回馈社会的方式,主要途径包括发表论文,不仅仅是刊登在“核心”期刊,而是去增加全社会对问题的认识,促进社会大众建立基于科学研究的共识。