新冠肺炎疫情在全球多国蔓延,多国主流媒体和卫生部门在发布疫情数据时都引用了美国约翰斯·霍普金斯大学检测的疫情数据和相关地图。而这幅全球都在刷的“网红”地图出自约翰斯·霍普金斯大学两名中国博士生董恩盛和杜鸿儒,以及他们的导师劳伦·加德纳之手。
第一版疫情地图仅用了8小时
在今年1月份,新冠肺炎疫情还尚未在全世界范围流行起来时,董恩盛就和导师达成一致意见,想要做这样的一份数据地图。
“我导师说要不要做一个dashboard(数据仪表盘),基本上当天晚上我大概花7到8个小时就做好了。”
董恩盛说,一是因为自己本身就是中国人,对家乡的疫情都比较担心,也很关注。另外就是想通过自己的数据收集,把一个疾病从“出生”一直到最后被人类所战胜的一个过程记录下来。
最初,地图数据完全靠手动整理,每天最多更新4至5次。而随着疫情发展,这种方式变得不可持续。在研发团队努力下,进入三月以后,数据已逐渐实现每20分钟即可自动更新一次,并辅以人工审核,在确保准确的基础上提高数据时效性。
杜鸿儒解释说:“我们是编写了一个程序,这个程序的作用是从各个数据源收集数据,再整理成统一的格式,然后更新到我们的服务器中。更新程序的同时,我们也在这个程序当中留有了一块人工会处理的部分。任何一个地方,如果(累计)死亡案例或者(累计)确诊案例出现往下降的情况,这些都是一个异常,我们要去人为检查,确保这个数据的准确。”
为不断完善可视化效果,研发团队还对数据地图进行了多次改版。各项标注都充分考虑到了用户体验,现在如果用户放大地图到一定程度,红色的点就会消失,这样就不会让用户看到他所在的地方还有红色的点,或者说新冠肺炎的病例有个直接的一对一联系,让他们心理上面会觉得舒服一些。
这张图缘何成为全球关注中心
由于新冠肺炎前所未有的破坏力和威胁性,这样面向全球的“疫情数据地图”系统,约翰·霍普金斯大学并不是独一家。哈佛大学与牛津大学合作,美国疾控中心(CDC),以及微软的必应搜索(Bing)都设计发布了类似的系统。
CDC发布的美国疫情地图能显示各州疫情数据,因其官方性质,具有权威性。但董恩盛表示,与他们的地图相比,CDC地图有两个明显缺点,更新不及时,且精度有限。
“可能今天更新的还是前一天的数据,而我们基本是实时更新。他们的数据只能精确到州一级,我们可以精确到州下面的郡县。”
哈佛和牛津和合作设计的疫情地图,更新速度和数据详尽程度也不如约翰·霍普金斯大学。有一个明显的区别是,前者用颜色深浅来体现疫情的严重程度,后者是用点的大小。杜鸿儒介绍,哈佛、牛津的地图有动画显示新冠疫情发生以来全球发展过程的功能,这是他们没有的。
(杜鸿儒工作中)
Bing的地图在某些方面可以提供比约翰·霍普金斯大学更精确的数据,例如俄罗斯、印度、印尼等国的地方疫情数据,而约翰·霍普金斯大学的地图在这几个国家还只显示全国数据。不过,后者能用曲线、柱状图等形式体现疫情发生以来每个国家的疫情发展趋势,功能更丰富,而且数据公开,为学术研究提供了便利。
两个多月下来,约翰·霍普金斯大学全球新冠疫情数据地图早已成为全球最权威的疫情数据平台。
对有人质疑中国疫情数据,他们怎么看?
随着这份疫情地图更新数据的持续增加,董恩盛他们的团队也从最开始的两三个人,发展到现在包括本系其他博士研究生以及其他学院志愿者,再加上合作提供技术支持的公司,一共有近50人的团队在对这样一个每天点击量超过10亿次的疫情地图进行维护。
对近来国际上围绕中国疫情数据产生的“质疑”,董恩盛也有自己的见解。在他看来,中国疫情数据的增长曲线在达到一定水平后就很和缓,可以证明疫情得到了控制。想要进一步证明数据的真伪,很多国家都很难做到这一点,特别是在疫情蔓延全球之后。
2月13日,湖北突然通报新增了13000多例临床诊断病例。董恩盛觉得这是一个比较合理的统计方式的变化,但国际上却因此对中国疫情数据有很多批评。
“其实美国也有类似问题,还有像意大利有段时间只报重症病例。美国有的州县不报外地的病例,比如缅因州挨着波士顿和纽约,如果有一个在大城市注册了身份的感染者回到当地被确诊,可能不会被纳入当地确诊病例进行通报。但他本来所在的大城市也可能不把他列入确诊当中,因为他已经离开了。这就给数据的精确统计造成干扰。
另外,当疫情在全世界持续影响下,两人也都认为世界各国要加强合作,学习中国成功的防控经验,早日控制疫情在全球的蔓延。杜鸿儒说:“从数据上来看,美国目前是全世界(疫情)最严重的。中国疫情防控对其他国家都是很好的榜样,我希望世界上各个国家可以参考中国的防控手段,希望能早日控制全球的疫情。”
(以上为中国新闻网原文)
在越来越多的人关注到他们制作的疫情地图后,化工学院采访到了杜鸿儒本人。
据杜鸿儒介绍,他在疫情地图制作中的工作主要分为两个阶段:第一个阶段是手动更新,在这个过程中,他主要负责数据收集整理以及美国数据的更新;第二个阶段是切换为自动更新后,他主要负责编写自动更新的代码。同时杜鸿儒还负责维护Github数据库,通过对比WHO的数据,验证数据的准确性。
如今,他们的疫情地图已经可以实现自动更新,杜鸿儒主要负责处理代码或者数据异常。现在他们的工作中心已经转移到数据建模上,希望可以对各地区疫情发展进行风险评估,并且对未来发展作出预测。
在谈及天津大学的求学时光,杜鸿儒说:“校园的每个环境都能让我感受到大学的温度并且激励我不断刻苦学习。实事求是的校训、严谨治学的校风、爱国奉献的传统让我无论在何处都能脚踏实地做事、严谨认真求学。天津大学的学习和生活让我能有机会站在世界科技的前沿——这就是天大的传承。”
在采访的最后他还特别的对天津大学化工学院学弟学妹们说到:“希望所有学弟学妹在任何时候都能够坚持自己的梦想,不要害怕失败,勇敢去闯!还有就是一定要学好高数! ”
声明:化学加刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 电话:18676881059,邮箱:gongjian@huaxuejia.cn