用地图大数据助力精准防控,专家详解如何制作“图说疫情”

作者: 日期:2020-03-13 18:43:46

科技日报记者 唐婷

疫情汹汹时,每个人都无法置身事外。搜集疫情相关的各种数据、制作1500多张疫情分布地图、连续推送20多期“图说疫情”分析……北京建筑大学测绘与城市空间信息学院院长杜明义教授带领团队积极投身到科技战疫的洪流中。

疫情期间,一些平台都推出了专门制作的疫情地图。在杜明义看来,疫情地图不仅仅是患者人数和所在地理位置信息的简单叠加。借助空间信息技术制作专业的疫情防控地图,用地图大数据为精准防控提供支撑,是他和团队的初衷。

“这是我们利用截至到2月23日的数据制作的京津冀感染风险指数图。这应该是独一份,在其他的疫情地图产品中没有见到‘同款’的。” 杜明义在接受科技日报记者采访时说道,透过这张图,可以看到当时北京、天津、唐山部分地区的感染风险明显高于京津冀其他地区。

一张张简洁明了的疫情地图背后,凝结了大量的数据收集处理工作。多源异构大数据的快速获取、处理、融合、表达与协同,是杜明义团队首先要面对的技术难题。

为制作疫情地图,杜明义团队采集的数据源非常广泛,除了地图、遥感影像等常规空间数据以外,还包括卫健委发布的疫情数据、微博舆情数据、百度人口迁徙、网页文本抓取数据、共享单车轨迹数据等多源多类型数据。

“这些数据时间和空间基准不同,可能存在冗余的信息,我们需要通过数据清洗、集成、规约等技术手段来进行数据处理。”团队联合负责人蒋捷教授介绍道。

不同来源的数据在疫情地图制作中扮演着怎样的角色?团队技术骨干曹诗颂博士举例道,百度人口迁徙大数据反映出了不同省市人口的迁入和迁出率,将这一数据与疫情数据结合分析,可以探索疫情空间分布和人口迁徙之间的关联,进而辅助疫情防控决策。在分析传播风险的时候,除了用各省市的人口迁徙数据外,还可以利用夜光灯光数据来辅助估算实际居住的人口规模和企业复工情况,以提升疫情风险地图的准确性。

“再比如,微博舆情反映某地医疗资源不够,我们能够通过时空语义规则从文本信息中抽取相关数据,判断医疗资源短缺的具体地点。” 曹诗颂认为,将统计指标进行空间化的分解和呈现,有利于生成疫情防控的知识地图,用图说话,清晰直观。

随着疫情的变化,疫情地图也在不断地更新。如何科学合理地设计疫情地图的监测指标也是杜明义团队需要应对的难题。在杜明义看来,从地理学中“人-地关系”角度来理解,疫情的发展态势在一定程度上与当地的地理环境和社会经济状况有着密切关联,因此,在设计疫情地图的监测指标时,需要从多个维度来进行动态监测。此外,宏观尺度的国家、省、市、区、县,和微观尺度的社区和个体,各自需要监测的指标也不相同,因而需要对不同尺度的对象设置不同的指标体系。

目前,新冠肺炎疫情在全球多点暴发并呈现蔓延态势,部分国家疫情还比较严重。对此,杜明义团队在每日推送的“图说疫情”分析中增设了世界各国疫情综合分析专题。

汇总截至到3月11日的数据,杜明义团队制作了最新一组的世界各地疫情分布图。“除中国以外,目前世界各地累计确诊病例数最多的是意大利,其次是伊朗、韩国等国。应该严密关注境外疫情发展动态,采取必要的应对措施,以防范境外疫情风险输入扩散。”杜明义建议。