MIGRATE:年度人口迁移新数据集
上周五,康奈尔大学和伯克利大学的研究人员在《自然》杂志上发表了一项非常出色的研究。
长期以来,研究人员一直只能使用美国县与县之间的数据,这种粒度非常粗糙。而专有数据集往往对研究人员不开放,或存在较高的偏差。这篇论文介绍了MIGRATE,这是一个覆盖2010-2019年的新数据集,通过将专有/商业数据锚定到人口普查数据,捕捉了474亿对人口普查区块组(CBG)之间的人口流动。
为了理解这个新数据集所达到的规模,了解美国人口普查局的测量层级会很有帮助:
县:迁移数据的标准单位。县可能非常大(洛杉矶县约有1000万人)。
人口普查区:县的细分单位。
人口普查区块组(CBG):本研究使用的单位。它是由多个区块组成的集群,通常包含600到3000人。美国约有21.7万个这样的区块组。
人口普查区块:最小单位(相当于由街道围成的城市街区)。
研究人员声称,他们的MIGRATE数据集比公开可用的5年县级数据精细约4600倍,比州级数据精细1800万倍。这太疯狂了。
这使研究人员能够看到以前不可见的超本地化模式。他们提到的一个完美例子是2017年和2018年加州野火(Tubbs和Camp火灾)引发的"气候撤退"。如果只看标准的县级数据,你会看到几乎持平的外迁率。你可能会得出结论,这些大规模火灾没有导致任何人流离失所。
但Tubbs火灾中77%的搬迁者和Camp火灾中54%的搬迁者搬到了同一县内的其他CBG。人口下降"Tubbs火灾的幅度比5年ACS水平可见的高260%,Camp火灾高40%"。
这篇论文应该对很多美国研究人员有很大帮助,特别是那些研究气候导致的人口流离失所的人。例如,我们之前报道过一篇Redfin的文章,关于洪水易发地区的净流出,他们使用的是县际数据。像这样的报告可能大大低估了气候导致的人口流离失所,因为它掩盖了短距离的撤退。