15 апреля 2020 г., Карло Бейли.
Чтобы узнать больше о COVID-19, перейдите на covid19.topos.com

В густонаселенных городских округах с большой численностью населения наблюдается наибольшее количество случаев заболевания и смерти, вызванных COVID-19. Это можно объяснить многими факторами, выходящими за рамки их соответствующей плотности населения, в частности тем фактом, что Нью-Йорк и Бостон (города, в которых находятся округа с одними из самых высоких концентраций заболевших) являются глобальными центрами путешествий. В то время как плотность населения в значительной степени объясняет высокий уровень смертности в этих городах, существуют и другие факторы, которые также имеют статистически значимое отношение к смертности и инфицированию ²⁾: количество ежедневных пассажиров, пользующихся сетями общественного транспорта. , процент жилых домов с 50+ единицами, даже плотность пиццерий (близкая и дорогая нашему сердцу тема) в районе. В этой статье мы исследуем сходство между округами на основе множества факторов и посмотрим, может ли это дать нам представление об уровне смертности в США от COVID-19.

Корреляция с общим числом смертей

Как компания, занимающаяся разведкой местоположения, Topos работает с тысячами функций, которые описывают то, как мы живем вместе и передвигаемся как люди - типы зданий, в которых мы живем, виды транспорта, которые мы используем, чтобы добраться до работы, разнообразие заведений, которые составляют наши города и районы. Мы преобразуем эти функции в миллиарды точек данных, которые дают нам целостное представление о месте.

Один из первых вопросов, который мы задали, когда пандемия начала разворачиваться, был: «Что наши особенности могут рассказать нам о том, как вирус распространяется через сообщества?» Глядя на взаимосвязь между общим числом смертей в округе и нашими характеристиками, мы обнаружили две наиболее значимые взаимосвязи: процент населения, пользующегося общественным транспортом (объясняющий ~ 70% различия в общем количестве смертей по стране) и процент жилых домов 50+ единиц (что объясняет ~ 45%). Эти отношения остаются значимыми, хотя и с немного меньшим значением R2, при удалении округов в штате Нью-Йорк.

Сходства и различия между округами

Как компания, один из основных вопросов, на который мы с самого начала стремились ответить: как мы понимаем сходство и дистанцию между географическими регионами в 21 веке?

Учитывая, что плотность жилых домов, насчитывающая более 50 единиц, и использование общественного транспорта демонстрируют такую ​​тесную связь с количеством смертей, вызванных COVID-19, мы можем изучить сходства и различия между округами на основе режима транзита и типа жилого дома⁽ ⁵⁾ чтобы узнать, могут ли они дать какое-либо представление о том, как вирус может повлиять на сообщество. Мы строим нашу метрику сходства на основе общественного транспорта и жилья, используя «косинусное расстояние», чтобы измерить сходство в разных географических регионах. Косинусное расстояние - это вычисление, которое часто используется для изучения расстояния между объектами в векторных пространствах большой размерности; здесь он позволяет нам сравнивать страны сразу по нескольким релевантным параметрам.

Основываясь на этой метрике сходства на основе транзита + жилья, два округа, наиболее похожие на Бруклин (мы выбрали Бруклин, поскольку он имеет один из самых высоких показателей смертности в стране по состоянию на 13 апреля 2020 г.) с точки зрения пригородным транспортом и типом жилья являются Манхэттен и Бронкс, что неудивительно, учитывая, что в Нью-Йорке самая разветвленная сеть общественного транспорта и самая высокая концентрация высотных зданий в стране. За ними следуют округа округа Колумбия, Сан-Франциско и Чикаго.

Сходные траектории ежедневных смертей можно увидеть во многих округах, наиболее похожих (по метрике схожести на транспорт + жилье) с Бруклином. Это неудивительно, поскольку и плотность общественного транспорта, и процент от 50+ жилых домов сильно коррелируют с количеством смертей, которые мы наблюдали до сих пор. Однако Сан-Франциско, похоже, идет против тренда. Это может быть связано с множеством факторов, ниже мы выделяем три: SF имеет более низкую долю пассажиров общественного транспорта, немного меньшую плотность больших жилых зданий (оба показателя служат нашим расчетом сходства), а округ внедрил политику пребывания дома. на пять дней раньше, чем в Бруклине.

Если мы посмотрим на количество заболевших с течением времени в наиболее непохожих округах Бруклина, с точки зрения распределения пригородных перевозок и типов жилья, мы увидим, что рост случаев намного медленнее, чем округа Нью-Йорка. Если первоначально в Бруклине число случаев заболевания удваивалось каждые 5 дней, то в Уэйнсборо, штат Вирджиния или Аттала, количество случаев заболевания удваивается каждые 14–16 дней. Ни в одном из этих округов пока что не было смертей (по состоянию на 13 апреля 2020 г.).

Сходства между городами

Когда мы уменьшаем масштаб, чтобы посмотреть на данные на уровне города (здесь мы используем Объединенную статистическую область для определения города), характеристики, которые наиболее сильно коррелируют с уровнем смертности, немного отличаются от тех, что на уровне округа. Существует тесная связь между пожилым населением и более высоким уровнем смертности от COVID-19; а с исключением города Нью-Йорка из анализа, плотность отдельно стоящих домов на одну семью становится сильно коррелированной характеристикой, объясняющей ~ 65% вариации.

На этот раз мы посмотрим на города, похожие на нынешнюю (по состоянию на 13 апреля 2020 г.) хорошо известную точку доступа - Детройт - и посмотрим, какие города наиболее похожи на основе сильно коррелированных характеристик, перечисленных выше: возраст населения, плотность заселения. типы зданий и распределение доходов домохозяйств.

Наиболее похожие города широко разбросаны географически, от Луисвилля до Гринсборо. Выбирая 3 из наиболее похожих городов, Луисвилл, Дейтон и Бирмингем, мы видим, что, хотя их дневной уровень смертности в настоящее время намного ниже, чем в Детройте, темпы роста начинают расти. Учитывая аналогичное распределение пожилых уязвимых групп населения, в этих городах может наблюдаться еще больший рост числа случаев заболевания.

Здесь мы вкратце продемонстрировали, как мы можем посмотреть на сходство между местами, чтобы получить представление о том, как развивается пандемия, без использования более сложной модели прогнозирования.

Мы рекомендуем вам изучить нашу карту, ​​чтобы сделать для себя интересные выводы.

Сноски

  1. На плотность населения приходится 45% разброса показателей смертности по стране, p ‹0,0001
  2. Мы использовали корреляцию Пирсона, чтобы изучить взаимосвязь между количеством случаев COVID-19 + смертей и другими факторами.
  3. Мы смотрим на показатели смертности, а не на количество случаев из-за различий в политике тестирования по всей стране.
  4. Корреляция Пирсона рассчитана 13 апреля 2020 года в США. Данные взяты из опроса американского сообщества 2018 г.
  5. Сходство, измеряемое по виду транспорта и типу жилья, включает: процент пассажиров, которые ездят на автомобиле, пользуются общественным транспортом, ездят на велосипеде, работают удаленно, ходят пешком и пользуются услугами автосервиса. А также процентная доля отдельных семейных отдельно стоящих, прикрепленных к одной семье, мобильных домов, автофургонов и зданий с квартирами от 2, 3–4, 5–9, 10–19, 20–49 и 50+

Источники данных:

  • COVID-19 по округам, The New York Times (источник)
  • Демографические данные по округам за 2018 г., исследование американского сообщества, 2018 г. (источник)
  • Данные о выборах в США, MIT Election Lab (источник)
  • Местная политика в отношении Covid-19, Фонд семьи Кайзера (источник)

— —

Узнайте больше о нашем исследовании COVID-19:

Взгляд на Covid-19 во втором доме для богатых