Собрано вручную: источники данных о коронавирусе в России и мире
Обновлено
от Kseniya Orlova
Составили для вас список источников информации и данных о распространении нового коронавируса COVID-19 в России и мире.
Данные соответствуют следующим условиям:
- актуальность — регулярная обновляемость;
- корректность — данные собраны из проверенных официальных источников или верифицированы активистами значимых сообществ, таких как Open Data Science.
Данные собраны как официальными исследовательскими сообществами и статистическими службами, так и неформальными группами активистов.
Данные о распространении коронавируса в России
Данные по ситуации в России собираются активистами на основе:
- ежедневных отчетов Коммуникационного центра Правительства РФ по ситуации с коронавирусом с сайта стопкоронавирус.рф;
- ежедневных сводок Роспотребнадзора об актуальной эпидемической ситуации в России и мире;
- данных карты индекса самоизоляции Яндекса: данные в JSON.
Альтернативные репозитории:
- Репозиторий с копией данных, предоставленных университетом Джонса Хопкинса, совмещенных с данными по России: https://github.com/grwlf/COVID-19_plus_Russia.
- Данные, собранные независимым аналитиком Сергеем Шпилькиным: https://drive.google.com/drive/folders/1Y23J6QRt_yiyOI75KuZuIyVNeqS_sZpB.
- Репозиторий доцента НИУ ВШЭ Алексея Куприянова для учета случаев эпидемии COVID-19 в России: https://github.com/alexei-kouprianov/COVID.2019.ru.
- Данные о коронавирусной статистике в разрезе муниципалитетов, собранные Борисом Овчинниковым и активистами: https://docs.google.com/spreadsheets/d/1L1eFrloQdG5BcJrR-Ivkqmfda-7Vf4GXPPlVR26iY20/edit?usp=sharing
- Репозиторий данных о распространении COVID-19 по Москве и Краснодару от Глеба Ивашкевича: https://github.com/PhtRaveller/covid19-ru
- Наборы данных, собранные Сергеем Сошниковым, Дарьей Халтуриной и Идрисом Булатовым: https://data.mendeley.com/datasets/8b8ygpt596/2
- Дашборд о коронавирусе на Yandex DataLens. Скачать данные: https://datalens.yandex/7o7is1q6ikh23?tab=ov3
Данные о распространении коронавируса в мире
- Novel Coronavirus (COVID-19) Cases, provided by JHU CSSE — официальные наборы данных от университета Джонса Хопкинса
- Данные о случаях коронавируса от университета Джонса Хопкинса в JSON-формате: https://github.com/pomber/covid19
- Статистический отчет ЕС по COVID-19: Трекер COVID-19 для стран ЕС. Репозиторий: https://github.com/Jonur/covid19-eu-report
- Worldometers: https://www.worldometers.info/coronavirus/
- Статистика и исследования COVID-19 от проекта “Our World in Data”: https://ourworldindata.org/coronavirus#n-co-v-2019-data-working-group-data
- Репозиторий наборов исторических данных, связанных с COVID-19: https://github.com/open-covid-19/data.
- Coronavirus (Covid-19) Data in the United States — сведения о распространении вируса и смертности в США от команды издания New York Times
- Обобщенные анонимные данные о перемещениях (мобильности) населения от Google по странам: https://www.google.com/covid19/mobility/
- Apple Mobility Trends Reports (CSV)
- Набор данных о COVID-19 на Kaggle: https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset
- Corona Virus (COVID-19) Tweets Dataset — набор данных твитов о распространении коронавируса
Ранее мы писали о том, где еще можно найти базы данных о коронавирусе COVID-19.
Социально-экономические данные
- Моделирование управления распространением заболеваний в регионах по данным о демографических/ экономических факторах
- International Monetary Fund’s COVID-19 Policy Tracker
CLI-инструмент (Command Line Interface) для извлечения и транскодирования данных, связанных с COVID-19 — стандартизированный инструмент транскодирования и CLI для национальных и международных наборов данных. Можно использовать его для исследований: https://github.com/ggbaro/covid-health-ita.
Данные о COVID-19 относятся к категории чувствительных, поскольку результаты прогнозирования сценариев эпидемиологической ситуации вызывают общественный резонанс. Поэтому анализ этих данных требует аккуратности, а интерпретация результатов — списков допущений, так как исходно они имеют следующие проблемы:
- Разрозненность источников и форматов данных. Нет единой электронной таблицы, которую каждый заполняет в соответствии с единой методологией и которая легко позволила бы сравнить случаи заражения и смертности по всему миру.
- Большая разница между мерами профилактики и борьбы с коронавирусом и их несопоставимость по странам и городам, что влияет на данные и общее знание о том, сколько людей на самом деле заразились COVID-19.