Получите официальный артефакт данных о новой коронной эпидемии COVID-19 | Задача августовского обновления

алгоритм
Получите официальный артефакт данных о новой коронной эпидемии COVID-19 | Задача августовского обновления

Пишите впереди:

Если у вас есть какие-либо потребности и вопросы по обучению языку R, вы можете написать мне лично, и я смогу ответить на ваши вопросы о работе с языком R. (пс т.к. контент оригинальный, все виды коммерческого использования запрещены, а для перепечатки необходимо указывать источник)

текст:

Пакет, опубликованный 5 июля 2021 г. - covidregionaldata, для получения данных о COVID-19 на местном и национальном уровне из официальных источников, таких как Службы общественного здравоохранения Великобритании, Англии и других сборников данных о COVID-19, включая Всемирную организацию здравоохранения (ВОЗ), Европейский Центр профилактики и контроля заболеваний (ECDC), Университет Джона Хопкинса (JHU), общедоступные данные Google и многое другое. Предназначен для упрощения извлечения, очистки и обработки данных о COVID-19 из различных источников данных открытым и прозрачным образом.

Эта статья используется для демонстрации процесса этого пакета для получения данных о COVID-19. Для того, чтобы проверить запасную сторону, вы можете собрать ее! Если вам это нравится, пожалуйста, поставьте лайк или подпишитесь на него~

1. Возьмите ВОЗ в качестве примера, чтобы разобраться в процессе загрузки данных о COVID-19.

Источники данных, представленные в этом пакете, включают Бельгию, Бразилию, Канаду, Колумбию, Covid19DataHub, Кубу, Францию, Германию, Google, Индию, Италию, JHU, Литву, Мексику, Нидерланды, Южную Африку, Швейцарию, Великобританию в дополнение к ВОЗ. Методы загрузки очень похожи. Здесь мы возьмем ВОЗ в качестве примера, чтобы изучить процесс загрузки данных.

В новом методе функции каждого параметра следующие:

level='1' используется для установки данных города, level='2' используется для установки данных регионов, level по умолчанию равен '1', level='3' используется для установки данных субрегионов

verbose по умолчанию имеет значение TRUE. Должны ли возвращаться подробные сообщения об обработке и предупреждения;

step=TRUE используется для сохранения данных каждого шага обработки; get используется для получения данных

library(covidregionaldata)
start_using_memoise()
national <- WHO$new(verbose = TRUE, steps = TRUE, get = TRUE)

На следующем рисунке показан процесс загрузки данных, вы можете увидеть источник загрузки данных:

Downloading data from Из OVI 19.WHO.int/WHO-C Ovid-1…

И некоторые основные переменные данных, такие как тип данных, количество строк и столбцов данных

national$return()

(1) Используйте return для возврата результатов всех данных и используйте метод DT для отображения результатов таблицы, что действительно красиво

По результатам WHOreturn возвращается всего 5 таблиц, причем основные данные одинаковы, то есть каждая таблица будет иметь некоторые отличия в некоторых полях.

Отображение информации о городе или районе, включенной в данные, здесь напечатан список городов

national$available_regions()

Не все источники данных имеют региональные данные, у ВОЗ нет настройки level='2', Covid19DataHub$new(level = "2") Это нормально

(2) Существует функция настройки загрузки, просто сделайте это напрямую

national$download()

(3) Есть функция фильтра настройки, вам нужен только фильтр, вы также можете установить параметр region='Albania' в новой части в начале

national$filter("Albania")
national$process()
national$return()

(4) Когда я попытался его использовать, я обнаружил ошибку, то есть после частого и многократного вызова нового метода он будет перехвачен веб-сайтом источника данных, я не знаю, сработал ли он какой-то анти- механизмы подбора~

Эту точку ошибки можно проследить, чтобы убедиться, что это моя проблема с сетью и ip ~