Пишите впереди:
Если у вас есть какие-либо потребности и вопросы по обучению языку R, вы можете написать мне лично, и я смогу ответить на ваши вопросы о работе с языком R. (пс т.к. контент оригинальный, все виды коммерческого использования запрещены, а для перепечатки необходимо указывать источник)
текст:
Пакет, опубликованный 5 июля 2021 г. - covidregionaldata, для получения данных о COVID-19 на местном и национальном уровне из официальных источников, таких как Службы общественного здравоохранения Великобритании, Англии и других сборников данных о COVID-19, включая Всемирную организацию здравоохранения (ВОЗ), Европейский Центр профилактики и контроля заболеваний (ECDC), Университет Джона Хопкинса (JHU), общедоступные данные Google и многое другое. Предназначен для упрощения извлечения, очистки и обработки данных о COVID-19 из различных источников данных открытым и прозрачным образом.
Эта статья используется для демонстрации процесса этого пакета для получения данных о COVID-19. Для того, чтобы проверить запасную сторону, вы можете собрать ее! Если вам это нравится, пожалуйста, поставьте лайк или подпишитесь на него~
1. Возьмите ВОЗ в качестве примера, чтобы разобраться в процессе загрузки данных о COVID-19.
Источники данных, представленные в этом пакете, включают Бельгию, Бразилию, Канаду, Колумбию, Covid19DataHub, Кубу, Францию, Германию, Google, Индию, Италию, JHU, Литву, Мексику, Нидерланды, Южную Африку, Швейцарию, Великобританию в дополнение к ВОЗ. Методы загрузки очень похожи. Здесь мы возьмем ВОЗ в качестве примера, чтобы изучить процесс загрузки данных.
В новом методе функции каждого параметра следующие:
level='1' используется для установки данных города, level='2' используется для установки данных регионов, level по умолчанию равен '1', level='3' используется для установки данных субрегионов
verbose по умолчанию имеет значение TRUE. Должны ли возвращаться подробные сообщения об обработке и предупреждения;
step=TRUE используется для сохранения данных каждого шага обработки; get используется для получения данных
library(covidregionaldata)
start_using_memoise()
national <- WHO$new(verbose = TRUE, steps = TRUE, get = TRUE)
На следующем рисунке показан процесс загрузки данных, вы можете увидеть источник загрузки данных:
Downloading data from Из OVI 19.WHO.int/WHO-C Ovid-1…
И некоторые основные переменные данных, такие как тип данных, количество строк и столбцов данных
national$return()
(1) Используйте return для возврата результатов всех данных и используйте метод DT для отображения результатов таблицы, что действительно красиво
По результатам WHOreturn возвращается всего 5 таблиц, причем основные данные одинаковы, то есть каждая таблица будет иметь некоторые отличия в некоторых полях.
Отображение информации о городе или районе, включенной в данные, здесь напечатан список городов
national$available_regions()
Не все источники данных имеют региональные данные, у ВОЗ нет настройки level='2', Covid19DataHub$new(level = "2") Это нормально
(2) Существует функция настройки загрузки, просто сделайте это напрямую
national$download()
(3) Есть функция фильтра настройки, вам нужен только фильтр, вы также можете установить параметр region='Albania' в новой части в начале
national$filter("Albania")
national$process()
national$return()
(4) Когда я попытался его использовать, я обнаружил ошибку, то есть после частого и многократного вызова нового метода он будет перехвачен веб-сайтом источника данных, я не знаю, сработал ли он какой-то анти- механизмы подбора~
Эту точку ошибки можно проследить, чтобы убедиться, что это моя проблема с сетью и ip ~