1 Exploración interactiva de datos con plotly

Author: Mike Jeziorski
Date: 5/13/2021

El código de R de este archivo está disponbie vía GitHub.

1.1 Introducción a plotly

Link a la presentación Introducción a plotly.

1.2 Graficando datos de palmerpenguins con plotly

# install.packages(c("tidyverse", "plotly", "palmerpenguins"))

library(palmerpenguins) # juego de datos científicos
library(tidyverse) # incluye dplyr y ggplot2
penguins_hm <- penguins %>%
      filter(!is.na(sex)) %>%
      dplyr::count(species, island, sex) %>%
      ggplot(aes(x = sex, y = species, fill = n)) +
      geom_tile() +
      facet_grid(~ island) +
      theme_classic() +
      labs(title = "Distribution of penguins")
penguins_sp <- penguins %>%
      filter(!is.na(sex)) %>%
      ggplot(aes(x = bill_length_mm, y = body_mass_g, shape = sex, color = species, 
                 text = paste0("Sex: ", sex,
                               "\nIsland: ", island,
                               "\nYear: ", year))) +
      geom_point() +
      scale_shape_manual(values = c(1, 16)) +
      labs(x = "Bill length (mm)", y = "Body mass (g)")
plotly::ggplotly(penguins_sp, tooltip = "text")
penguins_sp_i <- penguins %>%
   filter(!is.na(sex)) %>%
   plotly::plot_ly(x = ~bill_length_mm, y = ~body_mass_g, color = ~species,
                type = "scatter", mode = "markers")
# install.packages("htmlwidgets")
htmlwidgets::saveWidget(penguins_sp_i, "penguins_scatterplot.html")

1.3 Graficando datos de COVID con plotly

Datos del la Secretaría de Salud, Gobierno de México Fuente de los datos: https://datos.gob.mx/busca/dataset/informacion-referente-a-casos-covid-19-en-mexico Datos crudos: https://www.gob.mx/salud/documentos/datos-abiertos-152127

El archivo “qro_raw_210513.csv” contiene los datos para el 13 de mayo de 2021, filtrado para los residentes del estado de Querétaro.

qro_raw <- readr::read_csv("qro_raw_210513.csv")
qro_covid_pos <- qro_raw %>%
      mutate(sexo = case_when(SEXO == 1 ~ "Mujer",
                              SEXO == 2 ~ "Hombre",
                              SEXO == 99 ~ NA_character_),
             tipo_paciente = case_when(TIPO_PACIENTE == 1 ~ "Ambulatorio",
                                       TIPO_PACIENTE == 2 ~ "Hospitalizado",
                                       TIPO_PACIENTE == 99 ~ NA_character_)) %>%
      filter(RESULTADO_LAB == 1) %>%
      ggplot(aes(x = FECHA_INGRESO, fill = as.factor(tipo_paciente))) +
      geom_bar() +
      labs(x = "Fecha de visita", y = "Total",
           title = "Pacientes positivos en el Edo. de Querétaro (muertos en morado)",
           caption = "Fuente: Dirección General de Epidemiología, Gobierno de México") +
      scale_fill_manual(name = "Tipo de paciente", 
                        labels = c("Ambulatorio", "Hospitalizado"),
                        values = c("blue", "red")) +
      geom_bar(aes(x = FECHA_DEF), fill = "purple") +
def_emb <- filter(qro_raw, RESULTADO_LAB == 1, EMBARAZO == 1, !is.na(FECHA_DEF)) %>%
qro_covid_emb <- qro_raw %>%
      mutate(sexo = case_when(SEXO == 1 ~ "Mujer",
                              SEXO == 2 ~ "Hombre",
                              SEXO == 99 ~ NA_character_),
             tipo_paciente = case_when(TIPO_PACIENTE == 1 ~ "Ambulatorio",
                                       TIPO_PACIENTE == 2 ~ "Hospitalizado",
                                       TIPO_PACIENTE == 99 ~ NA_character_)) %>%
      filter(RESULTADO_LAB == 1, EMBARAZO == 1) %>%
      ggplot(aes(x = FECHA_INGRESO, y = EDAD, color = as.factor(TIPO_PACIENTE))) +
      geom_point() +
      labs(x = "Fecha de ingreso", y = "Edad",
           title = "Mujeres embarazadas positivas para el virus en Edo. de Querétaro",
           subtitle = paste0("Número de defunciones: ", def_emb),
           caption = "Fuente: Dirección General de Epidemiología, Gobierno de México") +
      scale_color_manual(name = "Tipo de paciente", 
                        labels = c("Ambulatoria", "Hospitalizada"),
                        values = c("blue", "red")) +
      ylim(c(0, 50)) +
ggplotly(qro_covid_emb, tooltip = c("FECHA_INGRESO", "EDAD"))