3 Introducción a RNA-seq de célula única (scRNA-seq) con Bioconductor y al libro de OSCA

Instructoras: Elisa Márquez Zavala, Citlali Gil Aguillon

Contenido adaptado del Curso de RNASeq de Leonardo Collado Torres y de

Original Notes in English

3.1 Bioconductor

“Bioconductor proporciona herramientas para el análisis y la comprensión de datos genómicos de alto rendimiento. Bioconductor utiliza el lenguaje de programación estadístico R y es de código abierto y desarrollo abierto. Tiene dos lanzamientos cada año y una comunidad de usuarios activa. Bioconductor también está disponible como AMI (Imagen de máquina de Amazon) e imágenes de Docker.”

Básicamente es un repositorio con reglas o estándares para el análisis y la comprensión de datos genómicos de alto rendimiento.

Para conocer sobre Bioconductor podemos ir a: https://www.bioconductor.org/ y dar click en About

3.1.1 Equipos y consejos

Es conformado por diversos equipos y consejos (Asesores científicos, técnicos y de la comunidad). Por ejemplo Leonardo Collado.

  • Científicos : Proporciona orientación externa y supervisión de la dirección científica del proyecto y está compuesto por líderes en el análisis estadístico de datos genómicos.
  • Técnicos: Desarrollar estrategias para asegurar que la parte técnica de la infraestructura sea apropiada a largo plazo (manejo de paquetes, sitio web, slack, etc)
  • Comunidad : Empoderar a las comunidades de usuarios y desarrolladores mediante la coordinación de actividades de capacitación y divulgación.

Dentro del equipo core que mantiene a Bioconductor y apoya con las dudas (https://www.bioconductor.org/about/core-team/) hay gente a la que Bioconductor le paga por mantener los repositorios, lo cual lo hace diferente de CRAN. El tener gente que oficialmente sabe cómo ayudarte y tiene el tiempo para hacerlo crea una mejor experiencia para los usuarios y los desarrolladores.

3.1.2 Encontrando paquetes de Bioconductor

Las listas de cada tipo de paquete se ven algo así:

Package Maintainer Title
Nombre del paquete Quién lo mantiene Título completo
recount3 Leonardo Collado-Torres Explore and download data from the recount3 project

Sin embargo, estas listas no son muy amigables si queremos explorar por lo que podemos usar biocViews

  • Encontrando paquetes a través de biocViews: http://bioconductor.org/packages/release/BiocViews.html#___Software
    • Estructura tipo árbol
    • Son 4 árboles principales: software, annotation, experiment, workflow
    • Dentro de cada árbol, un paquete puede ser parte de varias ramas, por ejemplo, recount3 está dentro de todas estas ramas:
      • Software
        • AssayDomain
          • GeneExpression
        • BiologicalQuestion
          • DifferentialExpression
          • Coverage
        • Infrastructure
          • DataImport
        • Technology
          • Sequencing
            • RNASeq
    • Tiene una búsqueda de texto simple
    • Ejemplo: Software → WorkflowStep → Visualization → http://bioconductor.org/packages/release/BiocViews.html#___Visualization (486 paquetes en BioC 3.11 abril-octubre 2020, 506 en BioC 3.12 octubre 2020-abril 2021, 529 en BioC 3.13 agosto 2021)

3.1.3 Estructura de un paquete de BioC

: ¿En qué plataformas funciona?

: ¿Qué tan descargado es?

: ¿Se han hecho preguntas del paquete en los últimos 6 meses? (respondidas/hechas)

: ¿Cuánto tiempo lleva en Bioconductor?

: ¿Funciona en las máquinas de bioconductor?

: ¿Cuándo fue la última vez que lo actualizaron?

: Número de dependencias recursivas necesarias para instalar el paquete

  • Parráfo de descripción del paquete
  • Cómo citar al paquete de Bioconductor
  • Cómo instalarlo. Más detalles en http://bioconductor.org/install/
  • Documentación
    • Una líga por cada vignette en formato PDF o HTML. Es la documentación principal!
    • Una vignette es donde lxs autores del paquete explican cómo usar las diferentes funciones del paquete y en qué orden
  • Detalles
    • Términos de biocViews
    • Cómo se relaciona a otros paquetes (depends, imports, linking to, suggests, depends on me, …)
    • URL: donde puedes encontrar el código fuente (nos puede dar más infor)
    • BugReports: donde puedes pedir ayuda
  • Más detalles sobre el paquete
    • Estadísticas de descargas

3.1.4 Las dos ramas de Bioconductor: release y devel

3.1.5 Cursos y eventos

3.1.6 Comunidad

3.2 Introducción a RNA-seq de célula única (scRNA-seq) con Bioconductor y al libro de OSCA

link a diapositivas

3.3 Detalles de la sesión de R

## Información de la sesión de R
Sys.time()
## [1] "2021-08-19 15:15:48 UTC"
proc.time()
##    user  system elapsed 
##   0.395   0.118   0.399
options(width = 120)
sessioninfo::session_info()
## ─ Session info ───────────────────────────────────────────────────────────────────────────────────────────────────────
##  setting  value                       
##  version  R version 4.1.0 (2021-05-18)
##  os       Ubuntu 20.04.2 LTS          
##  system   x86_64, linux-gnu           
##  ui       X11                         
##  language (EN)                        
##  collate  en_US.UTF-8                 
##  ctype    en_US.UTF-8                 
##  tz       UTC                         
##  date     2021-08-19                  
## 
## ─ Packages ───────────────────────────────────────────────────────────────────────────────────────────────────────────
##  package     * version date       lib source        
##  bookdown      0.23    2021-08-13 [1] RSPM (R 4.1.0)
##  bslib         0.2.5.1 2021-05-18 [1] RSPM (R 4.1.0)
##  cli           3.0.1   2021-07-17 [2] RSPM (R 4.1.0)
##  digest        0.6.27  2020-10-24 [2] RSPM (R 4.1.0)
##  evaluate      0.14    2019-05-28 [2] RSPM (R 4.1.0)
##  htmltools     0.5.1.1 2021-01-22 [1] RSPM (R 4.1.0)
##  jquerylib     0.1.4   2021-04-26 [1] RSPM (R 4.1.0)
##  jsonlite      1.7.2   2020-12-09 [2] RSPM (R 4.1.0)
##  knitr         1.33    2021-04-24 [2] RSPM (R 4.1.0)
##  magrittr      2.0.1   2020-11-17 [2] RSPM (R 4.1.0)
##  R6            2.5.0   2020-10-28 [2] RSPM (R 4.1.0)
##  rlang         0.4.11  2021-04-30 [2] RSPM (R 4.1.0)
##  rmarkdown     2.10    2021-08-06 [1] RSPM (R 4.1.0)
##  sass          0.4.0   2021-05-12 [1] RSPM (R 4.1.0)
##  sessioninfo   1.1.1   2018-11-05 [2] RSPM (R 4.1.0)
##  stringi       1.7.3   2021-07-16 [2] RSPM (R 4.1.0)
##  stringr       1.4.0   2019-02-10 [2] RSPM (R 4.1.0)
##  withr         2.4.2   2021-04-18 [2] RSPM (R 4.1.0)
##  xfun          0.25    2021-08-06 [2] RSPM (R 4.1.0)
## 
## [1] /__w/_temp/Library
## [2] /usr/local/lib/R/site-library
## [3] /usr/local/lib/R/library

Patrocinadores

Agradecemos a nuestros patrocinadores: