Información del taller
Formato del curso: en línea
¿Quién es nuestra audiencia?
Formulario de registro
Instructores
Ponentes e instructores invitados
Ayudantes
Temario
Código de Conducta
Pre-requisitos
Horario
Música para ejercicios
Materiales
Durante el curso
Fuentes
Zoom
Organizadores
Patrocinadores
Información sesión de R
Licencia
Inauguración CDSB2021
1
Introducción a R y RStudio
1.1
R
1.2
GitHub
1.3
RStudio
1.4
Material del curso
1.5
Detalles de la sesión de R
Patrocinadores
2
Ejercicio usando
usethis
,
here
y
postcards
2.1
here
2.2
usethis
2.3
Vinculando RStudio con Git y GitHub
2.3.1
Prerrequisitos
2.3.2
Creando token de acceso personal (PAT)
2.3.3
Inicializar repositorio de Git y Github
2.3.4
Probar otros comandos de
gert
2.4
Ejercicio postcards
2.4.1
Crear el repositorio
2.4.2
Modificar y subir a github nuestro postcard
2.5
Detalles de la sesión de R
Patrocinadores
3
Introducción a RNA-seq de célula única (scRNA-seq) con Bioconductor y al libro de OSCA
3.1
Bioconductor
3.1.1
Equipos y consejos
3.1.2
Encontrando paquetes de Bioconductor
3.1.3
Estructura de un paquete de BioC
3.1.4
Las dos ramas de Bioconductor: release y devel
3.1.5
Cursos y eventos
3.1.6
Comunidad
3.2
Introducción a RNA-seq de célula única (scRNA-seq) con Bioconductor y al libro de OSCA
3.3
Detalles de la sesión de R
Patrocinadores
4
Estructura e importe de datos
4.1
Preprocesamiento de datos
4.1.1
Cell Ranger
4.1.2
scPipe
4.1.3
Etc
4.2
Estructura de
SingleCellExperiment
4.3
Ejercicio 1
4.3.1
Preguntas:
4.4
Breve repaso de R
4.5
Ejercicio 2
4.5.1
Respuestas
4.5.2
Extra
4.6
Import data
4.7
Detalles de la sesión de R
Patrocinadores
5
Control de calidad
5.1
Diapositivas de Peter Hickey
5.2
Ejercicio: entendiendo addPerCellQC
5.3
Gráficas sobre medidas de control de calidad (QC)
5.3.1
Ejercicio: gráficas QC ERCC
5.4
Eliminar células de baja calidad
5.5
Ejercicio: filtrado de células
5.6
Datos de Grun et al
5.7
Gráficas de QC extra
5.8
Ejercicio: ERCC Grun et al
5.9
Identificando droplets vacíos con datos de PBMC
5.10
Ejercicio: detección de droplets vacíos
5.11
Filtrado de expresión mitocondrial adicional
5.12
Ejercicio avanzado
5.13
Discusión ¿Conviene eliminar datos?
5.13.1
Un nuevo paquete: ExperimentSubset
5.14
Explorando datos de forma interactiva con iSEE
5.14.1
Ejercicio iSEE con sce.416b
5.14.2
Datos de LIBD de Tran et al
5.14.3
Más detalles de iSEE
5.15
Detalles de la sesión de R
Patrocinadores
6
Normalización de datos
6.1
Material
6.2
Motivación
6.2.1
Ejercicio: Conceptos básicos
6.3
Datos
6.3.1
Ejercicio: QC
6.4
Normalización por escalamiento (scaling normalization)
6.4.1
Tamaño de biblioteca (
Library Size
)
6.4.2
Ejercicio:
library Size
6.4.3
Puntos finales
6.5
Normalización por decircunvolución (deconvolution)
6.5.1
Ejercicios: deconvolution
6.5.2
Puntos finales
6.6
Transformación logarítmica
6.6.1
Motivación
6.6.2
Ejercicio: Transformación logarítmica
6.7
Otras normalizaciones
6.7.1
Seurat
6.8
Notas finales
6.8.1
Ejercicio: Conceptos básicos
6.8.2
Ejercicio: QC
6.8.3
Ejercicio:
library Size
6.8.4
Ejercicios: deconvolution
6.8.5
Ejercicio: Transformación logarítmica
6.9
Adicionales
6.10
Agradecimientos
6.11
Detalles de la sesión de R
Patrocinadores
7
Selección de genes
7.1
Diapositivas de Peter Hickey
7.2
Motivación
7.3
Selección de
features
(genes)
7.4
Dataset ilustrativo: PBMC4k 10X sin filtrar
7.4.1
Descargar datos
7.4.2
Anotación
7.4.3
Control de calidad
7.4.4
Preguntas de repaso
7.5
Dataset ilustrativo: 416B
7.5.1
Preguntas de repaso
7.6
Cuantificando la varianza por gen
7.6.1
Varianza de los
log-counts
7.6.2
Enfoque simple
7.6.3
Un enfoque más sofisticado
7.6.4
Supuestos
7.6.5
Visualizando la media y varianza
7.6.6
Ordenando genes interesantes
7.7
Coeficiente de variación de las cuentas
7.7.1
Coeficiente de variación
7.7.2
Visualizando el coeficiente de variación
7.7.3
Genes por coeficiente de variación
7.8
Varianza de los
log-counts
vs coeficiente de variación
7.9
Cuantificando el ruido técnico
7.9.1
En la presencia de spike-ins
7.10
En la ausencia de spike-ins
7.11
Recordemos propiedades de los datos de sce.416b
7.12
Considerando factores experimentales
7.13
Seleccionando genes altamante variables (high-variable genes, HVGs)
7.13.1
Seleccionando HVGs sobre la métrica de varianza
7.13.2
Seleccionando HVGs de acuerdo a su significancia estadística
7.13.3
Seleccionando genes por arriba de la tendencia media-varianza
7.13.4
EJERCICIO: Dibujando los HVGs
7.13.5
Seleccionando genes de interés
a priori
7.14
Poniendo todo junto
7.14.1
Quedándonos sólo con los HGVs
7.14.2
Especificando los HGVs
7.14.3
Witchcraft (Brujería)
7.15
Resumen y recomendaciones
7.16
Recomendaciones para empezar
7.17
Detalles de la sesión de R
Patrocinadores
8
Reducción de dimensiones
8.1
Diapositivas de Peter Hickey
8.2
Motivación
8.3
Reducción de dimensionalidad
8.4
Dataset ilustrativo: Zeisel
8.5
Dataset ilustrativo: 10x PBMC4k no filtradas
8.6
Análisis de Componentes Principales
8.6.1
PCA aplicado a datos de scRNA-seq
8.6.2
Suposiciones de PCA aplicadas a los datos de scRNA-seq
8.6.3
Eligiendo el número de PCs
8.6.4
Juntando todo
8.6.5
EJERCICIO
8.6.6
Usando el ruido técnico
8.7
Reducción de dimensionalidad para visualización
8.7.1
Motivación
8.7.2
Visualizando con PCA
8.7.3
Retos y resumen de la visualización con PCA
8.7.4
Visualización con t-SNE
8.7.5
Visualización con UMAP
8.7.6
Interpretando las gráficas
8.7.7
Resumen y recomendaciones
8.8
Donde estamos
8.9
Detalles de la sesión de R
Patrocinadores
9
Clustering
9.1
Dataset ilustrativo: 10X PBMC4k no filtrado
9.2
Motivación
9.3
¿Por qué no realizamos el clustering sobre las coordenadas de t-SNE/UMAP?
9.4
¿Cuál es el verdadero clustering?
9.5
Clustering basado en grafos
9.5.1
Antecedentes
9.5.2
Gráfica de los
k
vecinos más cercanos (k-nearest neighbour -KNN- graph)
9.5.3
Gráfica de los vecinos más próximos compartidos (SNN)
9.5.4
Gráfica SNN con pesos en las aristas
9.5.5
Obteniendo comunidades a partir de una gráfica SNN pesada mediante un algoritmo de clustering
9.5.6
Resumen de clustering basado en grafos
9.5.7
Detalles a considerar en la implementación
9.5.8
Implementación
9.5.9
Eligiendo un valor de
k
9.5.10
Una implementación diferente: estilo Seurat
9.5.11
Detalles de las implementaciones más comunes
9.5.12
Otras implementaciones
9.6
Evaluando la separación de los clusters
9.7
Otros métodos de clustering
9.8
Evaluando la estabilidad de los clusters
9.9
Subclustering
9.10
Resumen y recomendaciones
9.11
Donde estamos
9.12
Detalles de la sesión de R
Patrocinadores
10
Identificación de genes marcadores
10.1
Diapositivas de Peter Hickey
10.2
Motivación
10.3
Dataset ilustrativo: PBMC4k 10X sin filtrar
10.3.1
Descargar datos
10.3.2
Anotación
10.3.3
Control de calidad
10.3.4
Genes variables
10.3.5
Reducción de dimensiones
10.3.6
Clustering
10.4
Motivación - continuación
10.5
Prueba t modificada de Welch pareada
10.6
Ejemplo ilustrativo: CD3E como gen marcador en el dataset PBMC4k 10X
10.6.1
Pruebas pareadas
10.6.2
Combinando comparaciones del gen CD3E para el clúster 1
10.7
Aplicación estándar
10.7.1
Explorando los resultados
10.7.2
Con un heatmap
10.8
Usando el
log-fold change
10.8.1
Sin espeficiar el lfc
10.8.2
Especificando el lfc
10.8.3
Heatmap
10.9
Encontrando marcadores específicos de clústeres
10.9.1
Pros/cons de los genes marcadores específicos de los clústeres
10.9.2
findMarkers con pval.type some
10.10
Pruebas alternas
10.10.1
Motivación
10.11
Prueba de rangos de Wilcoxon
10.11.1
findMarkers para Wilcoxon
10.11.2
Heatmap de genes marcadores con Wilcoxon
10.11.3
Resumen de la prueba de rangos de Wilcoxon
10.12
Prueba binomial
10.12.1
findMarkers para binomial
10.12.2
Visualizando genes marcadores de la prueba bionomial
10.12.3
Resumen de la prueba binomial
10.13
Métodos de expresión diferencial personalizados
10.14
Problemas estadísticos
10.14.1
Invalidez de P-values
10.14.2
Naturaleza de la replicación
10.14.3
Comentarios adicionales
10.15
Resumen y recomendaciones
10.16
Detalles de la sesión de R
Patrocinadores
11
Anotación de clusters de células
11.1
Diapositivas de Peter Hickey
11.2
Motivación
11.3
Dataset ilustrativo: PBMC4k 10X sin filtrar
11.3.1
Anotación
11.3.2
Control de calidad
11.3.3
Genes variables
11.3.4
Reducción de dimensiones
11.3.5
Clustering
11.4
Asignando las etiquetas celulares a partir de los datos de referencia
11.4.1
Visión general
11.5
SingleR
11.5.1
SingleR incluye varias referencias
11.5.2
Usando las referencias
11.5.3
Usando las referencias integradas
11.5.4
Podado de etiquetas (Label pruning)
11.5.5
Identificando los genes con anotación dirigida
11.5.6
Comparando las etiquetas con los clústeres
11.5.7
Voilà
11.6
Resumen de la anotación basada en una referencia (e.g., SingleR)
11.7
Asignando las etiquetas de tipos celulares a partir de marcadores
11.7.1
Gene set enrichment analysis
11.7.2
Calculando las actividades de los conjuntos de genes
11.8
Resumen y recomendaciones
11.9
Detalles de la sesión de R
Patrocinadores
12
Análisis de expresión diferencial
12.1
Diapositivas de Peter Hickey
12.2
Motivación
12.2.1
Dos categorías de análisis
12.3
Datos de ejemplo
12.3.1
Descarguemos los datos de ejemplo
12.3.2
Procesamiento
12.3.3
Exploremos los datos de ejemplo
12.3.4
Nuestros clusters vs los originales
12.4
Análisis de expresión diferencial
12.4.1
Pseudo-bulking
12.4.2
Convertir a un objeto nuevo
12.4.3
Pre-procesamiento
12.4.4
Modelo estadístico
12.4.5
De forma sencilla
12.4.6
Ejercicios
12.4.7
Respuestas
12.5
Análisis de abundancia diferencial
12.6
Comentarios sobre la interpretación
12.7
Detalles de la sesión de R
Patrocinadores
13
Introducción a Seurat
13.1
Diapositivas
13.2
Una perspectiva diferente
13.3
Kick-start
13.4
Quality Control
13.5
Normalización
13.6
Detección de genes (caractersticas) altamente variables
13.7
Escalar los datos
13.8
Reducción dimensional lineal
13.9
Determinar la dimensionalidad del conjunto de datos
13.10
Clustering
13.11
Reducción dimensional no lineal (UMAP/tSNE)
13.12
Caracteristicas diferencialmente expresadas (biomarcadores de los clusters)
13.13
Assigning cell type identity to clusters
13.14
Guardar Resultados
13.15
Detalles de la sesión de R
Patrocinadores
Plática de Ricardo Ramirez
Análisis de datos transcriptómicos de célula única (scRNA-seq) con R y Bioconductor
Inauguración CDSB2021