Data Science con R en el contexto biomédico

Precio
Duración
Créditos
Descripción
Los avances tecnológicos han permitido que la recogida de datos en el contexto biomédico se realice de forma cada vez más masiva y automatizada. Esto genera una gran cantidad de datos y la necesidad de analizarlos con métodos y herramientas adecuadas y eficientes.
Este curso proporciona los conocimientos estadísticos y de programación necesarios para el análisis de datos biomédicos mediante el lenguaje de programación R.
El contenido del curso incluye métodos de visualización y exploración de datos, conceptos de inferencia estadística (intervalos de confianza y pruebas de hipótesis), el modelo de regresión lineal, el modelo de regresión logística y los modelos para datos de supervivencia.
Se trata de un curso totalmente práctico en el que se utilizan diversos conjuntos de datos biomédicos para introducir e ilustrar la metodología y los procesos de análisis.
Contenido del curso
-
Módulo 1: Introducción al análisis de datos con R en el entorno RStudio expand/collapse
- En este módulo se introduce el lenguaje de programación R y el entorno de trabajo RStudio. Veremos cómo importar datos a R, las principales estructuras de datos, los distintos tipos de variables y la utilización de funciones y librerías de R.
-
Módulo 2: ¿Cómo puedo visualizar mis datos con R? Visualización y exploración de datos expand/collapse
- En todo proceso de análisis, la visualización y exploración de datos es esencial para entender el problema, identificar posibles errores en los datos y explorar posibles relaciones entre las variables. En este módulo describiremos qué gráficos y resúmenes de datos son los más adecuados en cada situación y cómo obtenerlos con R.
-
Módulo 3: ¿Puedo extrapolar mis resultados? Inferencia estadística expand/collapse
- Revisaremos el concepto de inferencia estadística, incluyendo nivel de significación, intervalo de confianza, prueba de hipótesis y potencia de una prueba de hipótesis. Estudiaremos las principales pruebas de hipótesis y su implementación en R: prueba de normalidad, pruebas de igualdad de medias, pruebas de igualdad de varianzas, pruebas de proporciones y prueba de independencia de dos factores.
-
Módulo 4: Mi principal variable es numérica continua, ¿qué modelo utilizo? Modelo de regresión lineal expand/collapse
- Estudiaremos el modelo de regresión lineal para analizar una variable respuesta numérica coninua en función de otras variables explicativas. Veremos las condiciones para la validez del modelo y cómo implementarlo en R.
-
Módulo 5: Mi principal variable es binaria, ¿qué modelo utilizo? Modelo de regresión logística expand/collapse
- Estudiaremos el modelo de regresión logística para analizar una variable respuesta binaria en función de otras variables explicativas. Veremos las condiciones para la validez del modelo y cómo implementarlo en R.
-
Módulo 6: Mi principal variable es el tiempo de supervivencia, ¿qué modelo utilizo? Análisis de datos de supervivencia expand/collapse
- Introduciremos los principales conceptos del análisis de supervivencia: censura de datos, función de supervivencia y función de riesgo. Veremos cómo obtener con R el estimador de Kaplan-Meier de la función de supervivencia y las pruebas de hipótesis de igualdad de las funciones de supervivencia. Estudiaremos el modelo de regresión de Cox para analizar una variable respuesta temporal (tiempo hasta que se produce un evento de interés) en función de otras variables explicativas. Veremos las condiciones para la validez del modelo y cómo implementarlo en R.
Profesores

M. Luz Calle Rosingana
Doctora en Matemáticas, catedrática de Bioestadística y Bioinformática. Coordinadora del Grupo de Investigación de Bioinformática y Estadística Médica y Directora del Departamento de Biociencias de la Facultad de Ciencia y Tecnologías, UVic - UCC.
A quién se dirige
- Aunque todos los ejemplos que se utilizan en el curso son del ámbito biomédico, las técnicas estadísticas son genéricas y se pueden utilizar en otros ámbitos. Es por esto que el curso no está restringido a ningún área determinada.
- Todas las personas que requieran analizar datos para poder tomar decisiones, formular hipótesis o comprender mejor un determinado fenómeno.
- Investigadores, profesores y estudiantes que quieran mejorar sus competencias y su proyección profesional utilizando los conocimientos en análisis de datos como elemento diferenciador.
Competencias
- Conocer los principios básicos de la metodología estadística aplicada al análisis de datos biomédicos.
- Identificar los métodos y modelos más adecuados en cada contexto de análisis.
- Analizar datos utilizando el lenguaje de programación R.
- Aplicar los conocimientos adquiridos en la elaboración y defensa de argumentos y la resolución de problemas.
- Utilizar el pensamiento estadístico para reforzar la reflexión crítica a nivel personal y profesional.
Objetivos
- Conocer los métodos estadísticos más importantes para el análisis de datos biomédicos.
- Saber utilizar el lenguaje de programación R para realizar estos análisis.
- Mejorar la comprensión y la valoración crítica de los resultados obtenidos en un estudio estadístico.