• 687374918
  • info@devacademy.es

Programa práctico en DataScience con R

Detalle del plan de formación

El mundo Data Science ha tenido un crecimiento exponencial en los últimos años debido a la gran cantidad de información que nos rodea, la capacidad para almacenarla y el potencial que ha mostrado el análisis de datos tanto en el ámbito público y de la investigación, como en la empresa privada. El Data Scientist, o científico de datos, es el encargado de dar forma y valor a esos datos. Por lo tanto se trata de un perfil mixto, con varias cualidades y mucha capacidad de ver más allá de lo que la simple lógica nos diría.

Este curso permitirá al alumno iniciarse en el mundo del Data Science y del Machine Learning. Tendrá una base teórica siempre acompañado de una parte práctica con problemas reales, por lo que el enfoque práctico tendrá un peso muy importante. Se realizarán prácticas en las que se aplicarán los conceptos aprendidos para solucionar casos de uso a los que se enfrenta cualquier Data Scientist en su vida laboral.

Se tratará el ciclo de explotación del dato completo que realiza un Data Sciencist, desde el planteamiento inicial del problema, la búsqueda y el tratamiento de datos, distintos de algoritmos de aprendizaje supervisado y no supervisado, el análisis final de resultados y comparación de algoritmos con diferentes medidas de error. Finalmente se propondrán diferentes problemas tanto de regresión como de clasificación para aplicar los conceptos aprendidos. Esto permite al alumno obtener una visión completa del trabajo de un Data Scientist.

Temario

Introducción y Conceptos básicos

  • ¿Qué es Data Science?
  • ¿Qué valor aporta el Data Scientist? Casos de uso.
  • Repaso de las diferentes herramientas para el análisis de datos.
  • Pasos para el planteamiento y solución de un problema analítico por parte de un Data Scientist.

Estadística básica.

  • Probabilidad.
  • Inferencia.
  • Test A/B.
  • Análisis de funciones para inferencia y probabilidad como t.test o funciones propias de test A/B

Introducción a R

  • ¿Qué es R y cuáles son sus ventajas?
  • Rstudio.
  • Principales librerías de R.
  • Ejercicios prácticos: Introducción a R y RStudio.

 Análisis Exploratorio de Datos

  • Problemas en los datos: datos desbalanceados, datos con ruido, creación de datos sintéticos.
  • Missing Values.
  • One hot encoding.
  • Normalización/Tipificación de datos.
  • Selección de variables.
  • Usos de librerías para análisis de datos, dplyr y data.table
  • Ejercicios prácticos
    • Análisis exploratorio de data set clasificación.
    • Análisis exploratorio de data set regresión.

Visualización de datos

  • Repaso de los principales gráficos de visualización de datos.
  • Librería ggplot2 en R.
  • Ejercicios prácticos: Usos de la librería ggplot2 para la visualización de datos.

Introducción al Machine Learning y R

  • ¿Qué es Machine Learning?
  • Aprendizaje Supervisado vs Aprendizaje no Supervisado.
  • Definición básica de técnicas de Aprendizaje Supervisado. Clasificación vs Regresión.
  • Definición básica de técnicas Aprendizaje no Supervisado.

Conceptos básicos de Machine Learning

  • Train/Validación/Test.
  • Overfitting y Underfitting. Tradeoff Bias/Variance.
  • Metaparametrización: Búsqueda en rejilla.
  • Función de Coste: Definición y ejemplos y optimización.

Aprendizaje Supervisado

  • RegresiónLineal.
  • Árboles de Decisión y representación.
  • Random Forests.
  • Redes Neuronales
  • Máquinas de Vectores Soporte o Support Vector Machines (SVM)
  • Funciones en la librerías rpart y randomForest, e1071, neuralnet
  • Ejercicios prácticos:
    • Aplicación de un modelo de aprendizaje supervisado a un caso práctico de clasificación
    •  Aplicación de un modelo de aprendizaje supervisado a un caso práctico de regresión.

Aprendizaje No Supervisado I: Clustering, PCA y sistemas de recomendación

  • Clustering: K-means y k-prototypes.
  • Reducción de Dimensionalidad: PCA
  • ¿Qué es un sistema de recomendación y para qué sirve? Caso práctico de Netflix.
  • Diferentes enfoques de un sistema de Recomendación: user-user, ítem-item.
  • Librerias para recomendación, recommenderlab y funciones propias para sistemas de recomendación.
  • Ejercicios prácticos:
    • Resolución de problema de aprendizaje no supervisado mediante k-means y reducción de dimensionalidad mediante PCA.
    • Construcción de un sistema de recomendación para sugerencias personalizadas.

BENCHMARKING

  • Comparación de los distintos métodos utilizados mediante distintas medidas de error.
  • Ejercicios prácticos: Comparación de los métodos utilizados.

Fechas, horario y lugar

Los cursos de DevAcademy son en horario NO LABORAL los VIERNES (16hrs – 21hrs) y SÁBADOS (9hrs-14hrs), pensado para que puedan asistir aquellos que estén trabajando.

Fechas: 18-19/10 y 25-26/10 de 2019

El curso tendrá lugar en las aulas situadas en las instalaciones DevAcademy

Responsabilidades profesor

Presentará el contenido conforme lo presentado en el programa de formación
Además, dará acceso al material necesario (PDFs, ejercicios, software, etcs) para el curso contratado.

Responsabilidades alumno

Conocimientos básicos de programación y administración de sistemas son recomendables.
Participará en la formación en el periodo determinado, trayendo un notebook con los requisitos mínimos necesarios para la participación en la formación, siendo estos los siguientes:

  1. Sistema Operativo Unix o Mac OS
  2. Recomendable unos 4GB de memoria RAM y 10GB de espacio en disco.
  3. Habilitada la virtualización tanto en software como hardware
  4. Poseer privilegios de administración

Observaciones importantes

Confirmaciones
Las confirmaciones serán enviadas a la dirección de e-mail enviada por el alumno.

Cancelaciones
Los plazos para la cancelación de inscripciones solicitadas, son de 5 días laborales antes del inicio del curso.
Además, en caso de cancelación fuera de plazo por parte del alumno, DevAcademy se reserva el derecho a cobrar un porcentaje (20%) del valor del curso.
Por último, DevAcademy se reserva el derecho de cancelar o posponer la formación, siempre y cuando avise al contratante y/o devuelva el importe íntegro en caso de cancelación.

Obligaciones del alumno
Es obligatorio que el alumno cumpla con todos las obligaciones recomendadas por el profesor para seguir todos los ejercicios y no demorar ni perjudicar la clase. Por último, es posible que días antes se envíe un email como recordatorio al alumno con instrucciones a seguir u obligaciones desarrollar para poder estar preparado al comienzo de la clase.

Si quieres informarte sobre otros cursos que ofrecemos, haz click aquí



DevAcademy 2024 - info@devacademy.es - Telf: 687374918