• 687374918
  • info@devacademy.es

Programa práctico en Machine Learning con R

Detalle del plan de formación

La escasez de perfiles “Data Scientist” (Científicos de Datos) es creciente. La adopción del BigData por las organizaciones está provocando una mayor escasez de este perfil en las organizaciones. Un perfil complejo por ser la intersección de diferentes disciplinas: programación, matemáticas, estadística, visualización, tratamiento de datos.

Con esta formación, a través de la enorme potencia que ofrece R como lenguaje específicamente orientado a este tipo de problemas, conseguirás entender el tipo de técnicas más empleadas para abordar un problema de modelización de datos, los paquetes más recomendables para cada caso y cómo automatizar parte de tu proceso de análisis

Temario

La formación cubrirá con detalle las etapas más apropiadas en el flujo de trabajo de un análisis de datos:

  • Cómo organizar tu proyecto de modelización. Un elemento básico a la hora de afrontar un proyecto de modelización con éxito es cómo organizar tanto el entorno como el código. Este elemento es clave a la hora de trabajar en equipo.
    • Recomendaciones de cómo configurar adecuadamente el entorno de RStudio.
    • Recomendaciones de cómo estructurar el código para cubrir las diferentes etapas de modelización.
  • Carga de datos al entorno desde diferentes fuentes
    • Uso de diferentes paquetes para la carga de datos, ventajas e inconvenientes de cada uno de ellos: base, readr, data.table.
    • Limpieza de datos, transformación:
      • Uso de las librerías para el tratamiento de strings (stringr) y de fechas (lubridate).
    • Visualización y perfilado de datos:
      • Cómo realizar una visualización rápida de tus datos.
    • “Feature Engineering”. En este punto se engloban todos los procesos destinados a la discriminación de variables importantes, eliminación, creación de nuevas variables, tratamiento de datos NA, etc.
      • Se utilizará las características específicas del paquete “caret”.
      • Ventajas y desventajas de estas técnicas.
    • Modelización:
      • Cómo realizar la modelización supervisada y no supervisada.
      • Algoritmos básicos a emplear.
      • Determinación de la bondad del modelo predictivo. Capacidad de generalización. Técnicas de “cross_validation”.
      • Se utilizará “caret” como paquete wrapper de múltiples modelos y se revisarán los algoritmos más empleados para los problemas de regresión y de clasificación.
      • Además de “caret” se utilizará el paquete “H2O” que igualmente actúa como wrapper de diferentes modelos, para usar su potencia en modelos basados en “deep learning”.
    • Hyperparameter tuning – optimization. Este punto contempla todo el proceso de ajuste de los parámetros propios de cada algoritmo.
      • Se revisarán las técnicas de grid_search, random_search y aoptimización bayesiana.

Se utilizará tanto “caret” y “H2O” como paquetes de referencia básicos, como la creación de código adaptado al caso de estudio.

El plan de formación está orientado para aquellas personas que dispongan ya de un conocimiento básico de “R” y de conocimientos elementales de estadística.

La versatilidad de “R” permite trabajar con aproximaciones diferentes sobre un mismo tipo de problema. Durante la formación, se cubrirán tanto las aproximaciones básicas como las avanzadas (y más rápidas) que ofrecen las nuevas librerías (data.table, tidyR, dplyr, vtreat)

Fechas, horario y lugar

Las formaciones de DevAcademy son en horario NO LABORAL los VIERNES (16hrs – 21hrs) y SÁBADOS (9hrs-14hrs), pensado para que puedan asistir aquellos que estén trabajando.

La formación tendrá lugar en las aulas situadas en las instalaciones DevAcademy

Responsabilidades profesor

Presentar el contenido conforme lo presentado en el programa de formación
Dar acceso al material necesario (PDFs, ejercicios, software, etcs) para la formación contratada.
Proveer de local para impartir la formación
Código fuente de los ejemplos vistos durante la formación.

Responsabilidades alumno

Participar en la formación en el periodo determinado, trayendo un notebook con los requisitos mínimos necesarios para la participación en la formación, siendo estos los siguientes:
Mínimo de 4GB de memoria RAM. Recomendable 8GB
Mínimo de 10GB de espacio en disco (HD).
R y RStudio de cualquier SO

Observaciones importantes

Confirmaciones
Las confirmaciones serán enviadas a la dirección de e-mail enviada por el alumno

Cancelaciones
Los plazos para el cancelamiento de inscripciones solicitadas, son de 5 días laborales antes del inicio de la formación.
En caso de cancelamiento fuera de plazo por parte del alumno, DevAcademy se reserva el derecho a cobrar un porcentaje (20%) del valor de la formación.
DevAcademy se reserva el derecho de cancelar o posponer la formación, siempre y cuando avise al contratante y/o devuelva el importe íntegro en caso de cancelación

Obligaciones del alumno
Es obligatorio que el alumno cumpla con todos las obligaciones recomendadas por el profesor para seguir todos los ejercicios y no demorar ni perjudicar la clase. Es posible que días antes se envie un email como recordatorio al alumno con instrucciones a seguir u obligaciones desarrollar para poder estar preparado al comienzo de la clase.



DevAcademy 2019 - info@devacademy.es - Telf: 687374918