• 687374918
  • info@devacademy.es

Machine Learning con Spark

Detalle del plan de formación

El aprendizaje automático es la ciencia de conseguir que las computadoras actúen sin haber sido explícitamente programadas. En la última década, el aprendizaje automático nos ha proporcionado vehículos que funcionan sin conductor, reconocimiento práctico de voz, búsqueda efectiva en la web, y un conocimiento infinitamente mejorado del genoma humano.

Este programa proporciona una amplia introducción al aprendizaje automático, la minería de datos y el reconocimiento de patrones estadísticos. Los temas abarcan:

(i)Aprendizaje supervisado (algoritmos paramétricos/no paramétricos, máquina de vectores de soporte, kernels, redes neuronales).

(ii) Aprendizaje no supervisado (algoritmo de agrupamiento, reducción dimensional, sistemas de recomendación, aprendizaje profundo).

(iii) Las mejores prácticas en aprendizaje automático (teoría del sesgo/la varianza, proceso de innovación en aprendizaje automático e inteligencia artificial).

Spark provee de una librería de Machine Learning que incopora algoritmos en su versión paralelizable y distribuida de diversas técnicas de ML como son son la clusterizacion, la clasificacion, motores de recomendación, minería de texto… En el curso veremos estas técnicas profundizando en las más comunes e interesantes desde el punto de vista del mercado.

Introducción a Apache Spark

  • Introducción a Apache Spark
  • Módulos de Apache Spark
  • SparkContext y esqueleto de una aplicación con PySpark
  • SparkSubmit para la ejecución de scripts python
  • RDD’s
    • Crear un RDD en python con PySpark
    • Operaciones (Tranformaciones, acciones, evaluación lazy)
    • Persistencia
  • Resumen operaciones pyspark
  • Ejercicios prácticos con PySpark

Desarrollo de Machine Learning con Spark MLib

  • Introducción al  Machine Learning
  • Spark MLlib como módulo de machine learning con pyspark
  • Algoritmos disponibles en Spark Mlib
    • Tipos de datos (vectores)
    • Extraccion de caracteristicas
    • Estadísticos
    • Clasificación
    • Clustering
    • Filtros colaborativos y recomendadores
    • Frequent Pattern Growth
    • Reducción de dimensiones
    • Evaluación de modelo
  • Casos prácticos y ejercicios guiados

Ejercicios prácticos

El alumno desarrollará durante todo el curso ejercicios prácticos de procesamiento distribuido con Apache Spark, ya sea procesamiento de histórico de logs, datos de redes sociales o diferentes ejemplos usando componentes que Apache Spark dispone para su procesamiento.

Responsabilidades profesor

Presentar el contenido conforme lo presentado en el programa de formación
Dar acceso al material necesario (PDFs, ejercicios, software, etcs) para el curso contratado.
Proveer de local para impartir la formación

Responsabilidades alumno

Participar en la formación en el periodo determinado, trayendo un notebook con los requisitos mínimos necesarios para la participación en la formación, siendo estos los siguientes:
Mínimo de 4GB de memoria RAM
Mínimo de 10GB de espacio en disco (HD).
Habilitada la virtualización tanto en software como hardware
Poseer privilegios de administración

Observaciones importantes

Confirmaciones
Las confirmaciones serán enviadas a la dirección de e-mail enviada por el alumno

Cancelaciones
Los plazos para el cancelamiento de inscripciones solicitadas, son de 5 días laborales antes del inicio del curso.
En caso de cancelamiento fuera de plazo por parte del alumno, DevAcademy se reserva el derecho a cobrar un porcentaje (20%) del valor del curso.
DevAcademy se reserva el derecho de cancelar o posponer la formación, siempre y cuando avise al contratante y/o devuelva el importe íntegro en caso de cancelación

Obligaciones del alumno
Es obligatorio que el alumno cumpla con todos las obligaciones recomendadas por el profesor para seguir todos los ejercicios y no demorar ni perjudicar la clase. Es posible que días antes se envie un email como recordatorio al alumno con instrucciones a seguir u obligaciones desarrollar para poder estar preparado al comienzo de la clase.

 



DevAcademy 2024 - info@devacademy.es - Telf: 687374918