• 687374918
  • info@devacademy.es

Introducción a Spark

Detalle del plan de formación

Spark es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato

Spark está ganando terreno a otros sistemas Big Data como Hadoop al realizar procesamiento en memoria distribuida para grandes volumenes de datos además de aportar un conjunto mayor de operaciones para manipularlos cómodamente, además de disponer de librerias para tratar los datos como en una base de datos relacioal con queries SQL y disponer de librerias de Machine Learning distribuidas

Este curso busca facilitar el inicio y aprendizaje de la herramienta, así como conceptos básicos e importantes de Spark. Se enseñarán las mejores prácticas que podrás usar en tus desarrollos para procesamiento de grandes volúmenes de datos

Temario

  • Intro Spark
  • Conceptos más importantes
  • RDD’s
    • Creación
    • Operaciones (Tranformaciones, acciones, evaluación lazy)
    • Persistencia
  • Carga y exportación de datos
    • Formatos de fichero
    • Sistema de fichero
  • Ejecución en cluster
    • Driver y sus ejecutores
    • Cluster manager
    • Despliegue con spark-submit

 

Material

El alumno contará con ejercicios y documentación pdf suministrada por el profesor y con anterioridad se concretará el software que deberá tener instalado previamente y que se facilitará de manera gratuita para poder empezar a desarrollar desde el minuto 0

Responsabilidades profesor

Presentar el contenido conforme lo presentado en el programa de formación
Dar acceso al material necesario (PDFs, ejercicios, software, etcs) para el curso contratado.
Proveer de local para impartir la formación

Responsabilidades alumno

Participar en la formación en el periodo determinado, trayendo un notebook con los requisitos mínimos necesarios para la participación en la formación, siendo estos los siguientes:
Mínimo de 4GB de memoria RAM
Mínimo de 10GB de espacio en disco (HD).
Habilitada la virtualización tanto en software como hardware
Poseer privilegios de administración

Observaciones importantes

Confirmaciones
Las confirmaciones serán enviadas a la dirección de e-mail enviada por el alumno

Cancelaciones
Los plazos para el cancelamiento de inscripciones solicitadas, son de 5 días laborales antes del inicio del curso.
En caso de cancelamiento fuera de plazo por parte del alumno, DevAcademy se reserva el derecho a cobrar un porcentaje (20%) del valor del curso.
DevAcademy se reserva el derecho de cancelar o posponer la formación, siempre y cuando avise al contratante y/o devuelva el importe íntegro en caso de cancelación

Obligaciones del alumno
Es obligatorio que el alumno cumpla con todos las obligaciones recomendadas por el profesor para seguir todos los ejercicios y no demorar ni perjudicar la clase. Es posible que días antes se envie un email como recordatorio al alumno con instrucciones a seguir u obligaciones desarrollar para poder estar preparado al comienzo de la clase.



DevAcademy 2019 - info@devacademy.es - Telf: 687374918