Basic Data Integration
¿Has sufrido alguna vez la tediosa tarea de desarrollar scripts para volcar datos de una base de datos a otra? o ¿ya has tenido que hacer un proceso de carga de logs a una base de datos?, ¿cansado de programar scripts para mover datos de un lado a otro?, ¿quieres aplicar limpieza y consistencia a tus datos?. Si es así, te recomendamos este curso donde aprenderás la metodología y una herramienta para poder facilitarte estas tareas.
Pentaho Data Integration es una herramienta de la suite de Pentaho la cual provee a los desarrolladores de acciones de manipulación de datos. Esta herramienta es muy utilizada por grandes y medianas empresas para la extracción, transformación y carga (ETL) de los datos, pues es la clave del éxito en un sistema de analítica de negocios ya que más del 80% de un proyecto consiste en mover y limpiar datos, tareas las cuales se llevan a cabo con esta herramienta, permitiendo así la fácil gestión los datos de forma adecuada en entornos de producción.
Este curso de Basic Data busca facilitar el inicio y aprendizaje de la herramienta, así como conceptos básicos e importantes de las ETLs. Se enseñarán las mejores prácticas que podrás traladar a cualquier otra herramienta de integración de datos.
Temario
Data Plumbing
- Introducción a Pentaho Data Integration. Instalación, estructura de la aplicación y componentes
- Buenas prácticas para definición de procesos ETL
- Arquitectura de una ETL: flujos de datos y data plumbing
- Parametrización: paso de desarrollo y producción
- Trabajos y orquestación de acciones sobre bloques de datos
- Transformaciones de datos
Ejercicios guiados
Ejercicio 1.
Este ejercicio guiado tiene como fin el cubrir uno de los eventos naturales en las empresas: carga y procesamiento de logs (servidor, aplicación, procesos, etcs). El alumno aprenderá a desarrollar toda la arquitectura del flujo de datos y la configuración de la herramienta, pasando por:
- Búsqueda, lectura de archivo de log y parseo de datos
- Selección, tratamiento y limpieza de datos
- Escritura en Base de Datos
Ejercicio 2.
Es común en las empresas el volcado de información de una base de datos a otra. Con este ejercicio el alumno podrá realizar estos procesos, ajustando la arquitectura a sus necesidades. El ejercicio repasará:
- Configuración de conexiones y parametrización a DB (desarrollo y producción)
- Consulta en Base de datos
- Selección, tratamiento y limpieza de datos
- Cruce de datos de un origen con otro en otra tecnología
- Escritura en Base de Datos
- Orquestación de datos
Responsabilidades profesor
Presentar el contenido conforme lo presentado en el programa de formación
Dar acceso al material necesario (PDFs, ejercicios, software, etcs) para el curso contratado.
Proveer de local para impartir la formación
Responsabilidades alumno
Participar en la formación en el periodo determinado, trayendo un notebook con los requisitos mínimos necesarios para la participación en la formación, siendo estos los siguientes:
Mínimo de 4GB de memoria RAM
Mínimo de 10GB de espacio en disco (HD).
Habilitada la virtualización tanto en software como hardware
Poseer privilegios de administración
Observaciones importantes
Confirmaciones
Las confirmaciones serán enviadas a la dirección de e-mail enviada por el alumno
Cancelaciones
Los plazos para el cancelamiento de inscripciones solicitadas, son de 5 días laborales antes del inicio del curso.
En caso de cancelamiento fuera de plazo por parte del alumno, DevAcademy se reserva el derecho a cobrar un porcentaje (20%) del valor del curso.
DevAcademy se reserva el derecho de cancelar o posponer la formación, siempre y cuando avise al contratante y/o devuelva el importe íntegro en caso de cancelación
Obligaciones del alumno
Es obligatorio que el alumno cumpla con todos las obligaciones recomendadas por el profesor para seguir todos los ejercicios y no demorar ni perjudicar la clase. Es posible que días antes se envie un email como recordatorio al alumno con instrucciones a seguir u obligaciones desarrollar para poder estar preparado al comienzo de la clase.