• 687374918
  • info@devacademy.es

Alberto Torres: “El principal reto del Data Science es encontrar el equilibrio entre aplicaciones e investigación base”

Entrevistamos a Alberto Torres, ingeniero de datos y miembro de la comunidad de profesionales DevAcademy, donde imparte formaciones en abierto y a empresas en este área. Con él hablamos sobre las últimos retos y novedades en el mundo de Data Science y Analytics.

¿En qué momento y por qué te interesaste por el mundo de Data Science y Analytics?

Fue en mi último año de carrera trabajando como becario de investigación en el IIC (Instituto de Ingeniería del Conocimiento), un empresa donde llevan más de 20 años aplicando aprendizaje automático a diversos problemas reales como la predicción de energías renovables y la detección de fraude. Ahí pude ver de primera mano que este tipo de técnicas no sólo eran posibles, sino que son además eran útiles para resolver una buena cantidad de problemas existentes.

¿Cuál ha sido el proyecto en el que has trabajado que más te ha gustado y por qué? ¿Y el que menos?

Probablemente el proyecto más interesante sea precisamente la predicción de energías renovables. Es un problema relevante porque una buena predicción puede ahorrar potencialmente mucho dinero a las empresas del sector. Es además un problema muy complejo ya que depende de la meteorología, que es a su vez algo inexacto. Por último es también relevante socialmente en el sentido de que en el futuro deberíamos dirigirnos hacia una producción 100% renovable. Reducir la variabilidad inherente de estos métodos de producción puede ayudar por tanto a los productores, distribuidores y comercializadores a moverse en esa dirección.
En cuanto a proyectos que me hayan gustado menos no podría destacar uno. En todos se aprende algo, que es al final el objetivo, a pesar de que la aplicación en particular no sea tan interesante
¿Cuáles son los principales retos en el área en los próximos dos años?
El principal reto en mi opinión es encontrar un equilibrio entre aplicaciones e investigación base. Algunas personas consideran que en los últimos años se ha “democratizado” el Data Science, haciendo que personas sean capaces de aplicar técnicas avanzadas a problemas complejos sin necesidad de conocimientos profundos en la materia. Esto es algo bueno, pero no sería posible sin el gran trabajo que realizan, por ejemplo, todas las personas que desarrollan las librerías necesarias para ello o los investigadores que avanzan las tecnologías detrás de los mismos.
Por un lado el interés de la industria significa que los métodos son útiles y resuelven problemas reales. El potencial peligro está en que a medida que aumenta la popularidad y aplicaciones de estas técnicas, más investigadores son atraídos por las empresas para trabajar en un producto concreto. Podría llegar un punto en el que no queden personas dispuestas a trabajar, por ejemplo, en proyectos de software libre, lo que sería algo muy perjudicial para el área.
Si tuvieras superpoderes, ¿qué solucionarías en el mundo con la tecnología que conoces?
Me bastaría con arreglar los problemas que tienen tecnologías actuales que todavía no se están aplicando en masa, por ejemplo los coches autónomos, hasta llegar al punto de que sean útiles para el conjunto de la sociedad.
¿Algún material (libro, documental, charla…) que consideres imprescindible para los interesados en el área?
Es imposible hacer Data Science sin programar, por eso voy a recomendar los libros imprescindibles de los dos lenguajes más populares (R y Python). No son libros de programación al uso ya que se centran en la aplicación de los lenguajes a este tipo de técnicas, pero en mi opinión son ambos muy recomendables:
R for Data Science. http://r4ds.had.co.nz/
¿Qué consejo le darías a un profesional que quiera iniciarse en Data Science?
El Data Science se basa en tres pilares que son la programación, las matemáticas y conocimiento específico del problema. Para los dos primeros no hay atajos y considero necesario familiarizarse con al menos un lenguaje de programación (R o Python) y nociones básicas de estadística, álgebra y cálculo. El conocimiento específico depende mucho del problema y se puede coger sobre la marcha.  Otros temas como por ejemplo las bases de datos y computación de altas prestaciones son también importantes pero no esenciales en mi opinión.
Además de formar a personas, ¿te formas tú también? Si es así, ¿qué estás aprendiendo actualmente?
El campo avanza tan rápido que es complicado seguir el ritmo sin estar formándose continuamente. A menudo cada proyecto en el que trabajas te obliga a aprender al menos lo básico de distintas tecnologías que no conocías anteriormente. En concreto ahora estoy aprendiendo lo básico de programación probabilista, que nunca antes había usado para resolver ningún problema.
¿Qué es lo que más te gusta de dar clase? ¿Y de hacerlo en DevAcademy?
Lo mejor de dar clase es que, además de enseñar, también se aprende mucho. No salgo de ninguna clase sin conocer algo que no sabía antes o sin plantearme alguna cosa desde un nuevo punto de vista. Lo mejor de DevAcademy es la oportunidad de dar cursos en empresas, donde los alumnos están en general más motivados, tienen muy claro por qué quieren aprender ese lenguaje y saben para que lo van a utilizar. Esto es crítico para el aprendizaje porque en todo momento están pensando como usarían ellos lo que se está viendo en clase para resolver los problemas de su trabajo diario
Analytics, Data Science, DevAcademy, formación, Python, R

DevAcademy 2018 - info@devacademy.es - Telf: 687374918