El investigador Josep Lluís Berral crea un curso on-line sobre Inteligencia Artificial y Machine Learning en entornos de supercomputación

13 Marzo 2020

La inteligencia artificial (IA), el análisis de datos y el aprendizaje automático son áreas de las ciencias de la computación que están presentes en muchos campos de la investigación y en la supercomputación. Con el objetivo de acercar el uso de la IA tanto a estudiantes de informática como a profesionales e investigadores de todos los ámbitos que trabajen con algoritmos de análisis y predicción de datos, el Barcelona Supercomputing Center (BSC) ha diseñado un curso on-line sobre IA en entornos de computación de altas prestaciones. El curso consta de video-tutoriales, breve teoría e introducción a los conceptos de DataCenters, Machine Learning, así como ejercicios y ejemplos usando plataformas como Apache Spark y Intel BigDL.

En este curso on-line, el doctor Josep Lluís Berral, creador del curso e investigador del grupo Data Centric Computing, introduce los conceptos básicos de paralelismo, rendimiento y virtualización, así como machine learning, orientados tanto a estudiantes e investigadores iniciados en estos campos como para aquellos que los descubren por primera vez.

El curso se divide en tres partes fundamentales: rendimiento en centros de procesado de datos, machine learning y tecnologías de procesamiento de datos distribuidos. Cada parte dispone de video-tutoriales, que incluyen también una parte teórica y ejemplos prácticos, además de una presentación y algunos ejercicios. En los dos primeros capítulos, los tutoriales presentan los fundamentos teóricos para la supercomputación y la inteligencia artificial. En el tercer capítulo se introducen las plataformas Spark y BigDL para el procesamiento de datos y deep learning, junto con casos prácticos. En total, Berral, con la ayuda de Francisco Javier Jurado, ha preparado más de cinco horas de video-tutoriales, alrededor de estos tres capítulos, varios ejercicios y ejemplos de código, así como scripts para desplegar fácilmente los entornos de software usados en el curso.

“Hemos preparado este curso pensando en investigadores como los que trabajan en torno al BSC y en grupos de investigación asociados que, aunque procedan de campos tan diversos como las matemáticas, la biología, la genómica o las ciencias de la Tierra, tienen la necesidad de usar supercomputadores para procesar grandes cantidades de experimentos, pero nunca han tenido ocasión de usar métodos como estos que pueden ayudarles en su trabajo diario”, comenta Josep Lluís Berral.

Berral recibió en 2019 un patrocinio del departamento de Relación con Universidades de Intel Corp., dentro de la Iniciativa de Educación en IA, para desarrollar el curso y publicarlo en abierto.

Las tecnologías escogidas en este curso on-line van desde conocidos lenguajes de script como Python, herramientas de virtualización como VirtualBox, el framework de procesamiento de datos distribuidos Apache Spark, hasta librerías de Deep Learning distribuido Intel BigDL. Se prevé que los contenidos y las tecnologías propuestas se actualicen periódicamente, a medida que la tecnología evolucione y los usuarios envíen su feedback.