El BSC-CNS instala un nuevo prototipo basado en tecnología ARM
El Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) ha puesto en marcha un nuevo prototipo para explorar arquitecturas de computadores alternativas. Este clúster combina núcleos (cores) ARM, que son eficientes desde un punto de vista energético, con un acelerador móvil GPU. Actualmente, alcanza 5 GFLOPs por Vatio en computación de precisión simple (0,8 GFLOPs/Vatio en precisión doble) y optimiza las aplicaciones que requieren GPUs gracias a los sistemas actuales basados en aceleradores.
Co-financiado por la iniciativa PRACE (Partnership for Advanced Computing in Europe), el nuevo prototipo, formado por 16 nodos Quad-core Tegra3 SoC y GPUs móviles Quadro 1000M conectadas mediante una red de interconexión Gigabit Ethernet, se basa en el anterior clúster Tegra2 con 256 nodos, puesto en marcha en 2011 (www.bsc.es/marenostrum-support-services/tibidabo-prototype).
En la actualidad, PRACE está explorando una serie de prototipos para testear y evaluar las nuevas tecnologías diseñadas para futuros sistemas multi-PFLOPs. Así, algunos clústers, que aún se encuentran en fase de pre-producción, se han instalado recientemente en centros de supercomputación como GENCI (en Francia), SNIC (Suecia) e ICHEC (Irlanda), entre otros. El común denominador de todas estas máquinas es la evaluación de la eficiencia energética para valorar si sus componentes son adecuados para los futuros sistemas.
“Nuestro objetivo es construir y evaluar potenciales arquitecturas que puedan ser innovadoras, tanto las que aún tardarán en salir al mercado como las que están prácticamente listas para su comercialización”, comenta Álex Ramírez, jefe del equipo de Arquitecturas Heterogéneas en el BSC-CNS.
El nuevo prototipo español está instalado en el BSC-CNS y se utilizará para desarrollar el software de sistema (sistemas operativos, compiladores, librerías, etc) de este nuevo tipo de arquitecturas, y realizar pruebas de rendimiento y eficiencia energética. Además, ayudará a evaluar cómo el modelo de programación OmpSs (desarrollado en el BSC-CNS) mitiga el impacto del bajo rendimiento de la memoria y la red de interconexión de estas arquitecturas. Estos clústers aceleran el desarrollo del software y ayudan a los arquitectos de computadores a investigar diferentes alternativas de hardware y paradigmas de programación, con la vista puesta en el diseño de supercomputadores que sean energéticamente eficientes.
Características técnicas de un nodo simple
NVIDIA CARMA developer board manufactured by SECO CPU: NVIDIA Tegra 3 quad-core ARM Cortex-A9 GPU: NVIDIA Quadro 1000M (96 CUDA cores) Memory: 2GB (CPU) + 2GB (GPU) 270 single precision GFLOPS |
Sesión ‘Birds-of-Feather’ en el SC12
Para ofrecer más información sobre este tipo de tecnologías, PRACE organiza una sesión especial ‘Birds-of-Feather’ que lleva por título ‘PRACE Future technologies evaluation results’, que tendrá lugar el próximo 14 de noviembre en el marco de la conferencia SC12 (http://sc12.supercomputing.org/), en Salt Lake City (USA). Más información en: http://www.prace-ri.eu/IMG/pdf/prace-bof-flyer2.pdf ; http://www.prace-project.eu/PRACE-Prototypes?lang=en y en http://www.nvidia.com/object/carma-devkit.html