El Instituto de Estudios Aranesi - Academia Aranesa dera Lengua Occitana (IEA-AALO) cederá datos de voz, texto y metadatos al BSC, que se integrarán en el corpus del proyecto Aina
El Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) y el Instituto de Estudios Aranesi - Academia Aranesa dera Lengua Occitana (IEA-AALO) han llegado a un acuerdo para desarrollar modelos de inteligencia artificial, por primera vez, también en aranés. Para ello, el IEA-AALO cederá datos de voz, texto y metadatos al BSC.
El acuerdo entre ambos centros es un hito clave para la incorporación de la lengua occitana en los sistemas de inteligencia artificial desarrollados por el Proyecto Aina. La Unidad de Tecnologías del Lenguaje del BSC es la encargada de coordinar el proyecto.
La colaboración prevé que el BSC preprocese los datos para integrarlos en el corpus de Aina. Los datasets que están disponibles en Hugging Face son fundamentales por el entrenamiento de los modelos y de las Tecnologías del Lenguaje (TL).
Para el IEA-AALO, se trata de un “paso que puede comportar un avance importante para el desarrollo de tecnologías en lengua occitana que puedan facilitar el estudio y análisis lingüístico, así como una mayor difusión y fomento de la lengua a través de aplicaciones de redacción de textos o corrección automática, entre otras”, según ha asegurado su presidente, Jèp de Montoya.
El Proyecto Aina liderado por el BSC y financiado por la Generalitat de Catalunya, expande así su abanico de colaboraciones, más allá del catalán. Su visión estratégica consolida la iniciativa como espacio de impulso de las lenguas con pocos recursos digitales.
Más información del proyecto y del desarrollo de modelos y datasets a través de la web del proyecto Aina Tech.