El BSC desenvoluparà models multilingües en aranès

17 Gener 2024

L'Institut d'Estudis Aranesi - Acadèmia Aranesa de la Llengua Occitana (IEA-AALO) cedirà dades de veu, text i metadades al BSC, que s'integraran al corpus del projecte Aina

 

El Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) i l’Institut d’Estudis Aranesi - Academia Aranesa dera Lengua Occitana (IEA-AALO) han arribat a un acord per al desenvolupament de models d’intel·ligència artificial, per primer cop, també en aranès. Per això, l’ IEA-AALO cedirà dades de veu, text i metadades al BSC.

L’acord entre ambdós centres és una fita clau per la incorporació de la llengua occitana en els sistemes d’intel·ligència artificial desenvolupats pel Projecte Aina. El projecte està coordinat a través de la Unitat de Tecnologies del Llenguatge del BSC.

La col·laboració preveu que el BSC preprocessi les dades per tal d’integrar-les al corpus d’Aina. Els datasets que estan disponibles a Hugging Face són fonamentals per l’entrenament dels models i de les Tecnologies del Llenguatge (TL).

Per a l’ IEA-AALO, es tracta d’un “pas que pot comportar un avanç important per al desenvolupament de tecnologies en llengua occitana que puguin facilitar l’estudi i anàlisi lingüístic, així com una major difusió i foment de la llengua a través d’aplicacions de redacció de textos o correcció automàtica, entre altres”, segons ha assegurat el seu president, Jèp de Montoya.

El Projecte Aina liderat pel BSC i finançat per la Generalitat de Catalunya, expandeix així el seu ventall de col·laboracions, més enllà del català. La seva visió estratègica permet consolidar la iniciativa com un espai d’impuls de llengües amb pocs recursos digitals.

 

Més informació del projecte i del desenvolupament dels models i datasets a través del web del projecte Aina Tech.