L'investigador del BSC Alfonso Valencia adverteix del risc de les bases de dades biomèdiques centralitzades per al progrés científic

20 Març 2025

En un article publicat a EMBO Reports, el director de Ciències de la Vida del BSC aposta per models científics col·laboratius i descentralitzats per protegir la informació científica d'interessos polítics

El professor ICREA i director de Ciències de la Vida del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS), Alfonso Valencia, ha publicat un article a la revista EMBO Reports on adverteix sobre la vulnerabilitat de les bases de dades biomèdiques centralitzades en un context internacional marcat per la inestabilitat. Davant d'aquesta situació, Valencia destaca el paper d'Europa com a líder en un nou model de ciència oberta en què les dades siguin lliures, segures i accessibles.

L'article signat per Valencia, titulat 'Decentralized Databases in Biomedical Research: Lessons from Recent Events', forma part d'una edició recent d'EMBO Reports que aborda els desafiaments que enfronta la investigació científica en un context de pressió política creixent. La situació és especialment crítica als Estats Units, on s'han implementat retallades pressupostàries que afecten l'activitat científica del país i amenacen el conjunt de la ciència mundial com a fenomen global i interconnectat.

Valencia posa el focus en la fragilitat dels sistemes centralitzats de gestió de dades científiques, essencials per a la biologia i la biomedicina, ja que contenen el coneixement acumulat durant dècades en centenars de milers de publicacions, bases de dades i repositoris especialitzats. Exemples recents són la retirada d'informació de salut pública pels Centres per al Control i la Prevenció de Malalties dels EUA (CDC), amb informació crítica sobre taxes de vacunació, brots epidemiològics, contaminació i violència de gènere, i el col·lapse dels servidors de PubMed, base de dades d'articles científics administrada per la Biblioteca Nacional de Medicina dels EUA.

Davant dels riscos de la centralització, el director de Ciències de la Vida del BSC advoca a l'article per la col·laboració internacional i l'adopció de models descentralitzats, que distribueixen les dades en múltiples nodes, millorant la resiliència i l'accessibilitat. Valencia subratlla l'èxit d'iniciatives com el Protein Data Bank (PDB) i l'European Genome-Phenome Archive (EGA), com a exemples de cooperació entre diferents països per garantir l'accés i la seguretat de la informació científica.

El PDB és una base de dades oberta i gratuïta, essencial per a la biologia estructural, amb nodes als EUA, Europa i el Japó, que emmagatzema desenes de milers d'estructures de proteïnes accessibles globalment. Ha estat fonamental per a avenços com AlphaFold, guanyador del Premi Nobel de Química 2024, basat en sistemes d'intel·ligència artificial que permeten predir amb precisió l'estructura de les proteïnes i com modificar-les.

En el cas d'EGA, i la seva versió federada (fEGA), és una base de dades descentralitzada amb informació essencial sobre genomes humans que facilita estudis transnacionals en àrees crítiques com el càncer infantil o malalties rares. El projecte està coordinat per l'European Molecular Biology Laboratory de l'European Bioinformatics Institute (EMBL-EBI) i pel Centre de Regulació Genòmica (CRG) a Barcelona, ​​en aquest cas en gran mesura amb el suport de la Fundació “la Caixa”. EGA allotja una enorme quantitat de dades genòmiques i fenotípiques, que són emmagatzemades al BSC i al mateix EBI, i pot adaptar-se també com un sistema federat, fEGA, cosa que permet accedir a aquesta informació a diversos països sense moure'ls de les seves seus legals, mantenint alhora les dades segures i privades.

Valencia destaca el paper crucial d'Europa, que té l'oportunitat i el deure de liderar un nou paradigma científic, enfortint el finançament de recursos descentralitzats, expandint aliances internacionals i promovent estàndards globals per a la interoperabilitat de les dades. L'investigador del BSC cita altres iniciatives de referència com ELIXIR, que integra recursos bioinformàtics de 23 països, o EUCAIM, per a l'anàlisi federada d'imatges mèdiques, que demostren que la col·laboració transnacional és tan necessària com viable.

"Els recents esdeveniments als EUA són, per tant, una crida d'atenció per a la comunitat científica. No podem donar per feta l'accessibilitat i la integritat de les dades biomèdiques. Adoptant sistemes descentralitzats, podem protegir la informació crítica d'interferències polítiques, desastres naturals i errors tècnics. Ara és el moment d'actuar, abans que la propera crisi requereixi una resposta molt més amplia i costosa. Hem de garantir que la cerca del coneixement segueixi sent lliure, oberta i resistent, passi el que passi”, conclou Valencia.