El BSC és el centre de supercomputació europeu que ha analitzat el nombre més alt de genomes complets en aquest ambiciós projecte.
Un equip internacional d’investigadors ha completat l’estudi més exhaustiu dels genomes del càncer fins a la data, fet que ajuda a millorar la comprensió d’aquesta malaltia i apunta a noves estratègies per al seu diagnòstic i tractament. El Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) ha estat implicat des de les etapes inicials d'aquest projecte i ha contribuït amb l'anàlisi de dades, amb el disseny de solucions informàtiques específiques per a la genòmica de el càncer, així com en la resposta a preguntes específiques relacionades amb la biologia dels tumors.
El projecte ICGC / TCGA [1] Pan-Cancer Analysis of Whole Genomes Project (PCAWG), conegut com a projecte Pan-Cancer, una col·laboració en què participen més de 1.300 científics i metges de 37 països, va analitzar més de 2.600 genomes de 38 tipus de tumors diferents, cosa que ha permès crear un enorme recurs de genomes de càncer primari. Aquest va ser el punt de partida de 16 grups de treball que estudien diversos aspectes del desenvolupament, la causa, la progressió i la classificació del càncer.
Els estudis anteriors es van centrar en l’1% del genoma que codifica les proteïnes i que s’assembla al mapeig de les costes dels continents. El Projecte Pan-Cancer va explorar amb molt més detall el 99% restant del genoma, incloses les regions claus que controlen l'activació i la desactivació de gens, una tasca semblant al mapeig que es duu a terme de les zones interiors dels continents davant les àrees de costa.
El Projecte Pan-Cancer ha facilitat un recurs integral per a la investigació en genòmica del càncer, incloent les dades de seqüenciació de genomes en brut, el programari per a l'anàlisi del genoma del càncer i diverses webs interactives que exploren diversos aspectes de les dades d’aquest projecte [2].
El paper de la computació d’altes prestacions
Entre els pocs centres d’anàlisi de dades de tot el món implicats en la gestió i l’anàlisi de les dades de PanCancer, el BSC ha estat el centre europeu més actiu. Ha tingut una àmplia contribució al projecte, que abasta l’anàlisi primària dels genomes, inclosa la detecció de mutacions; la generació de recursos informàtics relacionats; així com la identificació de còpies gèniques no funcionals que puguin tenir un impacte directe en l’aparició i la progressió dels tumors.
S’han analitzat dues seqüències del genoma de cada donant (una de cèl·lula sana i una de cèl·lula tumoral) mitjançant diferents mètodes. Amb el mètode BWA, els dos genomes de cada donant es van alinear amb el genoma humà de referència. Posteriorment, es van analitzar els resultats d’aquest alineament amb els mètodes Sanger, DKFZ / EMBL, Broad / MUSE per comparar els genomes sans i tumorals d’un mateix pacient i detectar possibles mutacions presents en el tumor. Al BSC es va realitzar el 14% d’aquestes anàlisis. Un dels quatre mètodes d’anàlisi (Broad / MUSE) només s’ha realitzat als Estats Units per problemes de propietat intel·lectual en el seu algorisme.
"Més enllà dels descobriments específics sobre els processos biològics darrere de l'origen i la progressió dels tumors, aquest esforç ha resultat en un dels esforços internacionals més importants en biomedicina i ha creat el camí per a futures iniciatives mundials en relació amb la genòmica del càncer, i per a la medicina personalitzada en general" diu el doctor David Torrents, professor d’investigació ICREA, al capdavant dels grups de genòmica computacional del BSC. "Aquest projecte ha situat el nostre centre entre els centres de referència més importants a nivell mundial per a l'anàlisi de dades en biomedicina i, en particular, en oncologia genòmica".
Nous coneixements sobre el càncer
El Projecte Pan-Cancer va ampliar i avançar mètodes per analitzar genomes del càncer que incloïen la computació en núvol i, aplicant aquests mètodes a la seva àmplia base de dades, va aportar nous coneixements sobre la biologia del càncer i va confirmar troballes importants d’estudis anteriors. Segons 23 treballs publicats avui a Nature i les seves revistes afiliades sobre el projecte Pan-Cancer:
- El genoma d’aquesta malatia és finit i es pot conèixer, però és molt complex. Combinant la seqüenciació de tot el genoma del càncer amb un conjunt d’eines d’anàlisi, es poden caracteritzar tots els canvis genètics trobats en un càncer, tots els processos que han generat aquestes mutacions i fins i tot l’ordre d’esdeveniments clau durant la història de la vida d’un càncer.
- Els investigadors estan a prop de catalogar totes les vies biològiques implicades en el càncer i tenir una imatge més exhaustiva de les conseqüències que les seves accions tenen en el genoma. Es va trobar almenys una mutació causal a pràcticament tots els càncers analitzats i també es va veure que els processos que generen mutacions són molt diversos, des de canvis en lletres d’ADN fins a la reorganització de cromosomes sencers. Es van identificar múltiples regions del genoma que controlen com s’activen i es desactiven els gens causants de les mutacions que provoquen un càncer.
- A través d'un nou mètode de "datació de carboni", els investigadors de Pan-Cancer van descobrir que és possible identificar mutacions que es van produir anys, fins i tot fins dècades, abans que es manifestés el tumor. Això obre, teòricament, nous camins per a la detecció precoç del càncer.
- Els tipus de tumors es poden identificar amb exactitud segons els patrons de canvis genètics observats a tot el genoma, cosa que pot ajudar al diagnòstic de càncer d'un pacient quan les proves clíniques convencionals no podrien identificar-ne el tipus. El coneixement del tipus exacte de tumor també podria ajudar a establir tractaments personalitzats.
DOI: https://www.nature.com/articles/s41467-020-14367-0
More information
ICGC - International Cancer Genome Consortium (https://icgc.org/) TCGA - The Cancer Genome Atlas (https://www.cancer.gov/about- nci/organization/ccg/research/structural-genomics/tcga)
PCAWG - PanCancer Analysis of Whole Genomes (dcc.icgc.org/pcawg) Expression Atlas (www.ebi.ac.uk/gxa/home)
PCAWG-Scout (pcawgscout.bsc.es)
Chromothripsis Explorer (compbio.med.harvard.edu/chromothripsis)
Pancancer Press Release
Pancancer FAQS
1. ICGC - International Cancer Genome Consortium https://icgc.org/; TCGA - The Cancer Genome Atlas (https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)
2. PCAWG Portal (dcc.icgc.org/pcawg); UCSC Xena (pcawg.xenahubs.net); Expression Atlas (www.ebi.ac.uk/gxa/home); PCAWG-Scout (pcawgscout.bsc.es); Chromothripsis Explorer (compbio.med.harvard.edu/chromothripsis)