El BSC es el centro de supercomputación europeo que más ha contribuido en Pancancer, el estudio que ha generado el mapa de genomas de cáncer más completo
Un equipo internacional de investigadores ha completado el estudio más exhaustivo de los genomas del cáncer hasta la fecha, lo que ayuda a mejorar la comprensión de esta enfermedad, y apunta a nuevas estrategias para su diagnóstico y tratamiento. El Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC) ha estado implicado desde las etapas iniciales de este proyecto y ha contribuido con el análisis de datos, con el diseño de soluciones informáticas específicas para la genómica del cáncer, así como en la respuesta a preguntas específicas relacionadas con la biología los tumores.
El proyecto ICGC / TCGA [1] Pan-Cancer Analysis of Whole Genomas Project (PCAWG), conocido como proyecto Pan-Cancer, una colaboración en la que participan más de 1.300 científicos y médicos de 37 países, analizó más de 2.600 genomas de 38 tipos de tumores diferentes, lo que ha permitido crear un enorme recurso de genomas de cáncer primario. Este fue el punto de partida de 16 grupos de trabajo que estudian diversos aspectos del desarrollo, la causa, la progresión y la clasificación del cáncer.
Los estudios anteriores se centraron en el 1% del genoma que codifica las proteínas y que tiene similitudes con el mapeo de las costas de los continentes. El Proyecto Pan-Cancer exploró con mucho detalle el 99% restante del genoma, incluidas las regiones claves que controlan la activación y la desactivación de genes, un trabajo similar al mapeo que se lleva a cabo de las zonas interiores de los continentes ante las áreas de costa.
El Proyecto Pan-Cancer ha facilitado un recurso integral para la investigación en genómica del cáncer, incluyendo los datos de secuenciación de genomas en bruto, el software para el análisis del genoma de esta dolencia y varias webs interactivas que exploran diversos aspectos de los datos de este proyecto [2].
El papel de la computación de altas prestaciones
Entre los pocos centros de análisis de datos de todo el mundo implicados en la gestión y el análisis de los datos de PanCancer, el BSC ha sido el centro europeo más activo. Ha tenido una amplia contribución al proyecto, que abarca el análisis primario de los genomas, incluida la detección de mutaciones; la generación de recursos informáticos relacionados; así como la identificación de copias génicas no funcionales que puedan tener un impacto directo en la aparición y la progresión de los tumores.
Se han analizado dos secuencias del genoma de cada donante (una de célula sana y una de célula tumoral) mediante diferentes métodos. Con el método BWA, los dos genomas de cada donante se alinearon con el genoma humano de referencia. Posteriormente, se analizaron los resultados de este alineamiento con los métodos Sanger, DKFZ / EMBL, Broad / MUSE para comparar los genomas sanos y tumorales de un mismo paciente y detectar posibles mutaciones presentes en el tumor. En el BSC se realizó el 14% de estos análisis. Uno de los cuatro métodos de análisis (Broad / MUSE) sólo se ha realizado en Estados Unidos por problemas de propiedad intelectual en su algoritmo.
"Más allá de los descubrimientos específicos sobre los procesos biológicos detrás del origen y la progresión de los tumores, este esfuerzo ha resultado en uno de los esfuerzos internacionales más importantes en biomedicina y ha creado el camino para futuras iniciativas mundiales en relación con la genómica del cáncer, y para la medicina personalizada en general" dice el doctor David Torrents, profesor de investigación ICREA, al frente de los grupos de genómica computacional del BSC. "Este proyecto ha situado nuestro centro entre los centros de referencia más importantes a nivel mundial para el análisis de datos en biomedicina y, en particular, en oncología genómica ".
Nuevos conocimientos sobre el cáncer
El Proyecto Pan-Cancer amplió y avanzar métodos para analizar genomas del cáncer que incluían la computación en nube y, aplicando estos métodos a su gran base de datos, aportó nuevos conocimientos sobre la biología del cáncer y confirmó hallazgos importantes de estudios anteriores. Según 23 trabajos publicados hoy en Nature y sus revistas afiliadas sobre el proyecto Pan-Cancer:
- El genoma del cáncer es finito y se puede conocer, pero es muy complejo. Combinando la secuenciación de todo el genoma de esta enfermedad con un conjunto de herramientas de análisis, se pueden caracterizar todos los cambios genéticos encontrados en un cáncer, todos los procesos que han generado estas mutaciones e incluso el orden de factores clave durante la historia de la vida de un cáncer.
- Los investigadores están cerca de catalogar todas las vías biológicas implicadas en el cáncer y tener una imagen más exhaustiva de las consecuencias que sus acciones tienen en el genoma. Se encontró al menos una mutación causal en prácticamente todos los cánceres analizados y también se vio que los procesos que generan mutaciones son muy diversos, desde cambios en letras de ADN hasta la reorganización de cromosomas enteros. Se identificaron múltiples regiones del genoma que controlan cómo se activan y se desactivan los genes causantes de las mutaciones que provocan un cáncer.
- A través de un nuevo método de "datación de carbono", los investigadores de Pan-Cancer descubrieron que es posible identificar mutaciones que se produjeron años, incluso décadas, antes de que se manifestara el tumor. Esto abre, teóricamente, nuevos caminos para la detección precoz del cáncer.
- Los tipos de tumores se pueden identificar con exactitud según los patrones de cambios genéticos observados en todo el genoma, lo que puede ayudar al diagnóstico de cáncer de un paciente cuando las pruebas clínicas convencionales no podrían identificar su tipo. El conocimiento del tipo exacto de tumor también podría ayudar a establecer tratamientos personalizados.
DOI: https://www.nature.com/articles/s41467-020-14367-0
Más información
ICGC - International Cancer Genome Consortium (https://icgc.org/) TCGA - The Cancer Genome Atlas (https://www.cancer.gov/about- nci/organization/ccg/research/structural-genomics/tcga)
PCAWG - PanCancer Analysis of Whole Genomes (dcc.icgc.org/pcawg) Expression Atlas (www.ebi.ac.uk/gxa/home)
PCAWG-Scout (pcawgscout.bsc.es)
Chromothripsis Explorer (compbio.med.harvard.edu/chromothripsis)
Pancancer Press Release
Pancancer FAQS
1. ICGC - International Cancer Genome Consortium https://icgc.org/; TCGA - The Cancer Genome Atlas (https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)
2. PCAWG Portal (dcc.icgc.org/pcawg); UCSC Xena (pcawg.xenahubs.net); Expression Atlas (www.ebi.ac.uk/gxa/home); PCAWG-Scout (pcawgscout.bsc.es); Chromothripsis Explorer (compbio.med.harvard.edu/chromothripsis)