El panell és fruit d'una col·laboració entre el GCAT|Genomes for Life de l'IGTP i el Barcelona Supercomputing Center
La seqüenciació massiva del genoma d'una mostra de membres sans de la població ha permès proporcionar una eina genètica per estudiar variants complexes del genoma que poden causar malalties comunes
El panell permetrà als investigadors que utilitzen tècniques de seqüenciació de baix cost millorar el descobriment i la interpretació dels canvis genètics darrere de les malalties comunes amb més facilitat
Investigadors de l'Institut de Recerca Germans Trias (IGTP) i del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) han elaborat el primer mapa genètic d’haplotips de la població de la península ibèrica, definint una eina, el panell GCAT, que permetrà entendre millor els canvis genètics darrere de moltes malalties comunes. El treball, publicat a la revista Nucleic Acids Research, representa la caracterització mes completa de la variació genètica creada a partir de dades de la població espanyola. A més, el grup ha demostrat que el panell GCAT és eficaç per analitzar poblacions d'arreu del món.
El grup va estudiar els genomes de 5.200 participants que viuen a Catalunya, dels quals es va estudiar la seqüència completa del genoma (WGS) de 785 voluntaris amb una alta cobertura de lectura (30X), juntament amb els registres clínics de salut i informació ambiental de totes les persones. “El resultat d'aquest treball, el GCAT|Panel, ha derivat del primer estudi que utilitza la seqüenciació per descriure les variants genètiques complexes del genoma en una cohort poblacional a Espanya. Ara, aquesta eina està disponible perquè els investigadors l'utilitzin en estudis genètics diversos, per buscar els mecanismes genètics darrere de les malalties o en estudis evolutius entre d’altres", explica Rafa de Cid, director científic del projecte GCAT|Genomes for Life i coautor sènior de l'estudi.
"Hem aplicat l'extensa bateria d'algoritmes disponible, juntament amb models d'anàlisi de regressió estadística, per generar una nova solució altament sensible en forma de panell de haplotips que conté més de 35 milions de variants, incloses en més de 100.000 variants estructurals", afegeix David Torrents, líder del Grup de Genòmica Computacional del BSC i professor de recerca ICREA, l'altre coautor sènior.
El extens treball el signen tres primers autors conjunts, Jordi Valls-Margarit i Daniel Matías-Sánchez, del Departament de Ciències de la Vida del BSC, i Iván Galván-Femenía, del Laboratori GCAT de l'IGTP i, actualment, de l'Institut de Recerca en Biomedicina (IRB Barcelona).
Variants genètiques
Tot i que molts estudis suggereixen que la genètica té un paper important en moltes malalties comunes, la majoria dels mecanismes encara es desconeixen. Quan es va seqüenciar el genoma humà l'any 2000, els científics tenien finalment el codi genètic, però no el mapa amb el qual interpretar-lo. Aquest estudi suposa un gran pas endavant per tenir aquest mapa. La majoria de les investigacions sobre variants genètiques s'han centrat en els canvis d'un sol nucleòtid, quan es canvia una unitat bàsica de la cadena genètica. Tanmateix, molts dels canvis que fan que les persones desenvolupin malalties són més complexos, impliquen importants insercions o supressions de material, canviant o intercanviant seccions, per exemple; però el seu paper en les malalties és molt menys conegut i difícil de analitzar. L'equip que treballa en aquest estudi té ara un mapa de quasi tres vegades més variants de les identificades fins ara. El coneixement precís disponible prèviament als participants del GCAT|Panel permetrà connectar més fàcilment aquestes variants amb la malaltia real. Aquest treball està en curs.
Rendiment millorat del panell de haplotips GCAT|Panel
Els investigadors van utilitzar el GCAT|Panel per la imputació in silico de les variants estructurals en amplies mostres de individus, i van observar una major eficiència en comparació amb altres panell poblacionals. L’aplicació d’aquesta eina en la cohort GCAT, juntament amb un estudi genètic d’associació del genoma, va identificar variants genètiques complexes associades a la presencia de diversos trets biològics i malalties. En concret, vam detectar la presència d'una variant genètica de baixa freqüència, un element anomenat AluYa5-element, que s'associa amb la presència de la moneuritis de les extremitats inferiors, que pot estar a la base de una rara malaltia neuromuscular.
"La combinació dels riscos genètics amb variants simples que ja hem identificat anteriorment a la cohort GCAT i aquestes noves dades sobre variants complexes contribuiran a la millor comprensió dels mecanismes darrera de les malalties que tenen una herència complexa", va confirmar de Cid.
"Aquests resultats realment proporcionen un argument addicional per utilitzar tècniques de genòmica de baix cost i fàcilment reproduïbles juntament amb panells com el GCAT|Panel, que es deriven d'una seqüenciació completa del genoma, per trobar l'impacte de variants més complexes i avançar en la nostra comprensió de la base molecular de les malalties comunes”, conclou Torrents.
GCAT|Genomes for Life Cohort: el poder dels voluntaris en la investigació
El GCAT és un projecte de recerca estratègica de l'IGTP finançat amb fons públics. Iniciat ara fa deu anys, el projecte centra el seu objectiu en l’estudi de les causes genètiques darrere les malalties comunes, malalties amb una herència complexa.
El projecte compta amb la participació de 20.000 voluntaris de la població general d'arreu de Catalunya, en el que els participants aporten de forma voluntària una mostra biològica i informació detallada sobre el seu estil de vida, dieta, medicació, així com de la seva història clínica electrònica. L’estudi que no revela la identificació dels participants, treballa amb dades xifrades i permet el seu reus, per posar les dades de tot el projecte a disposició de la comunitat científica, en estudis com el ara publicat, i sempre sota un estricte protocol de supervisió científica, ètìca i d’acord amb la legislació actual de protecció de dades.
El GCAT|Genomes for Life Cohort participa en projectes internacionals contribuint al coneixement de les causes moleculars de les malalties comunes, per exemple, ha participat en els grans estudis genòmics que han identificat els factors de risc genètics per a la Covid-19.
El Barcelona Supercomputing Center: entendre el big data és clau per a la investigació mèdica
Els potents recursos informàtics i el complex disseny d'estratègies per analitzar les dades genòmiques que ofereix el BSC han fet possible la generació d'aquest mapa. Aquest treball augmenta la resolució del mapa genètic tant en el nombre de variants trobades com en els tipus de variants catalogades. L'ordinador MareNostrum del BSC i el seu entorn computacional van ser clau per a aquesta investigació. Va necessitar un total de 766.663 hores (CPU/h 3.418,524) de càlcul per completar el mapa.
Paper original
Jordi Valls-Margarit, Iván Galván-Femenía, Daniel Matías-Sánchez, Natalia Blay, Montserrat Puiggròs, Anna Carreras, Cecilia Salvoro, Beatriz Cortés, Ramon Amela, Xavier Farre, Jon Lerga-Jaso, Marta Puig, Jose Francisco Sánchez-Herrero, Victor Moreno, Manuel Perucho, Lauro Sumoy, Lluís Armengol, Olivier Delaneau, Mario Cáceres, Rafael de Cid, David Torrents, GCAT|Panel, a comprehensive structural variant haplotype map of the Iberian population from high-coverage whole-genome sequencing, Nucleic Acids Research, 2022;, gkac076, https://doi.org/10.1093/nar/gkac076
Aquest treball ha estat finançat pel Govern d’Espanya, la Generalitat de Catalunya i el Fons Europeu de Desenvolupament Regional (FEDER, UE).