CARMEN-I: digitalitzant historials clínics de COVID-19 amb Intel·ligència Artificial
El pròxim 13 de Gener en la Facultat de Medicina de la Universitat de Barcelona es presentarà un avanç clau en l'aplicació de la Intel·ligència Artificial en l'àmbit de la salut i en el processament de llenguatge natural: el primer corpus anonimitzat de diferents tipus d'informes clínics en espanyol, anomenat CARMEN-I (Corpus of Anonymized Records for Medical information Extraction). CARMEN-I s'ha desenvolupat en el context del Pla d'Impuls de les Tecnologies del Llenguatge (Pla TL) promogut per la Secretaria d'Estat de Digitalització i Intel·ligència Artificial (SEDIA) i del conveni entre el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) i l'Hospital Clínic de Barcelona. A més del corpus, es preveu el llançament de models pre-entrenats per a detecció tant de dades sensibles com de conceptes clínics (malalties, troballes i procediments, entre altres), així com la documentació relativa al procés d'anonimització i anotació per a ajudar altres grups a usar el processament del llenguatge natural en l'àmbit sanitari.
Sobre CARMEN-I: aplicant Intel·ligència Artificial als historials clínics
CARMEN-I és un primer pas en la creació de components de Processament de Llenguatge Natural (PLN) clínics degudament documentats, avaluats i llicenciats. El Processament del Llenguatge Natural (PLN) és clau per a la millora de la qualitat assistencial i la recerca clínica. Tant professionals de l'àmbit de la salut com a investigadores es poden beneficiar de l'accés a historials clínics degudament processats, validats i adaptats per al seu estudi o anàlisi.
La qualitat dels sistemes de processament de text ha millorat en els últims anys gràcies als avanços en Intel·ligència Artificial, tècniques d'aprenentatge profund i l'ús de models de llenguatge. L'objectiu de CARMEN-I és servir com a conjunt o base de dades de salut de lliure accés que permeti l'aplicació de la Intel·ligència Artificial en salut. Martin Kralinger, investigador líder del grup de Text Mining del Barcelona Supercomputing Centre, defineix l'objectiu de CARMEN-I: "CARMEN-I vol no sols impulsar el desenvolupament tecnològic de sistemes de *PLN clínic, sinó també servir com a base tècnica per a facilitar el procés de creació de dades anonimitzades a nivell nacional i internacional, especialment per a llatinoamèrica i països amb dades en llengües romanços".
CARMEN-I estarà accessible per a investigadores i professionals de l'àmbit de la salut, juntament amb el protocol i guies d'anonimització, amb la finalitat de fomentar el desenvolupament de tecnologies del llenguatge i IA aplicades a dades clíniques i oferir unes guies i normes que serveixin per al procés d'anonimització de dades sensibles.
El debat - Anonimitzar dades i processar el llenguatge natural en l'àmbit de la salut
L'esdeveniment del dia 13 de gener abordarà dos temes principals: com s'ha creat un conjunt de dades anonimitzades com CARMEN-I i com funciona l'extracció automàtica d'informació clínica de textos. Martin Kralinger, investigador líder del grup de Text Mining del BSC, explicarà el procés d'extracció automàtica de dades clíniques i el sistema desenvolupat per a anonimitzar la informació dels informes clínics de CARMEN-I: "Aquest esdeveniment també té com a objectiu contribuir a la formació i difusió de tecnologies del llenguatge aplicades al sector de salut, tant per a l'entorn de la indústria com el sector acadèmic i experts sanitaris i investigadors".
A més, l'esdeveniment comptarà amb la ponència de Jesús Pinilla, Secretaria d'Estat de Digitalització i Intel·ligència Artificial sobre la nova economia del llenguatge en aplicacions en salut i biomedicina. La clausura de l'esdeveniment es durà a terme per Alfonso València, director de Life Sciences al BSC, Xavier Pastor, metge de l'Hospital Clínic de Barcelona i Jesús Pinilla, Secretaria d'Estat de Digitalització i Intel·ligència Artificial.
L'agenda completa de l'esdeveniment està disponible aquí.