Este caso de uso se ha realizado con Procesamiento del Lenguaje Natural y se enmarca en el Plan de Impulso de Tecnologías del Lenguaje.
El grupo de Procesamiento Natural del Lenguaje en el departamento CASE del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) ha desarrollado un prototipo de clasificación automática de mutaciones genéticas para procesos tumorales a partir de informes clínicos.
La clasificación se realizada después de entrenar al prototipo automáticamente con artículos clínicos obtenidos del Memorial Sloan Kettering Cancer Center (MSKCC). La función de este prototipo es ayudar a los patólogos a distinguir cuáles de las muchas mutaciones genéticas que tienen sus pacientes pueden contribuir al crecimiento de tumores, una labor que actualmente se lleva a cabo de forma manual, y requiere mucho tiempo, ya que habitualmente la secuenciación genética de un tumor de cáncer presenta miles de mutaciones y la inmensa mayoría son neutrales para la enfermedad.
El prototipo se entrena mediante técnicas de Procesamiento del Lenguaje Natural, campo de la inteligencia artificial que se ocupa de programar a los ordenadores para que procesen y analicen grandes cantidades de información en lenguaje natural.
El desarrollo de este prototipo se ha realizado en el marco del Plan de Impulso de Tecnologías del Lenguaje (Plan TL) de la Secretaría de Estado para el Avance Digital (SEAD), y ha servido de punto de partida para definir flujos de procesamiento de lenguaje natural básicos, que se implementarán en la plataforma del Plan TL.
Este prototipo busca demostrar que un usuario que no esté familiarizado con las tecnologías del lenguaje puede utilizar fácilmente estas tecnologías para llevar a cabo tareas complejas.