Description
Los datos ómicos, heterogéneos, interconectados, a nivel de sistemas, están cada vez más disponibles y se aplican en la medicina de precisión. Buscamos estratificar mejor a los pacientes en grupos de riesgo, descubrir nuevos biomarcadores para enfermedades, personalizar tratamientos médicos y reutilizar medicamentos conocidos para diferentes grupos de pacientes. Necesitamos nuevos métodos de minería de datos para lograr mejores resultados, mejorando los actuales algoritmos de minería de datos.
El proyecto está motivado por los desafíos del Covid-19, junto con el éxito de la ciencia de redes, la inteligencia artificial (IA) basada en latrifactorización de matrices no negativas (TMNN) y los métodos de incrustación de datos para el análisis y la fusión de datos ómicos heterogéneos en biomedicina. Un avance cualitativo requiere el desarrollo de nuevos métodos debido a la actual creciente cantidad dedatos y su diversidad. La investigación hasta el momento se limita a variantes especiales de estos métodos y sus aplicaciones. Proponemos aplicar nuestros métodos a enfermedades hasta ahora incurables, incluido el Covid-19, la enfermedad de Parkinson y el cáncer.
Proponemos lo siguiente:
- Enfoque centrado en funciones biológicas para incorporar datos de redes ómicas, con el objetivo de complementar el conocimiento obtenido a partir de enfoques de incrustación centrados en genes, descubrir nuevas funciones biológicas relacionadas con el cáncer y nuevos genes.
- Un método para cambiar la exploración del espacio de incrustación de genes partiendo de los vectores de incrustación de genes hasta la base (ejes) del espacio. Esto es para desentrañar la información biológica del espacio al imponer y utilizar la ortonormalidad de la base del espacio de incrustación, habilitado por un algoritmo de incrustación basado en TMNN. Proponemos aplicar nuestros métodos para obtener información sobre la historia evolutiva humana.
- Un método para determinar la dimensionalidad óptima de los espacios de incrustación de varios tipos de datos de redes ómicas, sobre varias especies. La pregunta es si es la complejidad de la especie o el tipo de datos ómicos, lo que determina la dimensionalidad óptima.