Publication: Predicción de riesgo prioritario en pacientes con cáncer a partir de datos de morbilidad utilizando Big Data y Deep Learning en Colombia
Loading...
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Corporación Universitaria Remington
Abstract
Este proyecto de grado se centra en el cáncer en Colombia, pero no solo como una enfermedad que afecta a las personas, sino como un gran problema para la salud de todos, con diferencias importantes según dónde vivan y cómo sea su situación económica. Lo que queremos es crear un modelo que prediga quién tiene más riesgo de sufrir complicaciones, usando técnicas de Deep Learning y Big Data para clasificar a los pacientes en niveles de riesgo alto o bajo. Así, los médicos pueden dar prioridad a quienes más lo necesitan. Para lograrlo, analizamos 25,000 registros de salud del Sistema Integral de Información de la Protección Social (SISPRO). Un desafío importante es que los datos no están equilibrados, algo que suele pasar en salud pública. Para solucionarlo, usamos el algoritmo SMOTE, que nos ayuda a equilibrar la muestra y a que la red neuronal identifique bien los casos de alto riesgo, que son los menos comunes. El modelo se construye con Python, TensorFlow y Keras, y logra una precisión y una puntuación F1 del 100%. Esto demuestra que el aprendizaje profundo es muy útil para encontrar patrones complejos en los datos de salud. Después, los resultados se procesan y organizan en bases de datos SQL para analizarlos con Power BI. Las visualizaciones indican cosas muy importantes e interesantes, vemos que muchos casos de alto riesgo se concentran en las ciudades y en personas con régimen contributivo, lo que indica que hay problemas para acceder a la salud y que faltan registros en zonas rurales y en personas con seguro subsidiado. En resumen, el proyecto muestra que la ingeniería de datos y la inteligencia artificial son herramientas muy útiles para que la salud sea más justa, identificando a personas que necesitan ayuda y que no siempre son visibles, y dando información científica para que los gobiernos tomen mejores decisiones.
Description
Keywords
Big Data, Deep learning, Riesgo oncológico, Morbilidad, Redes neuronales, SMOTE, SISPRO