Estudio predictivo de condiciones médicas en personas sin hogar.
dc.contributor.advisor | González Martínez, Edwin Fernando | |
dc.contributor.author | Patiño Castañeda, Diego Armando | |
dc.coverage.spatial | Colombia | |
dc.creator.email | dapatinoc01@libertadores.edu.co | |
dc.date.accessioned | 2024-06-14T22:57:35Z | |
dc.date.available | 2024-06-14T22:57:35Z | |
dc.date.issued | 2023-12 | |
dc.description.abstract | En este ejercicio, se buscó desarrollar un modelo clasificatorio para detectar casos de cáncer entre personas en situación de calle en Colombia. Se abordó el desbalance de clases mediante técnicas de submuestreo y sobremuestreo, empleando Análisis de Componentes Principales Múltiples (FAMD) para identificar variables clave. Además de las técnicas de aprendizaje automático, se consideraron los desafíos específicos de la salud en poblaciones vulnerables. Durante el modelado con Regresión Logística, Bosque Aleatorio y Gradient Boosting, se priorizó la sensibilidad para la detección de casos de cáncer. La fase de post-procesamiento incluyó la eliminación de variables asociadas para mejorar la eficiencia del modelo. Los resultados destacaron que la clasificación por Random Forest demostrando la mayor sensibilidad, al alcanzar un 61.7 % de probabilidad de detectar casos positivos de cáncer en personas en situación de calle. Este ejercicio demuestra que una base analítica procesada puede aportar en la predicción de condiciones de salud en poblaciones vulnerables como lo son los habitantes de calle que sufren de cáncer, lo cual puede representar un aporte en las estrategias de salud pública específicas para cada región. | spa |
dc.description.abstract | In this exercise, we sought to develop a classificatory model to detect cancer cases among homeless people in Colombia. Class imbalance was addressed through subsampling and oversampling techniques, using Multiple Principal Component Analysis (FAMD) to identify key variables. In addition to machine learning techniques, specific health challenges in vulnerable populations were considered. During modeling with Logistic Regression, Random Forest and Gradient Boosting, sensitivity for cancer case detection was prioritized. The post-processing phase included the elimination of associated variables to improve model efficiency. The results highlighted that Random Forest classification demonstrated the highest sensitivity, reaching a 61.7% probability of detecting positive cancer cases in homeless people. This exercise demonstrates that a processed analytical basis can contribute to the prediction of health conditions in vulnerable populations such as street dwellers suffering from cancer, which can represent a contribution in public health strategies specific to each region. | eng |
dc.description.degreelevel | Especialización | |
dc.format | ||
dc.identifier.uri | http://hdl.handle.net/11371/6909 | |
dc.language.iso | spa | |
dc.rights.accessrights | OpenAccess | |
dc.subject.lemb | Población urbana | spa |
dc.subject.lemb | Estadística | spa |
dc.subject.lemb | Análisis | spa |
dc.subject.lemb | Estadística - Muestreo | spa |
dc.subject.proposal | Censo habitantes | spa |
dc.subject.proposal | Modelos de clasificación | spa |
dc.subject.proposal | Datos de entrenamiento | spa |
dc.subject.proposal | Sensibilidad en modelos clasificatorios | spa |
dc.subject.proposal | Population census | eng |
dc.subject.proposal | Classification models | eng |
dc.subject.proposal | Training data | eng |
dc.subject.proposal | Sensitivity in classificatory models | eng |
dc.title | Estudio predictivo de condiciones médicas en personas sin hogar. | spa |
dc.title | Predictive study of medical conditions in homeless people. | eng |
dc.type | bachelor thesis |