Estudio predictivo de condiciones médicas en personas sin hogar.

dc.contributor.advisorGonzález Martínez, Edwin Fernando
dc.contributor.authorPatiño Castañeda, Diego Armando
dc.coverage.spatialColombia
dc.creator.emaildapatinoc01@libertadores.edu.co
dc.date.accessioned2024-06-14T22:57:35Z
dc.date.available2024-06-14T22:57:35Z
dc.date.issued2023-12
dc.description.abstractEn este ejercicio, se buscó desarrollar un modelo clasificatorio para detectar casos de cáncer entre personas en situación de calle en Colombia. Se abordó el desbalance de clases mediante técnicas de submuestreo y sobremuestreo, empleando Análisis de Componentes Principales Múltiples (FAMD) para identificar variables clave. Además de las técnicas de aprendizaje automático, se consideraron los desafíos específicos de la salud en poblaciones vulnerables. Durante el modelado con Regresión Logística, Bosque Aleatorio y Gradient Boosting, se priorizó la sensibilidad para la detección de casos de cáncer. La fase de post-procesamiento incluyó la eliminación de variables asociadas para mejorar la eficiencia del modelo. Los resultados destacaron que la clasificación por Random Forest demostrando la mayor sensibilidad, al alcanzar un 61.7 % de probabilidad de detectar casos positivos de cáncer en personas en situación de calle. Este ejercicio demuestra que una base analítica procesada puede aportar en la predicción de condiciones de salud en poblaciones vulnerables como lo son los habitantes de calle que sufren de cáncer, lo cual puede representar un aporte en las estrategias de salud pública específicas para cada región.spa
dc.description.abstractIn this exercise, we sought to develop a classificatory model to detect cancer cases among homeless people in Colombia. Class imbalance was addressed through subsampling and oversampling techniques, using Multiple Principal Component Analysis (FAMD) to identify key variables. In addition to machine learning techniques, specific health challenges in vulnerable populations were considered. During modeling with Logistic Regression, Random Forest and Gradient Boosting, sensitivity for cancer case detection was prioritized. The post-processing phase included the elimination of associated variables to improve model efficiency. The results highlighted that Random Forest classification demonstrated the highest sensitivity, reaching a 61.7% probability of detecting positive cancer cases in homeless people. This exercise demonstrates that a processed analytical basis can contribute to the prediction of health conditions in vulnerable populations such as street dwellers suffering from cancer, which can represent a contribution in public health strategies specific to each region.eng
dc.description.degreelevelEspecialización
dc.formatPDF
dc.identifier.urihttp://hdl.handle.net/11371/6909
dc.language.isospa
dc.rights.accessrightsOpenAccess
dc.subject.lembPoblación urbanaspa
dc.subject.lembEstadísticaspa
dc.subject.lembAnálisisspa
dc.subject.lembEstadística - Muestreospa
dc.subject.proposalCenso habitantesspa
dc.subject.proposalModelos de clasificaciónspa
dc.subject.proposalDatos de entrenamientospa
dc.subject.proposalSensibilidad en modelos clasificatoriosspa
dc.subject.proposalPopulation censuseng
dc.subject.proposalClassification modelseng
dc.subject.proposalTraining dataeng
dc.subject.proposalSensitivity in classificatory modelseng
dc.titleEstudio predictivo de condiciones médicas en personas sin hogar.spa
dc.titlePredictive study of medical conditions in homeless people.eng
dc.typebachelor thesis
Archivos