Estudio predictivo de condiciones médicas en personas sin hogar.

Patiño Castañeda, Diego Armando

Estudio predictivo de condiciones médicas en personas sin hogar.

dc.contributor.advisor	González Martínez, Edwin Fernando
dc.contributor.author	Patiño Castañeda, Diego Armando
dc.coverage.spatial	Colombia
dc.creator.email	dapatinoc01@libertadores.edu.co
dc.date.accessioned	2024-06-14T22:57:35Z
dc.date.available	2024-06-14T22:57:35Z
dc.date.issued	2023-12
dc.description.abstract	En este ejercicio, se buscó desarrollar un modelo clasificatorio para detectar casos de cáncer entre personas en situación de calle en Colombia. Se abordó el desbalance de clases mediante técnicas de submuestreo y sobremuestreo, empleando Análisis de Componentes Principales Múltiples (FAMD) para identificar variables clave. Además de las técnicas de aprendizaje automático, se consideraron los desafíos específicos de la salud en poblaciones vulnerables. Durante el modelado con Regresión Logística, Bosque Aleatorio y Gradient Boosting, se priorizó la sensibilidad para la detección de casos de cáncer. La fase de post-procesamiento incluyó la eliminación de variables asociadas para mejorar la eficiencia del modelo. Los resultados destacaron que la clasificación por Random Forest demostrando la mayor sensibilidad, al alcanzar un 61.7 % de probabilidad de detectar casos positivos de cáncer en personas en situación de calle. Este ejercicio demuestra que una base analítica procesada puede aportar en la predicción de condiciones de salud en poblaciones vulnerables como lo son los habitantes de calle que sufren de cáncer, lo cual puede representar un aporte en las estrategias de salud pública específicas para cada región.	spa
dc.description.abstract	In this exercise, we sought to develop a classificatory model to detect cancer cases among homeless people in Colombia. Class imbalance was addressed through subsampling and oversampling techniques, using Multiple Principal Component Analysis (FAMD) to identify key variables. In addition to machine learning techniques, specific health challenges in vulnerable populations were considered. During modeling with Logistic Regression, Random Forest and Gradient Boosting, sensitivity for cancer case detection was prioritized. The post-processing phase included the elimination of associated variables to improve model efficiency. The results highlighted that Random Forest classification demonstrated the highest sensitivity, reaching a 61.7% probability of detecting positive cancer cases in homeless people. This exercise demonstrates that a processed analytical basis can contribute to the prediction of health conditions in vulnerable populations such as street dwellers suffering from cancer, which can represent a contribution in public health strategies specific to each region.	eng
dc.description.degreelevel	Especialización
dc.format	PDF
dc.identifier.uri	http://hdl.handle.net/11371/6909
dc.language.iso	spa
dc.rights.accessrights	OpenAccess
dc.subject.lemb	Población urbana	spa
dc.subject.lemb	Estadística	spa
dc.subject.lemb	Análisis	spa
dc.subject.lemb	Estadística - Muestreo	spa
dc.subject.proposal	Censo habitantes	spa
dc.subject.proposal	Modelos de clasificación	spa
dc.subject.proposal	Datos de entrenamiento	spa
dc.subject.proposal	Sensibilidad en modelos clasificatorios	spa
dc.subject.proposal	Population census	eng
dc.subject.proposal	Classification models	eng
dc.subject.proposal	Training data	eng
dc.subject.proposal	Sensitivity in classificatory models	eng
dc.title	Estudio predictivo de condiciones médicas en personas sin hogar.	spa
dc.title	Predictive study of medical conditions in homeless people.	eng
dc.type	bachelor thesis

Colecciones

Especialización en Estadística Aplicada

Estudio predictivo de condiciones médicas en personas sin hogar.

Archivos

Colecciones