Especialización en Estadística Aplicada

URI permanente para esta colección

Examinar

Envíos recientes

Mostrando 1 - 5 de 398
  • Ítem
    Evaluación de modelos para el pronóstico de precipitaciones en dos estaciones pluviométricas de Bogotá D.C.
    (2023-12) Bain Loayza, Johanna Carolina; González Martínez, Edwin Fernando
    Se evaluaron modelos estadísticos para el pronóstico de series temporales de dos estaciones pluviométricas de Bogotá D.C., de acuerdo a la exactitud de los modelos estocásticos y de Machine Learning; para esto se emplea la metodología de Box Jenkins, la cual permite estimar y evaluar el mejor modelo y proyección a partir de los registros iniciales, obtenidos de bases de acceso libre, y posteriormente extraída la información de las estaciones cuya homogeneidad, es decir, densidad de los datos fuese similar. Para lo cual se seleccionan dos (2) estaciones pluviométricas automáticas denominas IDEAM y CATAM, dada su localización y se obtiene que para ambas series de tiempo el mejor modelo estocástico fue el modelo SARIMA, mientras que para la estación IDEAM el mejor desempeño para Machine Learning, correspondió al modelo XGBoost, mientras que para la estación CATAM fue el modelo Elastic Net. Concluyendo de esta forma que los modelos para las proyecciones de precipitación permiten estimar de mejor forma de acuerdo con el tipo de registro y/o manipulación de la data; así mismo, se recomienda para futuras investigaciones relacionadas, explorar distintos modelos estocásticos y de Machine Learning, con el fin de buscar mayor exactitud para un conjunto de información multivariada.
  • Ítem
    Exploración de la pobreza a través de variables socioeconómicas y de calidad de vida en hogares de la ciudad de Bogotá en el 2020.
    (2023-12) Roa Ruiz, Edison Stiven; Villamil Morera,, Caren Sofia; González Martínez, Edwin Fernando
    Contexto. La pandemia de COVID-19 ha generado desafíos multifacéticos en sectores clave como la economía, la salud y el bienestar en Colombia. Propósito. Por esta razón, resulta crucial evaluar el impacto de la pandemia en el progreso de los jefes de hogar en Bogotá, cuya ciudad registró un significativo aumento en los niveles de pobreza para el año 2020. Metodología. Para el análisis, se realizan métodos estadísticos, tanto bivariados como multivariados, para explorar la correlación entre variables claves. Además, se aplica el modelo Logit y sus técnicas de balanceo para determinar cuál de estos modelos se ajusta mejor al objetivo del estudio. Resultados. Este modelo identifica, como variables que indicaban considerarse en situación de pobreza para los jefes de hogar en Bogotá durante el año 2020, fueron: la falta de empleo estable, la edad avanzada, lugar de trabajo no establecido y en otras casas, vivienda en arriendo o usufructo, la ausencia de seguridad social acceso a internet. Conclusiones. Aquellas personas con mayores ingresos, educación avanzada y personas jóvenes tenían más acceso a oportunidades laborales, lo que les llevaba a no considerarse pobres.
  • Ítem
    Estudio predictivo de condiciones médicas en personas sin hogar.
    (2023-12) Patiño Castañeda, Diego Armando; González Martínez, Edwin Fernando
    En este ejercicio, se buscó desarrollar un modelo clasificatorio para detectar casos de cáncer entre personas en situación de calle en Colombia. Se abordó el desbalance de clases mediante técnicas de submuestreo y sobremuestreo, empleando Análisis de Componentes Principales Múltiples (FAMD) para identificar variables clave. Además de las técnicas de aprendizaje automático, se consideraron los desafíos específicos de la salud en poblaciones vulnerables. Durante el modelado con Regresión Logística, Bosque Aleatorio y Gradient Boosting, se priorizó la sensibilidad para la detección de casos de cáncer. La fase de post-procesamiento incluyó la eliminación de variables asociadas para mejorar la eficiencia del modelo. Los resultados destacaron que la clasificación por Random Forest demostrando la mayor sensibilidad, al alcanzar un 61.7 % de probabilidad de detectar casos positivos de cáncer en personas en situación de calle. Este ejercicio demuestra que una base analítica procesada puede aportar en la predicción de condiciones de salud en poblaciones vulnerables como lo son los habitantes de calle que sufren de cáncer, lo cual puede representar un aporte en las estrategias de salud pública específicas para cada región.
  • Ítem
    Machine Learning para la aprobación de créditos hipotecarios en Colombia.
    (2023-12) Valderrama Cuellar, Juan Sebastián; Díaz Baquero, Edwin Alexander; González Martínez, Edwin Fernando
    En el sistema actual de servicios financieros, uno de los productos más importantes en el desarrollo de la economía es el crédito hipotecario, el cual es un crédito a mediano o largo plazo que otorgan las entidades financieras para la compra, ampliación, reparación o construcción de vivienda y cuyo objetivo es garantizar una de las necesidades básicas de la población y el buen funcionamiento de las entidades financieras. se tiene como propósito crear un modelo de Machine Learning que ayude a optimizar el proceso de aprobación de créditos hipotecarios en entidades financieras minimizando la perdida de futuros clientes que si cumplen con las características para este tipo de otorgamiento, se propone el desarrollo de un modelo automatizado que permita analizar y evaluar todas aquellas variables que contienen información de los clientes dentro de un proceso de clasificación para la aprobación de solicitudes de créditos hipotecarios. Este estudio está enfocado en revisar y analizar los factores sociodemográficos que influyen en la aprobación de créditos hipotecarios en Colombia. La investigación se llevó a cabo siguiendo un enfoque mixto (cualitativo y cuantitativo), utilizando modelos estadísticos para examinar la relación existente entre las variables sociodemográficas y la probabilidad de hacer más eficiente la selección de aprobación de créditos hipotecarios. los resultados del ejercicio destacan la importancia de establecer un modelo de Machine Learning para respaldar la toma de decisiones sobre la aprobación de solicitudes de créditos hipotecarios en entidades financieras. Este modelo beneficia a estas entidades al seleccionar clientes con ciertas características que generen valor, reduciendo la tasa de rechazo y evitando incumplimientos futuros.
  • Ítem
    Análisis de desempeño de algoritmos supervisado de machine learning en la estimación de avalúos catastrales para las UPZ 79 Calandaima y 65 Arborizadora.
    (2023-12) León Peñaloza, Camilo Andrés; González Martínez, Edwin Fernando
    Los avalúos catastrales son esenciales para el fisco y las políticas públicas. El método clásico usa regresión lineal, pero se busca mejorar con nuevas metodologías. El propósito es determina el mejor algoritmo de machine learning para avalúos masivos, evaluando Regresión Lineal Múltiple, Elastic Net, RPART y k-Nearest Neighbor. Se sigue la estructura CRISP-DM: comprensión del negocio, comprensión de datos con análisis univariados y multivariados, preparación de datos con limpieza y división en conjuntos de entrenamiento y validación. En la modelación, se estiman 6 modelos optimizados con técnicas de escalamiento, entrado y transformación. La evaluación se basa en métricas como R2, RMSE, MAPE y ρ. K-Nearest Neighbor demostró rendimiento consistente, con MAPE de 0.47% a 4.95%, R2 del 82.37% al 99.4%, y ρ entre 90.82% y 99.42%. Aunque diversos estudios resaltan el rendimiento de los modelos supervisados en términos de métricas, no es apropiado afirmar de manera categórica que estos son superiores al análisis tradicional basado en regresiones lineales.