Especialización en Estadística Aplicada

URI permanente para esta colección

Examinar

Envíos recientes

Mostrando 1 - 5 de 399
  • Ítem
    El papel de la tecnología en el Sistema Socioecológico - SSE y agotamiento de la Lisa (Mugil incilis) como recurso pesquero en la Ciénaga Grande de Santa Marta en el año 2020.
    (2024-04) Ramírez Quintero, Francisco; Romero Ospina, Manuel Francisco; Sáenz Lesmes, Ross Mary
    Contexto. La CGSM es la laguna costera más grande de Colombia, con una superficie de 450 km2 y formando una red de humedales costeros. El sistema es vital por su intercambio de materia y energía con el Mar Caribe y el continente, y por sus abundantes recursos pesqueros para la comunidad local y el mercado nacional. La pesca artesanal es la principal fuente de subsistencia de al menos 30.000 personas de la zona, siendo la especie Mugil incilis (La Lisa) una de las más importantes para la pesca comercial en la CGSM. Propósito Se discute el rol de la tecnología en el Sistema Socioecológico (SSE) de la Ciénaga Grande de Santa Marta (CGSM) y el agotamiento del recurso pesquero Mugil incilis en 2020, así como, un análisis descriptivo sobre la presión pesquera ejercida y la aplicación de los métodos no paramétricos; prueba de Mann-Whitney-Wilcoxon, Chi-cuadrado Montecarlo y Correspondencias Múltiples para evaluar el impacto de las tecnologías de pesca en la dinámica del SSE. Metodología. La base de datos se obtuvo de Datos abiertos para la Captura Desembarcada de Pesca en el año 2020. Posteriormente se procedió a filtrar la base de datos por la especie de interés para lo cual se obtuve la muestra (n=8674). Con estos datos se procedió a evaluar las tres pruebas estadísticas. Resultados. La prueba Chi-cuadrado mediante simulaciones de Monte Carlo aporto un pvalor de 0.00049, lo cual sugiere que hay una asociación significativa entre la Forma de presentación y la Categoría comercial. Concomitante a lo anterior, el p-valor de la prueba de Mann-WhitneyWilcoxon fue de 6.089e-07, indicando una diferencia entre las medianas de la variable Peso (kg) entre las categorías comerciales Mediano y Pequeño. Finalmente, el Análisis de Correspondencias Múltiples logro explicar un porcentaje bajo de la variabilidad total (Dimensión 1 = 13.95% y Dimensión 2 = 9.77%). Se obtuvo claridad en cuanto a la comercialización y aprovechamiento del recurso pesquero, donde se determinó la Categoría Comercial (Revuelto) y Forma de Presentación (Entero Enhielado) como las prevalentes para 2020. Sin embargo, existe un alto grado de degradación ambiental que se refleja en una disminución percibida y observada del recurso mediante las capturas.
  • Ítem
    Evaluación de modelos para el pronóstico de precipitaciones en dos estaciones pluviométricas de Bogotá D.C.
    (2023-12) Bain Loayza, Johanna Carolina; González Martínez, Edwin Fernando
    Se evaluaron modelos estadísticos para el pronóstico de series temporales de dos estaciones pluviométricas de Bogotá D.C., de acuerdo a la exactitud de los modelos estocásticos y de Machine Learning; para esto se emplea la metodología de Box Jenkins, la cual permite estimar y evaluar el mejor modelo y proyección a partir de los registros iniciales, obtenidos de bases de acceso libre, y posteriormente extraída la información de las estaciones cuya homogeneidad, es decir, densidad de los datos fuese similar. Para lo cual se seleccionan dos (2) estaciones pluviométricas automáticas denominas IDEAM y CATAM, dada su localización y se obtiene que para ambas series de tiempo el mejor modelo estocástico fue el modelo SARIMA, mientras que para la estación IDEAM el mejor desempeño para Machine Learning, correspondió al modelo XGBoost, mientras que para la estación CATAM fue el modelo Elastic Net. Concluyendo de esta forma que los modelos para las proyecciones de precipitación permiten estimar de mejor forma de acuerdo con el tipo de registro y/o manipulación de la data; así mismo, se recomienda para futuras investigaciones relacionadas, explorar distintos modelos estocásticos y de Machine Learning, con el fin de buscar mayor exactitud para un conjunto de información multivariada.
  • Ítem
    Exploración de la pobreza a través de variables socioeconómicas y de calidad de vida en hogares de la ciudad de Bogotá en el 2020.
    (2023-12) Roa Ruiz, Edison Stiven; Villamil Morera,, Caren Sofia; González Martínez, Edwin Fernando
    Contexto. La pandemia de COVID-19 ha generado desafíos multifacéticos en sectores clave como la economía, la salud y el bienestar en Colombia. Propósito. Por esta razón, resulta crucial evaluar el impacto de la pandemia en el progreso de los jefes de hogar en Bogotá, cuya ciudad registró un significativo aumento en los niveles de pobreza para el año 2020. Metodología. Para el análisis, se realizan métodos estadísticos, tanto bivariados como multivariados, para explorar la correlación entre variables claves. Además, se aplica el modelo Logit y sus técnicas de balanceo para determinar cuál de estos modelos se ajusta mejor al objetivo del estudio. Resultados. Este modelo identifica, como variables que indicaban considerarse en situación de pobreza para los jefes de hogar en Bogotá durante el año 2020, fueron: la falta de empleo estable, la edad avanzada, lugar de trabajo no establecido y en otras casas, vivienda en arriendo o usufructo, la ausencia de seguridad social acceso a internet. Conclusiones. Aquellas personas con mayores ingresos, educación avanzada y personas jóvenes tenían más acceso a oportunidades laborales, lo que les llevaba a no considerarse pobres.
  • Ítem
    Estudio predictivo de condiciones médicas en personas sin hogar.
    (2023-12) Patiño Castañeda, Diego Armando; González Martínez, Edwin Fernando
    En este ejercicio, se buscó desarrollar un modelo clasificatorio para detectar casos de cáncer entre personas en situación de calle en Colombia. Se abordó el desbalance de clases mediante técnicas de submuestreo y sobremuestreo, empleando Análisis de Componentes Principales Múltiples (FAMD) para identificar variables clave. Además de las técnicas de aprendizaje automático, se consideraron los desafíos específicos de la salud en poblaciones vulnerables. Durante el modelado con Regresión Logística, Bosque Aleatorio y Gradient Boosting, se priorizó la sensibilidad para la detección de casos de cáncer. La fase de post-procesamiento incluyó la eliminación de variables asociadas para mejorar la eficiencia del modelo. Los resultados destacaron que la clasificación por Random Forest demostrando la mayor sensibilidad, al alcanzar un 61.7 % de probabilidad de detectar casos positivos de cáncer en personas en situación de calle. Este ejercicio demuestra que una base analítica procesada puede aportar en la predicción de condiciones de salud en poblaciones vulnerables como lo son los habitantes de calle que sufren de cáncer, lo cual puede representar un aporte en las estrategias de salud pública específicas para cada región.
  • Ítem
    Machine Learning para la aprobación de créditos hipotecarios en Colombia.
    (2023-12) Valderrama Cuellar, Juan Sebastián; Díaz Baquero, Edwin Alexander; González Martínez, Edwin Fernando
    En el sistema actual de servicios financieros, uno de los productos más importantes en el desarrollo de la economía es el crédito hipotecario, el cual es un crédito a mediano o largo plazo que otorgan las entidades financieras para la compra, ampliación, reparación o construcción de vivienda y cuyo objetivo es garantizar una de las necesidades básicas de la población y el buen funcionamiento de las entidades financieras. se tiene como propósito crear un modelo de Machine Learning que ayude a optimizar el proceso de aprobación de créditos hipotecarios en entidades financieras minimizando la perdida de futuros clientes que si cumplen con las características para este tipo de otorgamiento, se propone el desarrollo de un modelo automatizado que permita analizar y evaluar todas aquellas variables que contienen información de los clientes dentro de un proceso de clasificación para la aprobación de solicitudes de créditos hipotecarios. Este estudio está enfocado en revisar y analizar los factores sociodemográficos que influyen en la aprobación de créditos hipotecarios en Colombia. La investigación se llevó a cabo siguiendo un enfoque mixto (cualitativo y cuantitativo), utilizando modelos estadísticos para examinar la relación existente entre las variables sociodemográficas y la probabilidad de hacer más eficiente la selección de aprobación de créditos hipotecarios. los resultados del ejercicio destacan la importancia de establecer un modelo de Machine Learning para respaldar la toma de decisiones sobre la aprobación de solicitudes de créditos hipotecarios en entidades financieras. Este modelo beneficia a estas entidades al seleccionar clientes con ciertas características que generen valor, reduciendo la tasa de rechazo y evitando incumplimientos futuros.