Especialización en Estadística Aplicada

URI permanente para esta colecciónhttp://hdl.handle.net/11371/6011

Examinar

Envíos recientes

Mostrando 1 - 20 de 48
  • Ítem
    2025-12
    Revisión psicométrica de la Escala de Ansiedad por Estándares de Belleza en Redes Sociales (EAEB-RS
    Guativa Torres, Julián Andrés; Rubriche, Juan Carlos
    En la era digital, las redes sociales se han consolidado como espacios centrales de socialización, expresión y construcción de identidad en mujeres jóvenes. En estos entornos, la exposición continua a estándares de belleza idealizados promueve comparaciones sociales ascendentes que pueden derivar en ansiedad, baja autoestima e insatisfacción corporal. La Escala de Ansiedad por Estándares de Belleza en Redes Sociales (EAEB-RS) surge como un intento de medir este malestar específico asociado a los ideales estéticos digitales. Propósito. El objetivo de este estudio fue analizar las propiedades psicométricas de la EAEB-RS en una muestra de mujeres jóvenes adultas de Bogotá, evaluando su confiabilidad, validez de constructo y funcionamiento de los ítems bajo modelos de Teoría Clásica de los Tests (TCT), Análisis Factorial Exploratorio (AFE) y Teoría de Respuesta al Ítem (TRI). Metodología. Se aplicó la EAEB-RS a 87 mujeres entre 18 y 30 años, usuarias activas de redes sociales. Se estimó la consistencia interna mediante alfa de Cronbach, se realizó un AFE con correlaciones policóricas y rotación oblicua para explorar la estructura latente, y se ajustaron Modelos de Respuesta Graduada (GRM) unidimensionales para el puntaje total y por subescalas, evaluando parámetros de discriminación, umbrales de categoría, funciones de información y dependencia local. Resultados. La escala mostró una confiabilidad muy alta para el puntaje total (α = ,94), con discriminaciones ítem–total corregidas elevadas y dificultades tendientes a la zona difícil. El AFE indicó una estructura bidimensional correlacionada (dos factores, varianza total explicada ≈ 58,5%, correlación interfactor Φ ≈ ,63). El GRM unidimensional global ajustó mejor que el modelo bidimensional en términos de AIC y BIC, evidenciando una escala esencialmente unidimensional a nivel de puntaje total, con dos clústeres de ítems que pueden interpretarse como subdimensiones. Las curvas características de los ítems mostraron umbrales ordenados y pendientes diferenciadas, y las funciones de información del test indicaron máxima precisión en niveles medios del rasgo. Conclusiones. Los resultados apoyan que la EAEB-RS es un instrumento válido y fiable para medir la ansiedad asociada a estándares de belleza en redes sociales en mujeres jóvenes. Se recomienda conservar la mayoría de los ítems, revisar aquellos con cargas cruzadas o baja discriminación y gestionar la dependencia local entre pares muy redundantes, así como continuar la validación en muestras más amplias y diversas.
  • Ítem
    2025-12
    Pronóstico del Índice de Producción Industrial del sector de extracción de petróleo crudo y gas natural en Colombia mediante modelos ARIMA y BSTS
    Ruiz Solarte , Diego Fernando; Heivar Yesid Rodríguez Pinzón
    El Índice de Producción Industrial (IPI) del sector de extracción de petróleo crudo y gas natural representa el 15% del IPI total colombiano y ha exhibido alta volatilidad histórica ante choques internacionales como la caída de precios de 2014-2015 y la pandemia de COVID-19. En junio de 2025, el sector registró una variación anual de −5.9%, evidenciando una tendencia contractiva sostenida. Este contexto hace fundamental la disponibilidad de modelos de pronóstico precisos para anticipar el comportamiento del sector e informar la planificación fiscal y decisiones de inversión. Propósito. Este trabajo desarrolla modelos de pronóstico para el Índice de Producción Industrial del sector de extracción de petróleo crudo y gas natural en Colombia. Metodología. Se utilizan datos mensuales del DANE para el periodo de enero de 2014 a junio de 2025. Se implementan dos enfoques metodológicos: (i) modelos ARIMA mediante la metodología Box-Jenkins y (ii) modelos bayesianos de series temporales estructurales (BSTS). Resultados. Los pronósticos a 6 meses de ambos modelos confirman una contracción estructural persistente del sector, con niveles de producción proyectados aproximadamente 12-14% por debajo del promedio histórico y sin señales de recuperación en el corto plazo. Conclusiones. Estos hallazgos tienen implicaciones importantes para la formulación de política económica, planificación presupuestal y toma de decisiones de inversión en el sector extractivo colombiano.
  • Ítem
    2025-12
    Segmentación del Apetito de Riesgo en la Colocación de Créditos de Vivienda a través de Aprendizaje no supervisado (Clustering)
    Preciado Lozano Alba Milena; Alejandro Duitama Leal
    El crédito hipotecario en Colombia es un instrumento esencial para la adquisición de vivienda, ofrecido en modalidades como préstamos en pesos, indexados a la UVR y esquemas de leasing habitacional, según el tipo de inmueble y las condiciones de financiación. Ante la desaceleración del sector de la construcción y la transformación del sistema financiero, las entidades han implementado estrategias innovadoras para conservar competitividad y ampliar su participación en el mercado. Propósito. El estudio analiza el apetito de riesgo de las entidades financieras colombianas en créditos hipotecarios mediante técnicas de machine learning no supervisado, que permiten identificar patrones de comportamiento más allá de la estadística tradicional . Metodología. El análisis se realizó con la metodología CRISPDM, implementada en Python mediante Jupyter Notebook, aplicando técnicas de machine learning no supervisado especialmente clustering sobre 266.375 registros de créditos hipotecarios con variables clave como monto, tasa de interés, plazo y tipo de entidad. Resultados. La aplicación de Mean Shift identificó seis clústeres en créditos de vivienda, evidenciando la relación entre montos, plazos y tasas de interés en el apetito de riesgo de las entidades financieras. Estos hallazgos muestran una marcada concentración de operaciones en los bancos y destacan el valor del clustering como herramienta para segmentar el mercado y orientar decisiones estratégicas en la oferta de productos financieros Conclusiones.El estudio confirmó la utilidad del machine learning no supervisado para identificar patrones en créditos hipotecarios, destacando la concentración bancaria y el valor del clustering para diseñar estrategias competitivas.
  • Ítem
    2025
    Identificación de consumos de agua potable anomalos a partir de modelos de clústeres, casos asociados al área urbana del municipio Toledo del departamento Norte de Santander - Colombia. 30 Noviembre 2025
    Chimá Perez Pedro Angel; Villacorte Arias Brandon Javier; Alejandro Duitama Leal
    El acceso adecuado al agua potable es crucial para el bienestar y la sostenibilidad. En Colombia, la gestión del recurso hídrico se ha vuelto más relevante debido al crecimiento poblacional y la variabilidad climática. Esta investigación se centra en el municipio de Toledo, Norte de Santander, utilizando datos de consumo de agua registrados durante un año, complementados con variables socioeconómicas para enriquecer el análisis. Propósito. El objetivo de esta investigación es analizar los patrones de consumo de agua en Toledo, utilizando técnicas de análisis de clústeres para identificar y segmentar a los usuarios según su comportamiento y características socioeconómicas. Se busca entender cómo el estrato socioeconómico y el consumo mensual influyen en la eficiencia del uso del recurso y proporcionar herramientas para mejorar la gestión del agua, identificando grupos de alto consumo y estrategias de reducción de pérdidas. Metodología. Se adopta un enfoque cuantitativo y descriptivo, analizando patrones de consumo mediante técnicas de análisis de clústeres. Se utiliza una muestra de datos estratificados de hogares, representando diferentes estratos socioeconómicos. Se aplican diversos métodos de clustering, como K-Means, GMM, y técnicas basadas en densidad y jerarquía. La calidad de los clústeres se evalúa con métricas como Silhouette y Calinski-Harabasz, y se proponen recomendaciones prácticas para optimizar la gestión del agua en el municipio. Resultados. Los resultados mostraron una gran diversidad en los patrones de consumo, permitiendo segmentar a los usuarios en grupos de bajo, medio y alto consumo. Los modelos K-Means y GMM fueron los más robustos, destacándose en las métricas de validación. El análisis de clústeres ayudó a identificar patrones atípicos y anómalos, lo que proporciona una base sólida para estrategias de gestión más eficientes y dirigidas. Conclusiones. Tras evaluar varios algoritmos de clustering, el modelo K-Means fue el más óptimo para la segmentación de patrones de consumo. El Clúster 2, con variabilidad extrema en los consumos, es prioritario para inspecciones y monitoreo. Las partes interesadas deben desarrollar estrategias de gestión de la demanda dirigidas, implementar un plan de detección de anomalías y optimizar la distribución del agua.
  • Ítem
    2025-12
    Informalidad laboral: un análisis predictivo para Colombia
    Villamil Argota Aquiles Segundo; Alejandro Duitama Leal
    La informalidad laboral sigue siendo un desafío estructural en Colombia y afecta a más de la mitad de los ocupados, con fuertes heterogeneidades por educación, territorio y posición ocupacional. Propósito. Este estudio desarrolla un modelo predictivo de la probabilidad de informalidad, con el fin de mejorar la identificación de trabajadores en riesgo y aportar herramientas para el análisis del mercado laboral. Metodología. Se emplean microdatos de la GEIH 2024 y técnicas de aprendizaje supervisado con preprocesamiento automatizado, validación cruzada estratificada y evaluación externa en conjuntos independientes. Se comparan múltiples algoritmos y se incorpora la actividad económica (CIIU) como predictor adicional. Resultados. Los modelos basados en árboles potenciados alcanzan el mejor desempeño (accuracy ≈ 0,89, AUC > 0,95), con mejoras adicionales al incluir la actividad económica. El modelo muestra estabilidad entre entrenamiento, validación y prueba. Conclusiones. Los métodos no paramétricos resultan adecuados para capturar la complejidad de la informalidad laboral y superan a los enfoques econométricos tradicionales. La actividad económica aporta información predictiva relevante para apoyar decisiones de política laboral.
  • Ítem
    2025-12
    Segmentación de clientes en una aseguradora mediante clustering para fortalecimiento del SARLAFT
    Mojica Torres Dirley Astrid; Delgadillo Flórez Jorge Augusto; Alejandro Duitama Leal
    La segmentación de clientes es un componente clave del SARLAFT en entidades vigiladas, pues permite definir perfiles financieros comparables y detectar comportamientos inusuales. No obstante, los enfoques basados en reglas estáticas son limitados por la alta heterogeneidad y asimetría de los datos financieros en aseguradoras. Propósito. Construir una segmentación cuantitativa y reproducible de clientes de una aseguradora mediante técnicas de clustering no supervisado, que aporte a la identificación de perfiles homogéneos de riesgo y grupos minoritarios atípicos relevantes para priorización de controles SARLAFT. Metodología. Se trabajó con 280.545 clientes y cinco variables críticas: tipo de persona, ingresos, egresos, activos y pasivos. Los datos se limpiaron, codificaron y estandarizaron (zscore). Se implementaron nueve algoritmos de clustering en Python, evaluados con Silhouette, Calinski–Harabasz y Davies–Bouldin; se seleccionó K-Means por interpretabilidad operativa.Se usó PCA para visualización 2D y gráficos de caja y mapa para caracterización. Los perfiles tipo radar no se emplearon en la interpretación final debido a la alta asimetría y presencia de valores extremos en variables monetarias. Resultados. K-Means identificó cuatro clústeres con distribución altamente asimétrica: los clústeres 0 y 2 concentran el 99,95% de los clientes (materialidad media y alta típica, respectivamente), mientras que los clústeres 1 (0,05 %) y 3 (4 casos) corresponden a segmentos extremos de magnitud transaccional/patrimonial extraordinaria. El clúster 3 concentra los valores máximos de activos y pasivos, priorizando EDD en SARLAFT. Conclusiones. La segmentación basada en clustering permite establecer líneas base financieras diferenciadas, mejora la detección temprana de desviaciones y fortalece el diseño de umbrales SARLAFT; la detección de grupos extremos aporta a la priorización de monitoreo y debida diligencia intensificada
  • Ítem
    2025-12
    Desarrollo de un modelo predictivo basado en factores clínicos para estimar la probabilidad de éxito del destete ventilatorio en pacientes pediátricos
    De la Rosa Caldas Mayerli; Palacios Vargas Esperanza Margarita; Alejandro Duitama Leal
    El destete ventilatorio en pediatría es un proceso complejo, cuyo fracaso incrementa la morbilidad y prolonga la estancia en UCI. A pesar de su relevancia clínica, aún no existe un método estandarizado para predecir su éxito. Este estudio tuvo como objetivo identificar los factores clínicos asociados al éxito del destete y desarrollar un modelo predictivo que estime su probabilidad. Metodología. Se llevó a cabo un estudio retrospectivo con 213 pacientes pediátricos. Se entrenaron múltiples modelos de aprendizaje automático mediante PyCaret y Scikit-learn, evaluando su rendimiento con métricas clásicas de clasificación. Resultados. Los modelos CatBoost, Extra Trees y K Neighbors Classifier mostraron los mejores desempeños, con valores de AUC superiores a 0.92 y métricas consistentes entre clases, destacándose CatBoost como el modelo final seleccionado. Conclusiones. Los hallazgos evidencian que los modelos de machine learning pueden apoyar la toma de decisiones clínicas al identificar patrones asociados al éxito del destete ventilatorio pediátrico.
  • Ítem
    2025-12
    Modelo de predicción del PIB per cápita: Un Enfoque Basado en Técnicas de Machine Learning Supervisado
    Ardila Morales Julio César; Díaz Puello Luis Manue; Alejandro Duitama Leal
    La mayoría de los gobiernos utilizan el Producto Interno Bruto (PIB) per cápita como indicador de desarrollo económico y social, dado que este permite analizar las dinámicas estructurales de sus economías. Este trabajo se centra en la aplicación de técnicas de machine learning supervisado para evaluar distintos modelos y seleccionar aquel que ofrezca el mejor desempeño en la predicción de este indicador. Para este estudio se utilizó una base de datos abierta con variables macroeconómicas relevantes, tales como la balanza de cuenta corriente, el ingreso nacional bruto, el PIB, el gasto del gobierno, el ingreso fiscal, el ingreso del gobierno, la tasa de desempleo, la inflación y el IPC, entre otras. La investigación incorpora la preparación de los datos, la evaluación de diversos modelos mediante PyCaret y la selección de un modelo óptimo para la predicción. El modelo con mejor rendimiento fue el Extra Trees Regressor, que alcanzó las mejores métricas en el entrenamiento, la validación y la evaluación. Los resultados vislumbran alternativas para la predicción del PIB per cápita con herramientas de machine learning, permiten interpretar el comportamiento de variables determinantes en el desarrollo económico y ofrecen un marco metodológico para trabajos académicos futuros.
  • Ítem
    2024-12
    Evaluación comparativa de modelos de Machine Learning para la predicción del riesgo de enfermedad cardiovascular a partir de hábitos de vida y características físicas
    Jonathan Escobar Cifuentes; Angélica María Florez Mendoza; Alejandro Duitama Leal
    Las enfermedades cardiovasculares siguen siendo una de las principales causas de muerte, y su predicción temprana puede apoyarse en técnicas de machine learning aplicadas a datos de hábitos de vida y condiciones físicas. Propósito. Evaluar y comparar el desempeño de varios algoritmos de machine learning para predecir la enfermedad cardiovascular. Metodología. Se analizó el Health Activity Dataset (1000 individuos) mediante cinco modelos supervisados implementados en Python: K-Nearest Neighbors (KNN), Árbol de Decisión, Random Forest, Support Vector Machine (SVM) y Red Neuronal Artificial (MLP). El conjunto de datos fue balanceado mediante bootstrapping (60–40) y dividido en entrenamiento y prueba (70–30). Se aplicó validación cruzada de cinco pliegues y optimización de hiperparámetros mediante GridSearchCV, con estandarización de variables para los modelos sensibles a escala. Resultados. El modelo Random Forest obtuvo el mejor desempeño (exactitud 99.1 %, F1-score 0.989, AUC = 0.996), superando a los demás algoritmos. El Árbol de Decisión y el SVM alcanzaron resultados competitivos, mientras que KNN y la Red Neuronal mostraron rendimientos moderados. Las variables más influyentes en la predicción fueron la ingesta calórica, el índice de masa corporal, la presión sistólica y la actividad física diaria. Conclusiones. El modelo Random Forest se consolida como la alternativa más robusta y precisa para la predicción del riesgo cardiovascular, destacando el potencial del machine learning como herramienta de apoyo en la toma de decisiones clínicas y en estrategias preventivas de salud pública.
  • Ítem
    2025-12
    Evaluación del Algoritmo K-Modes en Datos de Encuestas Multinacionales: Implicaciones para la Segmentación Actitudinal
    Rodríguez Oyola, Anderson Andrés; Espinosa Sarmiento, Santiago; Villarraga Palomino, Jesús Antonio
    Contexto. La necesidad de comprender la compleja fragmentación de la ciudadanía latinoamericana ha impulsado la búsqueda de técnicas avanzadas de Machine Learning sobre encuestas. Propósito. El propósito de esta investigación fue evaluar la viabilidad del algoritmo K-Modes para identificar y caracterizar segmentos actitudinales robustos a partir de datos categóricos multivariantes. Metodología. La metodología adoptó el estándar CRISP-DM (Shearer, 2000). Se utilizó un conjunto de 19.205 registros categóricos de encuestas de 17 países. Para la segmentación, se aplicó el algoritmo K-Modes (Huang, 1998) con el objetivo de generar una tipología de K=6 perfiles. Resultados. Los resultados revelaron que, si bien la prueba χ2 confirmó diferencias modales entre los seis centroides, el análisis de validación interna proporcionó una evidencia cuantitativa crucial para la toma de decisiones metodológicas. El Índice de Silueta de 0,07 establece claramente que la granularidad de las actitudes políticas latinoamericanas introduce un solapamiento estructural significativo. Este hallazgo, por lo tanto, no invalida el estudio, sino que justifica plenamente la reorientación de la investigación hacia el uso de algoritmos más avanzados que puedan modelar estructuras de datos con límites menos definidos.Conclusiones. La evaluación rigurosa del algoritmo K-Modes proporciona una base empírica sólida para definir el alcance de las técnicas puramente categóricas en el estudio de las actitudes políticas complejas. Este hallazgo impulsa una reorientación necesaria y constructiva en la agenda de investigación. De acuerdo con estos resultados, la dirección futura debe enfocarse en la migración estratégica hacia modelos híbridos de clustering (como K-Prototypes) o la exploración de enfoques avanzados basados en la teoría de grafos, capitalizando las fortalezas de la ciencia de datos para modelar estructuras de alta dimensionalidad con ambigüedad inherente
  • Ítem
    2025-06
    Comparación de la metodología analítica para el análisis de los estupefacientes Cocaína, Heroína y Morfina mediante Cromatografía de Gases con Hidrógeno y Helio como gases portadores
    Arias, César Augusto; Eraso López, Luis Ángel; Romero Ospina, Manuel Francisco
    El presente trabajo comparó dos metodologías analíticas usadas para la identificación de los estupefacientes cocaína, heroína y morfina mediante cromatografía de gases acoplada a espectrometría de masas (CG-EM) en dos equipos; uno de ellos con gas helio y otro con gas hidrógeno como gases portadores de la muestra a analizar. Se evaluó el impacto de ambos sistemas cromatográficos en parámetros claves como el tiempo de retención (TR), área y resolución, concentración y analistas del laboratorio. El estudio aplica diversas pruebas estadísticas, incluyendo ANOVA, Kruskal-Wallis, Levene, Shapiro-Wilk, Tukey y Dunn, además de técnicas multivariadas como PCA y MCA para examinar la estructura de los datos y conocer la tendencia en su distribución. Las muestras objeto del análisis corresponden a muestras de cocaína, heroína y morfina analizadas en el laboratorio de estupefacientes del Instituto Nacional de Medicina Legal y Ciencias Forenses con sede en la ciudad de Cali.
  • Ítem
    2025-06
    Influencia de la educación y la experiencia laboral en la empleabilidad juvenil en Colombia: Un análisis mediante diseño factorial 2 k
    Contreras Cubides, Mariana; Romero Ospina, Manuel Francisco
    Contexto.El desempleo juvenil en Colombia es un problema persistente que evidencia la falta de políticas adecuadas para su mitigación. Propósito. En este contexto, el análisis de factores como la educación y la experiencia laboral resulta clave para comprender su impacto en la inserción laboral y para garantizar condiciones laborales favorables. Metodología. Para abordar esta problemática, se emplearon datos de la GEIH correspondientes al primer trimestre de 2025, aplicando un diseño factorial 2k con tres factores: nivel educativo alcanzado, experiencia laboral medida en meses trabajados durante el último año, y actividad principal, que permitió distinguir entre personas que se encontraban laborando y aquellas en búsqueda activa de empleo, considerando únicamente la población joven.Resultados. Los resultados mostraron que la educación tiene el mayor efecto individual sobre los ingresos, efecto que se incrementa al interactuar con la experiencia laboral y la actividad laboral. Aunque algunas interacciones no alcanzaron significancia estadística, se identificaron patrones relevantes que aportan una visión más completa sobre la inserción laboral juvenil en el país. Conclusiones. De acuerdo con estos hallazgos, se considera necesario fortalecer el acceso a la educación y promover programas que faciliten la adquisición temprana de experiencia laboral como estrategias efectivas para mejorar la empleabilidad y los ingresos de los jóvenes. Asimismo, se recomienda la incorporación de modelos estadísticos más flexibles en futuras investigaciones, con el fin de profundizar en el análisis de la realidad del empleo juvenil.
  • Ítem
    2025-06
    Análisis del rendimiento académico en pruebas Saber 11° mediante un diseño factorial: influencia del estrato y naturaleza del colegio
    Ramos Sarmiento, Heyma Manuela; Romero Ospina, Manuel Francisco, Salamanca Bernal, Julián Andrés
    Este estudio evalúa el efecto del estrato socioeconómico y el tipo de colegio sobre el puntaje global en las pruebas Saber 11 – 2020-1, utilizando un diseño factorial 2k aplicado a una muestra del departamento de Cundinamarca. A través de un modelo ANOVA con interacción, se encontró efectos significativos tanto del estrato como del tipo de institución, así como una interacción entre ambos factores. Los estudiantes de estrato alto en colegios privados obtuvieron los mejores resultados, mientras que los de estrato bajo en colegios públicos registraron los puntajes más bajos. Las pruebas post hoc y los gráficos de interacción confirmaron diferencias sustanciales entre los grupos. Se concluye que las condiciones socioeconómicas y educativas influyen de manera conjunta sobre el rendimiento académico, lo que expone la necesidad de políticas públicas orientadas a la equidad educativa.
  • Ítem
    2025-06
    Calidad de vida en pacientes con trastornos por abuso de sustancias psicoactivas, Bogotá D.C, Colombia
    Santos Yate, Jefersson David; Romero Ospina, Manuel Francisco
    Contexto: El consumo de sustancias psicoactivas (SPA) ha aumentado de forma alarmante en Colombia, afectando especialmente a jóvenes de sectores vulnerables de Bogotá. Esta situación se agrava por factores sociales, económicos y de salud mental, que deterioran su calidad de vida y dificultan el acceso a servicios de tratamiento, pese a la existencia de políticas públicas. Propósito: El estudio tuvo como objetivo evaluar la calidad de vida en jóvenes entre 18 y 35 años diagnosticados con trastorno por consumo de SPA, atendidos en una institución pública de salud en Bogotá. Además, buscó identificar los factores que más afectan sus condiciones de vida para orientar estrategias de intervención efectivas. Metodología: Se realizó un estudio observacional analítico de corte transversal con 250 participantes. Se aplicaron cuestionarios estructurados para la caracterización sociodemográfica y clínica, junto con la escala WHOQOL-BREF para evaluar la calidad de vida en sus dimensiones física, psicológica, social y ambiental. Se usaron pruebas de diferencia de medias para comparar puntajes según el tipo de SPA consumida.Resultados: El cannabis, el tabaco y el alcohol fueron las sustancias más consumidas. Se encontraron diferencias significativas en los puntajes de calidad de vida, especialmente en los dominios psicológico y social, entre consumidores de cannabis frente a otras SPA. Factores como el apoyo familiar, la interferencia en actividades diarias y enfermedades asociadas mostraron alto impacto. Conclusiones: Se evidencia la necesidad de implementar intervenciones integrales y diferenciadas, con enfoque psicosocial, familiar y comunitario, que mejoren la calidad de vida de esta población vulnerable.
  • Ítem
    2025-06
    Diseño de Experimentos a partir de la Encuesta Multipropósito 2021 con una muestra de la Sabana Occidente de Bogotá
    García Herrera, Sandra Yanneth; Romero Ospina, Manuel Francisco
    El área metropolitana de Bogotá caracterizada por una alta expansión urbana por su cercanía y funcionalidad con Bogotá, resulta una zona relevante para estudiar fenómenos socio económicos. Este estudio tuvo como propósito realizar una clusterización de la población estudiada a través de un diseño de experimentos evaluando los patrones de las variables de mayor representación. Para ello se tomaron los datos de la Encuesta Multipropósito Bogotá - Cundinamarca 2021 y se realizó un Muestreo Aleatorio Simple, un análisis exploratorio para ver distribución y relación de variables de interés, un Análisis Multivariado de Componentes y se evaluaron las contribuciones y supuestos del modelo luego de establecer distribución no paramétrica. Se obtuvo un diseño con 3 cluster diferenciados principalmente por ingresos, nivel escolar y ocupación encontrando que la población de ingresos bajos extremo tiene correlación con baja escolaridad, mujeres y ocupación en oficios del hogar, incapacitados permanentes y desempleados.
  • Ítem
    2025-06
    Evaluación de residuos de plaguicidas en alimentos de Colombia y su riesgo en la salud, mediante análisis de correspondencia múltiple (MCA) y diseño factorial 2 k
    Ladino Montañez, Yhon Jairo; Salamanca Bernal, Julián Andrés; Romero Ospina, Manuel Francisco
    El presente estudio se enfoca en analizar si los alimentos en Colombia presentan niveles de residuos de plaguicidas que superan los Límites Máximos Permitidos (LMR), y en evaluar el riesgo que esto representa para la salud de niños y adultos. Para comenzar, se hizo un análisis exploratorio con el fin de identificar las variables más relevantes, las cuales sirvieron como base para aplicar un Análisis de Correspondencias Múltiples (MCA). Esta técnica permitió establecer relaciones entre el índice de riesgo para la salud (HI) y distintas variables cualitativas del conjunto de datos. Luego, se utilizó un Diseño de Bloques Aleatorios (DBA) para analizar cómo varía el indicador de riesgo (HI) y determinar qué factores tienen un impacto significativo en su comportamiento. El análisis estadístico se llevó a cabo utilizando RStudio, apoyándonos en paquetes como FactoMineR, ggplot2 y FrF2 para procesar, visualizar e interpretar los datos. Los resultados mostraron que el 22,7 % de las muestras analizadas superaron los Límites Máximos de Residuos (LMR), siendo los departamentos de Cundinamarca, Boyacá y Antioquia algunos de los más representativos en cuanto a estas excedencias. En cuanto a los cultivos, los que presentaron con mayor frecuencia niveles por encima del límite permitido fueron el tomate y la papa.. La evaluación de riesgo indicó que el indice (HI) se ve afectado por las excedencias de LMR. Sin embargo, el estudio indica que los cultivos examinados, son seguros para el consumo en la población infantil y adulta.
  • Ítem
    2025-06
    Aplicación de cartas de control para el estudio de atributos en la evaluación de la población afiliada al régimen subsidiado en salud en el departamento del Valle del Cauca
    Perez, Luis Humberto; Sánchez Perdomo, Natalia; Varela Perea, Raúl Emilio
    El Regimen Subsidiado en Salud ha sido clave para garantizar el acceso a servicios de salud en las poblaciones m ´ as vulnerables ´ de Colombia. Sin embargo, su funcionamiento requiere un seguimiento constante que permita identificar posibles brechas en la afiliacion. Este estudio tuvo como objetivo analizar c ´ omo se ha comportado la afiliaci ´ on en los municipios certificados del ´ Valle del Cauca, utilizando cartas de control tipo P, C y U para detectar variaciones relevantes. A partir de los datos de la Base de Datos Unica de Afiliados (BDUA), con corte al 8 de mayo de 2025, se estudiaron variables relacionadas con los ciclos de ´ vida y se compararon los resultados con municipios no certificados. Entre los principales hallazgos se destacan comportamientos inusuales en la afiliacion de reci ´ en nacidos, personas con discapacidad, migrantes venezolanos y personas sin clasificaci ´ on en el ´ Sisben, con ´ enfasis en Cali y Buenaventura, donde se concentraron los casos m ´ as cr ´ ´ıticos. Estos resultados reflejan desigualdades entre territorios y evidencian posibles fallas en los procesos de registro y focalizacion. En conclusi ´ on, el uso de cartas de control ´ permitio identificar patrones de riesgo que pueden ser ´ utiles para orientar acciones en salud p ´ ublica con enfoque territorial.
  • Ítem
    2025-03
    Análisis exploratorio de defectos de producción en manofactura en busqueda de reducción en costos de reparación
    Baez Romero, Rubén Dario; Ruíz Bustos, Viviana Astrid; Varela Perea, Raúl Emilio
    Objetivos: En el presente estudio se pretendió determinar el mayor impacto económico generado a partir de las variables evaluadas durante el proceso de producción, así como generar una propuesta de ahorro que imapactara de manera positiva, reduciendo el costo de reparación. Metodos: La base de datos que se empleó fué tomada de la pagina Kaggle.com y correspondió a datos simulados relacionados con defectos de fabricación observados durante los procesos de control de calidad, la metodolofia utizada fue SEMMA. se realizó una prueba de independencia; así como monitoreo de los defectos a través de graficos de control P y Diagrama de Pareto.Resultados: se encontró que el defecto que presentaba el mayor costo de reparación fue de tipo componente con un costo promedio de $ 532.81; mediante los graficos de control se presentó un comportamiento estable frente a la media establecida. Se empleó una prueba de independencia donde se evidenció que hubo independencia entre las variables ubicación del defecto y metodo de detección ( Chi-cuadrado = 1.90, p = 0.7537). Se generaron 3 escenarios de ahorro: conservador ,moderado y optimista los cuales estimaron unos valores de ahorro de 12.05 % , 18.9 % y 25.8 % respectivamente.
  • Ítem
    2025-03
    Evaluación de la vida útil de una Bebida Láctea UAT (Ultra Alta Temperatura) mediante la aplicación de Ecuación de Arrhenius y Análisis estadístico
    Castrillon Bolaños, Yenny Magaly, Castrillón Bolaños, Yenny Magaly; Varela Perea, Raúl Emilio
    El presente estudio evaluó la estabilidad de una bebida láctea UAT almacenada a 20°C, 35°C y 50°C, con el objetivo de estimar su vida útil y determinar las condiciones óptimas de almacenamiento. Se analizaron las condiciones de pH, acidez y sensorial en cuatro formulaciones durante 102 días a diferentes temperaturas. Los datos se procesaron mediante correlación de Pearson, regresión stepwise, modelo de Arrhenius, árbol de regresión, análisis multivariado y cartas de control para estimar el tiempo de degradación. Los resultados mostraron que las formulaciones C y D conservaron mejor las propiedades de pH y acidez en todas las temperaturas evaluadas, mientras que las formulaciones A y B tuvieron una vida útil más corta. El modelo de árbol de regresión, el análisis multivariado y las cartas de control revelaron una fuerte correlación entre pH, ácido láctico, sensorial, humedad relativa y temperatura en la predicción del deterioro. El uso del método de Arrhenius y la aplicación del modelo de árbol de regresión y el análisis multivariado permitieron predecir con una precisión del 97.15% el deterioro del producto, evidenciando que altas temperaturas reducen la vida útil. Las formulaciones C y D son las más adecuadas para el proceso.
  • Ítem
    2025-03
    Impacto de la variabilidad en la certificación de ensayos a guantes dieléctricos: Un estudio estadístico del Método ASTM F496-20
    Guzmán Valencia, Maykh; Carrero Arias, Fabián; Mosquera Mesa, Aldhair; Varela Perea, Raúl Emilio
    Los laboratorios de ensayo son esenciales para asegurar la calidad de los equipos de protección personal y colectiva (EPP´s y EPC´s). La correcta aplicación de métodos de muestreo y análisis es clave para garantizar la confiabilidad de estos equipos, como los guantes dieléctricos, que deben cumplir estándares rigurosos para la seguridad laboral. Esto permite verificar la capacidad para detectar defectos, asegurando la fiabilidad de los resultados y la protección de los trabajadores. Este proyecto tiene como objetivo verificar estadísticamente la confiabilidad del método ASTM F496-20 para la certificación de guantes dieléctricos, mediante el análisis de repetibilidad, reproducibilidad y precisión del ensayo, utilizando herramientas estadísticas avanzadas para cuantificar la incertidumbre de medición y evaluar la estabilidad del proceso. Este estudio aplicó un enfoque cuantitativo utilizando herramientas estadísticas para analizar la variabilidad del método en la verificación de guantes dieléctricos, evaluando la rigidez dieléctrica. Se trató de un estudio descriptivo y experimental, que analizó datos obtenidos bajo condiciones controladas para evaluar la repetibilidad y reproducibilidad del método. Se utilizó un diseño experimental completamente aleatorizado. Se realizó el análisis exploratorio de los datos, identificando ausencia de registros anómalos dentro de los datos. La aplicación de las pruebas estadísticas válidas para el contexto del estudio permitió establecer el nivel de variabilidad y el comportamiento de los resultados para estimar la exactitud de los resultados en términos de su precisión con un nivel de confianza estadística del 95%. La validación correspondiente de la aplicabilidad de los análisis estadísticos empleados permitió evaluar la conformidad del método en cuanto a su variabilidad, así como su tendencia a mantenerse en control según los gráficos de control generados, confirmando la estabilidad y fiabilidad del método en entornos industriales.