Aplicación técnicas de machine learning para la predicción de costos de seguros de salud: un modelo automatizado, interactivo y listo para producción
Cargando...
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
Contexto y objetivo: La predicción de costos médicos en seguros de salud es una tarea crítica para la gestión
de riesgos y la tarificación de primas. Si bien los métodos estadísticos tradicionales han sido ampliamente utilizados,
presentan limitaciones frente a conjuntos de datos complejos y no lineales. Este estudio tuvo como objetivo desarrollar
un modelo automatizado basado en PyCaret para predecir los costos de seguros de salud, integrando todas las etapas
del pipeline de aprendizaje automático.
Metodología: Se empleó un conjunto de datos público con variables demográficas y clínicas. Se aplicó una transformación logarítmica a la variable objetivo y se utilizó PyCaret para automatizar el preprocesamiento, comparación
de modelos, ajuste de hiperparámetros y evaluación visual. Las métricas de desempeño se extrajeron tras validación
cruzada.
Resultados: El modelo optimizado alcanzó un coeficiente de determinación (R2) de 0.82, con una reducción sustancial del MAE y MSE en comparación con modelos no transformados. Las variables con mayor influencia fueron
el índice de masa corporal (IMC) y el hábito de fumar. El modelo final fue exportado, probado con nuevos datos y
demostró capacidad de generalización.
Conclusión: La automatización mediante PyCaret demostró ser un enfoque eficiente, reproducible y listo para
producción. El modelo permite tomar decisiones basadas en datos con menor esfuerzo técnico y mayor escalabilidad
en entornos reales del sector asegurador.