Aplicación técnicas de machine learning para la predicción de costos de seguros de salud: un modelo automatizado, interactivo y listo para producción

Cargando...
Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Resumen

Contexto y objetivo: La predicción de costos médicos en seguros de salud es una tarea crítica para la gestión de riesgos y la tarificación de primas. Si bien los métodos estadísticos tradicionales han sido ampliamente utilizados, presentan limitaciones frente a conjuntos de datos complejos y no lineales. Este estudio tuvo como objetivo desarrollar un modelo automatizado basado en PyCaret para predecir los costos de seguros de salud, integrando todas las etapas del pipeline de aprendizaje automático. Metodología: Se empleó un conjunto de datos público con variables demográficas y clínicas. Se aplicó una transformación logarítmica a la variable objetivo y se utilizó PyCaret para automatizar el preprocesamiento, comparación de modelos, ajuste de hiperparámetros y evaluación visual. Las métricas de desempeño se extrajeron tras validación cruzada. Resultados: El modelo optimizado alcanzó un coeficiente de determinación (R2) de 0.82, con una reducción sustancial del MAE y MSE en comparación con modelos no transformados. Las variables con mayor influencia fueron el índice de masa corporal (IMC) y el hábito de fumar. El modelo final fue exportado, probado con nuevos datos y demostró capacidad de generalización. Conclusión: La automatización mediante PyCaret demostró ser un enfoque eficiente, reproducible y listo para producción. El modelo permite tomar decisiones basadas en datos con menor esfuerzo técnico y mayor escalabilidad en entornos reales del sector asegurador.

Descripción

Palabras clave

Citación