Modelos de clasificación multiclase para la predicción del estado sanitario y tipo de daño en el arbolado urbano de Bucaramanga, Santander

Cargando...
Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Resumen

Contexto. En ciudades como Bucaramanga, el arbolado urbano enfrenta múltiples factores de estrés y deterioro, mientras que su monitoreo se basa en herramientas descriptivas sin capacidad predictiva. El uso de modelos de aprendizaje automático permite anticipar daños y mejorar la gestión arbórea. Propósito. Este estudio busca predecir el estado sanitario del arbolado urbano en seis categorías de daño, e identificar las variables más influyentes en dicha predicción, a partir de datos del censo forestal urbano. Metodología. Se aplicó la metodología SEMMA sobre datos geográficos, dendrométricos y taxonómicos, utilizando modelos de ensamble como Random Forest, XGBoost y LightGBM. Se aplicaron técnicas de balanceo, codificación y validación cruzada, y se evaluó el desempeño con métricas como F1-score, AUC y MCC. Resultados. El modelo optimizado de Random Forest logró un F1-score de 0.7769 y un AUC de 0.9203, superando a su versión original. Las variables más influyentes fueron la comuna, la ubicación geográfica y el tipo de emplazamiento. Conclusiones. Los modelos de clasificación multiclase permiten predecir con buen desempeño el estado sanitario de los árboles. Sin embargo, persisten dificultades en clases similares o poco representadas, por lo que se recomienda explorar modelos especializados o jerárquicos para mejorar la discriminación entre tipos de daño y optimizar decisiones de manejo urbano.

Descripción

Palabras clave

Citación