Modelos de clasificación multiclase para la predicción del estado sanitario y tipo de daño en el arbolado urbano de Bucaramanga, Santander
Cargando...
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
Contexto. En ciudades como Bucaramanga, el arbolado urbano enfrenta múltiples factores de estrés y deterioro,
mientras que su monitoreo se basa en herramientas descriptivas sin capacidad predictiva. El uso de modelos de
aprendizaje automático permite anticipar daños y mejorar la gestión arbórea. Propósito. Este estudio busca predecir
el estado sanitario del arbolado urbano en seis categorías de daño, e identificar las variables más influyentes en
dicha predicción, a partir de datos del censo forestal urbano. Metodología. Se aplicó la metodología SEMMA sobre
datos geográficos, dendrométricos y taxonómicos, utilizando modelos de ensamble como Random Forest, XGBoost y
LightGBM. Se aplicaron técnicas de balanceo, codificación y validación cruzada, y se evaluó el desempeño con métricas
como F1-score, AUC y MCC. Resultados. El modelo optimizado de Random Forest logró un F1-score de 0.7769 y
un AUC de 0.9203, superando a su versión original. Las variables más influyentes fueron la comuna, la ubicación
geográfica y el tipo de emplazamiento. Conclusiones. Los modelos de clasificación multiclase permiten predecir con
buen desempeño el estado sanitario de los árboles. Sin embargo, persisten dificultades en clases similares o poco
representadas, por lo que se recomienda explorar modelos especializados o jerárquicos para mejorar la discriminación
entre tipos de daño y optimizar decisiones de manejo urbano.