Evaluación de modelos de DBO5 para el afluente y efluente de un STARD piloto mediante tecnicas de machine learning.

dc.contributor.advisorGonzález Martínez, Edwin Fernando
dc.contributor.advisorSalamanca Bernal, Julián Andrés
dc.contributor.authorPascal Suárez, Angel Camilo
dc.coverage.spatialBogotá, D.C. - Colombia
dc.creator.emailacpascals@libertadores.edu.co
dc.date.accessioned2024-04-16T02:17:43Z
dc.date.available2024-04-16T02:17:43Z
dc.date.issued2023-12-02
dc.description.abstractContexto. Establecer el mejor modelo predictivo para el parámetro DBO5, mediante el uso de técnicas de Mechine Learning entre la Demanda Quimica de Oxigeno, los Solidos Suspendidos Totales, el Nitrogeno Total y el Fosforo Total de una planta de tratamiento piloto ubicada en la Facultad del Medio Ambiente de la Universidad Distrital Francisco Jose de Caldas. Propósito. Determinar mediante la aplicación de técnicas de machine Learning un modelo de carácter predictivo, el cual ayude a la toma de decisiones en funciones de las diferentes métricas evaluadas de los modelos aplicados. Metodología. Se realizo una limpieza e imputacion de datos faltantes, por la heterogeneidad de los datos se realizo una transformación de la base de datos para una mejor homogeneidad de los mismo; se determinaron dos grupos mediante el Análisis de Componentes Principales, posteriormente se aplicaron los modelos de Regresión lineal multiple y Random Forest, las métricas evaluadas para la determinar el mejor modelo fueron el RMSE, MAPE, R2, COR . Resultados. El mejor modelo RANDOM FOREST aplicado con las variables determinadas con el criterio AKAIKE presento las mejores métricas para el Afluente y Efluente del STARD, dentro de dichas métricas determinas esta el RMSE con un valor de 0.285 y 0.34 respectivamente. Conclusiones. De acuerdo con los resultados, se puede determinar que a pesar de obtener buenas metricas el modelos de regresión lineal, este no cumple los supuestos de normalidad, por lo cual el mejor modelo predictivo fue el Random Forest con mejores métricas y variables del criterio AKAIKE.spa
dc.description.abstractContext. To establish the best predictive model for the BOD5 parameter, through the use of Mechine Learning techniques between the Chemical Oxygen Demand, Total Suspended Solids, Total Nitrogen and Total Phosphorus of a pilot treatment plant located at the Environmental Faculty of the Universidad Distrital Francisco Jose de Caldas. Methodology. A cleaning and imputation of missing data was performed, due to the heterogeneity of the data, a transformation of the database was performed for a better homogeneity of the same; two groups were determined by Principal Component Analysis, then the Multiple Linear Regression and Random Forest models were applied, the metrics evaluated to determine the best model were the RMSE, MAPE, R2, COR . Results. The best RANDOM FOREST model applied with the variables determined with the AKAIKE criterion presented the best metrics for the STARD influent and effluent, within these metrics determined is the RMSE with a value of 0.285 and 0.34 respectively. Conclusions. According to the results, it can be determined that despite obtaining good metrics, the linear regression model does not meet the assumptions of normality, so the best predictive model was the Random Forest with better metrics and variables of the AKAIKE criterion.spa
dc.description.degreelevelEspecialización
dc.formatPDF
dc.identifier.urihttp://hdl.handle.net/11371/6689
dc.language.isospa
dc.rights.accessrightsOpenAccess
dc.subject.lembAprendizaje Automáticospa
dc.subject.lembAprendizajespa
dc.subject.lembProcesamiento de la informaciónspa
dc.subject.lembAnálisis de redesspa
dc.subject.proposalAprendizaje Automáticospa
dc.subject.proposalDBO5spa
dc.subject.proposalRegresion lineal multiplespa
dc.subject.proposalRandom Foresspa
dc.subject.proposalMachine Learningeng
dc.subject.proposalDBO5eng
dc.subject.proposalMultiple Linear Regressioneng
dc.subject.proposalRandom Foresteng
dc.titleEvaluación de modelos de DBO5 para el afluente y efluente de un STARD piloto mediante tecnicas de machine learning.spa
dc.titleEvaluation of BOD5 models for the influent and effluent of a pilot STARD using machine learning techniques.eng
dc.typebachelor thesis
Archivos