Evaluación de modelos de DBO5 para el afluente y efluente de un STARD piloto mediante tecnicas de machine learning.
dc.contributor.advisor | González Martínez, Edwin Fernando | |
dc.contributor.advisor | Salamanca Bernal, Julián Andrés | |
dc.contributor.author | Pascal Suárez, Angel Camilo | |
dc.coverage.spatial | Bogotá, D.C. - Colombia | |
dc.creator.email | acpascals@libertadores.edu.co | |
dc.date.accessioned | 2024-04-16T02:17:43Z | |
dc.date.available | 2024-04-16T02:17:43Z | |
dc.date.issued | 2023-12-02 | |
dc.description.abstract | Contexto. Establecer el mejor modelo predictivo para el parámetro DBO5, mediante el uso de técnicas de Mechine Learning entre la Demanda Quimica de Oxigeno, los Solidos Suspendidos Totales, el Nitrogeno Total y el Fosforo Total de una planta de tratamiento piloto ubicada en la Facultad del Medio Ambiente de la Universidad Distrital Francisco Jose de Caldas. Propósito. Determinar mediante la aplicación de técnicas de machine Learning un modelo de carácter predictivo, el cual ayude a la toma de decisiones en funciones de las diferentes métricas evaluadas de los modelos aplicados. Metodología. Se realizo una limpieza e imputacion de datos faltantes, por la heterogeneidad de los datos se realizo una transformación de la base de datos para una mejor homogeneidad de los mismo; se determinaron dos grupos mediante el Análisis de Componentes Principales, posteriormente se aplicaron los modelos de Regresión lineal multiple y Random Forest, las métricas evaluadas para la determinar el mejor modelo fueron el RMSE, MAPE, R2, COR . Resultados. El mejor modelo RANDOM FOREST aplicado con las variables determinadas con el criterio AKAIKE presento las mejores métricas para el Afluente y Efluente del STARD, dentro de dichas métricas determinas esta el RMSE con un valor de 0.285 y 0.34 respectivamente. Conclusiones. De acuerdo con los resultados, se puede determinar que a pesar de obtener buenas metricas el modelos de regresión lineal, este no cumple los supuestos de normalidad, por lo cual el mejor modelo predictivo fue el Random Forest con mejores métricas y variables del criterio AKAIKE. | spa |
dc.description.abstract | Context. To establish the best predictive model for the BOD5 parameter, through the use of Mechine Learning techniques between the Chemical Oxygen Demand, Total Suspended Solids, Total Nitrogen and Total Phosphorus of a pilot treatment plant located at the Environmental Faculty of the Universidad Distrital Francisco Jose de Caldas. Methodology. A cleaning and imputation of missing data was performed, due to the heterogeneity of the data, a transformation of the database was performed for a better homogeneity of the same; two groups were determined by Principal Component Analysis, then the Multiple Linear Regression and Random Forest models were applied, the metrics evaluated to determine the best model were the RMSE, MAPE, R2, COR . Results. The best RANDOM FOREST model applied with the variables determined with the AKAIKE criterion presented the best metrics for the STARD influent and effluent, within these metrics determined is the RMSE with a value of 0.285 and 0.34 respectively. Conclusions. According to the results, it can be determined that despite obtaining good metrics, the linear regression model does not meet the assumptions of normality, so the best predictive model was the Random Forest with better metrics and variables of the AKAIKE criterion. | spa |
dc.description.degreelevel | Especialización | |
dc.format | ||
dc.identifier.uri | http://hdl.handle.net/11371/6689 | |
dc.language.iso | spa | |
dc.rights.accessrights | OpenAccess | |
dc.subject.lemb | Aprendizaje Automático | spa |
dc.subject.lemb | Aprendizaje | spa |
dc.subject.lemb | Procesamiento de la información | spa |
dc.subject.lemb | Análisis de redes | spa |
dc.subject.proposal | Aprendizaje Automático | spa |
dc.subject.proposal | DBO5 | spa |
dc.subject.proposal | Regresion lineal multiple | spa |
dc.subject.proposal | Random Fores | spa |
dc.subject.proposal | Machine Learning | eng |
dc.subject.proposal | DBO5 | eng |
dc.subject.proposal | Multiple Linear Regression | eng |
dc.subject.proposal | Random Forest | eng |
dc.title | Evaluación de modelos de DBO5 para el afluente y efluente de un STARD piloto mediante tecnicas de machine learning. | spa |
dc.title | Evaluation of BOD5 models for the influent and effluent of a pilot STARD using machine learning techniques. | eng |
dc.type | bachelor thesis |