dc.contributor.advisor | González Veloza, Jose Jhon Fredy | |
dc.contributor.advisor | Fonseca Gómez, Lida Rubiela | |
dc.contributor.author | Díaz Morales, Adriana Patricia | |
dc.date.accessioned | 2020-10-05T19:34:25Z | |
dc.date.available | 2020-10-05T19:34:25Z | |
dc.date.created | 2020 | |
dc.identifier.uri | http://hdl.handle.net/11371/3258 | |
dc.description | Este trabajo tuvo como objetivo identificar la necesidad de implementar nuevas pruebas diagnósticas para enfermedades virales indeterminadas en aves, para el caso de un laboratorio de diagnóstico veterinario por biología molecular en Bogotá, Colombia. Así, por medio de la depuración de la base de datos y su posterior análisis por árboles de decisión CHAID, Random Forest y Regresión logística. La metodología de árbol CHAID se aplicó para identificar las variables más importantes en relación con la variable respuesta. Los resultados de éste, indican que las variables de mayor impacto en la variable respuesta son las variables de Departamento, Técnica y Prueba solicitada, lo cual coincide con los resultados obtenidos por Random Forest y por el modelo de Regresión logística. En cuanto a este último, se planteó un modelo binario de la variable respuesta (Resultado) con dos opciones: positivo o negativo y con 6 factores como variables independientes. Las tres metodologías aplicadas dan cuenta del desequilibrio de los datos, con una alta especificidad por el nivel negativo del factor Resultado, lo que da respuesta al objetivo planteado, pues se identifica la necesidad de implementar nuevas pruebas diagnósticas para enfermedades virales
indeterminadas en aves. | spa |
dc.description.abstract | This document aimed to identify the need to implement new diagnostic tests for undetermined viral diseases in birds, in the case of a molecular biology veterinary diagnostic laboratory in Bogotá, Colombia. Thus, through the purification of the database and its subsequent analysis by decision trees CHAID, Random Forest and Logistic Regression. The CHAID tree methodology was applied to identify the most important variables in relation to the response variable. The results of this indicate that the variables with the greatest impact on the response variable are the variables of Department, Technique and Test requested, which coincides with the results obtained by Random Forest and by the Logistic Regression model. Regarding the latter, a binary model of the response variable (Result) was proposed with two options: positive or negative and with 6 factors as independent variables. The three methodologies applied account for the imbalance of the data, with a high specificity due to the negative level of the Result factor, which responds to the objective set, since the need to implement new diagnostic tests for undetermined viral diseases in birds is
identified. | spa |
dc.format | PDF | spa |
dc.language.iso | spa | spa |
dc.title | Caracterización por árboles de decisión para datos categóricos: diagnóstico de virus respiratorios en aves. | spa |
dc.type | info:eu-repo/semantics/bachelorThesis | spa |
dc.creator.email | apdiazm@libertadores.edu.co | spa |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | spa |
dc.rights.acceso | Abierto (Texto Completo) | spa |
dc.subject.lemb | Diagnóstico virológico veterinario | spa |
dc.subject.lemb | Virología veterinaria | spa |
dc.subject.lemb | Enfermedades respiratorias | spa |
dc.subject.lemb | Aves - enfermedades | spa |
dc.subject.proposal | Regresión logística | spa |
dc.subject.proposal | Pruebas diagnósticas | spa |
dc.subject.proposal | Enfermedades virales | spa |
dc.subject.proposal | Diagnóstico veterinario | spa |