Please use this identifier to cite or link to this item: http://ricaxcan.uaz.edu.mx/jspui/handle/20.500.11845/3575
Full metadata record
DC FieldValueLanguage
dc.contributor1186284en_US
dc.contributor.advisorJosé María Celaya Padillaen_US
dc.contributor.advisorYamilé López Hernándezen_US
dc.contributor.advisorCarlor Eric Galván Tejadaen_US
dc.contributor.advisorAlejandra García Hernándezen_US
dc.contributor.advisorPedro Daniel Alaniz Lumbrerasen_US
dc.contributor.advisorJorge Alejandro Morgan Benitaen_US
dc.coverage.spatialGlobalen_US
dc.creatorTorres Pasillas, Hugo Alexis-
dc.date.accessioned2024-06-12T18:20:06Z-
dc.date.available2024-06-12T18:20:06Z-
dc.date.issued2023-06-01-
dc.identifierinfo:eu-repo/semantics/publishedVersionen_US
dc.identifier.issn1870-4069en_US
dc.identifier.urihttp://ricaxcan.uaz.edu.mx/jspui/handle/20.500.11845/3575-
dc.identifier.urihttp://dx.doi.org/10.48779/ricaxcan-394-
dc.descriptionCOVID-19 is a recent disease that emerged in late 2019 caused by a new type of coronavirus. Despite advances in virus research and the development of both vaccines and potential treatments, early and accurate diagnosis of the disease remains one of the best tools to combat the disease and its transmission. The aim of this study is to select the best set of metabolites as potential biomarkers for diagnosis, which are used as features of a random forest model. To achieve this, four different feature selection techniques that are frequently used in Machine Learning, and a dataset containing measurements of 110 metabolites from 158 suspected COVID-19 patients (121 confirmed patients and 37 confirmed healthy by rt-PCR tests) were used. The results show four different sets of metabolites capable of diagnosing COVID-19 with high performance in six different metrics used. The set with the best performance in the training set consists of 15 metabolites and achieves high performance in blind validation (f1=0.921, balanced accuracy=0.875, AUC=0.910), while the set with the smallest number of features (5) obtains the second best performance in the training set but the best performance in blind validation (f1=0.931, balanced accuracy=0.896, AUC=0.858).en_US
dc.description.abstractEl COVID-19 es una enfermedad reciente que surgió a finales de 2019 causado por un nuevo tipo de coronavirus. A pesar de los avances en la investigación del virus y el desarrollo tanto de vacunas como de posibles tratamientos, el diagnóstico de la enfermedad, especialmente de forma temprana, continúa siendo una de las mejores herramientas para combatir la enfermedad y su transmisión. El objetivo de este estudio es seleccionar el mejor conjunto de metabolitos como potenciales biomarcadores para el diagnóstico, que son utilizados como características de un modelo de bosques aleatorios. Para ello, se utilizaron 4 diferentes técnicas de selección de características que son utilizadas con frecuencia dentro del Aprendizaje Automático, y un conjunto de datos que contiene mediciones de 110 metabolitos de 158 pacientes sospechosos de COVID-19 (121 enfermos y 37 sanos confirmados por pruebas rt-PCR). Los resultados muestran cuatro distintos conjuntos de metabolitos capaces de diagnosticar el COVID-19 con un alto desempeño en 6 distintas métricas utilizadas. El conjunto con mejor rendimiento en el conjunto de entrenamiento consta de 15 metabolitos y logra tener un desempeño alto en la validación a ciegas (f1=0.921, exactitud balanceada=0.875, AUC=0.910), mientras que el conjunto con menor número de características (5) obtiene el segundo mejor rendimiento en el conjunto de entrenamiento pero el mejor desempeño en la validación a ciegas (f1=0.931, exactitud balanceada=0.896, AUC=0.858).en_US
dc.language.isospaen_US
dc.publisherResearch in Computing Scienceen_US
dc.relationhttps://rcs.cic.ipn.mx/2023_152_6/Seleccion%20de%20metabolitos%20como%20caracteristicas%20de%20un%20modelo%20de%20bosques%20aleatorios.pdfen_US
dc.relation.urigeneralPublicen_US
dc.rightsAttribution-NonCommercial-ShareAlike 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/us/*
dc.sourceResearch in Computing Science Vol. 6, No.152, pp. 161-174en_US
dc.subject.classificationINGENIERIA Y TECNOLOGIA [7]en_US
dc.subject.otherCOVID-19en_US
dc.subject.otherAprendizaje Automáticoen_US
dc.subject.otherMetabolitosen_US
dc.subject.otherSelección de característitcasen_US
dc.subject.otherDiagnósticoen_US
dc.titleSelección de matabolitos como características de un modelo de bosques aleatorios para el diagnóstico del COVID-19en_US
dc.typeinfo:eu-repo/semantics/conferenceProceedingsen_US
Appears in Collections:*Documentos Académicos*-- M. en Ciencias del Proc. de la Info.

Files in This Item:
File Description SizeFormat 
ARTICULO-MCPI_HugoAlexisTorresPasillas.pdfProducto del programa de Maestría en Ciencias del Procesamiento de la Información, programa Categoría 1 del Sistema Nacional de Posgrados CONAHCYT.3,38 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons