Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/13240
Type: Dissertação
Title: Classificadores de regressão logística, Naive Bayes e Random Forest na análise do Tropismo do HIV-1 de subtipo B
Author(s)/Inventor(s): Barros, Cesar Borges
Advisor: Nobre, Flávio Fonseca
Abstract: O desenvolvimento de antagonistas de correceptores – como o maraviroque – para o tratamento anti-HIV tornou mandatória a determinação clínica do tropismo viral previamente às terapias de resgate. Aspectos técnicos do TrofileTM, o ensaio fenotípico referencial, dificultaram o seu uso como ferramenta de rotina para este diagnóstico. Isto levou ao desenvolvimento de algoritmos genotípicos, cujas avaliações são baseadas em sequências genéticas da região V3 da gp120 do HIV-1. Tais algoritmos se mostraram opções menos dispensiosas de custo e tempo, além de serem mais práticos para o uso na rotina clínica do que o ensaio fenotípico. Dentre eles, o geno2pheno começou a ser amplamente utilizado após apresentar uma concordância preditiva de 86,5% com o TrofileTM. O presente projeto visou desenvolver modelos classificadores acurados, baseados em informações de sequências V3. Para isto, foram utilizadas 2.109 sequências de DNA da região V3 do HIV-1 de subtipo B. As sequências com os resultados do geno2pheno foram então modeladas pelos métodos de regressão logística, naive Bayes e random forest. Todos os classificadores apresentaram bons resultados preditivos, porém os modelos de random forest obtiveram o melhor desempenho discriminativo, sob a forma de resultados significativos de AUC. Tais resultados são encorajadores para a continuação do desenvolvimento de um algoritmo acurado e de uso prático para a predição clínica do tropismo viral, capaz de orientar a tomada de decisão em relação à utilização de antagonistas de correceptores no tratamento do HIV-1.
Abstract: The development of coreceptor antagonists – such as maraviroc – for HIV treatment has made mandatory the clinical determination of viral coreceptor usage prior to rescue therapy. Technical issues presented by TrofileTM, the gold standard phenotypic assay, hindered its use as a routine diagnostic tool. This fact has lead to the development of genotypic algorithms, whose evaluations are based on DNA sequences of the V3 region of HIV-1 gp120. These algorithms proved to be cheaper, easier to use, and less time consuming than the phenotypic method. One of them, geno2pheno has also gained widespread use since it showed 86.5% predictive concordance with TrofileTM. The present project aimed to develop accurate classification models based on V3 sequence information. For this, 2,109 DNA sequences of V3 region from HIV-1 subtype B were used. Data labeled with geno2pheno’s results were then modeled by methods such as logistic regression, naive Bayes and random forest. All classifiers presented good predictive outputs, however random forest models showed the best discriminative performance, in the form of significant AUC results. These outcomes encourage us to continue the development of an easy to use and accurate algorithm for HIV-1 tropism diagnosis, capable of guiding clinical decision making regarding the use of coreceptor antagonists in HIV-1 treatment.
Keywords: HIV-1 subtipo B
Tropismo viral
Classificadores baseados em aprendizado de máquina
Subject CNPq: CNPQ::ENGENHARIAS
Program: Programa de Pós-Graduação em Engenharia Biomédica
Production unit: Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: Mar-2019
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Engenharia Biomédica

Files in This Item:
File Description SizeFormat 
CesarBorgesBarros.pdf1.78 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.