Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/12052
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNobre, Flavio Fonseca-
dc.contributor.authorRaposo, Letícia Martins-
dc.date.accessioned2020-04-29T01:50:48Z-
dc.date.available2023-12-21T03:07:04Z-
dc.date.issued2018-01-
dc.identifier.urihttp://hdl.handle.net/11422/12052-
dc.description.abstractMany genotypic interpretation algorithms have been elaborated to detect HIV resistance to antiretrovirals (ARV). However, these systems have shown discordances in classification, generating different predictions of the therapeutic response. In clinical practice, genotypic assays are performed by Sanger sequencing, a technique with limited sensitivity, detecting only HIV variants present in more than 15-20% of the viral population. New DNA sequencing techniques, such as new generation sequencing (NGS), have been used in HIV genotypic resistance assays. These techniques can identify HIV-1 drug resistance mutations present at low frequencies not detectable by current HIV-1 genotyping. This study aimed to develop ensemble classifiers from interpretation algorithms and to implement an integrated environment capable of identifying the HIV-1 resistance mutations and the levels of susceptibility to ARVs from raw NGS data. Three different strategies were used to develop the ensemble classifiers: majority voting (MV), choice of the best genotypic interpretation system (MS) and stacking technique, with na¨ıve Bayes (NB) and k-NN as meta-classifiers. In general, NB and MS obtained the best results, with NB showing a statistically superior performance to at least one of the other three strategies for four drugs. The integrated environment was called SIRA-HIV, and it was implemented in the R language. The system performs a complete evaluation of the NGS data, providing to the user a list of amino acids and their frequencies found in the regions analyzed, and the HIV-1 resistance classification to ARVs according to two cut-offs.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal do Rio de Janeiropt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectMulticlassificadorespt_BR
dc.subjectSistemapt_BR
dc.subjectResistência do HIV-1pt_BR
dc.titleDesenvolvimento de multiclassificadores e de um sistema de identificação de resistência do HIV-1 aos antirretroviraispt_BR
dc.title.alternativeDevelopment of ensemble classifiers and a system of identification of hiv-1 resistance to antiretroviralspt_BR
dc.typeTesept_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/2953219280065235pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/2289581239869778pt_BR
dc.contributor.referee1Almeida, Rosimary Teresinha de-
dc.contributor.referee2Tierra-Criollo, Carlos Julio-
dc.contributor.referee3Cruz, Oswaldo Gonçalves-
dc.contributor.referee4Freire, Sergio Miranda-
dc.contributor.referee5Bastos, Francisco Inacio Pinkusfeld Monteiro-
dc.description.resumoMuitos algoritmos de interpretação genotípica têm sido elaborados com o intuito de detectar resistência do HIV aos antirretrovirais (ARV). Entretanto, esses sistemas têm apresentado discordâncias de classificação, gerando predições conflituosas da resposta terapêutica. Na prática clínica, ensaios genotípicos utilizados na detecção de resistência são realizados por meio do sequenciamento de Sanger, uma técnica com sensibilidade limitada, detectando apenas as variantes do HIV presentes em mais de 15-20% da população viral. Novas técnicas de sequenciamento de DNA, como o sequenciamento de nova geração (NGS), têm sido exploradas nos testes genotípicos de resistência do HIV. Essas técnicas são capazes de detectar mutações de resistência presentes em baixas frequências não detectáveis pela genotipagem atual. Os objetivos deste estudo foram desenvolver multiclassificadores de resistência a partir dos algoritmos de interpretação genotípica e implementar um ambiente integrado capaz de identificar as mutações de resistência do HIV-1 e os níveis de suscetibilidade aos ARVs a partir de dados brutos de NGS. Três estratégias diferentes foram utilizadas no desenvolvimento dos multiclassificadores: voto majoritário (VM), escolha do melhor algoritmo de interpretação genotípica (MS) e técnica stacking, com metaclassificadores naïve Bayes (NB) e k-NN. No geral, as abordagens NB e MS obtiveram os melhores resultados, com o NB sendo estatisticamente superior a pelo menos uma das outras três estratégias para quatro fármacos. O ambiente integrado recebeu o nome de SIRA-HIV e foi implementado na linguagem R. O sistema realiza uma avaliação abrangente dos dados de NGS, fornecendo ao usuário uma lista dos aminoácidos (e suas frequências) encontrados nas regiões analisadas, além da classificação de resistência do HIV-1 aos ARVs segundo dois pontos de corte.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenhariapt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Biomédicapt_BR
dc.publisher.initialsUFRJpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA BIOMEDICApt_BR
dc.embargo.termsabertopt_BR
Appears in Collections:Engenharia Biomédica

Files in This Item:
File Description SizeFormat 
LeticiaMartinsRaposo.pdf10.49 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.