Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/12052
Tipo: Tese
Título: Desenvolvimento de multiclassificadores e de um sistema de identificação de resistência do HIV-1 aos antirretrovirais
Título(s) alternativo(s): Development of ensemble classifiers and a system of identification of hiv-1 resistance to antiretrovirals
Autor(es)/Inventor(es): Raposo, Letícia Martins
Orientador: Nobre, Flavio Fonseca
Resumo: Muitos algoritmos de interpretação genotípica têm sido elaborados com o intuito de detectar resistência do HIV aos antirretrovirais (ARV). Entretanto, esses sistemas têm apresentado discordâncias de classificação, gerando predições conflituosas da resposta terapêutica. Na prática clínica, ensaios genotípicos utilizados na detecção de resistência são realizados por meio do sequenciamento de Sanger, uma técnica com sensibilidade limitada, detectando apenas as variantes do HIV presentes em mais de 15-20% da população viral. Novas técnicas de sequenciamento de DNA, como o sequenciamento de nova geração (NGS), têm sido exploradas nos testes genotípicos de resistência do HIV. Essas técnicas são capazes de detectar mutações de resistência presentes em baixas frequências não detectáveis pela genotipagem atual. Os objetivos deste estudo foram desenvolver multiclassificadores de resistência a partir dos algoritmos de interpretação genotípica e implementar um ambiente integrado capaz de identificar as mutações de resistência do HIV-1 e os níveis de suscetibilidade aos ARVs a partir de dados brutos de NGS. Três estratégias diferentes foram utilizadas no desenvolvimento dos multiclassificadores: voto majoritário (VM), escolha do melhor algoritmo de interpretação genotípica (MS) e técnica stacking, com metaclassificadores naïve Bayes (NB) e k-NN. No geral, as abordagens NB e MS obtiveram os melhores resultados, com o NB sendo estatisticamente superior a pelo menos uma das outras três estratégias para quatro fármacos. O ambiente integrado recebeu o nome de SIRA-HIV e foi implementado na linguagem R. O sistema realiza uma avaliação abrangente dos dados de NGS, fornecendo ao usuário uma lista dos aminoácidos (e suas frequências) encontrados nas regiões analisadas, além da classificação de resistência do HIV-1 aos ARVs segundo dois pontos de corte.
Resumo: Many genotypic interpretation algorithms have been elaborated to detect HIV resistance to antiretrovirals (ARV). However, these systems have shown discordances in classification, generating different predictions of the therapeutic response. In clinical practice, genotypic assays are performed by Sanger sequencing, a technique with limited sensitivity, detecting only HIV variants present in more than 15-20% of the viral population. New DNA sequencing techniques, such as new generation sequencing (NGS), have been used in HIV genotypic resistance assays. These techniques can identify HIV-1 drug resistance mutations present at low frequencies not detectable by current HIV-1 genotyping. This study aimed to develop ensemble classifiers from interpretation algorithms and to implement an integrated environment capable of identifying the HIV-1 resistance mutations and the levels of susceptibility to ARVs from raw NGS data. Three different strategies were used to develop the ensemble classifiers: majority voting (MV), choice of the best genotypic interpretation system (MS) and stacking technique, with na¨ıve Bayes (NB) and k-NN as meta-classifiers. In general, NB and MS obtained the best results, with NB showing a statistically superior performance to at least one of the other three strategies for four drugs. The integrated environment was called SIRA-HIV, and it was implemented in the R language. The system performs a complete evaluation of the NGS data, providing to the user a list of amino acids and their frequencies found in the regions analyzed, and the HIV-1 resistance classification to ARVs according to two cut-offs.
Palavras-chave: Multiclassificadores
Sistema
Resistência do HIV-1
Assunto CNPq: CNPQ::ENGENHARIAS::ENGENHARIA BIOMEDICA
Programa: Programa de Pós-Graduação em Engenharia Biomédica
Unidade produtora: Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: Jan-2018
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Engenharia Biomédica

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
LeticiaMartinsRaposo.pdf10.49 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.