Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/23608
Type: Trabalho de conclusão de graduação
Title: GENUVEM: busca de sequências genéticas em plataformas de Big Data
Author(s)/Inventor(s): Gomes, Raphael Sant'Anna
Advisor: Rossetto, Silvana
Co-advisor: Campos, Maria Luiza Machado
Abstract: A busca de sequências em bases de dados permanece como uma das mais importantes tarefas em bioinformática, sendo o Basic Local Alignment Search Tool (BLAST) a principal ferramenta utilizada para inferência de homologia baseada em similaridade de sequências. Nas últimas décadas, o volume de dados publicados cresceu de tal forma que foi necessária a criação de estratégias de paralelização e distribuição das buscas. Uma das possibilidades é a distribuição da execução do BLAST em clusters de computadores com o apoio de plataformas de Big Data, como Apache Hadoop e Apache Spark. Nesta monografia, foi realizada uma revisão de trabalhos relacionados neste campo, e foi desenvolvida uma ferramenta para busca de sequências em nuvem baseada em Spark, o Genuvem. A validação foi conduzida na nuvem pública da Google Cloud Platform em diferentes tipos de clusters de computadores. Os resultados demonstraram que, para buscas suficientemente grandes, a solução escala com eficiência superior a 80%.
Keywords: Alinhamento de sequências
Bioinformática
Blast
Hadoop
Spark
Bioinformatics
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Production unit: Instituto de Computação
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 14-Aug-2024
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
RSGomes.pdf1.08 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.