Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/23608
Type: | Trabalho de conclusão de graduação |
Title: | GENUVEM: busca de sequências genéticas em plataformas de Big Data |
Author(s)/Inventor(s): | Gomes, Raphael Sant'Anna |
Advisor: | Rossetto, Silvana |
Co-advisor: | Campos, Maria Luiza Machado |
Abstract: | A busca de sequências em bases de dados permanece como uma das mais importantes tarefas em bioinformática, sendo o Basic Local Alignment Search Tool (BLAST) a principal ferramenta utilizada para inferência de homologia baseada em similaridade de sequências. Nas últimas décadas, o volume de dados publicados cresceu de tal forma que foi necessária a criação de estratégias de paralelização e distribuição das buscas. Uma das possibilidades é a distribuição da execução do BLAST em clusters de computadores com o apoio de plataformas de Big Data, como Apache Hadoop e Apache Spark. Nesta monografia, foi realizada uma revisão de trabalhos relacionados neste campo, e foi desenvolvida uma ferramenta para busca de sequências em nuvem baseada em Spark, o Genuvem. A validação foi conduzida na nuvem pública da Google Cloud Platform em diferentes tipos de clusters de computadores. Os resultados demonstraram que, para buscas suficientemente grandes, a solução escala com eficiência superior a 80%. |
Keywords: | Alinhamento de sequências Bioinformática Blast Hadoop Spark Bioinformatics |
Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Production unit: | Instituto de Computação |
Publisher: | Universidade Federal do Rio de Janeiro |
Issue Date: | 14-Aug-2024 |
Publisher country: | Brasil |
Language: | por |
Right access: | Acesso Aberto |
Appears in Collections: | Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
RSGomes.pdf | 1.08 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.