Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/23608
Tipo: Trabalho de conclusão de graduação
Título: GENUVEM: busca de sequências genéticas em plataformas de Big Data
Autor(es)/Inventor(es): Gomes, Raphael Sant'Anna
Orientador: Rossetto, Silvana
Coorientador: Campos, Maria Luiza Machado
Resumo: A busca de sequências em bases de dados permanece como uma das mais importantes tarefas em bioinformática, sendo o Basic Local Alignment Search Tool (BLAST) a principal ferramenta utilizada para inferência de homologia baseada em similaridade de sequências. Nas últimas décadas, o volume de dados publicados cresceu de tal forma que foi necessária a criação de estratégias de paralelização e distribuição das buscas. Uma das possibilidades é a distribuição da execução do BLAST em clusters de computadores com o apoio de plataformas de Big Data, como Apache Hadoop e Apache Spark. Nesta monografia, foi realizada uma revisão de trabalhos relacionados neste campo, e foi desenvolvida uma ferramenta para busca de sequências em nuvem baseada em Spark, o Genuvem. A validação foi conduzida na nuvem pública da Google Cloud Platform em diferentes tipos de clusters de computadores. Os resultados demonstraram que, para buscas suficientemente grandes, a solução escala com eficiência superior a 80%.
Palavras-chave: Alinhamento de sequências
Bioinformática
Blast
Hadoop
Spark
Bioinformatics
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade produtora: Instituto de Computação
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: 14-Ago-2024
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
RSGomes.pdf1.08 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.