Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/23608
Especie: Trabalho de conclusão de graduação
Título : GENUVEM: busca de sequências genéticas em plataformas de Big Data
Autor(es)/Inventor(es): Gomes, Raphael Sant'Anna
Tutor: Rossetto, Silvana
Tutor : Campos, Maria Luiza Machado
Resumen: A busca de sequências em bases de dados permanece como uma das mais importantes tarefas em bioinformática, sendo o Basic Local Alignment Search Tool (BLAST) a principal ferramenta utilizada para inferência de homologia baseada em similaridade de sequências. Nas últimas décadas, o volume de dados publicados cresceu de tal forma que foi necessária a criação de estratégias de paralelização e distribuição das buscas. Uma das possibilidades é a distribuição da execução do BLAST em clusters de computadores com o apoio de plataformas de Big Data, como Apache Hadoop e Apache Spark. Nesta monografia, foi realizada uma revisão de trabalhos relacionados neste campo, e foi desenvolvida uma ferramenta para busca de sequências em nuvem baseada em Spark, o Genuvem. A validação foi conduzida na nuvem pública da Google Cloud Platform em diferentes tipos de clusters de computadores. Os resultados demonstraram que, para buscas suficientemente grandes, a solução escala com eficiência superior a 80%.
Materia: Alinhamento de sequências
Bioinformática
Blast
Hadoop
Spark
Bioinformatics
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade de producción: Instituto de Computação
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 14-ago-2024
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RSGomes.pdf1.08 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.