Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/11197
Especie: Trabalho de conclusão de graduação
Título : Ambiente de Dados do SIHSUS com MongoDB
Autor(es)/Inventor(es): Sampaio, Rafael S.
Tutor: Bastos, Valeria Menezes.
Tutor : Costa, Myrian Christina de Aragão
Resumen: O sistema de saúde pública do Brasil (SUS) disponibiliza dados de eventos de saúde como internações e nascimentos de forma anonimizada para uso público. Tais dados são oferecidos em padrões e tipos de arquivos oriundos de sistemas legados, e que não são adequados para análise a partir de técnicas e sistemas modernos. O objetivo deste trabalho é realizar uma extração, transformação e carga (ETL) dos dados da base de internações (SIHSUS) para um banco de dados NoSQL, produzindo um ambiente analítico adequado para a aplicação de técnicas de estatística, aprendizado de máquina e mineração de dados a fim de se extrair conhecimentos úteis para o entendimento e melhoramento da saúde pública. Foi escolhido o banco de dados orientado a documento, MongoDB, e o processo envolveu etapas de conversão dos arquivos originais, importação para o banco e agregação dos dados de tabelas auxiliares à tabela principal. Após o processo de ETL, foram obtidas as bases de internações em um ambiente analítico no MongoDB, do estado do Rio de Janeiro, entre os anos de 2010 a 2015. A metodologia pode ser estendida para a obtenção das bases do Brasil inteiro, assim como para a realização do mesmo processo em outras bases, como a de nascimento (SINASC) e mortalidade (SIM).
Materia: Saúde pública
Computação aplicada
Banco de dados não relacionais
Mineração de dados
Sistemas distribuídos
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
Unidade de producción: Instituto de Computação
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 28-ago-2019
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
RSSampaio.pdf1.45 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.