Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/11422/11197
Tipo: | Trabalho de conclusão de graduação |
Título: | Ambiente de Dados do SIHSUS com MongoDB |
Autor(es)/Inventor(es): | Sampaio, Rafael S. |
Orientador: | Bastos, Valeria Menezes. |
Coorientador: | Costa, Myrian Christina de Aragão |
Resumo: | O sistema de saúde pública do Brasil (SUS) disponibiliza dados de eventos de saúde como internações e nascimentos de forma anonimizada para uso público. Tais dados são oferecidos em padrões e tipos de arquivos oriundos de sistemas legados, e que não são adequados para análise a partir de técnicas e sistemas modernos. O objetivo deste trabalho é realizar uma extração, transformação e carga (ETL) dos dados da base de internações (SIHSUS) para um banco de dados NoSQL, produzindo um ambiente analítico adequado para a aplicação de técnicas de estatística, aprendizado de máquina e mineração de dados a fim de se extrair conhecimentos úteis para o entendimento e melhoramento da saúde pública. Foi escolhido o banco de dados orientado a documento, MongoDB, e o processo envolveu etapas de conversão dos arquivos originais, importação para o banco e agregação dos dados de tabelas auxiliares à tabela principal. Após o processo de ETL, foram obtidas as bases de internações em um ambiente analítico no MongoDB, do estado do Rio de Janeiro, entre os anos de 2010 a 2015. A metodologia pode ser estendida para a obtenção das bases do Brasil inteiro, assim como para a realização do mesmo processo em outras bases, como a de nascimento (SINASC) e mortalidade (SIM). |
Palavras-chave: | Saúde pública Computação aplicada Banco de dados não relacionais Mineração de dados Sistemas distribuídos |
Assunto CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS |
Unidade produtora: | Instituto de Computação |
Editora: | Universidade Federal do Rio de Janeiro |
Data de publicação: | 28-Ago-2019 |
País de publicação: | Brasil |
Idioma da publicação: | por |
Tipo de acesso: | Acesso Aberto |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
RSSampaio.pdf | 1.45 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.