Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/11197
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Bastos, Valeria Menezes. | - |
dc.contributor.author | Sampaio, Rafael S. | - |
dc.date.accessioned | 2020-01-31T14:40:50Z | - |
dc.date.available | 2023-12-21T03:06:48Z | - |
dc.date.issued | 2019-08-28 | - |
dc.identifier.uri | http://hdl.handle.net/11422/11197 | - |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal do Rio de Janeiro | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Saúde pública | pt_BR |
dc.subject | Computação aplicada | pt_BR |
dc.subject | Banco de dados não relacionais | pt_BR |
dc.subject | Mineração de dados | pt_BR |
dc.subject | Sistemas distribuídos | pt_BR |
dc.title | Ambiente de Dados do SIHSUS com MongoDB | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6948667770415330 | pt_BR |
dc.contributor.advisorCo1 | Costa, Myrian Christina de Aragão | - |
dc.contributor.advisorCo1Lattes | http://lattes.cnpq.br/1439066760889922 | pt_BR |
dc.contributor.referee1 | Vivacqua, Adriana Santarosa | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/6494676052801758 | pt_BR |
dc.contributor.referee2 | Pinheiro, Rejane Sobrino | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5914237903221204 | pt_BR |
dc.description.resumo | O sistema de saúde pública do Brasil (SUS) disponibiliza dados de eventos de saúde como internações e nascimentos de forma anonimizada para uso público. Tais dados são oferecidos em padrões e tipos de arquivos oriundos de sistemas legados, e que não são adequados para análise a partir de técnicas e sistemas modernos. O objetivo deste trabalho é realizar uma extração, transformação e carga (ETL) dos dados da base de internações (SIHSUS) para um banco de dados NoSQL, produzindo um ambiente analítico adequado para a aplicação de técnicas de estatística, aprendizado de máquina e mineração de dados a fim de se extrair conhecimentos úteis para o entendimento e melhoramento da saúde pública. Foi escolhido o banco de dados orientado a documento, MongoDB, e o processo envolveu etapas de conversão dos arquivos originais, importação para o banco e agregação dos dados de tabelas auxiliares à tabela principal. Após o processo de ETL, foram obtidas as bases de internações em um ambiente analítico no MongoDB, do estado do Rio de Janeiro, entre os anos de 2010 a 2015. A metodologia pode ser estendida para a obtenção das bases do Brasil inteiro, assim como para a realização do mesmo processo em outras bases, como a de nascimento (SINASC) e mortalidade (SIM). | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Instituto de Computação | pt_BR |
dc.publisher.initials | UFRJ | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS | pt_BR |
dc.embargo.terms | aberto | pt_BR |
Appears in Collections: | Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
RSSampaio.pdf | 1.45 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.