Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/21240
Tipo: Trabalho de conclusão de graduação
Título: Caracterização, evolução e identificação de padrões em notícias falsas: uma abordagem voltada à modelagem de tópicos
Autor(es)/Inventor(es): Alves, Leonardo Emerson André
Orientador: Sampaio, Jonice de Oliveira
Coorientador: Silva, Sirius Thadeu Ferreira da
Resumo: As notícias falsas constituem um problema central na sociedade atual. O avanço das tecnologias e mídias digitais tem alavancado esse problema, visto que se caracterizam como meios extremamente rápidos para disseminação de informação. Dessa forma, a disseminação de desinformações pode implicar em diversos problemas para a sociedade, tais como: influenciar processos democráticos, dificultar o contingenciamento de pandemias, ocasionar crises sociais, que podem trazer graves consequências para a população, entre outros. Este estudo tem como intuito a criação de um processo voltado para a caraterização, descrição da evolução e identificação de padrões em notícias com foco no estudo de notícias falsas escritas em português. Nesse sentido, o foco deste trabalho consiste na caracterização das notícias falsas estudadas por meio da análise textual das mesmas a partir da utilização de uma base de dados de notícias coletadas entre 2013 e 2021, com o uso de técnicas de processamento de linguagem natural e modelagem de tópicos. Portanto, este estudo realizou o tratamento e aperfeiçoamento de um corpus com uso de técnicas tanto de limpeza de dados, quanto de Web Scraping, e posteriormente uma análise das notícias falsas desse corpus, com o uso da linguagem de programação Python, e também com o uso de bibliotecas conhecidas para processamento de linguagem natural e modelagem de tópicos, como NLTK, gensim e spaCy; e fazendo uso de algoritmos tradicionais para modelagem de tópicos como Latent Dirichlet Allocation (LDA) e Latent Semantic Analysis (LSA); em conjunto com as bibliotecas para indexação, visualização e análise de dados Pandas, Matplotlib, Seaborn, Numpy; foi possível dessa forma compreender o avanço dos assuntos e padrões de escrita de notícias falsas, criando um dicionário que caracteriza tais notícias.
Palavras-chave: Fake news
Análise de texto
Processamento de linguagem natural
Modelagem de dados
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade produtora: Instituto de Computação
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: 28-Jun-2023
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
LEAAlves.pdf3.72 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.