Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/21240
Type: Trabalho de conclusão de graduação
Title: Caracterização, evolução e identificação de padrões em notícias falsas: uma abordagem voltada à modelagem de tópicos
Author(s)/Inventor(s): Alves, Leonardo Emerson André
Advisor: Sampaio, Jonice de Oliveira
Co-advisor: Silva, Sirius Thadeu Ferreira da
Abstract: As notícias falsas constituem um problema central na sociedade atual. O avanço das tecnologias e mídias digitais tem alavancado esse problema, visto que se caracterizam como meios extremamente rápidos para disseminação de informação. Dessa forma, a disseminação de desinformações pode implicar em diversos problemas para a sociedade, tais como: influenciar processos democráticos, dificultar o contingenciamento de pandemias, ocasionar crises sociais, que podem trazer graves consequências para a população, entre outros. Este estudo tem como intuito a criação de um processo voltado para a caraterização, descrição da evolução e identificação de padrões em notícias com foco no estudo de notícias falsas escritas em português. Nesse sentido, o foco deste trabalho consiste na caracterização das notícias falsas estudadas por meio da análise textual das mesmas a partir da utilização de uma base de dados de notícias coletadas entre 2013 e 2021, com o uso de técnicas de processamento de linguagem natural e modelagem de tópicos. Portanto, este estudo realizou o tratamento e aperfeiçoamento de um corpus com uso de técnicas tanto de limpeza de dados, quanto de Web Scraping, e posteriormente uma análise das notícias falsas desse corpus, com o uso da linguagem de programação Python, e também com o uso de bibliotecas conhecidas para processamento de linguagem natural e modelagem de tópicos, como NLTK, gensim e spaCy; e fazendo uso de algoritmos tradicionais para modelagem de tópicos como Latent Dirichlet Allocation (LDA) e Latent Semantic Analysis (LSA); em conjunto com as bibliotecas para indexação, visualização e análise de dados Pandas, Matplotlib, Seaborn, Numpy; foi possível dessa forma compreender o avanço dos assuntos e padrões de escrita de notícias falsas, criando um dicionário que caracteriza tais notícias.
Keywords: Fake news
Análise de texto
Processamento de linguagem natural
Modelagem de dados
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Production unit: Instituto de Computação
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 28-Jun-2023
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
LEAAlves.pdf3.72 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.