Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/21240
Type: | Trabalho de conclusão de graduação |
Title: | Caracterização, evolução e identificação de padrões em notícias falsas: uma abordagem voltada à modelagem de tópicos |
Author(s)/Inventor(s): | Alves, Leonardo Emerson André |
Advisor: | Sampaio, Jonice de Oliveira |
Co-advisor: | Silva, Sirius Thadeu Ferreira da |
Abstract: | As notícias falsas constituem um problema central na sociedade atual. O avanço das tecnologias e mídias digitais tem alavancado esse problema, visto que se caracterizam como meios extremamente rápidos para disseminação de informação. Dessa forma, a disseminação de desinformações pode implicar em diversos problemas para a sociedade, tais como: influenciar processos democráticos, dificultar o contingenciamento de pandemias, ocasionar crises sociais, que podem trazer graves consequências para a população, entre outros. Este estudo tem como intuito a criação de um processo voltado para a caraterização, descrição da evolução e identificação de padrões em notícias com foco no estudo de notícias falsas escritas em português. Nesse sentido, o foco deste trabalho consiste na caracterização das notícias falsas estudadas por meio da análise textual das mesmas a partir da utilização de uma base de dados de notícias coletadas entre 2013 e 2021, com o uso de técnicas de processamento de linguagem natural e modelagem de tópicos. Portanto, este estudo realizou o tratamento e aperfeiçoamento de um corpus com uso de técnicas tanto de limpeza de dados, quanto de Web Scraping, e posteriormente uma análise das notícias falsas desse corpus, com o uso da linguagem de programação Python, e também com o uso de bibliotecas conhecidas para processamento de linguagem natural e modelagem de tópicos, como NLTK, gensim e spaCy; e fazendo uso de algoritmos tradicionais para modelagem de tópicos como Latent Dirichlet Allocation (LDA) e Latent Semantic Analysis (LSA); em conjunto com as bibliotecas para indexação, visualização e análise de dados Pandas, Matplotlib, Seaborn, Numpy; foi possível dessa forma compreender o avanço dos assuntos e padrões de escrita de notícias falsas, criando um dicionário que caracteriza tais notícias. |
Keywords: | Fake news Análise de texto Processamento de linguagem natural Modelagem de dados |
Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Production unit: | Instituto de Computação |
Publisher: | Universidade Federal do Rio de Janeiro |
Issue Date: | 28-Jun-2023 |
Publisher country: | Brasil |
Language: | por |
Right access: | Acesso Aberto |
Appears in Collections: | Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
LEAAlves.pdf | 3.72 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.