Evaluation of machine learning classifiers in ordinal multiclass fake news detection scenario

Coutinho, Igor Bichara de Azeredo

Pantheon Repositório Institucional da UFRJ

Coleta, preserva e divulga a produção acadêmica digital em todas as áreas do conhecimento.
São os ativos do repositório, além de teses e dissertações da UFRJ, artigos científicos, livros eletrônicos, capítulos de livros e trabalhos apresentados em eventos por professores, pesquisadores, funcionários administrativos e alunos de mestrado e doutorado.

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/14047

Tipo:	Dissertação
Título:	Evaluation of machine learning classifiers in ordinal multiclass fake news detection scenario
Título(s) alternativo(s):	Avaliação de classificadores de aprendizado de máquina em cenário multiclasse de detecção de fake news
Autor(es)/Inventor(es):	Coutinho, Igor Bichara de Azeredo
Orientador:	Pedreira, Carlos Eduardo
Coorientador:	Xexéo, Geraldo Bonorino
Resumo:	[PT] Essa dissertação tem como objetivo avaliar classificadores de aprendizado de máquina e suas técnicas no problema de detecção de fake news. Algoritmos preditivos nesse contexto podem produzir resultados diferentes de acordo com a variância da rotulação de datasets causada pela ambiguidade e subjetividade da semântica textual. O dataset LIAR foi utilizado nos experimentos desta dissertação. Este dataset foi criado a partir de dados da agência de checagem de fatos PolitiFact que consiste em rótulos com 6 classes ordinais que por sua vez posicionam as declarações políticas no intervalo entre completamente falsa e completamente verdadeira. O experimento original do autor do dataset alcançou 27.4% de acurácia usando redes neurais híbridas com camadas convolucionais CNN e recorrentes LSTM bidirecionais. A contribuição principal deste trabalho consiste na avaliação de classificadores mais simples usando diferentes técnicas de pré-processamento e seleção de atributos. Além disso, o trabalho explora a natureza ordinal das classes usando um método ensemble de classificadores binários já estabelecido na literatura.
Resumo:	[EN] This thesis intends to explore machine learning classifiers and techniques to address the problem of fake news detection. Prediction algorithms can generate different results in this problem due to variance in dataset labeling caused by ambiguity and subjectivity of semantic text. The LIAR Dataset was used in the experiments of this thesis. This dataset derived from PolitiFact fact-checking agency data which is composed of a 6-class ordinal labeling that places political statements in the range between completely false and completely true statements. The original experiment that created the dataset achieved 27.4% class accuracy using hybrid CNN and Bi-Directional LSTM networks. The main contribution of this work consists of evaluating simpler classifiers focusing on using different preprocessing and feature selection techniques when modeling metadata and text features. Furthermore, this work explores the ordinal characteristics of the class labels and uses simple binary classifiers in an ordinal ensemble method already established in the literature.
Palavras-chave:	Fake news detection Ordinal classification Fake news feature extraction
Assunto CNPq:	CNPQ::ENGENHARIAS
Programa:	Programa de Pós-Graduação em Engenharia de Sistemas e Computação
Unidade produtora:	Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Editora:	Universidade Federal do Rio de Janeiro
Data de publicação:	Nov-2019
País de publicação:	Brasil
Idioma da publicação:	eng
Tipo de acesso:	Acesso Aberto
Aparece nas coleções:	Engenharia de Sistemas e Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
IgorBicharaDeAzeredoCoutinho.pdf		1.23 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas