Usando permutation based indexing na detecção de plágio

Rebelo, Hugo Diniz

Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/14056

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Xexéo, Geraldo Bonorino	-
dc.contributor.author	Rebelo, Hugo Diniz	-
dc.date.accessioned	2021-04-05T02:34:04Z	-
dc.date.available	2023-12-21T03:07:33Z	-
dc.date.issued	2019-09	-
dc.identifier.uri	http://hdl.handle.net/11422/14056	-
dc.description.abstract	Extrinsic text plagiarism detection is a document evaluation process, in which we analyze its content for possible plagiarism by comparing directly with potential source documents. The identification of extrinsic plagiarism can be divided into three stages, Heuristic Retrieval, Detailed Analysis and Postprocessing. This work will focus on the Heuristic Retrieval stage, and for that we will use the Permutation Based Indexing(PBI) approach, which was proposed as a new approach to the calculation of similarity between objects, having as a differential the reduction of the number of comparisons in the dataset, comparing the query only with the pivots objects, which are objects of the dataset itself chosen in the pivot selection step, considering to choose the objects that best represent the dataset as a whole. In addition to using the PBI technique, to add value to this work, this work will create variations on existing pruning techniques, based on a "pruning" of pivots, which removes pivots that do not have much influence on a given query.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal do Rio de Janeiro	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Plágio	pt_BR
dc.subject	Permutation based indexing	pt_BR
dc.subject	Recuperação de informação	pt_BR
dc.title	Usando permutation based indexing na detecção de plágio	pt_BR
dc.title.alternative	Using permutation based indexing in plagiarism detection	pt_BR
dc.type	Dissertação	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/4783565791787812	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/9830472381626128	pt_BR
dc.contributor.referee1	Silva, Geraldo Zimbrão da	-
dc.contributor.referee2	Alvim, Leandro Guimarães Marques	-
dc.description.resumo	A identificação de plágio Extrínseco é um processo de avaliação de um documento, no qual analisamos o seu conteúdo em busca de um possível plágio comparando de forma direta com possíveis documentos fontes. A identificação de plágio Extrínseco pode ser dividido em três etapas, A Busca Heurística, Analise Detalhada e o Pós-processamento. Neste trabalho iremos focar na etapa da Busca Heurística, e para isso utilizaremos a abordagem Permutation Based Indexing (PBI), que foi proposta como uma nova abordagem para o cálculo de similaridade entre objetos, tendo como diferencial a redução da quantidade de comparações no dataset, comparando a consulta somente com os objetos pivots, que são objetos do próprio dataset escolhidos na etapa de seleção de pivot, com a ideia de escolher os objetos que melhor representam o dataset como todo. Além da utilização da técnica do PBI, o trabalho terá como uma agregação de valor a criação de variações das técnicas já existentes de pruning, baseada numa "poda"dos pivots, que retira pivots que não tenham muita influência em uma determinada consulta.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Engenharia de Sistemas e Computação	pt_BR
dc.publisher.initials	UFRJ	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS	pt_BR
dc.embargo.terms	aberto	pt_BR
Appears in Collections:	Engenharia de Sistemas e Computação

Files in This Item:

File	Description	Size	Format
HugoDinizRebelo.pdf		995.57 kB	Adobe PDF	View/Open

Show simple item record Recommend this item View Statistics

Pantheon Institutional repository