Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/26975

Type: Trabalho de conclusão de graduação
Title: Estruturando o conhecimento jurídico: uma análise comparativa de sistemas de OpenIE aplicada ao domínio de inovação
Author(s)/Inventor(s): Aquino, Gustavo Martins Ferreira de
Advisor: Lopes, Giseli Rabello
Co-advisor: Silva, Vivian dos Santos
Abstract: Este trabalho investiga e compara o desempenho de diferentes gerações de sistemas de Extração Aberta de Informações na tarefa de estruturar o conhecimento contido no domínio legal brasileiro, com foco na legislação sobre inovação. A pesquisa aborda o desafio central imposto pela estrutura hierárquica e semanticamente fragmentada dos documentos legais, um obstáculo para ferramentas de Processamento de Linguagem Natural, propondo como contribuição metodológica o desenvolvimento de um pipeline de pré-processamento para a reconstrução de sentenças semanticamente coesas. Sobre um corpus representativo de 26 documentos legais, foram avaliadas três abordagens distintas: um modelo baseado em regras, outro em redes neurais junto a transformers e Modelos de Linguagem de Grande Escala (LLMs). Na ausência de um Gold Standard, a avaliação foi conduzida em duas etapas: uma análise preliminar diagnóstica, que confirmou a necessidade de tratamento dos resultados brutos, seguida por uma análise final sobre os resultados refinados através de uma etapa de pós-processamento. Essa etapa contou com a conversão das triplas extraídas em Grafos de Conhecimento, a aplicação de filtros linguísticos e agrupamento semântico. Os resultados demonstraram a superioridade dos LLMs, que geraram grafos de conhecimento com maior coesão e relevância semântica, identificando com mais eficácia os atores e conceitos do ecossistema de inovação. O estudo conclui que, com a metodologia adequada, é viável extrair conhecimento de textos legais complexos e que os avanços recentes em PLN resultam em uma estruturação de conhecimento significativamente mais robusta, oferecendo uma base sólida para futuras ferramentas de análise no direito brasileiro.
Keywords: Extração aberta de informação
Grafos de conhecimento
Modelos de linguagem de grande escala
Análise de redes
Reconstrução semântica
Embeddings contextuais
Open information extraction
Knowledge graphs
Large language models
Network analysis
Semantic reconstruction
Contextual embeddings
Subject CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Production unit: Instituto de Computação
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: 21-Aug-2025
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
GMFAquino.pdf1.63 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.