Please use this identifier to cite or link to this item:
http://hdl.handle.net/11422/26975
| Type: | Trabalho de conclusão de graduação |
| Title: | Estruturando o conhecimento jurídico: uma análise comparativa de sistemas de OpenIE aplicada ao domínio de inovação |
| Author(s)/Inventor(s): | Aquino, Gustavo Martins Ferreira de |
| Advisor: | Lopes, Giseli Rabello |
| Co-advisor: | Silva, Vivian dos Santos |
| Abstract: | Este trabalho investiga e compara o desempenho de diferentes gerações de sistemas de Extração Aberta de Informações na tarefa de estruturar o conhecimento contido no domínio legal brasileiro, com foco na legislação sobre inovação. A pesquisa aborda o desafio central imposto pela estrutura hierárquica e semanticamente fragmentada dos documentos legais, um obstáculo para ferramentas de Processamento de Linguagem Natural, propondo como contribuição metodológica o desenvolvimento de um pipeline de pré-processamento para a reconstrução de sentenças semanticamente coesas. Sobre um corpus representativo de 26 documentos legais, foram avaliadas três abordagens distintas: um modelo baseado em regras, outro em redes neurais junto a transformers e Modelos de Linguagem de Grande Escala (LLMs). Na ausência de um Gold Standard, a avaliação foi conduzida em duas etapas: uma análise preliminar diagnóstica, que confirmou a necessidade de tratamento dos resultados brutos, seguida por uma análise final sobre os resultados refinados através de uma etapa de pós-processamento. Essa etapa contou com a conversão das triplas extraídas em Grafos de Conhecimento, a aplicação de filtros linguísticos e agrupamento semântico. Os resultados demonstraram a superioridade dos LLMs, que geraram grafos de conhecimento com maior coesão e relevância semântica, identificando com mais eficácia os atores e conceitos do ecossistema de inovação. O estudo conclui que, com a metodologia adequada, é viável extrair conhecimento de textos legais complexos e que os avanços recentes em PLN resultam em uma estruturação de conhecimento significativamente mais robusta, oferecendo uma base sólida para futuras ferramentas de análise no direito brasileiro. |
| Keywords: | Extração aberta de informação Grafos de conhecimento Modelos de linguagem de grande escala Análise de redes Reconstrução semântica Embeddings contextuais Open information extraction Knowledge graphs Large language models Network analysis Semantic reconstruction Contextual embeddings |
| Subject CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Production unit: | Instituto de Computação |
| Publisher: | Universidade Federal do Rio de Janeiro |
| Issue Date: | 21-Aug-2025 |
| Publisher country: | Brasil |
| Language: | por |
| Right access: | Acesso Aberto |
| Appears in Collections: | Ciência da Computação |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| GMFAquino.pdf | 1.63 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.