Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11422/26320

Especie: Trabalho de conclusão de graduação
Título : GUARDRAIL: uma abordagem modular para sistemas de segurança em inteligência artificial generativa
Autor(es)/Inventor(es): Bocampagni, Fábio Alves
Tutor: Menasché, Daniel Sadoc
Resumen: Guardrail é um framework de código aberto desenvolvido para proteger Modelos de Linguagem de Grande Escala (LLMs) contra ataques maliciosos como prompt injection e jailbreaks. Seu objetivo é fornecer uma solução de segurança baseada em IA para filtragem evalidação de consultas em tempo real. O framework adota uma arquitetura modular inovadora, inspirada no paradigma de mixture of experts, que combina eficientemente filtros leves e semânticos. Para identificar e bloquear entradas prejudiciais antes que sejam processadas pelos modelos generativos, o Guardrail utiliza uma combinação de análise de entropia, análise de similaridade com embeddings de ataques conhecidos e detecção de anomalias por meio de um modelo SVM. Avaliado em 1000 prompts, obteve um F1-score de 0,9844 no modo paralelo e 0,9711 no modo sequencial, demonstrando um desempenho superior em relação a frameworks como PromptGuard e LLM-Guard. Os resultados empíricos validam a eficácia da combinação de módulos especializados na segurança de LLMs. As principais contribuições deste trabalho incluem o desenvolvimento do Guardrail como um framework modular e de código aberto, a proposição de sua arquitetura de mixture of experts, a demonstração empírica de sua superioridade e a validação da contribuição individual de cada módulo.
Materia: Segurança
Aprendizado de máquina
Inteligência artificial generativa
Security
Machine learning
Prompt injection
Materia CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade de producción: Instituto de Computação
Editor: Universidade Federal do Rio de Janeiro
Fecha de publicación: 17-jun-2025
País de edición : Brasil
Idioma de publicación: por
Tipo de acceso : Acesso Aberto
Aparece en las colecciones: Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
FABocampagni.pdf559.06 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.