Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/26320

Tipo: Trabalho de conclusão de graduação
Título: GUARDRAIL: uma abordagem modular para sistemas de segurança em inteligência artificial generativa
Autor(es)/Inventor(es): Bocampagni, Fábio Alves
Orientador: Menasché, Daniel Sadoc
Resumo: Guardrail é um framework de código aberto desenvolvido para proteger Modelos de Linguagem de Grande Escala (LLMs) contra ataques maliciosos como prompt injection e jailbreaks. Seu objetivo é fornecer uma solução de segurança baseada em IA para filtragem evalidação de consultas em tempo real. O framework adota uma arquitetura modular inovadora, inspirada no paradigma de mixture of experts, que combina eficientemente filtros leves e semânticos. Para identificar e bloquear entradas prejudiciais antes que sejam processadas pelos modelos generativos, o Guardrail utiliza uma combinação de análise de entropia, análise de similaridade com embeddings de ataques conhecidos e detecção de anomalias por meio de um modelo SVM. Avaliado em 1000 prompts, obteve um F1-score de 0,9844 no modo paralelo e 0,9711 no modo sequencial, demonstrando um desempenho superior em relação a frameworks como PromptGuard e LLM-Guard. Os resultados empíricos validam a eficácia da combinação de módulos especializados na segurança de LLMs. As principais contribuições deste trabalho incluem o desenvolvimento do Guardrail como um framework modular e de código aberto, a proposição de sua arquitetura de mixture of experts, a demonstração empírica de sua superioridade e a validação da contribuição individual de cada módulo.
Palavras-chave: Segurança
Aprendizado de máquina
Inteligência artificial generativa
Security
Machine learning
Prompt injection
Assunto CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Unidade produtora: Instituto de Computação
Editora: Universidade Federal do Rio de Janeiro
Data de publicação: 17-Jun-2025
País de publicação: Brasil
Idioma da publicação: por
Tipo de acesso: Acesso Aberto
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
FABocampagni.pdf559.06 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.