Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/11422/26320
| Tipo: | Trabalho de conclusão de graduação |
| Título: | GUARDRAIL: uma abordagem modular para sistemas de segurança em inteligência artificial generativa |
| Autor(es)/Inventor(es): | Bocampagni, Fábio Alves |
| Orientador: | Menasché, Daniel Sadoc |
| Resumo: | Guardrail é um framework de código aberto desenvolvido para proteger Modelos de Linguagem de Grande Escala (LLMs) contra ataques maliciosos como prompt injection e jailbreaks. Seu objetivo é fornecer uma solução de segurança baseada em IA para filtragem evalidação de consultas em tempo real. O framework adota uma arquitetura modular inovadora, inspirada no paradigma de mixture of experts, que combina eficientemente filtros leves e semânticos. Para identificar e bloquear entradas prejudiciais antes que sejam processadas pelos modelos generativos, o Guardrail utiliza uma combinação de análise de entropia, análise de similaridade com embeddings de ataques conhecidos e detecção de anomalias por meio de um modelo SVM. Avaliado em 1000 prompts, obteve um F1-score de 0,9844 no modo paralelo e 0,9711 no modo sequencial, demonstrando um desempenho superior em relação a frameworks como PromptGuard e LLM-Guard. Os resultados empíricos validam a eficácia da combinação de módulos especializados na segurança de LLMs. As principais contribuições deste trabalho incluem o desenvolvimento do Guardrail como um framework modular e de código aberto, a proposição de sua arquitetura de mixture of experts, a demonstração empírica de sua superioridade e a validação da contribuição individual de cada módulo. |
| Palavras-chave: | Segurança Aprendizado de máquina Inteligência artificial generativa Security Machine learning Prompt injection |
| Assunto CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Unidade produtora: | Instituto de Computação |
| Editora: | Universidade Federal do Rio de Janeiro |
| Data de publicação: | 17-Jun-2025 |
| País de publicação: | Brasil |
| Idioma da publicação: | por |
| Tipo de acesso: | Acesso Aberto |
| Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| FABocampagni.pdf | 559.06 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.