Protótipo de Pesquisa Documental para a Polícia Militar do Paraná com Retrieval Augmented Generation e Gemini AI em Ambiente Dockerizado
Prototype for Document Retrieval for the Military Police of Paraná with Retrieval Augmented Generation and Gemini AI in a Dockerized Environment
DOI:
https://doi.org/10.51473/rcmos.v1i2.2024.736Resumo
Este trabalho apresenta o desenvolvimento de um protótipo de pesquisa documental para as diretrizes e doutrinas da Polícia Militar do Paraná (PMPR) utilizando a estratégia Retrieval Augmented Generation (RAG) e o modelo de linguagem Gemini AI Flash 1.5. O protótipo foi implementado em um ambiente containerizado com Docker, visando garantir portabilidade e reprodutibilidade. A estratégia RAG combina a busca tradicional com modelos de linguagem avançados para gerar respostas mais precisas e completas às consultas dos usuários. O protótipo foi testado com perguntas reais e os resultados preliminares demonstram a capacidade do sistema em compreender as perguntas e fornecer respostas relevantes, com base nas informações contidas nos documentos da PMPR. O trabalho discute o potencial do protótipo para auxiliar os policiais militares no acesso às informações relevantes, superando as limitações da atual forma de pesquisa documental na instituição.
Downloads
Referências
BAUMANN, P. et al. Large Language Models for Retrieval Augmented Generation: A Comprehensive Survey. arXiv preprint arXiv:2308.01186, 2023.
BOETTIGER, C. An introduction to Docker for reproducible research. ACM SIGOPS Operating Systems Review, v. 49, n. 1, p. 71-79, 2015.
BRASIL. Ministério da Justiça e Segurança Pública. Portaria nº 332, de 27 de abril de 2023. Dispõe sobre o Manual de Uso da Força Policial. Diário Oficial da União, Brasília, DF, 28 abr. 2023. Seção 1, p. 47.
LEWIS, P. et al. Retrieval-augmented generation for knowledge-intensive nlp tasks. Advances in Neural Information Processing Systems, v. 33, p. 9459-9474, 2020.
N8N. n8n - Workflow Automation. Disponível em: https://n8n.io/. Acesso em: 06 nov. 2024.
QDRANT. Qdrant - Vector Database. Disponível em: https://qdrant.tech/. Acesso em: 06 nov. 2024.
Downloads
Arquivos adicionais
Publicado
Edição
Seção
Categorias
Licença
Copyright (c) 2024 Cleiton Giacomelli da Silva (Autor/in)
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Este trabalho está licenciado sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0). Isso significa que você tem a liberdade de:
- Compartilhar — copiar e redistribuir o material em qualquer meio ou formato.
- Adaptar — remixar, transformar e construir sobre o material para qualquer propósito, inclusive comercial.
O uso deste material está condicionado à atribuição apropriada ao(s) autor(es) original(is), fornecendo um link para a licença, e indicando se foram feitas alterações. A licença não exige permissão do autor ou da editora, desde que seguidas estas condições.
A logomarca da licença Creative Commons é exibida de maneira permanente no rodapé da revista.
Os direitos autorais do manuscrito podem ser retidos pelos autores sem restrições e solicitados a qualquer momento, mesmo após a publicação na revista.