Página 1 de 1

ASISTENTE CONVERSACIONAL BASADO EN LLAMA 2 7B -FINE TUNNIG Y RAG - APOYO A FUNCIONARIO EN INVIERTE.PE

Publicado: 09 Ago 2025, 17:52
por 20246699E
ASISTENTE CONVERSACIONAL INTELIGENTE BASADO EN LLAMA Y RECUPERACIÓN AUMENTADA (RAG) PARA MITIGAR LIMITACIONES TÉCNICAS Y NORMATIVAS EN LA FORMULACIÓN DE PROYECTOS PÚBLICOS EN INVIERTE.PE

Maestría en Inteligencia Artificial - Universidad Nacional de Ingeniería
III Ciclo - Curso: Procesamiento de Lenguaje Natural - Docente: Western Zela
Lima, Perú

Aradiel Hilario hilario.aradiel.c@uni.pe
García Fernando fernando.garcia.a@uni.pe
Estacio Deiby deiby.estacio.s@uni.pe
Meza Moisés moises.meza.r@uni.pe


Resumen—El presente estudio propone una solución innovadora, escalable y jurídicamente trazable frente a una problemática estructural que afecta la eficiencia y legalidad en la formulación de proyectos públicos en el Perú: la limitada capacidad normativa y técnica de los gobiernos subnacionales en el uso del sistema Invierte.pe. Informes oficiales del Ministerio de Economía y Finanzas (MEF) han evidenciado que gran parte de los expedientes técnicos presentan errores normativos, omisiones legales o interpretaciones incorrectas del marco regulador, lo que genera observaciones frecuentes, retrasos en el ciclo de inversión y deficiente ejecución presupuestal.
Ante esta situación, se desarrolla un asistente conversacional, diseñado específicamente para responder consultas normativas en el contexto del sistema Invierte.pe, utilizando técnicas avanzadas de procesamiento de lenguaje natural (PLN) e inteligencia artificial. La solución se fundamenta en el modelo LLaMA 2–7B, entrenado con 1000 pares de preguntas respuestas elaboradas por especialistas en inversiones públicas, y ajustado mediante Low-Rank Adaptation (LoRA), e integrado con una arquitectura de Recuperación Aumentada (RAG) basada en FAISS. Esta arquitectura permite al asistente recuperar documentos jurídicos pertinentes y generar respuestas auditables, coherentes y contextualizadas al marco legal peruano.
La metodología empleada incluyó la construcción de un dataset supervisado con más de 1000 pares pregunta–respuesta validados jurídicamente, y la implementación de un pipeline de entrenamiento y evaluación bajo estándares de calidad técnica y legal. Se utilizaron métricas como BLEU, Legal Accuracy y tiempo de respuesta promedio, alcanzando resultados sobresalientes: una precisión normativa del 94.3%, tiempos de respuesta inferiores a 2 segundos.
El asistente fue desplegado mediante una arquitectura modular basada en microservicios, permitiendo su escalabilidad e integración institucional. Además, se incorporó un pipeline MLOps que garantiza su actualización continua. En conjunto, esta propuesta no solo mejora la calidad de los expedientes técnicos, sino que contribuye a fortalecer la capacidad institucional, promover la transparencia y asegurar el cumplimiento del marco normativo vigente en la inversión pública del país.