Este trabajo presenta una extensión avanzada del sistema RAG original para diagnóstico de microondas, incorporando evaluación multi-modelo, comparación automatizada y fine-tuning personalizado. El sistema expandido evalúa simultáneamente cuatro modelos de embeddings diferentes (distiluse-base-multilingual-cased-v1, hiiamsid/sentence_similarity_spanish_es, paraphrase-multilingual-MiniLM-L12-v2, y paraphrase-multilingual-mpnet-base-v2) manteniendo la arquitectura FAISS original. Se implementó un framework de fine-tuning que adapta el modelo de mejor rendimiento al corpus específico de microondas en español peruano. Los resultados experimentales muestran mejoras consistentes en precisión y recall, con el modelo fine-tuned alcanzando mejoras de 5-15% en métricas clave comparado con el baseline original.
I.INTRODUCCIÓN
Este documento presenta una solución innovadora para el diagnóstico y la reparación de electrodomésticos comunes (Microondas para el escenario problemático del estudio). Se propone el desarrollo de un asistente de soporte técnico inteligente que aprovecha la comprensión del lenguaje natural para guiar a los usuarios. La motivación principal radica en la hipótesis de que la selección automática del modelo óptimo y su posterior adaptación mediante fine-tuning pueden mejorar significativamente el rendimiento del sistema RAG en el dominio específico de diagnóstico de electrodomésticos en español peruano.. El sistema se basa en técnicas avanzadas como RAG (Retrieval Augmented Generation) y LLMs (Large Language Models), integradas a través de la librería LangChain, para ofrecer respuestas precisas, seguras y contextualizadas en español a los problemas más frecuentes que se pueden dar con los electrodomésticos.
II. IDENTIFICACIÓN DEL PROBLEMA
El problema principal radica en la dificultad que enfrentan las personas para diagnosticar y reparar fallas en sus electrodomésticos. Las guías de usuario existentes a menudo son demasiado técnicas o incompletas, lo que las hace inaccesibles para el público general. Por otro lado, el soporte técnico especializado es costoso y consume mucho tiempo, incluso para averías menores. Esta situación a menudo lleva a la frustración de los usuarios y, en muchos casos, al abandono de aparatos que podrían haber sido reparados fácilmente. Se identifica una clara necesidad de una herramienta accesible y fácil de usar que pueda llenar este vacío.
III.OBJETIVOS
Objetivo General
Implementar un agente inteligente de recuperación de información usando LangChain + BERT, con un corpus en español peruano de fallas en microondas.
Objetivos Específicos
•Diseñar un corpus estructurado en español peruano con descripciones de fallas en microondas, incluyendo sus causas y soluciones, con diversidad lingüística (formal, coloquial, jerga técnica y popular).
•Implementar un sistema de recuperación de información semántica basado en un modelo multilingüe (BERT) usando la arquitectura RAG (Retrieval-Augmented Generation) con LangChain y FAISS.
•Construir un índice vectorial eficiente a partir de los embeddings generados desde el corpus utilizando técnicas de sentence-transformers para búsquedas semánticas.
•Desarrollar una interfaz de consulta en lenguaje natural que permita a usuarios no técnicos ingresar
2problemas de microondas y recibir posibles causas y soluciones automatizadas.
•Evaluar el desempeño del sistema mediante métricas estándar de recuperación de información como Recall@k, Precision@k, Accuracy@1 y MRR, utilizando un conjunto de pruebas anotadas.
•Demostrar la aplicabilidad del sistema en escenarios reales mediante ejemplos y análisis de casos típicos reportados por usuarios en contextos domésticos peruanos.