Proyectos en Inteligencia Artificial
Stephanny3011

Ranking Troomes
Mensajes: 2
Registrado: 08 Ago 2024, 21:40

Sistema inteligente de soporte técnico para diagnóstico y reparación de microondas con NLP

Mensaje por Stephanny3011 » 11 Ago 2025, 08:21

Sistema inteligente de soporte técnico para diagnóstico y reparación de microondas mediante técnicas de NLP
[/b]

1st Stephanny Gabriela Sanchez Bautista
2nd Diego Fernandez Álvarez
3rd Jovani Quispe Quispe
Universidad Nacional de Ingeniería
Lima, Perú

Resumen
Este trabajo presenta un sistema basado en Retrieval-Augmented Generation (RAG) para el diagnóstico de microondas, integrando evaluación multi-modelo, comparación automática y fine-tuning específico al dominio. El sistema evalúa simultáneamente cuatro modelos de embeddings distintos manteniendo la arquitectura FAISS, incorporando además un módulo de entrenamiento supervisado sobre un corpus en español peruano que describe fallas, causas y soluciones de microondas.

Los resultados experimentales muestran mejoras de entre 5 % y 15 % en métricas clave como Precision@3 y Accuracy@1 respecto al modelo base, confirmando que la selección automática del modelo óptimo y su adaptación al dominio mejoran el rendimiento general. La propuesta demuestra que es posible implementar una solución accesible, escalable y de bajo costo para el soporte técnico doméstico.

Palabras clave: Procesamiento de lenguaje natural, RAG, FAISS, BERT multilingüe, soporte técnico, diagnóstico de electrodomésticos.

I. Introducción
El diagnóstico de fallas en electrodomésticos como microondas suele ser complejo para usuarios no técnicos. Las guías de usuario existentes son técnicas o incompletas, y el soporte especializado es costoso y lento. Este trabajo propone un asistente inteligente de soporte técnico que usa comprensión de lenguaje natural para guiar al usuario en la identificación de causas y soluciones, optimizando así la precisión y la rapidez de respuesta.

El sistema se basa en RAG, integrando Large Language Models (LLMs) con búsqueda vectorial en FAISS y embeddings generados por modelos BERT multilingües, entrenados con un corpus especializado en español peruano.

II. Identificación del problema
Acceso limitado a soporte técnico: alto costo y tiempos prolongados.

Documentación poco amigable: lenguaje técnico inaccesible para usuarios domésticos.

Baja reutilización de experiencias previas: consultas similares no se aprovechan para mejorar la respuesta.

Riesgo de diagnósticos erróneos: los LLMs sin contexto tienden a generar “alucinaciones”.

III. Objetivos
Objetivo general
Implementar un sistema de recuperación y diagnóstico automático de fallas en microondas basado en RAG y BERT multilingüe.

Objetivos específicos

Construir un corpus en español peruano con descripciones de fallas, causas y soluciones.

Implementar una arquitectura RAG con FAISS y embeddings semánticos.

Evaluar múltiples modelos de embeddings para seleccionar el más eficiente.

Aplicar fine-tuning al modelo óptimo para mejorar métricas clave.

Validar el rendimiento mediante consultas reales y métricas estándar.

IV. Solución propuesta
El sistema procesa consultas en lenguaje natural y devuelve las posibles causas y soluciones más relevantes. Incluye:

Pipeline offline: carga y validación del corpus (1000 entradas), generación de embeddings, construcción de índices FAISS.

Pipeline online: preprocesamiento de la consulta, cálculo de embedding, búsqueda en FAISS, construcción de respuesta.

Comparación multi-modelo: evaluación simultánea de cuatro modelos de embeddings.

Fine-tuning: entrenamiento supervisado con pares positivos y negativos para optimizar la similitud semántica.

V. Descripción del corpus
Nombre: “corpus_microondas_final_con_id”

Registros: 1000 casos reales o simulados.

Estructura: id, problema, causa, solución.

Cobertura: fallas mecánicas, eléctricas, de control y de uso.

Variedad lingüística: registro coloquial (40 %), neutral (50 %), jerga técnica/local (10 %).

Fuente del corpus:

Fuente del código:

Paper:
Adjuntos
Borrador-EntregableFinal.zip
(27.39 MiB) Descargado 12 veces


Responder