Proyectos en Inteligencia Artificial
Stephanny3011

Ranking Troomes
Mensajes: 2
Registrado: 08 Ago 2024, 21:40

Sistema Inteligente de Soporte Técnico para Diagnóstico y Reparación de Microondas basado en Comprensión de Lenguaje Nat

Mensaje por Stephanny3011 » 11 Ago 2025, 08:08

Sistema inteligente de soporte técnico para diagnóstico y reparación de microondas con NLP y BERT
Autores: Stephanny Gabriela Sanchez Bautista; Diego Fernandez Álvarez; Jovani Quispe Quispe

Resumen
Se presenta un asistente de soporte técnico que emplea Retrieval-Augmented Generation (RAG), embeddings basados en BERT multilingüe y búsqueda vectorial con FAISS para diagnosticar fallas en microondas. El sistema compara múltiples modelos de embeddings y aplica fine-tuning específico al dominio, logrando mejoras sustanciales en precisión y ranking de resultados, con tiempos de respuesta menores a 100 ms.

Palabras clave: NLP, RAG, BERT multilingüe, FAISS, soporte técnico, diagnóstico de electrodomésticos.

Problema
Documentación técnica poco accesible para usuarios no técnicos.
Soporte especializado costoso y lento para averías menores.
LLMs sin recuperación tienden a generar respuestas no confiables.

Objetivo
Implementar un sistema de recuperación y diagnóstico automático para microondas que combine RAG + FAISS + BERT multilingüe, con evaluación multimodelo y fine-tuning.

Metodología (pipeline)

Corpus: 1 000 casos en español peruano (problema, causa, solución).
Preprocesamiento: normalización, tokenización, eliminación de stopwords.
Embeddings: modelos BERT/Sentence-Transformers (ej. distiluse-base-multilingual-cased-v1).
Índice: FAISS (IndexFlatL2) para búsqueda por similitud.
Consulta: cálculo del embedding de la pregunta y recuperación Top-k.
Comparación multimodelo: índices independientes por modelo para evaluación directa.
Fine-tuning: pares positivos/negativos con CosineSimilarityLoss.

Dataset
Nombre: “corpus_microondas_final_con_id”
Fuente:

Estructura: id, problema, causa, solución.

Cobertura: fallas mecánicas, eléctricas, de control y de uso.

Registro lingüístico: 40 % coloquial, 50 % neutral, 10 % jerga técnica/local.

Técnicas
BERT multilingüe (Sentence-Transformers) para embeddings semánticos.
FAISS para recuperación vectorial eficiente.
RAG para reducir alucinaciones y dar respuestas trazables.
Métricas: Recall, Precision, Accuracy, MRR.

Fuente del código:

Archivo adjunto:


Responder