Temas acerca de Inteligencia Artificial
JohanMB

Ranking Troomes
Mensajes: 3
Registrado: 17 Jun 2024, 21:12

Nombre del articulo: Modelo clasificación supervisado para predecir si un paciente hospitalizado por covid-19 necesita U

Mensaje por JohanMB » 26 Jul 2024, 00:44

Nombre del articulo: Modelo clasificación supervisado para predecir si un paciente hospitalizado por covid-19 necesita UCI

Miembros del equipo:

Cesar Vicuña H.,
Johan Callomamani B.
Adolfo Ramon P.
Paul Cusi H.
Jairo Pinedo T.

Sección: A Grupo 06
Resumen:

El trabajo presenta un modelo de clasificación supervisado para predecir si un paciente hospitalizado por COVID-19 requiere ingreso en la Unidad de Cuidados Intensivos (UCI). Utilizando datos clínicos como edad, sexo, resultados de pruebas de laboratorio y otros factores demográficos, el modelo clasifica a los pacientes en "paciente va a ingresar a UCI" o "paciente no va a ingresar a UCI". Esta herramienta proporciona a los médicos información basada en evidencia para tomar decisiones rápidas y mejorar la asignación de recursos y la atención del paciente.

Desde el inicio de la pandemia de COVID-19, Perú ha enfrentado desafíos significativos, reflejados en altos números de fallecidos, hospitalizados y vacunados. La falta de camas en las UCI ha sido crítica, exacerbada por la limitada infraestructura hospitalaria, la escasez de equipos médicos especializados y la falta de personal capacitado. Esta situación ha llevado a dilemas éticos y dificultades en la atención adecuada y oportuna de los pacientes, aumentando la mortalidad y prolongando la recuperación.

Para abordar esta problemática, el trabajo propone un modelo de clasificación utilizando diferentes algoritmos de aprendizaje automático: árboles de decisión, regresión logística, random forest y XGBoost. Los datos utilizados provienen del portal de Datos Abiertos del Gobierno de Perú, incluyendo información detallada sobre personas fallecidas, hospitalizadas y vacunadas por COVID-19 en 2021. Las variables categóricas incluyen género, estado de fallecimiento, resultados de pruebas, estado de hospitalización y vacunación, mientras que las variables numéricas comprenden edad y fechas de hospitalización y UCI.

El tratamiento de datos incluyó la transformación de fechas en variables numéricas y la separación en dataframes numéricos y categóricos. Se analizaron y limpiaron los datos, eliminando valores atípicos y generando una matriz de correlación para las variables numéricas. Para las variables categóricas, se crearon variables dummies para su procesamiento.

El desempeño de los modelos se evaluó utilizando matrices de confusión, Cada modelo tiene sus ventajas y desventajas:

Árboles de decisión: Intuitivo y fácil de interpretar, pero puede ser limitado para manejar interacciones complejas entre variables.Regresión logística: Eficaz para clasificación binaria y proporciona probabilidades claras, aunque puede no capturar relaciones no lineales adecuadamente.Random forest: Combina múltiples árboles de decisión, mejorando precisión y robustez, pero puede ser más difícil de interpretar.XGBoost: Algoritmo potente de boosting, altamente eficiente y capaz de manejar grandes volúmenes de datos, aunque su complejidad puede dificultar la interpretación.Conclusiones destacan que la implementación de estos modelos puede optimizar la gestión de recursos hospitalarios, y su éxito depende de un flujo continuo de datos actualizados y la colaboración entre expertos en salud y en ciencia de datos. Se recomiendan futuras investigaciones para aumentar la cantidad de datos y variables, y considerar otros modelos para comparar resultados.
dataset: https://www.datosabiertos.gob.pe/datase ... r-covid-19
Adjuntos
TB_FALLECIDO_HOSP_VAC.rar
dataset
(1.81 MiB) Descargado 187 veces


Responder