“AÑO DE LA UNIDAD, PAZ Y DESARROLLO”
UNIVERSIDAD NACIONAL DE INGENIERÍA
Análisis de Dataset de “Pacientes con Dengue del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita” en Weka
.Curso: Tópicos Especiales en Ingeniería de Sistemas - Inteligencia Artificial.
Docente: Dr. Wester Zela Moraya.
Alumno: Br. Eric José Jara Palacios.
Descripción:
Se busca con este articulo describir como los Pacientes de Dengue en el Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita en el año 2023, puedan tener una propuesta de solución de esta problemática con el apoyo de las tecnologías de información, más específicamente con Machine Learning que permite encontrar los diagnósticos con el modelo más eficiente.
Objetivos
- 1. La definición de la dataset, visualización de los metadatos, el diccionario de datos y el listado de los datos.
2. Limpieza del dataset de datos atípicos o que no sean comprendidas en el análisis.
3. Resolver el problema del dataset de los pacientes de dengue con los algoritmos de clasificaciones (o regresión).- 3.1. Probar los siguientes algoritmos: Árbol de Decisión, Random Forest y Redes Neuronales.
3.2. Deducir, ¿Cuál es el modelo más eficiente?
- 4.1. Usar el algoritmo KMeans.
4.2. Seleccionar la cantidad de Clusters para el modelo de agrupamiento.
- 3.1. Probar los siguientes algoritmos: Árbol de Decisión, Random Forest y Redes Neuronales.
Este trabajo de investigación justifica el comportamiento de la variable del diagnóstico de los pacientes con dengue. El estudio se basó en dato de pacientes que han sido diagnosticado por dengue en el Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita – Piura 2023. Los datos se utilizar de la siguiente manera, 95% de entrenamiento y 5% para pruebas (por motivo que el dataset es un poco limitado).
Los algoritmos de clasificación aplicados a este trabajo de investigación va ser J48, REPTree, Random Forest y Redes Neuronales, además del algoritmo de agrupación K-means. Para el análisis de estos modelos de clasificación y agrupación se va usar el software de código abierto Weka.
Marco Conceptual:
1. La definición de la dataset (visualización de los metadatos, el diccionario de datos y el listado de los datos).
2. Limpieza del dataset de datos atípicos o que no sean comprendidas en el análisis.
3. Resolver el problema del dataset con algoritmos de clasificaciones (o regresión).
- 3.1.Probar los siguientes algoritmos:
- 3.2. Deducir, ¿Cuál es el modelo más eficiente?
4.Resolver el problema del dataset con el algoritmo de Clustering.
- 4.1. Usar el algoritmo KMeans.
Conclusión:
La conclusión de este trabajo se puede apreciar de acuerdo a las métricas analizadas que el virus del dengue es más propenso en jóvenes mayores de edad y que el origen de los diagnósticos denomina que el dengue clásico y el no especificado, surgen porque los pacientes llegan directamente al tópico de emergencia del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita. Gracias a esta información podemos dar recomendaciones, que sugerirán mecanismo de prevención que deberán ser incluidos en las entidades públicas correspondientes (DIRESA, MINSA, Hospitales Pública y Privadas, o Instituciones que ejercen el cuidado de la salud) para erradicar el mosquito del Dengue.
Bibliografías (referencias):
- Estado Peruano. (23 de mayo de 2023). Plataforma Nacional de Datos Abierto del Estado Peruano. Obtenido el Dataset Pacientes con Dengue del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita [HNSLMP]: https://www.datosabiertos.gob.pe/datase ... s-de-paita
- Valero, J; Navarro, Á.; Larios, A.; Julca, J. (21 de diciembre de 2022). Troomes. Obtenido de Resumen de Trabajos de Machine Learning Aplicados en la Educación (Latinoamericana) por Jeannette Monroy García: https://www.troomes.com/viewtopic.php?f ... weka#p8169
- Miembro ‘Daño de la Tormenta’ (24 de septiembre de 2016). StackOverflow. Obtenido la Solución a un Problema de Cadena a valor nominal en Weka: https://stackoverflow.com/questions/396 ... ue-in-weka