Temas acerca de Inteligencia Artificial
ericjara96

Ranking Troomes
Mensajes: 2
Registrado: 14 Abr 2023, 19:27

Análisis de Dataset de “Pacientes con Dengue del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita” en Weka

Mensaje por ericjara96 » 16 Jun 2023, 08:38

“AÑO DE LA UNIDAD, PAZ Y DESARROLLO”
UNIVERSIDAD NACIONAL DE INGENIERÍA
Análisis de Dataset de “Pacientes con Dengue del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita” en Weka
.

Curso: Tópicos Especiales en Ingeniería de Sistemas - Inteligencia Artificial.
Docente: Dr. Wester Zela Moraya.
Alumno: Br. Eric José Jara Palacios.

Descripción:
Se busca con este articulo describir como los Pacientes de Dengue en el Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita en el año 2023, puedan tener una propuesta de solución de esta problemática con el apoyo de las tecnologías de información, más específicamente con Machine Learning que permite encontrar los diagnósticos con el modelo más eficiente.

Objetivos
  • 1. La definición de la dataset, visualización de los metadatos, el diccionario de datos y el listado de los datos.
    2. Limpieza del dataset de datos atípicos o que no sean comprendidas en el análisis.
    3. Resolver el problema del dataset de los pacientes de dengue con los algoritmos de clasificaciones (o regresión).
    • 3.1. Probar los siguientes algoritmos: Árbol de Decisión, Random Forest y Redes Neuronales.
      3.2. Deducir, ¿Cuál es el modelo más eficiente?
    4. Resolver el problema del dataset de los pacientes de dengue con el algoritmo de Clustering.
    • 4.1. Usar el algoritmo KMeans.
      4.2. Seleccionar la cantidad de Clusters para el modelo de agrupamiento.
Metodología y Experimentación:
Este trabajo de investigación justifica el comportamiento de la variable del diagnóstico de los pacientes con dengue. El estudio se basó en dato de pacientes que han sido diagnosticado por dengue en el Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita – Piura 2023. Los datos se utilizar de la siguiente manera, 95% de entrenamiento y 5% para pruebas (por motivo que el dataset es un poco limitado).
Los algoritmos de clasificación aplicados a este trabajo de investigación va ser J48, REPTree, Random Forest y Redes Neuronales, además del algoritmo de agrupación K-means. Para el análisis de estos modelos de clasificación y agrupación se va usar el software de código abierto Weka.

Marco Conceptual:
1. La definición de la dataset (visualización de los metadatos, el diccionario de datos y el listado de los datos).







2. Limpieza del dataset de datos atípicos o que no sean comprendidas en el análisis.








3. Resolver el problema del dataset con algoritmos de clasificaciones (o regresión).
  • 3.1.Probar los siguientes algoritmos:






  • 3.2. Deducir, ¿Cuál es el modelo más eficiente?
En este caso del dataset los Pacientes con Dengue del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita, tiene la variable objetivo de los diagnósticos para predecir con fundamentos cual es la mejor manera para luchar con el virus del dengue. El detalle de este trabajo de investigación al tener un dataset limitado, los márgenes de error son escasos por lo consiguiente se tenía el mismo resultado en todos los modelos con un nivel de pruebas de 70%, por lo que se opto a cambiar a 95% de entrenamiento y 5% de pruebas, para observar que modelo se desenvuelve más eficientemente. En este caso los modelos J48, Random Forest y MultilayerPerceptron (Redes neuronales) son que tiene un buen balance con el dataset, pero el que no es muy eficiente es el modelo REPTree, esta conclusión es por el porcentaje de aciertos y margen de error. Pero de acuerdo a la matriz de confusión el modelo más eficiente es el “Random Forest” por motivo que solo tiene 8 elementos fuera de su grupo correspondiente, mientras que los demás tiene 10 elementos fuera de su grupo de clasificación, es decir, el modelo “Random Forest” es el que está más adecuado para solucionar esta problemática.

4.Resolver el problema del dataset con el algoritmo de Clustering.
  • 4.1. Usar el algoritmo KMeans.




Conclusión:
La conclusión de este trabajo se puede apreciar de acuerdo a las métricas analizadas que el virus del dengue es más propenso en jóvenes mayores de edad y que el origen de los diagnósticos denomina que el dengue clásico y el no especificado, surgen porque los pacientes llegan directamente al tópico de emergencia del Hospital de Apoyo II 1 Nuestra Señora de Las Mercedes de Paita. Gracias a esta información podemos dar recomendaciones, que sugerirán mecanismo de prevención que deberán ser incluidos en las entidades públicas correspondientes (DIRESA, MINSA, Hospitales Pública y Privadas, o Instituciones que ejercen el cuidado de la salud) para erradicar el mosquito del Dengue.


Bibliografías (referencias):
Adjuntos


Responder