Modelo de prediccion de causas por muerte en Perú durante Pandemia
Publicado: 16 Ene 2021, 00:20
1. Resumen
La presente investigacion es motivada por el contexto actual, el Covid-19 es un virus que ha afectado mucho en temas de salud a las personas, tanto que ha llegado a ser una pandemia, es por ello que es importante utilizar la tecnología para predecir que tipo de personas pueden fallecer por el virus Covid-19, y tomar acciones para que estas personas no se expongan a dicho virus. Se utilizaron las tecnologías python y weka, python para el analisis exploratorio y limpieza de la data; weka para correr los modelos de clasificación.
2. Descripción de dataset
El Sistema Informático Nacional de Defunciones (SINADEF), es el aplicativo informático que contiene los datos del fallecido, genera el certificado de defunción y el informe estadístico; incluye las defunciones fetales, las defunciones generales y las diagnósticos y antecedentes de enfermedad de causas de defunción, los datos son preliminares a la fecha. Consta de 546011 filas y 30 columnas. link:
https://www.datosabiertos.gob.pe/datase ... ministerio
3. Descripción de los resultados con las técnicas usadas
Para corre los modelos de clasificación normalizamos los datos. En este caso trabajaremos con los modelos de clasificación Random Tree y SVM.
El modelo Random Tree nos da resultado un error root relative squared error de 47% y el modelo de SVM da como resultado el accuracy (80.04%) así como los mayores TP rate (76.9% y 83.5%). El mejor modelo es el SVM en esta investigación por los datos expuestos.
5Github
https://github.com/Juan-Moreno-17/Model ... e-Pandemia
La presente investigacion es motivada por el contexto actual, el Covid-19 es un virus que ha afectado mucho en temas de salud a las personas, tanto que ha llegado a ser una pandemia, es por ello que es importante utilizar la tecnología para predecir que tipo de personas pueden fallecer por el virus Covid-19, y tomar acciones para que estas personas no se expongan a dicho virus. Se utilizaron las tecnologías python y weka, python para el analisis exploratorio y limpieza de la data; weka para correr los modelos de clasificación.
2. Descripción de dataset
El Sistema Informático Nacional de Defunciones (SINADEF), es el aplicativo informático que contiene los datos del fallecido, genera el certificado de defunción y el informe estadístico; incluye las defunciones fetales, las defunciones generales y las diagnósticos y antecedentes de enfermedad de causas de defunción, los datos son preliminares a la fecha. Consta de 546011 filas y 30 columnas. link:
https://www.datosabiertos.gob.pe/datase ... ministerio
3. Descripción de los resultados con las técnicas usadas
Para corre los modelos de clasificación normalizamos los datos. En este caso trabajaremos con los modelos de clasificación Random Tree y SVM.
- Random Tree
- SVM
El modelo Random Tree nos da resultado un error root relative squared error de 47% y el modelo de SVM da como resultado el accuracy (80.04%) así como los mayores TP rate (76.9% y 83.5%). El mejor modelo es el SVM en esta investigación por los datos expuestos.
5Github
https://github.com/Juan-Moreno-17/Model ... e-Pandemia