EL artículo aplica minería de texto en los tweets que son considerados quejas, para ello seleccionar los tweets que citan órganos oficiales como Protección civil, policías, etc.
Se obtiene resultados por mejorar, ya que entre sus algoritmos el que obtuvo mejor rendimiento fue el SVM con 92.26%, también es rescatable que la clasificación es para muchas clases.
Lo que sí creo es que debió explicar un poco más es el tema de las fases de lematización y parametrización, el autor menciona que es parte de la metodología, pero no explica su relevancia. Por otro lado también es importante como se manejaría el desbalance de clases, ya que se comenta el uso de clusters para la obtención de clases entre los tipos de quejas existente, y aquellas que no pertenecían a una eran etiquetadas como "no etiquetados", y por ser mayoría dejaba muchas quejas que posiblemente resultaban ser relevante y deberían ser tomadas en cuenta en el análisis.
Lo que sí se valora bastante es que la aplicación permite apreciar las quejas según la ubicación, con esto se puede apreciar algunos patrones por cada lugar y tomar medidas más dirigidas, lo que le facilita esto es el dato del lugar donde se realizó el tweet. Así también se podría emplear el tiempo el que se hizo el tweet y con una mayor cantidad de registros (tweets) encontrar tipo de quejas según horarios, y así tener un mejor análisis a la hora de tomar decisiones.
Clasificación multiclase y visualización de quejas de organismos oficiales en twitter
- paulcordovav
- Mensajes: 8
- Registrado: 08 Ene 2020, 19:51