Machine Learning enfocado en eventos

VladimirTitoG · Mensaje por **VladimirTitoG** » 14 Ago 2020, 22:17

Articulo 1: USED, A Large-scale Social Event Detection Dataset

Descripción
Problema:
la principal limitación en la aplicación de CNN en el contexto de la detección de eventos es la falta de disponibilidad de grandes conjuntos de datos. Al igual que el sistema visual humano, las CNN también necesitan una gran cantidad de datos de entrenamiento antes de alcanzar buenas capacidades de reconocimiento, donde la alta variabilidad de la información representada puede explorarse eficazmente como un activo valioso para asegurar mejores rendimientos en la clasificación de eventos.
Solución:
Se introduce un enfoque basado en el aprendizaje profundo en el descubrimiento de eventos a partir de imágenes individuales como una de las posibles aplicaciones de este conjunto de datos con la creencia de que el aprendizaje profundo puede resultar un gran avance también en esta área de investigación. Se introduce un enfoque basado en el aprendizaje profundo en el descubrimiento de eventos a partir de imágenes individuales como una de las posibles aplicaciones de este conjunto de datos.

Proceso
Fase de preentrenamiento
La idea básica de la fase de preentrenamiento es adquirir características de imagen básicas, como bordes, esquinas y líneas, en un conjunto de datos más grande. Por eso, se usaron parámetros de una CNN previamente entrenada disponible en la caja de herramientas Caffe, que es un marco de código abierto para el aprendizaje profundo. Comenzar con los parámetros de una CNN previamente entrenada conduce a una convergencia más rápida.
Fase de ajuste fino
Con el conjunto de datos ImageNet se puede obtener características de imagen básicas, como bordes, esquinas y líneas, sin embargo, para la descripción / semántica de alto nivel de imágenes relacionadas con eventos, se necesita ajustar la CNN en un conjunto de datos específico del sujeto. Dado que el conjunto de datos de destino tiene imágenes con diferentes resoluciones, antes de continuar con el ajuste fino de la CNN con el conjunto de datos de destino, se realiza un muestreo descendente de todas las imágenes, en el conjunto de datos de destino, a una resolución de tamaño fijo de 256 × 256 como se recomienda en como las capas convolucionales inferiores de las CNN responden a las características de la imagen de bajo nivel, para garantizar una convergencia rápida, evitamos volver a entrenar las capas inferiores de la CNN con nuevos datos específicos del sujeto.
En el proceso de experimentación, afinamos dos redes neuronales convolucionales separadas, cada una para las clases de eventos en los conjuntos de datos EiMM y SED. La motivación básica para ajustar redes separadas para cada tipo de recopilación de eventos (es decir, SED y EiMM) es proporcionar un análisis en profundidad proporcionando matrices de confusión y comparación con los enfoques más avanzados. Dado que los conjuntos de datos contienen 8 y 7 clases de eventos de los conjuntos de datos EiMM y SED, respectivamente, se incluye una capa en la parte superior de la red de referencia con un número de salidas correspondientes al número de clases en los conjuntos de datos de destino. Dado que no hay una capa con el mismo nombre de la capa recién incluida en la CNN, la capa superior de la red se inicializa con pesos arbitrarios, que luego se ajustan durante la fase de entrenamiento. Para acelerar aún más el proceso de aprendizaje, se utiliza un valor bajo para el tamaño del paso, lo que ayuda a que la tasa de aprendizaje disminuya más rápido.
Resultados:
El conjunto de datos recién creado se divide en 3 subconjuntos, a saber, entrenamiento, validación y prueba mediante la selección aleatoria de imágenes para cada fase. Para el entrenamiento (ajuste fino) de la red neuronal, se usa 20,000 imágenes por clase, mientras que para fines de validación y prueba se usa 7.000 imágenes por clase para cada fase. En las clases de eventos del conjunto de datos de EiMM (es decir, 8 clases que incluyen concierto, graduación, viaje a la montaña, reunión, picnic, vacaciones en el mar, vacaciones en esquí y boda), se obtiene una precisión general del 67% y 65,96% en la validación y equipos de prueba, respectivamente. En lo que respecta al rendimiento de la CNN capacitada en las clases de eventos del conjunto de datos SED, se logra una precisión general del 70,03%.

Conclusiones
Con este trabajo, se pretende proporcionar una gran colección de imágenes relacionadas con eventos, que cubran diferentes aspectos de las clases de eventos sociales consideradas, que se pueden utilizar con fines de capacitación en enfoques basados en el aprendizaje profundo para el descubrimiento de eventos a partir de imágenes individuales. El aprendizaje profundo resulta es un avance en el área de investigación, ya que proporciona una descripción más detallada y completa del contenido visual y acerca la calidad del análisis un paso más al desempeño de un observador humano.

Articulo 2: Predicting Activity Attendance in Event-Based Social Networks: Content, Context and Social Influence

Descripción

Problema:
Aunque se han realizado estudios sobre las EBSN (redes sociales basadas en eventos), se han realizado muy pocos intentos de predicción del comportamiento. Comprender la dinámica colectiva de la participación de los usuarios en los eventos es fundamental para comprender mejor las redes sociales tanto en el mundo físico como en el cibernético, y para proporcionar información crítica que ayude a la recomendación personalizada de eventos y la publicidad dirigida.

Solución:
Se propuso el modelo SVD-MFN para combinar SVD con actividades vecinas, así como múltiples características para abordar el problema de predicción de asistencia a la actividad. Nuestros resultados experimentales mostraron que nuestro método superó a los métodos de predicción de actividad existentes.

de los trabajos realizados, descripción del problema, algoritmos y resultados de las pruebas, herramientas y librerías usadas.

Proceso

El marco del sistema consta de tres componentes: el componente de construcción de la matriz de asistencia (izquierda), el descubrimiento de vecindario con el componente de factores múltiples (derecha) y el componente de predicción (abajo).
Construcción de la matriz de asistencia:
• Con el usuario objetivo y los asistentes actuales de una próxima actividad una, podemos construir una matriz de asistencia binaria para la actividad.
• También se construye la matriz histórica de asistencia para todos los usuarios.
• Posteriormente, con base en la actualización de la matriz, podemos obtener una matriz de asistencia global, que es una entrada para el componente de predicción.
Descubrimiento de vecindarios con Multi-Factor:
El segundo El componente se basa en la asistencia histórica del usuario objetivo, que es el componente clave del marco. Primero se extrae características para cada actividad a partir de tres aspectos: preferencia de contenido, contexto espacio-temporal e influencia social. Luego, considerando la diferente influencia de estos tres aspectos, proponemos un modelo multifactorial (MF) utilizando un árbol de decisiones para evaluar sus contribuciones. Se calcula la similitud entre cada par de eventos desde la perspectiva del usuario objetivo. Y se descubre las actividades vecinas para el usuario objetivo a partir del historial de asistencia.
Componente de predicción:
Para combinar las partes anteriores en el sistema, se propone el predictor SVD-MFN en el componente de predicción.
Extracción de características:
Usando como base la asignación de Dirichlet latente (LDA), se obtienen las siguientes funciones para la extracción de características:

Imagen

Fusión de Funciones:
Imagen

Es necesario hacer uso de algoritmos de clasificación para obtener los pesos α, β, γ, δ.

SVD-MFN: Integración de vecindario multifactor en SVD
Los métodos de vecindario tradicionales se enfocan en calcular las relaciones entre actividades o, alternativamente, usuarios. Si bien son eficaces para detectar relaciones localizadas y realizar predicciones en unos pocos vecinos similares, es posible que no funcionen cuando no hay calificaciones observadas o hay pocas dentro del vecindario de tamaño limitado.
Resultados
Los experimentos, se dividió el conjunto de datos en dos partes. La primera parte (febrero de 2012 a mayo de 2013) se usó para capacitación y la segunda parte (junio de 2013 a octubre de 2013) para pruebas. Mientras tanto, los pares de actividad de usuario recopilados se consideraron muestras positivas. Sin embargo, para entrenar al clasificador binario sin sesgo, debe haber un número igual de muestras positivas y negativas. Como había un total de 481,325 muestras positivas y la misma cantidad de negativas.
Se encontró que el modelo SVD-MFN logró un mejor desempeño que SVD, árbol de decisión y ZeroR para todas las medidas. Específicamente, en el caso de precisión, SVD-MFN alcanzó 0.89, que fue 0.08 más alto que el árbol de decisión, 0.12 más alto que SVD y 0.39 más alto que ZeroR. De manera similar, el valor-F de SVD-MFN también fue el más alto (0.88), que fue 0.122 más alto que SVD, 0.067 más alto que el árbol de decisión y 0.538 más alto que ZeroR. En el caso de AUC (área bajo la curva), el rendimiento de SVD-MFN es tan alto como 0,952. SVD tiene un mal desempeño ya que solo usó la matriz de actividad del usuario.

Conclusiones
El modelo propuesto ofrece una interesante propuesta para el pronóstico de eventos.
Si bien el modelo tiene un alto índice de precisión, actualmente será necesario tomar en cuenta que la ubicación de no eventos ya no es relevante por las medidas de distanciamiento social.
Se recomienda profundizar más en las redes sociales EBSN si se está interesado en los modelos enfocados en eventos.

Referencias
Artículo 1: https://doi.org/10.1145/2910017.2910624
Artículo 2: https://dl.acm.org/doi/abs/10.1145/2632048.2632063