Evaluation of potential features present in short texts in spanish in order to classify them by polarity

Fecha

2016

Tipo

artículo original

Autores

Casasola Murillo, Edgar
Leoni de León, Jorge Antonio
Marín Raventós, Gabriela

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

This work describes the identification and evaluation process of potential text markers for sentiment analysis. The evaluation of the markers and their use as part of the feature extraction process from plain text that is needed for sentiment analysis is presented. The evaluation of text markers obtained as a result of systematic analysis from a corpus over a second one allowed us to identify that emphasized positive words that tend to appear in positive text posts. The second corpus allowed us to evaluate the relation between the polarity of morphological text markers and the text they appear in. The evaluation of the markers for polarity detection task, in combination with a polarized dictionary, produced polarity classification average precision of 0.56 % using only three markers. These are promising results if we compared them to the top 0.69 % obtained using more features and specialized dictionaries for the same task.
Este trabajo describe el proceso de identificación y evaluación de marcadores potenciales de texto para análisis de sentimientos. Se presenta la evaluación de los marcadores y se propone la forma de utilizarlos para análisis de sentimientos. La evaluación de los marcadores identificados como producto del análisis sistemático de un primer corpus sobre otro nos permitió determinar que palabras positivas con énfasis tienden a aparecer principalmente en comentarios positivos. Con el segundo corpus, se evaluó la relación entre la polaridad de las palabras con énfasis y sus textos. Finalmente, se llevó a cabo una evaluación del uso de los marcadores sobre la tarea de identificación de polaridad de textos, con lo cual se obtuvo una precisión de 0.56 usando solo tres marcadores y un diccionario polarizado. Los resultados fueron prometedores en comparación con 0.69 % que fue la precisión más alta obtenida en la misma tarea mediante el uso de mayor cantidad de características y diccionarios especializados

Descripción

Palabras clave

Sentiment analysis, Information gain, Feature vectors, Polarity, Classification, Análisis de sentimientos, Ganancia de información, Vectores de características, Clasificación, Polaridad