Logo Kérwá
 

Evaluation of potential features present in short texts in spanish in order to classify them by polarity

dc.creatorCasasola Murillo, Edgar
dc.creatorLeoni de León, Jorge Antonio
dc.creatorMarín Raventós, Gabriela
dc.date.accessioned2019-11-18T16:19:42Z
dc.date.available2019-11-18T16:19:42Z
dc.date.issued2016
dc.description.abstractThis work describes the identification and evaluation process of potential text markers for sentiment analysis. The evaluation of the markers and their use as part of the feature extraction process from plain text that is needed for sentiment analysis is presented. The evaluation of text markers obtained as a result of systematic analysis from a corpus over a second one allowed us to identify that emphasized positive words that tend to appear in positive text posts. The second corpus allowed us to evaluate the relation between the polarity of morphological text markers and the text they appear in. The evaluation of the markers for polarity detection task, in combination with a polarized dictionary, produced polarity classification average precision of 0.56 % using only three markers. These are promising results if we compared them to the top 0.69 % obtained using more features and specialized dictionaries for the same task.es
dc.description.abstractEste trabajo describe el proceso de identificación y evaluación de marcadores potenciales de texto para análisis de sentimientos. Se presenta la evaluación de los marcadores y se propone la forma de utilizarlos para análisis de sentimientos. La evaluación de los marcadores identificados como producto del análisis sistemático de un primer corpus sobre otro nos permitió determinar que palabras positivas con énfasis tienden a aparecer principalmente en comentarios positivos. Con el segundo corpus, se evaluó la relación entre la polaridad de las palabras con énfasis y sus textos. Finalmente, se llevó a cabo una evaluación del uso de los marcadores sobre la tarea de identificación de polaridad de textos, con lo cual se obtuvo una precisión de 0.56 usando solo tres marcadores y un diccionario polarizado. Los resultados fueron prometedores en comparación con 0.69 % que fue la precisión más alta obtenida en la misma tarea mediante el uso de mayor cantidad de características y diccionarios especializadoses
dc.description.procedenceUCR::Vicerrectoría de Investigación::Unidades de Investigación::Ingeniería::Centro de Investigaciones en Tecnologías de Información y Comunicación (CITIC)es
dc.description.procedenceUCR::Vicerrectoría de Docencia::Artes y Letras::Facultad de Letras::Escuela de Filología, Lingüística y Literaturaes
dc.identifier.citationhttps://revistas.ucr.ac.cr/index.php/kanina/article/view/30223
dc.identifier.doihttps://doi.org/10.15517/RK.V40I4.30223
dc.identifier.issn2215-2636
dc.identifier.urihttps://hdl.handle.net/10669/79874
dc.language.isoen_US
dc.rightsacceso abiertoes
dc.sourceKañína. Revista de artes y letras, vol. 40(4), pp. 21-32es
dc.subjectSentiment analysises
dc.subjectInformation gaines
dc.subjectFeature vectorses
dc.subjectPolarityes
dc.subjectClassificationes
dc.subjectAnálisis de sentimientoses
dc.subjectGanancia de informaciónes
dc.subjectVectores de característicases
dc.subjectClasificaciónes
dc.subjectPolaridades
dc.titleEvaluation of potential features present in short texts in spanish in order to classify them by polarityes
dc.title.alternativeEvaluación de características potenciales presentes en textos cortos en español para clasificarlos por polaridades
dc.typeartículo original

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
document (7).pdf
Size:
863.82 KB
Format:
Adobe Portable Document Format
Description:
Artículo principal

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
2.83 KB
Format:
Item-specific license agreed upon to submission
Description: