Logo Kérwá
 

Desarrollo de representaciones vectoriales de palabras para español de Costa Rica

dc.contributor.advisorCasasola Murillo, Edgar
dc.creatorAngulo Arce, Cristian
dc.date.accessioned2019-11-08T16:49:01Z
dc.date.available2019-11-08T16:49:01Z
dc.date.issued2019-11-05
dc.description.abstractLas representaciones vectoriales de palabras, también conocidas como word embeddings, son modelados del lenguaje, donde la semántica de palabras o textos es transferida a vectores de números reales. Estos son utilizados en algunas aplicaciones de procesamiento del lenguaje natural o NLP (por sus siglas en inglés). En este proyecto se crearon word embeddings con texto que incluye español de Costa Rica. Se utilizaron diferentes tamaños de ventana de contexto para su generación. Se aplicaron los word embeddings generados para resolver la tarea de análisis de sentimiento a partir de comentarios escritos en español costarricenses. Se generaron modelos para dos tipos de clasificador: redes neuronales y máquinas de soporte vectorial. Específicamente se evaluó la tarea de identificación de la polaridad de un texto. Se replicaron estas evaluaciones con un word embeddings pre existente que fue utilizado como línea base o referencia de comparación para todos los nuevos word embeddings generados en este trabajo. Las observaciones de estas evaluaciones dan indicios de mejora en los resultados del análisis de sentimiento, al utilizar textos con variantes del español costarricense para crear los embeddings.es
dc.description.procedenceUCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Académica en Computación e Informáticaes
dc.identifier.urihttps://hdl.handle.net/10669/79814
dc.language.isoes
dc.rightsacceso abierto
dc.sourceCiudad Universitaria Rodrigo Facio, Costa Ricaes
dc.subjectAnálisis de sentimientoes
dc.subjectEspañoles
dc.subjectCosta Ricaes
dc.subjectrepresentaciones vectoriales de palabrases
dc.subjectVentanas de contextoes
dc.subjectLenguaje hablado costarricensees
dc.titleDesarrollo de representaciones vectoriales de palabras para español de Costa Ricaes
dc.typetesis de maestría

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Desarrollo de representaciones vectoriales de palabras Costa Rica.pdf
Size:
2.09 MB
Format:
Adobe Portable Document Format
Description:
Trabajo Final de Investigación Aplicada

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
2.83 KB
Format:
Item-specific license agreed upon to submission
Description: