Logo Kérwá
 

Efecto del balanceo de clases al evaluar el F-Score para un clasificador de texto en análisis de sentimiento

dc.contributor.advisorCasasola Murillo, Edgar
dc.creatorSolís Fonseca, Carlos Francisco
dc.date.accessioned2021-02-03T22:04:05Z
dc.date.available2021-02-03T22:04:05Z
dc.date.issued2020-12-17
dc.description.abstractEn los últimos años los métodos de aprendizaje de máquina han sido incluidos en muchas áreas de investigación para dar soporte al análisis de datos. Los modelos de clasificación, los cuales corresponden a métodos de aprendizaje no supervisado, se han convertido en un instrumento muy importante para el análisis de texto y el análisis de sentimiento no es la excepción. Por esta razón es importante tener en consideración las características de los datos ya que, dependiendo de su naturaleza, pueden afectar la calidad del clasificador entrenado. Este trabajo se centra sobre el problema en las clases desbalanceadas. Mediante dos métodos de balanceo, submuestreo y sobremuestreo, se lleva a cabo un experimento estadístico para determinar si balancear un conjunto de datos con clases desbalanceadas mejora o no la calidad de un clasificador usando máquinas de soporte vectorial. Usando dos diferentes modelos para vectorizar palabras, TF-IDF y Word2Vec, se evalúa mediante un análisis de varianza el F-Score del clasificador de texto obteniendo como resultado un F-Score mayor cuando se usa sobremuestreo para balancear clases en comparación al F-Score obtenido del clasificador usando los datos con las clases desbalanceadas.es
dc.description.procedenceUCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informáticaes
dc.identifier.urihttps://hdl.handle.net/10669/82700
dc.language.isoes
dc.rightsacceso abierto
dc.sourceUniversidad de Costa Rica, San José, Costa Ricaes
dc.subjectBalanceo de claseses
dc.subjectAnálisis de sentimientoes
dc.subjectAprendizaje de máquinaes
dc.subjectClasificación de textoes
dc.subjectAprendizaje no supervisadoes
dc.subjectrepresentación vectorial de palabrases
dc.titleEfecto del balanceo de clases al evaluar el F-Score para un clasificador de texto en análisis de sentimientoes
dc.typetesis de maestría

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFIA-Carlos Solis Fonseca.pdf
Size:
962.81 KB
Format:
Adobe Portable Document Format
Description:
Artículo principal

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
2.83 KB
Format:
Item-specific license agreed upon to submission
Description: