Principal Component and Regression Analysis for Categorical Data.Application to Arterial Hypertension.
Archivos
Fecha
2010-07-02 00:00:00
Tipo
artículo original
Autores
Navarro Céspedes, Juan M.
Casas Cardoso, Gladys M.
González Rodríguez, Emilio
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
The present work is about the statistical processing of categorical data. The mathematical details of the Categorical Principal Components and the Categorical Regression Analysis are explained.The combination of both techniques can be used to solve classification problems. Because these techniques are relatively new, we decided to use another technique (classification trees following the chi squared criteria) to make a comparison of their results, with the help of the theory of ROC curves. In the application, supposedly healthy patients of Santa Clara, Cuba, were diagnosed as hypertensive, pre hypertensive and no hypertensive by a Committee of Medical Experts. Categorical Component Analysis and Categorical Regression Analysis were applied in order to successfully solve the classification problem.
El presente trabajo aborda el tema relacionado con el procesamiento estadístico de variables categóricas. Se explican los fundamentos matemáticos del análisis de Componentes Principales y del an´alisis de Regresión para datos categóricos. La unión de estas técnicas puede utilizarse para resolver problemas de clasificación.Debido a que estos son métodos relativamente nuevos, se decide utilizar otra técnica más conocida (´arboles de clasificación siguiendo criterios chi cuadrado) para realizar comparaciones de sus los resultados, con ayuda de la teoría de las curvas ROC. En la aplicación desarrollada se estudiaron pacientes supuestamente sanos del municipiode Santa Clara, Cuba, diagnosticados como hipertensos, prehipertensos y normotensos por un Comité de Expertos Médicos altamente calificados. La regresión categórica unida al análisis de Componentes Principales como m´etodo de selección de variables, resultó ser la mejor técnica ara resolver el problema de clasificación.
El presente trabajo aborda el tema relacionado con el procesamiento estadístico de variables categóricas. Se explican los fundamentos matemáticos del análisis de Componentes Principales y del an´alisis de Regresión para datos categóricos. La unión de estas técnicas puede utilizarse para resolver problemas de clasificación.Debido a que estos son métodos relativamente nuevos, se decide utilizar otra técnica más conocida (´arboles de clasificación siguiendo criterios chi cuadrado) para realizar comparaciones de sus los resultados, con ayuda de la teoría de las curvas ROC. En la aplicación desarrollada se estudiaron pacientes supuestamente sanos del municipiode Santa Clara, Cuba, diagnosticados como hipertensos, prehipertensos y normotensos por un Comité de Expertos Médicos altamente calificados. La regresión categórica unida al análisis de Componentes Principales como m´etodo de selección de variables, resultó ser la mejor técnica ara resolver el problema de clasificación.