Revista de Matema´tica: Teor´ıa y Aplicaciones 4(2): 51–62 (1997) algoritmo e implementacio´n del ana´lisis factorial de correspondencias William Castillo1 – Oldemar Rodr´ıguez1 Resumen En este art´ıculo se presenta un algoritmo en pseudoco´digo para el Ana´lisis Facto- rial de Correspondencias. Se presentan tambie´n algunos comentarios sobre la imple- mentacio´n desarrollada en C++. Finalmente se ilustra el me´todo mediante un ejemplo. Abstract In this article, it is presented an algorithm in pseudo-code for the Factor Analysis of Correspondence. Some comments on the implementation on C++ are also developed. Finally, the method is illustrated by an example. Palabras clave: Desarrollo de software, tabla de contingencia, perfiles, representacio´n bidimensional, contribuciones. 1. Introduccio´n El Ana´lisis Factorial de Correspondencias (AFC) es un me´todo exploratorio concebido para estudiar la relacio´n entre dos variables cualitativas a partir de la tabla de contingencia asociada. No obstante su uso se ha extendido a tablas de datos ma´s generales, con tal que sus casillas sean no negativas y sumables por filas y columnas [4] y [5]. El AFC fue implementado como un mo´dulo del sistema informa´tico de ana´lisis de datos PIMAD 2.1 [6], utilizando para ello el modelo matema´tico del Ana´lisis en Componentes Principales (ACP) y los resultados espec´ıficos que se obtienen en el caso particular del AFC, como se expone en la seccio´n siguiente. En este art´ıculo se presentan adema´s los ı´ndices de calidad usuales (seccio´n 3) tal como fueron implementados en el programa. El art´ıculo se completa con una formulacio´n algor´ıtmica en seudoco´digo a partir de la cual se realizo´ la implementacio´n computacional del me´todo; luego se ofrecen algunos detalles sobre el software desarrollado y en la u´ltima seccio´n se ilustra, a partir de un ejemplo, el uso de este software. 1PIMAD-CIMPA, Escuela de Matema´tica, Universidad de Costa Rica, 2060 San Jose´, Costa Rica 51 52 w. castillo – o. rodr´ıguez 2. El modelo matema´tico de base Uno de los objetivos del AFC es explorar las relaciones entre las modalidades de dos variables cualitativas por medio de representaciones bidimensionales o´ptimas. Como se sabe, este objetivo se logra haciendo el ACP de las nubes de perfiles fila y columna, lo cual permite obtener tales representaciones. Sean X y Y dos variables cualitativas con n y p modalidades respectivamente, Kn×p la tabla de contingencia asociada y S = 1TK la tabla de frecuencias; donde T = ∑ ij kij . 2.1. Perfiles y distancias Sean fi = ∑p j=1 kij , cj = ∑n i=1 kij . Los perfiles fila y columna son, respectivamente, los vectores pfi = ( ki1 fi , . . . , kip fi ) y pcj = ( k1j cj , . . . , knj cj )t . A cada perfil pfi ( resp. pcj) se le asigna el peso pi = fiT ( resp. qj = cj T ). Las distancias Chi-cuadrado entre los perfiles fila y los perfiles columna son dadas, respectivamente por las matrices D−1q y D−1p ; donde Dp = diag(pi) y Dq = diag(qj) . Es decir: d2 (pfi, pfl) = p∑ j=1 T cj ( kij fi − klj fl )2 d2 (pcj, pch) = n∑ i=1 T fi ( kij cj − kih ch )2 . 2.2. ACP de los perfiles Las filas de las matrices D−1p S y D−1q St son respectivamente los perfiles fila y colum- na. Por lo tanto, identificando cada modalidad con su perfil y haciendo el ACP de los tripletes ( D−1p S,D−1q ,Dp ) y ( D−1q St,D−1p ,Dq ) , se obtienen las representaciones o´ptimas como proyecciones ortogonales de las modalidades (perfiles), sobre los espacios principales correspondientes ([1], [3] y [5]). Se sabe que los elementos propios de estos dos ACP ′ s se relacionan de modo tal que los valores propios son los mismos y los vectores propios de un ACP se calculan conociendo los del otro. Este resultado es la base teo´rica del algoritmo que se presenta en la seccio´n 3 y es lo que permite una implementacio´n computacional eficiente del AFC. Una expresio´n formal de tales resultados es la siguiente: 1. Los valores propios de los dos ACP ′ s son iguales. Los vectores propios esta´n rela- cionados as´ı: ui = 1√λiS tD−1p vi y vi = 1√ λi SD−1q ui donde u1, . . . ua y v1, . . . va son, respectivamente, los vectores propios ortonormados de los ACP ’s de los tripletes( D−1p S,D−1q ,Dp ) y ( D−1q St,D−1p , Dq ) , asociados a los valores propios λ1, . . . , λa, con a = min{n, p} . 2. Con la notacio´n anterior se tiene λ1 = 1, u1 = Gf , v1 = Gc (salvo por el signo). algoritmo e implementacio´n del ana´lisis de correspondencias 53 3. Fo´rmulas barice´ntricas2: sea coorduα (pfi) = pfi · D−1q · uα (resp. coordvα (pcj) = pcj ·D−1p · vα) la coordenada del perfil pfi (resp. pcj) sobre la recta determinada por el vector uα. (resp.vα). Las fo´rmulas barice´ntricas toman la forma, a) coorduα (pfi) = 1√ λα ∑p j=1 kij fi coordvα (pcj) y b) coordvα (pcj) = 1√ λα ∑n i=1 kij cj coorduα (pfi). 4. λ ∈ ]0, 1] para todo valor propio no nulo del AFC. Este resultado se puede obtener directamente como una consecuencia de las fo´rmulas barice´ntricas ([2] y [5]). 5. Sea P̂ S la matriz D−1p S centrada por columna y V̂f = P̂ S t DpP̂ S. Si Pruα es el operador de proyeccio´n D−1q −ortogonal sobre uα y Prvα el operador de proyeccio´n D−1p −ortogonal sobre vα,entonces3: (a) V̂fD−1q ui = λiui, i = 2, . . . , a. (b) Pruα (pfi −Gf ) = Pruα (pfi); i = 1, . . . , n. (c) Prvα (pcj −Gc) = Prvα (pcj); j = 1, . . . , p. 1. Simetrizacio´n4: VfD−1q ∼ D −1 2 q ( VfD −1 q ) D 1 2 q = D −1 2 q StD−1p SD −1 2 q = Z que es sime´tri- ca. Por lo tanto Z y VfD−1q tienen los mismos valores propios y la relacio´n entre los vectores propios es v = D − 1 2 q u, donde u y v son vectores propios de VfD−1q y Z respectivamente, asociados a λ. 3. Interpretacio´n de un AFC La interpretacio´n de un Ana´lisis Factorial de Correspondencias tiene que ver con la se- leccio´n de ejes factoriales significativos, de puntos significativos y su representacio´n plana; todo lo cual permite visualizar las proximidades y oposiciones entre perfiles. A contin- uacio´n se presentan los ı´ndices y criterios utilizados como ayudas usuales en la etapa de ana´lisis e interpretacio´n de las “salidas” en un programa de AFC. La implementacio´n en PIMAD permite hacer uso de estos ı´ndices y criterios. 2A nivel de la implementacio´n computacional del AFC, estas fo´rmulas permiten hacer todos los ca´lculos a partir de uno solo de los dos ACP ’s. 3Segu´n este resultado el AFC se puede implementar sin hacer la operacio´n de centraje con tal que no se tome en cuenta el primer valor propio. 4El algoritmo de diagonalizacio´n requiere que la matriz sea sime´trica, por eso se diagonaliza Z y luego se hacen los ajustes necesarios en el ca´lculo de coordenadas, de acuerdo con este resultado. 54 w. castillo – o. rodr´ıguez 3.1. La contribucio´n absoluta La contribucio´n absoluta es un indicador del aporte inercial de una modalidad a un eje. Como se sabe, cada eje explica una parte de la inercia de la nube de perfiles, que es justamente la inercia de la nube proyectada sobre este eje. As´ı por ejemplo, para el eje α−e´simo se tiene: Inercia proyectada = λα = n∑ i=1 pi (coorduα (pfi)) 2 = p∑ j=1 qj (coordvα (pcj)) 2 . En virtud de esta relacio´n es natural definir la contribucio´n absoluta del perfil pfi al eje α−e´simo, como ctrα (i) = pi (coorduα (pfi)) 2 λα = fi (coorduα (pfi)) 2 Tλα . Cuanto mayor es ctrα (i), ma´s contribuye el perfil a la construccio´n del eje α−e´simo. De la misma manera la contribucio´n de un perfil columna pcj al eje α−e´simo es ctrα (j) = qj (coordvα (pcj)) 2 λα = cj (coordvα (pcj)) 2 Tλα 3.2. Contribucio´n relativa La contribucio´n relativa se puede usar como un ı´ndice para evaluar la calidad de la representacio´n de las modalidades en los ejes y planos principales. Tambie´n puede ser usado para dar significado a un eje con el cual se relacionan ciertas modalidades. Como ||pfi −Gf ||2 = ∑a α=2 ||Pruα(pfi)||2D−1q entonces es natural definir la contribucio´n relativa del eje α−e´simo al perfil pfi, como: corr2 (θiα) = ‖Pruα (pfi)‖2D−1q ‖(pfi − Gf )‖2D−1q = [coorduα (pfi)] 2∑p j=1 T cj ( kij fi − cjT )2 el cual se interpreta geome´tricamente como el cuadrado del coseno del a´ngulo formado por el eje α−e´simo y el vector pfi− Gf . De la misma manera para el caso de los perfiles columna, la contribucio´n relativa del eje α−e´simo al perfil pcj es: corr2 (θjα) = ‖Prvα (pcj)‖2D−1p ‖(pcj − Gc)‖2D−1p = [coordvα (pcj)] 2∑n i=1 T fi ( kij cj − fiT )2 . Cuanto ma´s grande sea corr2 (θiα) , ma´s espec´ıfico es el perfil pfi del eje α−e´simo. La misma relacio´n vale para los perfiles columna. Por otra parte, cuanto mayor sea corr2 (θiα) + corr2 (θiβ) , de mejor calidad es la representacio´n del perfil pfi en el plano determinado por uα y uβ. Los mismo vale para los perfiles columna. algoritmo e implementacio´n del ana´lisis de correspondencias 55 3.3. Seleccio´n de ejes Los criterios usuales para seleccionar el nu´mero de ejes son de cara´cter emp´ırico. Sean a = min{n, p}, IE (r) = 100 ∑r s=2 λs∑a s=2 λs la inercia explicada por los primeros r − 1 ejes, y sea ie (r) = 100 λr∑a s=2 λs la inercia explicada por el r−eje. Una primera forma (sencilla) es fijar a priori un porcentaje de inercia explicada por los ejes, digamos por ejemplo 75%, y escoger los primeros r − 1 ejes tales que IE (r) ≥ 75. Al ser este un criterio global, se aconseja controlarlo con un criterio local que involucre el porcentaje de inercia explicada por un eje: ie (r) ≥ 100a−1 . El criterio local consiste en retener los primeros r ejes tales que ie (r) ≥ 1a−1 ∑a s=2 ie (s) = 100 a−1 , y ie(r + 1) < 100 a−1 . Otro criterio emp´ırico, tambie´n usado en ACP, es la “regla del codo” que consiste en construir un diagrama lineal de los valores propios y determinar el punto donde la curva tiene una forma similar a un codo. Esto es, escoger los primeros r ejes tales que a partir del valor propio λr, el diagrama es aproximadamente una funcio´n constante. 3.4. Seleccio´n de puntos La media aritme´tica de las contribuciones absolutas de los perfiles fila ( resp. perfiles columna) es 1n ( resp. 1 p), entonces los perfiles tales que ctrα (i) ≥ 1n y ctrα (j) ≥ 1p se llaman perfiles explicativos del eje α−e´simo. En la etapa de depuracio´n e interpretacio´n de resultados se tomara´n en cuenta prioritariamente los perfiles explicativos. Seleccio´n de puntos explicativos: para el eje α−e´simo supongamos que las contribu- ciones ctrα (i) esta´n ordenadas en forma decreciente. Se escogen los h primeros puntos explicativos tales que ∑h i=1ctrα (i) ≥ d, donde d es un nu´mero entre cero y uno, escogido a priori. El criterio para los perfiles columna es igual: ∑g j=1ctrα (j) ≥ d. Por otra parte, los perfiles fuertemente asociados con un eje se llaman puntos explica- dos por este eje. Normalmente se toma 0.5 como valor l´ımite. Esto significa que un perfil pfi es explicado por el eje α−e´simo, si corr2 (θiα) ≥ 0,5. En modo ana´logo, un perfil pcj es explicado por el eje α−e´simo, si corr2 (θjα) ≥ 0,5. Eventualmente un eje que explica muy poca inercia (no pasa el criterio de seleccio´n de ejes) puede ser considerado dentro del ana´lisis si existe algu´n perfil explicado por este eje, de modo tal que se pueda afirmar que se trata de una direccio´n caracter´ıstica de ese perfil. 4. El algoritmo del ana´lisis factorial de correspondencias Paso 1. Entrada de datos: Los datos de entrada se presentan bajo el formato de una matriz K = (kij)n×p con las siguientes propiedades: (a) kij ≥ 0; i = 1, ..., n; j = 1, ..., p. (b) Se puede sumar por filas y columnas de K. (c) ∑p j=1 kij > 0 para todo i, ∑n i=1 kij > 0 para todo j. 56 w. castillo – o. rodr´ıguez Paso 2. Calcular la matriz a diagonalizar La matriz a diagonalizar es Z = (zjl)a×a tal que zjl =  1√ cjcl ∑n i=1 kijkil fi si p ≤ n 1√ fjfl ∑p i=1 kjikli ci si p > n donde: a = min {p, n}; fi = ∑p h=1 kih es el total de la fila i de K y cj = ∑n t=1 ktj es el total de la columna j de K. Paso 3. Ca´lculo de coordenadas Paso 3.0 Calcular los valores y vectores propios de Z Denotamos con w0, w1, . . . , wa los vectores propios de Z, Ia− ortonormados, asociados a los valores propios 1 > λ2 ≥ · · · ≥ λa > 0. Entonces se tienen dos casos: Paso 3.1 Primer caso: p ≤ n Para i = 1, . . . , n y α = 1, . . . , a se calculan las coordenadas de los perfiles fila me- diante la fo´rmula: coorduα(pfi) = pfiD − 1 2 q wα. Usando las formas expl´ıcitas de pfi =( ki1 fi , . . . , kip fi ) , D − 1 2 q = diag (√ T cj ) p×p y wtα = (wα1, . . . , wαp) ; obtenemos una expresio´n para las coordenadas de los perfiles fila dependiendo de los wαj (i = 1, . . . n , α = 2, . . . , a): coorduα(pfi) = √ T fi p∑ j=1 kijwαj√ cj . Para calcular las coordenadas de los perfiles columna se usan las fo´rmulas barice´ntricas (j = 1, . . . , p; α = 2, . . . , a) calcula´ndose: coordvα(pcj) = 1 cj √ λα n∑ i=1 kijcoorduα(pfi) Paso 3.2 Segundo caso: p > n Para j = 1, . . . p y α = 2, . . . , a se calculan las coordenadas de los perfiles columna mediante la fo´rmula : coordvα(pcj) = pcjD − 1 2 p wα . Ana´logamente al caso anterior, usando las expresiones de pctj = ( k1j cj , . . . , knj cj ) , D − 1 2 p = diag (√ T fi ) n×n y de wtα = (wα1, . . . , wαn) se llega a : coordvα(pcj) = √ T cj n∑ i=1 kijwαi√ fi algoritmo e implementacio´n del ana´lisis de correspondencias 57 Las coordenadas de los pefiles fila se calculan por medio de las fo´rmulas barice´ntricas: coorduα(pfi) = 1 fi √ λα p∑ j=1 kijcoordvα(pcj) Paso 4. Ayudas a la interpretacio´n Paso 4.1 Para i = 1, ..., n y α = 2, ..., a Paso 4.1.1 Calcular: ctrα(i) = fi [coorduα(pfi)] 2 Tλα y coor2(θiα) = [coorduα(pfi)] 2∑p j=1 T cj ( kij fi − cjT )2 Paso 4.1.2 Para α = 2, ..., a: (a) Crear una lista ordenada de las etiquetas de los perfiles fila segu´n el orden decreciente de corr2(θiα). (b) Crear una lista ordenada de las etiquetas de los perfiles fila segu´n el orden decreciente de ctrα(i). Paso 4.2 Para j = 1, ..., p y α = 2, ..., r Paso 4.2.1 Calcular: ctrα(j) = cj [coordvα(pcj)] 2 Tλα y corr(θjα) = [coordvα(pcj)] 2∑n i=1 T fi ( kij cj − fiT )2 Paso 4.2.2 Para α = 1, ..., r: (a) Crear una lista lista ordenada de las etiquetas de los perfiles columna segu´n el orden decreciente de corr2(θjα). (b) Crear una lista lista ordenada de las etiquetas de los perfiles columna segu´n el orden decreciente de ctrα(j). Paso 5. Representacio´n en el espacio bidimensional: para hacer las representaciones de los perfiles fila, de los perfiles columna y de las representaciones simulta´neas, el usuario selecciona los planos principales que desea. Dado γ ∈ ]0, 1[ (γ suministrado por el usuario): Paso 5.1 Escoger desde la listas creadas en 4.1.2 los perfiles fila tales que coor2(θiα) ≥ γ, los cuales sera´n representados en los planos principales. Las coordenadas se calculan segu´n las fo´rmulas 3.1 o´ 3.2. 58 w. castillo – o. rodr´ıguez Paso 5.2 Escoger desde la lista creada en 4.2.2 los perfiles columna tales que coor2(θjα) ≥ γ, los cuales sera´n representados en los planos principales. Las coordenadas se cal- culan segu´n las fo´rmulas 3.1 o´ 3.2. Paso 5.3 Seleccionar perfiles y fila y columna simulta´neamente para su representacio´n, siguiendo el mismo procedimiento que en 5.1 y 5.2. 5. Algunos detalles sobre la implementacio´n El algoritmo para el Ana´lisis Factorial de Correspondencias presentado en la seccio´n anterior fue implementado en lenguaje C++ [7] como un mo´dulo ma´s del sistema PIMAD 2.1 [6]. Esto permitio´ aprovechar el nu´cleo del sistema PIMAD para efectuar los Ana´lisis en Componentes Principales que son necesarios para el Ana´lisis Factorial de Correspondencias y para generar el gra´fico del Plano Principal. Igual que los dema´s mo´dulos de PIMAD, este mo´dulo debe ser ejecutado bajo Windows 3.1 o Windows95. El mo´dulo de Ana´lisis Factorial de Correspondencias esta´ implementado de modo tal que puede ser ejecutado con tablas de datos de cualquier taman˜o, limitado solamente por la cantidad de memoria del computador en donde se este´ ejecutando. Figura 1: Interfaz del mo´dulo AFC en PIMAD En la Figura 1 se muestra la interfaz del sistema. No´tese que los ca´lculos se pueden realizar en forma directa a trave´s de la barra de herramientas (tool-bar), o bien a trave´s del menu´ principal. algoritmo e implementacio´n del ana´lisis de correspondencias 59 Figura 2: Menu´ AFC-Paso-a-Paso en PIMAD El algortimo de la seccio´n anterior tambie´n se puede ejecutar paso por paso mediante el submenu´ AFC-Paso-a-Paso, que se muestra en la Figura 2. Todos los archivos creados por el programa son tipo ASCII. Tal como se muestra en la Figura 2 mediante la opcio´n Calcular la matriz Z el programa ejecuta el paso 2 del algoritmo presentado en la seccio´n anterior, dejando la ma- triz Z en el archivo MATRIZ Z.TXT. Con la opcio´n Calcular los Vectores y Valores Propios se puede ejecutar el paso 3.0 del algoritmo, los valores propios quedara´n alma- cenados en el archivo VALORP.TXT y los vectores propios en el archivo VECTORP.TXT. Con la opcio´n Calcular Coordenadas se pueden ejecutar los pasos 3.1 y 3.2 del algoritmo, las coordenadas de los perfiles fila y columna quedan en el archivo COORDENA.TXT. Con la opcio´n Graficar el Plano Principal... se despliega por pantalla el plano principal, tal como se ilustra ma´s abajo (Figura 3.). Una vez graficado el plano principal, mediante las opciones Calcular Contribuciones Absolutas y Calcular Contribuciones Relativas se puede ejecutar el paso 4 del al- goritmo de la seccio´n anterior. Las contribuciones absolutas se almacenan en el archivo C ABSOLU.TXT y las contribuciones relativas en el archivo C RELATI.TXT. 6. Ejemplo de ilustracio´n En esta seccio´n se ilustra el uso del submenu´ AFC-Paso-a-Paso. La tabla de datos uti- lizada es de taman˜o 50×5 y proviene del “cruzamiento” de las variables unidad acade´mica de la UCR con actividad acade´mica. La casilla (i, j) contiene el nu´mero de tiempos com- pletos invertidos por la unidad acade´mica i, en la actividad acade´mica j, en el II ciclo acade´mico de 1993. Es claro que dicha tabla de datos no negativos, es sumable por filas y columnas por lo que se pueden estudiar las relaciones entre las modalidades por medio del AFC. Las unidades acade´micas son codificadas con los nu´meros del 1 al 50, y las actividades con abreviaciones cuyo significado se indica en el cuadro siguiente: 60 w. castillo – o. rodr´ıguez Abreviacio´n Nombre de la Actividad Docencia Actividad Docente Invest Trabajo de Investigacio´n ComInst Trabajo en Comisiones Institucionales DocAdm Trabajo Docente-Administrativo AcSoc Accio´n Social Las “salidas” correspondientes a cada una de las opciones del submenu´ “AFC paso-a- paso”, son las siguientes: 1. Opcio´n: Calcular la matriz Z. El programa calcula la matriz Z de taman˜o 5 × 5 y crea el archivo MATRIZ Z.TXT que tiene una forma similar a: Z = 0.719 0.309 0.157 0.190 0.144 0.309 0.162 0.081 0.114 0.077 0.157 0.081 0.072 0.081 0.046 0.190 0.114 0.081 0.193 0.074 0.144 0.077 0.046 0.074 0.056 2. Opcio´n: Calcular los Vectores y Valores Propios. Los vectores propios de Z son las columnas del archivo VECTORP.TXT el cual tiene una apariencia similar a: u1 u2 u3 u4 u5 −0.831 0.425 0.243 0.230 0.131 −0.383 −0.062 −0.261 −0.657 −0.592 −0.209 −0.224 −0.779 0.538 −0.095 −0.288 −0.854 0.413 0.123 −0.043 −0.191 −0.191 −0.307 −0.459 0.789 Por otra parte los valores propios almacenados en VALORP.TXT, son: λ1 λ2 λ3 λ4 λ5 1 0.144 0.026 0.020 0.013 3. Opcio´n: Calcular Coordenadas. El programa calcula las coordenadas de los perfiles fila y columna y crea un archivo de nombre COORDENA.TXT. En este archivo las 50 primeras filas son las coordenadas de las 50 Unidades Acade´micas (perfiles fila), y las u´ltimas 5 son las coordenadas de las 5 actividades acade´micas (perfiles columna). Las siguientes tablas son segmentos de este archivo. algoritmo e implementacio´n del ana´lisis de correspondencias 61 Coordenadas de las Coordenadas de las primeras 10 UA actividades acade´micas Eje 1 Eje 2 Eje 3 Eje 4 Eje 1 Eje 2 Eje 3 Eje 4 0.351 0.101 0.040 −0.057 0.194 0.047 0.038 0.018 0.302 −0.011 −0.344 −0.374 −0.061 −0.109 −0.239 −0.173 0.403 0.099 0.118 0.000 −0.408 −0.599 0,358 −0,051 0.326 0.119 0.006 −0.053 −1.124 0,230 0.060 −0.017 0.027 −0.024 −0.009 0.048 −0,381 −0,259 −0,335 0,464 0.157 −0.096 −0.253 −0.093 0.261 −0.052 0.224 0.153 −1.126 0.309 0.194 −0.138 −0.521 0.031 0.122 −0.052 −0.585 −0.059 0.089 −0.026 4. Opcio´n: Graficar el Plano Principal. El programa genera un plano principal en el cual el usuario puede elegir los perfiles y los ejes. El siguiente gra´fico corresponde al plano de los ejes 1 y 2. Este gra´fico puede ser impreso directamente con el programa, o bien el programa puede generar co´digo LATEX de este gra´fico. 5. Opcio´n: Calcular Contribuciones Absolutas. Las contribuciones absolutas de las primeras 10 Unidades Acade´micas y las contribuciones absolutas de las activi- dades acade´micas (primeros 10 registros y los u´ltimos 5 respectivamente, del archivo C ABSOLU.TXT), son: Contribuciones Absolutas Contribuciones Absolutas de las de las primeras 10 UA actividades acade´micas Eje 1 Eje 2 Eje 3 Eje 4 Eje 1 Eje 2 Eje 3 Eje 4 1 4.460 2.0745 0.436 1.3623 Doc 18.068 5.907 5.279 1.708 2 0.357 0.003 3.463 6.273 DocAdm 0.383 6.710 43.156 35.018 3 2.862 0.969 1.830 0.000 ComIns 5.030 60.752 28.947 0.907 4 1.167 0.865 0.003 0.358 Inv 72.875 17.093 1.528 0.188 5 0.013 0.056 0.010 0.473 AcSoc 3.646 9.449 21.095 62.179 6 0.193 0.400 3.734 0.777 7 1.618 0.356 8.854 6.363 8 17.497 7.401 3.892 3.032 9 4.543 0.092 1.867 0.523 10 2.185 0.125 0.378 0.051 6. Opcio´n: Calcular Contribuciones Relativas. Las contribuciones relativas de las primeras 10 Unidades Acade´micas y las contribuciones realtivas de las actividades acade´micas (primeros 10 registros y los u´ltimos 5 respectivamente, del archivo C RELATI.TXT), 62 w. castillo – o. rodr´ıguez Eje 2 Eje 1 6 ? -ff % Inercia 84.18 ? 5 ? 11 ? 19 ? 23 ? 25 ? 48 ? • Doc. • DocAdm • ComInst • Inv. • AcSoc Figura 3: Plano Principal son Contribuciones relativas Contribuciones relativas de las de las primeras 10 UA actividades acade´micas Eje 1 Eje 2 Eje 3 Eje 4 1 0.891 0.074 0.012 0.024 Doc 0.904 0.053 0.036 0.007 2 0.261 0.000 0.340 0.399 DocAdm 0.037 0.116 0.555 0.292 3 0.872 0.053 0.075 0.000 ComInst 0.253 0.547 0.196 0.004 4 0.862 0.114 0.000 0.023 Inv 0.957 0.040 0.003 0.000 5 0.200 0.152 0.020 0.627 AcSoc 0.268 0.124 0.209 0.399 6 0.232 0.086 0.601 0.081 7 0.472 0.019 0.347 0.162 8 0.892 0.067 0.027 0.014 9 0.936 0.003 0.052 0.009 10 0.966 0.010 0.022 0.002 algoritmo e implementacio´n del ana´lisis de correspondencias 63 Referencias [1] Benze´cri, J.P. (1973) L’ Analyse des Donne´es. Tomo 2: L’Analyse des Correspon- dances., (2de. e´d. 1976). Dunod, Par´ıs. [2] Cailliez, F.; Page`s, J. P. (1976) Introduction a` l’Analyse des Donne´es. SMASH, Par´ıs. [3] Castillo, W. (1997) Ana´lisis Factorial de Correspondencias: Me´todo, teor´ıa y algorit- mos. Programa de Investigacio´n en Modelos y Ana´lisis de Datos (PIMAD), Escuela de Matema´tica, Universidad de Costa Rica, San Jose´. [4] Diday, E.; Lemaire, J.; Pouget, J.; Testu, F. (1982) Ele´ments d’Analyse de Donne´es. Dunod, Par´ıs. [5] Jambu, M. (1989) Exploration Informatique et Statistique des Donne´es. Dunod, Par´ıs. [6] Lebart, L.; Morineau, A.; Piron, M. (1995) Statistique Exploratoire Multidimension- nelle. Dunod, Par´ıs. [7] Rodr´ıguez, O. (1996) PIMAD 2.1 Manual al Usuario. Programa de Investigacio´n en Modelos y Ana´lisis de Datos, Universidad de Costa Rica, San Jose´. [8] Rodr´ıguez, O. (1997) Introduccio´n a la Programacio´n Orientada a Objetos en C++ para Ambiente Windows. Editorial Tecnolo´gica de Costa Rica, Cartago.