i UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO ASPECTOS LINGÜÍSTICOS DE UN LENGUAJE DE DESCRIPCIÓN DE MOVIMIENTO HUMANO Tesis sometida a la consideración de la Comisión del Programa de Estudios de Posgrado en Lingüística para optar al grado y título de Maestría Académica en Lingüística YORLENI BEATRIZ CAMPOS FLORES Ciudad Universitaria Rodrigo Facio, Costa Rica 2023 ii DEDICATORIA A mi familia: Mis padres Jorge Manuel Campos Elizondo y mi madre Enicia Flores Jiménez, que siempre me apoyaron en mi educación. Mis hermanos y hermanas que siempre han sido mi apoyo incondicional. Y con gran amor, a mi esposo Fabián y mi hijo Marco Fabián Herrera Campos, mi gran impulso para concluir esta hermosa etapa académica. iii AGRADECIMIENTOS Al Dr. Jorge Antonio Leoni de Léon, como tutor por su motivación, guía y amistad. Al Dr. Francisco Siles Canales, que me acompañó en la ideación del tema y me impulsó siempre. A la Dra. Kryscia Ramírez Benavides, por su apoyo y valiosos aportes a este documento. Al Programa de Posgrado en Lingüística, en especial al Dr. Adrián Vergara Heidke y la Dra. Gabriela Cruz, por las oportunidades brindadas. Y a Marilyn Álvarez Ortega por toda la ayuda administrativa. Al equipo y amigos del “PRIS-Lab” por su apoyo en el proceso, en especial a Elvira Chaves, Mario Castresana y Juan José Delgado. BACIÓN iv Esta tesis fue aceptada por la Comisión del Programa de Estudios de Posgrado en Lingüística de la Universidad de Costa Rica, como requisito parcial para optar al grado y título de Maestría Académica en Lingüística. _________________________________________________ Dra. Patricia Marín Sánchez Representante de la Decana Sistema de Estudios de Posgrado _________________________________________________ Dr. Antonio Leoni De León Director de Tesis _________________________________________________ Dr. Francisco Siles Canales Asesor _________________________________________________ Dra. Kryscia Ramírez Benavides Asesora ____________________________________________ Dra. Gabriela Cruz Volio Directora, Programa de Posgrado en Lingüística ___________________________________________ Yorleni Beatriz Campos Flores Candidata v TABLA DE CONTENIDO DEDICATORIA ..................................................................................................................... ii AGRADECIMIENTOS ......................................................................................................... iii TABLA DE CONTENIDO .................................................................................................... v RESUMEN EN ESPAÑOL ................................................................................................. viii ABSTRACT .......................................................................................................................... ix PALABRAS CLAVE .......................................................................................................... xiii LISTA DE ABREVIATURAS ............................................................................................ xiv CAPÍTULO I .......................................................................................................................... 1 INTRODUCCIÓN .................................................................................................................. 1 1.1 TEMA ........................................................................................................................... 1 1.2. JUSTIFICACIÓN E IMPORTANCIA ........................................................................ 2 1.3 OBJETIVOS ................................................................................................................. 4 1.3.1. GENERAL ........................................................................................................... 4 1.3.2. OBJETIVOS ESPECÍFICOS ............................................................................. 4 1.4. ESTADO DE LA CUESTIÓN ................................................................................... 4 1.4.1. Descripción del movimiento humano mediante distintos sistemas: lenguajes de señas, análisis de gestos y anotaciones gráficas de la danza. ............................................. 6 Las lenguas de señas ....................................................................................................... 6 Análisis de gestos ........................................................................................................... 9 Anotaciones gráficas de la danza ................................................................................. 13 1.4.2 Descripción del movimiento humano mediante bases de datos, creación de ontologías y sistemas tecnológicos de captura de movimiento humano .......................... 16 1.4.3 Descripción del movimiento humano a través de lenguajes controlados, categorías lingüísticas y otras posibilidades de la inteligencia artificial (AI) ................................... 19 Capítulo II: Marco Teórico ................................................................................................... 33 2.1. Referentes lingüísticos ............................................................................................... 33 2.1.1. Lingüística computacional (LC) ......................................................................... 34 2.1.2. Gramática Léxico-Funcional o GLF (Lexical functional grammar o LFG) ...... 36 2.1.2.1 Arquitectura de la LFG ..................................................................................... 39 Estructura-c(onstituyentes) ....................................................................................... 39 Estructura-f(uncional) ............................................................................................... 41 vi Estructura-a ............................................................................................................... 44 Configuración de la gramática .................................................................................. 44 2.1.2.2 Principios de la GLF ......................................................................................... 45 2.1.3. Lenguaje natural versus lenguaje controlado ..................................................... 51 Pasos en el planteamiento de un lenguaje controlado ...................................................... 54 2.2. Referentes de ciencias del movimiento humano ....................................................... 56 2.2.1 Movimiento humano ........................................................................................... 56 2.2.2 Movimiento facial ............................................................................................... 59 2.3. Sistema de captura de movimiento (Motion Capture) y sistema de reconocimiento de patrones ............................................................................................................................. 63 Vector de características y sensores ................................................................................. 65 Capítulo III: Metodología ..................................................................................................... 68 3.1. Tipo de investigación ................................................................................................ 68 3.2. Enfoque ...................................................................................................................... 68 3.3. Alcance ...................................................................................................................... 68 3.4. Técnica....................................................................................................................... 69 3.5. Etapas de la investigación ......................................................................................... 69 Capítulo IV. Resultados ........................................................................................................ 79 4.1 Caracterización de los componentes y expresiones faciales humanas ....................... 79 4.1.1 Definición de expresiones faciales y sus articuladores esenciales ...................... 79 4.1.2 Jerarquía del sistema de estructuras de expresiones faciales según sus patrones 81 4.1.3 Niveles y componentes del lenguaje de movimiento humano de las expresiones faciales estudiadas ........................................................................................................ 83 4.1.4 Conclusiones del apartado ................................................................................... 87 4.2. Relación entre las expresiones faciales descritas con las estructuras de la LFG ...... 88 4.2.1. Lexicón ............................................................................................................... 88 4.2.2. Categorías o clases gramaticales ........................................................................ 90 4.2.2.1. Tipología verbal ....................................................................................... 90 4.2.2.2. Tipología Nominal ................................................................................ 91 4.2.2.3. Adjuntos ................................................................................................ 91 4.2.2.4. Análisis lingüístico en las tres estructuras: estructura-c, estructura-f y estructura-a ................................................................................................................... 92 Descripción de sonrisa .............................................................................................. 92 vii Descripción de enojo ................................................................................................ 94 Descripción de sorpresa ............................................................................................ 95 4.2.3 Conclusiones del apartado ................................................................................... 98 4.3. Descripción de las posibilidades y restricciones de un lenguaje facial humano (LFH) 99 Multiplicidad de sintagmas nominales y roles temáticos ................................................. 99 Unión de oraciones o posible coordinación de más de una expresión facial en cadena 100 Funciones que se pueden establecer ............................................................................... 101 Sobre el rol temático ................................................................................................... 101 Sobre el género y número ........................................................................................... 102 Sobre el tiempo ........................................................................................................... 102 Supuestos hacia concretar la construcción de un lenguaje controlado (Lenguaje Facial Humano) ..................................................................................................................... 103 4.3.1. Conclusiones del apartado ................................................................................ 105 V. Conclusiones generales .................................................................................................. 106 VI. Bibliografía ................................................................................................................... 109 VII. ANEXOS .................................................................................................................... 115 Anexo 1. Ejemplo de base de datos del PRIS-Lab. ........................................................ 116 viii RESUMEN EN ESPAÑOL El estudio de expresiones faciales se ha dado desde muchas disciplinas, tales como antropología, comunicación, ingeniería informática y ciencias del movimiento humano. Gracias a la tecnología de captura de movimiento humano (MoCap) se pueden construir bases de datos que dan cuenta con mayor precisión de las variables detrás de cada expresión facial, no obstante, para quienes trabajan interpretando la precisión de los movimientos no resulta una tarea sencilla, por haber un paso entre la capacidad de procesamiento del ordenador y la comprensión del usuario acerca de la organización y niveles de información asociada. Por ende, se plantea en este trabajo con ayuda de la lingüística computacional y los lenguajes controlados, analizar el corpus de movimiento facial humano para facilitar su estudio y asimilación más detallada en análisis posteriores por parte del equipo de investigación del “PRIS-Lab” UCR (Laboratorio de investigación en reconocimiento de patrones y sistemas inteligentes). De manera exploratoria, desde una aproximación lingüística se plantea si se pueden concebir las estructuras de un lenguaje que aborde la comprensión de los patrones y relaciones que integran las variables físicas y matemáticas dadas por la ejecución de una expresión facial. Inicialmente, se estudia un corpus de movimientos faciales y sus patrones como lenguaje independiente con sus propias categorías, jerarquías y relaciones funcionales, luego, se emplea la Gramática Léxico Funcional para proponer posibles alcances y restricciones de este potencial lenguaje de movimiento humano en posibles categorías gramaticales y relaciones sintagmáticas, denominado por esta autora como LFH (Lenguaje Facial Humano) o FHL (Facial Human Language). Finalmente, se explora preliminarmente si el FHL podría acercarse a los parámetros de un lenguaje controlado. Las cuatro expresiones analizadas son la neutralidad, sonrisa, enojo y asombro. ix ABSTRACT The study of facial expressions has come from many disciplines, such as anthropology, communication, computer engineering, and human movement sciences. Thanks to the technology of human movement capture (MoCap) it is possible to build databases that more accurately account for the variables behind each facial expression, however, for those who work interpreting the precision of movements it is not an easy task, because there is a step between the processing capacity of the computer and the user's understanding of the organization and levels of associated information. Therefore, it is proposed in this work, with the help of computational linguistics and controlled languages, to analyze the corpus of human facial movement in order to facilitate its study and more detailed assimilation in subsequent analyses by the research team of the "PRIS-Lab" UCR (Laboratory for Research in Pattern Recognition and Intelligent Systems). In an exploratory way, from a linguistic approach, we consider whether it is possible to conceive the structures of a language that addresses the understanding of the patterns and relationships that integrate the physical and mathematical variables given by the execution of a facial expression. Initially, a corpus of facial movements and their patterns is studied as an independent language with its own categories, hierarchies and functional relations, then, Functional Lexical Grammar is used to propose possible scopes and restrictions of this potential language of human movement in possible grammatical categories and syntagmatic relations, named by this author as FHL (Facial Human Language) or FHL (Facial Human Language). Finally, it is preliminarily explored whether it could approach the parameters of a controlled language. The four expressions analyzed are neutrality, smile, anger and astonishment. x LISTA DE TABLAS Tabla 1. Conjunto de grabaciones con identificador numérico ........................................................ 20 Tabla 2. Diferencias entre HOCL y MOCL ...................................................................................... 53 Tabla 3. Variables fundamentales del movimiento humano ............................................................. 57 Tabla 4. Base de datos de expresiones faciales de PRIS-Lab ........................................................... 71 Tabla 5. Expresiones faciales universales y descritas según Ekman (1979) .................................... 74 Tabla 6. Condiciones de obtención de grabaciones de bases de expresiones faciales ..................... 76 Tabla 7. Definición de expresiones y articuladores con sus ejes antropométricos .......................... 80 Tabla 8. Atributos o modificadores para considerar en el lenguaje de movimiento humano .......... 92 Tabla 9. Correlación de niveles del LFH con estructuras de la LFG ............................................... 97 Tabla 10. Ejemplo de marcadores múltiples con datos en la expresión "enojo" ............................ 100 Tabla 11. Cumplimiento de fines de un lenguaje controlado .......................................................... 103 xi LISTA DE FIGURAS Figura 1: Ejemplo de palabras y señalización de LESCO (CENAREC, 2020) .................................. 8 Figura 2: Modelo cromático de color para clasificar emociones. Díaz (2001) ............................... 11 Figura 3: Puntos de reconocimiento de expresiones, con tecnología Kinect ................................... 12 Figura 4: Tres planos anatómicos del cuerpo humano. Azevedo-Guaura (2020) ............................ 14 Figura 5. Ejemplo de anotación Benesh. Instituto Benesh (2017) .................................................... 15 Figura 6. Componentes básicos de un Sistema de Captura de Movimiento Humano. Liu (2015) ... 17 Figura 7: Relación de modelo de lenguaje natural con modelo de lenguaje de movimiento. Takano (2009) ................................................................................................................................................ 22 Figura 8: Ejemplo 1 de función de conjunto R. Colado (2014) ........................................................ 49 Figura 9: Ejemplo 2 de función de conjunto R. Colado (2014) ........................................................ 49 Figura 10. Ejemplos de expresiones faciales y sus unidades de acción (AU). ................................. 61 Figura 11: Músculos del rostro que permiten el habla y las expresiones faciales. Parent (2012)... 63 Figura 12: Plantilla de división de puntos del rostro para sistema de captura de movimiento facial. PRISLab (2022) ................................................................................................................................. 66 Figura 13: Matriz de marcadores con movimientos verticales........................................................ 80 Figura 14. Jerarquía de sistema de estructuras de expresión facial ................................................ 81 Figura 15: Representación de un rostro tanto en imagen frontal como lateral, donde se pueden notar los distintos ejes que intervienen en una expresión facial; Z, X y Y. Pérez (2018) ................. 83 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918847 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918850 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918851 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918852 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918853 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918853 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918857 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918861 https://6f33fa7f78ea46e2aaca-my.sharepoint.com/personal/yorleni_campos_ucr_ac_cr/Documents/Escritorio/Tesis%20entregada%20SEP%20%20f.%20correcciones%20JAL.docx#_Toc145918861 xii LISTA DE DIAGRAMAS Diagrama 1. Ejemplo de estructura-f como matriz de rasgos .......................................................... 42 Diagrama 2. Configuración de la GLF según sus estructuras ......................................................... 45 Diagrama 3. Ejemplo de estructura funcional de una oración en inglés ......................................... 48 Diagrama 4. Diagrama de proceso de obtención de datos de expresiones faciales ......................... 75 Diagrama 5. Niveles del lenguaje de movimiento humano entorno a expresiones faciales o LFH (Lenguaje Facial Humano) ............................................................................................................... 84 Diagrama 6. Tipos de transición entre expresiones faciales ............................................................ 86 xiii PALABRAS CLAVE Lingüística computacional, lenguaje natural, lenguaje controlado o creado, gramática funcional léxico, expresiones faciales, captura de movimiento humano (human motion capture), MoCap, lenguaje facial humano. xiv LISTA DE ABREVIATURAS Adj: Adjetivo Adv: adverbio AI: Inteligencia Artificial (Machine Learning) LFG: Lexical Functional Grammar (Gramática Léxico Funcional por sus siglas en inglés) LFH: lenguaje facial humano LLMs: Modelos de lenguaje de gran tamaño (Large Language Models) MoCap: Captura de movimiento (del inglés Motion Capture) N: nombre OD: del inglés Direct Object PRIS-Lab Laboratorio de investigación en reconocimiento de patrones y sistemas inteligentes (del inglés Pattern Recognition and Intelligent Systems Laboratory) Sintagma Preposicional (del inglés Prepositional Phrase) PRED Predicación SAdv: Sintagma adverbial SConj: Sintagma Conjuncional SN: Sintagma Nominal SV: Sintagma Verbal SUJ Sujeto 1 CAPÍTULO I INTRODUCCIÓN En este capítulo se plantean los diversos aspectos que comprenden la presente investigación: el tema, la justificación, los alcances y objetivos, y el estado de la cuestión. 1.1 TEMA Esta investigación plantea el análisis de los aspectos lingüísticos de un lenguaje que describa la estructura de un conjunto de datos de expresiones faciales, recolectadas gracias al sistema de captura de movimiento o MoCap. El mismo contempla una arquitectura de niveles lingüísticos: morfología, léxico y sintaxis, con sus restricciones y alcances. Según Castrillón (2008), las expresiones faciales son la manera más natural e inmediata en que los seres humanos comunican sus emociones. Por lo cual ha resultado esencial su estudio como parte de explicación de procesos comunicativos, pero también para la interpretación computacional con distintos fines como el mejoramiento de la condición de salud las personas, las industrias creativas y las producciones audiovisuales. En cuanto a la comprensión lingüística se ha aproximado desde la interpretación del lenguaje no verbal, no obstante, la correlación de análisis de patrones como un lenguaje en sí mismo presenta un interés especial y un trabajo exploratorio. Para el análisis, se empleó una base de expresiones faciales “básicas o universales”, tales como: la sonrisa y sorpresa, recolectada en el Laboratorio de investigación en reconocimiento de patrones y sistemas inteligentes (PRIS-Lab) de la Escuela de Ingeniería Eléctrica de la Universidad de Costa Rica, y vinculada a la labor realizada por el equipo de trabajo denominado Move. El laboratorio fue fundado en el 2012 por el Dr. rer. nat. Francisco Siles Canales y en sus ocho años de existencia se han definido varias líneas de investigación, una de ellas ha sido el análisis del movimiento humano para su aplicación en otros campos de estudio como: desempeño deportivo, robótica y arte. 2 La representación del movimiento humano como un lenguaje se nutre de identificar los patrones y poder referenciarlos de manera más cercana por parte de los usuarios, labor que no resulta sencilla en el día a día en el Laboratorio. Por ende, este trabajo contempla acercarse a la cadena de movimientos o segmentos gracias a la teoría generativista Gramática Léxico Funcional (Lexical Functional Grammar) y la teoría de lenguajes creados. En este trabajo se concibe la gramática léxico funcional visualizando las múltiples dimensiones de estructuras, con sus propias reglas, conceptos y formas, por lo cual se analiza un corpus de movimientos enfocado en sus funciones y relaciones. Por su parte, si se pudiera considerar corpus o secciones de datos como una especie de lenguaje controlado o construido, para entendimiento del equipo del “PRIS-Lab”. 1.2. JUSTIFICACIÓN E IMPORTANCIA El uso aplicado de la disciplina de la lingüística y sus marcos de análisis para el desarrollo de aplicaciones en otras áreas permite un fortalecimiento del trabajo multi, inter y transdisciplinario, que se lleva a cabo en la Universidad de Costa Rica, de manera que se conectan distintas corrientes académicas con objetivos en común, como las citadas en la sección anterior. Y estos avances son positivos ya que obedecen a que: […] no solo las motivaciones de curiosidad ante los hechos han empujado el crecimiento de la Lingüística, sino que el campo disciplinar –en su progresión y debido al conocimiento logrado– ha permitido delimitar nuevos problemas y ha facilitado la aproximación a circunstancias peculiares, ya no solo con objeto de describirlas sino porque ha de resolverlas. Este panorama es especialmente notable en el ámbito –ya asentado– de la Lingüística aplicada. (Fernández, 1999, p.34) La lingüística computacional como campo interdisciplinario apoyado por ingenieros, informáticos, matemáticos y lingüistas, resulta de alta relevancia a nivel global porque 3 permite continuar avanzando a la sociedad en áreas de estudio, en este caso específicamente el análisis del movimiento humano. La mayor aproximación del estudio del movimiento humano y su vínculo con rasgos lingüísticos para implementación en sistemas inteligentes proviene de autores extranjeros como Takano (2009) y Gutemberg et. al (2012), y en cuanto al estudio del movimiento humano vinculado a lenguas señadas y pertinente para este trabajo destacan esfuerzos como los de Moreno (2013). Así mismo, desde el equipo MOVE, perteneciente a dicho Laboratorio, se ha buscado el análisis tridimensional del movimiento humano y el desarrollo de sistemas de modelado computacional para el análisis biomecánico-cinemático de movimientos humanos, en particular para optimizar el desempeño deportivo y el mejoramiento de la salud. Finalmente, se considera analizar desde un enfoque lingüístico puro la creación de un lenguaje descriptivo de movimiento humano para aportar con nuevos enfoques de estudio lingüístico en el país, desde el área computacional en el desarrollo de sistemas de modelado para el análisis consistente biomecánico y su rama la cinemática, automatizado de las acciones humanas, con un potencial impacto en la salud, enseñanza de ciencias del movimiento humano y consideraciones para la optimización del rendimiento deportivo, entre otras. Se emplea para tal fin, dos teorías, la primera de la Gramática Léxico Funcional y la segunda, de lenguajes controlados, con el propósito de visualizar posibles estructuras categoriales y funcionales, así como las primeras reglas, con alcances y limitaciones para considerar a futuro el modelaje formal del lenguaje. 4 1.3 OBJETIVOS 1.3.1. GENERAL Analizar desde un enfoque lingüístico la creación de un lenguaje descriptivo de movimiento humano, aplicado a expresiones faciales obtenidas de la tecnología de sistema de captura óptica de movimiento (MoCap). 1.3.2. OBJETIVOS ESPECÍFICOS I. Caracterizar los componentes y funciones del corpus de movimientos seleccionados en niveles. II. Seleccionar los constituyentes lingüísticos que puedan aproximarse a la descripción de los movimientos en estudio como componentes de un lenguaje. III. Describir las posibilidades y restricciones de un lenguaje facial humano (LFH). 1.4. ESTADO DE LA CUESTIÓN Cabe destacar que dentro de toda la gama del movimiento humano se puede elegir una sección del cuerpo o del rostro para estudio, cómo ya se explicó en la introducción de este trabajo se realiza un hincapié hacia las expresiones faciales por el interés que suscita el pensar en un Lenguaje Facial Humano (LFH), no obstante, en el estado de la cuestión se puede contar con la mención de trabajos sobre el movimiento de articulaciones del cuerpo en general, al ser propuestas previas relevantes o vinculantes con los objetivos de esta propuesta. Existen diversos trabajos que citan el estudio del movimiento humano y variables cercanas o directas para el establecimiento de un lenguaje descriptivo de movimiento humano, en este apartado se estructuran los antecedentes en tres secciones: Apartado 1.4.1: desarrollo de las lenguas de señas Stokoe (1960) Valli y Lucas (2008), Moreno (2013), donde se explica el movimiento humano a través de sistemas denotativos o iconográficos, pero con categorías independientes y como sistema comunicativo válido, así mismo, ejemplos de la sistematización o descripción de 5 manifestaciones como la danza y variables para ciencias del movimiento humano Laban (1984) y Newlove (2011) Apartado 1.4.2: la digitalización y captura del movimiento para la creación de ontologías, bases de datos digitales y estudios biométricos a nivel computacional Sead (2012) y Plapper (2016), donde se evidencia un salto hacia el empleo de tecnologías como cámaras de video y software para el registro del movimiento. Apartado 1.4.3: planteamiento de lenguajes controlados con categorías lingüísticas y modelos abstractos donde se busca explicar el movimiento humano en analogía a las lenguas naturales Takano (2009), Gutemberg (2012), Goutsu (2018) y García (2019). En general en la revisión bibliográfica se encontró que en las investigaciones que exploran el desarrollo de léxicos, iconografías o sistemas descriptivos del movimiento humano, se reconoce la complejidad de las variables y estructuras que lo conforman, así como que se establecen categorizaciones gramático léxicas que citan variables como: las partes del cuerpo o del rostro que intervienen en el movimiento, la tipología de movimientos, el significado asociado, y más cercanamente al análisis de bases de datos con categorías de morfología, fonética o sintaxis del movimiento. Aunque estas dan un norte hacia la construcción de un lenguaje de movimiento no se comparte plenamente las bases de datos o la metodología empleada para generar las descripciones que se postulan, por ende, se encuentra un espacio desde este trabajo para exponer una metodología de análisis descriptiva del movimiento humano y vinculante a categorías gramaticales. 6 1.4.1. Descripción del movimiento humano mediante distintos sistemas: lenguajes de señas, análisis de gestos y anotaciones gráficas de la danza. Las lenguas de señas Las lenguas de señas son un buen ejemplo donde los significados son representados por movimientos humanos y gestos los cuales en algunas ocasiones son documentados en diccionarios de imágenes o vídeos para poder ser aprendidos. Aunque las personas sordas son “mudas” y fueron consideradas por mucho tiempo de manera estigmatizada como personas enfermas o incapaces de comunicarse adquiriendo una lengua, se logró desarrollar técnicas mediante las cuales los maestros se comunicaban con sus alumnos sordos, y donde el lenguaje de señas se volvió clave, muestra de ello fue la fundación de la primera escuela para sordos en Francia, en 1755. Desde los siglos XVI y previo al XX, el desarrollo de la lengua de señas progresó, según Moreno (2013) estas lenguas son consideradas manifestaciones directas de la facultad humana de generar lenguaje, tanto como lo son las lenguas habladas. Cuentan con configuraciones para expresar sentidos, cabe aclarar que el concepto de lenguas señadas que resalta dicho autor y que interesa en este trabajo es que distingue las “lenguas señadas” de “lenguas orales señadas”, es decir, que son concebidas con independencia de las lenguas orales y se plantean plenamente desarrolladas. Sobre este tema, Chomsky (2000) en su texto “Language as a Natural Object” explica que las lenguas de señas son comparables con las lenguas habladas, ya que, al igual que estas, cuentan con intención y estructuras jerárquicas propias. Por otra parte, Valli y Lucas (2008) mencionan características con que cuentan las lenguas señadas en comparación con las orales: doble articulación, variación y mutabilidad, plurisemia, aprendibilidad, entre otras. La doble articulación es cuando se está ante la aparición de dos señas repetidas y de manera sucesiva, este dato resulta relevante porque puede dar cuenta del uso de segmentaciones vinculadas a la lengua de señas. Las lenguas de señas tienen claramente definidos los niveles que las componen: 7 a. Fonología: según lo postulado por Stokoe (1960) se pueden aislar con técnicas de distribución y contraste empleadas en fonología descriptiva los elementos de formación de una lengua de señas. b. Morfosintaxis: presentan un orden gramatical, dónde existe reglas para la formación de palabras, la construcción de oraciones y relaciones más complejas de los constituyentes. Se pueden tener clases de palabras como: sustantivos, verbos, adjetivos, adverbios, pronombres, entre otros, así mismo morfemas derivativos o flexivos. La fonología está orientada a explicar las reglas que rigen la pronunciación en las lenguas, detrás de los sonidos concretos que escuchamos existe un sistema abstracto de unidades más complejas que permiten diferenciar significados, por ejemplo, entre dos palabras como “pala” y “bala” donde existe en la primera un fonema bilabial oclusivo [p] que es sordo y en la segunda el fonema [b] bilabial oclusivo sonoro. Es decir, ambas palabras cuentan con un mismo punto de articulación del sonido, en este caso, el lugar dónde tienen contacto los labios y con un mismo modo de cómo se produce el sonido, en este caso, el rasgo del cierre total y momentáneo del paso del aire, pero los diferencia el rasgo relacionado con la vibración de las cuerdas vocales, en la primera no se da y en la segunda sí. Como parte de las más de 300 lenguas de señas a nivel mundial, se tiene la Lengua de Señas Costarricense (LESCO), de la cual hay un diccionario en línea para quienes deseen aprenderla. Esta evidencia la incorporación de estructuras gramaticales fundamentales, tales como la categoría del adverbio, acompañante del verbo, en la figura número 1 se muestra “a veces”, seña plana, adverbio de tiempo, y cómo se incorpora la explicación de este en el LESCO. 8 LUNES A-VECES-2 IR+del/derIR+del/derA-VECES-2. Características: 1. Seña plana; 2. Adverbio de tiempo. Traducción: Son los viernes o los lunes que a veces voy. Lo que significa la figura anterior es que se tiene una glosa para detallar el significado de la cantidad de días de la semana que se asiste a una actividad, en este sentido, VIERNES y LUNES. Jarque (2011) explica que las lenguas signadas tienen una perspectiva diferencial y el rol del gesto un gran aporte de significado, remitiendo a la labor de Stokoe (1960): En particular, analizó los signos como unidades léxicas formadas por tres parámetros formativos, equivalentes funcionales a los fonemas de las lenguas orales: (1) la forma de la(s) mano(s) –denominada configuración de la mano–, (2) la posición de la(s) mano(s) en el cuerpo del signante o en el espacio a su alrededor –denominada lugar de articulación– y (3) el movimiento que realiza(n) la(s) mano(s) o brazo(s), denominado movimiento (Jarque, 2011, p. 73). Hay que reconocer que el lenguaje de señas cuenta con un sistema fonológico de manera analógica al de los sistemas orales, reivindica a la capacidad de generar movimientos como núcleo de distintividad de una lengua y al uso de las partes del cuerpo humano como unidades con significado lingüístico (agente que rige el movimiento). En esta línea, Brentari Figura 1: Ejemplo de palabras y señalización de LESCO (CENAREC, 2020) 9 (1998) propuso un método prosódico con el que se estipulaban jerarquías estructurales de articulador, lugar de articulación y orientación espacial hacia donde se orientan los movimientos, con respecto a las manos. Así mismo desde el modelo de fonología semántica de Armstrong, Stokoe y Wilcox (1995) se comprendió que existen parámetros quinésicos con valor distintivo que permiten dar cuenta de la organización interna de una lengua de signos, que son: configuración de la mano, orientación de la palma de la mano, el movimiento y componentes no manuales como la expresión facial. En resumen, cabe aclarar que en las lenguas de señas y los lenguajes centrados en gestos se proponen símbolos visuales como un recurso de aprendizaje o representación gráfica de su léxico, pero subyacen en ellas niveles más complejos de estructuración a nivel semántico y pragmático que no deben ser ignorados. De igual manera se podría considerar que en la descripción del movimiento humano se emplean recursos como el uso de vectores con respecto a un punto de referencia u ontologías, pero no debe dejarse de lado comprender cuáles son las estructuras profundas a las que se debe hacer mención ni su lógica de funcionamiento de manera que se respete la independencia de las variables de movimiento en sí mismas. Análisis de gestos Según Díaz (2001) el análisis de los gestos faciales universales es una de las aproximaciones para la clasificación de las emociones humanas. Así mismo explica que contar con una taxonomía de las emociones humanas no ha sido fácil, no obstante, se han postulado distintos enfoques tal como el de Wundt (1896) que consideró tres dimensiones polares afectivas: excitación-calma, placer-dolor y tensión-alivio, dando este paso a finales del siglo XIX a diversas teorías posteriores. Los esfuerzos realizados por la clasificación de los gestos también ubicándolos en coordenadas dentro de campos cartesianos bidimensionales, véase Webster y Kelleher 10 (1999), siguen siendo criterios empíricos, pero constituyen una manera de acercarse al análisis de las emociones. De manera que al seguir realizando un intento de dar explicación de lo que emocionalmente se concreta a través de las expresiones faciales puede ser analógicamente comparable con lo que procesa el cerebro a nivel de lenguaje y lo que se percibe como expresiones concretas, así se considera que “en el lenguaje natural, los conceptos subyacen al uso de los términos, y la comunicación es posible porque el concepto se asocia a rasgos distintivos del referente o del objeto; tal asociación constituye el significado de una palabra. A pesar de las complejidades e incógnitas de la semántica, esta asociación entre palabra y objeto parece manifiesta para los términos que designan cosas y sucesos físicos externos a los sujetos. Sin embargo, no lo es tanto para los términos que designan procesos mentales, como son las emociones.” (Díaz, 2001, p. 3) Cabe en relación con lo anterior, plantearse cuáles son los rasgos distintivos para poder concretar la diferenciación en el análisis de expresiones faciales y si esto dentro del esquema abstracto de producción puede ser delimitado como sucede con el léxico en una lengua. En el caso de Díaz (2001) plantea una asociación afectiva como un modelo cromático de color, planteando la figura 2. 11 Figura 2: Modelo cromático de color para clasificar emociones. Díaz (2001) Tal como expresa la figura anterior, en un plano definido por dos variables ortogonales se muestra una horizontal de activación (excitación a la derecha, relajación a la izquierda) y otra vertical de valor hedónico (agrado arriba y desagrado abajo) se ubican catorce ejes polares de emociones antónimas (de signo afectivo contrario). En el centro se acomodó el círculo de los colores que se elaboró con un criterio similar de oposición entre complementarios. De este trabajo llama la atención la metodología planteada, realización de un vocabulario amplio de las emociones consideradas tanto en sinónimos como antónimos, la elección de un término representativo que engloba a las emociones afines, de manera que el modelo dispone el centro como falta de afecto, los ejes han sido ordenados de acuerdo con un criterio de polaridad agradable-desagradable. Otro aspecto muy llamativo es la asociación con el componente físico donde se si cita el ejemplo de “en el caso de la expresión facial se podría plantear que los músculos agonistas y antagonistas que se ponen en actividad para una determinada emoción pueden signar el afecto contrario al hacer el movimiento inverso, como 12 sucede con las comisuras labiales que se mueven hacia arriba en el caso de la alegría y hacia abajo en el caso de la tristeza” (Díaz, 2001, p. 10) Por otra parte, se tiene el trabajo de Ferreira (2015) sobre reconocimiento de expresiones faciales, orientado a reconocer emociones a través de expresiones faciales. La autora remite al uso de las FACS (Facial Coding System), entendiendo las AUs o unidades de acción como movimientos fundamentales de los músculos o grupos de músculos y la SU como shape unit a la forma de un músculo. La autora implementa aplicaciones basándose en la metodología de Candide, que en una malla de puntos y se buscan las coordenadas en grado de los puntos, así mismo se emplean sistemas SDK de Kinect con imágenes de color, profundidad y disposición de la cara, cómo se ve en la figura 3. Figura 3: Puntos de reconocimiento de expresiones, con tecnología Kinect Como se puede notar, SDK asigna 87 puntos en zonas clave de la cara para obtener la expresión del usuario, la estimación de localización de los puntos se hace mediante aplicaciones de algoritmo. Uno de los ejemplos desarrollados es lograr la detección de apertura de boca, sabiendo la distancia que se da entre los puntos superior e inferior del centro de la boca. O la 13 detección de la sonrisa, guardando la distancia inicial entre los puntos de la comisura labial. La autora finaliza considerando que se debe mejorar aún mucho en las relaciones de AUs y emociones, ya que se dan variaciones en los resultados. Anotaciones gráficas de la danza En otra línea de aportes para describir el movimiento humano es importante considerar los esfuerzos realizados desde la danza, desde esta área han surgido propuestas de sistemas de representación con el fin de registrar pasos de una coreografía. Labanotation o lenguaje Laban fue creado por Rudolf von Laban, en 1928, quien fue un profesor de danza húngaro que trabajó en Alemania y postuló una denotación matemática que ha constituido la base de comprensión de muchas características del movimiento humano, siendo usada no sólo por coreógrafos y actores sino por profesionales de ciencias del movimiento humano. Por ejemplo, esta teoría se usa en cursos introductorios de la Escuela de Educación Física de la Universidad de Costa Rica. Newlove (2011) explica que Laban es un sistema en el que los pasos de un movimiento y el movimiento en sí mismo constituyen una única entidad, es decir, no se puede hablar de un paso con simplicidad sin considerar características como: el peso, la posición, las secuencias, las partes que intervienen en el mismo, el espacio que se ocupa, entre otras características intrínsecas del movimiento mismo. 14 De esta propuesta cobra interés por ejemplo visualizar cómo se da un conjunto de símbolos para explicar la altura en el espacio y dirección en tres planos del movimiento humano, comprendiendo el cuerpo humano en estos tres planos; sagital (en hemisferio izquierdo y derecho), frontal (divide parte delantera y trasera) y transversal (divide inferior y superior), los cuales se muestran en la Figura 4. Tal como se muestra, los tres planos anatómicos del cuerpo humano son sólo un ejemplo de las coordenadas como referentes a partir de las cuales se precisan mediciones y puntos base para la ejecución de los movimientos. Con base en lo anterior se denota las dimensiones dentro del cual el movimiento puede comprenderse, estas características son importantes a considerar para el desarrollo de cualquier aproximación o lenguaje de movimiento humano, que pueda integrar todo el cuerpo o partes seleccionadas. Figura 4: Tres planos anatómicos del cuerpo humano. Azevedo-Guaura (2020) 15 Dentro de otras propuestas realizadas desde la danza, se tiene el sistema de anotación Benesh, creado en 1956 por el británico Joan Benesh, en este se emplea como marco de escritura cinco líneas horizontales dentro de las cuales se ubican símbolos que representan las posiciones de manos y pies, se lee de izquierda a derecha y de arriba a abajo tal como el sistema de escritura musical mediante el pentagrama. En la figura número 5 se muestra un ejemplo de la escritura de este sistema de anotación. Como se puede visualizar, las piernas que permanecen en el suelo se representan con una pequeña línea horizontal, el movimiento de los brazos y piernas en apertura se dan de manera redondeados, esto entre algunos de los símbolos empleados. Para aprender esta denotación es necesario memorizar los símbolos o íconos y los movimientos que representan. Los esfuerzos realizados desde la danza se consideran relevantes para este trabajo, porque son esfuerzos previos que contribuyen a dar cuenta del interés de la denotación y caracterización de distintos tipos de movimientos humanos, lo cual implica considerar sus distintas variables y complejidad, tales como: espacio y dirección. Cabe destacar que estas anotaciones quedan limitadas a la descripción plana y bidimensional del movimiento y permiten tomar en consideración lo siguiente: Figura 5. Ejemplo de anotación Benesh. Instituto Benesh (2017) 16 a. La representación, descripción, estructuración, alcance y final divulgación del lenguaje que se diseñe debe orientarse hacia los potenciales usuarios de este. Así como su aprendizaje, ya que, la memorización y uso cobra mayor significado según se practique, en los ejemplos vistos el uso en la danza se refuerza a través de maestros o academias de danza. b. Al igual que en el campo lingüístico se emplean recursos como: símbolos gráficos que constituirían un posible léxico para el análisis de estos lenguajes y por supuesto un sistema de comunicación para plasmar sus prácticas. Este tipo de denotaciones se nutren de estrategias similares a las empleadas en la generación de los lenguajes de señas o los mismos jeroglíficos, de hecho, la representación de personas danzantes se daba desde periodos anteriores a la cultura egipcia y cumplía con el objetivo de las personas de representar sus prácticas culturales con iconografías. Lo anterior genera un primer supuesto para la propuesta de un lenguaje; la manera en que debe ser representada la información valiosa de ser aprendida y documentada. Ciertamente se consideran muy valiosos estos aportes realizados desde la danza como un primer acercamiento a la descripción del movimiento humano y el uso de recursos lingüísticos para ello. 1.4.2 Descripción del movimiento humano mediante bases de datos, creación de ontologías y sistemas tecnológicos de captura de movimiento humano Con el auge de la tecnología se puede captar el movimiento para su archivo, análisis y reproducción, uno de los sistemas más conocidos es el de captura de movimiento humano. El sujeto porta un traje al cual se le adhieren marcadores que funcionan como sensores reflectores de luz, al ingresar a un campo físico y realizar movimientos las cámaras infrarrojas los captan y transfieren la información relacionada, tal como tiempo, parte del cuerpo u otras variables numéricas y cualitativas para la construcción de una base de datos digital, que se almacena en un computador. En la figura número 6 se muestra un ejemplo de un espacio de 17 captura de movimiento humano y de los implementos empleados por el sujeto de investigación. Se señalan las partes esenciales del sistema de captura: cámaras infrarrojas como sistema óptico, un traje empleado por un usuario al cual se le colocan sensores reflectivos, una barra (kinect) que ayuda a medir ruido ambiente en cuanto a transmisión de imagen y una pantalla que con ayuda del software proyecta las tomas de lo capturado. Sead (2012) explica que gracias al auge de producción de vídeos y la captura de movimiento humano se puede segmentar y analizar datos de este. Siendo esta una motivación de investigación se han dado esfuerzos como el propuesto por el autor y su grupo de investigación que es generar ontologías basadas en análisis de movimientos de distintos tipos, Figura 6. Componentes básicos de un Sistema de Captura de Movimiento Humano. Liu (2015) 18 específicamente en este caso ellos trabajan con datos de la danza y con el sistema de anotación Benesh. Dicho autor parte de la consideración de que después de que los datos de video son captados y se genera la segmentación de estos en rasgos o características, para los usuarios resulta difícil interpretar dicha información en contraste con la misma ejecución de los movimientos humanos llevadas a cabo por las personas que fueron grabadas. Es por esto por lo que plantean generar una ontología que permita que los datos que se generan sean clasificados mediante ciertas reglas permitiendo una organización y comprensión mejor de los mismos. La ontología construida por estos autores considera aspectos cruciales como: la parte del cuerpo, movimiento simple o complejo y subcategorías dentro de estos como movimiento de manos, ya sea derecha o izquierda, entre otros. Este trabajo se considera muy valioso para nuestro objetivo, porque da luz sobre aspectos esenciales de la misma jerarquía que pueden tener los movimientos humanos y cómo se podrían generar secuencias de estos de manera analógica como se hace con los componentes básicos de la oración. En adición al tema de ontologías o de la organización que se le da al conjunto almacenado de los movimientos captados por el MoCap, se tienen trabajos como el de Plapper (2016), donde se realza la importancia que ha tenido la unión del movimiento humano con estructuras del lenguaje natural. Dentro de la concepción del autor es relevante tomar en cuenta la lógica de organizarlos datos para que estén disponibles al querer usarlos tal como se podría dar el acceso al léxico en el lenguaje natural. Así se señala como un problema común “la recuperación de entradas coincidentes de una gran base de datos de movimiento” (Plapper, 2016, p. 2), ya que en una base de datos cada entrada suele ser anotada con una o más etiquetas y a menudo es difícil seleccionar todas las etiquetas apropiadas durante la anotación manual de un nuevo movimiento, esto sobre todo si se trabaja con una cantidad grande de datos. 19 En este caso, los investigadores construyeron una base que integra más de 3917 movimientos, 6278 oraciones y 52903 palabras descriptoras de los movimientos captados por el Sistema de Captura de Movimiento Humano, este es buen referente para comprender la complejidad de poder referirse a un conjunto léxico del movimiento humano en plenitud, por lo tanto queda claro que los trabajos de investigación para generación de un lenguaje de movimiento humano deben orientarse a una elección de una cantidad limitada de movimientos y a describir las estructuras específicas de la selección elegida. Como conclusión del trabajo se tiene que: …ha habido años de investigación en esta área para mejorar nuestra comprensión de cómo vincular modelos de movimiento y lenguaje. Sin embargo, no existe ningún conjunto de datos estandarizado y abierto que permita a los investigadores evaluar y comparar sus enfoques (Plapper, 2016, p. 11). Lo que arroja esta investigación refuerza el interés preexistente de muchos investigadores de estudiar las características de movimiento humano y cómo es un área no finalizada sino en la que se puede contribuir con nuevos enfoques de análisis. 1.4.3 Descripción del movimiento humano a través de lenguajes controlados, categorías lingüísticas y otras posibilidades de la inteligencia artificial (AI) Como primer esfuerzo cabe citar el de clasificación de expresiones faciales vinculada al aprendizaje automático elaborado por García (2019) donde se vincula el machine learning y el tema de reconocimiento de expresiones faciales en el contexto de grabaciones de streaming, para lo cual acude al Sistema de Codificación Facial relacionando la expresión con respecto a las unidades musculares de la cara. Como metodología el autor detalla como variables: el nombre de la emoción, una cantidad de grabaciones por cada tipo de emoción y un único identificador numérico asignado a cada emoción, tal como se muestra en la tabla 1. 20 Tabla 1. Conjunto de grabaciones con identificador numérico Identificador Cantidad de grabaciones Emoción 0 4593 Enfadado 1 547 Disgustado 2 5121 Aterrorizado 3 8989 Feliz 4 6077 Triste 5 4002 Sorprendido 6 6198 Neutral Fuente: García (2019) La autora desarrolla un algoritmo de clasificación de las imágenes de formato CSV a JPG empleando varios tipos de software de análisis entre ellos: Spark Submit utilizado en clasificaciones de clúster y Random Forest Classifier, que permiten diferenciar en una cadena de datos, los números enteros asociados a los cuadros de imagen del rostro que son medidos en pixeles. Como parte de sus resultados logra una precisión de clasificación de casi un 50% de distinción de tres tipos de emociones: “enfadado”, “triste” y “contento”. Por su parte, González, Guerrero et al. (2021) hacen un recorrido por bases de datos de expresiones faciales para identificación automática de emociones, al respecto mencionan que existen múltiples dispositivos para captar las imágenes, desde las cámaras web, tridimensionales a sensores especializados tipo MoCap. 21 También, aunque ha sido un campo de trabajo de los últimos años se siguen encontrando algunas limitantes: ● Dificultad de generar bases de datos con expresiones espontáneas ● Los repositorios de emociones espontáneas muestran una mezcla de expresiones y ruido, según el ambiente de donde fueron capturadas ● El vínculo de emociones con expresiones y estos con patrones de reconocimiento no resulta tarea sencilla Algo a enfatizar es que se menciona como consideración el uso del enfoque de emociones discreto que según las autoras se basa “en la categorización que es reflejada en la organización de los campos semánticos en los lenguajes naturales” (González, 2021, p. 2). Por otro lado, el proceso empleado dentro del método discreto remite al: … uso de escalas nominales, ordinales o intervalos de características, en una o varias listas de emociones que varían de acuerdo con la categorización o escalas que manejen. Aunque existen algunos instrumentos estandarizados de este tipo, muchos investigadores prefieren crear categorías de emociones que son relevantes para un contexto de investigación específico (González, 2021 p. 4). Dado lo anterior, se deduce la relevancia de que los análisis de emociones se den en contextos restringidos no sólo la capacidad misma de la base generada o corpus de análisis empleado, sino para la labor o fines que se persigue en el momento de su análisis. En otra iniciativa de investigación, Takano & Nakamura (2009) proponen un modelo de lenguaje de movimiento humano en relación con patrones del modelo de un lenguaje natural. A partir esta relación se enfatiza los aspectos de grafo del Modelo de lenguaje de movimiento con la sintaxis de una lengua natural, empleando la cadena de Márkov o HMM (Hidden Markov Model) que consiste en un conjunto de secuencias de clasificación de etiquetas, tal como se muestra en la figura número 7. 22 Como se puede notar, la relación anterior refleja que en el modelo de lenguaje de movimiento las palabras (morfemas) están asociadas con patrones de movimiento humano que son variables latentes (protosímbolos), es decir, son inobservables como lo serían los contenidos semánticos para la producción concreta de un léxico. Por su parte del modelo de lenguaje natural se realza la dinámica entre “las palabras” o conjuntos de morfemas en comparación con una estructura sintáctica, es decir, el movimiento se explica como si fuera una oración (secuencia de palabras) y se analizan los subcomponentes entendidos como clases de palabras. Figura 7: Relación de modelo de lenguaje natural con modelo de lenguaje de movimiento. Takano (2009) 23 Los autores desarrollan un algoritmo que predice la relación entre ambos niveles de lenguajes, esto tomando como referencia lo siguiente: El modelo de lenguaje de movimiento humano consiste en tres clases de nodos: símbolos de patrones de movimiento, variables latentes y palabras o morfemas. El símbolo del patrón de movimiento es representado mediante un lenguaje HMM que enseña patrones de comportamiento espacial y temporal (Takano, 2009, p. 647). Cabe aclarar que los datos de movimiento humano incluidos en esta investigación fueron generados gracias al sistema de captura de captura facial. Sistema con el cual también se cuenta en el “PRIS-Lab” y el cual será utilizado en esta tesis, tal como se detalla en el apartado de la metodología. Esta investigación es un buen ejemplo en cómo se pueden emplear estructuras de niveles morfológicos y sintácticos para la descripción o análisis de movimiento humano y su potencial interpretación por parte de sistemas inteligentes. En este caso ellos emplean 10 tipos de movimientos asociados al baseball, entre ellos el de agacharse que es incluido en al menos cuatro contextos oracionales. En otra propuesta, Goutsu, Takano & Nakamura (2018) establecen un modelo donde logran discriminar partes del cuerpo humano ligadas a ciertos tipos de movimientos, para así dar cuenta de clasificaciones específicas y sus tipologías. Por su parte, Gutemberg, Fermüller & Yiannis (2012) proponen un lenguaje visualmotor de actividad humana denominado HAL (Human Activity Language) que a nivel computacional podría permitir el reconocimiento de patrones de un movimiento dado tal como lo hacen las neuronas espejo gracias a la percepción humana y su posterior procesamiento cerebral. Para dar cuenta de dicho lenguaje, acuden al uso de categorías lingüísticas como una aproximación de análisis, ya que consideran que tanto el lenguaje hablado como los movimientos visibles emplean un sustrato cognitivo similar basado en el procesamiento gramatical. 24 Entonces se toman un conjunto de acciones humanas para generar un plan y proceso de control de movimientos para ser transferidos a robots humanoides o sistemas de animación. Los autores hacen hincapié como antecedes también a las representaciones simbólicas empleadas en campos como la danza, la lingüística con estudio de gestos y lenguas de señas, como esfuerzos previos de este campo de trabajo. Como corpus se emplean una cantidad de 90 movimientos, que incluyen globales (de todo el cuerpo) y estructurados (algunas articulaciones específicas). Entre los elementos que se analizan están: partes rígidas, partes que generan el movimiento, es decir, articulaciones y sus rasgos; posición, ángulo, velocidad, trayectoria y aceleración, variables correlacionadas a un tiempo de ejecución, de tal manera el lenguaje cuenta con los siguientes componentes: · La fonología: consiste en un conjunto de secuencias de medidas físicas estáticas de las articulaciones que intervienen en los movimientos; velocidad, aceleración, positiva o negativa. Por ende, la representación fonética sería cómo cambian esas secuencias en el tiempo en las características medibles, y se asigna a cada secuencia un símbolo para poder referenciarlas. Por ejemplo, V se asigna a velocidad 0. En dicho sentido, las reglas fonológicas describen con precisión las combinaciones de movimiento que se esperaría como conformaciones de manera analógica a las “palabras”. ·La morfología: se detalla como los fonemas seleccionados y combinados que se convierten en morfemas en este subsistema de organización del lenguaje. ·El léxico: se orienta a diez acciones locomotoras; sacudida, salto, funcionamiento, desgaste, pise fuerte, fanfarronería, punta de los pies, dedo del pie, tropa y caminar. ·Sintaxis: el nivel de sintaxis descrito en este trabajo encierra concretamente el definir una unidad compleja de movimiento que encierra clases de cadenas de movimientos. En este nivel se explicitan las siguientes consideraciones: 25 a. Palabra: compleja combinación de movimientos, b. Palabra visual-motora: movimiento humano, c. Frases: palabras combinadas; posturas (rasgos de articulaciones) y actividades (periodo de tiempo y movimientos), d. Sintaxis: relación de unión de frases, e. Siguiendo el patrón de orden de lengua SVO: Sujeto sería la parte o articulación del cuerpo, verbo sería el movimiento o cambio de esas partes o articulaciones y el objeto es una parte pasiva. f. Los adverbios son distintos valores que se vinculan al verbo (movimiento), g. Puede haber oraciones paralelas, ya que existen movimientos paralelos, h. La puntuación es relacionada con los movimientos preparatorios como: “stop” En este trabajo llama la atención el uso de ciertas comparaciones de la clasificación del movimiento humano con los niveles y componentes de las lenguas naturales, por ejemplo, los autores expresan: “la postura inicial para una oración HAL (human action language) es análoga a un adjetivo el cual después describe (modifica) las partes activas (sustantivos) en la oración” (Gutemberg et al, 2008, p. 6),es decir, los autores explican que una postura inicial de una cadena de lenguaje de movimiento humano análogamente es como un adjetivo que describe al sustantivo en la oración. En este caso cabe cuestionarse si realmente se deban denominar las características del movimiento con nombres de categorías gramaticales tal como se usan en las lenguas naturales, o si se debiera dar designaciones nuevas y diferenciadas al lenguaje de movimiento humano, en este sentido, desde esta tesis se busca describir primero los movimientos humanos, antes de emplear categorías gramaticales que puedan ser arbitrarias para remitir a las características del movimiento. 26 Para finalizar, cabe destacar que este trabajo es el más cercano a lo que se plantea a desarrollar en la tesis, por lo cual es un referente importante y, por ende, se ahondó en explicarlo. A la vez, valida el que ya ha existido un interés previo por representar las distintas variables del movimiento humano empleando categorizaciones lingüísticas, por lo cual con esta tesis se puede contribuir a comparar si esas categorías han sido empleadas con la certeza y precisión de la disciplina y ampliar los planteamientos hechos hasta el momento. En cuanto a Costa Rica, se encuentra, por un lado, el esfuerzo realizado por Castresana (2017) entorno al uso de sistemas de captura de movimiento, con los cuales se busca crear algoritmos que mejoren la precisión de los datos que se obtienen a través del MoCap. Y, por otro lado, el trabajo de Abarca (2020) sobre serialización de un cuerpo humano tridimensional, donde se genera referenciación sobre mediciones corporales de dos sujetos y los puntos de: cabeza, hombros, codos, manos, rodillas y dedos pulgares de los pies, para los cuales se emplean símbolos y letras. Dichos precedentes resultan de interés porque son una exploración de consideraciones a tomar en el análisis basado en ese tipo de datos, entre ellas: ● Comprender la manera en que el software de MoCap provee los datos. ● Evaluar la posición de una articulación en el espacio, esto como procedimiento para cuantificar y objetivar la ausencia de movilidad de una articulación. ● Evaluar el arco de movimiento de una articulación en cada uno de los tres planos del espacio, esto como procedimiento para cuantificar y objetivar la movilidad de una articulación. ● Considerar en el análisis del movimiento variables como: el tipo de movimiento, ¿en qué dirección se dio? y ¿a qué miembro del cuerpo pertenece? (Castresana, 2017, p.13) 27 Por otra parte, la elección de movimientos debe estar bien demarcada según las partes del cuerpo que se deseen analizar, y estas variables que suelen ser numéricas por los ángulos del cuerpo pueden ser referenciadas con letras u otros símbolos. Estos recursos son empleados en programación, así se ve que los algoritmos “emplean una simbología por la que se puede realizar una comparación cuantitativa de un mismo movimiento, pero realizado por dos personas con diferentes características físicas” (Abarca, 2020, p.89). En resumen, del estado previo se obtienen ciertas conclusiones que se consideran valiosas: a. El lenguaje de señas es un buen modelo de cómo se puede tener detrás de las expresiones concretas de la comunicación motora sistemas complejos de organización. Esto se considera oportuno para aplicarse en la descripción del movimiento humano, dado que también incluye variables abstractas y mecanismos concretos de uso de articuladores corporales. b. Postular un posible lenguaje del movimiento humano no es una tarea ingenua y se nota la complejidad de esta labor en trabajos internacionales dónde se han creado vastas bases de datos de movimientos y ontologías para describir los múltiples sets de datos que pueden desagregarse en cualquier locomotora común. Queda claro que las reglas que pueden postularse para explicar la ocurrencia y restricciones de los movimientos humanos son tan complejas como las reglas de producción de una lengua natural, por ende, la disciplina lingüística puede aportar en vacíos preexistentes. c. Aunque existen algunos esfuerzos internacionales por describir el movimiento humano a través de categorías lingüísticas, sigue existiendo un gran campo de investigación para validar la precisión de esas denominaciones y asociaciones. d. Finalmente, en los esfuerzos nacionales se tienen recomendaciones cercanas de colegas del PRIS-Lab que pueden nutrir acertadamente este trabajo. 28 En cuanto a otras consideraciones, en medio de la emergencia de la inteligencia artificial (AI), resulta relevante la simulación de cómo se podría remitir a la creación de un lenguaje de movimiento facial, apoyándose en nuevas herramientas. Esto remite a los denominados LLMs (Large Language Models) o modelos lingüísticos de gran tamaño, que son modelos estadísticos por los que se asigna una probabilidad a una secuencia de palabras y permiten el manejo de una cantidad amplia de texto en el desarrollo de muchas tareas del procesamiento de lenguaje natural (Carlini, 2021, p. 2), gracias a redes neuronales con arquitecturas de muy grandes de parámetros y datos masivos. Estos modelos surgieron en el 2018 y han permitido entrenar modelos para tareas concretas, por ejemplo, el análisis de sentimientos, crear contenido, escribir código de programación, extracción de documentos, entre otras. En este sentido se ha lanzado al público aplicaciones Bot como ChatGPT presentada al público por OpenAI en el 2022 y Bard presentada por Google en 2023, aún en fase experimental. Al dirigirse a estas aplicaciones se les puede solicitar la creación de un lenguaje de movimiento facial empleando categorías para lo cual se obtiene un proceso metodológico como el que se ve a continuación. En el caso del empleo de Bard, como un ejercicio lúdico, se dicta la orden “pasos para un lenguaje de movimiento facial”, obteniéndose como respuesta una función relacionada con la comunicación y las partes esenciales del rostro: El lenguaje de movimiento facial es un sistema de comunicación no verbal que utiliza los movimientos de la cara para transmitir información. Puede utilizarse para expresar una amplia gama de emociones, desde la felicidad y la tristeza hasta la ira y el miedo, resulta interesante que remite a las expresiones más universales y consideradas desde muchos trabajos de análisis de la expresión facial. (Bard, 2023, s.p) Así mismo, al emplear ChatGPT y dictar la misma orden anterior, se realza el involucramiento de ciertas partes del rostro: 29 • También destaca la relevancia de las partes del rostro con incidencia en la producción de las expresiones; ojos, boca y cejas, también a variables como tiempo y otros aspectos de contexto. “Los ojos: Los ojos son una de las partes más expresivas de la cara. Una mirada directa puede indicar confianza o interés, mientras que una mirada desviada puede indicar timidez o desinterés. • La boca: La boca también se utiliza para expresar una amplia gama de emociones. Una sonrisa puede indicar felicidad, una sonrisa puede indicar tristeza, y una boca fruncida puede indicar enojo. • Las cejas: Las cejas pueden utilizarse para expresar sorpresa, confusión o desconcierto.” (Chat GPT, 2023, s.p) Evidentemente, la relación que está haciendo la aplicación no se está enfocando a la visión de los componentes del movimiento facial humano, desde lo estructural, sino más desde la comunicación o el análisis psicológico de los gestos. Para probar aún más las variables de especificidad de manejo de datos de Bard, se orienta la solicitud a la orden de “crear lenguaje de movimiento facial humano gramática léxico funcional pasos”. Siendo que la tecnología propone los pasos de creación del lenguaje de la siguiente manera: 1. Recolección de datos: El primer paso sería recopilar datos sobre los movimientos faciales humanos. Esto podría hacerse mediante la observación de personas en su vida cotidiana, mediante el uso de cámaras de alta velocidad o mediante el uso de métodos de captura de movimiento. 2 2. Análisis de datos: Los datos recopilados luego se analizarían para identificar patrones y tendencias. Esto podría incluir el estudio de la posición, la duración y la frecuencia de los movimientos faciales, según Duda (2000). 30 3. Creación de un vocabulario: Una vez que se hayan identificado los patrones, se pueden utilizar para crear un vocabulario de movimientos faciales. Este vocabulario podría incluir términos para describir diferentes emociones, como felicidad, tristeza, ira y miedo. 4.Creación de una gramática: Luego, se podría crear una gramática para describir cómo se combinan los movimientos faciales para formar mensajes. Esta gramática podría basarse en el lenguaje natural o podría ser un sistema completamente nuevo. 5.Pruebas: El lenguaje de movimiento facial recién creado luego se probaría para evaluar su eficacia. Esto podría hacerse mediante la observación de personas que utilizan el lenguaje o mediante la realización de estudios experimentales. (Bard, 2023, s.p) Resulta interesante, cómo se propone una metodología que tiene cierta relación con la de esta tesis, no obstante, el paso 2 se realiza mucho pensando en las variables matemáticas y cualitativas, no estructurales en asociación con categorías gramaticales. Y en cuanto al paso 3 resulta que tiene asociación con el paso metodológico de la gramática de este trabajo, el cual consiste en crear un lexicón. Finalmente, para ingresar más a emplear categorías lingüísticas, se realiza un último ejercicio bajo la indicación “programar en Python gramática léxico funcional lenguaje facial”, obteniéndose la siguiente respuesta: “La programación de una gramática léxico funcional para el lenguaje facial humano sería un proyecto complejo, pero también sería un proyecto muy gratificante. El primer paso sería crear un vocabulario de movimientos faciales. Esto podría hacerse mediante la observación de personas en su vida cotidiana, mediante el uso de cámaras de alta velocidad o mediante el uso de métodos de captura de movimiento. Una vez que se haya creado el vocabulario, se podría crear una gramática para describir cómo se combinan los movimientos faciales para formar mensajes. La gramática podría basarse en el lenguaje natural o podría ser un sistema completamente nuevo. 31 La gramática léxico funcional para el lenguaje facial humano podría codificarse en Python utilizando una serie de funciones y clases. Por ejemplo, la siguiente función podría utilizarse para representar un movimiento facial: Al solicitarle detalle de la estructura-c se tendría: (Bard, 2023, s.p.) Cómo se puede ver, Bard reconoce la complejidad de creación de un lenguaje facial humano, no sólo por la planificación que debe tenerse sino por los datos organizados de las variables del movimiento humano, en este caso remitiendo la IA a “nominación” y variables vinculantes a zona del movimiento “posición”, y datos matemáticos como “duración” y “frecuencia”. En el apartado de resultados del trabajo se puede visualizar cómo se elabora desde la LFG en este trabajo, la propuesta de estructura-c y estructura-f, así como la determinación del lexicón específico para el corpus en estudio del PRIS-Lab. 32 Todos los esfuerzos en mención, en este apartado son relevantes pues muestran los acercamientos históricos y de avance de la tecnología hacia desentrañar un trabajo tan arduo como el análisis de los movimientos faciales humanos, teniendo conciencia desde la misma posibilidad tecnológica el soporte de criterio humano de discriminación y orientación de los patrones seleccionados y clasificados para una gramática. 33 Capítulo II: Marco Teórico En este capítulo se presentan los aspectos teóricos que sustentan y contextualizan el tema de investigación de esta tesis. Primero, se abarcan los referentes sobre lingüística computacional, y específicamente la Gramática Léxico-Funcional (LFG) y la teoría de lenguajes controlados. Segundo, se detalla los referentes de ciencias de movimiento humano, enfatizando los aspectos antropométricos del análisis de anatomía y fisiología facial. Por último, los conceptos vinculantes a la tecnología de captura de movimiento humano y generación de bases de datos digitales. Esto debido a que es un trabajo con sustento multidisciplinario. 2.1. Referentes lingüísticos La lengua ha sido estudiada desde distintas disciplinas tales como: filosofía, antropología y por supuesto la lingüística, dado el atractivo que encierra comprender el funcionamiento del lenguaje como un sistema con componentes abstractos y expresiones concretas que permiten no sólo funciones sociales y de comunicación, sino una vinculación con las tecnologías emergentes, es así, como la relación entre la lengua y los ordenadores resultó innegable, al querer replicar cierta parte de esta inteligencia humana en los procesadores de los computadores. Tal como expresa Villayandre (2010) citando a Moreno et al. (1998) “la lengua no solo ha sido objeto de interés para los lingüistas, junto a ellos están los filósofos, psicolingüistas e ingenieros” refiriéndose a (Villayandre, 2010, p.1), es desde esa última concepción de profesionales donde se estrecha la informática con la lingüística, y viceversa. La exposición se ha organizado en cuatro partes principales: 1) Introducción general a lingüística computacional 2) lenguajes formales y sus postulados 3) Gramática Léxico- Funcional y sus postulados 4) lenguajes controlados o construidos. 34 2.1.1. Lingüística computacional (LC) Los orígenes de la lingüística computacional se remontan a los años 50 en Estados Unidos, como parte de los esfuerzos por generar traducciones automáticas desde otros idiomas al inglés, así como por el trabajo en elaboración de índices y concordancias. Al abordar el lenguaje a través de ordenadores, se requiere un sistema de formalización que permita acercarse a replicar el funcionamiento de la mente humana, siguiendo a Guinovart (1998): …desde el punto de vista de su vinculación a la lingüística, la lingüística computacional puede ser considerada una subdisciplina de la lingüística teórica, en tanto que uno de sus objetivos es la elaboración de modelos formales (e implementables informáticamente) del lenguaje humano (p. 135). Hay un aspecto esencial de distinguir en cuanto a lo que se podría considerar que es LC y lo que no, el trabajo general lingüístico podría apoyarse en el uso de herramientas tecnológicas, en el caso de la LC no basta con que haya estas herramientas, sino se fundamentan en la abstracción del conocimiento lingüístico para emular la competencia de los hablantes nativos, y ser reproducida en ordenadores de manera multipropósito. Lo que se mencionó puede ejemplificase así, actualmente existen muchos chatbots como parte de los servicios de las empresas, estos pueden tener preestablecidas respuestas a preguntas frecuentes, o tan sólo recibir inputs simples tipo “si desea continuar dé click”, esto no sería una abstracción de conocimiento lingüístico. Por el contrario, sí sería abstracción de conocimiento lingüístico que el usuario escribiera una interrogante abierta al chatbot y este tuviera que ejecutar pasos como: el análisis de contenido, interpretación de la intención, para posteriormente generar inferencias y brindar una respuesta. Otro ejemplo de lingüística computacional sería el análisis de sentimientos, por citar un caso, un analizador de las calificaciones dadas a un producto por parte de un cliente y que el ordenador intente discriminar cuál es la intencionalidad expresada según el tipo de adjetivo, dentro de una 35 escala de valoración positiva o negativa, es decir, aquí sí se estaría recurriendo a comprender recursos sintácticos y semánticos. Para propósitos de esta investigación, se parte de la noción de lingüística computacional (LC), siguiendo a Domínguez (2002, p. 1), entendida como una ciencia interdisciplinaria que se ubica entre la lingüística y la informática, con énfasis en la lingüística. Y considerando como uno de los objetivos de la LC la elaboración de modelos computacionales que reproduzcan uno o más aspectos del lenguaje humano, por ejemplo, para la creación de sistemas expertos que respalden la labor de especialistas en un área dada. La información que se analiza desde la LC puede darse en distintos tipos de datos digitales. En este sentido según Vide (1994), remitiendo al trabajo de Atkins y Bernard Quémada, para recapitular los tipos de textos con que se cuenta en la lingüística computacional: ● Archivo digital: un repositorio de textos electrónicos sin relación entre sí. ● Biblioteca de textos electrónicos: colección de textos con formato estandarizado con ciertas convenciones referidas, pero sin rigurosos criterios de selección. ● Corpus: un subgrupo dentro de una Biblioteca Electrónica de Textos creado según criterios de diseño explícitos para un fin específico. ● Subcorpus: un subgrupo dentro del corpus que funciona como un componente estático dentro de un corpus complejo o como una selección dinámica durante determinado análisis. En este trabajo se visualiza apoyarse en el componente de lenguajes naturales y lenguajes controlados desarrollado dentro de la teoría de la lingüística computacional y el estudio de un “subcorpus” de movimientos faciales, de manera que se pueda visualizar si la información provista en las bases del PRIS-Lab cuentan con la robustez para poder eliminarse 36 ambigüedades en la interpretación posterior de los usuarios de la información de manera que se pueda plantear un lenguaje controlado. 2.1.2. Gramática Léxico-Funcional o GLF (Lexical functional grammar o LFG) La Gramática Léxico-Funcional o GLF, LFG por sus siglas en inglés, es un formalismo de unificación desarrollado por Bresnan y R. Kaplan (1982), como respuesta a la gramática generativa transformacional de Chomsky de los años 70 y 80, que consideraba que toda construcción lingüística era resultado de un componente transformacional sobre un elemento base, es decir una estructura profunda (que contiene el significado) y una estructura superficial (forma en que se presenta la oración), la GLF es más bien monoestratal. Las gramáticas transformacionales dan prioridad al componente sintáctico sobre la estructuración de la expresión, que condiciona las reglas para la aparición o desplazamiento de constituyentes de una frase, teniéndose ciertas estructuras definidas como: sintagmas nominales o nominal phrase (NP) y sintagmas verbales o verbal phrase (VP) con sus argumentos, el rol del verbo (V), Predicado (Pred), nombres (N), preposición (P), entre otros. Estos sintagmas se pueden dar con una variación en su orden de aparición, pero siempre conformado bajo un mismo sintagma donde se tiene un núcleo; en una frase verbal sería el verbo y en una nominal el sustantivo, por ejemplo, una consideración sería que ese núcleo que los determina puede aparecer al inicio de la frase como en (1) y (3) o al final como en (2 y (4)): (1) Lloré amargamente: sintagma verbal (2) Lentamente lloré: sintagma verbal (3) Estadio majestuoso: sintagma nominal (4) Construcción del estadio: sintagma nominal 37 La propuesta de la GLF es dar relevancia al léxico y no al componente transformacional, ya que se afirma que la estructura aparece de tal manera debido al rol de la configuración del léxico y no a la predeterminación sintáctica, por ejemplo, ya que no todas las lenguas se presentan configuracionales, por ejemplo, no siempre el objeto directo se encuentra anexo al verbo. Es decir, los cambios de organización estructurales no ocasionan agramaticalidad. Esta gramática es considerada funcional en dos sentidos: en primer lugar, al igual que la Gramática Relacional, es funcional en tanto que no considera las funciones gramaticales como conceptos lingüísticos que se deriven de la configuración sintagmática. Y, en segundo lugar, esta gramática es funcional en sentido matemático” (Tordera, 2003, p. 23) Según Colado (2014) dicha gramática plantea los siguientes aspectos: • Parte de una gramática universal, es decir, existe una facilidad innata para aprender lenguas. Esto en relación con su base generativista. • La estructura mental es responsable de la gramática, pero no de su manifestación lingüística. Existe una gran variabilidad en modos de expresión. • No contempla la existencia de un componente transformacional, una misma idea puede expresarse de maneras distintas. • Permite generar un modelo matemático, formalizado, flexible, simple y bien definido. • Se propone una representación más abstracta de las funciones de sujeto y objeto que no se vea comprometida por medio de una expresión, o sea las funciones gramaticales no pueden reducirse a una estructura sintagmática. Sino que son clases de expresión formal que se incorporan a la estructura argumental y aparecen representadas de maneras diversas. Dicho autor presenta un ejemplo citando a Bresnan (2001) comparando el inglés y walpiri, lengua aborigen australiana, en cuanto a una gramática universal: 38 Ilustración 1. Ejemplo de ordenación sintáctica del inglés Ilustración 2. Representación de oración en warlpiri AI En las ilustraciones número 1 y 2 se deja ver que, en el caso del inglés no se puede separar “dog” del determinante “that”, y se tiene una jerarquía en los sintagmas-núcleos. En el caso del walpiri no se da una jerarquía y la organización de constituyentes varía, ya que 39 existe un complejo sistema de marcas de caso y concordancia entre elementos dando un orden sintáctico más libre. En cuanto al hecho de que no existe una jerarquía de constituyentes para representar la estructura de las lenguas, se da hincapié al componente léxico, dando a las palabras un rol sintáctico y funcional. Este es el corazón ya que se rige por el principio de integridad léxica, donde cada palabra funciona como un átomo en la creación de estructuras superiores y se sitúan en la posición de núcleo. En el siguiente apartado se explican los principios de la GLF, así como su estructura categorial. 2.1.2.1 Arquitectura de la LFG La Gramática Léxico-Funcional plantea un modelo conformado por tres niveles de representación, la estructura c-, la estructura-f y la estructura-a. A continuación, se explican las tres estructuras. Estructura-c(onstituyentes) La estructura-c da cuenta de las categorías gramaticales de que consta una oración y el modo en que se combinan, siendo este un nivel sintáctico que se denomina estructura- c(onstituyentes). (Tordera, 2003, p. 50) Así mismo, se nutre de dos acciones: el tagging, que es asignar una categoría gramatical a cada elemento y el parsing, que es un analizador sintáctico que determina el modo en el que se combinan estos elementos. Y desde el área de producción, se puede tener un lexicón donde queden listados los elementos léxicos adscritos a una categoría gramatical y unas reglas sintagmáticas que expliciten las relaciones de contigüidad y jerarquía entre los elementos. 40 La definición de una estructura-c se podría dar con determinar por ejemplo, que dentro de un SV se tiene un V, y asociando que un ejemplo de V es “cogiendo”. Es decir, se tendría un sintagma verbal conformado por un verbo, es decir bajo la representación de la siguiente regla: SV → V’ V → cogiendo Tordera (2003) aporta el ejemplo del castellano (parcialmente configuracional) de cómo se pueden definir reglas sintagmáticas y lexicón asociado: Ilustración 3. Ejemplo de reglas sintagmáticas en la oración "Los niños pequeños están cogiendo aquel perro" Como se puede desprender del ejemplo anterior, se registraría dentro del lexicón como Det → los, aquel y como Adj → pequeños. En el caso de una lengua no configuracional, se tendría un lexicón, pero no habría una relación jerárquica entre los elementos de la oración, 41 sino que sería una cadena de n elementos, es decir O → C*..., tal como aporta Tordera (2003) en la siguiente ejemplificación mostrada en la ilustración número 4: Ilustración 4. Ejemplo de oración como cadena n de elementos De tal manera que en una comparación entre ambas lenguas más allá de la configuración sintagmática se puede visualizar funcionalmente que existen determinantes y un adjetivo que modifica al sustantivo. Y en cuanto al predicado que se tiene verbo y objeto directo. Estructura-f(uncional) Según Loáciga (2012) una estructura-f es una matriz de rasgos, pares de atributos- valor que recogen la información léxica de la frase, al ser una estructura de rasgos, el orden de los elementos no es importante. Entonces se tendría una estructura como se muestra en el diagrama número 1. 42 Diagrama 1. Ejemplo de estructura-f como matriz de rasgos Fuente: Loáciga (2012) Es decir, partiendo del ejemplo un par de atributo-valor sería un rasgo. Y una estructura f compuesta de pares de atributo-valor se llamaría función. Un ejemplo claro es en la fonología, un fonema +sonoro, sordo. Según Bresnan (2001) la estructura-f contiene cinco atributos: • Subject • Tense: el tiempo encierra a persona, número, género y caso. • NEG: la negación ligada por ejemplo al tiempo y verbo • PRED: que cuenta con atributos léxicos o el contenido de los argumentos como el complemento directo e indirecto (caso oblicuo), introducidos por preposiciones. • COMP: complement o complementos, es la función gramatical de los complementos de la cláusula. Según Tordera (2003) citando a Moreno Sandoval (2001), la estructura-f como matriz de rasgos recoge información de funciones gramaticales, funciones discursivas (TÓPICO, FOCO) Y categorías funcionales (DEFINITUD, GÉNERO, TIEMPO, MODO), existiendo para cada atributo, un único valor. 43 De tal manera, el autor aporta como ejemplo de una estructura-f la oración «Los niños pequeños están cogiendo aquel perro»: Ilustración 5. Ejemplo de estuctura-f En resumen, la estructura-f permite explicitar fenómenos universales del lenguaje. Un aspecto relevante que comenta el autor es que no debe haber analogía entre estructura-c con estructura superficial ni estructura-f con estructura profunda de la Gramática Generativa Transformacional, ya que en la LFF coexisten ambos niveles más ninguno precede al otro. 44 Estructura-a Es un nivel propiamente sintáctico, desde el que se regula la proyección de los argumentos a la estructura-f (Bresnan, 2001: 302-307) De tal manera se tiene como estructura-a al predicador y sus roles argumentales según la prominencia así se tienen como roles, por ejemplo, el verbo golpear condiciona tener un agente y un paciente, el disfrutar a un experimentador y un tema. De tal manera sí se generar un orden de roles por jerarquía temática, tal como expresa Bresnan (2001: 307): Como convención el rol más prominente de un predicador se designa con el símbolo “ ˆ”. Y están relacionadas con las funciones según el siguiente cuadro: Tipos de funciones [– r] no se restringen a un único papel semántico [+ r] se les asigna un papel temático concreto [– o] no transitivos SUJ OBL [+ o] exigidas por predicadores transitivos OBJ OBJ Configuración de la gramática De tal manera, Tordera (2003) citando a Sells (1989) y Moreno (2001) explica que la configuración gramatical en la GLF se reflejaría bajo el esquema mostrado en el diagrama 2: 45 Diagrama 2. Configuración de la GLF según sus estructuras Fuente: Tordera (2003) En síntesis, el lexicón recogería todas esas flexiones ocurridas antes de intervenir en la sintaxis, es decir la estructura-c, la estructura-f no intervienen el proceso morfológico. Luego, se da cuenta en la estructura-c sobre los elementos léxicos acorde con reglas categoriales y en la estructura-f su dimensión sintáctica con respecto a la estructura-c. 2.1.2.2 Principios de la GLF Según Colado (2014) los tres principios de la GLF son variabilidad, universalidad y monotonicidad. La variabilidad se refiere a que existe una gran variación en el componente externo- expresivo de las lenguas. Así se nutre la representación de la estructura categorial o de constituyentes como estructura-c, en la que se representan las relaciones entre las palabras y su estructura. 46 Dentro de dicha noción se recurre a árboles similares a los generativistas con reglas de constituyentes, de tal manera se tiene por ejemplo: S→ NP VP NP→ Det N VP→ V NP NP Un ejemplo del inglés sería según el autor el que se representa en la ilustración número 5: Ilustración 6. Representación C-estructura La universalidad está relacionada con que hay un componente interno en las lenguas que es universal, para ello se emplea formalmente la estructura funcional que contiene las funciones gramaticales de: sujeto y objeto, fundamentadas en la relación predicado- argumento. Estas funciones ya que se asocian a los participantes centrales de una eventualidad expresada por el verbo. 47 Pero según el tipo de lengua al que se asocie el rol del SUJ ocupa un papel diferente, por ejemplo, en las nominativo-acusativas es más prominente, en las ergativas quien haya sido más afectado por la eventualidad y en las activas es el controlador de la eventualidad. La monotonicidad es la relación entre la variabilidad y la universalidad, ya que no necesariamente existiría una relación entre la estructura argumental con la estructura expresiva, sino que se estaría ante una contradicción. Entre las estructuras categoriales que se tiene en la GLF están las categorías léxicas como sustantivo (N), verbo (V), adjetivo (A) y adverbio (Adv). Por otro lado, se concibe la denominada Part para referirse a partículas preposicionales. Y las categorías funcionales en las que se tiene: el sintagma tiempo (Inflectional Phrase, IP) que alberga tiempo verbal y concordancia sujeto-verbo y el sintagma complementante (Complementizer Phrase, CP), vinculado a la información de morfología verbal. Se puede ver esta estructura en la ilustración número 6, dada por Colado (2014). Ilustración 7. Estructura de sintagma tiempo y sintagma complementante 48 Entre las estructuras funcionales, se tiene por un lado las funciones gramaticales de sujeto y objeto, pero también el uso de funciones matemáticas que permitan expresar relaciones semánticas, léxicas y sintácticas que tienen lugar en los modos de expresión. Estos entendidos como una serie de pares similares a las empleadas en computación o lógica. Según Colado (2014) citando a Bresnan y Kaplan (1995), se dan cuatro tipos de valores, explicados a través del ejemplo del diagrama número 3: Diagrama 3. Ejemplo de estructura funcional de una oración en inglés Tal como se puede ver en el ejemplo anterior, cada elemento cuenta con un valor– único, esto gracias a subíndices alfanuméricos, por ejemplo, si David apareciera como sujeto 49 u objeto tendrían un valor de asignación diferenciado; Davidi, Davidj. Otro ejemplo sería para el sintagma tiempo el atributo “Tense” y sus valores PRES, PAST. En resumen, se busca una formalización que sea sencilla y directa. De tal manera, se podría definir la estructura funcional como función matemática; Colado (2014) señala para el ejemplo en mención: 𝑓𝑎 = 𝑣 > (𝑓 𝑇𝐸𝑁𝑆𝐸) = 𝑃𝐴𝑆𝑇 De tal manera la función sería una relación (R) entre dos conjuntos: conjunto A que es el conjunto de partida o de argumentos (denominado dominio) y conjunto B que es el conjunto de llegada o de valores (denominado rango, contradominio…). Donde se establecen como reglas: a. cada miembro del dominio se le asigna uno y solo un miembro del rango y b. que el dominio de R es igual a A, tal como se muestra en la figura 8 de Tordera (2003). Figura 8: Ejemplo 1 de función de conjunto R. Colado (2014) Figura 9: Ejemplo 2 de función de conjunto R. Colado (2014) 50 Como se puede ver en la figura 9, a cada miembro del conjunto A se le ha asignado un miembro del conjunto B, y solamente un miembro, es decir, cada atributo tiene un único valor cumpliendo con la condición de Unicidad. Un ejemplo de estructura-f como una ecuación funcional más compleja sería el ilustrado por Tordera (2003): En el predicado anterior como se puede ver para “aprobar” se asumiría tener un Sujeto que es quien aprueba “el estudiante” y un Objeto que es lo que se aprueba “examen”. Como resumen en la funciones se tendría un inventario de funciones principales: SUJ(eto), OBJ(eto), quienes son los participantes centrales de la eventualidad señalada por el verbo. Y como inventario general: COMPL, ADJUNTO, TÓPICO, OBLSUJ, OBJ, OBJ y FOCO 51 Por ende, la visualización de este tipo de atributos con sus respectivos valores en un lenguaje para movimiento humano resulta muy interesante de aplicar. Considerando la flexibilidad dada por la GLF y su funcionalidad para describir distintos tipos de lenguas. 2.1.3. Lenguaje natural versus lenguaje controlado El lenguaje natural es la manera en que se comunica un grupo de seres humanos entre sí, como resultado de un proceso de evolución y del cambio lingüístico derivado de multifactores; intra y extralingüísticos tales como: los procesos sociológicos, políticos y otros de la misma evolución de las sociedades. La evolución es referente al contenido y apropiación de la información de los hablantes gracias a la capacidad mental de almacenar información y emplearla en contextos discriminados según la intencionalidad comunicativa tales como los casos de polisemia. En oposición a un lenguaje natural, se generan los lenguajes controlados, el cual no emerge naturalmente o como una comunicación espontánea de los seres humanos, sino que es diseñado para un contexto dado y con un alcance más limitado. Para ilustrar, “un ejemplo de estos lenguajes resultó ser el inglés técnico CFE implementado por la empresa Caterpillar, que como fabricante de vehículos planteaba que sus operarios conocieran diez reglas y ochocientas palabras para aprender a manejar las máquinas construidas” (Seoane, 2015, p. 19). Partiendo de lo anterior, se tiene que un lenguaje controlado posee un fin concreto y preconcebido, en el caso de la empresa citada era ahorrarse recursos en la traducción de la gran cantidad de documentos generados. 52 Por su parte Kuhn (2013) define que los lenguajes construidos encierran las siguientes propiedades: 1. Se basa exactamente en un lenguaje natural (su "lenguaje base"). 2. La diferencia más importante entre este y su lenguaje base (pero no necesariamente el único) es que es más restrictivo en cuanto a léxico, sintaxis y/o semántica. 3. Conserva la mayoría de las propiedades naturales de su lengua base, de modo que