© 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 331 Comisión: Lingüística Computacional © 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 332 © 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 333 JULIÁN ASTORGA CAMPOS SERGIO CORDERO MONGE JORGE ANTONIO LEONI DE LEÓN Universidad de Costa Rica San José, Costa Rica antonio.leoni@ucr.ac.cr INLEXPO: Una herramienta de gestión lexicográfica 1 1. Introducción La metodología lexicográfica contemporánea exige una legitimación empírica de la información contenida en las entradas de un diccionario, a través de su vinculación con los datos de uno o varios corpus, una articulación transparente y coordinada del trabajo en equipo y un esquema de distribución de responsabilidades bien definido. Además, la rapidez de acceso a las informaciones de los corpus, la elaboración de versiones intermedias y finales de la(s) obra(s) lexicográfica(s) y el acto rutinario de redacción de artículos son fundamentales en una disciplina cuyos resultados deben representar lo mejor posible el estado actual del que quizás sea el nivel lingüístico más cambiante: el léxico. Por estas razones, es necesario contar con herramientas que permitan administrar todas las etapas y variables de la labor lexicográfica. Estas consideraciones, fruto de nuestra experiencia en la elaboración de diccionarios en el marco del Programa Estudios de Lexicografía Hispánico-Costarricense2 de la Universidad de Costa Rica, nos condujeron a diseñar y crear una herramienta computacional de gestión lexicográfica, multifuncional, que llamamos INLEXPO por interfaz lexicográfica polivalente, que discutimos brevemente en esta presentación. INLEXPO es una aplicación web creada con el objetivo de contar con una herramienta que permita redactar, administrar, modificar, actualizar y publicar diccionarios, además de facilitar la organización del trabajo de un equipo de lexicógrafos. La prioridad de esta herramienta es su aplicación al proceso de redacción del Nuevo Diccionario del Español de Costa Rica (NDECR) a cargo del equipo del ELEXHICÓS bajo la dirección del Dr. Víctor Ml. Sánchez Corrales, cuya planta, mejorada en el marco de nuestro proyecto, sirve de base para la estructura del artículo lexicográfico tal y como se presenta en nuestra aplicación. Los programas especializados en la elaboración de diccionarios no faltan. Así, por ejemplo, Kirrkir3 explora las posibilidades para transformar bases de datos léxicas a fin de proveer una innovativa visualización de la información, muy particularmente de las lenguas indígenas. Este sistema no calza en esta etapa de nuestro proyecto, puesto que buscamos una manera de establecer una cadena de producción de diccionarios, la visualización de la información, en nuestro caso, se focaliza en el aspecto de la versión final. Lexique Pro4 es un popular editor de diccionarios, que posee buscador inverso, hipervínculos entre entradas, visualización por categorías y posibilidades de exportación de léxicos, entre otras opciones, sin embargo, está más orientado a la compilación de glosarios que a la publicación y la producción en equipo. ToolBox5 es una aplicación pensada para satisfacer las necesidades del lingüista en el terreno, de manera que está especializado en gestión de datos, análisis e interlinearización de texto; puede ser usado también para otros fines como una herramienta genérica para datos. Wolf6 es un programa que busca facilitar la labor de campo en la recolección de datos léxicos e, igual que lo hemos dicho para los otros programas, no satisface a cabalidad nuestras necesidades en todo el proceso de creación de obras lexicográficas finales. Otros proyectos, más cercanos al nuestro, han visto la luz, como el electronic Dictionary of Bahamian English7 (eDBE), el cual está orientado a la difusión en línea de un único diccionario, en este caso el Dictionary of Bahamian English, de manera que es un programa a la medida, que sólo busca la transcripción, por diversos métodos, de una obra ya existente, y que, por consiguiente, tampoco se adapta a nuestras necesidades que se basan en la redacción de obras totalmente nuevas. De esta forma, se hizo evidente que el trabajo en el ELEXHICÓS exigía el desarrollo de una nueva aplicación, hecha a la medida, que presentamos en esta ocasión. A continuación especificamos los requerimientos de la aplicación web en la sección 2; luego, en la sección 3 ilustramos el funcionamiento de INLEXPO. Por último, en la sección 4 presentamos algunas conclusiones y perspectivas de desarrollo. 2. Requerimientos Podemos clasificar las necesidades del ELEXHICÓS en cuatro grandes áreas: Interfaz de redacción, distribución de trabajo, acceso y administración de corpus y publicación de versiones finales. La compilación, acceso y 1 Queremos agradecer a la Vicerrectoría de Investigación de la Universidad de Costa Rica y a su programa ProInnova de la Universidad de Costa Rica por su apoyo a este proyecto, Interfaz Lexicográfica Polivalente (INLEXPO)”, el cual se encuentra inscrito en el Instituto de Investigaciones Lingüísticas con la secuencia No 745-B1-001. 2 Por sus siglas, ELEXHICÓS (http://www.lexicografia.ucr.ac.cr). 3 http://www-nlp.stanford.edu/kirrkirr/ 4 http://www.sil.org/computing/catalog/show_software.asp?id=92 5 http://www.sil.org/computing/catalog/show_software.asp?id=79 6 Por [W]ord [O]riented [L]inguistic [F]ramework (http://cs.sou.edu/~harveyd/wolf/index.php). 7 Presentado en la 19a Conferencia de la Sociedad Lingüística del Caribe por Raymond Oenbring del College of the Bahamas (http://www.cobses.info/EDBEWW/), Nassau, Bahamas, agosto de 2012. © 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 334 gestión de corpus necesita una dedicación particular, por lo que fue decidido que INLEXPO no contendría tal sistema, sino que quedaría abierta la posibilidad de acceder a ellos.8 La interfaz de redacción fue definida siguiendo dos principios: Todo diccionario creado en INLEXPO tiene un administrador que decide el formato de las entradas (a partir de una planta de diccionario), distribuye las responsabilidades a través de un sistema de permisos y autoriza las nuevas entradas que son sugeridas por los lexicógrafos; luego, los lexicógrafos tienen ante sí la posibilidad de definir descriptores para una entrada particular, a través de menúes de selección única o múltiple, según el caso, pero bajo ninguna circunstancia pueden cambiar el aspecto de la versión del artículo, el cual, en cambio, sí pueden ver en tiempo real. Un lexicógrafo puede sugerir entradas, rápidamente definidas, que le llegan al administrador por correo electrónico o a través de un foro; si hay suficientes razones metodológicas para incluirla, el administrador da el visto bueno y asigna el término a alguien del equipo.9 En lo que respecta a la programación, rápidamente, nos decantamos por el lenguaje PHP con acceso a una base de datos MySQL, en vez de crear una aplicación que sería instalada individualmente en cada computadora; esto por cuanto nos resulta más práctico tener un servidor, respaldado, que al que los redactores acceden a través de una red interna de la red. La ventaja es que sólo se necesita un navegador web y cualquier cambio que hagamos en la interfaz es inmediatamente visible en todas las computadoras, sin necesidad de establecer cronogramas de actualizaciones de software. Además, el trabajo es inmediatamente guardado en la base de datos del servidor y el administrador puede decidir si lo publica y bajo qué formato. Así, la distribución del trabajo queda definida desde un menú de configuración, en el que también es posible fijar los parámetros de las marcas diastráticas y diafásicas y el aspecto final de los artículos lexicográficos. En la última versión de INLEXPO, antes de su liberación, será posible definir la lengua de la interfaz, de manera que nuestra aplicación no se limite al mundo hispánico. La intención principal es disminuir los errores por manipulaciones inadecuadas de los archivos que conforman las versiones intermedias de un diccionario. Debido a que el ELEXHICÓS trabaja en la elaboración de varios diccionarios, decidimos que INLEXPO pudiera contener varios diccionarios. De esta manera, al inicio de una sesión, un usuario puede decidir si crea un nuevo diccionario o si actualiza alguno ya existente en el que deba trabajar. Incluso, en caso de que haya diccionarios publicados en línea desde INLEXPO, los lectores pueden consultar uno o varios. De aquí que hablemos de una interfaz léxica polivalente. La publicación de las versiones finales es responsabilidad del administrador. Una vez que está decidido que todas o algunas de las entradas que constituyen un diccionario están listas para ser publicadas, existe la posibilidad de crear una versión final en formato PDF para imprenta, o bien, también está la opción de publicarlo en HTML para la consulta en línea. No hay posibilidad de publicar un artículo parcialmente, sólo cabe publicarlo entero. 3. Descripción El menú de inicio de INLEXPO está ilustrado en la figura 3.1; como se aprecia ahí, es necesario decidir entre acceder a un diccionario particular, insertar un nuevo artículo, configurar diccionarios (un nuevo diccionario o uno ya existente) o administrar usuarios. La opción Diccionario permite efectuar una búsqueda. Figura 3.1 Menú de inicio 8 En la Universidad de Costa Rica, también se desarrolla, paralelamente, el proyecto Interfaz para el procesamiento de corpus lingüísticos digitales - IPROCOLDI, inscrito en el Instituto de Investigaciones Lingüísticas (INIL), bajo el código 745-B1-244 de la Vicerrectoría de Investigación, a cargo de la Dra. Carla Jara Murillo, como investigadora principal, y del Dr. Jorge Antonio Leoni de León, como investigador asociado. 9 Aunque todavía no ha sido abordado, también cabría la posibilidad de calcular las frecuencias léxicas en un corpus y decidir semiautomáticamente la inserción de un término; queda, eso sí, la revisión de contextos para determinar los matices. © 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 335 Las búsquedas en INLEXPO, son incrementales, es decir, conforme el usuario introduce un término, el sistema le ofrece, en tiempo real, las opciones más cercanas o lo que está tecleando. Como se aprecia en la figura 3.2, también la interfaz le permite al usuario decidir en qué diccionario debe ser efectuada la búsqueda. Tenemos opciones de búsqueda avanzada, aún en desarrollo, que, entre otras posibilidades, permitirán buscar términos introducidos por determinados colaboradores o que cumplen ciertos criterios de forma. Figura 3.2 Búsqueda En todo nuevo artículo se define el lema en su forma canónica (por ejemplo, mucho, -a), algún tipo de información etimológica, morfológica u ortográfica y observaciones que afecten a sus acepciones (figura 3.3); luego, el lema es almacenado, en caso de ser uno completamente nuevo, le llega al administrador quien decide su inserción definitiva. Si en el artículo se hace referencia a un lema ya existente, este se muestra como un hipervínculo a su entrada en el diccionario, lo que permite navegar fácilmente entre artículos vinculados (en la figura 3.2 tenemos un hipervínculo a bocamanga para el sublema cabeza de bocamanga). Figura 3.3 Inserción de un nuevo artículo La interfaz de redacción contiene varias pestañas, las cuales corresponden a los datos del lema, que acabamos de describir, un bloque de acepciones (figura 3.4), donde se introducen las definiciones de las entradas simples © 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 336 (por ejemplo, cabeza), un bloque de sublemas, en el que se insertan los lemas complejos (por ejemplo, cabeza de agua) y un bloque de paremias (como el cliente siempre tiene la razón). Finalmente, la última pestaña corresponde a la vista previa; ahí es posible ver la definición en su forma para la publicación como fue establecido en la configuración. Por ejemplo, la entrada cabeza, se vería tal y como la tenemos en la figura 3.2. Figura 3.4 Bloque de acepciones En el bloque de acepciones (figura 3.4), las marcas diafásicas y diastráticas se presentan en forma de menúes de selección única o múltiple, según sea el caso. Esto es similar para los sublemas en la pestaña siguiente. El área de configuración (figura 3.5), permite establecer los valores de usuario, que no mostramos por razones de espacio, así como las abreviaturas utilizadas y todas las características tipográficas de los diccionarios contenidos en el sistema. Esto se hace por medio de un sistema de pestañas a través de las cuales se puede configurar la marcación, los signos, las tipografías y la delimitación de los lemas, las marcas gramaticales, las referencias y los sinónimos. Figura 3.5 Configuración © 2013 Actualizaciones en Comunicación Social Centro de Lingüística Aplicada, Santiago de Cuba 337 4. Conclusiones INLEXPO es una aplicación web, desarrollada como un programa de código abierto, que permite controlar toda la cadena de producción de varias obras lexicográficas, desde su creación hasta su publicación. INLEXPO es altamente configurable y permite distribuir el trabajo entre un equipo de lexicógrafos recurriendo a un sistema de permisos. Todos los usuarios, ya sean redactores o lectores, pueden acceder a las obras lexicográficas usando navegadores web estándar, debido a que el programa está contenido en un servidor que almacena y distribuye los datos lexicográficos según haya sido definido a partir de las necesidades del proyecto. INLEXPO minimiza el riesgo de errores y mantiene una clara división de responsabilidades. Así, INLEXPO es un programa computacional concebido para ser utilizado en red que conjuga cuatro áreas: Creación o definición de diccionarios, configuración del diccionario, redacción de artículos y publicación de la obra. 5. Bibliografía Águila Escobar, G. (2006). Las nuevas tecnologías al servicio de la lexicografía: los diccionarios electrónicos. Actas del XXXV Simposio Internacional de la Sociedad Española de Lingüística (págs. 1-23). León: Universidad de León, Departamento de Filología Hispánica y Clásica. Atkins, B. T., & Rundell, M. (2008). The Oxford Guide to Practical Lexicography. New York: Oxford University Press. Fontenelle, T. (Ed.). (2009). Practical Lexicography. A Reader. New York: Oxford University Press.