An Introduction to Symbolic data Analysis and its Application to the Sodas Project

 The data descriptions of the units are called "symbolic" when they are more complex than the standard ones due to the fact that they contain internal variation and are structured. Symbolic data happen from many sources, for instance in order to summarise huge Relational Data Bases by their underlying concepts. "Extracting knowledge" means getting explanatory results, that why, "symbolic objects" are introduced and studied in this paper. They model concepts and constitute an explanatory output for data analysis. Moreover they can be used in order to define queries of a Relational Data Base and propagate concepts between Data Bases. We define "Symbolic Data Analysis" (SDA) as the extension of standard Data Analysis to symbolic data tables as input in order to find symbolic objects as output. In this paper we give an overview on recent development on SDA. We present some tools and methods of SDA and introduce the SODAS software prototype (issued from the work of 17 teams of nine countries involved in an European project of EUROSTAT). dc.description.abstract Las descripciones de los datos de las unidades se llaman "simbólicas" cuando son más complejas que las estándar debido al hecho que contienen variación interna y están estructuradas. Los datos simbólicos aparecen a través de diversas fuentes, por ejemplo para resummir grandes Bases de Datos Relacionales por sus conceptos fundamentales."Extracción del conocimiento" significa la obtención de resultados explicativos, por lo que se introducen los "objetos simbólicos" y se estudian en este artículo. Ellos modelan conceptos y constituyen una salida explicativa para el análisis de datos. Es más, pueden ser usados para definir consultas a una Base de Datos Relacional y propagar conceptos entre Bases de Datos. Definimos el "Análisis de Datos Simbólico" (SDA) como una extensión del Análisis de Datos estándar a tablas de datos simbólicos como entrada, con el fin de encontrar objetos simbólicos como salida. En este artículo damos un panorama de desarrollos recientes en SDA. Presentamos herramientas y métodos de SDA, e introducimos el prototipo de software SODAS (resultado del trabajo conjunto de 17 equipos de nueve países que participan en un proyecto europeo de EUROSTAT).
