La Sobreparametrización en el ARIMA: una aplicación a datos costarricenses

Fecha

2023-01-09

Tipo

tesis de maestría

Autores

Gamboa Sanabria, César Andrés

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

Estimar modelos de series cronológicas es una labor ampliamente extendida en múltiples campos de la investigación y uno de los objetivos es generar pronósticos de la forma más precisa posible dentro de un horizonte determinado. Existe una amplia gama de modelos que puede utilizarse con este fin, entre ellos están los modelos Autorregresivos Integrados de Medias Móviles ($ARIMA$), e incluso existen diversos métodos de estimación automática o semi-automática para esta rama de la Estadística. A pesar de esto, encontrar un modelo que posea un buen ajuste a los datos no es fácil, pues se deben considerar tanto aspectos teóricos como prácticos, y de la temática de estudio para así obtener un modelo adecuado que genere pronósticos realistas y pertinentes para la toma de decisiones dentro de lo posible. Esta investigación propone hacer uso del método denominado sobreparametrización en conjunto con el método de permutaciones del análisis combinatorio para someter a prueba un espectro más amplio de posibles modelos ARIMA. En la selección de modelos ARIMA, los métodos más tradicionales como los correlogramas u otros, no suelen cubrir muchas alternativas para definir la cantidad de coeficientes a estimar en el modelo, lo cual representa un método de estimación que no es óptimo. Por lo tanto, la presente tesis propone una metodología para obtener pronósticos más precisos en comparación a los métodos tradicionales. Los resultados encontrados se contrastan con datos simulados de series cronológicas y cuatro series reales para ajustar modelos ARIMA con la función auto.arima(), la sobreparametrización y un modelo ARIMA de orden bajo. Para cada una de estas series se realiza una partición del 80% para entrenar los modelos y el restante 20% para validación de los pronósticos. En cada una de estas series se realizó un análisis visual del comportamiento de los errores y posteriormente se evalúa la calidad de los resultados de cada modelo obtenido con las tres técnicas descritas mediante medidas de bondad de ajuste (AIC, AICc y BIC) y de precisión (RMSE, MAE y MAPE). Al tener datos que vienen de un proceso con bajo número de parámetros, la sobreparametrización logra captar de buena manera el comportamiento de la serie en comparación a las otras alternativas, y cuando el proceso que gobierna la serie es de un mayor grado. La metodología propuesta es capaz de capturar de mejor forma el comportamiento de la serie y conseguir pronósticos con una precisión mayor a los de los métodos tradicionales, ya que en los resultados de entrenamiento, la sobreparametrización obtuvo el mejor ajuste un 58,33% de las veces y la mejor precisión el 45,45% de las veces, mientras que al evaluar los resultados sobre los conjuntos de datos de validación, la sobreparametrización obtuvo el mejor ajuste el 50% de las veces, mientras que las mejores medidas de precisión se alcanzaron un 67% del tiempo.

Descripción

Palabras clave

ARIMA, ESTADÍSTICA, MODELO MATEMÁTICO

Enlaces Externos

Colecciones