Estadística

URI permanente para esta colección

Examinar

Envíos recientes

Mostrando 1 - 20 de 120
  • Ítem
    Análisis de los factores asociados a la posibilidad de impago por parte de los deudores en materia de pensiones alimentarias
    (2024) León Cerdas, Juan Pablo; Rojas Rojas, Guaner David
    El objetivo de la presente investigación es identificar factores asociados a la posibilidad de impago por parte de los deudores alimentarios, para lo cual se estructura una base de datos de 1000 expedientes activos en fase de ejecución seleccionados aleatoriamente por muestreo sistemático del listado total registrado en el sistema informático denominado Escritorio Virtual, alimentado en el Juzgado de Pensiones Alimentarias del Segundo Circuito Judicial de San José para los años 2019 y 2020. Primeramente, se desarrolla un análisis exploratorio con las variables de interés del estudio denominadas como independientes, llámese: Edad, Estado Civil, Escolaridad, Presencia de discapacidad, Ingresos familiares, Ingreso de la persona demandada, Zona de residencia, Apremio Efectivo, presencia de Medida Alterna, Cantidad de alimentarios, Rebajo automático, Sexo de la persona juzgadora y Trabajan ambos progenitores en relación primeramente con la variable respuesta denominada Buen pagador, así como posteriormente con la que hace referencia al Monto de la pensión alimentaria asignada. El enfoque de análisis se estableció en tres vertientes principales: • Primeramente, en establecer una clasificación de riesgo mediante modelos de aprendizaje supervisado por Árboles de decisión, Bosques Aleatorios y Redes Neuronales de los cuales se escogerá el que mejores resultados registre en cuanto a la predicción de la variable Buen pagador. • Por otro lado, mediante la predicción de montos asignados por pensión alimentaria utilizando distintos escenarios para modelos de aprendizaje supervisado por Regresión lineal múltiple. • Finalmente, determinando perfiles de los obligados alimentarios mediante las técnicas de análisis multivariado por Componentes Principales (ACP) y Conglomerados en dos etapas a modo de validación. Con los resultados de los dos primeros puntos se determinaron las variables consideradas como más significativas en cuanto al aporte de los modelos generados y sus matrices de confusión, para ser utilizadas posteriormente en el análisis definido en el tercer punto. Se logra determinar que, a nivel de modelos de clasificación, Bosques Aleatorios resulta ser el más eficiente alcanzando un nivel de precisión global del 96,67% en cuanto a la clasificación de la variable Buen pagador, mientras que el modelo denominado como simple obtuvo los resultados más bajos en la Raíz del Error Cuadrático Medio (RMSE), el Error Estándar de los Residuos (RSE), y el Error Relativo para la predicción de Montos por pensión alimentaria con la metodología de Regresión lineal múltiple. Finalmente son conformados los perfiles de los deudores alimentarios basados en cinco grupos que fueron los establecidos con el ACP y validados con Análisis de Conglomerados en dos etapas.
  • Ítem
    Desarrollo y validación de una herramienta estadística para la estimación de incertidumbre de medida para inventarios de gases de efecto invernadero utilizando el método de simulación de Monte Carlo
    (2024) Molina Castro, Gabriel Ignacio; Solano Sánchez, Paula
    El presente proyecto busca generar una herramienta estadística validada, que permita estimar la incertidumbre de medida para las emisiones de un inventario de gases de efecto invernadero mediante la propagación de distribuciones de probabilidad aplicando el método de simulación de Monte Carlo. Su justificación se fundamenta en la ausencia de software u hoja de cálculo de libre acceso que permita esta estimación de forma coherente con los requisitos de reporte del PPCN 2.0 y en su necesidad latente por parte las organizaciones que pretenden alcanzar la carbono neutralidad según las políticas ambientales de Costa Rica. Inicialmente, se abordó y generó una propuesta de estimación de incertidumbre para los factores de emisión incluidos en la base de datos oficial del país, mantenida por el IMN. Esta propuesta incluyó a los factores de emisión caracterizados por intervalos de variación asimétricos y otros factores de emisión con ausencia de información sobre su incertidumbre. Dicha propuesta fue publicada internacionalmente en dos artículos científicos y fue adoptada por el IMN en la última publicación de la base de datos. Posteriormente, se pasó a la construcción de la herramienta denominada GEISER, programada en lenguaje R bajo una estructura de aplicación web (librerías shiny). Su interfaz permite al usuario: contar con instrucciones generales de uso, incorporar información de un inventario con hasta cinco emisiones cuantificadas directamente y diez emisiones cuantificadas indirectamente, obtener un resumen de los resultados asociados al inventario (emisión total, su incertidumbre estándar, intervalo de cobertura al 95 % y una gráfica de su distribución) y el detalle de cada emisión y su incertidumbre estándar para identificar posibles oportunidades de mejora. Para lograr la generación de estos resultados, la herramienta usa bases de datos predefinidas y métodos de simulación de Monte Carlo (incluyendo el remuestreo o bootstrapping) para simular poblaciones asociadas a todas las variables de entrada y combinarlas para generar una población simulada de la variable de salida (emisión total del inventario), siguiendo los lineamientos establecidos en guías de estimación de incertidumbre pertinentes (GUM, GUM-S1 y Guía Metodológica del PPCN). Seguidamente, se validó la exactitud de la herramienta (presentando diferencias menores a un 5 % con respecto a resultados de casos de referencia), su robustez (evidenciando cambios reducidos ante la incorporación de hasta un 10 % de valores extremos) y uso por parte de un usuario potencial. Por último, la herramienta fue publicada a través de enlace de descarga de un repositorio web mantenido por el autor y se identificaron las principales limitaciones y recomendaciones de mejora a ser consideradas en una próxima actualización de la herramienta.
  • Ítem
    Implementación del modelo de Rasch para la generación automática de pruebas de aula
    (2023) Masís Soto, Manuel Felipe; Rojas, Guaner
    Este trabajo se circunscribe a temas relacionadas con la automatización de exámenes en el aula, partiendo de la teoría clásica de los tests (TCT), para luego analizar el aporte de la teoría de respuesta al ítem (TRI), específicamente por medio del modelo de Rasch y utilizando como base una herramienta de software denominada “The Examiner”, que permite la creación, calificación y análisis de pruebas de aula. Se aprovecha la información consignada en la base de datos del software para 1428 ítems utilizados en exámenes reales y aplicados en una universidad estatal, con el fin de analizar los indicadores que el software calcula como predichos. Se realiza una comprobación de los cálculos internos del software, para concluir que la información generada es útil para la confección de exámenes. En este sentido y como elementos clave, el software aporta información sobre la media esperada para los exámenes aplicados y sobre el coeficiente de confiabilidad o consistencia esperado mediante el alfa de Cronbach. Los resultados del análisis permiten concluir que los cálculos que genera el software para estos valores predichos se pueden utilizar como información de referencia útil para la confección previa de exámenes a partir de ítems consignados con información histórica. Por otro lado, se utiliza la información de la base de datos para ajustar el modelo de Rasch a las pruebas de aula ejecutadas, así como a pruebas simuladas y se concluye que este modelo genera un buen ajuste a nivel de exámenes, ítems y personas, por lo cual se convierte en una alternativa para incorporarlo como parte de las funcionalidades del software en versiones posteriores y así enriquecer el análisis que brinda el enfoque de la TCT.
  • Ítem
    Evaluación de la probabilidad de perdida esperada de una cartera de crédito de consumo en el mercado financiero hondureño a través de modelos alternativos: Caso de aplicación con puntajes de crédito
    (2023) Cubero Soto, Sergio; Rímola Guevara, Max Alberto
    En un sector financiero global competitivo, las instituciones buscan métodos científicos, como el aprendizaje de máquinas, para identificar clientes solventes y reducir pérdidas crediticias. En Honduras, las entidades financieras se apoyan en burós de crédito y consultorías analíticas para desarrollar herramientas que minimicen la probabilidad de impago, pero no hay un marco de referencia que demuestre mejoras con modelos de aprendizaje de máquinas. Esta investigación busca evaluar la pérdida esperada en una cartera de crédito de consumo en el mercado hondureño hasta diciembre de 2020, al comparar modelos de aprendizaje de máquinas y estadísticos, con el objetivo de determinar si las metodologías alternativas mejoran la estimación de incumplimiento y la pérdida esperada en la cartera de crédito. En este estudio se compararon modelos como regresión logística, bosques aleatorios, XGBoost y redes neuronales a través de métricas de rendimiento y una comparación de negocio con base en la pérdida esperada acumulada. Además, se utilizaron datos de información crediticia desde mayo de 2018 hasta febrero de 2020 proporcionados por un buró de crédito hondureño. Las variables independientes incluyeron información sociodemográfica y comportamiento de pago de créditos mensualmente, mientras que la variable dependiente identificó como malos pagadores a aquellos con morosidad mayor que 60 días en los 12 meses posteriores a la solicitud de crédito. El modelo XGBoost se seleccionó como el mejor entre los modelos de aprendizaje de máquinas, ya que mostró métricas de rendimiento superiores. Asimismo, obtuvo una puntuación de 0.4072 en Kolmogorov Smirnov (KS), por lo que superó en más de 3.75 % a los otros modelos, al igual que en la métrica área bajo la curva ROC (Auroc). Además, presentó mejor capacidad predictiva y de discriminación que la regresión logística, con una mejora del 7.66 % en sensibilidad y 4.41 % en casos predichos correctamente. Este estudio proporciona evidencia para mejorar la gestión del riesgo crediticio en entidades financieras mediante la adopción del modelo XGBoost.
  • Ítem
    Comparación de métodos de evaluación de modelos climáticos globales para América Central
    (2023) Gómez Camacho, Mario Javier; Barboza Chinchilla, Luis Alberto
    El objetivo de este estudio es analizar el comportamiento de seis técnicas utilizadas en la evaluación de la similitud entre dos campos espaciotemporales, especialmente en el ámbito climático, cuatro de ellas aplicadas desde una perspectiva espacial, y las dos restantes desde una perspectiva temporal, basadas en el análisis de datos funcionales, bajo el supuesto de que estos últimos aportarán informaciónn adicional. Para lograrlo, primero se generaron datos sintéticos para visualizar el comportamiento de las técnicas en escenarios controlados, conformados por las combinaciones de diversos valores de correlación lineal entre los campos, razón de sus desviaciones estándar, sesgo y diferencias de forma en sus distribuciones. Posteriormente se realizó una simulación para observar la robustez de cada técnica ante valores faltantes. La Efi ciencia Espacial Wasserstein fue el indicador seleccionado luego de realizar estos diseños, gracias a que este cuanti ca correctamente la similitud y se mantiene estable al lidiar con valores perdidos. Este indicador se utilizó para ordenar 48 modelos climáticos de acuerdo a su capacidad para reproducir el ciclo anual de algunas variables climáticas, considerando el periodo de 1979 a 1999. Se seleccionaron seis modelos gracias a tres métodos de análisis multicriterio: la norma euclídea, TOPSIS y PROMETHEE. Estos muestran rendimientos de cientes en al menos una variable o en algún mes o estación en específico, sin embargo, conocer la superioridad general de estos modelos facilita futuras investigaciones aplicadas.
  • Ítem
    Caracterización de los Usuarios a partir de Escalas de Uso de Internet y Evaluación del Tamaño de Muestra de la Encuesta de Acceso y uso y de los Servicios de Telecomunicaciones en Costa Rica
    (2023-10) Aguilar Aguilar, Vivian; Gómez Meléndez, Agustín
    La apertura del mercado del sector de las telecomunicaciones en el 2008, trajo como consecuencia un aumento en el número de proveedores de estos servicios, lo cual contribuyó con el acceso de más personas a las TIC, es por esto que es indispensable la medición y monitoreo del sector. En el presente estudio se categorizan los diferentes tipos de usuarios de Internet por medio de la creación de escalas de uso utilizando los datos de la “Encuesta de acceso y uso de los servicios de telecomunicaciones en Costa Rica 2017”. En primer lugar, se construyeron parcelas sustentadas con un análisis factorial exploratorio y un análisis de fiabilidad, se procedió con la construcción de un índice, las escalas de uso de Internet y se validó la teoría por medio de un análisis factorial confirmatorio, por último; se realizó un análisis de conglomerados para crear perfiles. Se crean cinco escalas: informativa, interacción social, entretenimiento, productividad, y habilitación ciudadana. Dentro de las escalas se pueden encontrar brechas por zona de residencia, sexo, grupos de edad, nivel educativo y de ingresos. Se determinan dos perfiles de usuarios, los consumidores sociales los cuales son personas que residen fuera de la región Central; una mayor proporción corresponde a mujeres, a personas de más de 45 años, personas con nivel educativo de primaria o menos, así como personas con ingresos inferiores a los 250 mil colones. Los ciudadanos digitales que en su mayoría son de la región Central, mayoritariamente hombres, con edades entre los 18 y 44 años, personas con nivel de instrucción universitaria y con ingresos superiores a los 750 mil colones.
  • Ítem
    La alfabetización y el pensamiento estadístico en la sociedad de la información: una reflexión desde el ejercicio docente
    (2023-01) Ruiz Barrantes, Esteban Alberto; Gallardo Allen, Eugenia
    La presente sistematización tiene como finalidad exponer la experiencia docente utilizando datos reales en la resolución de problemas para desarrollar en el estudiantado habilidades relacionadas con la alfabetización y el pensamiento estadístico. Un aspecto por considerar, para el diseño de la estrategia didáctica, fue el contexto de la pandemia del virus responsable de la COVID, debido al traslado de los cursos a la modalidad 100% virtual. La experiencia didáctica inicia con la aplicación de un cuestionario en línea dirigido al estudiantado de cursos introductorios de Estadística de varias de las carreras de la Universidad de Costa Rica, donde a partir del conjunto de datos recolectados en línea y datos publicados por el Ministerio de Salud relacionados con el virus de la COVID se generaron diversas guías de aprendizaje enfocadas a los conceptos básicos de estadística descriptiva. Entre los principales resultados, se encontró la importancia que tiene la mediación tecnológica para lograr la alfabetización y el pensamiento estadístico enfocándose en aspectos relacionados con la calidad de los datos, su resumen e interpretación. Adicionalmente, el estudiantado logró ir más allá del cálculo estadístico, ya que estableció conclusiones de fondo relacionadas con su disciplina.
  • Ítem
    Análisis de la volatilidad electoral en Costa Rica a través del análisis bayesiano de datos longitudinales
    (2023) Guzmán Castillo, Jesús; Rojas Rojas, Guaner David
    En las elecciones de 2018, el debilitamiento de las identidades partidarias se hizo presente con una gran volatilidad en las preferencias de las personas electoras, influenciada en parte por eventos coyunturales que incidieron en la intención de voto. Un primer evento fue la investigación en torno a los créditos del Banco de Costa Rica a favor del empresario Juan Carlos Bolaños y el posible caso de tráfico de influencias, conoci asociado fue la resolución de la Opinión Consultiva 24 de la Corte Interamericana de Derechos Humanos sobre el reconocimiento de derechos a la población LGTBIQ+. Ambos eventos tuvieron una repercusión en la narrativa de la campaña en dos momentos distintos, caracterizándose por elementos autoritarios y conservadores, que también atizaron el descontento de la ciudadanía con la clase política. Esta narrativa logró empatar con actitudes presentes en las personas, como lo es el descontento y la animadversión con las élites políticas. En términos generales, se puede concluir que anidar a las personas en los distintos meses que duró la campaña electoral resultó adecuada para explicar la influencia de las actitudes conservadoras en los cambios a favor de algún partido político. Se lograron encontrar variables que explicaran el cambio a favor de cada una de las tipologías de partidos propuestas, y que estos cambios estuvieron mediados por los factores contextuales que caracterizaron esa elección.
  • Ítem
    La población de 60 años y más en Costa Rica. Dinámica demográfica y situación actual
    (1996) Barquero Barquero, Jorge Arturo
    El presente documento es un estudio realizado para la Junta de Protección Social de San José, con el propósito de servir de base al Hospital Nacional Geriátrico Dr. Raúl Blanco Cervantes para su evaluación y presentación ante la Comisión Nacional de Hospitales. La investigación se realizó durante el mes de enero de 1995 y contó con la colaboración de la Licda. Elizabeth Solano, en el procesamiento de datos y en el capítulo III de este informe. Los objetivos fundamentales de este trabajo fueron: 1. Dar un panorama general sobre el proceso de Transición Demográfica en Costa Rica y de una de sus principales consecuencias: El Envejecimiento de la Población. 2. Analizar los cambios más recientes en la mortalidad de la población de 60 años y más en Costa Rica. 3. Dar a conocer las principales características socioeconómicas de la población de 60 años y más, según los resultados de la Encuesta de Hogares de Propósitos Múltiples de julio de 1994. La mayor parte de la información que se utilizó en este estudio fue suministrada por la Dirección General de Estadística y Censos y consistió en: tabulaciones especiales de defunciones por causa de muerte para la población de 60 y más, y un archivo especial de la Encuesta de Hogares de Propósitos Múltiples de julio de 1994 y del Módulo para personas de 60 años y más, incluido en dicha Encuesta. Dejamos constancia del apoyo de la Dirección General de Estadística y Censos por permitir utilizar sus instalaciones, personal y equipo, para la realización de esta investigación. En especial, al Departamento de Cómputo de la mencionada Institución. Finalmente, se agradece a las miles de personas de 60 años y más que brindaron gran parte de la información que sirvió de base para este estudio.
  • Ítem
    Costa Rica: niveles y tendencias de la mortalidad infantil, según zona de residencia y nivel de instrucción de las mujeres. Periodo 1962-1969
    (1985) Barquero Barquero, Jorge Arturo
    El estudio de los diferenciales de mortalidad debería considerarse para la formulación de políticas tendientes a disminuir su nivel, pues permite identificar los sectores de población más expuestos al riesgo. La fuente de información tradicional para la estimación de la mortalidad son las estadísticas vitales , pero en muchos países de América Latina éstas poseen grandes deficiencias No obstante, aún en los países donde se tienen estadísticas vitales de relativa confiabilidad, no es posible elaborar estimaciones que identifiquen estratos de mortalidad distinta ligados a variables socio-económicas. Las preguntas retrospectivas introducidas en los censos y encuestas, constituyen así una alternativa para el estudio de diferenciales de mortalidad. Mediante métodos indirectos, como el que se utiliza en el presente estudio, es posible asociar la estimación de mortalidad con la información que recoge el censo, ya sean características geográficas, de la vivienda, del hogar, o de las personas. Este trabajo está motivado en el reconocimiento de la desigualdad social ante la muerte. Sin embargo, hay que dejar en claro que no se trata de una visión esquemática o mecánica que asocia directamente el fenómeno de la muerte con las características socio-económicas, sino más bien, se reconoce que entre ambos existe una compleja interrelación mediada por factores biológicos y culturales que se asocian al proceso salud-enfermedad-muerte. Además, dicho proceso y los factores que lo determinan deben ser vistos en el marco de una sociedad históricamente determinada, por lo que la desigualdad social ante la muerte no ha sido siempre igual ni lo será en el futuro; más aún, ésta no puede ser explicada hoy día de un mismo modo en cada situación concreta. El reconocimiento de estos principios lleva a proponer la necesidad de estudiar las desigualdades sociales ante la muerte dentro de una teoría general que integre tanto aspectos sobre el funcionamiento de lo social como aquéllos asociados al proceso salud-enfermedadmuerte . —Estas reflexiones hacen que el concepto de clase social sea un elemento analítico útil para el estudio de los diferenciales de la mortalidad. Toda vez que sea entendido como la posición y situación que los individuos poseen con respecto a los medios de producción y a los beneficios de lo producido dentro de la sociedad, inserta dentro de un sistema de producción históricamente determinado. Así, el concepto de clase social logra identificar a diferentes grupos de individuos y sus condiciones de existencia, por tanto, su situación ante la vida 2/ y la muerte.— Sin embargo, el concepto de clase social no es posible de ser aprehendido con la sola información censal, pues implica factores asociados no sólo con las condiciones materiales de existencia, sino también con aspectos de la conciencia de clase, es decir, también factores políticos. Dadas las limitaciones de la información y de tiempo para este estudio, se decidió utilizar dos informaciones que recoge el censo que se considerarán como variables ligadas a las diferencias sociales ante la muerte; son éstas el lugar de residencia y el nivel de instrucción de las mujeres que declararon en el censo la información sobre hijos tenidos vivos e hijos sobrevivientes, utilizando la mortalidad infantil como variable ’’dependiente". La variable lugar de residencia es importante pues las desigualdades sociales tienen su expresión espacial en el territorio. El nivel de instrucción se interpreta no sólo como los posible hábitos, creencias y valores sobre higiene y alimentación que la educación inculca en las madres y que éstas transmiten en el cuidado de sus hijos. El nivel' de instrucción también se interpreta como un indicador de la pertenencia a una clase social, por tanto como las posibilidades de acceso a mayores ingresos y a los servicios de salud. Así pues, el objetivo de este trabajo será la estimación de los niveles y tendencias generales de la mortalidad infantil que se asocian a las variables lugar de residencia y nivel de instrucción de las mujeres. Como indicador de la mortalidad infantil se empleará la probabilidad de morir en el primer año de vida. Por último, es preciso aclarar que las estimaciones que se presentarán están sujetas a juicio de los lectores por posibles limitaciones metodológicas y de la información básica. Además, no se pretende llegar a estimaciones precisas, sino que, reconocer los diferenciales y órdenes de magnitud más importantes. El trabajo está organizado en cuatro capítulos. El primero es una referencia general a la situación de Costa Rica al momento de la estimación (1960- 1970). El segundo está dedicado a aspectos metodológicos y de la información básica. El tercer capítulo presenta los resultados de este estudio y, el último se refiere a las principales conclusiones que se derivan de los resultados obtenidos.
  • Ítem
    La Sobreparametrización en el ARIMA: una aplicación a datos costarricenses
    (2023-01-09) Gamboa Sanabria, César Andrés; Centeno Mora, Óscar Javier
    Estimar modelos de series cronológicas es una labor ampliamente extendida en múltiples campos de la investigación y uno de los objetivos es generar pronósticos de la forma más precisa posible dentro de un horizonte determinado. Existe una amplia gama de modelos que puede utilizarse con este fin, entre ellos están los modelos Autorregresivos Integrados de Medias Móviles ($ARIMA$), e incluso existen diversos métodos de estimación automática o semi-automática para esta rama de la Estadística. A pesar de esto, encontrar un modelo que posea un buen ajuste a los datos no es fácil, pues se deben considerar tanto aspectos teóricos como prácticos, y de la temática de estudio para así obtener un modelo adecuado que genere pronósticos realistas y pertinentes para la toma de decisiones dentro de lo posible. Esta investigación propone hacer uso del método denominado sobreparametrización en conjunto con el método de permutaciones del análisis combinatorio para someter a prueba un espectro más amplio de posibles modelos ARIMA. En la selección de modelos ARIMA, los métodos más tradicionales como los correlogramas u otros, no suelen cubrir muchas alternativas para definir la cantidad de coeficientes a estimar en el modelo, lo cual representa un método de estimación que no es óptimo. Por lo tanto, la presente tesis propone una metodología para obtener pronósticos más precisos en comparación a los métodos tradicionales. Los resultados encontrados se contrastan con datos simulados de series cronológicas y cuatro series reales para ajustar modelos ARIMA con la función auto.arima(), la sobreparametrización y un modelo ARIMA de orden bajo. Para cada una de estas series se realiza una partición del 80% para entrenar los modelos y el restante 20% para validación de los pronósticos. En cada una de estas series se realizó un análisis visual del comportamiento de los errores y posteriormente se evalúa la calidad de los resultados de cada modelo obtenido con las tres técnicas descritas mediante medidas de bondad de ajuste (AIC, AICc y BIC) y de precisión (RMSE, MAE y MAPE). Al tener datos que vienen de un proceso con bajo número de parámetros, la sobreparametrización logra captar de buena manera el comportamiento de la serie en comparación a las otras alternativas, y cuando el proceso que gobierna la serie es de un mayor grado. La metodología propuesta es capaz de capturar de mejor forma el comportamiento de la serie y conseguir pronósticos con una precisión mayor a los de los métodos tradicionales, ya que en los resultados de entrenamiento, la sobreparametrización obtuvo el mejor ajuste un 58,33% de las veces y la mejor precisión el 45,45% de las veces, mientras que al evaluar los resultados sobre los conjuntos de datos de validación, la sobreparametrización obtuvo el mejor ajuste el 50% de las veces, mientras que las mejores medidas de precisión se alcanzaron un 67% del tiempo.
  • Ítem
    Sesgo y precisión de una modificación del modelo de jolly-seber para incluir el tamaño inicial de la población y conteos parciales de mortalidad
    (2022-11) Rodríguez Campos, Luis Alejandro; Ramírez Hernández, Fernando
    La estimación de los inventarios de peces es crucial en la producción acuícola, pues permite un manejo apropiado de las tasas de alimentación y de la programación de las cosechas. Los métodos de captura y recaptura han sido ampliamente utilizados para estimar parámetros demográficos en poblaciones animales silvestres. Específicamente, el modelo de Jolly-Seber (JS) modela la abundancia y sobrevivencia de la población; sin embargo, es restrictivo en cuanto asume probabilidades iguales de captura y sobrevivencia para todos los individuos. Adicionalmente, en la acuicultura comercial se tiene información del número de peces sembrados y conteos parciales de mortalidad que podrían ayudar a generar modelos más robustos y precisos. Considerando lo mencionado anteriormente, el presente trabajo busca determinar el sesgo y precisión de estimadores de sobrevivencia y abundancia de JS a partir de diferentes tamaños de muestra, para la estimación de sobrevivencia y tamaño instantáneo, en poblaciones artificiales con capturabilidad desigual, tamaño inicial conocido y conteos parciales de mortalidad, usando simulación. Para ello, se simuló el crecimiento y mortalidad de 36 ciclos de producción de tilapia nilótica (Oreochromis niloticus) que se muestrearon para probar en cada una, dos diferentes números de ocasiones de muestreo (4 y 6) y tres diferentes tamaños de muestra en cada captura (n = 50, 100 y 150, equivalentes aproximadamente al 5, 10 y 15% de la población inicial), por lo cual se obtuvieron 909 estimaciones de abundancia y 680 de sobrevivencia y recuperabilidad. Como factores a nivel de ciclo productivo, se incluyó la forma de la relación entre sobrevivencia aparente y sobrevivencia observada, así como la época del año. Los datos simulados se analizaron mediante un modelo bayesiano de captura y recaptura que permite probabilidades desiguales de captura y la inclusión de conteos de mortalidad. Las estimaciones obtenidas de abundancia, sobrevivencia y recuperabilidad se analizaron por su nivel de sesgo y error estándar relativo. viii Los resultados obtenidos para las estimaciones de abundancia mostraron una concordancia adecuada con los tamaños poblacionales reales, con bajos niveles de sesgo (<7%) y error estándar relativo (<3%). Se evidenció un sesgo importante si el estanque presenta pérdida o robo, pero no se vieron severamente afectadas por la época de siembra. Las estimaciones de sobrevivencia mostraron incluso menor nivel de sesgo y error estándar relativo, pero la distribución de las estimaciones tendió a mostrar una importante asimetría, que podría indicar falta de convergencia. Las estimaciones de recuperabilidad presentaron elevados niveles de sesgo y error estándar relativo, pero ambos disminuyen al aumentar la edad del estanque. Si bien el modelo bayesiano de captura y recaptura presentado es innovador y tiene potencial para ser implementado, debe ser mejorado para reducir el tiempo que dura en converger y aumentar la calidad de las estimaciones, a fin de que pueda ser útil en situaciones de acuicultura industrial.
  • Ítem
    Comparación de metodologías para estimar la pobreza de tiempo en la población de 15 años y más que reside en Costa Rica
    (2022) Rodríguez Núñez, Simón Benjamín; García Santamaría, Cathalina
    La presente investigación tiene como objetivo comparar metodologías de estimación en relación con pobreza de tiempo en la población de 15 años y más residente en Costa Rica, a partir de métodos aplicados en otros países latinoamericanos, técnicas de análisis multivariado y visualizaciones, que se enfoquen en estrategias de acción para política pública. Para ello, se utilizan los datos de la ENUT 2017. Dentro de los principales resultados, se destaca la estimación de umbrales de pobreza de tiempo unidimensionales, estos son: la Carga Global de Trabajo (CGT), pobreza R (1,5 veces mediana del tiempo total de trabajo), y la pobreza V que se estima a partir de la norma de Vickery. Se destaca que la mayor cantidad de brechas se evidencia con la pobreza de tiempo por CGT, en donde son más las mujeres ocupadas con dicha condición, además, se caracterizan por tener 36 a 54 años, son jefas de hogar, cuyo nivel de educación es primaria completa o secundaria incompleta. Con respecto a la pobreza R y V, se resalta que son más severas en comparación a pobreza por CGT, en ambas mediciones no se encuentran diferencias significativas por sexo. Por otro lado, se realiza un análisis de conglomerados (k medias) usando las variables de tiempo total por trabajo y no trabajo, este permite identificar tres grupos: las personas que trabajan en exceso, las que trabajan una cantidad de horas equilibrada o lo necesario, y las personas que trabajan poco. Por último, se describe a la población ubicada en cada conglomerado. Para ello, se realiza el contraste de medias entre las agrupaciones y se complementa con un análisis de correspondencia múltiple. Como resultado se obtuvo que el grupo de personas que trabajan en exceso se caracteriza por estar compuesto principalmente de personas con las edades más productivas en la fuerza laboral (de 20 a 54 años), la mayoría son jefatura de hogar, cuyo estado conyugal es casada o en unión libre. Dentro de las principales conclusiones se enfatiza la visibilización de la doble o hasta triple jornada que experimentan algunas mujeres, en especial aquellas que se encuentran pobres de tiempo. Además, las mujeres con privación del tiempo dedican en promedio más del 44% del tiempo por concepto de trabajo a actividades no remuneradas, en contraste a los hombres cuyo porcentaje es inferior a 25%. Las metodologías empleadas en este estudio confirman una situación de vulnerabilidad de las mujeres desde un enfoque de uso del tiempo y cuido.
  • Ítem
    Esperanza de vida libre de enfermedades degenerativas no letales (artritis y osteoporosis): Análisis comparativo entre el método de Sullivan y el método de tablas de decremento múltiple y Esperanza de vida libre de diabetes: el problema de operacionalización de la diabetes y el efecto de una intervención
    (2022-09) Pacheco Rivas, Jorge Andrés; Brenes Camacho, Gilbert
    Resumen (Práctica Profesional I) : En la presente investigación, se desarrolla la metodología y objetivos para el cálculo de la esperanza de vida libre de artritis y osteoporosis utilizando dos métodos: el modelo de tablas multiestado (MTM) y el modelo de Sullivan (MS). Debido al marcado envejecimiento de la población y a la alta incidencia de dichas enfermedades crónicas en edades avanzadas, resulta importante conocer la estimación de la esperanza de vida de los adultos mayores con el fin de implementar políticas que le permitan al sistema de salud enfrentarse a la carga de estas enfermedades. El objetivo principal de este trabajo es determinar cuánta es la esperanza de vida de las personas de 50 años y más, según el padecimiento o no de osteoporosis y artritis, mediante los dos métodos mencionados. Los datos utilizados en este análisis provienen de la encuesta CRELES (Costa Rica: Estudio de Longevidad y Envejecimiento Saludable), la cual es un estudio longitudinal basado en una muestra representativa de adultos mayores a nivel nacional. Para el análisis se utiliza la cohorte de jubilados (pre-1945) donde se inicia con 2815 adultos mayores a lo largo de tres rondas de entrevistas, y la cohorte 1945-1955 (pre-jubilación) que comienza con 2790 entrevistados y cuenta con dos rondas. Se logró demostrar que la esperanza de vida libre de artritis es mayor para los hombres, según el MTM; sin embargo, con el MS, la esperanza de vida libre de dicha enfermedad solo es mayor que la de las mujeres alrededor de los 60 años; posterior a dicha edad, el indicador es mayor para las mujeres. Para el caso de la osteoporosis, la esperanza de vida promedio es 31.23 años, 28.08 de los cuales vivirá exento del padecimiento y 3.12 años en promedio con dicha enfermedad. Con el SM, la esperanza de vida libre de artritis es 28.06 años, en tanto que la esperanza de vida libre de osteoporosis es 30.23 años. La escogencia de cuál de los dos modelos es mejor depende meramente del objetivo para el cual se utilizarán las estimaciones; si es para hacer comparaciones internacionales y se va a trabajar con las tasas de prevalencia, resulta más conveniente el MS, mientras que, si se requiere analizar una cohorte de forma longitudinal basándose en las tasas de incidencia, el método que se prefiere es el MTM.
  • Ítem
    Implementación de modelos estadísticos para la estimación de la demanda de combustibles en Costa Rica
    (2022-09-27) Quesada Rojas, Allan Gerardo; Rojas Rojas, Guaner David
    La pandemia del Covid-19, ha constituido un reto enorme para la humanidad, generando importantes desafíos en las diversas áreas del conocimiento, y la Estadística no es la excepción, pues muchos modelos, requieren el desarrollo de diversas modificaciones en su tratamiento, para la adecuada internalización de este cambio tan importante en el contexto. De ahí nace la motivación del presente trabajo, el cual busca generar un aporte, que permita dar diversas alternativas para la estimación de series de tiempo o cronológicas, las cuales han sido expuestas a una perturbación fuerte como es el caso de la pandemia, que ocasiona importantes errores al momento de pronosticar el comportamiento a futuro de la serie. En este estudio, se empleó la información de la demanda de combustible de Costa Rica de 2010 a 2020 en litros para los productos Súper (RON 95), Regular (RON 91) y Diésel (Diésel 50 ppm), que son los combustibles de mayor consumo a nivel nacional, son de gran importancia en la economía del país, y han sido una de las demandas más afectadas por la pandemia. Para lograr lo anterior, se desarrollaron diversos modelos estadísticos de series de tiempo, como por ejemplo los modelos de suavizamiento exponencial, modelos ARIMA, modelos de Series de Tiempo Estructurales Bayesianas y modelos de minería de datos como XGBoost y el uso de Vectores de Soporte de Regresión, empleando datos estadísticos de las series de ventas de combustible, datos de movilidad de Google y datos asociados a la evolución del Covid-19. El fin de utilizar este conjunto de modelos, fue aprovechar las diversas características y bondades que cada uno de ellos ofrece, y de este modo poder enfrentar un escenario de estimación complejo, comprendiendo que, en diversas ocasiones los mejores resultados se obtienen de emplear diversos modelos, por ejemplo para la gasolina regular, el mejor resultado se obtuvo por medio de un modelo XGBoost (7,55% de Error Absoluto Medio), mientras que para el Diésel el mejor resultado fue del modelo Bayesiano (8,84% de Error Absoluto Medio). Además, se observó que en ocasiones el trabajo conjunto de todas estas técnicas puede ser una gran alternativa, como se observó en el caso de la gasolina Súper, en la cual se empleó el modelo conjunto estimado por medio de Vectores de Soporte de Regresión, utilizando como variables explicativas, las estimaciones de los otros modelos y permitió obtener los mejores resultados con 9,91% de Error Absoluto Medio.
  • Ítem
    Análisis del Modelo de Competencias Laborales Desempeñadas por las Personas Graduadas de las Universidades Estatales
    (2022) Corrales Bolívar, Karen Pamela; Rojas Rojas, Guaner David
    I resumen En el presente documento se muestra como objetivo de investigación, la metodología abordada, resultados obtenidos de los análisis psicométricos, con sus respectivos hallazgos, para dar respuesta al objetivo general de la práctica profesional que corresponde a reunir evidencias para la validez de los instrumentos de medición de las competencias laborales de las personas graduadas de las universidades estatales desarrollado por el Observatorio Laboral de Profesiones. En la investigación se utilizaron dos instrumentos de para su validez, el primero corresponde a la encuesta de seguimiento de la condición laboral de las personas graduadas 2011-2013 de las universidades estatales y el segundo al estudio de empleadores de las personas graduadas 2011-2013. Ambos instrumentos comparten una batería de competencias laborales que fue analizada para cumplir con el objetivo de validez de medición. Las competencias laborales fueron evaluadas por distintas técnicas, iniciando con un análisis factorial confirmatorio, la aplicación de la Teoría de Clásica de los Test y finalizando con la aplicación de la Teoría de Respuesta al ítem y sus respectivos modelos. Los principales resultados obtenidos, reflejaban buen ajuste de los ítems, además del buen funcionamiento de la mayoría de ellos. Se seleccionan como mejores modelos en su mayoría modelos de Rasch que facilitan su interpretación y finalmente el ítem de “compromiso con la calidad” en los diferentes niveles medidos, resultó ser el ítem más complejo de evaluar tanto para personas graduadas como para las jefaturas. II resumen Producto del crecimiento en los diplomas universitarios, es de interés para el Observatorio Laboral de Profesiones, indagar sobre la combinación de estudios universitarios que están realizando las personas graduadas, es así que esta práctica plantea como objetivos generales el generar un perfil de las personas graduadas universitarias entre el 2011-2013 a partir de las características académicas y laborales, tomando en cuenta las posibles combinaciones de las disciplinas de los graduados(as), y analizar la combinación de disciplinas universitarias de las personas graduadas 2011-2013 de las universidades costarricenses, para construir un perfil considerando las características académicas y laborales. Esto se llevó a cabo por medio de la aplicación de la técnica de redes sociales o grafos, consideran un total de 58 disciplinas de las 114 que tiene el estudio de seguimiento de graduados, dichas disciplinas corresponden a las que tienen combinaciones de diplomas entre ellas. A la red social también se le aplicó un modelo exponencial de grafos aleatorios, para ver la asociación existente entre las combinaciones de carrera universitaria. Como principal resultado, las disciplinas de Archivística y Gestión de Tecnología es la combinación con más personas graduadas en ambas carreras, así mismo el modelo encontró nueve variables significativas entre aspectos académicos y laborales, lo que indican es que a mayor grado en alguna de las variables menor la probabilidad de que se estudien de manera conjunta.
  • Ítem
    Análisis de Sobrevivencia para Predecir el Retiro de Funcionarios de Ministerios de Gobierno. Análisis de Cohortes para determinar el Impacto Salarial de un Modelo de Salario Único para los Empleados de Ministerios de Gobierno
    (2022) Ortiz Robles, Israel de Jesús; Barboza Chinchilla, Luis Alberto
    Resumen de Práctica Profesional I Este estudio se enfocó en la predicción de la probabilidad de retiro a corto, mediano y largo plazo de los funcionarios de ministerios de gobierno. Para obtener estimaciones de dicha probabilidad se utilizaron modelos de sobrevivencia tanto paramétricos como semiparamétricos y se estableció una metodología para determinar cuál modelo produce estimaciones de forma más exacta. Estos modelos utilizaron como variables predictoras el sexo, la categoría profesional y la edad inicial dada la influencia que tienen estas variables en el retiro de funcionarios. Los resultados demuestran que el comportamiento al retiro es bastante heterogéneo de acuerdo a las variables de interés. En específico es más probable la salida de mujeres y de no profesionales sobre todo en los primeros 5 años de laborar. Es más probable la salida de funcionarios no profesionales sobre todo en los primeros años de laborar. A su vez se evidenció la interacción entre el sexo y la categoría profesional puesto que en general son más longevos los hombres profesionales y los grupos menos longevos son las mujeres no profesionales. En cuanto a la edad inicial se encontró que se espera que entre mayor sea la edad de un funcionario al ingresar menor será su tiempo de permanencia del mismo. En cuanto a la metodología para evaluar el modelo de sobrevivencia más exacto en cuanto a predicción de la probabilidad de sobrevivencia cabe aclarar que es un tema aún en discusión en la comunidad estadística. Los estadísticos utilizados para este tipo de evaluación en este estudio se clasifican en medidas de discriminación y exactitud. Los estadísticos de discriminación escogidos fueron el índice C de Harrell y el Área Bajo la Curva ROC con Sensibilidad al Incidente y Especificidad Dinámica (I/D), el estadístico de exactitud escogido fue el Brier Score y también se calculó la desviación estándar del estadístico C. Por último, se realizó un consenso entre los resultados de los indicadores para determinar de forma más acertada el modelo a escoger. Resumen de Práctica Profesional II En el presente estudio se compararon modelos de pago de salarios en los Ministerios de Gobierno de Costa Rica para determinar el efecto de implementar un modelo de salario único en dichas instituciones. En específico se compararon 3 esquemas de salario base más pluses y 3 esquemas de salario único. La comparación se realizó por medio de simulación de los esquemas salariales ligados al desgaste de cohortes de funcionarios, dado que el componente demográfico es fundamental para predecir el gasto salarial devengado. De esta forma se obtuvo una proyección del gasto en salarios devengado para el período comprendido entre los años 2022 y 2053. Los resultados demuestran la influencia del componente demográfico asociado a la duración de cohortes de funcionarios en el gasto devengado para todos los esquemas puesto que los cambios en el gasto son concordantes con los cambios en las cohortes de funcionarios. También se encontró que los esquemas de salario base más pluses devengan mayor gasto que los correspondientes a salario único sobre todo para aquellos casos en los cuales el salario base aumenta. Por otro lado, los esquemas de salario único devengan menor gasto que los esquemas de salario base más pluses, sin embargo, el gasto de dichos esquemas es muy similar para cada uno de ellos. Además, es importante recalcar que el gasto proyectado para el esquema de salario base más pluses con aumentos solamente por el componente de anualidad es muy similar al devengado por los esquemas de salario único. Un hallazgo importante es la incertidumbre generada en este tipo de estimaciones puesto que se realizaron estimaciones por intervalo del 80% de cada uno de los escenarios simulados y los mismos fueron muy anchos, lo cual es un aspecto importante al momento de tomar decisiones.
  • Ítem
    Clasificación y caracterización de intersecciones de rutas nacionales con base en el uso de dispositivos de seguridad pasiva en ocupantes de vehículos automotores para el 2018
    (2022) Granados Salazar, José Jesús; Madrigal Pana, Johnny
    RESUMEN PRÁCTICA PROFESIONAL I: El objetivo de esta investigación es clasificar intersecciones entre rutas nacionales con base en el uso de dispositivos de seguridad pasiva en el año 2018 para definir perfiles que generen información de interés en el planteamiento de estrategias de intervención. Para realizarlo se utiliza como fuente de datos, el “Estudio nacional sobre uso de dispositivos de seguridad pasiva, vestimenta y factores distractores, 2019” realizado por el Consejo de Seguridad Vial (Cosevi) en el 2018. Previo a la clasificación de las intersecciones, se realiza una valoración de los indicadores disponibles para determinar el o los más apropiados en la formación de grupos. Posteriormente, mediante análisis de conglomerados, utilizando la técnica “K-Medoids”, se identifican diferentes escenarios para encontrar el número adecuado de grupos. Los grupos generados se validan internamente para determinar diferencias significativas, según las variables propuestas para la caracterización de las intersecciones, y una vez definidos los grupos, se procede a caracterizarlos mediante regresión logística multinomial. Entre los resultados más importantes se encuentra que, de los tres indicadores evaluados para formar los grupos, el uso de los dos indicadores individuales (uso de casco y uso de cinturón) brinda mayor información que el compuesto (suma de indicadores individuales). Además, a partir de la razón de correlación “eta2” (η2), análisis gráfico y criterio sustantivo, se determina que el número de agrupaciones se estabiliza en tres, denominadas “Bajo uso”, “Uso medio” y “Alto uso”. A partir de la validación interna se determinan diferencias significativas entre los grupos y las características de la intersección. La creación del perfil, usando regresión logística multinomial, sugiere que las variables relevantes corresponden a: “Zona”, “GAM”, “Flujo vehicular” y “Cantidad media de accidentes”, de las cuales, “GAM” y “Flujo vehicular” resultaron significativas al 5%, utilizando como referencia el grupo de “Bajo uso”. Lo anterior implica que, en ambas agrupaciones, las intersecciones que se encuentran dentro de la GAM tienen mayor posibilidad de ser de uso medio o alto uso de dispositivos de seguridad y que, además, aumentos en el flujo vehicular implican mayor posibilidad de pertenecer a dichos grupos de uso de dispositivos de seguridad. A partir del análisis realizado con la clasificación y caracterización de las intersecciones, se logran identificar los focos de menor uso de dispositivos de seguridad pasiva, generando información relevante para orientar a las entidades responsables en materia de seguridad vial, creando políticas y estrategias de intervención destinadas a mejorar la situación en sitios con bajo uso de dispositivos de seguridad, mediante la aplicación de campañas de comunicación, operativos de tránsito y demás medidas que garanticen una mejoría en el porcentaje de uso de casco y cinturón de seguridad.
  • Ítem
    Efecto del ciclo económico en la calidad de la cartera de crédito de consumo y vivienda 2007-2021
    (2022-08-30) Ureña Jiménez, Osvaldo Lorenzo; Rímola Guevara, Max Alberto
    El entorno de las entidades financieras que operan actualmente en Costa Rica se desarrolla en un mercado competitivo, por lo que mucha atención se concentra en el porcentaje de participación del mercado de crédito que tiene cada institución. Por este motivo, el interés de las entidades financieras se dirige al incremento de su cartera de crédito. Según información de la Superintendencia de Entidades Financieras de mayo 2020 a mayo 2021 la participación de mercado de la entidad más grande del sistema se redujo en un 0.5% (creciendo en cartera, de 4.231.030 millones de colones a 4.275.151 millones de colones, en porcentaje representa un 1.04% de aumento) y la participación del principal banco privado aumento en un 0.7%, (creciendo en cartera, de 2.696.180 millones de colones a 2.938.562 millones de colones, en porcentaje representa un 8.9%) lo que ejemplifica lo competitivo que se ha tornado el mercado de crédito dentro de Costa Rica. Un elemento muy importante de la cartera de crédito es la calidad de esta (entendiendo la calidad de la cartera como el resultado de dividir la cartera en atraso mayor a cero días entre la cantidad total de la cartera). La presente investigación estudia la relación existente entre la calidad de la cartera de las actividades de consumo y vivienda, en moneda colones para el Banco Nacional de Costa Rica respecto al ciclo económico, para el período enero 2007 a mayo 2021. Mediante un modelo de vectores de corrección de error (VECM) se logró confirmar que sí existe relación entre la calidad de cartera de las actividades antes mencionadas con el ciclo económico. Además, se logró identificar que, un shock positivo sobre el indicador mensual de actividad económica tiene como efecto una reducción en el indicador de mora, durando este efecto aproximadamente 12 meses, por otro lado, un shock positivo sobre la cartera de crédito (para estos efectos la cartera de las actividades consumo y vivienda en la moneda cólones), reduce el indicador de mora durante aproximadamente 5 meses. También se logró concluir que shocks sobre la tasa básica pasiva no tiene un efecto estadísticamente significativo sobre el indicador de mora, esto al observar las funciones de impulso respuesta del modelo VECM.
  • Ítem
    Análisis de la duración de los flujos de exportación de Costa Rica a nivel de producto mediante modelos de sobrevivencia.
    (2022-08) Valverde Fallas, Kimberly; Brenes Camacho, Gilbert
    Se analiza la duración de las exportaciones de Costa Rica, durante el período comprendido entre 2007 y 2019 medida como la cantidad de años que se mantiene vigente una exportación. También, se analizan los determinantes que influyen en el cese de la exportación, con especial interés en el papel que los Tratados de Libre Comercio (TLC) tienen en las tasas de sobrevivencia, así como otros determinantes propios de la teoría gravitacional del comercio internacional y factores relacionados con el producto.