1204 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) Campos-Sánchez, R., Flores-Cruz, A., Molina-Mora, J. A., Mora, R., Rodríguez, C., Gatica-Arias, A., & Guzmán-Verri, C. (2021). Avances de la bioinformática en Costa Rica: vista retrospectiva y perspectivas. Revista de Biología Tropical, 69(4), 1204-1223. https://doi.org/10.15517/rbt. v69i4.46873 OTROS https://doi.org/10.15517/rbt.v69i4.46873 Avances de la bioinformática en Costa Rica: vista retrospectiva y perspectivas Rebeca Campos-Sánchez1,3*; https://orcid.org/0000-0002-9413-8371 Andrés Flores-Cruz2; https://orcid.org/0000-0001-5354-2901 José Arturo Molina-Mora2,3,4; https://orcid.org/0000-0001-9764-4192 Rodrigo Mora2,3; https://orcid.org/0000-0001-7964-3575 César Rodríguez2,4; https://orcid.org/0000-0001-5599-0652 Andrés Gatica-Arias5; https://orcid.org/0000-0002-3841-0238 Caterina Guzmán-Verri6; https://orcid.org/0000-0003-1036-920X 1. Centro de Investigación en Biología Celular y Molecular, Universidad de Costa Rica, San Pedro, San José, Costa Rica; rebeca.campos@ucr.ac.cr (Correspondencia*) 2. Facultad de Microbiología, Universidad de Costa Rica, San Pedro, San José, Costa Rica; andres.florescruz@ucr.ac.cr, jose.molinamora@ucr.ac.cr, rodrigo.morarodriguez@ucr.ac.cr, cesar.rodriguezsanchez@ucr.ac.cr 3. Programa de Maestría en Bioinformática y Biología de Sistemas, Escuela de Medicina, Universidad de Costa Rica, San Pedro, San José, Costa Rica. 4. Centro de Investigación en Enfermedades Tropicales, Universidad de Costa Rica, San Pedro, San José, Costa Rica. 5. Escuela de Biología, Universidad de Costa Rica, San Pedro, San José, Costa Rica; andres.gatica@ucr.ac.cr 6. Programa de Investigación en Enfermedades Tropicales, Escuela de Medicina Veterinaria, Universidad Nacional, Heredia, Heredia, Costa Rica; caterina.guzman.verri@una.cr Recibido 05-V-2021. Corregido 27-X-2021. Aceptado 09-XI-2021. ABSTRACT Bioinformatics advances in Costa Rica: retrospective view and perspectives Introduction: The scientific discipline of bioinformatics has the potential to generate innovative applications for human societies. Costa Rica, small in size and population compared to other Latin American countries, has been progressively adopting the discipline. Recognizing progress makes it possible to determine where the country can go in this field, as well as its contribution to the Latin American region. Objective: This manuscript reports evidence of the evolution of bioinformatics in Costa Rica, to identify weak- nesses and strengths allowing future actions plans. Methods: We searched databases of scientific publications and sequence repositories, as well as information on training activities, networks, infrastructure, web pages and funding sources. Results: Important advances have been observed since 2010, such as increases in training opportunities and the number of publications, significant contributions to the sequence databases and connections through networks. However, areas such as critical mass and financing require further development. The scientific community and its sponsors should promote bioinformatics-based research, invest in graduate student training, increase profes- sional training, create career opportunities in bioinformatics, and promote international collaborations through networks. Conclusions: It is suggested that in order to experience the benefits of bioinformatics applications, three key aspects must be strengthened: the scientific community, the research infrastructure, and funding opportunities. The impact of such investment would be the development of ambitious but feasible projects and extended Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1205 collaborations within the Latin American region and abroad. This would allow significant contributions to address global challenges and the implementation of new approaches to research, innovation and knowledge transfer for the development of the economy, within an ethics of research framework. Key words: data analysis; NGS-next generation sequencing; education; Web of Science; SRA (Sequence Read Archive); PubMed; ENA (European Nucleotide Archive). Las sociedades humanas son impulsadas microorganismos. De estas secuencias se pue- por la información en forma de datos. Las den identificar los genes de esos organismos disciplinas científicas, incluidas la agronomía, para encontrar moléculas con potencial apli- la biología, la ecología, la microbiología, la cación biotecnológica y por ende económico química y la medicina, se benefician del rápi- (Coutinho et al., 2018). do crecimiento de tecnologías que producen Costa Rica tiene ejemplos relevantes de y manejan cantidades masivas de datos. Esto contribuciones y aplicaciones de la bioinformá- permite la toma de decisiones más precisas tica. Entre ellas están el retrato de la riqueza de y acertadas acorde a la realidad que cada la biodiversidad nacional, la estructura genética sociedad vive. de la población humana según las genealogías Un ejemplo claro de esto es la medicina registradas en el país, y las detalladas caracte- personalizada o de precisión que permite rea- rizaciones fenotípicas de venenos de serpientes lizar diagnósticos basados en la información (Campos-Sánchez et al., 2013; CBOL Plant propia de cada paciente, como la genética. Esto Working Group, 2009; Lomonte et al., 2014; facilita la prescripción de tratamientos médicos Lomonte & Calvete, 2017; Segura-Wang et al., hechos a la medida de la condición propia de 2010; Suárez-Esquivel et al., 2017a). La parti- cada paciente. También se pueden integrar dife- cipación en esfuerzos globales como el proyec- rentes niveles moleculares a estudios GWAS to “International Barcoding of Life – iBOL” y (Genome Wide Association Studies) para com- la secuenciación del genoma completo (WGS) prender mejor las enfermedades humanas, o de familias con esquizofrenia o trastorno bipo- incluso asistirse de estrategias como inteli- lar también reflejan contribuciones importantes gencia artificial para describir padecimientos en el avance de la generación y la investigación con modelos descriptivos y predictivos. En basada en cantidades masivas de datos de Costa el futuro, podría ser posible modificar genes Rica (Glahn et al., 2019; Shokralla et al., 2015). defectuosos con técnicas como CRISPR-Cas9 Durante los últimos diez años, el país ha (Razzouk, 2018), o estrategias basadas en ARN registrado una serie de eventos que reflejan (ácido ribonucleico) de interferencia. el aumento de interés y capacidad de realizar Otro ejemplo actual ilustrado por la pan- investigación en el campo. Uno de ellos es demia del SARS-CoV-2, es la relevancia de la instalación de seis instrumentos Illumina la vigilancia genómica global de patógenos, de secuenciación en instituciones tanto públi- la cual permite una respuesta oportuna para el cas como privadas. En recursos de computa- control de la diseminación de la enfermedad, o ción, existe al menos un clúster computacional quizás incluso prevenirla por completo (Gardy moderno con libre acceso para investigación & Loman, 2017). Adicionalmente, la informa- (Kabré del Colaboratorio Nacional de Compu- ción generada de la secuenciación del genoma tación Avanzada - CNCA). En el área académi- del SARS-CoV-2, permitió un diseño rápido y ca, se creó en el 2011 el Programa de Maestría dirigido de vacunas sin precedentes (Kyriakidis en Bioinformática y Biología de Sistemas et al., 2021). (MBBS) de la Universidad de Costa Rica, se En el tema de bioprospección, con las tec- han organizado múltiples cursos internacio- nologías de secuenciación y análisis de datos nales entre ellos el de Genómica y Vigilancia se pueden describir comunidades enteras de Epidemiológica de Patógenos Bacterianos en 1206 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) Costa Rica desde el 2013. Además, se han autores sugieren acciones desde la perspectiva organizado sesiones de Bioinformática y Biolo- científica para impulsar el crecimiento de la gía de Sistemas como parte de las conferencias investigación en genómica y bioinformática internacionales IWOBI 2018 (IEEE Interna- con potencial impacto social y económico. tional Work Conference on Bioinspired Inte- Esto dependerá de la capacidad de fortalecer la lligence), CARLA 2019 (Latin America High comunidad, de conseguir fondos de investiga- Performance Computing Conference) e IWOBI ción y del desarrollo de una infraestructura de 2020. A nivel nacional, el Consejo Técnico en investigación bien articulada (Fig. 1). Bioinformática Clínica (CTBC) del Ministerio de Salud ha organizado dos Jornadas en Bioin- MATERIALES Y MÉTODOS formática Clínica (2019 y 2020) con participa- ción profesional y estudiantil. El objetivo principal de esta revisión es En este trabajo se recopila y presenta evi- evaluar el progreso de la investigación y el dencia de la evolución de la bioinformática en ambiente nacional con respecto a la bioinfor- Costa Rica desde el 2010. Para esto se usaron mática en Costa Rica en los últimos once años. datos de la literatura científica, se realizaron Para esto se cuantificaron aspectos como el búsquedas en bases de datos de secuencias y aumento en el número de publicaciones, núme- páginas en línea, y entrevistas a profesiona- ro de secuencias depositadas en bases de datos les y docentes relacionados con el campo a y número de personas capacitadas. Además, se nivel nacional. Los datos indican un avance midieron los avances en términos de acceso importante en esta disciplina. Además, con a fondos de financiamiento e infraestructura este trasfondo, se identificaron debilidades y computacional, colaboración en redes cientí- fortalezas para proponer acciones a futuro. Los ficas y la legislación que regula el acceso y Fig. 1. Componentes interrelacionados para medir el avance de la bioinformática en Costa Rica y potenciales puntos de acción para fortalecer la disciplina. Fig. 1. Interrelated components to measure progress of bioinformatics in Costa Rica and action opportunities to strengthen this discipline. Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1207 análisis de datos genómicos. Todas las búsque- TITLE: (microbiome) OR TITLE: (microbio- das se realizaron del 15-23 de abril del 2021, ta) OR TITLE: (metagenome) OR TITLE: abarcando los años 2010 hasta el 23 de abril (metagenomic) OR TITLE: (proteomic) OR del 2021. En resumen, el proceso de recolecta TITLE: (proteome) OR TITLE: (microarray) de información se dividió en tres etapas: bús- OR TITLE: (exome) OR TITLE: (NGS). Los queda en bases de datos de artículos científicos, resultados fueron luego filtrados en Refine búsqueda en bases de datos de secuencias de results con la palabra Costa Rica y por organi- nucleótidos y recolecta de información directa- zaciones (ORGANIZATIONS-ENHANCED: mente de páginas web o personas ligadas a las (UNIVERSIDAD COSTA RICA OR UNI- actividades relacionadas con la bioinformática. VERSIDAD NACIONAL COSTA RICA OR HOSP NACL NINOS DR CARLOS SAENZ Búsqueda en bases de datos de artícu- HERRERA OR CATIE CENTRO AGRONO- los científicos: Se realizaron búsquedas en MICO TROPICAL DE INVESTIGACION Y tres bases de datos: PubMed, Web of Science ENSENANZA OR FDN INCIENSA OR UNI- y IEEEXplore. Las dos primeras difieren en VERSIDAD ESTATAL A DISTANCIA UNED, su formato de búsqueda, así como en el con- INST TECNOL DE COSTA RICA). Los resul- tenido de las bases de datos, aunque hay un tados se exportaron con la opción “other file traslape que no se cuantificó. IEEEXplore formats” usando la opción “Record content = contiene artículos tipo “proceedings” de con- Full record” y “File format = plain text”. De ferencias que no están presentes en PubMed o estos archivos se extrajo únicamente la fecha Web of Science. de publicación (identificado como PY). La búsqueda en PubMed se hizo de tres En IEEEXplore la búsqueda incluyó dos maneras, buscando el campo “title”, “title/abs- palabras bioinformatics AND Costa Rica para tract” o “allfields”. Este es un ejemplo del for- todos los años que hubiera datos disponibles. mato title: (((((((((((((((((((bioinformatic[Title]) Adicionalmente, se realizó una nube de OR (systems biology[Title])) OR (computatio- palabras con la herramienta en línea word- nal biology[Title])) OR (genome[Title])) OR clouds (https://www.wordclouds.com/) usando (genomic[Title])) OR (transcriptomic[Title])) los títulos de las publicaciones identificadas en OR (transcriptome[Title])) OR (rna la búsqueda de PubMed por título y resumen. seq[Title])) OR (RNA-Seq[Title])) OR Todas las palabras de los títulos se cambiaron a (microbiome[Title])) OR (microbiota[Title])) minúsculas para hacer el conteo. OR (metagenome[Title])) OR (metagenomic[Title])) OR (proteomic[Title])) Búsqueda en bases de datos de secuen- OR (proteome[Title])) OR (microarray[Title])) cias de nucleótidos: Para esta revisión se OR (exome[Title])) OR (NGS[Title])) AND hicieron búsquedas en dos bases de datos: (Costa Rica[Affiliation])) AND ((“2010”[Date ENA (European Nucleotide Archive) y SRA - Publication] : “3000”[Date - Publication])). (Sequence Read Archive). Cada base de datos Los resultados se exportaron en formato csv y tiene campos de búsqueda distintos y alber- se extrajo únicamente la fecha de publicación. ga tanto datos compartidos (redundantes) La búsqueda en Web of Science se reali- como únicos, así que no son completamente zó de tres formas, buscando el campo “title”, comparables. “topic” y “allfields”. Un ejemplo de búsque- Se realizó la búsqueda limitando la fuente da es el siguiente: TITLE: (bioinformatics) geográfica a 19 países Latinoamericanos, uno OR TITLE: (systems biology) OR TITLE: cada vez (Argentina, Belice, Bolivia, Brasil, (computational biology) OR TITLE: (genome) Chile, Colombia, Costa Rica, Cuba, Ecuador, OR TITLE: (genomic) OR TITLE: (trans- El Salvador, Guatemala, Honduras, México, criptomic) OR TITLE: (transcriptome) OR Nicaragua, Panamá, Paraguay, Perú, Uruguay TITLE: (rnaseq) OR TITLE: (RNA-Seq) OR y Venezuela). Las búsquedas se enfocaron en 1208 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) datos generados por cualquier tecnología de 2021), CNCA (30 abril 2021), colaboradores secuenciación de lecturas cortas y largas. del proyecto CABANA en Costa Rica (25 de Se usó la interfaz web del ENA bajo la abril 2021), colaboradores de las redes RedBio- opción búsqueda avanzada y el tipo de datos Sea, RedBioAplicada y Rigatrop. También se “Raw reads”. La búsqueda tuvo el siguiente obtuvo información de profesores de la UCR, formato (reemplazando el nombre de país): UNA e ITCR relacionados con la enseñanza de (country = “Costa Rica”) AND (instrument_ la bioinformática en sus instituciones. platform = “ABI_SOLID” OR instrument_plat- Se recabó información de páginas web de form = “BGISEQ” OR instrument_platform = las redes SOIBio y BIOCANET, y de publica- “CAPILLARY” OR instrument_platform = ciones de estas redes. “COMPLETE_GENOMICS” OR instrument_ platform = “DNBSEQ” OR instrument_plat- RESULTADOS form = “HELICOS” OR instrument_platform = “ILLUMINA” OR instrument_platform Producto de la búsqueda y análisis de = “ION_TORRENT” OR instrument_plat- información de bases de datos de publicaciones form = “LS454” OR instrument_platform = y secuencias, páginas web de redes y entre- “OXFORD_NANOPORE” OR instrument_ vistas, se observa en general: un incremento platform = “PACBIO_SMRT”). Los resultados en la producción científica y el entrenamiento se exportaron como un archivo TSV (columnas de profesionales, el impacto positivo de la separadas por tabs) y se extrajo la información colaboración en redes, el acceso a infraes- relevante con scripts de Unix. Los campos tructura computacional gratuita y avances en de búsqueda fueron: “first_created”, “instru- la legislación para regular la investigación. ment_platform”, y en el caso de Costa Rica También se evidenció un desestímulo en los también se extrajo el nombre de la institución últimos años en el financiamiento nacional para que sometió las secuencias (“center_name”). la ciencia en general, que podría afectar a la Una búsqueda similar se realizó en el bioinformática directamente. SRA del NCBI, sin embargo, el formato de la búsqueda fue el siguiente: (Costa Rica) AND Producción científica: En la Fig. 2 se (“2010”[Publication Date]: “3000”[Publication muestra el aumento en la producción científica Date]). Se repitió la búsqueda con el resto de 18 a partir del 2014 en Costa Rica, según los datos países mencionados anteriormente. Los datos recolectados en PubMed y Web of Science con se exportaron en formato csv con las opciones 18 palabras clave. Esta tendencia creciente “file” y “format RunInfo”. Se usaron scripts después del año 2014 se observa también en el para extraer los datos de “release date”, “center número de registros en la base de datos ENA name” y “platform”. (Fig. 3), así como en todas las publicaciones Para ambas bases de datos, los datos científicas de Costa Rica registradas en la se normalizaron por tamaño de la población base de datos HIPATIA del Programa Esta- usando el dato del 2020 según la página web do de la Nación (https://hipatia.cr/dashboard/ Worldometers (https://www.worldometers. publicaciones-cientificas). Especialmente, en info/world-population/population-by-country/, el 2020 se muestra un crecimiento acelerado accesada el 21 de abril del 2021). de publicaciones, quizás siendo un preámbulo para un 2021 aún mayor. Entre ambas bases Búsqueda de datos en páginas web o de datos hay un traslape de publicaciones que directamente con personas: Otra información no se cuantificó, sin embargo, es evidente que que se presenta en este trabajo fue recabada de PubMed captura mejor las búsquedas inclu- representantes de organizaciones, incluyendo sive solo usando el título y resumen de los la dirección de la Maestría en Bioinformática artículos. Esta realidad supera los resultados y Biología de Sistemas de la UCR (19 de abril brindados por de las Rivas y colaboradores Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1209 (Rivas et al., 2017), en un análisis de Latino- participación de la comunidad nacional (ver américa enfocado en publicaciones científicas sección Redes nacionales e internacionales). buscadas en Web of Science con tres palabras En la representación en nube de las pala- clave únicamente: bioinformatic, computatio- bras de los 255 títulos de publicaciones iden- nal biology o biological database. tificadas en Pubmed se observan los temas En la base de datos de IEEEXplore se más relevantes (Fig. 3). Entre ellos es clave la encontraron adicionalmente 22 publicaciones presencia de los estudios en venenos de ser- pientes; el estudio de bacterias de los géneros de conferencias que no se encuentran reportadas Brucella, Clostridium y Pseudomonas; estu- en PubMed o Web of Science. Estas publica- dios en cáncer, enfermedad bipolar y asma; ciones corresponden a los años 2014 (1), 2016 y aplicaciones en genética, genómica, micro- (4), 2017 (1), 2018 (12), 2019 (3) y 2020 (1). biomas y proteómica. En el 2018 se desarrolló la conferencia IWOBI Por otra parte, en las bases de datos en Costa Rica, por lo que hubo una importante de secuencias se muestra un comportamiento Fig. 2. Número de publicaciones científicas relacionadas a bioinformática desde el 2010 identificadas utilizando diversas palabras clave en las bases de datos PubMed y Web of Science. En estas publicaciones al menos un autor tiene afiliación de alguna institución de Costa Rica. Los datos del 2021 son los registrados hasta el 23 de abril. Fig. 2. Number of scientific publications related to bioinformatics since 2010 identified using various keywords in PubMed and Web of Science databases. In these publications, at least one author is affiliated with an institution in Costa Rica. Data for 2021 was obtained before April 23rd. 1210 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) Fig. 3. Nube de palabras de 255 títulos de publicaciones identificadas en PubMed. Fig. 3. Word cloud of 255 publication titles identified in PubMed. similar a las publicaciones, con una tendencia principalmente del proyecto PRJNA295247 (6 al incremento a partir del 2015 y los primeros 580 genomas). En segundo lugar, para el mismo registros en el 2011 (Fig. 4). Estos registros son período, se depositaron 1 350 metagenomas un reflejo de las actividades de investigación humanos, de los cuales 1 345 son del proyecto nacional, así como de colaboraciones interna- PRJNA623584. Estos mismos dos proyectos cionales en proyectos de investigación. En estas son los responsables del aumento observado en bases de datos es posible que haya secuencias el 2020 (5 919 records, Fig. 4) con un total de 3 no publicadas en artículos científicos, por lo 395 registros, más otros tres proyectos asocia- que es importante rescatar esta información. dos a biodiversidad ambiental (PRJEB42019 En la base de datos ENA se muestra un con 314 registros, PRJNA623020 con 582 total 1 662 registros de secuencias prove- registros y PRJNA530637 con 640 registros). nientes de Costa Rica, sin embargo, esto no En comparación con otros 18 países lati- significa que la institución que depositó los noamericanos, la contribución de Costa Rica datos sea costarricense. En detalle, del total de al registro público de datos de secuencias de secuencias solo 43 fueron depositadas por la nucleótidos es comparable a la de Colombia Universidad Nacional de Costa Rica y 4 por y Chile en el SRA (Fig. 5A) cuando se usan la Universidad de Costa Rica, es decir un 2.8 números absolutos, y es comparable a Nica- %. En una búsqueda similar realizada en el ragua y Bolivia según el ENA (Fig. 5A). Sin SRA se encontraron 15 297 registros desde el embargo, cuando se normaliza por millón de 2011 (Fig. 4). En este caso solo un 2.4 % de las habitantes en cada país (per cápita, tamaño de secuencias fueron depositadas por instituciones la población al 2021), se observa que la contri- costarricenses y corresponden a: 306 UCR, bución de Costa Rica es mayor que todos los 45 UNA, cinco del CENIBIOT, nueve de una países excepto Belice (Fig. 5B) y comparable a investigadora del ITCR y una del SENASA. la contribución de Panamá. En el SRA, el mayor número de regis- tros en este periodo 2010-2021 corresponde a Educación y entrenamiento: De los datos genomas humanos con 6 590 records (43 %), recolectados en el presente estudio, se observa Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1211 Fig. 4. Número de registros de Costa Rica en las bases de datos ENA y SRA buscados en el periodo 2010 hasta abril 2021. Los datos corresponden a secuencias provenientes de muestras de Costa Rica, pero solo una fracción fueron depositadas por instituciones nacionales. Fig. 4. Number of records for Costa Rica in the ENA and SRA databases for the period 2010 until April 2021. The sequences come from Costa Rican samples, but only a fraction was submitted by national institutions. que en los últimos cinco años se han dado de los cuales 12 abandonaron sus estudios de múltiples eventos positivos en el área de forma- posgrado por motivos personales o porque ción profesional, incluyendo la participación el posgrado no satisfizo sus expectativas en de estudiantes en programas nacionales de algunos cursos. De los 33 restantes sólo cuatro maestría y pregrado, y la formación local de se han graduado y el resto están realizando profesionales por medio de cursos presenciales tesis o llevando cursos (comunicación personal y virtuales en bioinformática. de la directora del programa). La respuesta a En el 2011, la Maestría en Bioinformática por qué la tasa de graduación es tan baja (12 y Biología de Sistemas (MBBS) fue creada %) requiere un análisis más profundo. Sin con el objetivo de proporcionar a la comuni- embargo, la dirección de la maestría menciona dad nacional recurso humano capacitado en varias circunstancias que les comunicaron los bioinformática, particularmente en aplicacio- estudiantes. Una de ellas es que, al ser una nes relacionadas a la salud humana. Desde maestría autofinanciada, los estudiantes deben entonces, 45 estudiantes han sido admitidos, trabajar para pagar sus estudios, lo que limita 1212 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) Fig. 5. Número de registros en las bases de datos ENA y SRA buscados por país y año (2010-2021). A. Clasificación de los países de América Latina según el número de registros totales encontrados en las bases de datos. B. Número de registros normalizados per cápita (por millón de habitantes en el 2020). Fig. 5. Number of records in the ENA and SRA databases searched by country and year (2010-2021). A. Classification of Latin American countries according to the number of total records found in the databases. B. Number of normalized records per capita (per million inhabitants for the year 2020). Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1213 su dedicación a la investigación y retrasa su entorno de salud pública de América Latina. avance. Otra razón es la dificultad de encontrar Hasta el momento, se han capacitado alrededor tutor y tema de tesis, especialmente si son estu- de 130 participantes del sector académico y de diantes ajenos al ambiente de la universidad. salud pública de América Latina. Esta oportu- Otro cambio positivo en los últimos cinco nidad también ha ayudado a los investigadores años es la oferta de clases de bioinformática costarricenses a avanzar en su trabajo colabora- básica para estudiantes de pregrado. Estas tivo, lo que resultó en múltiples publicaciones clases son ofrecidas por las Escuelas de Bio- (Alvarez et al., 2020; Baker et al., 2017; Chi- logía de la Universidad Nacional (UNA) y la nen et al., 2016; Quesada-Gómez et al., 2015; Universidad de Costa Rica (UCR), la Facultad Ramírez-Vargas et al., 2017; Suárez-Esquivel de Microbiología de la UCR y el programa de et al., 2017a; Suárez-Esquivel et al., 2017b; Ingeniería Biotecnológica del Instituto Tec- Suárez-Esquivel et al., 2020). nológico de Costa Rica (ITCR). Un producto La sociedad IEEE en Medicina y Biología indirecto de estas actividades es la creación (EMB) organizó varias actividades de forma- de la edición Costa Rica del Grupo Regional ción y un congreso en Biocomputación - el de Estudiantes de la Sociedad Internacional de IWOBI 2018 (http://iwobi.ulpgc.es/2018/). En Biología Computacional (ISCB-CR) en el 2018 este evento se brindó la oportunidad a los estu- (Shome et al., 2019). Esta formación básica en diantes nacionales (10 estudiantes de la MBBS) bioinformática tendrá implicaciones importan- para presentar sus resultados de investigación tes para las nuevas generaciones de científicos en un evento internacional, de lo cual también que combinan experimentos de laboratorio y se generaron doce publicaciones documentadas biología computacional en sus primeras etapas. en IEEEXplore. Las oportunidades de capacitación están Los cursos en línea también son una alter- aumentando tanto en la demanda como en la nativa, como ejemplo están los recursos de variedad de temas en comparación con infor- Train-online ofrecidos por EMBL-EBI (Labo- mes anteriores (Orozco et al., 2013). En los ratorio Europeo de Biología Molecular - Insti- últimos cinco años se impartieron más de 12 tuto Europeo de Bioinformática), los cursos de talleres presenciales en la UCR, capacitando a FutureLearn de Wellcome Genome Campus y más de 150 personas en temas como ensambla- Sanger Institute, cursos de Coursera o Harvard, je y anotación de genomas, análisis de genes y más recientemente los tutoriales de eLearning 16S con Mothur (Schloss et al., 2009) y QIIME del proyecto CABANA ofrecidos en inglés y (Caporaso et al., 2010), Python, R, GATK español para la comunidad Latinoamericana (McKenna et al., 2010) y COPASI (Hoops et (https://cabana.online/elearning). al., 2006). El CNCA, por su parte, tiene un por- tafolio de capacitación que incluye siete cursos Redes nacionales e internacionales: basados en Python, R, visualización, machine Durante los últimos siete años se crearon learning, programación y análisis de datos varias redes dentro de instituciones académicas (https://cnca.cenat.ac.cr/en/#intro). Otro ejem- (por ejemplo, Bio-SEA, Rigatrop, RedBioA- plo de gran impacto, es el curso internacional plicada, RICC) para promover la formación de sobre Genómica y Vigilancia Epidemiológica estudiantes y profesionales, así como brindar de Patógenos Bacterianos que se imparte anual- oportunidades de colaboración. Como ejemplo, mente desde el 2013. Este curso está patrocina- la RedBioAplicada de la UCR se enfoca en la do por el Wellcome Trust Advanced Courses investigación y educación en bioinformática en colaboración con socios de Costa Rica, y bioestadística. Actualmente con 118 miem- América Latina y el Reino Unido. Su objetivo bros (profesionales y estudiantes), coordinó es proporcionar capacitación en las habilidades cinco acciones formativas con colaboradores necesarias para generar e interpretar datos NGS nacionales e internacionales, y continúa pro- (Secuenciación de nueva generación) en un moviendo oportunidades de formación. Por 1214 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) otra parte, estudiantes de diversas instituciones Al menos, una profesora pasó seis meses en organizaron la edición ISCB-CR, abriendo EMBL-EBI (2018-2019) desarrollando cursos puertas de interacción con una de las socieda- de capacitación en línea (e-Learning), y tres des de biología computacional más grandes del profesores han participado en el curso Train- mundo (Shome et al., 2019). Las consecuencias the-trainer para diseñar e impartir capacitación de esta interacción pueden ser relevantes para en bioinformática en América Latina. Otros las nuevas generaciones en Costa Rica. dos profesores y un estudiante de maestría par- En el 2018 (La Gaceta Alcance N.36), ticiparon en capacitaciones internacionales en el Ministerio de Salud conformó el Consejo bioinformática en México, Chile y Colombia. Técnico en Bioinformática Clínica (CTBC) Actualmente, se están desarrollando proyectos con miembros de universidades, hospitales e regionales relacionados con la genómica de la instituciones nacionales (Ministerio de Salud, enfermedad de la roya en café, detección de 2021). Este es el único esfuerzo a nivel guber- diversidad genética en café y la genómica del namental para promover el uso de la bioin- SARS-CoV-2 en Latinoamérica, en los cuales formática en la salud. Parte de sus objetivos Costa Rica es un colaborador activo. Todo esto son promover el desarrollo tecnológico y la contribuirá al crecimiento de la comunidad innovación en salud; fomentar la investigación, investigadora de América Latina y Costa Rica. la actividad académica y la formación profe- sional; propiciar el desarrollo de aplicaciones Financiamiento para investigación: En genómicas, entre otras. Entre sus actividades el lado positivo, el número de las oportunidades más representativas se reporta la organización de financiamiento aumentaron en el país hasta de las Jornadas en Bioinformática Clínica en el 2019, así como el tamaño del aporte. Por los años 2019 y 2020, agrupando a múltiples profesionales y estudiantes reflejando el trabajo ejemplo, el Ministerio de Ciencia, Tecnología en este tema en el país. y Telecomunicaciones de Costa Rica (MICITT) A nivel internacional, Costa Rica ha for- y el Consejo de Investigaciones Científicas mado parte de colaboraciones con la región (CONICIT) han realizado convocatorias anua- Latinoamericana en grupos como la Sociedad les para proyectos de investigación en diversos Iberoamérica de Bioinformática (SoIBio) (de campos otorgando fondos desde US$18-80k. las Rivas et al., 2017) (http://www.soibio.org/ La UCR creó fondos mayores (US$12.5-50k) es) y la Red Centroamericana de Bioinformáti- para períodos más largos de ejecución que ca y Biocomputación Molecular (BioCANET) permitieron la inclusión de proyectos que invo- (https://www.biocanet.org/). En el 2017, entró lucran NGS y análisis de datos desde el 2017. en el consorcio CABANA (Capacitación en La Universidad Nacional (UNA) desde hace Bioinformática para América Latina, http:// más de 15 años ha otorgado fondos de inves- www.cabana.online/), para fortalecer la capaci- tigación a través del programa Fondos para el dad de investigación en bioinformática en toda Desarrollo Institucional Académico, otorgando América Latina, en tres áreas de desafío: enfer- actualmente hasta US$70k para proyectos a medades contagiosas, protección de la biodi- ejecutar en un período de dos años. versidad y producción sostenible de alimentos. En el lado negativo, desde el 2020 se ha CABANA está financiado por el Fondo dado una reducción del presupuesto de las de Investigación de Desafíos Globales (GCRF, universidades públicas (Castro, 2020) y del parte del Presupuesto de Ayuda del Reino MICITT (MICITT, 2020), lo que tendrá un Unido). Costa Rica, como parte del consor- impacto directo en la generación de ciencia y cio, está aprovechando esta oportunidad con por tanto en las investigaciones que apliquen la formación de profesores e investigadores a la bioinformática. Estas medidas responden al través de pasantías de investigación, progra- problema de la crisis fiscal y mecanismos del mas de formación para entrenadores y talleres. gobierno para reducir gastos. Adicionalmente, Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1215 la situación de la pandemia por el SARS-CoV-2 coordinador del clúster). Kabre, con todos sus vino a agravar la situación actual. recursos, sigue siendo inadecuado para algunos En contraste, las oportunidades de finan- programas que requieren una infraestructura y ciación internacional son más y de aporte requisitos de memoria particulares, por ejem- mayor. Existen fondos disponibles del NIH, plo, Galaxy, SMRT y COPASI. Otros recursos ICGEB, EMBO, BBSRC, GCRF, NSF, Cancer computacionales alojados en la UCR incluyen UK, Horizon Europe, la fundación NVIDIA, al menos siete clústeres en funcionamiento, sin Microsoft, Bill y Melinda Gates, entre otros. embargo, la mayoría de ellos solo son utiliza- En muchos de estos casos la colaboración dos por uno o un pequeño grupo de investiga- internacional es esencial, así como demostrar dores, y el uso es en general muy bajo. experiencia en la propuesta que se plantea. La computación en la nube es otra alter- nativa que incluye servicios de Amazon AWS, Infraestructura para la investigación: Microsoft Azure y Google Cloud, entre otros. Dos aspectos importantes de la investigación Sin embargo, no es una opción prioritaria por bioinformática son: i) la infraestructura donde la comunidad de investigadores, debido a limi- se generan y almacenan los datos y ii) la taciones presupuestarias, falta de conocimiento infraestructura para el análisis de datos. En y/o experiencia para su implementación. el 2015, se compró el primer instrumento MiSeq en el país con fines académicos; éste Regulación ética: La bioinformática se se encuentra en el CIBCM-UCR. Actualmente, vincula directamente con aspectos éticos prin- hay siete secuenciadores Illumina instalados en cipalmente desde dos perspectivas: derechos el país en diversas instituciones para la vigilan- de autor y la gestión de datos biológicos. En cia epidemiológica, investigación, diagnóstico Costa Rica, ambos aspectos están incorporados genético y análisis forense. Estas instituciones como parte de diferentes leyes, que a su vez son: CIBCM-UCR, CIHATA-UCR, SENASA, responden a iniciativas globales para asegurar INCIENSA, Poder Judicial, Hospital Nacio- las mejores prácticas éticas. nal de Niños y el Laboratorio de Docencia Respecto a derechos de autor en bioin- en Cáncer-UCR (acá está el único NextSeq). formática, algunos autores separan las regula- A pesar de tener una infraestructura abun- ciones en función de tres dimensiones: (i) las dante con respecto al tamaño de la población secuencias de moléculas, (ii) las bases de datos costarricense, estos equipos en su mayoría y (iii) el software y el hardware (McBride, están subutilizados. 2002; Shilpa, 2018). En nuestro país, la Ley Los recursos computacionales son limi- N° 6 683 sobre Derechos de Autor y Derechos tados pero eficientes y gratuitos. El CNCA es Conexos es la que regula estos aspectos, en un el principal laboratorio computacional finan- marco que aplica los derechos patrimoniales y ciado por el CONARE (Consejo Nacional de morales a obras del campo literario, científico Rectores) que brinda servicios de computación y artístico, que incluiría indirectamente la pro- a investigadores de todas las universidades ducción en bioinformática. públicas del país. Su clúster computacional Respecto a la gestión de datos biológicos llamado Kabre, tiene 46 nodos (32 de simu- (recolección o generación, análisis, interpre- lación, 2 de bioinformática, 6 de aprendizaje tación y uso), éstos son un eje fundamental en máquina y 6 de ciencias de datos). El RAM bioinformática. La evolución que ha tenido la de los mismos está entre 16-1 024 GB. Los bioinformática no sería posible sin las estrate- dos nodos de bioinformática tienen 36 núcleos gias para proveer la gestión de datos masivos (2 hilos por núcleo) de 3 GHz y 1 024 GB (Elissa et al., 2020), y por tanto, las regulacio- de RAM (https://kabre.cenat.ac.cr/userguide/). nes del uso de datos, en este caso biológicos, Aproximadamente, 195 de 427 usuarios traba- son también aplicables a la bioinformática. A jan en aplicaciones bioinformáticas (dato del nivel global existe un escenario ético amplio de 1216 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) discusión y regulación que involucra diferentes papel del CTBC del Ministerio de Salud será niveles de protección de los datos, los indivi- relevante en este tema en los años venideros. duos y los estudios científicos. Esta protección se enmarca en la Declaración Universal de DISCUSIÓN Derechos Humanos, la Declaración Universal sobre el Genoma Humano y los Derechos Este trabajo recaba evidencia de algu- Humanos, la Declaración Universal de los nos componentes para medir el avance de la Derechos del Animal, entre otros. En Costa bioinformática en Costa Rica, que van desde Rica, la protección de los datos personales y la visión de la comunidad científica, la infraes- datos genómicos se ejerce bajo las leyes nacio- tructura disponible y el acceso al financiamien- nales Ley N° 5 395 General de Salud, Ley N° 8 to (Fig. 1). Estos mismos componentes son 968 de Protección de la Persona Frente al Tra- referencia para definir acciones que impulsen tamiento de sus Datos Personales, y el Regla- el fortalecimiento de esta disciplina. mento del Registro de Datos de Perfiles de La búsqueda de publicaciones científicas y ADN para Identificación Humana, entre otras secuencias en bases de datos arrojó resultados leyes y reglamentos conexos. Estos mismos que indican que la contribución del país ha ido aplican para la investigación con seres huma- en aumento a lo largo de los años. La razón de nos, junto con la regulación específica dada por este aumento requiere un análisis detallado que la Ley N° 9 234 Reguladora de Investigación integre información de las fuentes de financia- Biomédica, y otros acuerdos internacionales. miento y colaboraciones en los artículos. Esto Finalmente, estudios científicos en animales permitiría determinar si los fondos nacionales y recursos de la biodiversidad están regulados o internacionales han impulsado este progreso. bajo la Ley N° 7 451 Ley de Bienestar de los Lo que sí fue evidente es que los organismos Animales y la Ley N° 7 788 de Biodiversidad, más estudiados en términos de secuencias respectivamente, entre otras regulaciones. depositadas son los humanos con 6 590 geno- Así, la gestión de datos biológicos para mas y 1 350 metagenomas depositados (51.9 % su uso en bioinformática implica una serie de del total), y un 10 % de metagenomas ambien- consideraciones que indirectamente han sido ya tales diversos, según el SRA. Sería importante incluidas en la regulación actual en el manejo medir el impacto de estas investigaciones en el de la información de las personas, el uso de ani- ambiente nacional como un ejemplo a futuro. Al poner en perspectiva la contribución males y recursos de la biodiversidad en Costa en número de secuencias de Costa Rica con la Rica. Sin embargo, algunas de estas leyes y región Latinoamericana, es evidente la activi- reglamentos responden a una generalidad que dad científica que se está realizando. Sin embar- no siempre es aplicable al caso de la bioinfor- go, al evaluar las instituciones que depositan mática, siendo una situación que se presenta en las secuencias, más de un 97 % corresponde el resto del mundo (Elissa et al., 2020). a instituciones internacionales. La explicación En 2020 Costa Rica ha iniciado su partici- de esto requiere un análisis más profundo, para pación en el “Genomic Data Policy Framework determinar la razón por la cual información de and Ethical Tensions”, que busca resaltar la organismos costarricenses aparece depositada necesidad de políticas y legislación en el tema por instituciones internacionales restando visi- de la genómica con consideraciones éticas bilidad a la comunidad científica nacional. para los responsables políticos, los líderes Del análisis de los títulos de las publicacio- empresariales, investigadores, pacientes y otros nes científicas se pueden identificar las áreas de al tomar acciones que afecten o involucren impacto de estas contribuciones. En este caso la recolección y el uso de datos genéticos y fue evidente que los venenos de serpientes, genómicos humanos para investigación y uso Clostridium, Pseudomonas, Brucella, asma, clínico masivos (Elissa et al., 2020). Quizás el enfermedad bipolar, entre otros, predominaron Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1217 en la nube de palabras. Sin embargo, un análisis estudiando o trabajando en el exterior (http:// que integre esta información con los nombres ticotal.cr/conozca-acerca-de-ticotal.html#) y de de los autores nacionales, los colaboradores la base de datos HIPATIA (https://hipatia.cr/ y las fuentes de financiamiento enriquecería dashboard/diaspora-cientifica). la discusión al permitir determinar el impacto Adicionalmente, algo que sí permanece es agregado para la comunidad nacional (traba- la falta de oportunidades laborales especiali- jo en progreso). Otro aspecto que se podría zadas en análisis de datos biológicos. Esto en derivar del análisis de las publicaciones es el parte, dificulta la adopción rápida de esta cien- número de profesionales trabajando en bioin- cia en instituciones que la podrían estar aplican- formática en el país, que actualmente es supe- do (por ejemplo, el sistema de salud nacional). rior a los 40 (conteo informal realizado en este Otra evidencia del avance de la bioin- trabajo). formática es la creación de redes nacionales En el tema de educación y comunidad, y la integración de Costa Rica a redes inter- hace 13 años, Moreno y colaboradores (More- nacionales. El impacto se ha observado en la no et al., 2008) presentaron un ensayo sobre la coordinación de cursos de capacitación y desa- contribución científica de Costa Rica a la biolo- rrollo de colaboraciones para investigación. gía computacional tomando como ejemplo tres Esto reduce la anterior conceptualización de la institutos de investigación de renombre nacio- bioinformática como una herramienta que era nal: el Instituto Clodomiro Picado, el INBio - usada como parte de un tema médico-biológico Instituto Nacional de Biodiversidad, cerrado en central (el cual sigue siendo vigente en muchos 2015) y el PIET - Programa de Investigación en casos), pero que también puede ser desarrolla- Enfermedades Tropicales. En aquel entonces, da como una entidad central en investigación. las carreras científicas en las universidades Esto es, una visión de investigación en “bioin- públicas ignoraban los cursos computacionales, formática pura”. lo que obstaculizaba el interés de las nuevas En el tema de infraestructura se evidenció generaciones por la biología computacional. el incremento de la capacidad de secuencia- Adicionalmente, se mencionaba el efecto de la ción nacional. Si bien esto podría representar “fuga de cerebros”, donde profesionales egre- un gran avance y una gran oportunidad, el sados en el extranjero no regresaban al país impacto de esta iniciativa se ve contrarrestado debido a las limitadas y menos competitivas por tres situaciones. Una es la falta de alterna- oportunidades laborales. Sin embargo, este tivas comerciales a los kits de preparación de efecto se desmitificó en un ensayo de Moreno bibliotecas de Illumina en el país. Aunque en (2014) y en el análisis actual del Programa el 2020 se empezó a ofertar la química Collibri Estado de la Nación reportados en la base de (Thermo Fisher). En segundo lugar, está el datos HIPATIA (https://hipatia.cr/dashboard/ alto costo de los reactivos de secuenciación, diaspora-cientifica), que involucra un análisis encarecidos en gran manera (~25 %) debido a de todas las áreas de la ciencia, tecnología e los costos de importación. En tercer lugar, la innovación. carga de secuenciación es reducida lo que hace En este trabajo se muestra un contraste que el costo de cada muestra sea mayor, como con esta perspectiva luego de más de 10 años, consecuencia esto reduce la competitividad siendo dos logros positivos el incluir cursos de respecto a otras empresas que brindan servicios bioinformática a nivel de pregrado y la crea- de secuenciación (ej. Psomagen o Novogene). ción de la MBBS. Sin embargo, no se cuantifi- Todo esto conduce a una producción de datos có el regreso de profesionales luego de concluir ineficiente, que es una de las razones por la que sus estudios en el exterior que podría ser un muchos de los instrumentos Illumina en Costa dato relevante para la comunidad en bioinfor- Rica están subutilizados (datos no mostrados). mática. Este dato se podría obtener en parte de Muchos científicos prefieren enviar sus mues- la base de datos Ticotal de talento costarricense tras al extranjero para secuenciar, resolviendo 1218 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) el problema del tiempo y los costos. A pesar de (Scheneegans et al., 2021). A pesar de estas estas limitaciones, algunos investigadores aún situaciones circunstanciales, se recomienda a secuencian en las instalaciones locales para futuro ajustar el uso de los fondos para que tener control sobre la contaminación, con fines incluyan componentes esenciales para la inves- didácticos, e incluso para estimular la adopción tigación en bioinformática y biología compu- de estas tecnologías en el país (datos persona- tacional y para la transición posterior, a decir: les). Este tema requiere también un análisis más detallado para determinar las oportunida- 1. La compra de equipos computacionales o des a futuro que brinda tener tanta capacidad pago de servicios en la nube, además de la de secuenciación en el país. compra de reactivos o servicios. La capacidad computacional nacional para 2. La contratación de analistas de datos análisis de datos si bien es gratuita y suficiente bioinformáticos. Que bien podría ser un para la mayoría de aplicaciones, no es una estudiante que está haciendo su tesis de limitante para el desarrollo de la bioinformáti- maestría. ca. Existen múltiples recursos en la nube y en 3. Diseñar una estrategia para retener al ana- redes como RedCLARA/SCALAC (Sistema lista de datos (comúnmente un estudiante) de Cómputo Avanzado para América Latina y en la universidad o institución. el Caribe, https://scalac.redclara.net/index.php/ 4. Desarrollar fondos de becas para can- es/) de las cuales Costa Rica forma parte. Sin didatos de maestría/doctorado a tiempo embargo, se debe considerar que en algunos completo para que estudien en el país. casos estos recursos externos requieren finan- Esto reduciría el problema del estudiante ciamiento adicional, recurso humano dedicado o colaborador de dividir su tiempo entre y habilidades que se deben desarrollar. Esta es investigación, trabajo y responsabilidades una dificultad que se analizará en otro estudio. personales. Y al mismo tiempo aportaría al Finalmente, entre los aspectos que mos- desarrollo de la comunidad de expertos. traron avance está la regulación ética para 5. Evaluar el efecto del cambio de colones a investigación biomédica y el manejo de datos dólares, que tiende al alza. Esto tiene un sensibles. Este aspecto es fundamental para la impacto en la adquisición de insumos de implementación de tecnologías aplicadas a la investigación que se pagan principalmente salud humana como lo son la secuenciación de en dólares. genomas o exomas de pacientes. Sin embargo, la legislación en cuanto a manejo de material Otra oportunidad siempre presente es genético no humano, llámese muestras ambien- obtener financiamiento internacional, lo que tales, animales, plantas, con potencial bioeco- requiere equipos sólidos, interdisciplinarios, nómico aún son muy complejas de resolver en con apoyo administrativo a nivel institucional el ambiente nacional. para que el proceso sea eficiente. Esto ha sido Uno de los aspectos preocupantes anali- logrado por pocos grupos de investigación en zados en este trabajo es la financiación nacio- el país. nal, pero este no es un asunto nuevo pues fue Considerando el panorama presentado en presentado por Moreno et al. (Moreno et al., este trabajo, visualizamos un mayor desarrollo 2008). En Costa Rica solo el 0.46 % del PIB de la bioinformática en Costa Rica en los próxi- se destina a actividades de investigación y mos 10 años. Para promover este desarrollo, desarrollo, como se reveló en el 2017 (Mora, proponemos cinco acciones directas resumidas 2017). Además, los efectos de la pandemia y la en la Fig. 1. crisis fiscal vienen a agravar el aspecto finan- Primero, se necesita estimular la consoli- ciero. Aunque es bien sabido que la ciencia dación de grupos de investigación en el país acelera el desarrollo económico de una nación que utilicen la bioinformática como herra- muchos gobiernos no priorizan en este campo mienta para responder las preguntas científicas Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1219 relevantes en el contexto nacional o internacio- La bioinformática en Costa Rica ha expe- nal. Esta consolidación podría estimularse den- rimentado una evolución significativa a lo tro de la academia, incluidos los estudiantes de largo de más de 10 años. Esto se observó en la MBBS, exbecarios que regresan al país, pro- el aumento progresivo anual de publicaciones, moviendo la conexión con la industria y otras la cantidad de personas capacitadas en el país, instituciones gubernamentales. En este sentido, la creación de la MBBS y de diversas redes, es necesaria una estrategia a nivel CONARE el acceso a infraestructura computacional y que permita ubicar a los exbecarios en grupos el desarrollo de un marco bioético que regula afines a su disciplina, evitando la duplicidad de la investigación en genómica. Todos estos oferta académica en el país y contribuyendo a eventos positivos han tenido un impacto en la la generación de grupos colaborativos cada vez investigación. El efecto se ha ampliado al tra- mayores, mejor organizados y multidisciplina- bajo de laboratorios gubernamentales que han rios. Actualmente, los grupos son escasos, pero adoptado tecnologías NGS para abordar casos a medida que la comunidad de investigadores forenses, en la detección de patógenos y para crece, también aumentan los intereses comunes vigilancia epidemiológica. y las colaboraciones duraderas. Esta evolución se ha dado en parte por las En segundo lugar, es claro que hoy en día colaboraciones en redes nacionales e interna- los fondos para investigación son adjudicados cionales, el trabajo de personal capacitado para prioritariamente a grupos o redes de investiga- liderar investigación en bioinformática, y el ción, más allá de individuos o instituciones. La acceso a fondos de financiamiento sustanciales consolidación de una red nacional o comunidad para realizar los procesos de secuenciación que interactúa a distintos niveles epistémi- masiva. En algunos casos la evolución se ha cos aumentaría las probabilidades de obtener dado por la necesidad imperante de aplicar recursos para apoyar proyectos de bioinformá- estas tecnologías para la sociedad, como es el tica, incluyendo la contratación de estudiantes caso de la vigilancia epidemiológica genómica. Debido a que este progreso recae prin- graduados y/o investigadores postdoctorales cipalmente en las personas capacitadas en colaborando en proyectos extendidos. bioinformática, es necesario seguir brindando En tercer lugar, a medida que se aprue- oportunidades a las nuevas generaciones. Sin ben las solicitudes por fondos, algunas polí- embargo, también se deben generar nuevos ticas y protocolos de administración dentro empleos dentro del país, incluidas oportuni- de las universidades, se debe coadyuvar para dades como puestos de posgrado, investigador cambiar y mejorar el sistema de contrata- postdoctoral, analista de datos o asistente de ción de recurso humano, incluyendo puestos investigación financiados con subvenciones como asistentes de investigación en bioinfor- nacionales o internacionales. En consecuencia, mática o analistas de datos, pagados por entes estos esfuerzos tendrán un efecto en el tamaño, financiadores externos. la solidez y la experiencia de la comunidad, que Cuarto, la integración activa con socie- a su vez tendrá un mayor potencial para obtener dades internacionales como ISCB, SoIBio o financiamiento de investigación. Nuestra expe- BioCANET, permitirá potenciar los recursos riencia representa una oportunidad para apoyar humanos y promover la investigación nacional. a la región centroamericana con capacitaciones Una consecuencia directa será un aumento y colaboraciones. en el número de publicaciones, como quinta Entre los esfuerzos actuales en bioinfor- acción. Este aumento de publicaciones expon- mática se incluyen los estudios del microbioma drá la ciencia costarricense que podrá atraer infantil y la transcriptómica de la enfermedad más financiamiento internacional. En conjunto, periodontal con fondos administrados por la esto tendrá un impacto positivo en la economía Universidad de Costa Rica; la secuenciación y en la sociedad en general. completa del genoma de ~180 miembros de 1220 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) familias que viven en Costa Rica diagnosticadas y que han hecho aportes que justifican su auto- con esquizofrenia o trastorno bipolar (Carmiol ría; que no hay conflicto de interés de ningún et al., 2014; Glahn et al., 2019); la contribución tipo; y que han cumplido con todos los requi- a las bases de datos internacionales de genomas sitos y procedimientos éticos y legales perti- de patógenos circulantes locales como parte de nentes. Todas las fuentes de financiamiento las redes PULSE NET, RELAVRA y OPS; y se detallan plena y claramente en la sección más recientemente, el estudio de la genómica de agradecimientos. El respectivo documento del SARS-CoV-2 (Molina-Mora et al., 2021) legal firmado se encuentra en los archivos de y la contribución a bases de datos mundiales la revista. como Nextstrain (https://nextstrain.org/ncov/ gisaid/global). AGRADECIMIENTOS A futuro, se pueden formular proyectos de resecuenciación más grandes de impor- Agradecemos el apoyo de la Universidad tancia para la población humana similares al de Costa Rica para la creación de la Red- UK10K (Kaye et al., 2014). Costa Rica es BioAplicada que realizó esta investigación una de las pocas poblaciones humanas con un a través del financiamiento 801-B6-767. Se registro genealógico detallado desde el siglo agradece a Cath Brooksbank, Ian Willis, Pira- XVI (Meléndez-Obando, 2004), y en la región veen Gopalasingam y Edgardo Moreno por sus se han localizado temas de gran interés (por contribuciones y comentarios al artículo. Tam- ejemplo, la zona azul de longevidad en Nicoya bién se agradece a las personas que aportaron (Rosero-Bixby et al., 2013). Costa Rica tiene información por medio de entrevistas para la aproximadamente más del 5 % de la biodi- realización de esta investigación incluyendo versidad mundial que puede protegerse con el Mariela Arias y Federico Muñoz de la UCR, y uso de información genómica. Otros proyectos Jean Carlo Umaña del CNCA. relevantes para el país podrían ser proyectos financiados por la misma población similares a los proyectos microbioma intestinal estadouni- RESUMEN dense o británico (McDonald et al., 2018), una Introducción: La disciplina científica de la bioinformática forma de ciencia ciudadana donde las personas tiene el potencial de generar aplicaciones innovadoras para brindan voluntariamente muestras y apoyan las sociedades humanas. Costa Rica, pequeña en tamaño financieramente la investigación, contribuyen- y población en comparación con otros países de América Latina, ha ido adoptando la disciplina de manera progre- do en última instancia a la comprensión de la siva. El reconocer los avances permite determinar hacia salud humana. La aplicación de la medicina de dónde puede dirigirse el país en este campo, así como su precisión podría ser guiada siguiendo la expe- contribución a la región latinoamericana. riencia de proyectos pioneros como Genomics Objetivo: En este manuscrito se reporta evidencia de la England del Departamento de Salud del Reino evolución de la bioinformática en Costa Rica, para identi- ficar debilidades y fortalezas que permitan definir acciones Unido entre otros (Stark et al., 2019). a futuro. Para que este tipo de proyectos se desarro- Métodos: Se realizaron búsquedas en bases de datos de llen, primero deben ocurrir otros cambios polí- publicaciones científicas y repositorios de secuencias, así ticos y administrativos en Costa Rica. Dentro como información de actividades de capacitación, redes, de diez años, esperamos que estos cambios y infraestructura, páginas web y fuentes de financiamiento. Resultados: Se observan avances importantes desde el esfuerzos permitan desarrollar una comunidad 2010, incluyendo un aumento en oportunidades de entre- científica sólida donde la investigación brinde namiento y número de publicaciones, aportes significativos oportunidades para mejorar la vida, proteger el a las bases de datos de secuencias y conexiones por medio medio ambiente y estimular la economía. de redes. Sin embargo, ciertas áreas, como la masa crítica y la financiación requieren más desarrollo. La comunidad científica y sus patrocinadores deben promover la investi- Declaración de ética: los autores declaran gación basada en bioinformática, invertir en la formación que todos están de acuerdo con esta publicación de estudiantes de posgrado, aumentar la formación de Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1221 profesionales, crear oportunidades laborales para carreras Carmiol, N., Peralta, J. M., Almasy, L., Contreras, J., en bioinformática y promover colaboraciones internacio- Pacheco, A., Escamilla, M. A., Knowles, E. E. M., nales a través de redes. Raventós, H., & Glahn, D. C. (2014). Shared genetic Conclusiones: Se sugiere que para experimentar los bene- factors influence risk for bipolar disorder and alcohol ficios de las aplicaciones de la bioinformática se deben use disorders. European Psychiatry, 29(5), 282–287. fortalecer tres aspectos clave: la comunidad científica, la https://doi.org/10.1016/j.eurpsy.2013.10.001 infraestructura de investigación y las oportunidades de Castro, A. M. (20 octubre, 2020). Recorte de 53 000 financiamiento. El impacto de tal inversión sería el desarro- millones de colones al presupuesto de las universi- llo de proyectos ambiciosos pero factibles y colaboraciones dades públicas afectaría seriamente la operación de extendidas dentro de la región latinoamericana. Esto per- la UCR. https://www.ucr.ac.cr/noticias/2020/10/20/ mitiría realizar contribuciones significativas para abordar recorte-de-53-000-millones-de-colones-al-presu- los desafíos globales y la aplicación de nuevos enfoques de puesto-de-las-universidades-publicas-afectaria-seria- investigación, innovación y transferencia de conocimiento mente-la-operacion-de-la-ucr.html para el desarrollo de la economía, dentro de un marco de ética de la investigación. CBOL Plant Working Group. (2009). A DNA barcode for land plants. Proceedings of the National Aca- demy of Sciences of the United States of Ameri- Palabras clave: análisis de datos; NGS (Secuenciación ca, 106(31), 12794–12797. https://doi.org/10.1073/ de Nueva Generación); educación; Web of Science; SRA pnas.0905845106 (Sequence Read Archive); PubMed; ENA (European Nucleotide Archive). Chinen, I., Galas, M., Tuduri, E., Vinas, M. R., Carbonari, C., Gaspera, A. D., Napoli, D., Aanensen, D. M., Argimon, S., Thomson, N. R., Hughes, D., Baker, REFERENCIAS S., Guzmán-Verri, C., Holden, M. T., Abdala, A. M., Alvarez, L. P., Alvez, B., Barros, R., Budall, S., … Alvarez, L. P., Ruiz-Villalobos, N., Suárez-Esquivel, M., Campos, J. (2016). Whole genome sequencing iden- Thomson, N. R., Marcellino, R., Víquez-Ruiz, E., tifies independent outbreaks of Shigellosis in 2010 Robles, C. A., & Guzmán-Verri, C. (2020). Mole- and 2011 in La Pampa Province, Argentina. BioRxiv, cular characterization of Brucella ovis in Argentina. 049940. Veterinary Microbiology, 245, 108703. https://doi. org/10.1016/j.vetmic.2020.108703 Coutinho, F. H., Gregoracci, G. B., Walter, J. M., Thomp- son, C. C., & Thompson, F. L. (2018). Metagenomics Baker, K. S., Campos, J., Pichel, M., Gaspera, A. D., Duar- Sheds Light on the Ecology of Marine Microbes te-Martínez, F., Campos-Chacón, E., Bolaños-Acuña, and Their Viruses. Trends in Microbiology, 26(11), H. M., Guzmán-Verri, C., Mather, A. E., Velasco, S. 955–965. https://doi.org/10.1016/j.tim.2018.05.015 D., Rojas, M. L. Z., Forbester, J. L., Connor, T. R., Keddy, K. H., Smith, A. M., Delgado, E. A. L. de, Elissa, P., Cameron, F., & Forum, W. E. (2020). Genomic Angiolillo, G., Cuaical, N., Fernández, J., … Thom- Data Policy Framework and Ethical Tensions. http:// son, N. R. (2017). Whole genome sequencing of www3.weforum.org/docs/WEF_Genomic_Data_ Shigella sonnei through PulseNet Latin America and Policy_and_Ethics_Framework_pages_2020.pdf Caribbean: advancing global surveillance of foodbor- ne illnesses. Clinical Microbiology and Infection: The Gardy, J. L., & Loman, N. J. (2017). Towards a genomics- Official Publication of the European Society of Cli- informed, real-time, global pathogen surveillance nical Microbiology and Infectious Diseases, 23(11), system. Nature Review Genetics, 19(1), 9–20. https:// 845–853. https://doi.org/10.1016/j.cmi.2017.03.021 doi.org/10.1038/nrg.2017.88 Campos-Sánchez, R., Raventós, H., & Barrantes, R. Glahn, D. C., Nimgaonkar, V. L., Raventós, H., Contreras, (2013). Ancestry informative markers clarify the J., McIntosh, A. M., Thomson, P. A., Jablensky, A., regional admixture variation in the Costa Rican McCarthy, N. S., Charlesworth, J. C., Blackburn, N. population. Human Biology, 85(5), 721–740. https:// B., Peralta, J. M., Knowles, E. E. M., Mathias, S. R., doi.org/10.3378/027.085.0505 Ament, S. A., McMahon, F. J., Gur, R. C., Bucan, M., Curran, J. E., Almasy, L., … Blangero, J. (2019). Caporaso, J. G., Kuczynski, J., Stombaugh, J., Bittinger, Rediscovering the value of families for psychia- K., Bushman, F. D., Costello, E. K., Fierer, N., Peña, tric genetics research. Molecular Psychiatry, 24(4), A. G., Goodrich, J. K., Gordon, J. I., Huttley, G. A., 523–535. https://doi.org/10.1038/s41380-018-0073-x Kelley, S. T., Knights, D., Koenig, J. E., Ley, R. E., Lozupone, C. A., McDonald, D., Muegge, B. D., Hoops, S., Sahle, S., Gauges, R., Lee, C., Pahle, J., Simus, Pirrung, M., … Knight, R. (2010). QIIME allows N., Singhal, M., Xu, L., Mendes, P., & Kummer, U. analysis of high-throughput community sequencing (2006). COPASI—a COmplex PAthway SImula- data. Nature Methods, 7(5), 335–336. https://doi. tor. Bioinformatics, 22(24), 3067–3074. https://doi. org/10.1038/nmeth.f.303 org/10.1093/bioinformatics/btl485 1222 Revista de Biología Tropical, ISSN: 2215-2075 Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) Kaye, J., Hurles, M., Griffin, H., Grewal, J., Bobrow, M., recortes-el-presupuesto-del-micitt-afectarian-su-ope- Timpson, N., Smee, C., Bolton, P., Durbin, R., Dyke, racion-y-los-programas-que-benefician S., FitzPatrick, D., Kennedy, K., Kent, A., Muddy- man, D., Muntoni, F., Raymond, L. F., Semple, R., Ministerio de Salud. (2021). Consejo Técnico en Bioin- & Spector, T. (2014). Managing clinically significant formática Clínica. Consejo Técnico en Bioinfor- findings in research: the UK10K example. Euro- mática Clínica. https://www.ministeriodesalud.go.cr/ pean Journal of Human Genetics, 22(9), 1100–1104. index.php/investigacion-y-tecnologia-en-salud/ https://doi.org/10.1038/ejhg.2013.290 vida-saludable Kyriakidis, N. C., López-Cortés, A., González, E. V., Gri- Molina-Mora, J. A., Cordero-Laurent, E., Godínez, A., maldos, A. B., & Prado, E. O. (2021). SARS-CoV-2 Calderón-Osorno, M., Brenes, H., Soto-Garita, vaccines strategies: a comprehensive review of phase C., Pérez-Corrales, C., COINGESA-CR, Drexler, 3 candidates. Npj Vaccines, 6(1), 28. https://doi. J. F., Moreira-Soto, A., Corrales-Aguilar, E., & org/10.1038/s41541-021-00292-w Duarte-Martínez, F. (2021). SARS-CoV-2 geno- mic surveillance in Costa Rica: Evidence of a Lomonte, B., & Calvete, J. J. (2017). Strategies in “snake divergent population and an increased detection venomics” aiming at an integrative view of composi- of a spike T1117I mutation. Infection, Genetics tional, functional, and immunological characteristics and Evolution, 104872. https://doi.org/10.1016/j. of venoms. The Journal of Venomous Animals and meegid.2021.104872 Toxins Including Tropical Diseases, 23(1), 26–12. https://doi.org/10.1186/s40409-017-0117-8 Mora, W. (12 diciembre, 2017). Disminuye inversión en I+D en Costa Rica. http://www.conicit.go.cr/tra- Lomonte, B., Fernández, J., Sanz, L., Angulo, Y., Sasa, M., mites/rct/reporte_rct/anteriores/ReporteRCT-dic-17. Gutiérrez, J. M., & Calvete, J. J. (2014). Venomous aspx snakes of Costa Rica: Biological and medical impli- cations of their venom proteomic profiles analyzed Moreno, E. (28 setiembre, 2014). Los cerebros se fugan through the strategy of snake venomics. Journal of dentro de Costa Rica. La Nación. https://www.nacion. Proteomics, 105, 323–339. https://doi.org/10.1016/j. com/viva/cultura/los-cerebros-se-fugan-dentro-de- jprot.2014.02.020 costa-rica/GZVXK6K4CFD4DEK2AELAITEFVE/ story McBride, M. S. (2002). Bioinformatics and Intellec- tual Property Protection. Berkeley Technology Law Moreno, E., Lomonte, B., & Gutiérrez, J. M. (2008). Com- Journal, 17(4), 1331–1364. http://www.jstor.org/ putational Biology in Costa Rica: The Role of a Small stable/24116745 Country in the Global Context of Bioinformatics. Plos Computational Biology, 4(3), e1000040. https:// McDonald, D., Hyde, E., Debelius, J. W., Morton, J. doi.org/10.1371/journal.pcbi.1000040.g001 T., Gonzalez, A., Ackermann, G., Aksenov, A. A., Behsaz, B., Brennan, C., Chen, Y., Goldasich, L. D., Orozco, A., Morera, J., Jiménez, S., & Boza, R. (2013). Dorrestein, P. C., Dunn, R. R., Fahimipour, A. K., A review of Bioinformatics training applied to Gaffney, J., Gilbert, J. A., Gogul, G., Green, J. L., research in Molecular Medicine, Agriculture and Hugenholtz, P., … Gunderson, B. (2018). American Biodiversity in Costa Rica and Central America. Gut: an Open Platform for Citizen Science Microbio- Briefings in Bioinformatics, 14(5), 661–670. https:// me Research. MSystems, 3(3), e00031–18. https://doi. doi.org/10.1093/bib/bbt033 org/10.1128/msystems.00031-18 Quesada-Gómez, C., López-Ureña, D., Acuña-Amador, L., McKenna, A., Hanna, M., Banks, E., Sivachenko, A., Villalobos-Zúñiga, M., Du, T., Freire, R., Guzmán- Cibulskis, K., Kernytsky, A., Garimella, K., Alts- Verri, C., Gamboa-Coronado, M. del M., Lawley, huler, D., Gabriel, S., Daly, M., & DePristo, M. A. T. D., Moreno, E., Mulvey, M. R., Brito, G. A. (2010). The Genome Analysis Toolkit: a MapRedu- de C., Rodríguez-Cavallini, E., Rodríguez, C., & ce framework for analyzing next-generation DNA Chaves-Olarte, E. (2015). Emergence of an outbreak- sequencing data. Genome Research, 20(9), 1297– associated Clostridium difficile variant with increased 1303. https://doi.org/10.1101/gr.107524.110 virulence. Journal of Clinical Microbiology, 53(4), 1216–1226. https://doi.org/10.1128/jcm.03058-14 Meléndez-Obando, M. O. (2004). Importancia de la genealogía aplicada a estudios genéticos en Costa Ramírez-Vargas, G., Quesada-Gómez, C., Acuña-Amador, Rica. Revista de Biología Tropical, 52(3), 423– L., López-Ureña, D., Murillo, T., Gamboa-Coro- 450. http://www.scielo.sa.cr/scielo.php?script=sci_ nado, M. del M., Chaves-Olarte, E., Thomson, N., arttext&pid=S0034-77442004000300005&lng=en& Rodríguez-Cavallini, E., & Rodríguez, C. (2017). A nrm=iso Clostridium difficile Lineage Endemic to Costa Rican Hospitals Is Multidrug Resistant by Acquisition of MICITT. (20 octubre, 2020). Recortes en el presu- Chromosomal Mutations and Novel Mobile Gene- puesto del MICITT afectarían su operación tic Elements. Antimicrobial Agents and Chemothe- y los programas que benefician a los habitantes rapy, 61(4), e02054–16. https://doi.org/10.1128/ de todo el país. https://www.micit.go.cr/noticias/ aac.02054-16 Revista de Biología Tropical, ISSN: 2215-2075, Vol. 69(4): 1204-1223, October-December 2021 (Published Nov. 25, 2021) 1223 Razzouk, S. (2018). CRISPR-Cas9: A cornerstone for the 5(1), 153. https://doi.org/10.1093/bioinformatics/ evolution of precision medicine. Annals of Human btr381 Genetics, 82(6), 331–357. https://doi.org/10.1182/ blood-2010-12-328161 Shome, S., Parra, R. G., Fatima, N., Monzon, A. M., Cuypers, B., Moosa, Y., Coimbra, N. D. R., Assis, J., De las Rivas, J., Bonavides-Martínez, C., & Campos-Labo- Giner-Delgado, C., Dönertaş, H. M., Cuesta-Astroz, rie, F. J. (2017). Bioinformatics in Latin America Y., Saarunya, G., Allali, I., Gupta, S., Srivastava, and SoIBio impact, a tale of spin-off and expansion A., Kalsan, M., Valdivia, C., Olguin-Orellana, G. around genomes and protein structures. Brief Bioin- J., Papadimitriou, S., … Rahman, F. (2019). Glo- form, 20(2), 390–397. https://doi.org/10.1093/bib/ bal network of computational biology communities: bbx064 ISCB’s Regional Student Groups breaking barriers. F1000Research, 8(ISCB Comm J), 1574. https://doi. Rosero-Bixby, L., Dow, W. H., & Rehkopf, D. H. (2013). org/10.12688/f1000research.20408.1 The Nicoya region of Costa Rica: a high longevity island for elderly males. Vienna Yearbook of Popula- Stark, Z., Dolman, L., Manolio, T. A., Ozenberger, B., tion Research, 11, 109–136. Hill, S. L., Caulfied, M. J., Levy, Y., Glazer, D., Wilson, J., Lawler, M., Boughtwood, T., Braithwaite, Scheneegans, S., Lewis, J., & Straza, T. (2021). UNESCO J., Goodhand, P., Birney, E., & North, K. N. (2019). Science Report: the race against time for smarter Integrating Genomics into Healthcare: A Global development; executive summary (SC-2021/WS/7). Responsibility. The American Journal of Human UNESCO. https://unesdoc.unesco.org/ark:/48223/ Genetics, 104(1), 13–20. https://doi.org/10.1016/j. pf0000377250 ajhg.2018.11.014 Schloss, P. D., Westcott, S. L., Ryabin, T., Hall, J. R., Hart- Suárez-Esquivel, M., Baker, K. S., Ruiz-Villalobos, N., mann, M., Hollister, E. B., Lesniewski, R. A., Oakley, Hernández-Mora, G., Barquero-Calvo, E., González- B. B., Parks, D. H., Robinson, C. J., Sahl, J. W., Stres, Barrientos, R., Castillo-Zeledón, A., Jiménez-Rojas, B., Thallinger, G. G., Horn, D. J. V., & Weber, C. F. C., Chacón-Díaz, C., Cloeckaert, A., Chaves-Olarte, (2009). Introducing mothur: Open-Source, Platform- E., Thomson, N. R., Moreno, E., & Guzmán-Verri, Independent, Community-Supported Software for C. (2017). Brucella Genetic Variability in Wildlife Marine Mammals Populations Relates to Host Prefe- Describing and Comparing Microbial Communities. rence and Ocean Distribution. Genome Biology and Applied and Environmental Microbiology, 75(23), Evolution, 9(7), 1901–1912. https://doi.org/10.1093/ 7537–7541. https://doi.org/10.1128/aem.01541-09 gbe/evx137 Segura-Wang, M., Raventós, H., Escamilla, M., & Barran- Suárez-Esquivel, M., Hernández-Mora, G., Ruiz-Villa- tes, R. (2010). Assessment of genetic ancestry and lobos, N., Barquero-Calvo, E., Chacón-Díaz, C., population substructure in Costa Rica by analysis of Ladner, J. T., Oviedo-Sánchez, G., Foster, J. T., individuals with a familial history of mental disorder. Rojas-Campos, N., Chaves-Olarte, E., Thomson, Annals of Human Genetics, 74(6), 516–524. https:// N. R., Moreno, E., & Guzmán-Verri, C. (2020). doi.org/10.1111/j.1469-1809.2010.00612.x Persistence of Brucella abortus lineages revealed by genomic characterization and phylodynamic analysis. Shilpa, G. U. (2018). Intellectual Property Rights and PLOS Neglected Tropical Diseases, 14(4), e0008235. Bioinformatics: An Introduction. En A. Shanker https://doi.org/10.1371/journal.pntd.0008235 (Ed.), Bioinformatics: Sequences, Structu- res, Phylogeny (pp. 1–14). Springer. https://doi. Suárez-Esquivel, M., Ruiz-Villalobos, N., Jiménez-Rojas, org/10.1007/978-981-13-1562-6_1 C., Barquero-Calvo, E., Chacón-Díaz, C., Víquez- Ruiz, E., Rojas-Campos, N., Baker, K. S., Oviedo- Shokralla, S., Porter, T. M., Gibson, J. F., Dobosz, R., Sánchez, G., Amuy, E., Chaves-Olarte, E., Thomson, Janzen, D. H., Hallwachs, W., Golding, G. B., & N. R., Moreno, E., & Guzmán-Verri, C. (2017). Hajibabaei, M. (2015). Massively parallel multiplex Brucella neotomae Infection in Humans, Costa Rica. DNA sequencing for specimen identification using an Emerging Infectious Diseases, 23(6), 997–1000. Illumina MiSeq platform. Nature Publishing Group, https://doi.org/10.3201/eid2306.162018