UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO IDENTIFICACIÓN DE VARIANTES RARAS DE NÚMERO DE COPIAS EN UNA FAMILIA CON ALTA PREVALENCIA DE PSICOSIS Tesis sometida a consideración de la Comisión del Programa de Estudios de Posgrado en Biología para optar al grado y título de Maestría Académica en Biología con énfasis en Genética y Biología Molecular María Fernanda Francis Cartín Ciudad Universitaria “Rodrigo Facio”, Costa Rica 2023 ii DEDICATORIA A mi familia, que me enseñó el amor por las ciencias, y la complejidad del ser humano. A mi pareja, que me enseñó todo aquello que la ciencia no puede explicar, la magia. iii AGRADECIMIENTOS Quiero agradecer a la Universidad de Costa Rica, por darme mi educación profesional, y por brindarme la educación integral que me hace hoy una gran profesional. Agradezco al CIBCM, en especial al grupo de Psiquiatría Genética, quien fue y será siempre mi familia académica. Agradezco al Centro Nacional de Alta Tecnología (CeNAT) por brindar su apoyo en el proceso de análisis inicial del pipeline de este proyecto. Agradezco también a mi comité asesor. A Ph.D. Henriette Raventós Vorst y Dr.rer.nat. Gabriela Chavarría Soley, quienes juntas me enseñaron bastos conocimientos del mundo genético, quienes además se han esmerado por crear un grupo de investigación donde cualquier persona se pueda sentir en un espacio seguro, y eso en la academia es algo de admirar; y Ph.D. Alejandro Sánchez Flores, gracias por sus valiosos aportes para el desarrollo de este proyecto, por su paciencia, y su apoyo con conocimientos en informática. A Javier Contreras gracias por apoyarme en momentos difíciles. A Esteban Rodríguez, gracias porque sin su aporte este trabajo no hubiera sido posible, su apoyo tanto técnico, como emocional fueron invaluables en el proceso de construcción de la tesis. A mi familia, mi mama, mi hermana, y mi pareja, gracias porque estuvieron para mí en todo el proceso. A Andrés Duarte, Paula Ledezma, Ana Murillo, Mauren Hernández, Ricardo Sánchez, Nelson Chávez, Nicole Gamboa, Yerali Cruz, y Josefina Brais por el apoyo y los miles de momentos maravillosos durante toda la carrera. iv v ÍNDICE DEDICATORIA ..................................................................................................................... ii AGRADECIMIENTOS .........................................................................................................iii RESUMEN ........................................................................................................................... vii LISTA DE TABLAS ............................................................................................................. ix LISTA DE FIGURAS ............................................................................................................. x LISTA DE MATERIAL SUPLEMENTARIO ....................................................................xiii LISTA DE ABREVIATURAS ............................................................................................ xiv INTRODUCCIÓN .................................................................................................................. 1 MATERIALES Y MÉTODOS ............................................................................................... 4 Sujetos de estudio ............................................................................... 4 Fenotipo ............................................................................................. 7 Secuenciación .................................................................................... 7 Llamado y filtrado de variantes ......................................................... 8 Prueba de asociación en familias .................................................... 11 Anotaciones genéticas ...................................................................... 11 RESULTADOS .................................................................................................................... 13 Depuración por errores mendelianos .............................................. 13 Llamado y filtrado de variantes ....................................................... 13 Prueba de asociación en familias .................................................... 18 Anotaciones genéticas ...................................................................... 21 Genes candidatos ............................................................................. 25 DISCUSIÓN ......................................................................................................................... 28 Llamado y filtrado de variantes ....................................................... 28 vi Prueba de asociación en familias .................................................... 29 Genes candidatos ............................................................................. 30 Anotaciones genéticas ...................................................................... 33 CONCLUSIONES ................................................................................................................ 37 REFERENCIAS .................................................................................................................... 38 APENDICES ........................................................................................................................ 55 vii RESUMEN Los trastornos psiquiátricos son enfermedades que afectan los procesos afectivos y cognitivos de las personas y que están presentes en todas las poblaciones humanas. Son padecimientos complejos para los cuales se han encontrado fuertes asociaciones entre el sistema inmunitario y la función cerebral en personas que los padecen. Debido a la heredabilidad faltante en muchos de estos padecimientos, este estudio plantea la utilización de un modelo de enfermedad común-alelo raro, apoyando la búsqueda de variantes raras o privadas características de familias y el análisis de variantes genéticas menos estudiadas, pero con tamaños de efecto mayores que estas, como es el caso de las variantes de número de copia (CNVs), y aportar al conocimiento sobre la arquitectura genética de padecimientos psiquiátricos. También se plantea el uso de definiciones alternativas de afectado, como fenotipos sindrómicos, o bien fenotipos categóricos según el DSM-IV. El presente estudio utilizó dos fenotipos para la asociación de CNVs raras en la familia, la presencia de psicosis en el curso de la enfermedad (como fenotipo sindrómico) y el padecimiento de trastornos del estado de ánimo (como fenotipo categórico). Los objetivos del estudio fueron analizar si en la presente familia se están segregando variantes genéticas estructurales asociadas a la presencia de psicosis y/o presencia de trastornos del estado de ánimo, así como determinar qué vías o genes se ven comprometidas o interrumpidas por la ganancia o pérdida de estas estas variantes de número de copias, si es que estas existen. Los resultados muestran que existe al menos una variante de número de copia, cnvdup137, que está segregando para el fenotipo de trastornos del estado de ánimo. Sin embargo, existen otras variantes que por los elementos genéticos que engloban, son buenas candidatas para explicar parte de la arquitectura genética de la familia (cnvdel221 y cnvdup175). La variante asociada contiene genes que codifican para inmunoglobulinas y traslapa con el locus kappa de la inmunoglobulina. Estos resultados apoyan la amplia línea de investigación que demuestra la implicación que tiene el sistema inmune en el curso de varias enfermedades del sistema nervioso central. Este es el primer estudio que identifica CNVs de riesgo para trastornos psicóticos y trastornos del estado de ánimo en población costarricense, proporcionando nuevos conocimientos sobre la arquitectura genética de tales padecimientos. viii ix LISTA DE TABLAS Cuadro I. Cantidad de personas en la familia con diagnósticos finales reportados mediante DSM-IV; confirmado por entrevista personal y el proceso del mejor estimado diagnóstico. En columnas se denota la cantidad de personas por padecimiento que presentan también información de genoma completo. ..................................................... 6 Cuadro II. Total de CNVs (506) categorizadas según el score de ISV (Interpretación de Variantes Estructurales) (Gažiová et al. 2022), además se presentan las métricas de máximo (Max), mínimo (Min), promedio y desviación estándar (SD) para cada categoría. Este programa anota las deleciones y duplicaciones con una puntuación de 0 a 1, donde es más probable que las puntuaciones más altas sean patogénicas ................................. 17 Cuadro III. Total de CNVs con regiones exónicas (103) categorizadas según el score de StrVCTVRE (Sharo et al. 2022), además se presentan las métricas de máximo (Max), mínimo (Min), promedio y desviación estándar (SD) para cada categoría. Este programa anota las deleciones y duplicaciones que tengan regiones exónicas con una puntuación de 0 a 1, donde es más probable que las puntuaciones más altas sean patogénicas. ........... 18 Cuadro IV. Anotaciones para las 15 CNVs significativas antes de la corrección por Bonferroni-Holm. Se adjuntan para cada CNV las características de posición, longitud y tipo, además se añade los resultados de asociación, con los respectivos valores de p y el fenotipo al que corresponden. Se analizó la presencia de genes, variantes pLoF, missense y sinónimas reportadas en gnomAD. .............................................................................. 22 Cuadro V. Genes codificantes encontrados en CNVs significativas previo a la corrección por Bonferroni-Holm. Se adjunta la información de la posición, longitud, banda, nombre principal, otros nombres y Ensambl ID del gen. Además, se adjunta ID, posición, longitud y fenotipo al que dio asociación de la CNV. ................................................................... 23 x LISTA DE FIGURAS Figura 1. Árbol genealógico de la familia, realizado con el software CraneFoot (Mäkinen et al. 2005), y la imagen fue procesada con Inkscape 0.92.4, para obtener una mejor resolución. En Amarillo se denotan los individuos que han padecido de psicosis, y en blanco los que no. Los símbolos denotan la categorización de la psicopatología según el DSM V: Bipolar tipo I (BPI), Bipolar tipo II (BPII), Trastorno bipolar no especificado (BPNOS), Trastorno depresivo no especificado (DDNOS), Episodio de depresión mayor (MDE), Psicosis no especificada, Trastorno de depresión mayor recurrente, Trastorno esquizoafectivo tipo bipolar (SADBP), Trastorno esquizoafectivo tipo depresivo (SADD). ............................................................................................................................ 5 Figura 2. Waterfall de CNVs posterior a filtros de calidad y eliminación de variantes comunes. Los filtros de calidad se aplicaron con CNVpytor, se aplicaron filtros como: Q0_range de -1 a 0.5 que elimina llamadas con más del 50% de reads no mapeados, p_range de 0 a 0.0001 que elimina llamadas no confiables, p_N de 0 a 0.5 que elimina llamadas con más del 50% de Ns en el genoma de referencia, dG_range de 100 000 a inf que elimina llamadas cercanas a gaps en el genoma de referencia. El filtro de variantes comunes se realizó utilizando la base de datos Database of Genomic Variants (DGV), y se eliminaron del pool de CNVs aquellas que traslapan en 50% o más con las variantes seleccionadas de DVG, el traslape se evaluó con la herramienta intersect de Bedtools. Todos estos filtros se aplicaron en cada VCF de las 114 secuencias de genoma completo. ........................................................................................................................................... 9 Figura 3. Workflow para obtener el llamado y filtrado de CNVs para prueba de asociación. Se realizo en OS Ubuntu 22, paralelizando todos los procesos con 2 cores de 4 nodos cada uno con GNU Parallel (Tange, 2023). Para el llamado de variantes se utilizó el software CNVpytor (version 1.3.1), se definieron bins de 500pb. La conversión de VCF a BED se realizó utilizando vcf2bed de BEDOPS, el filtro de variantes comunes se realizó utilizando la base de datos Database of Genomic Variants (DGV), y se eliminaron del pool de CNVs aquellas que traslapan en 50% o más con las variantes seleccionadas de DVG, el traslape se evaluó con la herramienta intersect de Bedtools. La herramienta multiinter de Bedtools, se utilizó para agrupar y determinar el punto de quiebre real de las xi variantes dentro de la familia. Finalmente, se aplicaron los filtros por fenotipo, en los cuales se eliminaban las CNVs que estaban ausentes en los afectados, y se excluyen variantes con una frecuencia mayor al 95% y menor al 5%. .......................................... 11 Figura 4. Waterfall de CNVs para cada fenotipo, se aplicaron filtros en los cuales se eliminaban las CNVs que estaban ausentes en los afectados, además, se excluyeron las variantes con una frecuencia mayor al 95% y menor al 5% dentro de la familia. a: Waterfall para el fenotipo de psicosis: después de los filtros, se obtuvieron 95 CNVs, 57 duplicaciones y 38 deleciones. b: Waterfall para el fenotipo de trastorno del estado de ánimo: después de los filtros se obtuvieron 63 CNVs 36 duplicaciones y 27 deleciones. ......................................................................................................................................... 14 Figura 5. Cantidad de CNVs identificadas (506) por cromosoma, divididas en deleciones (DEL) y duplicaciones (DUP). La mayor cantidad de CNVs se encontraron en el cromosoma 1 y cromosoma 9. ......................................................................................... 15 Figura 6. Cantidad de CNVs identificadas (506) por rango de tamaño, divididas en deleciones (DEL) y duplicaciones (DUP). El tamaño promedio de CNV fue de 33,8 kb y el tamaño medio fue de 16,5 kb, además se encontró la mayor cantidad de CNVs en el rango de 9.5 a 12 Kb. ...................................................................................................... 16 Figura 7. Ilustración de la ubicación cromosómica de las 15 CNVs significativas previo a la corrección por Bonferroni-Holm. El código de color hace referencia al fenotipo asociado, amarillo: significativas para el fenotipo de psicosis, rojo: significativas para el fenotipo de trastornos del estado de ánimo y naranja: significativas en ambos fenotipos. Ambos fenotipos comparten 5 CNVs significativas previo a la corrección. Posterior a la corrección, solamente una de las CNVs mantiene la significancia, cnvdup137, para el fenotipo de trastornos del estado de ánimo (p= 0,01456). .............................................. 20 Figura 8. Ilustración de la ubicación cromosómica de las 15 CNVs significativas, 9 duplicaciones y 6 deleciones, previo a la corrección por Bonferroni-Holm, el código de color hace referencia al tipo de CNV que es: duplicación en color azul y deleción en color verde, muchas de estas se ubican en regiones cercanas al centrómero. .......................... 21 Figura 9. Red de interacción, generada con Genemania, para los genes CNTNAP3 (perteneciente al CNV cnvdel221) y GSTT4 (perteneciente al CNV cnvdup175), los cuales se pueden identificar por las rayas claras dentro del círculo gris. En color rosa se xii representan las interacciones físicas, esto se obtiene de datos de interacción proteína- proteína. En color morado la co-expresión, que se obtienen de datos de expresión génica. En color naranja las predicciones de relaciones funcionales entre genes, a menudo interacciones de proteínas. En azul la co-localización que se refiere a genes expresados en el mismo tejido, o proteínas encontradas en la misma ubicación. En verde las interacciones génicas. En color celeste las vías o rutas, brinda la información cuando dos productos génicos están vinculados en la misma reacción dentro de una vía. En color amarillo se denotan los dominios de proteínas compartidos. .......................................... 24 Figura 10. Topología de red de interacciones de regulación transcripcional, generada con BioNetUCR, donde se puede identificar el efecto que ejercen especies genéticas sobre uno de los genes de interés CNTNAP3. .......................................................................... 25 Figura 11. Validación de la variante cnvdup137, utilizando la graficación de CNVpytor. Únicamente se encontró la variante de manera heterocigota. En el recuadro a se evidencia la ausencia de la variante, mientras que en los recuadros b, c y d se evidencia la presencia de la duplicación, mediante el aumento significativo de la profundidad de lectura. ...... 26 Figura 12. Ilustraciones de Decipher (Firth et al. 2009), para las CNVs reportadas que contienen los genes IGKV1-12 y IGKV1-13. Los reportes son de 40 pacientes. Se evidencia como los pacientes en los que se encontraron CNVs con estos genes, el fenotipo más frecuente fue el de capacidad intelectual disminuida, además de que el modo de herencia de estas CNVs fue mayoritariamente desconocido. ......................................... 27 Figura 13. Ilustración del posible mecanismo por el cual IGK puede estar afectando la via AKT-mTOR. Imagen adaptada de: Ryskalin et al. (2018) y Wang et al. (2022). .......... 32 Figura 14. Ilustración del posible mecanismo por el cual GST puede estar afectando la expresión de NF-κB. GST media la isomerización de las prostaglandinas de PGH2 a PGD2, luego de varios procesos esta se convierte en 15-dPGJ2. La eliminación de 15- dPGJ2 es mediado por la conjugación del mismo con GST y se excreta por vías celulares. 15-dPGJ2 inhibe la expresión de NF-κB. Imagen adaptada de: Hayes, Flanagan & Jowsey (2005) y Koo et al. (2010). .............................................................................................. 35 xiii LISTA DE MATERIAL SUPLEMENTARIO Cuadro Material Suplementario 1. Información total de las 506 CNVs evaluadas para la familia. Incluye: posición de las variantes, tipo de variante, longitud, score y categoría de ISV (Interpretación de Variantes Estructurales) (Gažiová et al. 2022), score y categoría de StrVCTVRE (Sharo et al. 2022), porcentaje del total de los genomas evaluados que presentaban la variante, y el porcentaje de cada fenotipo que presentaba la variante. Además, se adjunta la información del valor de p para las CNVs que así lo presenten, y el valor p corregido, para ambos fenotipos evaluados. PS: Psicosis. TE Ánimo: Trastornos del estado de ánimo. ............................................................................................................................... 55 xiv LISTA DE ABREVIATURAS 15-dPGJ2: “15-Deoxy-Delta-12,14-prostaglandin J2” AKT: “A serine/threonine protein kinase” APBA1: “Amyloid Beta Precursor Protein Binding Family A Member 1” BDNF: Factor neurotrófico derivado del cerebro BPI: Trastorno Bipolar Tipo I BPII: Trastorno Bipolar Tipo II BPNOS: Trastorno Bipolar No Especificado CEC: Comité Ético Científico Chr: Cromosoma CNTNAP3: “Contactin Associated Protein Family Member 3” CNV: Variantes de número de copia D1R: “Dopamine 1 receptors” DDNOS: Trastorno Depresivo No Especificado DEL: Deleción DGV: “Database of Genomic Variants” DISC1: “Disrupted-in-schizophrenia 1” DoC: Profundidad de cobertura DSM: Manual diagnóstico. y estadístico. de los trastornos mentales DUP: Duplicación ErbB4: “Erb-B2 Receptor Tyrosine Kinase 4” FAK: Kinasa de adhesión focal xv FBAT: “Family‐Based Association Test” GST: Glutatión S-transferasas GSTT1: “Glutathione S-Transferase Theta 1” GSTT4: “Glutathione S-Transferase Theta 4” GWAS: Estudio de asociación del genoma completo IGJ: Cadena J de inmunoglobulinas IGK: Locus kappa de inmunoglobulinas IGKV1-12: Immunoglobulin Kappa Variable 1-12 IGKV1-13: Immunoglobulin Kappa Variable 1-13 IL: Interleucina ISV: “Interpretation of Structural Variants” Kb: Kilobase MDE: Episodio de Depresión Mayor MED: Mejor Estimado Diagnóstico Mir: Referente a MicroARN mTOR: “Mammalian Target of Rapamycin” NF-κB: Factor nuclear κB NRG1: Neuregulina 1 PGD2: Prostaglandina D2 PGH2: Prostaglandina H2 PI3K: Fosfoinositol 3-kinasa pLoF: Variantes con probabilidad de pérdida de función PNOS: Psicosis no especificada xvi RMDD: Trastorno de Depresión Mayor Recurrente SADBP: Trastorno Esquizoafectivo Tipo Bipolar SADD: Trastorno Esquizoafectivo Tipo Depresivo SNC: Sistema nervioso central SNV: Variantes de un solo nucleótido SRC: “Steroid receptor coactivator” SUDEP: Muerte súbita inesperada en epilepsia SZ: Esquizofrenia (SZ) TDT: “Transmission disequilibrium test” TNF: Factor de necrosis tumoral VEP: “Ensembl Variant Effect Predictor” WGS: Secuenciación de Genoma Completo 1 INTRODUCCIÓN Los trastornos psiquiátricos son unas de las causas principales de morbilidad y afectan a todas las poblaciones humanas (Craddock, O’donovan & Owen, 2005; World Health Organization, 2004). Estos padecimientos se caracterizan por ser poligénicos (Li et al. 2017; Milaneschi et al. 2016; Purcell et al. 2009), y por presentar heterogeneidad genética, e interacciones gen-gen y gen-ambiente, lo que complica su estudio (Uhl & Grow, 2004). Incluso se ha determinado que la interacción génica puede ser de sistemas o vías distintas; por ejemplo, se han encontrado fuertes conexiones causales entre el sistema inmunitario y la función cerebral, dando paso a correlaciones entre las medidas de la función inmunitaria y las enfermedades psiquiátricas en humanos (Bennett & Molofsky, 2019). Históricamente, los resultados de los grandes estudios caso-control de asociación con todo el genoma (GWAS), para encontrar variantes comunes de pequeño efecto, no han logrado explicar por completo la heredabilidad de padecimientos psiquiátricos como esquizofrenia y trastorno bipolar (Li et al. 2017; Purcell et al. 2009; Stahl et al. 2019). Esto pone la atención en 2 puntos principales: 1. Un modelo de enfermedad común-alelo raro (McClellan, Susser & King, 2007), ya que la mayoría de las enfermedades complejas podrían explicarse por múltiples variantes, tanto raras como comunes, con tamaños de efectos variables, y 2. Variantes menos estudiadas que las variantes de un solo nucleótido (SNV), pero con tamaños de efecto mayores que estas, como es el caso de las variantes de número de copia (CNVs) (Bergen et al. 2018). Referente al punto 1, para enfocarnos en un modelo de enfermedad común-alelo raro, los estudios en familias toman gran relevancia para la detección variantes raras con efectos que varían de moderados a grandes (Glahn et al. 2018; McClellan, Susser & King, 2007; Knight et al. 2009). Se ha visto que las variantes génicas con efectos más grandes están enriquecidas en familias con múltiples casos (Levy et al. 2011), por ello estos estudios se han caracterizado por ser mejores para identificar nuevos genes candidatos en distintas enfermedades (Glahn et al. 2018; Levinson et al. 2012). Con relación al punto 2, ya han sido reportadas varias CNVs que aumentan el riesgo de esquizofrenia (Bassett et al. 2008; Glessner et al. 2010; St Clair, 2008), trastorno bipolar (Girirajan & Eichler, 2011) y 2 enfermedades del espectro autista (Takumi & Tamada, 2018; Krumm et al. 2013; Kushima et al. 2018). La definición del fenotipo en estos padecimientos es otro de los grandes retos (Craddock, O'donovan & Owen, 2007). A lo largo de la historia, se han implementado distintos sistemas diagnósticos para clasificar las enfermedades psiquiátricas (Freedman et al. 2013). Sin embargo, algunos de estos padecimientos se encuentran tan estrechamente relacionados que se dificulta establecer la línea divisoria entre categorías, como para el espectro de los trastornos psicóticos y afectivos (Craddock, O'donovan, & Owen, 2007; Craddock, O’donovan, & Owen, 2005; Escamilla, 2001; Lee et al. 2013). Existe evidencia que pone en duda la división Kraepeliana entre esquizofrenia y trastorno bipolar, ya que se ha observado que sus manifestaciones clínicas son muy similares (American Psychiatric Association, 2014; Escamilla, 2001). En algunos casos, responden a los mismos tratamientos (Correll et al. 2015; Newcomer, 2006), y pueden compartir variantes con potencial susceptibilidad genética entre los distintos trastornos (Berrettini, 2004; Walss‐ Bass et al. 2005; Lee, Feng & Smoller, 2021; Pineda-Cirera et al. 2022; Xia et al. 2019). Además, varios estudios han demostrado que los familiares en primer grado de pacientes con algún trastorno psiquiátrico como esquizofrenia tienen mayor riesgo de presentar otros trastornos como trastorno bipolar, y viceversa (Bailer et al. 2002; Craddock, O'donovan & Owen, 2006; Lee et al. 2013; Walss‐Bass et al. 2006). Dado lo anterior, algunos estudios optan por usar definiciones alternativas para el estado de afección, utilizando criterios sindrómicos o que engloben varias categorías diagnósticas del DSM (Burmeister, McInnis & Zöllner, 2008; Cardno et al. 2002; Craddock, O’donovan & Owen, 2005). En el primer caso, algunos estudios han utilizado la presencia o ausencia del síndrome de manía (Walss‐Bass et al. 2006) o de psicosis (Chavarria-Siles et al. 2007; Escamilla et al. 2007; Escamilla et al. 2008; Lee et al. 2007) en el curso de la enfermedad, como estrategia alternativa de fenotipado. En el segundo caso, se han utilizado categorías diagnosticas del DSM, que engloban 2 o más trastornos se encuentran estrechamente asociados (Stefansson et al. 2014) El presente estudio utilizó dos fenotipos para el análisis de asociación, la presencia de psicosis en el curso de la enfermedad (como fenotipo sindrómico) y el padecimiento de 3 trastornos del estado de ánimo, también llamados afectivos (como fenotipo extendido que engloba los padecimientos de trastorno bipolar y trastornos depresivos). El presente trabajo tuvo como objetivo general, estudiar una familia multigeneracional costarricense, con alta prevalencia de trastornos psiquiátricos, por la posible presencia de variantes genéticas estructurales, específicamente variantes de número de copias, asociadas con psicosis y/o trastornos del estado de ánimo. Tuvo como objetivos específicos: 1) Analizar si la presente familia está segregando variantes genéticas estructurales asociadas a la presencia de psicosis y/o presencia de trastornos del estado de ánimo. 2) Determinar qué vías o genes se ven comprometidas o interrumpidas por la ganancia o pérdida de estas estas variantes de número de copias, si es que estas existen. Este es el primer estudio que identifica CNVs de riesgo para trastornos psicóticos y trastornos del estado de ánimo en población costarricense, proporcionando nuevos conocimientos sobre la arquitectura genética de tales padecimientos. 4 MATERIALES Y MÉTODOS Sujetos de estudio Las personas analizadas son parte de una familia multigeneracional costarricense, residentes de la provincia de San José, Costa Rica. Debido al análisis de isonimia realizado anteriormente por Sáenz & Barrantes (2009), se expone que la región geográfica en la que se ubican podría presentar alta consanguinidad. Consecuentemente, en esta familia se encuentran varias uniones consanguíneas, lo que la hace sumamente relevante para identificar variantes de herencia recesiva. Esta familia consta de 293 personas (149 mujeres, 144 hombres), de las cuales 92 han presentado algún trastorno psicótico y/o trastorno del estado de ánimo según el DSM-IV, confirmado por entrevista personal y el proceso del mejor estimado diagnóstico (Figura 1, Cuadro I). 5 Figura 1. Árbol genealógico de la familia, realizado con el software CraneFoot (Mäkinen et al. 2005), y la imagen fue procesada con Inkscape 0.92.4, para obtener una mejor resolución. En Amarillo se denotan los individuos que han padecido de psicosis, y en blanco los que no. Los símbolos denotan la categorización de la psicopatología según el DSM V: Bipolar tipo I (BPI), Bipolar tipo II (BPII), Trastorno bipolar no especificado (BPNOS), Trastorno depresivo no especificado (DDNOS), Episodio de depresión mayor (MDE), Psicosis no especificada, Trastorno de depresión mayor recurrente, Trastorno esquizoafectivo tipo bipolar (SADBP), Trastorno esquizoafectivo tipo depresivo (SADD). 6 Cuadro I. Cantidad de personas en la familia con diagnósticos finales reportados mediante DSM-IV; confirmado por entrevista personal y el proceso del mejor estimado diagnóstico. En columnas se denota la cantidad de personas por padecimiento que presentan también información de genoma completo. Diagnóstico Final Cantidad de Personas Totales Cantidad de Personas con Genoma Completo Psicosis 55 48 Sin Psicosis 238 66 Trastorno del estado de ánimo 65 60 Sin Trastorno del estado de ánimo 228 54 Sin Trastorno diagnosticado 201 32 Psicosis no especificada (PNOS) 14 12 Trastorno Bipolar Tipo I (BPI) 23 22 Trastorno Bipolar Tipo II (BPII) 1 1 Episodio de Depresión Mayor (MDE) 13 13 Trastorno de Depresión Mayor Recurrente (RMDD) 16 14 Trastorno Esquizoafectivo Tipo Bipolar (SADBP) 5 4 Trastorno Esquizoafectivo Tipo Depresivo (SADD) 2 2 Trastorno Bipolar No Especificado (BPNOS) 3 3 Trastorno Depresivo No Especificado (DDNOS) 9 7 Esquizofrenia (SZ) 6 4 Las personas fueron estudiadas como parte de 3 proyectos sucesivos de investigación (B2521 Caracterización de una forma mendeliana de psicosis en un aislado poblacional, B5331 Secuenciación del genoma completo en familias con trastornos psicóticos y afectivos, y C0318 Análisis de ligamiento y asociación e identificación de variantes raras de número de copias en una familia multigeneracional con alta prevalencia de psicosis) aprobados por el CEC de la Universidad de Costa Rica. Todas las personas participantes firmaron el 7 consentimiento informado aprobado por el CEC, de previo a su participación. Encontrar familias humanas tan numerosas, con alta consanguinidad y con múltiples casos de enfermedades psiquiátricas es poco común, y representa una gran oportunidad para identificar variantes raras de efecto grande o moderado. Todas las personas de la familia cuentan con evaluaciones clínicas por profesionales en salud mental, que incluyen el Mejor Estimado Diagnóstico (MED), en el cual dos expertos revisan el material clínico de cada individuo, para llegar a un diagnóstico independiente. Luego ambos llegan a un diagnóstico consensuado, que puede incluir el realizar más pruebas clínicas, o incluso, que un tercer experto revise el caso, para así llegar a un mejor estimado diagnóstico según las pautas diagnósticas del DSM-IV (Contreras et al. 2009). Fenotipo Debido a que la familia a estudiar incluye diagnósticos como Psicosis no especificada (PNOS), esquizofrenia (SZ), Trastorno Esquizoafectivo Tipo Bipolar (SADBP), Trastorno Esquizoafectivo Tipo Depresivo (SADD), Trastorno Bipolar Tipo I (BPI), Trastorno Bipolar Tipo II (BPII), Trastorno Bipolar No Especificado (BPNOS), Episodio de Depresión Mayor (MDE), Trastorno de Depresión Mayor Recurrente (RMDD) y Trastorno Depresivo No Especificado (DDNOS), se utilizó el diagnóstico sindrómico de psicosis como el fenotipo de afectado. Además de este, se empleó el fenotipo de la clasificación diagnóstica de Trastornos del Estado de Ánimo, que agrupa los siguientes padecimientos: BPI, BPII, RMDD, MDE, DDNOS y BPNOS. Ambos fenotipos no son mutuamente excluyentes, existen personas con diagnóstico de trastornos del estado de ánimo con y sin presciencia de psicosis. Secuenciación El presente trabajo utilizó datos de secuencias obtenidas del proyecto 801-A1-751: Secuenciación del genoma completo en familias con trastornos psicóticos y afectivos. Se utilizaron 114 secuencias del genoma completo de individuos de la familia expuesta anteriormente. El proyecto 801-A1-751 obtuvo las secuencias a partir del servicio Secuenciación de Genoma Completo (WGS) de Illumina, utilizando la plataforma Illumina HiSeq 2000. Estos datos se generaron a partir de una única biblioteca de inserción corta sin PCR, utilizando secuenciación de extremos pareados con una longitud mínima de lectura de 8 2x100 pb. Las muestras se secuenciaron con 30x de cobertura promedio, además utilizó bwamem (versión 0.7.15-r1140) (Li & Durbin 2009) como método de alineamiento. Todas las muestras enviadas a Illumina para la secuenciación se genotiparon en una matriz HumanOmni2.5 para evaluar la concordancia de genotipo entre los métodos. Se utilizo como genoma de referencia el GRCh38. Llamado y filtrado de variantes Para analizar si la presente familia está segregando variantes génicas estructurales asociadas a la presencia de psicosis y/o a la presencia de trastornos del estado de ánimo, se realizó un llamado de CNVs. El llamado de CNVs usando WGS, es un proceso con escasos flujos de trabajo estandarizado; actualmente no existe un método que capture el rango de tamaños completo de tamaños de CNV (Trost et al. 2018). El presente estudio utilizó la estrategia de profundidad de cobertura (DoC), ya que es la que presenta uno de los rangos de tamaño más amplios en cuanto a detección de CNVs (Zhao et al. 2013). Se realizó un pipeline en OS Ubuntu 22, y paralelizando todos los procesos con 2 procesadores de 4 núcleos cada uno. Dicha paralelización se realizó con GNU Parallel (versión 3, 20230322) (Tange, 2023). Para el llamado de variantes se utilizó CNVpytor (version 1.3.1), con base en Python (versión 3.10.10), CNVpytor es una herramienta de línea de comandos para el análisis de CNVs utilizando la profundidad de cobertura (Suvakov et al. 2021). El proceso se llevó a cabo creando un archivo pytor, donde se definieron bins de 500pb, siguiendo el protocolo estipulado por Suvakov y colaboradores (2021), donde se define que bins se deben utilizar en base a la profundidad de cobertura promedio de las lecturas. Se realizó la corrección por GC y la creación de las particiones para el llamado de variantes, que dio como resultado 3041 (± 236) CNVs en promedio por persona. Seguidamente, se llevaron a cabo filtros de calidad. Luego de la depuración de las variantes con los filtros de calidad, se obtuvo 278 (± 17) CNVs en promedio por persona (Figura 2). 9 Figura 2. Waterfall de CNVs posterior a filtros de calidad y eliminación de variantes comunes. Los filtros de calidad se aplicaron con CNVpytor, se aplicaron filtros como: Q0_range de -1 a 0.5 que elimina llamadas con más del 50% de reads no mapeados, p_range de 0 a 0.0001 que elimina llamadas no confiables, p_N de 0 a 0.5 que elimina llamadas con más del 50% de Ns en el genoma de referencia, dG_range de 100 000 a inf que elimina llamadas cercanas a gaps en el genoma de referencia. El filtro de variantes comunes se realizó utilizando la base de datos Database of Genomic Variants (DGV), y se eliminaron del pool de CNVs aquellas que traslapan en 50% o más con las variantes seleccionadas de DVG, el traslape se evaluó con la herramienta intersect de Bedtools. Todos estos filtros se aplicaron en cada VCF de las 114 secuencias de genoma completo. Finalmente se realizó un filtrado por variantes comunes utilizando la base de datos Database of Genomic Variants (DGV) (versión DGV Variants 2020-02-25). El objetivo de esta base de datos de variantes genómicas es proporcionar un resumen completo de la 10 variación estructural en el genoma humano identificada en muestras de controles sanos. De esta base se filtró con las variantes depuradas de personas sanas que estuvieran representadas en al menos 2 estudios. Para el presente trabajo se eliminaron las CNVs que traslapaban en 50% o más con las variantes seleccionadas de DVG. El traslape se evaluó con la herramienta intersect de Bedtools (Quinlan & Hall, 2010) (Figura 3). Luego se utilizó la herramienta multiinter de Bedtools (Quinlan & Hall, 2010) para agrupar y determinar el punto de quiebre real de las variantes dentro de la familia. Al obtener el total de variantes, se aplicaron filtros por fenotipo, eliminando CNVs que estaban ausentes en afectados, y excluyendo variantes con una frecuencia mayor al 95% y menor al 5%. 11 Figura 3. Workflow para obtener el llamado y filtrado de CNVs para prueba de asociación. Se realizo en OS Ubuntu 22, paralelizando todos los procesos con 2 cores de 4 nodos cada uno con GNU Parallel (Tange, 2023). Para el llamado de variantes se utilizó el software CNVpytor (version 1.3.1), se definieron bins de 500pb. La conversión de VCF a BED se realizó utilizando vcf2bed de BEDOPS, el filtro de variantes comunes se realizó utilizando la base de datos Database of Genomic Variants (DGV), y se eliminaron del pool de CNVs aquellas que traslapan en 50% o más con las variantes seleccionadas de DVG, el traslape se evaluó con la herramienta intersect de Bedtools. La herramienta multiinter de Bedtools, se utilizó para agrupar y determinar el punto de quiebre real de las variantes dentro de la familia. Finalmente, se aplicaron los filtros por fenotipo, en los cuales se eliminaban las CNVs que estaban ausentes en los afectados, y se excluyen variantes con una frecuencia mayor al 95% y menor al 5%. Prueba de asociación en familias Se probó la asociación de CNVs raras con los fenotipos utilizando el software FBAT, “Family-Based Association Tests” (FBAT versión 2.4) (Laird et al. 2000). Este se basa en el enfoque unificado de las pruebas de asociación basadas en la familia presentado por Laird y colaboradores (2000) y Rabinowitz y Laird (2000). Además, toma de base el método TDT original en el que los alelos transmitidos a la descendencia afectada se comparan con la distribución esperada de alelos entre la descendencia (Spielman et al. 1993). Se realizó la corrección de significancia, por la cantidad de pruebas de hipótesis evaluadas, utilizando el método de Bonferroni-Holm (Holm, 1979). Anotaciones genéticas Investigar la funcionalidad de las CNV es el paso final y más relevante, conformado por 2 partes: identificar las regiones funcionales en las CNV y proponer posible relevancia para los trastornos psicóticos y/o trastornos del estado de ánimo. Para comprender la posible influencia que tengan estas CNVs en el fenotipo, se evaluó la presencia de regiones funcionales como los genes codificantes de proteínas, promotores, potenciadores, sitios de metilación, entre otros. Esto utilizando ISV (“Interpretation of Structural Variants”) (versión 0.3.16), este programa brinda un score de patogenicidad de la CNV (Gažiová et al. 2022). Para evaluar la patogenicidad de regiones exónicas se utilizó StrVCTVRE (versión 1.9.), un predictor de impacto de variantes estructurales desarrollado por Sharo y colaboradores (2022). Ambas herramientas, ISV y 12 StrVCTVRE, anotan las deleciones y duplicaciones con una puntuación de 0 a 1, donde es más probable que las puntuaciones más altas sean patogénicas. La variante que resultó significativa para la asociación (p < 0.05) fue evaluada con VEP (“Ensembl Variant Effect Predictor”), Decifer, gnomAD, UCSC Genome Browser y DGV. Con el fin de determinar todos los elementos genéticos que pudieran encontrarse en la región comprendida por la CNV. Finalmente, para analizar las vías o redes de interacción en la que participan los genes encontrados en la CNV se utilizaron GeneMania (version 2.6) (Franz et al. 2018) y BioNet (versión 1.3.0) (Acon et al. 2021). 13 RESULTADOS Depuración por errores mendelianos Se estudió una familia multitudinaria costarricense de 293 integrantes, de los cuales 114 contaban con genoma completo. De estos, se descartaron 4 por errores mendelianos, por lo que los siguientes resultados se presentarán con 110 genomas completos. Llamado y filtrado de variantes Al realizar el llamado de variantes con los filtros establecidos se dio como resultado 506 CNVs totales, 271 Duplicaciones y 235 Deleciones. Posteriormente, se aplicaron los filtros por fenotipo, en los cuales se eliminaban las CNVs que estaban ausentes en los afectados, y se excluyen variantes con una frecuencia mayor al 95% y menor al 5%. Al finalizar los filtros se obtuvieron 95 CNVs para el fenotipo de Psicosis: 57 Duplicaciones y 38 Deleciones (Figura 4ª); y 63 CNVs para el fenotipo de trastornos del estado de ánimo: 36 Duplicaciones y 27 Deleciones (Figura 4b). 14 Figura 4. Waterfall de CNVs para cada fenotipo, se aplicaron filtros en los cuales se eliminaban las CNVs que estaban ausentes en los afectados, además, se excluyeron las variantes con una frecuencia mayor al 95% y menor al 5% dentro de la familia. a: Waterfall para el fenotipo de psicosis: después de los filtros, se obtuvieron 95 CNVs, 57 duplicaciones y 38 deleciones. b: Waterfall para el fenotipo de trastorno del estado de ánimo: después de los filtros se obtuvieron 63 CNVs 36 duplicaciones y 27 deleciones. Los 110 individuos presentan en promedio 278 (±17) CNVs, y alrededor de 33 (±5) CNVs que no están reportados en la base de datos de DGV (Figura 3). Al obtener el total de CNVs de la familia, se identificaron 506 CNVs, 271 duplicaciones y 235 deleciones (Cuadro Material Suplementario S1). La mayor cantidad de CNVs se encontraron en el cromosoma 1 y cromosoma 9 (Figura 5). El tamaño promedio de CNV fue de 33,8 kb y el tamaño medio fue de 16,5 kb. Se encontró la mayor cantidad de CNVs en el rango de 9.5 a 12 Kb (Figura 6). 15 Figura 5. Cantidad de CNVs identificadas (506) por cromosoma, divididas en deleciones (DEL) y duplicaciones (DUP). La mayor cantidad de CNVs se encontraron en el cromosoma 1 y cromosoma 9. 16 Figura 6. Cantidad de CNVs identificadas (506) por rango de tamaño, divididas en deleciones (DEL) y duplicaciones (DUP). El tamaño promedio de CNV fue de 33,8 kb y el tamaño medio fue de 16,5 kb, además se encontró la mayor cantidad de CNVs en el rango de 9.5 a 12 Kb. 17 La mayoría de estas 506 CNVs tienen un score de ISV que denota no patogenicidad (98.8%), por los elementos génicos que estos poseen (Figura suplementaria S1). Solamente 2 CNVs se encontraron en las categorías de patogénico y posiblemente patogénico (Cuadro II). Las CNVs que presentaban regiones exónicas (103 CNVs, 20%) se clasificaron utilizando StrVCTVRE; de estas, se encontraron 9 CNVs posiblemente patogénicos (Cuadro III). Cuadro II. Total de CNVs (506) categorizadas según el score de ISV (Interpretación de Variantes Estructurales) (Gažiová et al. 2022), además se presentan las métricas de máximo (Max), mínimo (Min), promedio y desviación estándar (SD) para cada categoría. Este programa anota las deleciones y duplicaciones con una puntuación de 0 a 1, donde es más probable que las puntuaciones más altas sean patogénicas Potencial patogénico Cantidad CNVs Porcentaje de CNVs Max ISV Score Min ISV Score Promedio ISV Score SD ISV Score No patogénico 500 98,8% 0,146 0,000 0,004 0,012 Posiblemente no patogénico 2 0,4% 0,203 0,150 0,177 0,037 Incierto 2 0,4% 0,401 0,311 0,356 0,064 Posiblemente patogénico 1 0,2% 0,752 0,752 0,752 NA Patogénico 1 0,2% 0,960 0,960 0,960 NA 18 Cuadro III. Total de CNVs con regiones exónicas (103) categorizadas según el score de StrVCTVRE (Sharo et al. 2022), además se presentan las métricas de máximo (Max), mínimo (Min), promedio y desviación estándar (SD) para cada categoría. Este programa anota las deleciones y duplicaciones que tengan regiones exónicas con una puntuación de 0 a 1, donde es más probable que las puntuaciones más altas sean patogénicas. Potencial patogénico Cantidad CNVs Porcentaje de CNVs Max StrVCTVRE Score Min StrVCTVRE Score Mean StrVCTVRE Score SD StrVCTVRE Score No patogénico 26 25,24% 0,147 0,071 0,112 0,024 Posiblemente no patogénico 21 20,39% 0,199 0,152 0,172 0,015 Incierto 47 45,63% 0,589 0,200 0,400 0,123 Posiblemente patogénico 9 8,74% 0,719 0,640 0,677 0,025 Se identificaron 41 de 47 (87 %) personas con psicosis con 1 o más CNVs raras que no se observaron en las personas sin psicosis. Por otro lado, 58 de 66 (88%) personas con trastornos del estado de ánimo presentaron 1 o más CNVs raras que no se observaron en las personas sin trastornos del estado de ánimo. Al filtrar las CNVs que no se encontraron en los fenotipos analizados, y filtrar por frecuencias de más de 95% y menos de 5%, se identificaron 95 CNVs para el fenotipo de psicosis y 63 CNVs para el fenotipo de trastornos del estado de ánimo (Cuadro Material Suplementario S1). Con estos se probó la asociación con cada fenotipo respectivo. Prueba de asociación en familias Al realizar el análisis de asociación con FBAT se encontraron resultados positivos para 11 de las 95 CNVs evaluadas para el fenotipo de psicosis (3 deleciones y 8 duplicaciones). Para el fenotipo de trastorno del estado de ánimo, se encontraron resultados positivos para 9 de las 63 CNVs (3 deleciones y 6 duplicaciones) (Cuadro Material 19 Suplementario S1). Ambos fenotipos compartieron 5 CNVs significativas previo a la corrección de la p (Figura 7). Previo a la corrección de Bonferroni-Holm, se contaban con 15 CNVs significativas, 9 duplicaciones y 6 deleciones, muchas de estas ubicadas en regiones cercanas al centrómero (Figura 8). La significancia de una de las CNVs (cnvdup137), se mantiene (p= 0,01456) posterior a la corrección de Bonferroni-Holm por las pruebas totales (158) para el fenotipo de trastorno del estado de ánimo. Esta misma variante, fue la que mantuvo una p más cercana a la significancia para el fenotipo de psicosis, después de la corrección (p=0.05728). Dado lo anterior, se presenta un resultado positivo al primer objetivo del presente estudio, en donde se puede expresar que, en efecto, la presente familia está segregando al menos una variante genética estructural asociada a la presencia de psicosis y/o presencia de trastornos del estado de ánimo. 20 Figura 7. Ilustración de la ubicación cromosómica de las 15 CNVs significativas previo a la corrección por Bonferroni-Holm. El código de color hace referencia al fenotipo asociado, amarillo: significativas para el fenotipo de psicosis, rojo: significativas para el fenotipo de trastornos del estado de ánimo y naranja: significativas en ambos fenotipos. Ambos fenotipos comparten 5 CNVs significativas previo a la corrección. 21 Posterior a la corrección, solamente una de las CNVs mantiene la significancia, cnvdup137, para el fenotipo de trastornos del estado de ánimo (p= 0,01456). Figura 8. Ilustración de la ubicación cromosómica de las 15 CNVs significativas, 9 duplicaciones y 6 deleciones, previo a la corrección por Bonferroni-Holm, el código de color hace referencia al tipo de CNV que es: duplicación en color azul y deleción en color verde, muchas de estas se ubican en regiones cercanas al centrómero. Anotaciones genéticas Se analizó la presencia de genes, variantes de pérdida de función, “missense” y sinónimas reportadas en la literatura para las 15 CNVs significativas antes de la corrección. No se encontraron variantes de perdida de función, no obstante, se encontraron variantes con probabilidad de pérdida de función (pLoF). Se encontraron 29 genes distintos tanto codificantes como no codificantes (Cuadro IV). 22 Cuadro IV. Anotaciones para las 15 CNVs significativas antes de la corrección por Bonferroni-Holm. Se adjuntan para cada CNV las características de posición, longitud y tipo, además se añade los resultados de asociación, con los respectivos valores de p y el fenotipo al que corresponden. Se analizó la presencia de genes, variantes pLoF, missense y sinónimas reportadas en gnomAD. PS: Psicosis, TE.An: Trastornos del Estado de Ánimo, Chr: Cromosoma, Vrs: variantes, Fen: Fenotipo. CNV Características CNV Asociación Anotaciones gnomAD Chr Inicio Final Longitud Tipo Fen. P P corregida genes codificantes genes no codificantes Vrs. anotaciones VEP Vrs. pLoF Vrs. Missense Vrs. Sinónimas cnvdel143 chr20 29125501 29160500 34999 DEL PS 0,027 1 - - - - - - cnvdel150 chr22 10634001 10684000 49999 DEL TE.An 0,015 1 - - - - - - cnvdel221 chr9 39150001 39168000 17999 DEL PS 0,042 1 CNTNAP3 RBM17P1, AL353729.2 - - - - cnvdel232 chr9 42408501 42731000 322499 DEL PS 0,015 1 - SDR42E1P2,ATP5F1AP1,RAB28P3, RBPJP6,BX088651.4,BX088651.1,B X088651.2,FGF7P5,BX088651.3,FG F7P4,BX664718.1,CNTNAP3P7 7 7 - - cnvdel40 chr10 40430001 40435500 5499 DEL TE.An 0,044 1 - - - - - - cnvdel73 chr13 16165001 16229000 63999 DEL TE.An 0,002 0,419 - - - - - - cnvdup12 chr1 123664001 123769000 104999 DUP Ambos PS: 0,003 TE. Animo: 0,038 PS: 0,496 TE. Animo: 1 - - - - - - cnvdup137 chr2 89032501 89049000 16499 DUP Ambos PS: 0,0003 TE.An: 0,000091 PS: 0,057 TE. Animo: 0,014 IGKV1-12 IGKV1-13 168 14 110 44 cnvdup175 chr22 23992001 24009000 16999 DUP TE.An 0,041 1 GSTT4 AC253536.4 242 27 151 64 cnvdup183 chr3 91514501 91545000 30499 DUP Ambos PS: 0,002 TE.An: 0,008 PS: 0,359 TE.An: 1 - - - - - - cnvdup189 chr3 195663001 195677500 14499 DUP Ambos PS: 0,009 TE.An: 0,001 PS: 1 TE.An: 0,236 - MUC20-OT1,SDHAP2 10 10 - - cnvdup219 chr7 62259001 62299000 39999 DUP PS 0,045 1 - AC128676.1 - - - - cnvdup264 chr9 65954001 65997000 42999 DUP PS 0,035 1 - - - - - - cnvdup63 chr14 18324001 18345500 21499 DUP Ambos PS: 0,004 TE.An: 0,0007 PS: 0,695 TE.An: 0,124 - CR383658.1,RNU6-458P 2 2 - - cnvdup92 chr16 22565001 22605000 39999 DUP PS 0,005 0,899 - OTOAP1 6 6 - - 23 Se incluyeron los genes codificantes (Cuadro V) en el programa GeneMania, únicamente 2 genes presentaban redes de interacción reportadas (CNTNAP3 en cnvdel221 y GSTT4 en cnvdup175) (Figura 9). Cuadro V. Genes codificantes encontrados en CNVs significativas previo a la corrección por Bonferroni-Holm. Se adjunta la información de la posición, longitud, banda, nombre principal, otros nombres y Ensambl ID del gen. Además, se adjunta ID, posición, longitud y fenotipo al que dio asociación de la CNV. En esta red se determinaron 77.64% de interacciones físicas o interacciones proteína- proteína (datos recopilados de BioGRID y PathwayCommons). 8.01% de co-expresión; basado en si los genes presentan niveles de expresión similares en todas las condiciones de estudios de expresión (datos recopilados de Gene Expression Omnibus). 5.38% de predicciones de relaciones funcionales entre genes (datos recopilados de predicciones basadas en relaciones funcionales por ortología). 3.63% de relaciones de co-localización; que brinda información de si los genes son expresados en el mismo tejido, o si las proteínas de estos están en la misma ubicación. 2.87% de interacciones génicas, que determina si están asociados funcionalmente (Figura 9). Los porcentajes más bajos de la red fueron el de vías o rutas, con 1.88%, en donde se ejemplifica si dos productos génicos participan en la misma reacción dentro de una vía; y el de dominios de proteínas compartidos, con 0.60%; en este último se brinda la información de si dos productos génicos tienen el mismo dominio proteico (Figura 9). 24 Figura 9. Red de interacción, generada con Genemania, para los genes CNTNAP3 (perteneciente al CNV cnvdel221) y GSTT4 (perteneciente al CNV cnvdup175), los cuales se pueden identificar por las rayas claras dentro del círculo gris. En color rosa se representan las interacciones físicas, esto se obtiene de datos de interacción proteína-proteína. En color morado la co-expresión, que se obtienen de datos de expresión génica. En color naranja las predicciones de relaciones funcionales entre genes, a menudo interacciones de proteínas. En azul la co-localización que se refiere a genes expresados en el mismo tejido, o proteínas encontradas en la misma ubicación. En verde las interacciones génicas. En color celeste las vías o rutas, brinda la información cuando dos productos génicos están vinculados en la misma reacción dentro de una vía. En color amarillo se denotan los dominios de proteínas compartidos. También se realizó una segunda red con BioNetUCR, la cual brinda una topología de red de interacciones de regulación transcripcional. En esta se puede identificar el efecto que ejercen los genes de interés sobre otros elementos genéticos. Solamente se encontraron 25 interacciones de elementos génicos sobre un único gen, CNTNAP3 que se enmarca en cnvdel221. Se encontraron 4 microARNs y un factor transcripcional que regulan la expresión de CNTNAP3 (Figura 10). Figura 10. Topología de red de interacciones de regulación transcripcional, generada con BioNetUCR, donde se puede identificar el efecto que ejercen especies genéticas sobre uno de los genes de interés CNTNAP3. Genes candidatos Posterior a la corrección por Bonferroni-Holm, se encontró únicamente una CNV significativa para el fenotipo de trastorno del estado de ánimo (p=0,01456), cnvdup137. Esta también fue la CNV con mayor significancia en el fenotipo de Psicosis (p=0,05728). Dentro de esta CNV se encuentran dos genes, uno codificante IGKV1-12 y uno no codificante IGKV1-13. Se validó con CNVpytor que los heterocigotos para esta variante fueran reales. En la figura 11a se evidencia la ausencia de la variante, contrario a las figuras 11b, 11c y 11d donde se observa el aumento significativo de la profundidad de lectura. 26 Figura 11. Validación de la variante cnvdup137, utilizando la graficación de CNVpytor. Únicamente se encontró la variante de manera heterocigota. En el recuadro a se evidencia la ausencia de la variante, mientras que en los recuadros b, c y d se evidencia la presencia de la duplicación, mediante el aumento significativo de la profundidad de lectura. Para determinar qué vías o genes se ven comprometidos por la ganancia de cnvdup137, se analizaron los elementos génicos de la CNV en VEP, Decifer, gnomAD, UCSC Genome Browser y DGV. Se encontraron reportes de 40 pacientes con CNVs que contenían ambos genes. El fenotipo más frecuente de los pacientes fue el de capacidad intelectual disminuida. El modo de herencia fue mayoritariamente desconocido (Figura 12). Los genes comprendidos por cnvdup137, IGKV1-12 y IGKV1-13, no se encontraron en redes conocidas de interacción génica. 27 Figura 12. Ilustraciones de Decipher (Firth et al. 2009), para las CNVs reportadas que contienen los genes IGKV1-12 y IGKV1-13. Los reportes son de 40 pacientes. Se evidencia como los pacientes en los que se encontraron CNVs con estos genes, el fenotipo más frecuente fue el de capacidad intelectual disminuida, además de que el modo de herencia de estas CNVs fue mayoritariamente desconocido. 28 DISCUSIÓN Llamado y filtrado de variantes El hecho de que las personas de la familia presenten en promedio 278 (±17) CNVs, y alrededor de 33 (±5) CNVs no reportados en DGV, le brinda relevancia y novedad a los resultados del análisis. Se estima que se encuentran en promedio 30 CNVs por persona, sin embargo, la literatura reporta este número para CNVs grandes, aquellos mayores a 100 Kb (Itsara et al. 2009). Varios autores señalan que una carga mayor de CNVs ha estado asociada a medidas bajas en habilidades cognitivas (Girirajan et al. 2011; Jensen et al. 2018; Pinto et al. 2010). Es relevante que las variantes reportadas estén mayoritariamente entre 5.9 a 12kb. CNVs grandes se caracterizan por ser altamente penetrantes, pero de vida corta, la gran mayoría son de novo y si persisten, lo hacen por muy pocas generaciones (Itsara et al. 2009). CNVs pequeños, menores a 100 Kb, tienen mayor probabilidad de segregar por más generaciones, debido a que están sometidos a una menor presión selectiva (Itsara et al. 2009). El tener mayor cantidad de duplicaciones (271), que de deleciones (235) es consistente con la literatura, ya que las deleciones por estar sometidas a una mayor presión selectiva son menos frecuentes (Iafrate et al. 2004). Las variantes estructurales reportadas en este estudio son de gran interés ya que ninguna de estas está situada en un “hotspot” de CNVs reportado (Perry et al. 2006). Las variantes categorizadas como patogénicas o potencialmente patogénicas en ISV y strVCTVRE, no se evaluaron en la prueba de asociación con el fenotipo. Lo anterior debido a que se presentaban en menos del 5% de las personas que componen la familia. La mayoría de las variantes reportadas no eran patogénicas, no obstante, se debe tener en consideración que estas herramientas se alimentan de las bases de datos actuales de CNVs. Las bases de datos actuales de CNVs no son extensas, como las bases de datos de SNV, esto se debe los pocos estudios en estas variantes. Pös y colaboradores (2021), reportan que, mediante una búsqueda en PubMed, desde 1983 hasta el 2020, con el término “copy number variation” solamente se encontraron 4,759 artículos, sin aplicar ningún otro filtro. Lo anterior dimensiona la falta de información que se tiene de este tipo de variantes estructurales. Esto se puede ver como una oportunidad para seguir realizando hallazgos en esta área. 29 Que se hayan identificado la mayoría de las personas tanto en el caso de psicosis como en el caso de personas con trastornos del estado de ánimo con 1 o más CNVs raras que no se observaron en las personas sin estos fenotipos, apoya la hipótesis de que algunas de estas CNVs están aumentando el riesgo para estos padecimientos. Esta misma lógica fue comprobada por Ikeda y colaboradores (2010) al determinar mayor frecuencia de ciertas CNVs en casos, y luego determinar asociación de estos para el fenotipo de SZ en población japonesa. Prueba de asociación en familias Las variantes reportadas para ambos fenotipos como significativas previo a la corrección de Bonferroni-Holm, son las de mayor interés. Estas podrían relacionarse con la variación de categorías diagnósticas vistas en la familia. Las variantes compartidas fueron: cnvdup12, cnvdup137, cnvdup183, cnvdup189 y cnvdup63. La única significativa posterior a la corrección de Bonferroni-Holm, fue cnvdup137, también fue la de mayor significancia en ambos fenotipos previo a corrección. Esto le brinda mayor peso a ser una variante candidata para explicar los fenotipos. Cabe destacar que fue la única de estas 5 variantes que contenía un gen codificante, del cual se hablará más en detalle en la sección de genes candidatos. Que se comparta en ambos fenotipos la variante con mayor significancia es congruente con la literatura. Se ha evidenciado que los trastornos psiquiátricos se superponen sustancialmente a nivel genético (Calabrò et al. 2020; Cross-Disorder Group of the Psychiatric Genomics Consortium 2013; Lee, Feng & Smoller, 2021; O'Donovan & Owen, 2016; Xia et al. 2019; Visscher et al., 2017). Actualmente se denota a las variantes de riesgo compartidas en varios trastornos psiquiátricos como variantes de vías de riesgo transdiagnóstico (Chawner et al. 2023; Grotzinger, 2021). El termino de vías de riesgo transdiagnóstico se acuño en estudios en familias, donde los parientes cercanos a un individuo, con un trastorno psiquiátrico particular, tienen mayor riesgo de presentar varios trastornos psiquiátricos y no solo el trastorno presente en el individuo, esto por afectación a las vías de riesgo transdiagnóstico (Dean et al. 2010; Sharp, Critchley & Eccles, 2021). Además de esto, se estima que aproximadamente el 90 % de las variantes de trastornos complejos como los trastornos psiquiátricos, son pleiotrópicas, por lo 30 que pueden dar diversos resultados fenotípicos (Lee, Feng & Smoller, 2021; Watanabe et al. 2019; Malhotra & Sebat, 2012). Esta CNV asociada, brinda un panorama de investigación para evaluarla en estudios futuros analizando la presencia de características prodrómicas comunes entre psicosis y trastornos del estado de ánimo, como presencia de alucinaciones, discurso desorganizado, comportamiento psicomotor anormal y entre otros. También plantea la posibilidad de que sea parte de la estructura génica de variantes de riesgo transdiagnóstico que pueden estar presentes en la familia. Genes candidatos El sistema inmunitario está implicado en el curso de numerosas enfermedades del sistema nervioso central (SNC) (Krumbholz et al. 2012). Un ejemplo claro de esto es la esclerosis múltiple, el cual es un trastorno autoinmune del SNC que implica respuestas inmunitarias dirigidas contra autoantígenos del SNC (Wanleenuwat & Iwanowski, 2019). Una característica de este padecimiento es el aumento de células B, células plasmáticas clonalmente expandidas e inmunoglobulinas oligoclonales (Künzle, 2007). Dado lo anterior, se puede pensar que las inmunoglobulinas están jugando un papel relevante en la patogénesis de los fenotipos de la familia, ya que la única variante que mantuvo la significancia posterior a la corrección de Bonferroni-Holm, fue cnvdup137. Esta CNV contiene 2 genes, uno codificante IGKV1-12, y uno no codificante IGKV1-13. Además, traslapa con el locus kappa de inmunoglobulina, también conocido como IGK; esta región se ubica en 2p11.2, y contiene los genes para las cadenas ligeras kappa de anticuerpos (o inmunoglobulinas) (Lefranc, 2001). Existen varios estudios que relacionan las inmunoglobulinas con vías del sistema nervioso central. Yin y colaboradores (2022), encontraron proteínas de anticuerpos reguladas al alza como la cadena J de inmunoglobulina (IGJ) y algunas IGK, específicamente se encontró la IGKV1-12, esto se correlacionó a problemas en el desarrollo del sistema nervioso, incluida la generación de neuronas, el desarrollo de neuronas, el reconocimiento de neuronas y el desarrollo de axones. Varios estudios identifican vías inflamatorias en las que participan inmunoglobulinas como biomarcadores sanguíneos fiables para determinar Enfermedad de Alzheimer y otras demencias (Aiyaz et al. 2012; Jang et al. 2019). Lo anterior 31 apoya los resultados encontrados en Decipher, donde otras CNVs que contienen IGKV1-12, se han presentado en individuos que mayoritariamente presentan capacidad intelectual disminuida. Particularmente, desregulaciones en IGKV1-12 se han correlacionado con resultados de accidentes cerebrovasculares (Carmona-Mora et al. 2023). Lokhande (2017) detectó a IGKV1-12 como parte de complejos proteicos estadísticamente significativos del integroma en la enfermedad de Huntington. La proteína IGKV1-12 también se encontró en muestras de péptidos filtrados de personas con epilepsia en un estudio de marcadores exosomales para este padecimiento (Bouza-Muvilla, 2022). Por otro lado, se ha asocio significativamente IGKV1-12 y otras inmunoglobulinas que sus cambios de expresión, desencadenan la señalización de mTOR en trastornos del neurodesarrollo, vinculando las vías del sistema inmunitario con enfermedades psiquiátricas (Feuer et al. 2022). Se ha documentado como la vía AKT-mTOR se puede estar siendo afectada por el aumento de IGK (Figura 13). IGK interactúa con el dinero de integrina β1, esto desencadena la fosforilación y activación de FAK, que activa a la fosfoinocitol-3-kinasa (PI3K), un factor corriente arriba de AKT (Wang et al. 2022). El aumento en la vía AKT- mTOR disminuye la expresión de DISC1, el cual tiene un papel fundamental en la neuro expresión de dopamina (Ryskalin et al. 2018; Schurov et al. 2004). Además, DISC1 tiene la función de bloquear dicha vía, con su disminución en la expresión, se estimula aún más la vía AKT-mTOR (Ryskalin et al. 2018). El estímulo de esta vía desencadena una cascada de señalización que terminan en la disminución de la expresión de neoregulina1 (NRG1) (Ryskalin et al. 2018). La alteración en la expresión de NRG1 se ha asociado con problemas de la regulación del neurodesarrollo y la neurotransmisión (Mei & Xiong 2008). Por otro lado, la alteración en la expresión de DISC1, se ha asociado con problemas en la neurogénesis, migración neuronal, formación de sinapsis, neurotransmisión de dopamina, y un aumento del riesgo para desarrollar esquizofrenia (Schurov et al. 2004). Esto puede estar pasando en esta familia al existir personas que tienen una duplicación del gen completo de IGKV1-12. Sin embargo, esto debe demostrarse con ARNseq y la expresión del gen. 32 Figura 13. Ilustración del posible mecanismo por el cual IGK puede estar afectando la via AKT-mTOR. Imagen adaptada de: Ryskalin et al. (2018) y Wang et al. (2022). Al tener mayor cantidad de inmunoglobulinas kappa variable, esto puede generar una respuesta inmune mayor, o generar respuestas inmunes atípicas (Hewitt et al. 2008). Algunos autores han planteado que, en padecimientos con un amplio espectro fenotípico, como los trastornos psiquiátricos, este amplio espectro se debe a variaciones de las vías inmunológicas (Gennery, 2012; Raje, 2018; Sullivan et al. 1998; Davies et al. 2001; Jawad et al. 2001; Gennery et al. 2002; Smith et al. 1998; Bennett & Molofsky, 2019). Raje (2018) presenta el ejemplo del síndrome de deleción 22q11.2 (22qDS), en el que se ha visto que las manifestaciones fenotípicas y la gravedad del padecimiento pueden variar incluso entre individuos dentro de una misma familia y con la misma deleción, por cambios en algunas vías de expresión en las que participan los linfocitos T. Raje (2018) además mostró varios genes de inmunoglobulinas regulados al alza en pacientes con manifestaciones diferentes de 22qDS. El hecho de que ambos fenotipos se asociaron con cnvdup137, le da un mayor peso a esta para poder ser una posible variante de riesgo transdiagnóstico. Se debe evaluar la 33 expresión génica de IGKV1-12 en personas padecientes y no padecientes de los fenotipos analizados. Esto con la finalidad de determinar el aporte de esta variante a la arquitectura genética de trastornos psiquiátricos presentes en la familia. Anotaciones genéticas En 6 de las 15 CNVs significativas previo a la corrección de Bonferroni reportan en gnomAD la existencia de variantes SNV con potencial de pérdida de función y cambio de sentido o missense. Esto señala la importancia de hacer un llamado de SNVs en futuros análisis para determinar si estas variantes se encuentran presentes en la familia. En las redes de interacción únicamente se relacionaron 2 de los 3 genes codificantes encontrados en la muestra de CNVs, CNTNAP3 (Contactin Associated Protein Family Member 3) en cnvdel221 y GSTT4 (Glutathione S-Transferase Theta 4) en cnvdup175, para los fenotipos de psicosis y trastornos del estado de ánimo, respectivamente. En la red las interacciones físicas prevalecen, y los genes con los que estas interacciones tienen lugar son encontrados en vías de regulación de la inflamación o regulación de expresión de células linfocíticas (Alizadeh et al. 2000; Whisenant et al. 2015; Jiang et al. 2017; Von Hundelshausen et al. 2017; Lum et al. 2018). Además, se encuentran interacciones relevantes, como la de APBA1, en co-expresión con ambos genes. APBA1, interacciona con el precursor proteico amiloide asociado con la enfermedad de Alzheimer y se ha asociado con procesos de memoria (Mustafin et al. 2020), funciones cognitivas (Davies et al. 2016) y presencia de trastornos depresivos. (Yun et al. 2015). También en la red se evidencia la relación de NRG1, en co-expresión con CNTNAP3, e interacción génica con APBA1. La proteína codificada por el gen CNTNAP3 pertenece a la familia Neuroxin- IV/CNTNAP Paranodin, cuya función biológica es la mediación de las interacciones neurona-células gliales (Bhat et al. 2001). Ha sido detectada en varias regiones del cerebro de los ratones (corteza, lóbulos frontales, cuerpo calloso, hipocampo, etc.) (Spiegel et al. 2002). Esta proteína puede desempeñar un papel en el reconocimiento de células dentro del sistema nervioso, y puede tener roles en vías inmunológicas y de sistema nervioso central (Poliak et al. 1999; Rios et al. 2000; Spiegel et al. 2002; Huang et al. 2017). En particular, la variación del número de copias del gen CNTNAP3 se ha encontrado asociada a la enfermedad de Crohn (Huang et al. 2017). 34 Al igual que en este estudio, otros han relacionado CNTNAP3 con padecimientos mentales como la SZ. Estos estudios sugieren que la interrupción de los circuitos neuronales del cerebro que ocurre en SZ puede estar asociado con la desregulación de CNTNAP3 (Chua et al. 2007; Wagner et al. 2015). Okita y colaboradores (2017), determinaron que la expresión anormal de CNTNAP3 puede estar asociada con la patogenia de SZ. Otros estudios determinaron, en ratones, que la ausencia completa del gen CNTNAP3 daba como resultado déficit en interacción social y aprendizaje espacial, además de comportamientos repetitivos prominentes, y concluyeron que CNTNAP3 juega un papel fundamental en el desarrollo de sinapsis y los comportamientos sociales (Hirata et al. 2016; Tong et al. 2019). Toda la familia de proteínas Neuroxin-IV/CNTNAP Paranodin, se ha asociado a enfermedades del sistema nervioso, ya que su estructura y función es crucial para la correcta mielinización de los axones (Zou et al. 2017). Esto apoya la hipótesis de que tener cnvdel221, en la cual se da una deleción parcial del gen CNTNAP3, puede colaborar, en conjunto con la presencia de otras variantes de riesgo, con la presencia de fenotipos anormales del comportamiento, como trastornos psicóticos. Por otro lado, las glutatión S-transferasas (GST) constituyen una familia de enzimas multifuncionales, que catalizan la conjugación del glutatión a compuestos electrofílicos, incluidos productos del estrés oxidativo, carcinógenos, algunos fármacos quimioterapéuticos, entre otros (Keen & Jakoby 1978; Hayes et al. 2005; Minina et al. 2017). De la familia de GST, GSTT4 no ha sido tan ampliamente estudiado, ya que antes se le categorizaba como un pseudogen, debido a que es común encontrar fusión del gen GSTT4 con GSTT1 y que estos se expresen como un solo gen (Lin et al. 2015). Recientemente GSTT4 ha tomado relevancia al estar asociado positivamente a la muerte súbita inesperada en epilepsia (SUDEP) lo que fue confirmado con modelos animales (Chen et al. 2021; Christiansen et al. 2021). Pocos estudios han analizado las duplicaciones del gen GSTT4; únicamente se encontraron dos estudios con CNVs que involucraron GSTT4, uno evaluando su asociación a personalidad impulsiva-desinhibida (Laplana et al. 2014). La sobreexpresión de este gen se ha asociado con funciones gliales en Drosophila (Lago-Baldaia et al. 2022). Además, otros miembros de la misma familia, como GSTT1, se han asociado fuertemente con riesgo de enfermedad de Alzheimer (Jafarian et al. 2017). Se ha encontrado 35 que GSTT1 y GSTT4 presentan una metilación diferencial en personas con problemas del desarrollo del sistema nervioso central (Cobben et al. 2018), y ambos genes han presentado variantes genéticas reportadas como moduladoras de enfermedades psiquiátricas (Rahbar et al. 2015; Shi & Wang, 2018). Se sabe que los genes de la familia de GST son un factor clave en la regulación de la expresión del factor nuclear κB (NF-κB) (Hayes et al. 2005) (Figura 14). NF-κB es clave en las vías proinflamatorias ligadas a depresión, ya que estimula la liberación de otras citocinas proinflamatorias, incluido el factor de necrosis tumoral (TNF) e IL-6, que junto con IL-1β e IL-18 pueden acceder al cerebro a través de rutas humorales y neurales (Bierhaus et al. 2003; Pase et al. 2006). Se ha asociado los cambios en expresión de NF-κB a trastornos del estado de ánimo (Koo et al. 2010). Figura 14. Ilustración del posible mecanismo por el cual GST puede estar afectando la expresión de NF-κB. GST media la isomerización de las prostaglandinas de PGH2 a PGD2, luego de varios procesos esta se convierte en 15-dPGJ2. La eliminación de 15-dPGJ2 es mediado por la conjugación del mismo con GST y se excreta por vías celulares. 15-dPGJ2 inhibe la expresión de NF-κB. Imagen adaptada de: Hayes, Flanagan & Jowsey (2005) y Koo et al. (2010). 36 Otra vía con la que se relacionan las GST a trastornos del estado de ánimo es mediante la vía de los receptores de glutamato y la liberación de glutamato (Hayes et al. 2005; Sedlak et al. 2019). Al darse una liberación alta de glutamato, se bloquea la recaptación de este por parte de los astrocitos, resultando en un exceso de glutamato tanto dentro como fuera de la sinapsis; cuando se da una unión del glutamato a los receptores NMDA extrasinápticos resulta en un aumento de la excitotoxicidad y una disminución de la producción del factor neurotrófico derivado del cerebro (BDNF) (Hardingham et al. 2002; Tavares et al. 2002). El BDNF es clave en el proceso de neurogénesis, y se ha determinado como relevante en el fenotipo de depresión (Goshen et al. 2008; Koo et al. 2010). Dado lo anterior, se puede pensar que una desregulación en el gen GSTT4 podría estar causando una expresión diferencial en NF-κB y su asociación con el fenotipo de trastornos del estado de ánimo previo a la corrección de Bonferroni-Holm. Sin embargo, es necesario validar esta hipótesis con técnicas como ARN-seq para evaluar expresión diferencial en la familia. Si bien las variantes cnvdel221 (que contiene CNTNAP3) y cnvdup175 (que contiene GSTT4), no dieron resultados significativos para los fenotipos posterior a la corrección de Bonferroni-Holm, podrían ser buenas candidatas para variantes de riesgo transdiagnóstico, y explicar, en parte, la presencia de psicosis y trastornos del estado de ánimo en la familia. Se recomienda tomarlas en cuenta para futuros estudios en la familia analizada. Se debe considerar que el programa utilizado para realizar la asociación en familias (FBAT), no toma en cuenta las relaciones consanguíneas, ni relaciones familiares de primos, sino únicamente las relaciones de genotipos parentales (Chen et al. 2022), por lo que los resultados presentados en este trabajo se pueden consideran conservadores. Se recomienda realizar una segunda prueba de asociación con otros programas para validar estos resultados. 37 CONCLUSIONES Existen dos objetivos principales para este estudio. El primero fue analizar si la presente familia estaba segregando variantes genéticas estructurales asociadas a la presencia de psicosis y/o presencia de trastornos del estado de ánimo. Los resultados muestran que existe al menos una variante de número de copia, cnvdup137, que está segregando para el fenotipo de trastornos del estado de ánimo. Sin embargo, existen otras variantes que por los elementos genéticos que engloban son buenas candidatas para explicar parte de la arquitectura genética de los fenotipos de estudio en la familia (cnvdel221 que contiene CNTNAP3 y cnvdup175 que contiene a GSTT4). Esto plantea la posibilidad de realizar un nuevo análisis de asociación utilizando programas que estén mejor adaptados para las uniones consanguíneas presentes en la muestra. El segundo objetivo fue determinar qué vías o genes se ven comprometidas o interrumpidas por la ganancia o pérdida de estas variantes de número de copias, si es que estas existen. La variante asociada contiene 2 genes, uno codificante IGKV1-12, y uno no codificante IGKV1-13; además traslapa con el locus kappa de inmunoglobulina, que contiene los genes para las cadenas ligeras kappa de anticuerpos (o inmunoglobulinas). Estos resultados apoyan la amplia línea de investigación que demuestra la implicación que tiene el sistema inmunitario en el curso de numerosas enfermedades del sistema nervioso central. En este estudio se proporciona la primera evidencia de CNVs asociadas a padecimientos psiquiátricos en población costarricense, además plantea las bases para comenzar la investigación a fondo sobre alteraciones en la función inmunitaria de esta familia que estén aumentando el riesgo de padecimientos psiquiátricos. Se tiene claro que responder a la pregunta de cómo afecta o contribuye el sistema inmunológico a la modificación o causa de una enfermedad psiquiátrica es un gran desafío, sin embargo, hay evidencia fuerte de la estrecha relación entre ambos sistemas. Quizás reforzar la línea de investigación en inmunopsiquiatría ayude a descubrir nuevas variantes para disminuir la heredabilidad faltante de algunos de estos padecimientos. Se debe investigar a profundidad la clara evidencia de correlaciones entre la alteración inmunitaria y la enfermedad psiquiátrica. Como siguientes pasos, se propone realizar perfiles de expresión con ARNseq para determinar expresión diferencial, si es que existe, de inmunoglobulinas en las personas padecientes de psicosis y trastornos afectivos en comparación con aquellos que no los padecen, dentro de la muestra familiar. 38 REFERENCIAS Acón, M., Geiß, C., Torres-Calvo, J., Bravo-Estupiñan, D., Oviedo, G., Arias-Arias, J. L., Rojas-Matey, L.A., Edwin, B., Vasquez-Vargas, G., Oses-Vergas, Y., Guevara-Coto, J., Segura-Castillo, A., Siles-Canales, F., Quiros-Barrantes, S., Regnier-Vigouroux, A., Mendes, P. & Mora-Rodríguez, R. (2021). MYC dosage compensation is mediated by miRNA-transcription factor interactions in aneuploid cancer. IScience, 24(12). Aiyaz, M., Lupton, M. K., Proitsi, P., Powell, J. F., & Lovestone, S. (2012). Complement activation as a biomarker for Alzheimer's disease. Immunobiology, 217(2), 204-215. Alizadeh, A. A., Eisen, M. B., Davis, R. E., Ma, C., Lossos, I. S., Rosenwald, A., Boldrick, J.C., Sabet, H., Tran, T., Yu, X., Powell, J.I., Yang, L., Marti, G.E., Moore,T., Hudson, J., Lu, L., Lewis, D.B., Tibshirani, R., Sherlock, G., Chan, W.C., et al. Staudt, L. M. (2000). Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature, 403(6769), 503-511. American Psychiatric Association. (2014). Guía de consulta de los criterios diagnósticos del DSM-5. Arlington. American Psychiatric Publishing. Bailer, U., Leisch, F., Meszaros, K., Lenzinger, E., Willinger, U., Strobl, R., Heiden, A., Gebhardt, C., Döge, E., Fuchs, K., Sieghart, W., Kasper, S., Hornik, K., Aschauer, H. N. (2002). Genome scan for susceptibility loci for schizophrenia and bipolar disorder. Biological psychiatry, 52(1), 40-52. Bassett, A. S., Marshall, C. R., Lionel, A. C., Chow, E. W., & Scherer, S. W. (2008). Copy number variations and risk for schizophrenia in 22q11. 2 deletion syndrome. Human molecular genetics, 17(24), 4045-4053. Bennett, F. C., & Molofsky, A. V. (2019). The immune system and psychiatric disease: a basic science perspective. Clinical & Experimental Immunology, 197(3), 294-307. Bergen, S. E., Ploner, A., Howrigan, D., CNV Analysis Group and the Schizophrenia Working Group of the Psychiatric Genomics Consortium, O’Donovan, M. C., 39 Smoller, J. W., Sullivan, P.F., M.D., F.R.A.N.Z.C.P., Sebat, J., Neale, B. & Kendler, K. S. (2018). Joint contributions of rare copy number variants and common snps to risk for schizophrenia. American Journal of Psychiatry, 176(1), 29-35. Berrettini, W. (2004). Bipolar disorder and schizophrenia. Neuromolecular Medicine, 5(1), 109-117. Bierhaus, A., Wolf, J., Andrassy, M., Rohleder, N., Humpert, P. M., Petrov, D., Ferstl, R., von Eynatten, M., Wendt, T., Rudofsky, G., Joswig, M., Morcos, M., Schawaninger, M., McEwen, B., Kirschbaum, C. & Nawroth, P. P. (2003). A mechanism converting psychosocial stress into mononuclear cell activation. Proceedings of the National Academy of Sciences, 100(4), 1920-1925. Bhat, M. A., Rios, J. C., Lu, Y., Garcia-Fresco, G. P., Ching, W., Martin, M. S., Li, J., Einheber, S., Chesler, M., Rosenbluth, J., Salzer, J.L. & Bellen, H. J. (2001). Axon- glia interactions and the domain organization of myelinated axons requires neurexin IV/Caspr/Paranodin. Neuron, 30(2), 369-383. Bouza Muvilla, L. I. (2022). Marcadores exomales en epilepsia. Tesis de Grado en Medicina. Universidad de Salamanca Calabrò, M., Porcelli, S., Crisafulli, C., Albani, D., Kasper, S., Zohar, J., ... & Serretti, A. (2020). Genetic variants associated with psychotic symptoms across psychiatric disorders. Neuroscience letters, 720, 134754. Cardno, A. G., Rijsdijk, F. V., Sham, P. C., Murray, R. M., & McGuffin, P. (2002). A twin study of genetic relationships between psychotic symptoms. American Journal of Psychiatry, 159(4), 539-545. Carmona-Mora, P., Knepp, B., Jickling, G. C., Zhan, X., Hakoupian, M., Hull, H., Alomar, N., Amini, H., Sharp, F.R., Stamova, B. & Ander, B. P. (2023). Monocyte, neutrophil, and whole blood transcriptome dynamics following ischemic stroke. BMC medicine, 21(1), 1-24. Chavarria-Siles, I., Walss-Bass, C., Quezada, P., Dassori, A., Contreras, S., Medina, R., Ramirez, M., Armas, R., Salazar, R., Leach, R.J., Raventos, H., & Escamilla, M.A. 40 (2007). TGFB-induced factor (TGIF): a candidate gene for psychosis on chromosome 18p. Molecular psychiatry, 12(11), 1033. Chawner, S. J., Evans, A., IMAGINE-ID consortium, Williams, N., Owen, M.J., Hall, J. & van den Bree M. (2023). Sleep disturbance as a transdiagnostic marker of psychiatric risk in children with neurodevelopmental risk genetic conditions. Translational Psychiatry, 13(1), 7. Chen, W., Coombes, B. J., & Larson, N. B. (2022). Recent advances and challenges of rare variant association analysis in the biobank sequencing era. Frontiers in Genetics, 13, 1014947. Chen, D., Zhu, L., Lin, X., Zhou, D., & Liu, L. (2021). Dysregulated long noncoding RNAs in the brainstem of the DBA/1 mouse model of SUDEP. BMC genomics, 22, 1-11. Christiansen, S. N., Jacobsen, S. B., Andersen, J. D., Kampmann, M. L., Trudsø, L. C., Olsen, K. B., Tfelt-Hansen, J., Banner, J. & Morling, N. (2021). Differential Methylation in the GSTT1 Regulatory Region in Sudden Unexplained Death and Sudden Unexpected Death in Epilepsy. International Journal of Molecular Sciences, 22(6), 2790. Chua, S. E., Cheung, C., Cheung, V., Tsang, J. T., Chen, E. Y., Wong, J. C., Cheung, J.P.Y., Yip, L., Tai, K., Suckling, J. & McAlonan, G. M. (2007). Cerebral grey, white matter and csf in never-medicated, first-episode schizophrenia. Schizophrenia research, 89(1-3), 12-21. Cobben, J. M., Krzyzewska, I. M., Venema, A., Mul, A. N., Polstra, A., Postma, A. V., Smigiel, R., Pesz, K., Niklinski, J., Chomczyk, M.A., Henneman, P., & Mannens, M. M. (2018). DNA methylation abundantly associates with fetal alcohol spectrum disorder and its subphenotypes. Epigenomics, 11(7), 767-785. Contreras, J., Dassori, A., Medina, R., Raventos, H., Ontiveros, A., Nicolini, H., Munoz, R. & Escamilla, M. (2009). Diagnosis of schizophrenia in latino populations: a comparison of direct interview and consensus based multi-source methods. The Journal of nervous and mental disease, 197(7), 530-535. 41 Correll, C. U., Detraux, J., De Lepeleire, J., & De Hert, M. (2015). Effects of antipsychotics, antidepressants and mood stabilizers on risk for physical diseases in people with schizophrenia, depression and bipolar disorder. World psychiatry, 14(2), 119-136. Craddock, N., O'donovan, M. C., & Owen, M. J. (2007). Phenotypic and genetic complexity of psychosis: invited commentary on… Schizophrenia: a common disease caused by multiple rare alleles. The British Journal of Psychiatry, 190(3), 200-203. Craddock, N., O'donovan, M. C., & Owen, M. J. (2006). Genes for schizophrenia and bipolar disorder? Implications for psychiatric nosology. Schizophrenia bulletin, 32(1), 9-16. Craddock, N., O’donovan, M. C., & Owen, M. J. (2005). The genetics of schizophrenia and bipolar disorder: dissecting psychosis. Journal of medical genetics, 42(3), 193-204. Cross-Disorder Group of the Psychiatric Genomics Consortium. (2013). Genetic relationship between five psychiatric disorders estimated from genome-wide SNPs. Nature genetics, 45(9), 984-994. Davies, G., Marioni, R. E., Liewald, D. C., Hill, W. D., Hagenaars, S. P., Harris, S. E., ... & Deary, I. J. (2016). Genome-wide association study of cognitive functions and educational attainment in UK Biobank (N= 112 151). Molecular psychiatry, 21(6), 758-767. Davies, K., Stiehm, E. R., Woo, P. A. T. R. I. C. I. A., & Murray, K. J. (2001). Juvenile idiopathic polyarticular arthritis and IgA deficiency in the 22q11 deletion syndrome. The Journal of rheumatology, 28(10), 2326-2334. Dean, K., Stevens, H., Mortensen, P. B., Murray, R. M., Walsh, E., & Pedersen, C. B. (2010). Full spectrum of psychiatric outcomes among offspring with parental history of mental disorder. Archives of general psychiatry, 67(8), 822-829. Escamilla, M. A. (2001). Diagnosis and treatment of mood disorders that co-occur with schizophrenia. Psychiatric Services, 52(7), 911-919. Escamilla, M., Lee, B. D., Ontiveros, A., Raventos, H., Nicolini, H., Mendoza, R., Jerez, A., Munoz, R., Medina, R., Figueroa, A., Walss-Bass C., Armas, R., Contreras, S., Ramirez M.E., & Dassori, A. (2008). The epsin 4 gene is associated with psychotic 42 disorders in families of Latin American origin. Schizophrenia research, 106(2-3), 253-257. Escamilla, M. A., Ontiveros, A., Nicolini, H., Raventos, H., Mendoza, R., Medina, R., Munoz R., Levinson, D., Peralta, J.M., Dassori, A. & Almasy, L. (2007). A genome‐wide scan for schizophrenia and psychosis susceptibility loci in families of Mexican and Central American ancestry. American Journal of Medical Genetics Part B: Neuropsychiatric Genetics, 144(2), 193-199. Feuer, K. L., Peng, X., Yovo, C., & Avramopoulos, D. (2022). DPYSL2/CRMP2 isoform B knockout in human iPSC-derived glutamatergic neurons confirms its role in mTOR signaling and neurodevelopmental disorders. bioRxiv, 2022-11. Firth, H. V., Richards, S. M., Bevan, A. P., Clayton, S., Corpas, M., Rajan, D., van Vooren, S., Moreau, Y., Pettett, R.M. & Carter, N. P. (2009). DECIPHER: database of chromosomal imbalance and phenotype in humans using ensembl resources. The American Journal of Human Genetics, 84(4), 524-533. Franz, M., Rodriguez, H., Lopes, C., Zuberi, K., Montojo, J., Bader, G. D., & Morris, Q. (2018). GeneMANIA update 2018. Nucleic acids research, 46(W1), W60-W64. Freedman, R., Lewis, D. A., Michels, R., Pine, D. S., Schultz, S. K., Tamminga, C. A., Gabbard, G.O., Gau, S.S.F., Javitt, D.C., Oquendo M.A., Shrout P.E., Vieta, E. & Yager, J. (2013). The initial field trials of DSM-5: new blooms and old thorns. American Journal of Psychiatry, 170(1), 1-5 Gažiová, M., Sládeček, T., Pös, O., Števko, M., Krampl, W., Pös, Z., Hekel, R., Hlavačka, M., Kucharík, M., Radvánszky, J., Budiš J. & Szemes, T. (2022). Automated prediction of the clinical impact of structural copy number variations. Scientific Reports, 12(1), 555. Gennery, A. R. (2012). Immunological aspects of 22q11. 2 deletion syndrome. Cellular and Molecular Life Sciences, 69, 17-27. 43 Gennery, A. R., Barge, D., O'sullivan, J. J., Flood, T. J., Abinun, M., & Cant, A. J. (2002). Antibody deficiency and autoimmunity in 22q11. 2 deletion syndrome. Archives of disease in childhood, 86(6), 422-425. Girirajan, S., Brkanac, Z., Coe, B. P., Baker, C., Vives, L., Vu, T. H., Shafer, N., Bernier, R., Ferreno, G.B., Silengo, M., Warren, S.T., Moreno, C.S., Fichara, M., Romano, C., Raskind, W.H. & Eichler, E. E. (2011). Relative burden of large CNVs on a range of neurodevelopmental phenotypes. PLoS genetics, 7(11), e1002334. Girirajan, S., & Eichler, E. E. (2011). De novo CNVs in bipolar disorder: recurrent themes or new directions?. Neuron, 72(6), 885-887. Glahn, D. C., Nimgaonkar, V. L., Raventós, H., Contreras, J., McIntosh, A. M., Thomson, P. A., Jablensky, A., McCarthy, N.S., Charlesworth, J.C., Blackburn, N.B., Peralta, J. M., Knowles, E.E.M., Mathias, S.R., Ament, S.A., McMahon, F.J., Gur, R.C., Bucan, M., Curran, J.E., Almasy, L., Gur, R.E. & Blangero, J. (2018). Rediscovering the value of families for psychiatric genetics research. Molecular psychiatry, 24, 523– 535. Glessner, J. T., Reilly, M. P., Kim, C. E., Takahashi, N., Albano, A., Hou, C., Bradfield, J.P., Zhang, H., Sleiman, P.M.A., Flory, J.H., Imielinski, M., Frackelton, E.C., Chiavacci, R., Thomas, K.A., Garris, M., Otirno, F.G., Davidson, M., Weiser, M., Reichenberg, A. et al. & Hakonarson, H. (2010). Strong synaptic transmission impact by copy number variations in schizophrenia. Proceedings of the National Academy of Sciences, 107(23), 10584-10589. Goshen, I., Kreisel, T., Ben-Menachem-Zidon, O., Licht, T., Weidenfeld, J., Ben-Hur, T., & Yirmiya, R. (2008). Brain interleukin-1 mediates chronic stress-induced depression in mice via adrenocortical activation and hippocampal neurogenesis suppression. Molecular psychiatry, 13(7), 717-728. Grotzinger, A. D. (2021). Shared genetic architecture across psychiatric disorders. Psychological medicine, 51(13), 2210-2216. 44 Hayes, J. D., Flanagan, J. U., & Jowsey, I. R. (2005). Glutathione transferases. Annu. Rev. Pharmacol. Toxicol., 45, 51-88. Hardingham, G. E., Fukunaga, Y., & Bading, H. (2002). Extrasynaptic NMDARs oppose synaptic NMDARs by triggering CREB shut-off and cell death pathways. Nature neuroscience, 5(5), 405-414. Hewitt, S. L., Farmer, D., Marszalek, K., Cadera, E., Liang, H. E., Xu, Y., Schlissel, M.S. & Skok, J. A. (2008). Association between the Igk and Igh immunoglobulin loci mediated by the 3′ Igk enhancer induces' decontraction'of the Igh locus in pre–B cells. Nature immunology, 9(4), 396-404. Hirata, H., Takahashi, A., Shimoda, Y., & Koide, T. (2016). Caspr3-deficient mice exhibit low motor learning during the early phase of the accelerated rotarod task. PloS one, 11(1), e0147887. Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian journal of statistics, 65-70. Huang, M., Qiao, Y., Shen, J., Cai, C., XU, X., Chen, S., & Ran, Z. (2017). CNTNAP3 Copy Number Variation and its Significance in Crohn's Disease. Chinese Journal of Gastroenterology, 325-330. Iafrate, A. J., Feuk, L., Rivera, M. N., Listewnik, M. L., Donahoe, P. K., Qi, Y., Scherer, S.W., & Lee, C. (2004). Detection of large-scale variation in the human genome. Nature genetics, 36(9), 949-951. Ikeda, M., Aleksic, B., Kirov, G., Kinoshita, Y., Yamanouchi, Y., Kitajima, T., Kawashima, K., Okochi, T., Kishi, T., Zaharieva, I., Owen, M.J., O’Donovan, M.C., Ozaki, N. & Iwata, N. (2010). Copy number variation in schizophrenia in the Japanese population. Biological psychiatry, 67(3), 283-286. Itsara, A., Cooper, G. M., Baker, C., Girirajan, S., Li, J., Absher, D., Krauss, R.M., Myers, R.M., Ridker, P.M., Chasman, D.I., Mefford, H., Ying, P., Nickerson, D.A. & Eichler, E. E. (2009). Population analysis of large copy number variants and hotspots of human genetic disease. The American Journal of Human Genetics, 84(2), 148-161. 45 Jafarian, Z., Saliminejad, K., Kamali, K., Ohadi, M., Kowsari, A., Nasehi, L., & Khorram Khorshid, H. R. (2018). Association of glutathione S-transferases M1, P1 and T1 variations and risk of late-onset Alzheimer’s disease. Neurological research, 40(1), 41-44. Jang, S., Jang, W. Y., Choi, M., Lee, J., Kwon, W., Yi, J., Park, S.J., Yoon, D., Lee, S., Kim, M.O. & Ryoo, Z. Y. (2019). Serum amyloid A1 is involved in amyloid plaque aggregation and memory decline in amyloid beta abundant condition. Transgenic research, 28, 499-508. Jawad, A. F., McDonald-McGinn, D. M., Zackai, E., & Sullivan, K. E. (2001). Immunologic features of chromosome 22q11. 2 deletion syndrome (DiGeorge syndrome/velocardiofacial syndrome). The Journal of pediatrics, 139(5), 715-723. Jensen, M., Kooy, R. F., Simon, T. J., Reyniers, E., Girirajan, S., & Tassone, F. (2018). A higher rare CNV burden in the genetic background potentially contributes to intellectual disability phenotypes in 22q11. 2 deletion syndrome. European journal of medical genetics, 61(4), 209-212. Jiang, J., Mathijs, K., Timmermans, L., Claessen, S. M., Hecka, A., Weusten, J., Peters, R., van Delft, J.H., Kleinjans, J.C.S., Jennen, D.G.J. & de Kok, T. M. (2017). Omics- based identification of the combined effects of idiosyncratic drugs and inflammatory cytokines on the development of drug-induced liver injury. Toxicology and applied pharmacology, 332, 100-108. Keen, J. H., & Jakoby, W. B. (1978). Glutathione transferases. Catalysis of nucleophilic reactions of glutathione. Journal of Biological Chemistry, 253(16), 5654-5657. Koo, J. W., Russo, S. J., Ferguson, D., Nestler, E. J., & Duman, R. S. (2010). Nuclear factor- κB is a critical mediator of stress-impaired neurogenesis and depressive behavior. Proceedings of the National Academy of Sciences, 107(6), 2669-2674. Knight, H. M., Pickard, B. S., Maclean, A., Malloy, M. P., Soares, D. C., McRae, A. F., Condie, A., White, A., Hawkins, W., McGhee, K., van Beck, M., MacIntyre, D.J., Starr, J.M., Deary, I.J., Vissscher, P.M., Porteous, D.J., Cannon, R.E., St Clair, D., 46 Muir, W.J. & Blackwood, D.H.R. (2009). A cytogenetic abnormality and rare coding variants identify ABCA13 as a candidate gene in schizophrenia, bipolar disorder, and depression. The American Journal of Human Genetics, 85(6), 833-846. Krumbholz, M., Derfuss, T., Hohlfeld, R., & Meinl, E. (2012). B cells and antibodies in multiple sclerosis pathogenesis and therapy. Nature Reviews Neurology, 8(11), 613- 623. Krumm, N., O’Roak, B. J., Karakoc, E., Mohajeri, K., Nelson, B., Vives, L., ... & Eichler, E. E. (2013). Transmission disequilibrium of small CNVs in simplex autism. The American Journal of Human Genetics, 93(4), 595-606. Kushima, I., Aleksic, B., Nakatochi, M., Shimamura, T., Okada, T., Uno, Y., ... & Arioka, Y. (2018). Comparative analyses of copy-number variation in autism spectrum disorder and schizophrenia reveal etiological overlap and biological insights. Cell reports, 24(11), 2838-2856. Künzle, S. (2007). Monocloning oligoclonality-dissecting the humoral immune response in central nervous system inflammations. Tesis Doctoral. University of Zurich. Laplana, M., Royo, J. L., García, L. F., Aluja, A., Gomez‐Skarmeta, J. L., & Fibla, J. (2014). SIRPB1 copy‐number polymorphism as candidate quantitative trait locus for impulsive‐disinhibited personality. Genes, Brain and Behavior, 13(7), 653-662. Lago-Baldaia, I., Cooper, M., Seroka, A., Trivedi, C., Powell, G. T., Wilson, S., ... & Fernandes, V. M. (2022). A Drosophila glial cell atlas reveals that transcriptionally defined cell types can be morphologically diverse. Neuroscience, 10(2022.08), 01- 502305. Laird, N. M., Horvath, S., & Xu, X. (2000). Implementing a unified approach to family‐based tests of association. Genetic Epidemiology: The Official Publication of the International Genetic Epidemiology Society, 19(S1), S36-S42. Lefranc, M. P. (2001). Nomenclature of the human immunoglobulin kappa (IGK) genes. Experimental and clinical immunogenetics, 18(3), 161-174. 47 Lee, P. H., Feng, Y. C. A., & Smoller, J. W. (2021). Pleiotropy and cross-disorder genetics among psychiatric disorders. Biological psychiatry, 89(1), 20-31. Lee, S. H., Ripke, S., Neale, B. M., Faraone, S. V., Purcell, S. M., Perlis, R. H., ... & Absher, D. (2013). Genetic relationship between five psychiatric disorders estimated from genome-wide SNPs. Nature genetics, 45(9), 984-995 Lee, B. D., Walss-Bass, C., Thompson, P. M., Dassori, A., Montero, P. A., Medina, R., ... & Salazar, R. (2007). Malic enzyme 2 and susceptibility to psychosis and mania. Psychiatry research, 150(1), 1-11. Levinson, D. F., Shi, J., Wang, K., Oh, S., Riley, B., Pulver, A. E., ... & Owen, M. J. (2012). Genome-wide association study of multiplex schizophrenia pedigrees. American Journal of Psychiatry, 169(9), 963-973. Levy, D., Ronemus, M., Yamrom, B., Lee, Y. H., Leotta, A., Kendall, J., ... & Buja, A. (2011). Rare de novo and transmitted copy-number variation in autistic spectrum disorders. Neuron, 70(5), 886-897. Li, H. and Durbin R. (2009). Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics, 25, 1754-1760. Li, Z., Chen, J., Yu, H., He, L., Xu, Y., Zhang, D., . . . Li, W. (2017). Genome-wide association analysis identifies 30 new susceptibility loci for schizophrenia. Nature genetics, 49(11), 1576–1583 Lin, Y. L., Pavlidis, P., Karakoc, E., Ajay, J., & Gokcumen, O. (2015). The evolution and functional impact of human deletion variants shared with archaic hominin genomes. Molecular biology and evolution, 32(4), 1008-1019. Lokhande, S. (2017). Understanding Huntington's disease using Machine Learning Approaches. Tesis Doctoral. Claremont Colleges. Lum, K. K., Song, B., Federspiel, J. D., Diner, B. A., Howard, T., & Cristea, I. M. (2018). Interactome and proteome dynamics uncover immune modulatory associations of the pathogen sensing factor cGAS. Cell systems, 7(6), 627-642. 48 Mastrorosa, F. K. (2021). The Role of Copy Number Variants in Severe Idiopathic Male Infertility. Tesis Doctoral. Newcastle University. McClellan