UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO IDENTIFICACIÓN PANGENÓMICA DE SECUENCIAS FIRMA PARA LA DETECCIÓN DE CEPAS DEL CLADO C-I DE CLOSTRIDIOIDES DIFFICILE MEDIANTE qPCR Tesis sometida a la consideración de la Comisión del Programa de Estudios de Posgrado en Ciencias Biomédicas para optar al grado y título de Maestría Académica en Ciencias Biomédicas con Énfasis en Genómica CAMILO MONGE CASCANTE Ciudad Universitaria Rodrigo Facio, Costa Rica 2021 II Dedicatoria. A mi esposa, por su apoyo incondicional. Agradecimientos En primer lugar, al Dr. César Rodríguez Sánchez, por su acompañamiento, tutelaje, y en particular por su franca y siempre amable actitud a lo largo de todo el proceso. Realmente el mundo sería mejor con más profesores y científicos como usted. A la Dra. Rebeca Campos Sánchez y el Dr. Esteban Chaves Olarte, en calidad de lectores, cuyos valiosos comentarios y observaciones convirtieron este en un mejor trabajo. Al personal del Laboratorio de Biología Molecular del Hospital Clínica Bíblica, en particular a la Dra. Karla Gutiérrez González, por permitirme realizar ensayos en sus equipos, las explicaciones brindadas y en general toda su valiosa ayuda. Al personal del Centro de Investigación en Enfermedades Tropicales y el Laboratorio de Investigación en Bacteriología Anaerobia de la Universidad de Costa Rica, por su labor y asistencia durante las fases experimentales del proyecto. A los profesores y personal administrativo de la Maestría, por su paciencia, comprensión y ardua labor, sin la cual este trabajo no hubiera sido posible. III Hoja de aprobación IV Tabla de Contenidos DEDICATORIA............................................................................................................................................... II AGRADECIMIENTOS ................................................................................................................................... II HOJA DE APROBACIÓN ............................................................................................................................ III TABLA DE CONTENIDOS .......................................................................................................................... IV RESUMEN ...................................................................................................................................................... VI LISTA DE CUADROS ................................................................................................................................. VII LISTA DE FIGURAS .................................................................................................................................. VIII LISTA DE ABREVIATURAS ....................................................................................................................... IX CAPÍTULO I: INTRODUCCIÓN .................................................................................................................. 1 GENERALIDADES: ......................................................................................................................................................... 1 FACTORES DE RIESGO: ................................................................................................................................................. 3 PRESENTACIÓN CLÍNICA: ............................................................................................................................................ 3 IMPORTANCIA CLÍNICA DE LAS CDI: ......................................................................................................................... 3 DIAGNÓSTICO Y TIPIFICACIÓN:................................................................................................................................... 4 PREVENCIÓN Y CONTROL DE LAS CDI A NIVEL HOSPITALARIO: ........................................................................... 6 EPIDEMIOLOGÍA DE LAS CDI: ..................................................................................................................................... 9 EPIDEMIOLOGÍA DE LAS CDI EN COSTA RICA: ..................................................................................................... 10 PANGENÓMICA Y SECUENCIAS FIRMA: ................................................................................................................... 11 APORTES DE LA GENÓMICA AL ESTUDIO Y MANEJO EN ENFERMEDADES INFECCIOSAS: ................................ 12 CAPÍTULO II: JUSTIFICACIÓN, HIPÓTESIS Y OBJETIVOS ............................................................. 14 JUSTIFICACIÓN: .......................................................................................................................................................... 14 HIPÓTESIS: ................................................................................................................................................................. 15 OBJETIVO GENERAL: ................................................................................................................................................. 15 OBJETIVOS ESPECÍFICOS: .......................................................................................................................................... 15 CAPÍTULO III: METODOLOGÍA .............................................................................................................. 16 GENOMAS: .................................................................................................................................................................. 16 GENÓMICA COMPARATIVA: ...................................................................................................................................... 17 IDENTIFICACIÓN DE SECUENCIAS FIRMA: .............................................................................................................. 17 DISEÑO DE OLIGONUCLEÓTIDOS CEBADORES: ...................................................................................................... 21 ESTANDARIZACIÓN Y VALIDACIÓN DE LA PCR: ................................................................................................... 22 CAPÍTULO IV: RESULTADOS .................................................................................................................. 28 GENÓMICA COMPARATIVA Y PANGENÓMICA: ....................................................................................................... 28 IDENTIFICACIÓN DE SECUENCIAS FIRMA: .............................................................................................................. 35 DISEÑO Y VALIDACIÓN DE ENSAYO (Q)PCR: ........................................................................................................ 37 CAPÍTULO V: DISCUSIÓN ........................................................................................................................ 55 GENÓMICA COMPARATIVA Y PANGENÓMICA: ....................................................................................................... 55 IDENTIFICACIÓN DE SECUENCIAS FIRMA: .............................................................................................................. 57 DISEÑO Y VALIDACIÓN DEL ENSAYO DE PCR: ...................................................................................................... 60 PCR DE PUNTO FINAL: ............................................................................................................................................. 61 QPCR USANDO CÉLULAS COMPLETAS (CULTIVOS PUROS): ................................................................................ 62 QPCR CON ADN EXTRAÍDO A PARTIR DE HECES: ................................................................................................ 63 QPCR CON ADN EXTRAÍDO A PARTIR DE MUESTRAS INOCULADAS: ................................................................. 64 QPCR CON CEBADORES PARA EL GEN TCDB: ........................................................................................................ 65 PROPUESTA TEMPORAL DE ALGORITMO DIAGNÓSTICO: ..................................................................................... 67 CONSIDERACIONES FINALES Y LIMITACIONES: ..................................................................................................... 69 CAPÍTULO VI: CONCLUSIONES: ............................................................................................................. 73 BIBLIOGRAFÍA ............................................................................................................................................ 74 V ANEXO I. ST, RIBOTIPO DE PCR, IDENTIFICADOR DE AISLAMIENTO, TOXIGENICIDAD, CLADO, FUENTE Y FECHA DE AISLAMIENTO Y NUMERO DE CORRIDA DE SECUENCIACIÓN DE LAS CEPAS INCLUIDAS EN EL DISEÑO EXPERIMENTAL. ........................................................ 87 ANEXO II. CARACTERÍSTICAS DETERMINADAS PARA LOS ENSAMBLAJES UTILIZADOS EN EL ANÁLISIS BIOINFORMÁTICO. .......................................................................................................... 91 ANEXO III. PRINCIPALES CARACTERÍSTICAS PREDICHAS Y MEJORES HITS DE BLASTN DE LAS SECUENCIAS FIRMA DEL CLADO C-I IDENTIFICADAS Y DETERMINADAS POR NEPTUNE. ..................................................................................................................................................... 94 ANEXO IV. CONGLOMERADOS DE CDSS IDENTIFICADOS POR SCOARY Y TREEWAS COMO EXCLUSIVOS DE LAS CEPAS DEL CLADO C-I (SENSIBILIDAD Y ESPECIFICIDAD= 100%, P CON CORRECCIÓN DE BENJAMINI HOCHBERG =1.21962E-11). ............................................... 95 ANEXO V. CONGLOMERADOS DE GENES IDENTIFICADOS DEL BIN EXCLUSIVO DE LAS CEPAS DEL CLADO C-I IDENTIFICADO POR ANVI’O. ................................................................... 110 ANEXO VI. CARACTERÍSTICAS DE LAS SECUENCIAS FIRMA IDENTIFICADAS POR DBGWAS DE MÁS DE 100PB PRESENTES EN LOS PRIMEROS 60 NODOS ANALIZADOS SEGÚN VALOR DE Q, Y SUS RESULTADOS AL ALINEARLAS CON LA COLECCIÓN DE NUCLEÓTIDOS DEL NCBI POR BLASTN. ........................................................................................................................ 114 ANEXO VII. RESULTADOS DE PCR PUNTO FINAL PARA LOS PARES DE CEBADORES. .... 122 VI Resumen Clostridioides difficile es un importante patógeno humano. Las cepas de esta bacteria han sido organizadas en cinco clados comunes, numerados del 1 al 5, y tres divergentes, conocidos como C-I, C-II y C-III. La infección con cepas patogénicas de C. difficile (CDI) se manifiesta clínicamente como diarrea en el paciente. Estos efectos son mediados principalmente por el efecto de tres toxinas (TcdA, TcdB y CDT). El diagnóstico de las CDI se realiza usualmente mediante inmunoensayos para las toxinas A y B, los cuales son rápidos, pero poco sensibles, o con cultivo toxigénico y ensayos de neutralización de citotoxicidad celular, ambos demandantes desde un punto de vista técnico y económico. Como alternativa, se han desarrollado ensayos de amplificación de ácidos nucleicos, dado que tienen alta sensibilidad, especificidad, y son relativamente rápidos y accesibles. Existen reportes de cepas toxigénicas del Clado C-I que escapan los métodos de diagnóstico utilizados rutinariamente en la mayoría de los centros de salud. Esta situación es preocupante, y motivó la realización del presente proyecto, el cual pretendía identificar secuencias firma nucleotídicas de cepas del Clado C-I susceptibles a ser amplificadas por qPCR, para emplearlas en un método de diagnóstico molecular. Se incluyeron en el análisis 77 genomas de cepas de C. difficile calidad draft (10 de cepas C-I, 67 de cepas de Clados 1-5) los cuales fueron ensamblados, verificada su calidad y anotados. Para identificar las posibles secuencias firma se utilizaron tres técnicas: estudios de asociación de genoma completo (DBGWAS, TreeWAS y Roary/Scoary), procesos automatizados basados en referencia y pareo de k-mer (Neptune) y análisis pangenómicos (Roary y Anvi’o). Los resultados de estos métodos fueron consolidados, y se eliminaron aquellas secuencias que tuvieran alta identidad con otras presentes en otros microorganismos. Se utilizó Primer- BLAST para diseñar juegos de oligonucleótidos cebadores para las secuencias firma identificadas, los cuales fueron depurados según contenido GC, autocomplementariedad, largo del producto, Tm. Los mejores pares fueron probados inicialmente en ensayos de PCR punto final. Estos cebadores, y uno adicional diseñado para el gen tcdB presente en las cepas del Clado C-I, fueron probados adicionalmente en qPCR usando ADN extraído a partir de cultivos bacterianos, de heces humanas negativas para C. difficile, de heces humanas inoculadas con ADN extraído a partir de cepas del Clado C-I y de heces humanas inoculadas con cultivos de C. difficile del Clado C-I y de otros clados. Se calcularon las sensibilidades y especificidades demostradas por los cebadores en cada ensayo. Finalmente, se aproximó el límite de detección de los dos mejores cebadores para las secuencias firma identificadas y el diseñado para el gen tcdB. El análisis pangenómico con Roary reveló que las cepas del Clado C-I comparten 890 CDSs que no pertenecen al genoma core determinado para la especie. Once conglomerados de secuencias codificantes fueron identificados como exclusivos de las cepas C-I por Anvi’o, Roary/Scoary y Treewas. Se generaron pares de cebadores para ocho de estas secuencias firma, los cuales fueron depurados, para sintetizar cuatro, los cuales fueron probados en laboratorio. Dos de los pares de cebadores mostraron 100% de sensibilidad y especificidad en los ensayos de qPCR con ADN extraído de cultivos líquidos y de heces inoculadas con cultivos, mientras que el par diseñado para el gen tcdB mostró 100% de sensibilidad y 72.7% de especificidad en los ensayos de qPCR con ADN extraído de cultivos en medio líquido, y 66% de sensibilidad y 100% de especificidad en los realizados con heces inoculadas con cultivos. A partir de estos resultados se propuso un algoritmo para determinar la presencia de ADN de cepas de C. difficile del Clado C-I, toxigénicas o no, en heces de pacientes diarreicos con sospecha de CDI, utilizando estos tres pares de cebadores. Estos hallazgos confirman que las cepas del Clado C-I presentan secuencias firma susceptibles a ser amplificadas por qPCR, y que los cebadores diseñados detectan la presencia de ADN de dichas cepas en cultivo y heces con 100% de especificidad y sensibilidad. VII Lista de cuadros CUADRO I. GENES USUALMENTE PRESENTES EN EL PALOC DE C. DIFFICILE ............................................... 2 CUADRO II. RESUMEN DE LA FORMA DE INTERPRETACIÓN DE LOS ENSAYOS DE QPCR .............................26 CUADRO III. PRINCIPALES CARACTERÍSTICAS PREDICHAS DE LAS SECUENCIAS FIRMA DEL CLADO C-I IDENTIFICADAS EN CONJUNTO POR ROARY/SCOARY, TREEWAS Y ANVI’O Y DETERMINADAS POR ROARY Y ANVI’O. TODAS LAS SECUENCIAS TUVIERON LONGITUDES MAYORES A 300 PB PARA POSIBILITAR SU DETECCIÓN POR QPCR. .......................................................................................36 CUADRO IV. CARACTERÍSTICAS PREDICHAS DE LOS PARES DE CEBADORES IDENTIFICADOS POR PRIMERBLAST PARA LAS SECUENCIAS FIRMA SELECCIONADAS. .....................................................39 CUADRO V. PROPIEDADES TERMODINÁMICAS DEL AMPLICÓN ESPERADO Y POSIBLES DÍMEROS DE CEBADOR ANTICIPADOS PARA LOS 7 MEJORES PARES DE CEBADORES CANDIDATOS. .......................................44 CUADRO VI. CARACTERÍSTICAS PREDICHAS DE LOS PARES DE CEBADORES IDENTIFICADOS POR PRIMERBLAST PARA LAS SECUENCIAS DEL GEN TCDB DE LAS CEPAS DE C. DIFFICILE DEL CLADO C-I. ...................................................................................................................................................46 CUADRO VII. VALORES DE CT Y RESULTADOS OBTENIDOS POR QPCR UTILIZANDO ADN EXTRAÍDO A PARTIR DE CULTIVOS DE DIVERSAS BACTERIAS Y LOS CEBADORES DISEÑADOS PARA LAS SECUENCIAS FIRMA DEL CLADO C-I. ...........................................................................................................................47 CUADRO VIII. VALORES DE CT OBTENIDOS POR QPCR UTILIZANDO ADN EXTRAÍDO A PARTIR DE HECES DE PACIENTES DIARREICOS Y LOS CEBADORES DISEÑADOS PARA LAS SECUENCIAS FIRMA DEL CLADO C-I. ...................................................................................................................................................48 CUADRO IX. VALORES DE CT Y RESULTADOS OBTENIDOS POR QPCR UTILIZANDO ADN EXTRAÍDO A PARTIR DE HECES INOCULADAS CON ADN GENÓMICO DE CEPAS DEL CLADO C-I Y LOS CEBADORES DISEÑADOS PARA LAS SECUENCIAS FIRMA DEL CLADO C-I. .............................................................49 CUADRO X. VALORES DE CT Y RESULTADOS OBTENIDOS POR QPCR UTILIZANDO ADN EXTRAÍDO A PARTIR DE HECES INOCULADAS CON DILUCIONES SERIADAS DE CULTIVOS DE CEPAS DEL CLADO C-I Y LOS CEBADORES DISEÑADOS PARA LAS SECUENCIAS FIRMA DEL CLADO C-I. ..........................................50 CUADRO XI. VALORES DE CT OBTENIDOS EN EL ENSAYO DE QPCR UTILIZANDO ADN EXTRAÍDO A PARTIR DE CULTIVOS DE DIVERSAS BACTERIAS Y LOS CEBADORES DISEÑADOS PARA EL GEN TCDB PRESENTE EN LAS CEPAS DEL CLADO C-I. ..........................................................................................................51 CUADRO XII. VALORES DE CT OBTENIDOS EN EL ENSAYO DE QPCR UTILIZANDO ADN EXTRAÍDO A PARTIR DE HECES INOCULADAS CON DILUCIONES SERIADAS DE CULTIVOS DE CEPAS DEL CLADO C-I Y LOS CEBADORES DISEÑADOS PARA EL GEN TCDB PRESENTE EN LAS CEPAS DEL CLADO C-I. ...................52 CUADRO XIII. RESUMEN DE LAS SENSIBILIDADES Y ESPECIFICIDADES DETERMINADAS PARA LOS DIFERENTES PARES DE CEBADORES ENSAYADOS. .............................................................................................53 VIII Lista de figuras FIGURA 1. ESTRUCTURA HABITUAL DEL PALOC DE C.DIFFICILE. ................................................................ 1 FIGURA 2. ESQUEMA RESUMEN DE LA METODOLOGÍA UTILIZADA PARA IDENTIFICAR LAS POSIBLES SECUENCIAS FIRMA.. ....................................................................................................................20 FIGURA 3. ESQUEMA RESUMEN DE LAS PRUEBAS REALIZADAS PARA VALIDAR LA SENSIBILIDAD Y ESPECIFICIDAD DE LOS CEBADORES DISEÑADOS PARA LAS SECUENCIAS FIRMA IDENTIFICADAS. ........27 FIGURA 4. ESQUEMA RESUMEN DE LAS PRUEBAS REALIZADAS PARA VALIDAR LA SENSIBILIDAD Y ESPECIFICIDAD DE LOS CEBADORES DISEÑADOS PARA EL GEN TCDB PRESENTE EN LAS CEPAS DEL CLADO C-I. ..................................................................................................................................27 FIGURA 5. ÁRBOL FILOGENÉTICO CONSTRUIDO A PARTIR DE UN ALINEAMIENTO DE SITIOS VARIABLES IDENTIFICADOS POR ROARY EN TODOS LOS GENOMAS ANALIZADOS. ...............................................29 FIGURA 6. DIAGRAMA DE CAJAS-BIGOTES PARA COMPARAR EL ANI DETERMINADO POR FASTANI PARA CEPAS DE CLADO C-I (N=10), CLADOS 1-5 (N=67) Y ENTRE AMBOS GRUPOS. .................................30 FIGURA 7. NÚMERO ABSOLUTO (A) Y RELATIVO EN PORCENTAJE (B) DE SECUENCIAS EN EL GENOMA CORE (PRESENTES EN AL MENOS 99% DE LAS CEPAS ANALIZADAS, N=76), SOFT-CORE (PRESENTES ENTRE EL 95% Y 99% DE LAS CEPAS, N=73 Y 76 CEPAS), SHELL (PRESENTES ENTRE EL 15% Y 95% DE LAS CEPAS, N= 11 Y 73 CEPAS) Y CLOUD (PRESENTES EN MENOS DEL 15% DE LAS CEPAS, N< 11) DE LAS CEPAS DEL CLADO C-I, LAS CEPAS DE LOS CLADOS 1-5 Y TODAS LAS CEPAS ANALIZADAS. ...............32 FIGURA 8. MATRIZ DE PRESENCIA/AUSENCIA DE CDS CONTEXTUALIZADA FILOGENÉTICAMENTE (ROARY)..33 FIGURA 9. CONGLOMERADOS DE GENES PRESENTES EN EL BIN EXCLUSIVO DE LAS CEPAS C-I IDENTIFICADO POR ANVI’O, CLASIFICADOS SEGÚN SU FUNCIÓN COG ANTICIPADA. ................................................34 FIGURA 10. GRÁFICO SEMILOGARÍTMICO DE FACTOR DE DILUCIÓN VS CT OBTENIDO EN EL ENSAYO DE LÍMITE DE DETECCIÓN DEL ENSAYO DE PCR TIEMPO REAL UTILIZANDO ADN EXTRAÍDO A PARTIR DE UN CULTIVO DE LA CEPA LIBA-7602 Y LOS CEBADORES 114 (ROJO), 161 (VERDE) Y DISEÑADOS PARA EL GEN TCDB (AZUL) PRESENTE EN LAS CEPAS DEL CLADO C-I. ..........................................................54 FIGURA 11. ALGORITMO PROPUESTO PARA DETERMINAR LA PRESENCIA DE CEPAS DE C. DIFFICILE DEL CLADO C-I, TOXIGÉNICAS O NO, EN HECES DE PACIENTES DIARREICOS CON SOSPECHA DE CDI. ......67 FIGURA 12. AMPLIFICACIÓN DE LAS CEPAS UTILIZADAS CON LOS CEBADORES 110 (PANEL A), 161 (PANEL B) Y 114 (PANEL C), ASÍ COMO LAS CEPAS 6822, 7602 (PANEL D), NAP1 Y A-B+ (PANEL E) CON LOS CEBADORES 110, 114, 161 Y 195 . .............................................................................................122 IX Lista de abreviaturas CDI “Clostridioides difficile infection” (infección por Clostridioides difficile) GTP Guanosina trifosfato ADP Adenosina difosfato PaLoc Locus de patogenicidad TC “toxigenic culture” (cultivo toxigénico) CCNA “cell cytotoxicity neutralization assay” (ensayos de neutralización de citotoxicidad celular) EIA “enzyme immunoassay” (inmunoensayos enzimáticos) NAAT “nucleic acid amplification test” (ensayos de amplificación de ácidos nucleicos) PFGE “pulsed-field gel electrophoresis” (electroforesis de campo pulsante) MLST “multilocus sequence typing” (tipificación por secuencias multilocus) NGS “next generation sequencing” (secuenciación de siguiente generación) PFGE “pulsed-field electrophoresis” (electroforesis de campo pulsante) ESCMID “European Society of Clinical Microbiology and Infectious Diseases” (Sociedad Europea de Microbiología Clínica y Enfermedades Infecciosas) IDSA “Infectious Diseases Society of America” (Sociedad Americana de Enfermedades Infecciosas) SHEA “Society for Healthcare Epidemiology of America” (Sociedad para la Epidemiología de la Atención Médica de América) ST “sequence type” (secuencia tipo de MLST) PCR “polymerase chain reaction” (reacción en cadena de la polimerasa) CA California, E.E.U.U. qPCR “quantitative polymerase chain reaction” (reacción en cadena de la polimerasa cuantitativa) GWAS “genome-wide association studies” (estudio de asociación del genoma completo) BLAST “Basic Local Alignment Search Tool” (herramienta de búsqueda por alineamiento local básico) COG “clusters of orthologous groups of proteins” (conglomerados de grupos ortólogos de proteínas). NCBI “National Center for Biotechnology Information” (Centro Nacional para Información en Biotecnología, E.E.U.U.) Tm “melting temperature" (temperatura de fusión) Ct “cycle threshold” (umbral del ciclo) VP verdadero positivo VN verdadero negativo FP falso positivo FN falso negativo 1 Capítulo I: Introducción Generalidades: Según el Manual de Bacteriología Sistemática de Bergey (Paul De Vos, 2009) Clostridium difficile, recientemente reclasificada como Clostridioides difficile (Lawson, Citron, Tyrrell, & Finegold, 2016) es una bacteria Gram-positiva, perítrica, esporulante y anaerobia estricta. Crece entre los 250C y 450C, de forma óptima a 370C. Se le considera un patógeno oportunista que provoca infecciones intestinales cuando ocurre disbiosis de la microbiota residente, principalmente durante la atención en centros de salud (Samarkos, Mastrogianni, & Kampouropoulou, 2018). Este microorganismo fue originalmente descrito en 1935 como componente normal de la microbiota fecal de los recién nacidos, no obstante, fue posteriormente encontrado en heces de animales y en diversos tipos de muestras ambientales (Burnham & Carroll, 2013). C. difficile alterna entre una forma vegetativa y una endospora resistente a condiciones ambientales adversas. Para que se produzcan las infecciones por C. difficile (CDI), pacientes con factores que los predisponen a adquirir la enfermedad (ver abajo) deben entrar en contacto con esporas de cepas toxigénicas de la bacteria, las cuales persisten sobre superficies por largos periodos de tiempo (Eze, Balsells, Kyaw, & Nair, 2017). La virulencia de C. difficile se relaciona principalmente con la expresión de toxinas codificadas en una secuencia de 19.6 kb denominada locus de patogenicidad (PaLoc) que incluye 5 genes: tcdA y tcdB, que codifican para las toxinas identificadas con la letra correspondiente, tcdE, que codifica para una proteína potencialmente implicada en su secreción de ambas toxinas; y tcdR y tcdC, que corresponden a reguladores positivos y negativos de la síntesis de toxinas (Figura 1, Cuadro 1). Figura 1. Estructura habitual del PaLoc de C.difficile. Tomado de (Hunt & Ballard, 2013) 2 Cuadro I. Genes usualmente presentes en el PaLoc de C. difficile Gen Producto Referencia tcdA Toxina A (Di Bella, Ascenzi, Siarakas, Petrosillo, & di Masi, 2016) tcdB Toxina B (Di Bella et al., 2016) tdcE Holina para secreción de toxina (Govind & Dupuy, 2012; Govind, Fitzwater, & Nichols, 2015) tcdR Regulador positivo de toxina (Martin-Verstraete, Peltier, & Dupuy, 2016) tcdC Regulador negativo de toxina (Martin-Verstraete et al., 2016) Las toxinas TcdA y TcdB ejercen su efecto tóxico al inactivar proteínas Rho pequeñas y otras GTPasas de células eucariotas, interrumpiendo así vías metabólicas vitales en el hospedero (Burnham & Carroll, 2013). Un grupo menor de cepas expresa otra toxina, denominada C. difficile transferasa (CDT) o toxina binaria. Esta enzima presenta actividad ADP-ribosiltransferasa y genera disrupción del citoesqueleto, promoviendo pérdida de fluido y eventualmente la muerte celular. Como su nombre lo indica, se compone de dos componentes: CdtA, que posee actividad catalítica, y CdtB, involucrada en la unión al sustrato. Los genes que codifican para estas proteínas se encuentran en el denominado CdtLoc (Elliott, Androga, Knight, & Riley, 2017), que se localiza en un sitio cromosomal diferente al PaLoc. Típicamente se considera que las cepas que no expresan TcdA o TcdB no causan CDI en humanos, sin embargo, como se verá más adelante, el papel de estas denominadas cepas no toxigénicas en la patogénesis aún no es claro. Además de las toxinas TcdA, TcdB y CDT, se han descrito otros factores de virulencia en esta especie, tales como la proteína de capa S, proteínas de flagelos, fimbrias y proteínas de unión a fibronectina (Awad, Johanesen, Carter, Rose, & Lyras, 2014). 3 Factores de riesgo: Una serie de factores de riesgo han sido asociados al desarrollo de las CDI, incluyendo admisión a centros de salud (y tiempo de internamiento), edad avanzada (relacionada con senescencia inmune), presencia de comorbilidades y, en particular, exposición a agentes antimicrobianos (Elliott et al., 2017), ya que estas drogas inducen cambios inmediatos y profundos en la microbiota intestinal endógena y reducen su diversidad. Esta disbiosis disminuye la resistencia a la colonización de C. difficile y modifica el metabolismo de las sales biliares (Winston & Theriot, 2016). Prácticamente todos los agentes antimicrobianos de uso clínico conocido han sido implicados con las CDI, sin embargo, metaanálisis recientes han encontrado diferencias importantes en la magnitud de asociación al disgregar los datos según factores, como sitio geográfico o el contexto hospitalario de los casos. Así, en comparación con controles adiarreicos, la administración hospitalaria de clindamicina, cefalosporinas, carbapenémicos, fluoroquinolonas y sulfonamidas se asocia con un riesgo al menos dos veces mayor de CDI. En casos comunitarios dicho riesgo aumenta entre 8 y 20 veces para clindamicina, y entre 3 y 5 veces para cefalosporinas y quinolonas (Eze et al., 2017). Presentación clínica: Las CDI presenta un amplio espectro de manifestaciones clínicas, entre las que se incluyen diarrea (que puede desencadenar íleo severo), colitis pseudomembranosa y/o fulminante. Entre sus síntomas destacan dolor abdominal, anorexia, fiebre y malestar general. Las heces de los pacientes suelen ser líquidas y poseer un olor desagradable y característico (Bartlett & Gerding, 2008). Las complicaciones de esta patología incluyen internamiento en unidades de cuidado intensivo, colectectomía e incluso la muerte (Pacheco & Johnson, 2013). Importancia clínica de las CDI: A pesar de haber sido reconocido como un patógeno importante en el desarrollo de colitis pseudomembranosa desde 1970 (George et al., 1978), la incidencia y severidad de los casos de CDI ha aumentado en los últimos 15-20 años (He et al., 2013). Este aumento es atribuible, al menos en parte, a la aparición de nuevas cepas hipervirulentas (Knight, 4 Elliott, Chang, Perkins, & Riley, 2015; Rodriguez, Van Broeck, Taminiau, Delmée, & Daube, 2016). La infección por este patógeno se ha convertido en un considerable problema de salud pública en numerosos países, incluido Costa Rica. Prueba de lo anterior es que en agosto del año anterior fue catalogado por los Centros para Control y Prevención de Enfermedades de E.E.U.U como una de las más grandes amenazas, otorgándole un nivel de peligro urgente. En 2009-2010 se reportó un brote importante de CDI en nuestro país (Quesada-Gomez et al., 2010; Wong-McClure et al., 2012), y en años recientes se ha detectado la emergencia o predominancia de cepas con alta resistencia a antibióticos (López-Ureña et al., 2016). Diagnóstico y tipificación: La detección temprana de C. difficile y sus toxinas es crucial, pues permite un tratamiento más temprano y así disminuir significativamente la morbilidad y mortalidad de las infecciones y los costos médicos asociados a atenciones hospitalarias prolongadas (Peng et al., 2018). Además de considerar los síntomas clínicos anteriormente mencionados, el diagnóstico de CDI requiere de resultados positivos de pruebas de laboratorio que persiguen detectar el patógeno y/o sus toxinas. Sin embargo, no existe un ensayo que posea sensibilidad, especificidad y capacidad predictiva óptimas (Pacheco & Johnson, 2013). Entre los ensayos más comunes destacan: a) el cultivo toxigénico (TC, del inglés “toxigenic culture”), que detecta el efecto de toxinas presentes en suspensiones de heces sobre cultivos celulares. Su sensibilidad y especificidad son altas, pero en ciertos casos puede tardar días para generar resultados. Aunado a esto, el cultivo celular no se realiza en todos los laboratorios clínicos, lo que limita el acceso a este tipo de ensayos. b) los ensayos de neutralización de citotoxicidad celular (CCNA, del inglés “cell cytotoxicity neutralization assay”), que detectan toxinas presentes en heces mediante la observación de su efecto sobre cultivos celulares en presencia y ausencia de antitoxina(s). Estos ensayos poseen ventajas y desventajas similares a las del cultivo toxigénico. 5 c) los inmunoensayos para toxina A y B (EIAs, del inglés “enzyme immunoassay”), que tienen bajo costo, requieren poco tiempo y son fáciles de realizar, pero son poco sensibles. d) los ensayos de amplificación de ácidos nucleicos (NAAT, del inglés “nucleic acid amplification test”), que normalmente tienen como blanco fragmentos de tcdA, tcdB y/o de los genes para la toxina binaria en combinación o solos. Si bien se ha considerado al TC y a los CCNA como los dos estándares para diagnóstico, no se utilizan de forma rutinaria en la clínica debido a su alta demanda de tiempo y mano de obra calificada. Por otro lado, los NAAT poseen una serie de ventajas, tales como sensibilidad y especificidad > 80% y hasta 99% (Burnham & Carroll, 2013; Peng et al., 2018), baja complejidad (una vez que el ensayo se ha estandarizado) y poco tiempo de respuesta, además de ser altamente costo-efectivos. A pesar de sus ventajas, existen algunos cuestionamientos con respecto a la utilidad de los NAAT en la clínica. Por ejemplo, si bien la detección de los genes usualmente correlaciona con la presencia de enfermedad, esto no es siempre cierto porque las toxinas no necesariamente se expresan. Además, existen reportes de cepas virulentas que carecen de tcdA (B. Wang, Peng, Zhang, & Su, 2018) o cdtAB (Marvaud, Quevedo- Torres, Eckert, Janoir, & Barbut, 2019), y dado que el tipo de cepas causantes varía en el tiempo y el espacio, es necesario revalidar los NAAT constantemente. C. difficile es una especie genéticamente heterogénea y su eficiente tipificación es crítica para el análisis epidemiológico, particularmente durante los brotes (Awad et al., 2014). Este tipo de análisis también es requerido para diferenciar entre cepas circulantes, cepas nuevas y variantes. Se han aplicado una serie de métodos de tipificación a C. difficile, sin que alguno predomine como estándar de oro, a saber: a) La electroforesis de campo pulsante (PFGE, del inglés “pulsed-field gel electrophoresis”), que fue uno de los primeros métodos de tipificación disponibles, sin embargo, presenta poca capacidad de discriminación. b) El ribotipado, que se basa en la identificación de patrones de secuencias localizadas entre los operones ribosomales y que ha sido particularmente utilizado en Europa y muestra una alta capacidad discriminatoria, pero poca reproducibilidad. 6 c) La tipificación por secuencias multilocus (MLST, del inglés “multilocus sequence typing”), en la que se secuencian seis o siete genes conservados y los alelos se comparan contra los depositados en bases de datos curadas (Peng et al., 2018). d) Más recientemente, el bajo costo por base de los nuevos métodos de secuenciación masiva (NGS, del inglés “next generation sequencing”) y avances computacionales ha permitido la comparación de miles de genomas y la consecuente clasificación de C. difficile en 8 clados (Janezic, Potocnik, Zidaric, & Rupnik, 2016). Prevención y control de las CDI a nivel hospitalario: Las estrategias de manejo de las CDI se centran en la prevención primaria o de recurrencia (Khanna & Gerding, 2019). El documento para la prevención de CDI en escenarios de atención médica aguda elaborado por la Sociedad Europea de Microbiología Clínica y Enfermedades Infecciosas (ESCMID, del inglés “European Society of Clinical Microbiology and Infectious Diseases”) establece que restricciones en el uso de antibióticos reducen la incidencia de CDI en condiciones de brote y/o endémicas (Tschudin-Sutter et al., 2018). De forma similar, las guías de práctica clínica para CDI en adultos y niños elaboradas por la Sociedad Americana de Enfermedades Infecciosas (IDSA, del inglés “Infectious Diseases Society of America”) y la Sociedad para la Epidemiología de la Atención Médica de América (SHEA, del inglés “Society for Healthcare Epidemiology of America”) recomiendan minimizar la frecuencia y duración del uso de antibióticos de alto riesgo, así como el número de agentes antibióticos prescritos, para reducir el riesgo de CDI (McDonald et al., 2018). Es probable que la resistencia a ciertos antibióticos que algunas cepas de C. difficile han adquirido sea importante para explicar la ocurrencia de brotes a nivel local, y se relacione con el buen o mal uso de los antibióticos en dichas regiones, como se evidencia con el caso del ribotipo 027 en Inglaterra (Wieczorkiewicz et al., 2015). De esta manera, es importante que los programas de vigilancia del uso de antibióticos dispongan de los recursos necesarios para llevar un adecuado control, para eventualmente prever la aparición de cepas resistentes de C. difficile que podrían causar brotes de CDI. Los gastos incurridos en la vigilancia se pueden justificar a nivel de salud pública, pues el mantenimiento de una buena vigilancia tiene efectos positivos como reducción en efectos 7 adversos, incremento en susceptibilidad y mejora en la resolución de los pacientes (Barlam et al., 2016). Múltiples recomendaciones propuestas por las guías anteriormente mencionadas se relacionan con evitar la propagación del agente causal en los centros de salud. Las manos del personal contaminadas con esporas, así como la contaminación ambiental, son probablemente los medios que facilitan este proceso, por lo que la limpieza y precauciones por contacto (“contact precautions”) son de suma importancia para mitigar el riesgo de contagio en los centros hospitalarios (McDonald et al., 2018). De esta forma, es recomendable que los pacientes con CDI se mantengan en cuartos privados con, de ser posible, un baño independiente. El equipo de protección personal (guantes y batas desechables) representa una barrera crítica para prevenir la transmisión de esporas entre pacientes y el personal de salud, por lo que se recomienda su uso desde antes de entrar en contacto con pacientes con CDI o su ambiente (Napolitano & Edmiston, 2017). Además de lo anterior, la buena higiene de manos se considera una piedra angular en la prevención de la transmisión de la CDI, recomendándose el lavado con agua y jabón, dado que las esporas de C. difficile son altamente resistentes al alcohol (Tschudin-Sutter et al., 2018). El equipo utilizado para el tratamiento del paciente y el espacio físico donde este se encuentra, es frecuentemente contaminado con esporas de C. difficile, por lo que se recomienda el uso de equipo desechable y la desinfección profunda del equipo reutilizable y cuartos donde se trata a los pacientes con CDI (Napolitano & Edmiston, 2017). Los pacientes sintomáticos para CDI son más propensos a contaminar el medio y a otras personas que los asintomáticos, por lo tanto, el tratamiento temprano es de suma importancia para controlar la transmisión de esta enfermedad (Tschudin-Sutter et al., 2018). Dado que el tratamiento debe ser administrado a los pacientes una vez confirmado el diagnóstico (Debast, Bauer, & Kuijper, 2014), es importante contar con métodos de diagnóstico rápidos, certeros y accesibles que permitan una intervención temprana. El control de la CDI también se logra a través de una vigilancia epidemiológica estricta, con el objetivo de comparar las tasas de incidencia y detectar posibles brotes de la enfermedad en sus estados iniciales, de forma tal que se puedan redoblar los esfuerzos descritos anteriormente para controlarlos de manera oportuna (Tschudin-Sutter et al., 2018). Las guías de E.E.U.U recomiendan llevar una vigilancia mínima reportando los casos de CDI de advenimiento en el centro de salud (“healthcare facility-onset”), definidos 8 como aquellos eventos suscitados luego del tercer día de internamiento. También es recomendable el monitoreo de los casos con advenimiento en la comunidad asociados a centros de salud, es decir, aquellos que ocurren en el transcurso de 28 días luego de la salida de un centro hospitalario (McDonald et al., 2018). Es crucial que las tasas de incidencia sean comunicadas efectivamente a los directores o coordinadores, para que ante un eventual aumento se asegure el acatamiento de las medidas de control de infección, o el incremento de estas. En Costa Rica, el Sistema de Vigilancia Epidemiológica monitorea la incidencia de las Infecciones Asociadas a la Atención en Salud, que incluyen la CDI. Las medidas de control para brotes de esta enfermedad son similares a las descritas en las guías anteriormente citadas, e incluyen medidas de aislamiento por cohorte, restricción de personal y visitas en las zonas de aislamiento, uso estricto de equipo de protección personal, limpieza y desinfección de la zona de aislamiento, desinfección de ropa contaminada y manejo apropiado de desechos bioinfecciosos y restricción de medicamentos (Mairena-Morera, 2014). El manejo clínico inicial de la CDI normalmente implica la descontinuación del uso de antibióticos (McDonald et al., 2018). Los antibióticos continúan siendo el tratamiento usual para la CDI. Típicamente se ha utilizado vancomicina y metronidazol como métodos de tratamiento. Más recientemente se ha añadido el uso de fidaxomicina como alternativa al uso de vancomicina. En casos de recurrencia se suele utilizar vancomicina si la infección anterior fue tratada con metronidazol, mientras que, si se utilizó vancomicina en la primera infección, para la segunda se suele utilizar vancomicina por pulsos o fidaxomicina (Khanna & Gerding, 2019). Existen otras terapias para el tratamiento de CDI, sin embargo, su uso es limitado a ciertos casos. Por ejemplo, anticuerpos monoclonales anti-toxina B (bezlotoxumab) han demostrado ser útiles para prevenir la recurrencia de CDI en pacientes de riesgo (mayores de 65 años, historial previo de CDI, inmunocomprometidos, etc) (Gerding et al., 2018). Además, también existen trasplantes de microbiota fecal para restaurar la microflora normal intestinal en pacientes con CDI, sin embargo, su uso se suele restringir a pacientes con recurrencia múltiple (McDonald et al., 2018; Peng et al., 2018). 9 Epidemiología de las CDI: En los últimos 10-15 años, las principales cepas responsables de brotes de CDI han sido las del ribotipo 027/patrón de electroforesis NAP1 (Robinson, Auchtung, Collins, & Britton, 2014). Su mayor capacidad epidémica se ha asociado a su resistencia aumentada a las fluoroquinolonas (Spigaglia et al., 2008), así como a su capacidad de sobreproducción de toxinas (McDonald et al., 2005) y esporas (Akerlund et al., 2008), entre otros factores. El primer análisis genético de la población y relación filogenética de C. difficile fue realizado por Lemee y colaboradores en 2004 (Lemee, Dhalluin, Pestel-Caron, Lemeland, & Pons, 2004), usando MLST (ST, del inglés “Sequence Type”). En este estudio se identificaron 34 secuencias tipo de MLST entre 72 cepas, las cuales se distribuían a su vez en tres clados, que no se asociaban a huéspedes ni zonas geográficas específicas. Estudios adicionales de comparación de genoma completo han confirmado esta organización cladística, y a la fecha se cuentan 5 clados numerados del uno al cinco, y tres clados crípticos denominados C-I, C-II y C-III. El clado más heterogéneo es el Clado 1, que incluye al menos 200 STs. Este clado incluye además varias cepas de importancia clínica en Europa, como los ribotipos 014 (ST-2), 002 (ST-8), 001 (ST-3), entre otros. El Clado 2 es el segundo más heterogéneo, con 61 STs, e incluye los ribotipos epidémicos 027 (ST-1), 176 (ST-1) y 244 (ST-41). El Clado 3 incluye 13 STs diferentes, de los cuales el más representativo es el 023 (ST-22). El Clado 4 se asocia con cepas de ribotipo 017 (ST-37), las cuales poseen la particularidad de poseer toxina B, pero no así la A. El miembro más conocido del Clado 5 es el ribotipo 078 (ST-11), el cual en los últimos 10 años ha emergido como causante de CDI en humanos, a pesar de anteriormente ser reconocido como un patógeno de animales (Janezic, Garneau, & Monot, 2018). Recientemente se han descrito cepas toxigénicas en el Clado C-I (Monot et al., 2015; Ramírez-Vargas et al., 2018). Los Clados C-II y C-III fueron definidos al analizar muestras ambientales, y sólo aparecen esporádicamente en muestras clínicas, por lo que se supone que el hábitat natural de sus miembros es el ambiente (Janezic et al., 2018). Es pertinente agregar además que, dada la notable divergencia de estos grupos, se ha sugerido que podrían corresponder a nuevas especies (Knight et al., 2020). En los últimos años se ha reportado un aumento en la incidencia de CDI en la población general, con un incremento en los casos de advenimiento comunitario de la enfermedad (Thornton et al., 2018). Este aumento podría estar relacionado con cambios a nivel de 10 ambiente comunitario que favorecen la emergencia de C. difficile en la población general (Ogielska et al., 2015). Los animales de granja, productos cárnicos y otros relacionados podrían ser un reservorio de cepas toxigénicas de C. difficile (Brown & Wilson, 2018). Se han identificado cepas toxigénicas en caballos, cerdos, ganado vacuno, así como en animales domésticos como perros y gatos (Weese, 2020) principalmente del ribotipo 078, así como de otros ribotipos relacionados con epidemias en seres humanos (014, 027) (Rabold et al., 2018). Esta evidencia sugiere que existe un importante potencial de transmisión zoonótica de la CDI, aunque aún es necesario realizar más estudios para comprobar esta hipótesis (Knight & Riley, 2019). Epidemiología de las CDI en Costa Rica: Entre diciembre de 2009 y abril de 2010 se presentó un brote nosocomial de diarrea asociada a C. difficile en el Hospital San Juan de Dios, reportado inicialmente por un aumento de casos de 0.3 y 0.6 a 2.4 por cada 10000 pacientes/día. Durante el periodo total se identificaron 84 casos, para una incidencia de entre 3.1 y 6.7 casos por cada 10000 pacientes/día. El brote fue finalmente declarado controlado en julio de 2010, gracias a la aplicación de diversas medidas de higiene intrahospitalarias y restricción de uso de antibióticos. En su reporte, los autores mencionan que la mayor limitación del estudio fue la poca sensibilidad del método diagnóstico utilizado, e indican además que el sistema de vigilancia nosocomial debe mejorar la sensibilidad de los métodos diagnósticos de C. difficile para prevenir casos futuros (Quesada-Gomez et al., 2010; Wong-McClure et al., 2012). En un estudio inicial con 37 aislamientos obtenidos a partir de muestras de este brote se identificaron nueve patrones de electroforesis de campo pulsante, todos positivos para tcdA y tcdB, susceptibles a vancomicina y metronidazol. Más de la mitad de estos mostraron el patrón de macrorestricción NAP1, los cuales poseían, además, alta resistencia a fluoroquinolonas. También se encontraron aislamientos con patrones NAP2 y NAP9 (Quesada-Gomez et al., 2010). En un estudio subsecuente se identificaron 68 aislamientos de C. difficile obtenidos a lo largo de dos años en los cuales no se presentaron brotes de CDI. Interesantemente, en este periodo predominó un genotipo local designado como NAPCR1 (26%) en conjunto con otras 14 cepas típicamente asociadas a infecciones intrahospitalarias (i.e. NAP2, NAP4 y NAP6), así como 8 genotipos nuevos. En este periodo no se aislaron cepas NAP1, y se encontraron 7 cepas 11 no toxigénicas a partir de las muestras de heces de los pacientes analizados (López- Ureña et al., 2016). Más recientemente se ha demostrado que aislamientos de la cepa NAPCR1 se caracterizan por ser multirresistentes a los antibióticos. Esta resistencia puede ser al menos parcialmente explicada por la presencia de mutaciones en gyrA y rpoB y la presencia de genes adquiridos en diversos elementos móviles (Ramírez-Vargas et al., 2017). Un último hallazgo reciente con respecto a C. difficile en nuestro país fue la identificación de tres aislamientos pertenecientes al Clado C-I en muestras de heces de pacientes humanos diarreicos. Estas cepas escapan pruebas diagnósticas basadas en PCR e inmunológicas comúnmente utilizadas en laboratorios clínicos, además de que representan nuevos ribotipos, tipos de electroforesis de campo pulsante y STs. Contienen, además, PaLocs atípicos, localizados en moléculas extracromosomales circulares, y variantes en las secuencias de CdtA y CdtB con respecto a la cepa de referencia R20291. A pesar de lo anterior, uno de estos aislamientos mostró efectos citotóxicos y mortalidad en hámsteres similares a los causados de una cepa NAP1 epidémica (Ramírez-Vargas et al., 2018). Pangenómica y secuencias firma: El llamado pangenoma de una especie bacteriana está compuesto por el genoma central (core genome), que incluye los genes responsables de funciones básicas de la biología de la especie y es compartido por todas las cepas conocidas de la misma, y el genoma accesorio o dispensable, que contiene genes adaptativos para su nicho y es específico de una cepa o grupo de cepas (Chaudhari, Gupta, & Dutta, 2016). C. difficile se caracteriza por poseer un pangenoma amplio y abierto, con una gran cantidad de genes accesorios y un componente central pequeño (Elliott et al., 2017). Así, las cepas de C. difficile pueden diferir de forma sustancial en su contenido génico. Las secuencias firma (en inglés “signature sequences”) son secuencias de longitud variable específicas para una especie, cepa, o grupo particular de estas (Karimi & Hajdu, 2016). Su presencia correlaciona con la identidad del taxón de interés, por lo que tienen un valor diagnóstico. Este concepto ha sido explotado en el desarrollo de métodos de detección basados en amplificación o hibridación de ADN, o bien, el reconocimiento de 12 péptidos o proteínas con anticuerpos o aptámeros para bacterias de interés clínico (Hung, Nagamine, Li, & Lo, 2012; Nagamine, Hung, Li, & Lo, 2015; Phillippy et al., 2007). Aportes de la genómica al estudio y manejo en enfermedades infecciosas: La disminución del costo de la secuenciación de genomas y la disponibilidad de genomas completos en bases de datos públicas han revolucionado el campo de las enfermedades infecciosas. La genómica microbiana ha permitido el diseño de ensayos diagnósticos basados en herramientas moleculares como la PCR. Estos ensayos no solo permiten muchas veces la detección e identificación de patógenos directamente en matrices complejas, sin necesidad de realizar cultivo (Logares et al., 2012), sino que también posibilitan la selección de diferentes blancos según su objetivo. La detección de microorganismos por PCR en especímenes clínicos ha sido utilizada por un tiempo considerable, en parte por su capacidad de identificar microorganismos difíciles de cultivar en el laboratorio. Si bien inicialmente los blancos para estos ensayos se determinaban empíricamente, hoy en día es factible diseñar ensayos específicos para secuencias presentes en un microorganismo o grupo particular, gracias a la gran cantidad de genomas de especies bacterianas disponibles en bases de datos públicas y la accesibilidad de las aplicaciones bioinformáticas necesarias para lograr tal fin. Actualmente existen varios ensayos y tecnologías comercialmente disponibles para la detección de microorganismos patógenos basados en PCR, tales como SeptiFast (Roche®) (Korber et al., 2017), el cual permite la identificación simultánea de una importante variedad de microorganismos en sangre, y GeneXpert, que ha sido recomendado por la Organización Mundial de la Salud para el diagnóstico de tuberculosis (Saeed et al., 2017), solamente para citar dos ejemplos. Además del diseño de nuevos métodos de detección de patógenos, la disminución en el costo de la secuenciación de genoma completo ha posibilitado el desarrollo y aplicación de métodos de genotipado basados en esta metodología, siendo el análisis de MLST el más comúnmente utilizado actualmente. El sitio web PubMLST.com lista alelos y STs de más de 100 especies microbianas, muchas de importancia clínica, como C. difficile, Escherichia coli y Staphylococcus aureus, permitiendo la caracterización genotípica de aislamientos de interés a partir de los datos de secuenciación (Jolley, Bray, & Maiden, 2018). 13 La secuenciación de genoma completo posibilita también la detección de marcadores genéticos de interés clínico, tales como factores de virulencia y genes relacionados con resistencia a antibióticos, lo cual puede ser relevante para el manejo de un paciente o de posibles brotes (Fournier, Dubourg, & Raoult, 2014). El reciente aumento en la cantidad de genomas completos depositados en bases de datos públicas ha permitido la ejecución de estudios de pangenómica, que permiten, por ejemplo, determinar cuáles genes del genoma se comparten entre distintas cepas de interés y cuáles están presentes únicamente en algunos grupos. Este tipo de estudio aplicado a microorganismos de interés clínico ha repercutido en la identificación de nuevos blancos para el desarrollo de vacunas, terapias y métodos de diagnóstico (Anani, Zgheib, Hasni, Raoult, & Fournier, 2020). 14 Capítulo II: Justificación, hipótesis y objetivos Justificación: El uso de métodos de diagnóstico sensibles, sencillos y rápidos es vital para iniciar el tratamiento y evitar la diseminación de C. difficile dentro y fuera de los centros hospitalarios. Los métodos moleculares existentes están diseñados principalmente para detectar las cepas típicamente descritas como virulentas (p. ej. NAP1/027/ST01) y se enfocan primordialmente en elementos del PaLoc, lo que excluye una gran parte de la población de C. difficile que podría estar presente en algunos pacientes. Un ejemplo de ello son las cepas Clado C-I con potencial patogénico que se han detectado por cultivo en pacientes costarricenses con CDI, ya que sus genomas y genes del PaLoc son altamente divergentes (Ramírez-Vargas & Rodríguez, 2020). Este proyecto pretende identificar secuencias firma de cepas del Clado C-I mediante genómica comparativa y usarlas en el diseño de un método de identificación por PCR cuantitativa en tiempo real (qPCR) más exhaustivo que los disponibles hoy en día comercialmente. Este abordaje se escogió porque el qPCR es ampliamente usado en los laboratorios clínicos y porque su implementación podría simplemente implicar la adición de un par adicional de oligonucleótidos a las reacciones usuales. Además de la relevancia diagnóstica de este esfuerzo, la identificación de secuencias firma contribuiría al poco conocimiento que se tiene sobre las cepas del Clado C-I, ya que potencialmente permitiría identificar genes relacionados con su anticipada inusual biología y facilitaría su estudio epidemiológico. Se pretende que el método detecte C. difficile de Clado C-I en heces y cultivo, por lo que podría utilizarse tanto en la clínica como fuera de centros hospitalarios, como por ejemplo, en estudios de veterinaria o microbiología ambiental para indagar sobre los casos comunitarios y el posible componente zoonótico de esta enfermedad (Janezic et al., 2016; Knetsch et al., 2018). 15 Hipótesis: Las cepas de Clostridioides difficile que pertenecen al Clado C-I poseen secuencias nucleotídicas exclusivas susceptibles de ser amplificadas diferencialmente por qPCR a partir de cultivos o heces. Objetivo general: ● Diseñar un método de diagnóstico molecular para cepas del Clado C-I de Clostridioides difficile basado en secuencias firma identificadas mediante pangenómica. Objetivos específicos: I. Utilizar pangenómica para identificar secuencias firma en el Clado C-I de C. difficile. II. Diseñar un método basado en qPCR que posibilite la detección de cepas del Clado C-I de C. difficile en cultivo y heces. 16 Capítulo III: Metodología Genomas: En el presente proyecto se incluyeron 77 genomas calidad “draft”, distribuidos en un grupo de inclusión compuesto por 10 cepas de C. difficile del Clado C-I y un grupo de exclusión compuesto por 67 genomas de C. difficile pertenecientes a los Clados 1-5. Específicamente, 40 del Clado 1, 7 del Clado 2, 6 del Clado 3, 8 del Clado 4 y 7 del Clado 5 (ver Anexo 1). Cinco de los genomas del grupo de inclusión fueron secuenciados y ensamblados en el Laboratorio de Investigación en Bacteriología Anaerobia (LIBA) de la Universidad de Costa Rica, los cuales corresponden a cepas toxigénicas del Clado C-I aisladas en Costa Rica entre los años 2014 y 2017 a partir de heces de pacientes diarreicos (Ramírez-Vargas et al., 2018). Los 72 genomas restantes fueron ensamblados a partir de reads de Illumina pareados descargados usando el NCBI SRA Toolkit (Leinonen, Sugawara, & Shumway, 2011). Estos genomas corresponden a aislamientos del Reino Unido y Australia obtenidos entre los años 2005 y 2012 y reportados por Dingle y colaboradores en un estudio de historia evolutiva del PaLoc (Dingle et al., 2014). Se empleó KmerGenie ver. 1.7049 (Chikhi & Medvedev, 2014) para evaluar la mejor longitud de k-mer teórica para ensamblar de novo cada juego de reads, usando subgrupos de 5 genomas según la longitud de read. Este software estima la longitud de k- mer ideal para un ensamblaje de novo (Chikhi & Medvedev, 2014). Los reads fueron ensamblados usando SPAdes (3.12.0) (Bankevich et al., 2012) en el modo predeterminado para genomas procariotas y usando la longitud de k-mer calculada usando KmerGenie, en ambos casos habilitando el método de corrección de reads BayesHammer con scaffolding. Este software utiliza gráficos de Bruijn multilongitudinales, además, posee un paso de ensamblaje iterativo, de forma tal que permite aproximar la longitud de k-mer más apropiada de forma automática. Incluye además un módulo de corrección de reads de Illumina (BayesHammer) y un corrector de errores de apareamiento. Es apropiado para el ensamblaje de genomas pequeños y se ha demostrado que genera N50 superiores a otros ensambladores manteniendo una alta cobertura genómica (Bankevich et al., 2012). En este contexto, el valor N50 es una mediana ponderada, de forma tal que 50% del ensamblaje total está contenido en contigs o scaffolds de tamaño igual o mayor a este valor. 17 La calidad de los genomas ensamblados fue analizada utilizando la herramienta QUAST (Gurevich et al., 2013) con las cepas C. difficile 630, R20291, VL-0391, M68, y M120 como referencias para las cepas pertenecientes a los Clados 1, 2, 3, 4 y 5, respectivamente. Se eliminaron ensamblajes con una longitud menor a 3,8 Mbp, pues esta corresponde a la menor longitud esperable para C. difficile y se eligió el mejor ensamblaje para cada cepa según mayor N50 y menor L50, donde L50 corresponde a la cantidad de secuencias necesarias para alcanzar el N50. Los valores de N50 obtenidos fueron comparados con los reportados originalmente en el trabajo de Dingle y colaboradores (Dingle et al., 2014), obteniéndose solo 4 ensamblajes con menor valor. Estos ensamblajes fueron aún así conservados para mantener la homogeneidad en el tamaño del set de datos. Los ensamblajes escogidos fueron anotados con Prokka (1.14.6) (Seemann, 2014) usando una base de datos de proteínas pertenecientes a las anotadas en el genoma de la cepa C. difficile 630 (AM180355), dado que estas han sido curadas manualmente por el Instituto Sanger. Prokka coordina varias herramientas que permiten anotar secuencias codificantes para proteínas y ARN no codificantes, incluyendo Prodigal, RNAmmer, Aragorn, SignalP e Infernal (Seemann, 2014). Genómica comparativa: Con el fin de verificar la designación cladística de las cepas incluidas en el análisis, se realizó un alineamiento de genoma core con Roary (Page et al., 2015), del cual se extrajeron los sitios variables para construir un alineamiento Clustal Omega y un dendrograma con SeaView (Gouy, Guindon, & Gascuel, 2010), el cual fue visualizado y editado en TreeGraph 2 (Stöver & Müller, 2010). Asimismo, se determinaron los valores de identidad nucleotídica promedio (ANI) por pares entre todas las cepas de ambos grupos usando FastANI (Jain, Rodriguez-R, Phillippy, Konstantinidis, & Aluru, 2018). Identificación de secuencias firma: Para determinar las secuencias firma de las cepas Clado C-I se utilizaron tres técnicas: a) GWAS, b) procesos automatizados basados en referencia y pareo de k-mer y c) análisis pangenómicos. 18 Para llevar a cabo los estudios de asociación genética o GWAS (Falush, 2016) se utilizaron los programas DBGWAS, TreeWAS y Roary/Scoary. DBGWAS realiza GWAS basado en k-mer extendidos y gráficos de Bruijn compactados. Durante el proceso, los nodos del gráfico se prueban por asociación con la característica de interés (en este caso, pertenecer al grupo de inclusión). La salida consiste en regiones del gráfico que contienen nodos significativamente asociados con la característica de interés, a decir, pertenencia al Clado C-I) (Jaillard et al., 2018). Dada la sobre-representación de cepas del Clado 1 y la cantidad de k-mer significativos esperados, se realizó un primer análisis exploratorio con opciones predeterminadas, y uno posterior usando SFF (significant features filter)=70, nh (neighbourhood)=3, k=47 y maf (minor allele frequency)=0,0014, pretendiendo que los componentes resultantes tuvieran menos nodos y fueran más sencillos de visualizar. Roary es una herramienta que construye pangenomas e identifica genes accesorios a partir de las secuencias codificantes de un grupo de genomas. Usando BLASTp, CD-HIT y agrupamiento por MCL, este software construye un gráfico con la relación de grupos de genes ortólogos y parálogos y una tabla de presencia/ausencia de estos genes en los genomas analizados (Page et al., 2015). Esta información es usada por Scoary para hacer un “pan-GWAS”, en donde cada gen candidato en el genoma accesorio se puntea según su correlación aparente con una característica (en este caso, pertenecer al grupo de inclusión). Aquellos genes que pasan el primer cribado son reanalizados incorporando la información de la estructura filogenética de la muestra, infiriendo la estructura poblacional a partir de los datos (Brynildsrud, Bohlin, Scheffer, & Eldholm, 2016). La tabla de presencia/ausencia generada por Roary fue utilizada para realizar un tercer análisis con TreeWAS (Collins & Didelot, 2018), el cual utiliza un acercamiento al GWAS basado en árboles filogenéticos, midiendo la asociación estadística entre una característica de interés y el genotipo de todos los loci, identificando asociaciones significativas y corrigiendo por el efecto de población clonal. Roary, Scoary y TreeWAS fueron empleados con las opciones predeterminadas usando los mismos grupos de inclusión y exclusión. Adicionalmente, para identificar las secuencias firma de forma automatizada se utilizó la herramienta Neptune, que identifica k-mers conservados en el grupo de inclusión y ausentes en el de exclusión. Las secuencias encontradas son evaluadas y filtradas realizando un análisis de especificidad utilizando alineamientos en parejas. Aquellas secuencias que pasan este filtro son clasificadas según su puntuación de especificidad y 19 sensibilidad, usando rangos de confianza (Marinier et al., 2017). Se utilizaron los grupos de inclusión y exclusión mencionados anteriormente, especificando que las secuencias extraídas estuvieran presentes en todos los genomas de inclusión, ausentes en todos los genomas de exclusión, y que fueran al menos de 200 pares de bases. Para la identificación de secuencias mediante análisis pangenómico se utilizó el flujo de trabajo para pangenómica de Anvi’o (Delmont & Eren, 2018; Eren et al., 2015). Este procedimiento genera una base de datos genómica que almacena las secuencias nucleotídicas y aminoacídicas, así como las anotaciones funcionales para cada gen en el genoma de ambos grupos incorporados en el análisis, para luego computar un pangenoma a partir de conglomerados de genes. El pangenoma obtenido permite visualizar los conglomerados de genes presentes o ausentes en los distintos grupos de genomas. Anvi’o se usó habilitando la opción de evaluación de función COG (del inglés “clusters of orthologous groups of proteins”) (Tatusov, Galperin, Natale, & Koonin, 2000). Se corrió, además, un análisis de enriquecimiento funcional entre los grupos de inclusión y exclusión, y manualmente se identificó un bin con conglomerados de genes presentes exclusivamente en el grupo de inclusión. Se determinó manualmente la concordancia entre las secuencias firma identificadas con Scoary y TreeWAS, verificando sus valores de p, sensibilidad y especificidad. Posteriormente las secuencias identificadas con ambos métodos fueron revisadas contra las identificadas en el bin exclusivo reportado por Anvi’o, extrayendo manualmente la secuencia aminoacídica de Anvi’o, encontrando la secuencia en el genoma anotado, extrayendo su identificador único, y verificando en la salida consolidada de Scoary y TreeWAS. El flujo de trabajo comentado en esta sección se resume en la Figura 2. 20 Figura 2. Esquema resumen de la metodología utilizada para identificar las posibles secuencias firma. Se representan en azul los grupos de inclusión y exclusión, en verde los programas empleados, y en celeste sus salidas. 21 Diseño de oligonucleótidos cebadores: Las secuencias firma identificadas con los métodos anteriormente descritos fueron comparadas según especificidad, sensibilidad, y cantidad de métodos que las identificaron. Las mejores secuencias fueron filtradas usando la base no redundante del NCBI con BLASTn, eliminando aquellas que tenían alta identidad con secuencias de ADN de otras especies o con secuencias de cepas de C. difficile no pertenecientes al Clado C-I (E-value<1, bit score > 40). Se utilizó Primer-BLAST (Ye et al., 2012) para diseñar juegos de oligonucleótidos cebadores que amplificaran por PCR 11 presuntas secuencias firma del grupo de inclusión, identificadas tal y como se detalló en el apartado anterior. Se conservaron los parámetros predeterminados de esta aplicación, salvo aquellos relacionados con especificidad de los pares de oligonucleótidos, para los cuales se usó la base de datos Refseq con genomas de Homo sapiens, Clostridia (NCBI taxid:186801) y Firmicutes (NCBI taxid:1239), considerando que se realizaron amplificaciones en presencia de ADN humano y en heces humanas. Se procuró que estas secuencias fueran compatibles con el sistema multiplex descrito por Miller y colaboradores (2010), el cual es recomendado para el diagnóstico de CDI a partir de muestras de heces. Este método utiliza ADN extraído a partir de cultivos de C. difficile aislados a partir de heces previamente en dos ensayos de PCR multiplex con cebadores para los genes cdtB, tcdA, tcdB, tcdC y tpi. En este contexto, mientras que los cebadores para tcdA, tcdB y cdtB permiten categorizar las cepas de acuerdo a las toxinas que contienen, los cebadores para el gen tpi amplifican un fragmento específico presente en el genoma de todas las cepas conocidas de C. difficile, por lo que permiten detectar cepas no toxigénicas (Lemee et al., 2004). Los pares de oligonucleótidos cebadores sugeridos por el software fueron clasificados según los siguientes parámetros: a) Tm más cercano a 60 0C, b) largo del producto entre 70 y 170 pares de bases, c) contenido GC entre 40% y 60%, d) ausencia de autocomplementariedad, particularmente en el extremo 3’ (en este caso la autocomplementariedad representa la tendencia de los cebadores a alinearse con el otro, sin necesariamente favorecer amplificación del dímero, mientras que la autocomplementariedad 3’ representa la tendencia de que se generen dímeros de cebadores que se amplifiquen). Posteriormente, para los siete mejores pares se determinó in silico la posible existencia de estructuras secundarias en el amplicón y sus 22 características termodinámicas (Markham & Zuker, 2005), así como las de su hibridación y posible heterogeneidad en sus sitios de unión al ADN de las cepas del grupo de inclusión (mediante alineamiento Clustal Omega). A partir de esta información se seleccionaron los cuatro mejores pares, los cuales se sintetizaron comercialmente (servicio de Macrogen, Korea). Dado que los oligonucléotidos del párrafo anterior no tienen como blanco ninguna de las toxinas requeridas para causar enfermedad, también se diseñaron pares de oligonucleótidos cebadores para los alelos del gen tcdB detectados entre las cepas toxigénicas del grupo de inclusión, según lo descrito para los diseñados para las secuencias firma. El mejor par fue también síntetizado en Macrogen, Korea. Estandarización y validación de la PCR: Los cebadores para amplificar las secuencias firma fueron inicialmente probados en un ensayo de PCR punto final. Para tal fin se usó utilizando ADN genómico extraído con el kit DNEasy tissue kit (Qiagen) a partir de cultivos de cuatro cepas de C. difficile pertenecientes al Clado C-I (identificadas como LIBA-6622, LIBA-6625, LIBA-6822 y LIBA-7602), ocho cepas de otros clados de C. difficile, identificadas como NAP7, NAP1, A-B+, dos Clado 1 identificadas como LIBA-5755 y LIBA-6291, una Clado 2 identificada como LIBA-5757, una Clado 3 identificada como LIBA-7110 y una Clado 4 identificada como LIBA-6279), dos de C. perfringens (identificadas como SM101 y LIBA-8327), una de C. filamentosum (ATCC 25785), una de C. botulinum (identificada como A2), y una de Bacteroides thetaiotaomicron (ATCC 29741). La amplificación se realizó con una concentración de ADN entre 0,065 ng/µL y 1,17 ng/µL, 0,3 µl de oligonucleótido cebador forward y reverso en concentración final de 0,15 µM, 10 µl de PowerUpTM SYBR® Green Master Mix (Applied Biosystems) y agua libre de nucleasas para PCR, para un volumen final de 20 µl. El perfil de amplificación incluyó los siguientes pasos: a) preincubación de 2 minutos a 50 ºC seguidos de 2 minutos a 95 0C; b) 40 ciclos de amplificación, cada uno con 15 segundos a 95 0C, 15 segundos a 60 0C y 1 minuto a 72 0C. Luego de la amplificación, 5 µl del producto de cada reacción fueron cargados con 2 µl de buffer de carga con GelRed® en geles de agarosa al 1,5% en TAE 0,5X, y corridos por 45 minutos a 100 V. Luego de comprobar que los oligonucleótidos diseñados amplificaban las secuencias firma en las cepas del grupo de inclusión, se procedió a realizar pruebas en un equipo 23 de qPCR LightCycler480 (Roche®). Para un primer ensayo se utilizaron cuatro cepas de C. difficile del Clado C-I (LIBA-6622, LIBA-6822, LIBA-7602 y LIBA-7194), cuatro cepas C. difficile pertenecientes a otros clados (LIBA-5755, LIBA-5755, LIBA-6291 y LIBA-7110), y una cepa de C. perfringens (LIBA-8327). En estos primeros ensayos se utilizaron volúmenes iguales a los presentados en la PCR anteriormente presentada. Se empleó el siguiente perfil térmico: a) preincubación de 5 minutos a 95 ºC; b) 45 ciclos de amplificación, cada uno con 10 segundos a 95 0C, 15 segundos a 60 0C y 20 segundos a 72 0C con adquisición sencilla; c) análisis de melting de 65 0C a 97 0C. Seguidamente se realizaron ensayos de qPCR con los mismos oligonucleótidos cebadores y ADN extraído de heces humanas de pacientes diarreicos negativos para C. difficile, con el fin de comprobar que la ausencia de amplificación en ausencia de ADN de cepas del grupo de inclusión. Para tal fin, se tomó la cantidad de heces que quedaba unida a un hisopo estéril y se disolvió en 1 ml de medio amies líquido (Hubbard, Pellar, & Emanuel, 2011). Se extrajo el ADN genómico total a partir de 200 µl de las heces diluidas usando un instrumento MagNA pure-12 según las instrucciones del fabricante (Roche®), con un volumen de eluido de 50 µl, con y sin pretratamiento con proteinasa K, e incubación a 65 ºC sin agitación por 10 minutos. El ADN extraído fue cuantificado por fluorometría en un equipo Qubit (Invitrogen) y utilizado para un ensayo de PCR tiempo real según se describió anteriormente, modificando los volúmenes de ADN agregado de forma tal que el volumen final de la reacción tuviera una concentración final de ADN genómico igual a 1,5 ng/µl. También se realizó un ensayo para comprobar si la adición de ADN de cepas del Clado C-I a heces de pacientes diarreicos negativos por C. difficile daba lugar a la amplificación de los productos esperados en otro ensayo de qPCR. Esto con los mismos oligonucleótidos cebadores y condiciones descritas. Para tal fin se tomó 1 ml de cuatro muestras de heces de pacientes diarreicos colectadas y diluidas (ver arriba), a las cuales se le agregaron diferentes volúmenes de ADN genómico extraído a partir de cultivos de cepas Clado C-I (LIBA-7194, LIBA-6822, LIBA-7602, LIBA-6622), de forma que cada muestra de heces recibiera 9-12 ng de ADN. Posteriormente se realizó una extracción de ADN genómico de las heces inoculadas en un instrumento MagNA pure 12 (Roche®), sin realizar pretratamiento. Este ADN extraído fue cuantificado y utilizado para un ensayo de qPCR utilizando los oligonucleótidos cebadores en el mismo instrumento LightCycler480 (Roche®), el perfil de temperatura arriba descrito y 24 ajustando los volúmenes de ADN añadido de forma tal que cada reacción tuviera una concentración de ADN de entre 1,15 ng/µl y 1,25 ng/µl. Como última prueba para determinar la especificidad y sensibilidad de los oligonucleótidos diseñados para detectar cepas del Clado C-I en matrices complejas, se inocularon heces de un paciente diarreico con cultivos en medio líquido de tres cepas del Clado C-I (MX-149, MX-152 y SJ312) y dos de otros clados de C. difficile (LIBA-6533 y LIBA-6538). Para tal fin se mezclaron 750 µl de heces y un volumen igual del cultivo de alguna de las cepas, sea puro, diluido 1:100 ó 1:500 en solución salina, para un total de 15 muestras, además de una sin inocular, mezclada con solución salina en la misma proporción. A partir de cada muestra se tomaron 500 µl de mezcla, los cuales fueron tratados con 40 µl de proteinasa K, para, acto seguido, extraer el ADN genómico a partir 400 µl de cada una en un equipo MagCore Plus II (RBC Bioscience) con un volumen de eluido de 40 µl. El ADN extraído fue cuantificado utilizando un fluorómetro Qubit según las instrucciones del fabricante. Se realizó un ensayo de qPCR para cada muestra de ADN extraído utilizando los oligonucleótidos cebadores en un instrumento LightCycler480 (Roche®) utilizando el perfil de temperatura descrito pero con 45 ciclos de amplificación y ajustando los volúmenes de ADN añadido de forma tal que cada reacción tuviera entre 0,97 ng/µl y 3,23 ng/µl de ADN. Los oligonucleótidos cebadores para el gen tcdB fueron probados por qPCR usando ADN genómico de cuatro cepas toxigénicas de C. difficile del clado C-I (LIBA-6622, LIBA-6625, LIBA-6822 y LIBA-7194), seis cepas de otros clados de C. difficile (NAP1, A-B+, LIBA-5755, LIBA-6291, LIBA-7110 y LIBA-6279), dos de C. perfringens (SM101 y LIBA-8327), una de C. filamentosum (ATCC 25785), una de C. botulinum (identificada como A2), y una de Bacteroides thetaiotaomicron (ATCC 29741), en concentraciones de entre 0,054 ng/µl y 2,34 ng/µl de ADN, así como las heces inoculadas con cultivos mencionadas anteriormente. La amplificación se realizó con 1 µl de ADN, 0,5 µl de oligonucleótido cebador forward y reverso en concentración 10 µM, 10 µl de PowerUpTM SYBR® Green Master Mix (Applied Biosystems) y completando el volumen final de 20 µl por reacción con agua para PCR. Se empleó un instrumento LightCycler480 (Roche®) utilizando las concentraciones de ADN y el perfil de temperatura descritos para los otros pares de oligonucleótidos cebadores, pero con 40 ciclos de amplificación. 25 En ensayos de qPCR, el valor de Ct (o Cq) corresponde al número de ciclos de amplificación transcurridos cuando la curva de amplificación alcanza la línea del umbral, esto es, el momento en que la fluorescencia se hace detectable (Kralik & Ricchi, 2017). Se seleccionó Ct=35 como punto de corte dado que la presencia de una única copia de la secuencia blanco en la reacción generaría este resultado (asumiendo eficiencia de amplificación del 90%-100%). A partir de los resultados obtenidos en cada ensayo de PCR, excepto el realizado con ADN extraído a partir de heces de pacientes diarreicos, se calcularon la especificidad y sensibilidad de los pares de cebadores para clasificar correctamente una cepa en cultivo puro según pertenezca o no al Clado C-I, o en determinar correctamente la presencia o ausencia de una cepa del Clado C-I en una muestra de heces diarreica. Estos valores de determinaron según las ecuaciones (Kralik & Ricchi, 2017): 𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 𝑉𝑃 𝑉𝑃 + 𝐹𝑁 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 𝑉𝑁 𝑉𝑁 + 𝐹𝑃 Donde VP representa la cantidad de verdaderos positivos, VN la cantidad de verdaderos negativos, FP la cantidad de falsos positivos y FN la cantidad de falsos negativos. En los resultados de los ensayos realizados con ADN extraído a partir de cultivos puros se consideró: i) como verdadero positivo la amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de una cepa del Clado C-I, ii) como verdadero negativo la ausencia de amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de una cepa que no pertenece al Clado C- I, iii) como falso positivo la amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de una cepa que no pertenece al Clado C-I y iv) como falso negativo la ausencia de amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de una cepa del Clado C-I. Por su parte, en los resultados de los ensayos realizados con ADN extraído de muestras de heces se consideró: i) como verdadero positivo la amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de heces que contenían C. difficile del Clado C-I, ii) como verdadero negativo la ausencia de amplificación antes del punto de corte de una reacción que contenía ADN extraído a 26 partir de heces que no contenían C. difficile del Clado C-I, iii) como falso positivo la amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de heces que no contenían C. difficile del Clado C-I y iv) como falso negativo la ausencia de amplificación antes del punto de corte de una reacción que contenía ADN extraído a partir de heces con C. difficile del Clado C-I. Cuadro II. Resumen de la forma de interpretación de los ensayos de qPCR Amplificación antes del punto de corte Ausencia de amplificación antes del punto de corte Muestra con ADN de C. difficile Clado C-I VP FN Muestra con ADN de C. difficile no Clado C-I FP VN Para estimar el límite de detección de los dos mejores cebadores diseñados para las secuencias firma encontradas y el gen tcdB, se prepararon nueve diluciones decimales seriadas de ADN extraído a partir de un cultivo líquido de una cepa del Clado C-I que generó amplificación por qPCR utilizando los métodos descritos arriba (LIBA-7602). Se realizó un ensayo de qPCR para cada una de estas soluciones y pares de cebadores, empleando un instrumento LightCycler480 (Roche®) y los perfiles de temperatura descritos, pero con 35 ciclos de amplificación y agregando 1µL de cada solución de ADN, para generar concentraciones seriadas en las reacciones de entre 0,165 ng/µl y 1,65x10-9 ng/µl de ADN. 27 Figura 3. Esquema resumen de las pruebas realizadas para validar la sensibilidad y especificidad de los cebadores diseñados para las secuencias firma identificadas. Figura 4. Esquema resumen de las pruebas realizadas para validar la sensibilidad y especificidad de los cebadores diseñados para el gen tcdB presente en las cepas del Clado C-I. 28 Capítulo IV: Resultados Genómica comparativa y pangenómica: La Figura 5 confirma la distribución cladística reportada por Dingle y colaboradores (Dingle et al., 2014), así como la pertenencia de las cepas aisladas en el LIBA al Clado C-I. Este resultado confirma que la distribución de las cepas en los grupos de inclusión y exclusión es apropiada según el propósito de la investigación. 29 Figura 5. Árbol filogenético construido a partir de un alineamiento de sitios variables identificados por Roary en todos los genomas analizados. Las cepas C-I (rojo) pertenecen a un clado genéticamente divergente. Se muestran las cepas del Clado 1 en negro, del Clado 2 en morado, del Clado 3 en azul, del Clado 4 en naranja y del Clado 5 en verde, así como los valores de bootstrap (100 iteraciones) para cada nodo y la escala (sustituciones por sitio). Las cepas aisladas en el LIBA se marcan con un asterisco. 30 A pesar de ser diferentes entre sí, las cepas Clado C-I son genéticamente distintas a las cepas Clados 1-5 (Figura 6). Los valores de porcentaje de identidad nucleotídica promedio (ANI) obtenidos de la comparación de estos grupos sugieren que ambos representan especies distintas. Figura 6. Diagrama de cajas-bigotes para comparar el ANI determinado por FastANI para cepas de Clado C-I (n=10), Clados 1-5 (n=67) y entre ambos grupos. La línea roja marca un 95% de ANI, el cual es el umbral aceptado para delimitar especies bacterianas (Jain, Rodriguez-R, Phillippy, Konstantinidis, & Aluru, 2018). El alto grado de divergencia de las cepas del Clado C-I se confirmó a través de la observación de un incremento sustancial en el tamaño del pangenoma de C. difficile y 31 una concomitante reducción del tamaño de su genoma core luego de incluir cepas Clado C-I en la comparación (Figura 7). Un número pequeño, pero detectable, de secuencias codificantes son compartidas por todos los miembros del Clado C-I, pero no pertenecen al genoma core de C. difficile (n=890), por lo que son potencialmente secuencias firma y potencialmente aprovechables en el diagnóstico específico que se desea diseñar (Figura 7). 32 A. B. Figura 7. Número absoluto (A) y relativo en porcentaje (B) de secuencias en el genoma core (presentes en al menos 99% de las cepas analizadas, n=76), soft-core (presentes entre el 95% y 99% de las cepas, n=73 y 76 cepas), shell (presentes entre el 15% y 95% de las cepas, n= 11 y 73 cepas) y cloud (presentes en menos del 15% de las cepas, n< 11) de las cepas del Clado C-I, las cepas de los Clados 1-5 y todas las cepas analizadas. En congruencia con el resultado anterior, una fracción del genoma core de las cepas Clado C-I no está presente en las cepas de los Clados 1-5 (Figura 8). 33 Figura 8. Matriz de presencia/ausencia de CDS contextualizada filogenéticamente (Roary). Las líneas verticales azules y naranja indican presencia de CDSs o presencia de CDS exclusiva en cepas del Clado C-I, respectivamente. En el dendrograma se muestran las cepas del Clado 1 en negro, del Clado 2 en morado, del Clado 3 en azul, 34 del Clado 4 en naranja y del Clado 5 en verde, así como los valores de soporte local (test de Shimodaira-Hasegawa con 1000 reemplazos) para cada nodo. Las cepas C-I se encuentran en el recuadro rojo. De acuerdo con los resultados obtenidos con Scoary y treeWAS, la mayoría de los CDS universales, pero exclusivos de las cepas C-I, codifican para enzimas metabólicas y proteínas hipotéticas. En un menor grado se encontraron múltiples factores de transcripción, sistemas de transporte ABC, sistemas reguladores de dos componentes, entre otros (ver Anexo IV para la descripción completa). Por su parte, el bin exclusivo de las cepas C-I extraído por Anvi’o, contiene un importante número de conglomerados de genes de copia única relacionados con transcripción (K) (n=25), mecanismos de transducción de señales (T) (n=11) y metabolismo de aminoácidos y carbohidratos € (n=11) (Figura 9) (ver Anexo V para la descripción completa). Figura 9. Conglomerados de genes presentes en el bin exclusivo de las cepas C-I identificado por Anvi’o, clasificados según su función COG anticipada. 0 5 10 15 20 25 30 Transcripción (K) Sólo predicción de función general (R) Mecanismos de transducción de señal (T) Metabolismo y transporte de aminoácidos (E) Metabolismo y transporte de carbohidratos (G) Mecanismos de defensa (V) Transporte y metabolismo de iones inorgánicos (P) Función desconocida (S) Traducción, estructura ribosomal y biogénesis (J) Producción y conversión de energía (C) Otros Ninguna Número de conglomerados 35 Identificación de secuencias firma: Utilizando Neptune se identificaron varias secuencias firma candidatas, sin embargo, ninguna de estas estaba totalmente ausente en el grupo de exclusión, y todas mostraron una considerable similitud con secuencias de otras especies o de cepas de C. difficile al alinearlas con BLASTn a la colección de nucleótidos del NCBI (Ver Anexo III). Por tal razón, se descartaron y no se consideraron para los análisis subsecuentes. Al menos 11 conglomerados de CDS (cada uno conformado por una CDS de cada cepa del Clado C-I) fueron identificados por Anvi’o, Roary/Scoary y Treewas como exclusivos de las cepas C-I (p<0.05) con 100% de sensibilidad y especificidad (valores de p con corrección Benjamini–Hochberg de 1,22x10-11), y sin similitud significativa con secuencias nucleotídicas de organismos que no pertenecen al Clado C-I de C. difficile, tales como bacterias del género Clostridium (C. perfringens, C. septicum) E. coli, Enterococcus fecalis, las cuales son constituyentes de la flora intestinal normal del adulto (Cuadro III). Estas secuencias firma se utilizaron como candidatas para el diseño de cebadores para PCR. 36 Cuadro III. Principales características predichas de las secuencias firma del Clado C-I identificadas en conjunto por Roary/Scoary, TreeWAS y Anvi’o y determinadas por Roary y Anvi’o. Todas las secuencias tuvieron longitudes mayores a 300 pb para posibilitar su detección por qPCR. ID Roary Anotación funcional (Roary) Identificador de conglomerado de Anvi’o Indice de homogeneidad geométrica por Anvi’o Función COG por Anvi’o Categoría COG por Anvi’o* Puntaje de enriquecimiento de Anvi’o Core en C-I? lsrF 3-hidroxi-5-fosfonooxipentano-2,4-diona tiolasa GC_00004247 1 Fructosa bisfosfato aldolasa clase Ia G 7,77 Si dhaK Dihidroxiacetona kinasa dependiente de PTS, subunidad de unión a dihidroxiacetona Dhak GC_00004331 1 Dihidroxiacetona kinasa G 7,77 Si crcB Transportador de ión fluoruro predicho CrcB GC_00004262 0,9983871 Exportador de ión fluoruro CrcB/FEX D|P 7,77 Si grupo_5507 Proteína hipotética GC_00004244 1 NA NA NA NA grupo_8205 Regulador transcripcional GC_00004306 1 Regulador transcripcional de unión a ADN LsrR K NA NA grupo_5266 Proteína hipotética GC_00004280 1 NA NA NA NA grupo_5459 Proteína hipotética GC_00004274 1 Proteína de unión a metal predicha S NA NA grupo_7858 Proteína hipotética GC_00004267 1 NA NA NA NA grupo_8076 Proteína hipotética GC_00004294 0,998726115 Regulador transcripcional de unión al ADN. K NA NA grupo_3785 Regulador transcripcional, familia MerR GC_00004253 0,9889393 Regulador transcripcional de unión a ADN K NA NA grupo_3695 Sistema de transporte tipo ABC, permeasa de familia cistina/aminoácido GC_00004326 0,9465858 Sistema de transporte de aminoácido tipo ABC E NA NA 37 *Las categorías COG mostradas corresponden a: G=Metabolismo y transporte de carbohidratos; D=Control del ciclo celular y mitosis; P= Transporte y metabolismo de iones inorgánicos; K= Transcripción; E=Metabolismo y transporte de aminoácidos; S=Función desconocida. NA = indeterminado. 38 Diseño y validación de ensayo (q)PCR: Ocho secuencias firma identificadas generaron pares de oligonucleótidos cebadores específicos utilizando Primer-BLAST. En el Cuadro IV se muestran algunas de sus características predichas, las cuales funcionaron como primer criterio de selección según se describe en la metodología. No se encontraron pares de oligonucleótidos cebadores específicos para los clusters identificados como lsrF y dhaK. Además, no se diseñaron oligonucleótidos cebadores para el grupo_3695 debido a diferencias en el tamaño (pb) de los CDS que conforman dicho conglomerado (Cuadro IV). 39 Cuadro IV. Características predichas de los pares de cebadores identificados por PrimerBLAST para las secuencias firma seleccionadas. Cluster Largo producto (bp) Hebra molde Largo Tm GC% Autocomplementariedad Autocomplementariedad 3’ crcB 116 Forward + 22 59,89 45,45 5 1 Reverse - 21 57,79 47,62 2 2 118 Forward + 23 60,25 43,48 7 1 Reverse - 22 57,65 45,45 3 2 114 Forward + 23 60,44 43,48 5 0 Reverse - 24 58,79 45,83 5 3 123 Forward + 23 59,23 43,48 7 0 Reverse - 24 58,79 45,83 3 1 124 Forward + 22 58,22 40,91 7 0 Reverse - 24 58,79 45,83 3 0 110 Forward + 24 59,96 41,67 2 0 Reverse - 25 59,93 44 7 2 152 Forward + 24 60,14 45,83 6 2 Reverse - 25 59,7 48 3 1 100 Forward + 22 57,8 45,45 2 0 Reverse - 25 59,7 44 7 1 5507 126 Forward + 23 58,87 43,48 6 0 Reverse - 23 59,67 43,48 4 2 115 Forward + 24 59,66 41,67 4 2 Reverse - 22 58,33 45,45 4 2 123 Forward + 24 60,38 41,67 6 0 Reverse - 22 58,07 45,45 4 1 159 Forward + 22 57,52 45,45 6 0 Reverse - 24 60,02 37,5 6 2 111 Forward + 25 59,99 40 4 2 40 Reverse - 24 60,2 41,67 4 2 128 Forward + 25 60,16 40 6 0 Reverse - 24 60,2 41,67 6 2 146 Forward + 23 59,68 43,48 4 2 Reverse - 25 58,53 36 4 0 124 Forward + 25 59,7 40 6 0 Reverse - 24 60,56 45,83 4 2 126 Forward + 24 58,7 41,67 6 0 Reverse - 24 60,8 45,83 4 1 120 Forward + 23 57,51 39,13 6 0 Reverse - 24 59,01 41,67 4 2 8205 234 Forward + 20 60,4 55 6 0 Reverse - 22 59,96 45,45 4 2 260 Forward + 24 59,53 45,83 3 1 Reverse - 21 59,99 52,38 4 0 332 Forward + 22 61,18 50 4 0 Reverse - 22 60,5 50 6 2 3785 101 Forward + 22 58,48 45,45 4 3 Reverse - 21 57,62 42,86 6 3 102 Forward + 21 57,39 42,86 4 3 Reverse - 23 59,32 43,48 6 3 104 Forward + 23 59,13 43,48 4 1 Reverse - 22 58,07 40,91 6 3 106 Forward + 21 57,07 47,62 4 1 Reverse - 22 58,06 45,45 6 2 165 Forward + 22 58,07 40,91 6 2 Reverse - 21 57,03 47,62 5 2 167 Forward + 22 58,07 40,91 6 3 Reverse - 24 59,9 41,67 5 2 41 196 Forward + 23 59,07 43,48 6 2 Reverse - 24 59,78 41,67 2 1 134 Forward + 24 58,94 37,5 8 2 Reverse - 22 58,47 45,45 5 2 195 Forward + 24 59,67 41,67 6 0 Reverse - 24 59,47 41,67 2 0 277 Forward + 24 60,38 41,67 4 3 Reverse - 24 59,47 41,67 2 0 5266 103 Forward + 23 59,22 43,48 8 0 Reverse - 24 57,59 33,33 3 1 108 Forward + 24 59,96 45,83 8 0 Reverse - 25 58,18 32 3 1 102 Forward + 22 57,58 45,45 8 0 Reverse - 25 57,2 36 3 0 72 Forward + 25 57,46 36 6 3 Reverse - 24 58,62 37,5 4 0 5459 434 Forward + 23 57,05 39,13 4 2 Reverse - 24 59,36 37,5 3 2 7858 161 Forward + 24 60,2 45,83 4 2 Reverse - 23 59,93 43,48 4 0 170 Forward + 24 59,48 41,67 6 2 Reverse - 22 58,6 45,45 4 2 160 Forward + 25 59,82 40 6 2 Reverse - 21 57,33 47,62 5 1 151 Forward + 25 59,35 40 4 3 Reverse - 22 57,96 50 5 1 241 Forward + 24 58,34 41,67 4 3 Reverse - 23 58,94 43,48 4 2 236 Forward + 23 57,34 39,13 6 3 42 Reverse - 24 60,08 45,83 5 1 161 Forward + 23 57,31 39,13 6 2 Reverse - 24 59,84 45,83 5 0 156 Forward + 24 58,17 37,5 4 3 Reverse - 23 58,69 43,48 4 3 163 Forward + 24 58,12 37,5 6 2 Reverse - 23 58,68 43,48 4 3 166 Forward + 25 59,06 40 6 2 Reverse - 22 57,65 40,91 4 2 8076 434 Forward + 23 57,05 39,13 4 2 Reverse - 24 59,36 37,5 3 2 43 Luego de realizar una primera depuración según los criterios establecidos en la metodología, se continuó teniendo un número elevado de pares de cebadores candidatos, sin embargo, muchos de ellos amplificaban las mismas secuencias, difiriendo en pocos nucleótidos. Por esta razón se seleccionó un subgrupo de siete mejores candidatos para los cuales se determinaron las características termodinámicas de la estructura secundaria del amplicón esperado y la capacidad de hibridación de ambos oligonucleótidos del par (Cuadro V). Este paso adicional permitió descartar algunos pares de cebadores cuyos amplicones esperados tenían estructuras secundarias con valores de Tm elevado donde el extremo 3’ no se encontraba libre, o bien, dímeros de cebador estables. Además, mediante alineamiento Clustal Omega de las secuencias blanco de los cebadores se determinó que todos los pares candidatos tenían algunos sitios variables (Cuadro V). 44 Cuadro V. Propiedades termodinámicas del amplicón esperado y posibles dímeros de cebador anticipados para los 7 mejores pares de cebadores candidatos. Cluster Largo producto Cebador Hebra molde Parámetros termodinámicos de estructura secundaria del amplicón Parámetros termodinámicos de posible dímero de cebadores Número de sitios variables ΔG (kcal/ mol) ΔH (Kcal/ mol) ΔS (cal/mol/ K) Tm (°C) Extremo 3’ ΔG (Kcal/ mol) ΔH (Kcal/ mol) ΔS (cal/mol/ K) Tm (°C) crcB 114 Forward + -7,16 -96,3 -287,41 61,9 libre -8,2 -77,0 -222,0 37,8 2 Reverse - 1 110 Forward + -9,25 -103,7 -304,53 67,4 libre -7 -46,3 -126,6 31,0 4 Reverse - 2 152 Forward + -15,92 -231,7 -695,73 59,9 libre -4,2 -54,0 -160,4 17,1 4 Reverse - 1 grupo_55 07 115 Forward + -4,57 -126,8 -394,1 48,6 horquilla de 3 nucleótidos -5,5 -39,0 -108,1 18,5 4 Reverse - 3 111 Forward + -4,98 -156,2 -487,57 47,2 asa -4,3 -29,6 -81,6 2,9 5 Reverse - 3 grupo_37 85 195 Forward + -12,22 -251,3 -770,85 52,9 libre -2,2 -23,9 -69,8 -22,7 2 Reverse - 2 grupo_78 58 161 Forward + -8,16 -232,1 -722,04 48,3 horquilla -3,7 -45,1 -133,5 10,3 3 Reverse - 0 45 Los 7 pares de cebadores cumplían con la mayoría de los criterios de inclusión establecidos en la metodología (Tm cercano a 60 ºC, largo de producto entre 70 y 170 pares de bases, contenido CG entre 40% y 60%, baja estabilidad del posible dímero de cebador, estructura secundaria del amplicón con extremo 3’ libre, o de baja estabilidad). Por el contrario, todos poseían cierto grado de autocomplementariedad y cantidad de sitios variables. Con base en esta información se decidió probar en el laboratorio los cebadores de largo de producto 110, 114, 161 y 195, designados de esta forma en lo subsecuente. Con el fin de poder determinar el potencial toxigénico de las cepas detectables con los cebadores indicados arriba, se diseñaron 10 cebadores específicos para las secuencias de tcdB de las cepas de C. difficile del Clado C-I (Cuadro VI). De estos, se decidió sintetizar y ensayar el primer par, pues se apegaba mejor a los criterios de selección establecidos en la metodología. 46 Cuadro VI. Características predichas de los pares de cebadores identificados por PrimerBLAST para las secuencias del gen tcdB de las cepas de C. difficile del Clado C-I. Largo producto Cebador Hebra molde Largo Tm GC% Autocomplementariedad Autocomplementariedad 3’ 166 Forward + 21 59,99 47,62 4 2 Reverse - 25 57,43 36 4 2 84 Forward + 23 58,55 39,13 5 2 Reverse - 23 57,5 39,13 4 3 98 Forward + 24 59,1 37,5 5 2 Reverse - 25 60,52 40 5 1 196 Forward + 24 58,38 33,33 7 2 Reverse - 24 60,87 45,83 8 0 194 Forward + 24 58,19 33,33 7 1 Reverse - 22 57,12 45,45 8 0 96 Forward + 24 59,1 37,5 5 2 Reverse - 25 59,11 40 5 2 160 Forward + 25 59 36 6 2 Reverse - 22 57,08 40,91 5 0 101 Forward + 25 59,63 36 5 2 Reverse - 25 59,11 40 5 0 194 Forward + 25 58,76 32 7 1 Reverse - 24 58,75 41,67 6 0 86 Forward + 24 58,57 37,5 5 0 Reverse - 24 57,93 37,5 4 2 47 En la discriminación de las cepas del Clado C-I por PCR punto final, los pares de cebadores 114 mostraron una sensibilidad del 100% y una especificidad del 80% (𝑉𝑃 = 2; 𝐹𝑁 = 0; 𝑉𝑁 = 8; 𝐹𝑃 = 2; 𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 2 2+0 ; 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 8 8+2 ), mientras que los pares de cebadores 110 y 161 mostraron sensibilidad de 100% y especificidad del 90% (𝑉𝑃 = 2; 𝐹𝑁 = 0; 𝑉𝑁 = 9; 𝐹𝑃 = 1; 𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 2 2+0 ; 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 9 9+1 ) (Anexo VII). Al establecer como punto de corte Ct=35 en el ensayo de qPCR, tal y como sugieren otros autores (Chang, Hur, & Park, 2020; Jordan & Durso, 2005; Sacramento de Oliveira et al., 2018), los pares de cebadores 114 y 161 discriminaron la presencia de ADN de cepas de C. difficile del Clado C-I con una sensibilidad y especificidad del 100% (𝑉𝑃 = 4; 𝐹𝑁 = 0; 𝑉𝑁 = 5; 𝐹𝑃 = 0; 𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 4 4+0 ; 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 5 5+0 ) , mientras que el par 110 tuvo una sensibilidad del 100% y una especificidad del 60% (𝑉𝑃 = 4; 𝐹𝑁 = 0; 𝑉𝑁 = 3; 𝐹𝑃 = 2; 𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 4 4+0 ; 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 = 3 3+2 ). Ninguna de las cepas ensayadas generó amplificación utilizando el par de cebadores 195 (Cuadro VII). Cuadro VII. Valores de Ct y resultados obtenidos por qPCR utilizando ADN extraído a partir de cultivos de diversas bacterias y los cebadores diseñados para las secuencias firma del Clado C-I. Cepa Clado Concentración ADN en la reacción (ng/µl) Cebadores Ct Interpretación del resultado LIBA-5755 1 0,775 110 37,96 VN LIBA-6291 0,445 110 32,66 FP LIBA-5757 2 0,068 110 35,73 VN LIBA-5757 0,068 114 35,21 LIBA-5757 0,068 161 40 LIBA-7110 3 0,51 110 30 FP LIBA-6622 C-I 0,212 110 28,31 VP LIBA-6622 0,212 114 20,79 LIBA-6622 0,212 161 18,52 LIBA-6822 0,054 110 19,4 LIBA-6822 0,054 114 18,35 LIBA-6822 0,054 161 21,37 LIBA-7194 0,11 110 16,73 LIBA-7194 0,11 114 16,36 LIBA-7194 0,11 161 28,79 LIBA-7602 0,165 110 20,3 LIBA-7602 0,165 114 19,1 LIBA-7602 0,165 161 23,81 48 * La cepa LIBA-8327 (C. perfringens) no amplificó con los cebadores 110. Las cepas LIBA-5755 y LIBA-6291 (clado 1), LIBA-7710 (clado 3) y LIBA-8327 no amplificaron con los cebadores 114 y 161. Las cepas LIBA-5755 y LIBA-6291 (clado 1), y LIBA-5757 (clado 2) no amplificaron con los cebadores 195. Todos estos corresponden a resultados verdaderos negativos. Las cepas LIBA-6822 y LIBA-7602 (Clado C-I) no amplificaron con los cebadores 195 (FN). Se muestran los demás identificadores de las cepas, el clado o especie al que pertenecen, las concentraciones de ADN usadas en las reacciones de PCR, el cebador utilizado y el Ct obtenido. El control negativo corresponde a mezcla de reacción a la que no se le adicionó ADN, y no generó amplificación