Crónica Taller Cegen-PRB2 (I): Aplicaciones del genotipado en la agrigenómica.

Como viene siendo habitual en este espacio, tras la asistencia a un evento científico- divulgativo cuyo contenido puede ser de interés para el ámbito de difusión de esta bitácora y sus lectores, suelo publicar una crónica que recoge los principales (y no tan principales) conceptos y/o aspectos más interesantes, novedosos o impactantes que los ponentes tienen a bien a compartir en tales jornadas. En este caso, tocaba ya poner al día todo lo divulgado durante las jornadas que el Centro Nacional de Genotipado llevó a cabo durante el mes de diciembre en la Universidad de Santiago de Compostela, cuyo programa podéis consultar aquí. Así que… si queréis saber que nos contaron los variados ponentes, ya sabéis… A seguir leyendo!

Agrigenómica

Las jornadas “Aplicaciones del genotipado en la agrigenómica” empezaron el día 12 de diciembre de 2016 con la presentación inaugural por parte de Ángel Carracedo, coordinador del nodo norte del CEGEN. Tras un breve repaso a los derroteros llevados por parte de gestores y coordinadores para mantener en pie una entidad tan necesaria para investigadores, sanidad e industria como actualmente es el centro nacional de genotipado, Ángel nos explicó el motivo por el cual, siendo el CEGEN una entidad adscrita al Instituto Carlos III y al Ministerio de Sanidad del gobierno de España, ofrecían este tipo de jornadas destinadas a un espectro de conocimiento más agroalimentario que sanitario. Todo ello radica en su constitución como miembro de las PRB2, plataformas de recursos biomoleculares y bioinformáticos, quienes entre sus muchas funciones está la apoyar las líneas de investigación destinadas a la mejora vegetal y animal, cuyas repercusiones más directas pueden afectar a la salud pública.

El primer ponente de la mañana fue Paulino Martínez, quien además de presentarnos el grupo que coordina, el Acuigen, nos relató todos los pormenores de cómo consiguieron descifrar el genoma completo del rodaballo (Scophthalmus maximus) uno de los peces planos de mayor producción comercial del mundo junto con el lenguado común, senegalés y chino así como la platija japonesa y el fletán atlántico. Al parecer los peces planos tienen unas características propias (calidad del tejido comestible alta, bajo coste de producción, posibilidad de usar tanques terranales, etc) que lo hacen óptimo para su cultivo en acuicultura, hecho que ha favorecido junto con el de otras especies el crecimiento sostenido de la acuicultura frente a la pesquería extractiva desde 1990. Paulino también nos recordó que el grupo de los pleuronectiformes es un grupo icono ris-_4-1_43del darwinismo, por la adaptación gradual que supuso la migración de la simetría bilateral a una simetría plana, que explica a su vez, por que este tipo de peces planos tienen los ojos juntos en la parte superior de su cráneo. Con ello también se explica su complejidad filogenética, pues no se sabe con certeza si son mono o poliféticos a causa de la respuesta adaptativa tan rápida que tuvieron, se perdió parte de la señal filogenética. A través del estudio de librerías de DNA de tres familias de rodaballo, utilizando la secuenciación shot-gun (sequenciación por pair-ends (secuenciación de un fragmento desde ambos extremos) para obtener los contig  y mate pair (secuenciación de fragmentos intermedios de un fragmento más largo) para obtener los scafolds), obtuvieron que el genoma del rodaballo alcanza las 560 mega bases nucleotídicas, 5 veces menor que el humano. A través de programas estadísticos predictivos, hallaron que el número de genes del rodaballo asciende a 22.720 genes, de los cuales el 86% codifican por proteínas y un 65% están relacionados con aspectos funcionales. A partir de este mapa físico, pudieron mediante mapeo comparado con otras especies modelos como el pez cebra o el pez globo, realizar el mapeo genético del rodaballo, estudiando con ello también la historia evolutiva y la caracterización de los genes candidatos implicados en procesos de interés (crecimiento, anomalías morfológicas, inmunidad, toxicidad, adaptación a temperaturas más bajas, etc) tanto comercial como evolutivo.

Paulino dio paso a una otra de sus compañeras de grupo, Carmen Bouza, nos habló de la selección de caracteres de interés en rodaballo a través de la secuenciación del RNA (transcriptoma) y de identificación de SNP mediante la plataforma Agena Biosciences (antes Sequenom). El crecimiento del rodaballo, es una diana de selección en la producción animal y acuicultura, por tratarse de un rasgo complejo con presencia de poligenia (está regulado por más de un gen) y una fuerte asociación con el ambiente (supone una variación adaptativa en poblaciones salvajes), que además, está implicado en numerosos procesos fisiológicos. Sin embargo, la selección y predicción fenotípica es compleja por el conocimiento incompleto que existe de sus genes parálogos (cuando un gen de un organismo se duplica para ocupar dos posiciones diferentes en el mismo genoma). A través del conocimiento del mapa genético y del genoma del rodaballo (explicado en la charla de Paulino), de algunos QTLs significativos y sugerentes (locus cuya variante alélica se corresponde con la variación de carácteres cuantiativos) y de programas de selección tradicionales (manejar hasta la 5ª generación), se pudieron estudiar los genes candidatos que expresan por el peso, la longitud y otros factores de crecimiento del rodaballo y además, estudiar su variación funcional que está en relación una mayor diversidad interpoblacional y una selección poblacional más eficiente. No obstante, se observaba que cuanto más comprensión funcional se obtiene, más cobertura genómica se pierde. Se utilizó la plataforma Agena para rastrear SNP en genes candidatos, pues estos son polimorfismos observados en secuencias génicas de  interés para estudios de asociación familiar y poblacional (rastro genómico), por su abundancia en el genoma, su baja tasa de mutación y su herencia codominante. Con esta información y la obtenida en el transcriptoma, se obtuvo que en el rodaballo de los 175 genes candidatos, 64 genes están asociados a marcadores genéticos de crecimiento y de ellos, 45 se consideran relevantes y/o priorizados. Para ver que SNP de estos genes eran viables, se realizó una validación técnica-poblacional y posteriormente, un análisis familiar y poblacional. Además, con el análisis familiar y poblacional lo que se busca es obtener el marcador genético que por medio del SNP, diferencie stocks y por tanto, sea un rasgo diferenciador de cara a una posible mejora en la selección de los cultivos y/o familias.

El tercer ponente, fue Diego Robledo, quien forma parte del mismo grupo pero que en estos momentos está haciendo una estancia en el Instituto Roslin de Edinburgo. Pasamos del rodaballo a otro pez teleósteo, el salmón, de alto rendimiento económico. En este caso, Diego nos relató como estaban tratando de seleccionar variantes resistentes a enfermedades que merman estas poblaciones como la sea lice, enfermedad amebiana de las branquias (AGD) y necrosis pancreática infecciosa (IPN). Partiendo de un diseño experimental de cruces entre hermanos completos a los que se infectó con el sea slicemicroorganismo patógeno, se seleccionaron los candidatos y se estudió la variabilidad fenótipica (% de la misma explicado por varianza genética aditiva) entre familias, en lo referente a la supervivencia, número de parásitos infestadores, severidad de los síntomas, tiempo de vida tras la infección y reduccion del crecimiento.  De ahí se obtuvo el porcentaje de heredabilidad a la resistencia a las enfermedades que era mayor en el caso de la necrosis pancreática infecciosa (IPN) que en el de la sea slice. Con ello se estudió el genotipado de cada individuo respecto a estos caracteres y luego se imputan a alta densidad los padres y a baja los hijos (estimar la frecuencia alélica de un determinado SNP), para reducir los costes en la obtención de resultados puesto que, en caso contrario, se requería secuenciar un número alto de individuos. A partir de esto se calcularon los valores de desequilibrio de ligamiento y con ellos se realizaron estudios de GWAS (genomic wide association studies) para determinar como de asociados están los caracteres de interés. Así se llegó a la conclusión de que, el sea slice era más complejo describir los SNP causales por ser una enferemedad cuya resistencia  es de tipo poligénico y de baja heredabilidad, mientras que en el caso de la patología INV se observó una asociación fuerte con un marcador genético en el cromosoma 26, lo que que facilitaría la selección genómica entre poblaciones.

En sus segunda charla, Diego nos relató el uso de la secuenciación de nueva generación en acuicultura, cuyo origen se remonta a 2012, utilizando para ello la técnica del RNA-seq o estudio genético del transcriptoma. Utilizando la selección de colas de poli-A presentes únicamente en el RNAm y eliminando el RNA ribosomal (ribo-depleted), se obtiene la secuencia de RNA , el long-non coding RNA, que no participa en la síntesis de f1-largeproteínas, se pueden llevar a cabo ensamblados de novo (en especies sin genoma de referencia), estudios de expresión diferencial y por supuesto, integración con GWAS. Con las lecturas obtenidas en el transcriptoma se obtiene un transcriptoma de referencia que constituye una fuente de recursos genómicos para especies no modelo sin genoma de referencia, al ser más barato y sencillo que ensamblar un genoma. Además, este transcriptoma de referencia tiene múltiples aplicaciones: expresión diferencial, obtención de SNPs e indels así como, diseño de primers para microarrays. Diego nos contó como el equipo de Acuigen está a utilizar el RNA-seq para identificar los individuos de almeja japonesa (Ruditapes philippinarum) resistentes y/o tolerantes al protozoo patógeno Perkinsus olseni. A través del uso de microarrays que permiten realinear los transcriptomas, se buscan los SNP candidatos y se calculan sus frecuencias alélicas. Diferencias entre estas frecuencias alélicas y genes diferencialmente expresados entre líneas tolerantes y susceptibles, se consigue llegar a los genes candidatos a expresar resistencia a este parásito. En el caso del rodaballo, la infección por mixozoos Enteromyxum scophthalmi implica daños sobre el intestino y los tejidos inmunes de este pez, se ha estudio mediante diferencias en la expresión génica. Cuanta mayor expresión del gen, más lecturas del long-non coding RNA se encuentran alineados a la secuencia del gen en cuestión; el uso de arrays permite una mayor especificidad (se sabe que se está cantificando), se amplia el rango (sin ruido de fondo) y con ello, se pueden explicar los procesos biólogicos implicados. Agrupando las diferentes expresiones génicas en clúster y con los valores Go-terms, se puede explicar las funciones de los genes a los cuales se asocian las expresiones y con ello, se permiten buscar estrategias de prevención (uso de fármacos, vacunas o tratamientos). Con la integración mediada por GWAS, buscaron encontrar eQTLs que afectaban a la expresión diferencial de un gen candidato en forma cis (afectando a su factor de transcripción) o en la forma trans (afectando a la incorporación de una aminoácido). Con todo ello y con la técnica de CRISPR, en líneas celulares, se pretende observar por silenciamiento de regiones génicas intermedias, si existe desequilibrio de ligamiento entre SNP asociados a genes de mayor expresión obtenidos en la RNA-seq con los SNP expresados en los eQTLs observados.

El siguiente ponente fue Manuel Vera Rodriguez, quien nos explicó como se usaba el genotipado por síntesis y la secuenciación asociada a dianas a restricción para trazar los escapes de especies de acuicultura a pesquerías y evaluar su impacto. Se trata de estudiar zonas comunes del genoma para observar la variabilidad, mediante la generación de los mismos fragmentos en todos los individuos por medio de la RAD-seq (las enzimas de restricción tienen regiones diana altamente conservadas que cortan en las mismas regiones del DNA entre los diferentes individuos). Illumina tiene dos técnicas RAD- seq: la RAD-seq2b-RAD seq (la enzima de restricción corta en dos sitios a la vez) y la dd-RAD seq (dos enzimas de restricción cortan en zonas de corte más frecuentes (region diana más pequeña) y zonas de corte más raras). Como el objetivo era reducir la región diana para secuenciar más individuos, en su caso utilizaron la dd-RAD seq y luego secuenciaron por homología; las secuencias RADtag unidas la enzima de restricción debían estar presentar en cada uno de los individuos, variando su posición según el individuo sea heterocigoto y/o varíe entre poblaciones. Aplicando un algoritmo desarrollado por J. Catchen et. al. basado en el apilamiento y análisis de stacks, se identifican los SNPs en las poblaciones (SNPs más polimórficos se encuentran como marcadores únicos por cada RAD-tag). En el caso presentado, sólo entre 5 a 10 SNPs se podían emplear para identificar y diferenciar individuos puros o salvajes de los procedentes de acuicultura o de granja, una vez estimada la diferenciación y estructura genética poblacional mediante el cálculo de la variabilidad genética intra e interpoblacional por medio de índice de fijación de Wright (FST).

El sexto ponente de la primera sesión de las jornadas fue Juan Andrés Rubiolo quien nos presentó el análisis metagenómico y sus aplicaciones. Partiendo de la definición de microbiota (comunidad ecológica microbiana mutualista y parasítica de un determinado medio ambiente) de la cuál se han descrito 1,5 millones de especies, de los más de 30 millones que se cree que forman parte, Juan nos explica que el estudio de la metagenómica (genomas del microbiota) y el uso de la secuenciación de marcadores moleculares, mejora la identificación de invidividuos con respecto a la que realiza la microbiología tradicional. Esto es muy importante dada sus múltiples aplicaciones biomédicas, medioambientales, agroalimentarias y de salud pública. El flujo de trabajo del análisis metagenómico comienza con la toma de muestra medioambiental, de la que se extrae el DNA y el RNA. Del DNA extraído se pueden secuenciar marcadores simples mediante secuenciación Sanger (requiere una clonación previa y una posterior bioprospección) o mediante secuenciación de nueva generación/NGS (requiere eliminar las quimeras generadas en los procesos de preparación del template así como no se garantiza la asignación inequívoca de secuencias), permitiendo esta última la secuenciación de genes marcadores de filogenia (se conoce así la diversidad taxonómica) y la obtención del metagenoma (aporta información sobre el potencial metabólico). Del RNA, se puede extraer información sobre las funciones de la comunidad microbiana y/o de sus miembros más activos. A partir de la secuenciación del RNA 16S arn-ribosomalde procariotas, al tratarse de secuencias altamente conservadas entre individuos, se puede usar para identificar géneros y especies microbianas. Este RNA consta de varias regiones hipervariables (en número total igual a 9) de las cuales algunas de ellas (en concreto las V4, V5 y V6) se pueden utilizar para realizar estudios filogéneticos; sin embargo, debido a la elevadísima variabilidad de individuos de la muestra ambiental es muy díficil determinar el número lecturas necesarias para, usando un marcador, identificar una especie microbiana. Hoy en día se parte de la secuenciación por homología entre las secuencias de las bases de datos (ej: Silva, Pyrosequencing, GreenGenes) y las OTUs (unidad operacional taxonómica, basada en la divergencia de secuencia) obtenida de la secuenciación del RNA16S; si la homología llega al 80% se llega a identificar familias, al 90% especies y al 97%, géneros, en el caso de cepa será necesario partir de un mayor número de marcadores secuenciados. Utilizando el índice de diversidad de Simpson, de Shannon y el índice Chao 1, se puede determinar la diversidad de individuos de la muestra. Juan nos explicó como, utilizando estos parámetros, pudieron estudiar la capacidad invasora de Enterobacterias, bacterias del género Salmonella y del género Vibrio sobre mejillones de ría, así como, su potencial metabólico. Mediante la inferencia del metagenoma funcional – fenotípico y analizando el perfil taxonómico de las muestras depuradas y no depuradas, se observó que en los mejillones no depurados se producía una mayor degradación de xenobióticos, debido a la influencia de una determinada especie en la muestra que permitía deducir el tipo de vertido producido. De igual manera, partiendo de una intoxicación de mejillones con tetradotoxina (TTX) se pudo inferir por secuenciación por homología de las OTUs encontradas, que la especie predominante causante de esa toxiinfección en los mejillones eran las bacterias del género Vibrio. El metagenoma obtenido por secuenciación shot-gun y posterior ensamblado, proceso muy caro y que requiere aún de un gran desarrollo, permite relacionar la filogenia con el potencial metabólico y codificante de la muestra, presentando una gran aplicación a nivel biotecnológico y/o de salud pública.

Antes de pasar a la segunda parte de la crónica, os dejo con los apuntes realizados por María Torres e Inés Quintela, responsables de las plataformas Agena Bioscience y Affymetrix, respectivamente. En el primer caso, Agena Bioscience, se trata de una plataforma de genotipado de media – baja capacidad, esto es, permite analizar entre 1 y 36 SNPs en cada reacción en formato multiplex (hasta 394 reacciones de PCR por placa), detectando variantes raras a baja frecuencia. Los SNPs son seleccionados por el Agena Bioscienceusuario, y se generan ensayos con un software de diseño propio. Partiendo sólo de 2 microlitros de ADN de baja concentración (10 nanogramos/microlitro) se genera una PCR múltiplex y una extensión de una única base (el primer diseñado previamente termina en la base nucleotídica anterior al SNP que se quiere sondear, por la adicción de un dideoxinucleótido mediante una termosequenasa), que será detectada por medio de la medicción de las unidades de masa atómica (u.m.a.) de las diferentes bases nucleotídicas, en un espectrometro de masas o sistema Maldi-Tof (Matrix-assisted laser desorption/ionization _  Time-of-flight) que mide el tiempo de vuelo (proporcional a la masa) del nucleótido ionizado y volatilizado en el espectrómetro. El cambio de valor observado (por adicción de ese valor de uma al del nucleótido final del primer) indicará, por complementariedad y según el valor, el tipo de nucleótido que conforma ese SNP. Se pueden detectar además de mutaciones puntuales bialélicas,  variaciones trialélicas, niveles de metilación (el uso de bisulfato hace que las citosinas metiladas se transformen en timinas, siendo detectadas por una variación en el tamaño de la molécula) e indels de hasta 40 bp en prácticamente cualquier genoma humano, animal y vegetal. En el caso de Affymetrix, se trata de una plataforma de media – alta capacidad, que es capaz de Affymetrixanalizar entre 650.000 SNP en placas de 96 muestras a 50.000 SNPs en placas de 384 muestras, tanto con paneles de SNPs diseñados para diferentes especies animales y vegetales como, con paneles de SNPs diseñados a la carta. Affymetrix también tiene una tecnología, la GeneChip que permite analizar hasta 50.000 SNPs de una única muestra en cada array. Se requiere de un ADN de doble cadena, íntegro, puro, libre de inhibidores o sustancias quelantes y a una concentración igual a 450 nanogramos/microlitro. Para más información, consultar aquí.

Y hasta aquí la primera parte de la crónica. Os emplazo a saber que nos contaron diferentes investigadores sobre los planes de investigación sobre mejora genética de las principales especies animales y vegetales de mayor producción en España y sus diferentes comunidades.

¡Nos “leemos” en la próxima entrada!                                                                                     TatianaDC

Link a la segunda parte de la crónica: https://unabiologaenlacocina.wordpress.com/2017/01/30/cronica-taller-cegen-prb2-ii-aplicaciones-del-genotipado-en-la-agrigenomica/

Anuncios

Responder

Por favor, inicia sesión con uno de estos métodos para publicar tu comentario:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s