Sem. 1 GEN: Genóma humano

Programa

SG1:

  • GENOMA HUMANO Tamaño y organización del genoma humano. Genoma nuclear ymitocondrial. Comparación del genoma humano con el genoma de otras especies. Tipos de secuencias de ADN: repetitivas, de secuencia única. ADN codificante y no codificante. Concepto de gen. Concepto de locus y alelo. Características de un gen humano promedio. Conceptos de genotipo y fenotipo. ¿Cómo se logró conocer y caracterizar las secuencias del genoma humano?
    Secuenciación de ADN. Método de Sanger y métodos de secuenciación de alto rendimiento (high‐throughput). Técnicas involucradas en la caracterización del transcriptoma: Aplicación de métodos de alto rendimiento para secuenciar ARN (RNA‐seq) Proyecto ENCODE. Proyecto POBLAR Argentina

 

Introducción

Todos los organismos vivos estamos compuestos por células. La información genética está contenida en el ADN (ácido desoxirribonucleico). Esta sustancia química es el componente principal de los cromosomas del núcleo de las células. Las células del cuerpo humano tienen 46 cromosomas, en realidad, 23 pares. De cada par, uno de los cromosomas proviene del padre y el otro de la madre, y se dice que los dos cromosomas de cada par son homólogos entre sí. La molécula de ADN está formada por la repetición de unidades químicas menores llamadas bases

adn1.png

Hay cuatro bases identificadas por las letras A, T, C y G, por adenina, timina, citosina y guanina, respectivamente. Dos hebras de ADN se aparean para formar la estructura en doble hélice descubierta por Watson y Crick en 1953. Las bases de cada hebra se enfrentan o aparean con las bases de la otra, siguiendo siempre la misma regla: frente a A sólo se ubica T y frente a C sólo se ubica G. Se dice que dos hebras que se aparean según estas reglas son complementarias. La complementariedad de bases permite que el ADN se duplique fielmente. Para esto primero se separan las dos hebras y cada una de ellas sirve de molde para fabricar, por medio de enzimas de la célula, otra complementaria y así tener dos dobles hélices idénticas a la original, es decir, con la misma secuencia, la misma información. Una vez duplicada, la información se transmite equitativamente de una célula madre a sus dos células hijas a través de la mitosis, o división celular. Otro tipo de división celular, llamada meiosis, ocurre en las células madres de las gametas (espermatozoides en el hombre y óvulos en la mujer). En la meiosis, se reduce a la mitad el número de cromosomas

En los humanos, al igual que en la mayoría de los mamíferos, la información genética contenida en los 23 cromosomas de una gameta (célula haploide) tiene aproximadamente 3.300 millones de bases de longitud

cariotipo_de_una_mujer

Al poseer 46 cromosomas, el resto de las células (llamadas diploides) tiene el doble. Cuando decimos que se ha “secuenciado” el genoma humano, lo que queremos decir es que se ha determinado experimentalmente cuál es el ordenamiento preciso de esos 3.300 millones de bases del núcleo de una gameta humana. Todas las células de un organismo pluricelular, como los humanos, tienen la misma información genética, porque todas ellas derivan, por mitosis, de una única célula, el cigoto, que se forma por la fusión del espermatozoide con el óvulo

Genoma y genes

Llamamos genoma al conjunto de todo el ADN de una célula de una especie y los genes que éste contiene. En sentido estricto, el genoma humano no sólo comprende al ADN del núcleo sino también al de las mitocondrias que, aunque sólo tiene 16.000 bases de longitud, es esencial para el funcionamiento celular. Los genes son segmentos de ADN capaces de ser transcriptos –es decir, copiados– a una molécula de ARN (ácido ribonucleico) con igual secuencia que el gen. Los genes no se encuentran yuxtapuestos a lo largo de los cromosomas, sino más bien esparcidos y separados a grandes distancias por secuencias de ADN intergénicas (intrones). Las regiones intergénicas constituyen el 70% del genoma, mientras que los genes representan sólo un 30%. Se estima que el genoma humano tiene unos 20.000 genes. Estos genes codifican distintos tipos de ARN, entre los que se encuentran los llamados ARNs mensajeros, que codifican a su vez proteínas. Los otros ARNs, los que no son mensajeros, reciben el nombre genérico de ARNs no codificantes: no son intermediarios entre el gen y la proteína sino que cumplen funciones en sí mismos. Entre éstos están los ARNs ribosomales, de transferencia, nucleares pequeños, los micro ARNs y las ribozimas. Por lo tanto, la definición según la cual un gen es el segmento de ADN que codifica una proteína, no es estrictamente correcta: muchos genes codifican proteínas, pero no todos. Cada uno de los genes que codifican proteínas tiene regiones que estarán representadas en el ARN mensajero maduro intercaladas por otras cuyas secuencias no estarán representadas allí. Las primeras regiones se llaman exones, en tanto que las segundas son los intrones. Mientras los intrones no son codificantes, la mayoría de los exones son las regiones del genoma que codifican proteínas. Estas regiones constituyen sólo el 1,5% del genoma

Cada cromosoma tiene muchos genes, y la posición que ocupa cada gen a lo largo del cromosoma se denomina locus (del latín, lugar). Cada gen tiene entonces su copia homóloga en el locus equivalente del otro cromosoma del par. Cada una de las dos copias del gen se llama alelo

Digamos, entonces, que una célula humana tiene dos alelos para cada uno de sus 20.000 genes distintos. No todos los genes se expresan (es decir, se transcriben y se traducen) al mismo tiempo y en el mismo lugar. En un tejido o tipo celular determinado se expresa un subconjunto del conjunto de todos los genes. Uno de los puntos clave de la regulación de la expresión de los genes, es el control de la transcripción. Este control no sólo se ocupa de “encender” o “apagar” genes (efecto del todo o nada), sino también de regular la cantidad de producto (ARN o proteína) de los genes “encendidos”

 

Comparación del genoma humano con el genoma de otras especies , proyecto ENCODE

Las técnicas de secuenciación genómica y los estudios de genómica comparativa están siendo un generador importantísimo de información sobre la biología de los seres vivos. Diferentes proyectos internacionales están tratando de desentrañar el ADN humano y de otras especies para poder conocer su base molecular y con ella dar respuesta a muchas preguntas para las que no se tiene ninguna, como ciertas enfermedades. Esta semana (27/08/2014) la revista Nature publica cinco estudios que serán un referente para miles de científicos de todo el mundo, aunque su efecto en la sociedad tardará todavía años

Se trata de estudios elaborados a partir de los dos proyectos científicos: el ENCODE -generado en 2003 para establecer la enciclopedia de los elementos del ADN humano- y el modENCODE, -creado en 2007 para generar un catálogo de los elementos funcionales de la mosca de la fruta (D. melanogaster) y del genoma del gusano C. elegans. Ambos han sido financiados por el Instituto Nacional de Investigación del Genoma Humano, que forma parte de los Institutos Nacionales de Salud de Estados Unidos. Estos dos proyectos han integrado ahora los datos de las tres especies, muy estudiadas en investigación y muy distantes en la evolución

Su estudio comparativo, en el que se han utilizado más de 67.000 millones de secuencias genéticas, ha descubierto un patrón genético de expresión de las tres especies, particularmente de los genes involucrados en el desarrollo. «Lo que hemos encontrado son un conjunto de genes que parecen funcionar al mismo tiempo en cada animal en su desarrollo embrionario y de manera común. Esto viene a confirmar una hipótesis que había sobre el tema que establecía que hay un momento en el desarrollo embrionario donde la expresión de los genes es igual en todos los animales. Serían como los genes que son la base de la vida», explica a EL MUNDO Sarah Djebali, co-autora de este trabajo e investigadora en el Centro de Regulación Genómica en Barcelona

De esta manera, moscas, gusanos y hombres comparten programas de apagado y encendido de genes de una manera coordinada, es decir, utilizan un patrón para expresar ciertos genes necesarios para el desarrollo y que funcionan en paralelo en cada una de ellas

Diario EL MUNDO

Gen humano promedio

genes
A, estructura simple concebida como secuencia de ADN constituida por exones e intrones; B, estructura que incluye regiones reguladoras y promotoras

¿Qué es un gen y cuál es su composición?

Un gen es la unidad física y funcional básica de la herencia. Los genes, que se componen de ADN, actúan como instrucciones para hacer moléculas llamadas proteínas. En los seres humanos, los genes varían en tamaño desde unos pocos cientos de bases de ADN a más de 2 millones de bases. Cada persona tiene dos copias de cada gen, una heredada de cada progenitor

Molecularmente el gen es una secuencia de nucleótidos contiguos en la molécula de ADN (o de ARN en el caso de algunos virus) que contiene la información necesaria para la síntesis de una macromolécula con función celular específica, es decir, vinculados al desarrollo o funcionamiento de una función fisiológica

  • Exones

Los exones son la región de un gen que contiene ADN codificante para una proteína

  • Intrones

Los intrones son la sección de un gen que no contiene ninguna instrucción para la síntesis proteica

  • Región reguladora

En determinados lugares de la molécula de ADN hay secuencias reguladoras, los promotores, que son cruciales para el inicio de la transcripción por medio de la enzima ARN polimerasa II (esta enzima cataliza la síntesis del ARN) También hay otras regiones del ADN que determinan el grado en que se expresa un gen. Esas regiones se denominan “amplificadoras” (también llamadas enhancers) o “silenciadoras” según sea su efecto sobre la transcripción. Aunque es común que se encuentren cercanos al gen, también pueden ubicarse en sitios muy distantes al gen, a miles de pares de bases de este. Por lo tanto, en cada gen, la transcripción comienza en su promotor. Pero para que esto ocurra, se requiere de la interacción de muchas proteínas que se unen de manera específica, posibilitando la acción de la ARN polimerasa II

 

  • Región 5′ UTR

La región 5’ no traducida (5’UTR; en ocasiones llamada la líder) es una secuencia de nucleótidos del extremo 5’ del mRNA, que no codifica la secuencia de aminoácidos de una proteína.

  • Región 3′ UTR

La última región del ARNm es la región 3’ no traducida, una secuencia de nucleótidos en el extremo 3’ del ARNm que no se traduce a proteínas. La región 3’ no traducida afecta la estabilidad de ARNm y la traducción de la secuencia de ARNm que codifica la proteína

¿Cuántos genes tiene el ser humano?

El Proyecto Genoma Humano ha estimado que los seres humanos tienen entre 20.000 y 25.000 genes. Esto es un poco más que lo que tiene un chimpancé o un ratón, pero nada espectacular. Los científicos esperaban encontrar muchos más genes ya que en teoría somos más complejos que el resto de animales. Aún más sorprendente, los científicos descubrieron que una gran parte de nuestro genoma está compuesto de ADN que no codifica genes

 

Genotipo y fenotipo

Al conjunto de la información genética particular de un individuo lo llamamos
genotipo. El genotipo es esencialmente la secuencia de ADN. Todo aquello que “vemos” y que no es secuencia de ADN es el fenotipo (del griego, fainein, visible). El fenotipo es tanto lo macroscópico (forma, anatomía, fisiología, patología y comportamiento), como lo más pequeño (histología,bioquímica y estructura molecular). El fenotipo siempre es el resultado de la interacción de un determinado genotipo con un determinado ambiente, lo cual se expresa con la fórmula:

FENOTIPO = GENOTIPO + AMBIENTE

Para algunos fenotipos, la influencia del componente genético es mayoritaria o determinante y, en consecuencia, la ambiental es virtualmente nula. Un buen ejemplo son las enfermedades hereditarias como la fibrosis quística, la corea de Huntington y la distrofia muscular: quien haya heredado el gen de la distrofina mutado padecerá la enfermedad, no importa en qué ambiente se encuentre. En otros fenotipos, la influencia del componente ambiental es mayoritaria y la del genético despreciable. Las enfermedades infecciosas producidas por contagio son un ejemplo

Para la mayoría de los rasgos fenotípicos hay tanto un componente genético como uno ambiental

 

¿Cómo se logró conocer y caracterizar las secuencias del genoma humano?

El proyecto genoma Humano El Proyecto Genoma Humano internacional, financiado por los gobiernos y por instituciones benéficas, se puso en marcha en  1990 bajo la dirección de James Watson. Su objetivo era la lectura de los 3.000 millones de pares de bases en los que están escritas las instrucciones genéticas de la humanidad; los investigadores señalaron  que sería necesaria una inversión de 15 años y de 3.000 millones de dólares, es decir, un dolar por cada letra de ADN

El proyecto era de tal alcance que lo último que se esperaba es que hubiera competencia. Sin embargo, en 1998, cuando el consorcio público ya había descifrado el 3% del código, apareció un competidor en el sector privado. John Craig Venter, el especialista en genética que había identificado más genes que nadie, estableció un acuerdo de 300 millones de dólares con la principal compañía fabricante de máquinas de secuenciación del ADN con el objetivo de conseguir su propia versión del genoma

Sobre la base de una nueva técnica que denominó «secuenciación genómica completa en disparo» (whole-genome shotgun sequencing), Venter y su compañía (Celera Genomics) se comprometieron a finalizar el proyecto en sólo dos o tres años, mucho antes de la fecha propuesta por el consorcio público

El genoma humano es demasiado grande como para ser leído de una sola pasada. Por ello, era necesario fragmentarlo en segmentos que las máquinas de secuenciación pudieran manejar, y los equipos rivales adoptaron estrategias distintas para resolver este problema. En el proyecto público, el ADN se segmentó inicialmente en fragmentos grandes de 150.000 pares de bases, con clonación de miles de copias en las bacterias y, finalmente, con determinación de las posiciones de estos clones en sus cromosomas. Después, cada clon se segmentaba en fragmentos aleatorios todavía más pequeños que después se secuenciaban y reunían mediante la combinación de los extremos superpuestos de los fragmentos. Finalmente, los clones secuenciados se cartografiaban en sus posiciones cromosómicas para definir el código completo

La técnica era exhaustiva, pero extremadamente lenta. Celera Genomics consideró que lo podía hacer mejor saltando la fase de cartografía y ensamblando todo el genoma de una sola vez a partir de fragmentos pequeños. Este método de «disparo» ya se había utilizado para secuenciar bacterias y virus, pero muchos expertos dudaban de que pudiera funcionar en el genoma humano, que es 500 o más veces mayor. Sin embargo, Venter demostró su utilidad mediante la secuenciación del genoma de un viejo amigo de los especialistas en genética, la mosca de la fruta (Drosophila melanogaster) y, después, se puso a trabajar en el código humano

Si la estrategia profesional hubiera sido la único que separaba a los dos grupos, las relaciones podrían haber sido cordiales; sin embargo, también diferían en su visión del mundo. El Proyecto Genoma Humano contemplaba el código genético como propiedad de la humanidad, de modo que introdujo todos sus resultados en una base de datos pública,GenBank, tan pronto como los obtuvo. Celera Genomics, en cambio, era una compañía con el objetivo de lucrarse

Aunque Venter había forzado a sus patrocinadores financieros a aceptar que publicaría los resultados libremente, también tenía un negocio en marcha. Celera Genomics esperaba comercializar el acceso a una potente base de datos genética, además del software necesario para que otras compañías pudieran localizar nuevos genes y desarrollar medicamentos. Los investigadores universitarios podrían acceder gratuitamente a la base  de datos, pero tendrían que pagar derechos de patente de cualquier producto comercial que pudieran desarrollar a partir de ella.

Esta actitud resultaba odiosa para científicos como John Sulston, quien dirigió la rama británica del proyecto público. Consideraban a Venter un pirata de la genética que intentaba adueñarse, junto con sus inversores, de algo que pertenecía a toda la humanidad. Aunque Venter siempre había señalado que el genoma es algo en sí mismo no patentable, existía el temor de que Celera Genomics estuviera persiguiendo su privatización. El Proyecto Genoma Humano aceleró el ritmo de sus esfuerzos en el intento de impedir cualquier tipo de conflicto sobre los datos finales, consiguiendo que fueran del dominio público antes de que su rival pudiera reclamar cualquier derecho

Venter terminó primero la tarea, pero el proyecto público lo hizo tan poco tiempo después que se acordó un empate. Un elemento clave para esta inestable tregua fueron las dos intervenciones del entonces presidente de Estados Unidos, Bill Clinton. En abril de 2000, anunció que consideraba que el genoma debía ser de propiedad pública, y esta declaración hizo que el valor de las acciones de las compañías de biotecnología (incluyendo las de Celera Genomics) cayera en picado. Desconcertado con esta consecuencia no pretendida, Clinton intentó después enmendarla aproximando a las dos partes en conflicto. Negoció un anuncio conjunto en la Casa Blanca relativo al fin del proyecto, y él mismo se mantuvo en un terreno neutral desde el cual reconoció formalmente la contribución de Venter. En el evento estuvo acompañado de Francis Collins, director del proyecto público, que realizaba el NIH

Anuncio del genoma humano
El ex-presidente Bill Clinton, acompañado por J. Craig Venter, presidente de Celera Genomics y Francis Collins, director del NIH, durante el anuncio del desciframiento del genoma humano, el 26 de junio de 2001

Celera Genomics mantuvo su palabra y sus declaraciones, y su base de datos de valor añadido demostró tener tanta utilidad que la mayor parte de las instituciones científicas públicas y las compañías farmacéuticas se suscribieron para su uso. Sin embargo, el «cambio de velocidad» impreso al proyecto público evitó cualquier posibilidad de que el genoma pudiera ser patentado. En 2004, después de una serie de problemas con sus inversores, Venter dimitió como presidente de Celera Genomics e incluso su genoma fue añadido al GeneBank sin ningún tipo de restricción de acceso. El genoma ya se había descifrado y la encarnizada rivalidad había resultado muy provechosa para la humanidad. El estímulo de la competición hizo que el genoma pudiera se secuenciado con una rapidez impensable sólo 10 años antes

 

Bibliografía utilizada:

https://cefegen.es/blog/que-es-un-gen-cuantos-genes-tiene-el-ser-humano

https://www.elmundo.es/salud/2014/08/27/53fe05a0ca4741d03f8b4575.html

https://mundogenetica.jimdo.com/tem%C3%A1ticas/1-bases-moleculares-de-la-herencia/1-2-estructura-y-partes-de-un-gen/

dels_-_genoma_humano_-_2017-04-26

50 Cosas que hay que saber sobre genética. 2010. Mark Henderson. Editorial Ariel