Traducción de seis cuadros
Las regiones de ADN que codifican proteínas se transcriben primero en ARN mensajero y luego se traducen en proteínas. Examinando sólo la secuencia del ADN podemos determinar la secuencia de aminoácidos que aparecerá en la proteína final. En la traducción, los codones de tres nucleótidos determinan qué aminoácido se añadirá a continuación en la cadena proteica en crecimiento. Por lo tanto, es importante decidir qué nucleótido va a iniciar la traducción y cuándo se va a detener, lo que se denomina marco de lectura abierto.
Una vez que se ha secuenciado un gen, es importante determinar el marco de lectura abierto (ORF) correcto. Cada región de ADN tiene seis marcos de lectura posibles, tres en cada dirección. El marco de lectura que se utiliza determina qué aminoácidos serán codificados por un gen. Normalmente sólo se utiliza un marco de lectura para traducir un gen (en eucariotas), y éste suele ser el marco de lectura abierto más largo. Una vez que se conoce el marco de lectura abierto, la secuencia de ADN puede traducirse en su correspondiente secuencia de aminoácidos. Un marco de lectura abierto comienza con un atg (Met) en la mayoría de las especies y termina con un codón de parada (taa, tag o tga).
Solucionador de códigos de ADN
Enseguida los investigadores supieron que el código genético era más complejo que un nucleótido por aminoácido. Al fin y al cabo, si este fuera el caso, el ADN de una persona sólo podría codificar cuatro aminoácidos diferentes. De hecho, ni siquiera dos nucleótidos por aminoácido (es decir, un código de doblete) podría dar cuenta de 20 aminoácidos, porque un código así sólo proporciona 16 permutaciones (cuatro bases en cada una de las dos posiciones = 4 × 4 = 16 aminoácidos).
Por ello, los primeros investigadores determinaron rápidamente que la combinación más pequeña de As, Cs, Gs y Us que podía codificar los 20 aminoácidos en el ARN sería un código de tripletes (tres bases). Una combinación de tripletes, o codón, permitiría 64 combinaciones posibles (cuatro bases en cada una de las tres posiciones = 4 × 4 × 4 = 64). Sin embargo, con sólo 20 aminoácidos, un código de tripletes también sugeriría redundancia, es decir, más de un codón podría corresponder al mismo aminoácido, o incluso podría haber codones «de reserva» o no utilizados. Si estos codones «sobrantes» estaban presentes, ¿cuál era su propósito? ¿Servían para «romper» el código, como las comas en una frase? Además, ¿cómo podía «leer» un código de tres nucleótidos la maquinaria de formación de proteínas del ribosoma? ¿Era un código superpuesto o no superpuesto (Figura 1)? ¿Era un código continuo o había «comas» (nucleótidos de reserva) entre los codones que servían de señales para el siguiente aminoácido (Tabla 1)? Estas preguntas se respondieron mediante varios elegantes experimentos.
Convertidor de ADN a ARN
En biología molecular, un marco de lectura es una forma de dividir la secuencia de nucleótidos de una molécula de ácido nucleico (ADN o ARN) en un conjunto de tripletes consecutivos y no superpuestos. Cuando estos tripletes equivalen a aminoácidos o señales de parada durante la traducción, se denominan codones.
Una sola hebra de una molécula de ácido nucleico tiene un extremo fosforilo, llamado extremo 5′, y un extremo hidroxilo o 3′. Estos definen la dirección 5′→3′. Hay tres marcos de lectura que pueden leerse en esta dirección 5′→3′, cada uno de los cuales comienza a partir de un nucleótido diferente en un triplete. En un ácido nucleico de doble hebra, pueden leerse otros tres marcos de lectura desde la otra hebra complementaria en la dirección 5′→3′ a lo largo de esta hebra. Como las dos hebras de una molécula de ácido nucleico de doble cadena son antiparalelas, la dirección 5′→3′ en la segunda cadena corresponde a la dirección 3′→5′ a lo largo de la primera cadena[1][2].
En general, como máximo, un marco de lectura en una sección dada de un ácido nucleico, es biológicamente relevante (marco de lectura abierto). Algunos transcritos virales pueden traducirse utilizando múltiples marcos de lectura superpuestos. Hay un ejemplo conocido de marcos de lectura superpuestos en el ADN mitocondrial de los mamíferos: las porciones de codificación de los genes para 2 subunidades de la ATPasa se superponen.
Marco de lectura abierto
Junto con las proteínas, los lípidos y los hidratos de carbono complejos (polisacáridos), los ácidos nucleicos son uno de los cuatro tipos principales de macromoléculas esenciales para todas las formas de vida conocidas. Los ácidos nucleicos constan de dos macromoléculas principales, el ácido desoxirribonucleico (ADN) y el ácido ribonucleico (ARN), que llevan las instrucciones genéticas para el desarrollo, el funcionamiento, el crecimiento y la reproducción de todos los organismos y virus conocidos. La macromolécula de ADN (figura 4.1) está compuesta por dos cadenas de polinucleótidos que se enrollan una alrededor de la otra para formar una doble hélice. La macromolécula de ARN suele existir como una única cadena de polinucleótidos que es mucho más corta que la molécula de ADN comparada.
La estructura central de un monómero de ácido nucleico es el nucleósido, que consiste en un residuo de azúcar + una base nitrogenada que se une al residuo de azúcar en la posición 1′ (Figura 4.2). El azúcar utilizado para los monómeros de ARN es la ribosa, mientras que los monómeros de ADN utilizan la desoxirribosa que ha perdido el grupo funcional hidroxilo en la posición 2′ de la ribosa. Para la molécula de ADN, hay cuatro bases nitrogenadas que se incorporan a la estructura estándar del ADN. Entre ellas se encuentran las purinas: Adenina (A) y Guanina (G), y las Pirimidinas: Citosina (C) y Timina (T). El ARN utiliza las mismas bases nitrogenadas que el ADN, excepto la timina. La timina se sustituye por el uracilo (U) en la estructura del ARN.