Informationen i DNA er opdelt i gener, der hver især koder for et RNA-molekyle. Kopiering af DNA til RNA, transkription, varetages af enzymet RNA-polymerase i samspil med en række proteinfaktorer. RNA-molekylerne anvendes i nogle tilfælde direkte i cellens funktion, hvilket gælder bl.a. transfer RNA (tRNA) og ribosomal RNA (rRNA), der er vigtige komponenter i proteinsyntesen. En anden gruppe RNA (mRNA; eng. messenger 'budbringer') videregiver genernes information fra DNA til ribosomerne, hvor oversættelsen fra en nukleotidrækkefølge til en rækkefølge af aminosyrer i et protein finder sted. Denne oversættelse, translation, foregår efter en grundlæggende ordbog kaldet den genetiske kode. Alle 20 naturligt forekommende aminosyrer er kodet af mindst ét, men ofte flere, "ord" bestående af tre nukleotider, kaldet en codon. Fx angiver GGG, at der skal være aminosyren glycin i proteinet, og TGA er et terminerings-codon, et signal om, at proteinsyntesen skal stoppes.
Ud over den kodende del af DNA findes der sekvenser, der kontrollerer udtrykkelsen af generne. Eksempler på kontrolregioner i DNA er promotorer og terminatorer, der hhv. styrer begyndelsen og afslutningen af RNA-transkriptionen af et imellemliggende gen, samt enhancere og silencere, der hhv. op- og nedregulerer transkriptionen.
Andre DNA-regioner som fx centromere og telomere sekvenser spiller en rolle for DNA's overordnede struktur i kromosomerne, som det ses i eukaryote celler. Omfanget af disse ikke-kodende, men funktionelt vigtige sekvenser er dårligt karakteriseret, bl.a. fordi man formodentlig langtfra kender funktionen af alle sådanne elementer endnu.
Mængden af DNA i en celle eller virus afspejler ikke direkte mængden af anvendelig information. I mennesker og højerestående dyr har naturen tilsyneladende fråset med mængden af DNA. Kun ca. 5 % menes at indeholde kodende sekvenser, og over 90 % af DNA kender man ikke funktionen af. Til denne sidstnævnte gruppe hører store områder af humant DNA, der udelukkende består af repeterede sekvenser af varierende længde. Disse sekvenser deles ind i to klasser: SINEs (Short Interspersed Elements, 13 % af genomet), hvor den repeterede DNA-sekvens er mindre end 500 basepar, og LINEs (Long Interspersed Elements, 21 % af genomet), hvor den repeterede sekvens er over 5000 basepar lang.
Et eksempel på repeterede DNA-sekvenser af SINE-typen er Alu-sekvenser, som er opkaldt efter restriktionsenzymet Alu-I, der skærer i denne type DNA-sekvens. Alu-sekvenser består af irregulære repeterede sekvensenheder på ca. 300 basepar, der forekommer 700.000-900.000 gange i genomet, svarende til ca. 10 % af arvemassen.
Kendetegnende for genstrukturen i eukaryote celler er også, at dele af det transkriberede RNA ofte bliver fjernet og bortkastet ved en proces kaldet RNA-splejsning. Den bortkastede del af genet kaldes introns (udgør 30 % af genomet) i modsætning til den tilbageblevne information, der kaldes exons (udgør få % af genomet). Specielt i højerestående dyr og mennesker kan introns være meget store (op til 200.000 basepar), og der findes eksempler på gener, der strækker sig over flere mio. basepar, men hvor mindre end 1 % af denne information bruges til at kode for protein. En funktionel begrundelse for denne uøkonomiske opbevaring af information er stadig ikke fundet af forskerne, men det står nu klart, at introns kan indeholde vigtige sekvenser, fx findes mange gener for små RNA-molekyler i introns.
Bakteriers arvemasse er væsentlig mindre end hos mennesker og dyr. Fx indeholder bakterien Escherichia coli "kun" ca. 4 mio. basepar, men tætheden af kodende DNA-sekvens er væsentlig højere, idet ca. 50% menes at være kodende sekvens. Denne forskel skyldes til dels, at bakterielle gener generelt ikke indeholder den type af introns, der er hyppigst hos eukaryoter.
I virus, som typisk har et genom på 5000-100.000 basepar, er informationen normalt endnu mere koncentreret, og der findes ekstreme eksempler på, at den samme DNA-sekvens kan kode for tre forskellige proteiner ved at anvende overlappende codons, fx i hiv-virus.
Kommentarer (1)
skrev Annelise Brincker
Da Crick og Watson skrev deres verdensberømte artikel i 1953, skrev de, at de:
"... wish to put forward a radically different structure for the salt of deoxyribose nucleic acid..."
Er der natrium i dna? Eller betyder "salt" her noget helt andet? Jeg ved, at salt får dna til at klumpe sammen, men jeg kan ikke se, at det skulle indgå i selve molekylet.
Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.
Du skal være logget ind for at kommentere.