Sebenta FBM 2021

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 109

Fundamentos

de Biologia
Molecular
1 º SEMESTRE
Beatriz Silva
Carlota Ferreira
Carolina Finuras
Mara Silva
2020/2021

ÍNDICE

Página 1 de 109
Página 2 de 109
ÍNDICE

1. O Dogma central da Biologia Molecular ………………………………………………………………………………………………….. Pág. 4


2. As moléculas da Biologia Molecular: DNA, RNA e proteínas ……………………………………………………………………. Pág. 5
3. Genoma (1ª parte) …………………………….…………………………………………………………………………………………………… Pág. 15
I. Características gerais dos genomas procariótico e eucariótico………………………………………………….. Pág. 16
II. Estrutura do genoma procariótico: cromossoma da E. coli………………………………………………………… Pág. 17
III. Estrutura e organização dos cromossomas eucarióticos …………………………………………………………… Pág. 18
IV. Estrutura e organização dos genes no genoma …………………………………………………………………………. Pág. 21
4. Expressão génica: ……………………………………………………………………………………………………………………………….….. Pág. 23
I. Transcrição; ………………………………………………………………………………………………………………………….…… Pág.23
II. Regulação da expressão génica …………………………………………………………………………………………………. Pág. 45
III. Classes de RNA …………………………………………………………………………………………………………………………...Pág. 50
IV. Tradução;…………………………………………………………………………………………………………………………………… Pág. 60
V. Variedade de Proteínas e Pós-Tradução ……………………………………………………………………………………. Pág. 67
5. Replicação do DNA ………………………………………………………………………………………………………………………………… Pág. 72
6. Mutações no DNA e mecanismos de reparação ……………………………………………………………………………………. Pág. 83
7. Recombinação homóloga …………………………………………………………………………………………………………………….. Pág. 103

Página 3 de 109
O DOGMA CENTRAL DA BIOLOGIA MOLECULAR
• A Biologia Molecular é uma ciência relativamente recente que resulta da fusão de várias outras disciplinas que
deram origem à Biologia Molecular. Foram descobertas pontuais que permitiram o aparecimento desta ciência.

• Destacam-se as experiência de Mendel, sendo que no final do séc. XIX já se sabia que havia material genético no
núcleo que seria a base física da hereditariedade. Nesta altura, também se descobre a molécula de DNA que era
constituída por bases nitrogenadas.
• Em meados do séc. XX, concluiu-se que o DNA era o material genético com a experiência de Hershey e Chase em
bacteriófagos. Ao mesmo tempo, Watson e Crick conseguiram engendrar o modelo da molécula de DNA. Chargaff
descobre a regularidade e proporcionalidade na constituição das bases (A=T; G=C).
• Por fim, Fraenkel-Conrat e Singer mostram que alguns vírus usam RNA como uma molécula de informação.
• No fundo, de uma genética clássica, desde a análise morfológica das ervilhas, das Drosophilas, passou-se para uma
genética mais moderna, em que para além desta análise, tentava-se perceber qual a função do material genético,
e em conjunto com a Bioquímica, forma-se a Biologia Molecular.
• O interesse da Biologia Molecular circunscreve-se fundamentalmente ao estudo dos genes e das suas atividades a
nível molecular (estrutura, expressão, controlo da expressão) e ao estudo da célula (como se desenvolvem,
trabalham, comunicam, regulam…).
• À exceção dos vírus, todos os organismos vivos usam DNA como molécula de informação e utilizam processos
moleculares comuns (replicação, transcrição, processamento do RNA e tradução).
• O dogma central da Biologia Molecular explica como é que se dá o fluxo de informação genética que está contida
no DNA. Este modelo mostra que uma sequência de ácidos nucleicos pode formar uma proteína, contudo, o
contrário não é possível. Segundo este dogma, o fluxo da informação genética segue o seguinte sentido: DNA →
RNA → PROTEÍNAS.
• Atualmente também se sabe que uma molécula de RNA pode produzir
DNA. Chamamos esse processo de transcrição reversa e ele acontece
principalmente em vírus. Eles possuem um enzima denominado
transcriptase reversa, que transcreve o RNA para o DNA. Este dogma
atualizado pode ser resumido e representado da seguinte maneira. O
enzima responsável pela replicação de RNA é a RNA replicase.
• O dogma central da Biologia Molecular diz ainda que:

Página 4 de 109
o As proteínas nunca fazem auto-replicação;
o Nunca ocorre síntese de RNA a partir de proteínas;
o Nunca ocorre síntese de DNA a partir de proteínas;
• A transcrição e a tradução ocorrem no mesmo compartimento celular nos procariotas, enquanto que nos eucariotas
estes processos ocorrem em compartimentos separados, no núcleo e citoplasma, respetivamente.

A ESTRUTURA DO DNA

• Em abril de 1953, os pesquisadores James Watson e Francis Crick elaboraram o famoso modelo da dupla hélice de
DNA. Eles juntaram e analisaram conjuntos de dados já existentes, organizando-os de forma esclarecedora.
• Algumas das suas pistas mais cruciais sobre a estrutura do DNA vieram de Rosalind
Franklin, uma química que produziu a famosa “imagem 51”, uma imagem de raios-X de
difração do DNA notavelmente clara. Para Watson, o padrão de difração em formato de X
da imagem de Franklin imediatamente sugeriu uma estrutura helicoidal, de duas fitas para
o DNA.
• Essa descoberta foi fundamental para o desenvolvimento da biologia molecular nos anos seguintes. Em 1957, o
próprio Francis Crick estabeleceu o dogma central da biologia: propôs que o fluxo de informação do DNA vai para a
proteína. A partir desse conhecimento, vieram a ocorrer importantes descobertas.
• A molécula de DNA é constituída por unidades – o nucleótido – 1 grupo fosfato, 1 molécula de açúcar (5C) e 1 base
azotada. O nucleótido é a unidade repetitiva dos polímeros de DNA (desoxirribonucleótido) e RNA (ribonucleótido).

• Esta diferença é que a molécula de açúcar no caso do RNA, contém o grupo OH assinalado na imagem, enquanto
que na molécula de açúcar do DNA, há a perda de um oxigénio (daí o nome). Esta diferença faz com que o RNA seja
uma molécula muito mais lábil, ou seja, muito mais sujeito a degradação.
• O 3’ OH e o 5’ fosfato vão ser dois grupos fundamentais no estabelecimento da cadeia polinucleótida, quer no caso
do DNA, quer no caso do RNA.

Página 5 de 109
• As purinas são a adenina (A) e a guanina (G) e as pirimidinas são a citosina (C), a timina (T) e o uracilo (U).

• As purinas apresentam 2 anéis, enquanto que as pirimidinas apresentam apenas um anel. Estas bases são planares
(não formam grandes projeções), hidrofóbicas (tinham que estar para dentro da estrutura do DNA) e não polares
(não interagiam com outras moléculas à partida).
• O tipo de ligação que se estabelece entre a molécula
de açúcar e a base azotada é uma ligação covalente do
tipo N-glicosídica (entre os átomos N1 das pirimidinas
ou N9 das purinas e o átomo de carbono 1’ da molécula
de açúcar). Por outro lado, o grupo fosfato vai-se ligar
ao grupo hidroxilo do carbono 5’ – ligação fosfodiéster.
• Um nucleótido sem o grupo fosfato é denominado
nucleósido (desoxirribonucleósido ou ribonucleósido).
Um nucleótido pode se designar por nucleósido mono-
, di- ou trifosfatado (consoante o número de grupos fosfato presentes).
• Cada fosfato liga o grupo hidroxilo (OH) do átomo de carbono 3’ de uma pentose e o grupo hidroxilo do carbono 5’
da pentose do nucleótido adjacente. Consequentemente, a estrutura de uma cadeia polinucleótida resulta de
ligações fosfodiéster, da qual se projetam as bases azotadas. Cada cadeia polinucleótida apresenta na extremidade
5’ livre um grupo fosfato e na extremidade 3’ livre um grupo hidroxilo, tendo-se convencionado escrever as
sequências
nucleotídica no
sentido 5’ – 3’.
• Como as bases
azotadas são
hidrofóbicas, concluiu-
se que a pentose e o
fosfato formariam o
esqueleto da
molécula.

Página 6 de 109
• Denote-se que quando um nucleótido se integra numa cadeia, o grupo fosfato que se liga à extremidade 3’ e 5’ é
sempre o fosfato mais interno (no caso de haver mais do que um grupo fosfato). Este nucleósido trifosfatado é que
é o precursor para que possa haver síntese de DNA. Os 2 grupos fosfato desintegram-se, libertando-se energia que
irá estabelecer a ligação fosfodiéster. Logicamente durante este processo, o emparelhamento de bases tem de ser
respeitado.

• A DNA polimerase possui algumas características que determinam a forma como ocorre o processo de replicação:
o As DNA polimerases não efetuam a separação das cadeias da dupla hélice a serem copiadas.
o Todos as DNA polimerases até agora descritas não iniciam a nova cadeia – apenas estendem uma nova
cadeia a partir de um fragmento pré-existente de DNA ou RNA, o iniciador (primer).
o Todas as DNA polimerases só conseguem catalisar a adição de nucleótidos à extremidade 3’OH livre da
nova cadeia em crescimento que, portanto, só pode ser sintetizada na direção 5’→ 3’.
• Na molécula de DNA, cada cadeia
linear possui uma extremidade 3’ e
outra 5’.
• A polaridade dos ácidos nucleicos
deve-se à existência de grupos
químicos diferentes nas suas
extremidades (5’ fosfato, 3’OH).
• As cadeias de DNA são
antiparalelas.
• Na cadeia de RNA não há
paralelismo, mas existe polaridade.
• Os grupos fosfato como têm carga
negativa, vão conferir à molécula
de DNA e de RNA uma carga global
negativa.

Página 7 de 109
• O emparelhamento é sempre feito entre uma purina e uma pirimidina. A
ligação que se estabelece entre purinas e pirimidinas são ligações por pontes
de hidrogénio. No caso da adenina e da timina, estabelecem-se apenas 2
ligações, enquanto que no caso da guanina e da citosina, estabelecem-se 3
ligações. Como as ligações de hidrogénio são ligações muito fortes, isto quer
dizer que uma cadeia de DNA formada por C-C-C-C, e uma cadeia
complementar G-G-G-G, é necessária uma maior quantidade de energia para
romper estas ligações e separar estas cadeias.
• Na molécula de DNA verifica-se que a concentração total de purinas é igual à
concentração total de pirimidinas. Na molécula de RNA, tal não se verifica,
uma vez que o RNA é constituído por uma única cadeia, podendo haver um
maior número de purinas em relação a pirimidinas, ou vice-versa.

MODELO DE WATSON E CRICK

• Estas observações permitiram a Crick e Watson elaborar o modelo de dupla hélice


apresentado em 1953. A forma predominante do DNA é de dupla hélice, formada
por duas cadeias polinucleotídicas enroladas à volta uma da outra para a direita,
com dois sulcos na parte externa da molécula, um maior (major groove) e outro
menor (minor groove).
• As estruturas de desoxirribose-fosfato traçam a periferia da molécula. E os pares
de anéis de purina-pirimidina localizam-se no interior (hidrofóbicas), com o plano
dos seus anéis aproximadamente perpendicular ao eixo da hélice.
• As duas cadeias polinucleotídicas apresentam orientações 5’-3’ antiparalelas.
• O diâmetro da hélice mede cerca de 2 nm (20 Å); A distância entre os pares de
anéis é cerca de 0,34 nm (3,4 Å);
• Verificou-se também que cada volta completa da dupla hélice, correspondia a 10 pares de bases e cerca de 3.4 nm.
• A forma do DNA originalmente identificada foi denominada forma B, caracterizada pela repetição regular de minor
e major grooves com enrolamento helicoidal para a direita (no sentido dos ponteiros do relógio). No entanto, são
conhecidas duas formas adicionais isoméricas do DNA que resultam do facto de os ângulos das ligações que
envolvem as bases e as desoxirriboses serem mutáveis, bem como o anel de desoxirribose e o esqueleto
polinucleotídico ser suficientemente flexível de forma a permitir diferentes conformações.
• A forma A do DNA existe apenas no estado desidratado, não lhe tendo sido ainda atribuída qualquer função
biológica. É frequentemente encontrada em condições salinas elevadas. Esta forma apresenta uma distância menor
entre as bases, em virtude de o ângulo entre os pares de bases ter sido alterado cerca de 20° relativamente à
perpendicular do eixo da dupla hélice. Em consequência, o número de pares de bases aumenta para 11-12 em cada
volta da dupla hélice.
• Em algumas situações, dependendo da sequência nucleotídica do DNA, nomeadamente quando se observa uma
sequência de nucleótidos alternados de purinas e pirimidinas (regiões ricas em G e C), o DNA pode assumir uma

Página 8 de 109
forma helicoidal para a esquerda, designada por forma Z. A forma Z apresente uma estrutura em ziguezague e com
12 nucleótidos por volta, à semelhança da forma A. Nesta conformação Z, ligam-se algumas proteínas específicas
designadas por Z-DNA-binding proteins, que regulam a expressão génica.
• Note-se que se não houve proteínas específicas que se ligassem ao DNA, nada aconteceria.
• Na verdade, para além destas 3 conformações, existem mais de 20 variantes de diferentes possibilidades de
enrolamento. A conformação do DNA varia consoante as condições fisiológicas e a sequência de bases.

• Alguns exemplos de várias estruturas de DNA que não estão na


conformação B temos:
o H-DNA (DNA triplo)
o Slipped DNA (frequente em sequências DR – direct repeats)
o G-quadruplex (tetraplex) DNA;
o Cruciform DNA (frequente em sequências IR – inverted repeats)

ENROLAMENTO E SUPER-ENROLAMENTO DO DNA (Coiling and supercoiling)

• A molécula de DNA é muito longa em comparação com o seu


diâmetro, e para que seja possível haver replicação, as duas
T
cadeias têm de ser separadas, de forma a servirem de molde para W Coil
Supercoil
as cadeias-filha. Contudo, separar as cadeias da dupla hélice,
implica que a hélice gire sob a “bolha” de transcrição.
• Imagine tentar separar os fios de uma longa corda torcida. A
torção da corda vai apertar à frente fios de separação, e,
eventualmente, a corda tenderá a enrolar-se sobre si mesma.
Este enrolamento da corda (na prática, do DNA) é o processo de
super-enrolamento (supercoiling).
• O Twist (T) descreve o enrolamento (coiling) das cadeias em torno do eixo da hélice, ou seja, sobre si próprias. Como
vimos anteriormente, uma volta completa são cerca de 10 pares de bases.
• O Writhe (W) descreve o número de vezes que a dupla hélice sofre contorção (supercoiling).

Página 9 de 109
• O linking number (L) é dado como L = T+W. Isto implica que para
uma dada molécula circular fechada, uma vez que o L não varia,
que qualquer mudança no twist do DNA é acompanhada por
uma mudança oposta no writhe, e vice versa.
• As duas formas oposta de supercoiling são designadas por
supercoiling positivo (overwinding – “sobreenrolamento”) e
supercoiling negativo (underwinding – “subenrolamento”).
• No caso das moléculas lineares, podemos pensar que como não têm nada que tranque a molécula num ponto fixo
(têm pontos livres – free ends), resultando numa tensão e consequentemente um supercoiling aquando da
replicação, que a molécula irá desenrolar sem problema e sem formar um supercoiling. Contudo, a molécula de
DNA não tem pontos livres (no free ends), ainda que os cromossomas sejam lineares, estão cheios de proteínas
ligadas à molécula. Essas proteínas vão fixar a molécula, gerando tensão aquando da replicação, e formando,
inevitavelmente, supercoiling.
• Denote-se que temos sempre um enrolamento negativo em oposição a um positivo. O supercoiling negativo é um
défice no número de voltas (ocorre atrás da proteína) e o supercoiling positivo é um excesso no número de voltas
(ocorre após a proteína).

TOPOISOMERASES

• Na molécula de DNA, para que não ocorra supercoiling, existem enzimas chamadas topoisomerases, que induzem
ou eliminam o underwinding ou o overwinding da cadeia dupla de DNA. Elas agem induzindo temporariamente
quebras na cadeia, numa ou nas duas cadeias, aliviando assim a tensão e permitindo a rotação livre de uma cadeia
em torno da outra, e de seguida, selam a zona que foi quebrada.
• A Topoisomerase I liga e cliva uma fita da cadeia, reduzindo o supercoiling porque remove voltas, já a
Topoisomerase II liga e cliva ambas as fitas da cadeia, adicionando ou removendo voltas.
• Procariotas e eucariotas têm o seu
próprio conjunto de enzimas.
• Se o DNA não possuir a tensão super-
helicoidal adequada, os processos
vitais ocorrem de forma muito lenta
ou até podem mesmo deixar de
ocorrer.

Página 10 de 109
A ESTRUTURA DO RNA

• O RNA é uma macromolécula biológica, que consiste numa cadeia simples de ribonucleótidos com capacidade de
armazenamento da informação genética e também de catálise. Apresenta polaridade.
• O RNA é sintetizado através da transcrição catalisada pela enzima RNA polimerase. Cada ribonucleótido contém:
uma base azotada, que pode ser uma purina – adenina, guanina – ou pirimidina – uracilo ou citosina; uma ribose; e
um grupo fosfato, que confere o caráter ácido ao RNA.
• Sendo o RNA uma molécula de cadeia simples, pode formar estruturas secundárias complexas.
• A diferença da molécula de açúcar no caso do RNA que contém o grupo 2’OH (que no caso do DNA, há a perda de
um oxigénio), faz com que o RNA seja uma molécula muito mais lábil, ou seja, muito mais sujeito a degradação.
• A molécula de RNA quando sofre enrolamento, forma
algumas estruturas secundárias, de cadeia dupla.
• Alguns exemplos de estruturas secundárias e
terciárias são:
o Hairpin;
o Stem-loop;
o Pseudoknot;
• Uma molécula de RNA que é altamente estruturada é,
por exemplo, o t-RNA. Após formar a estrutura secundária e terciária, não sendo planar, ela adquire alguma
tridimensionalidade.
• Se uma molécula de RNA que tem uma sequência específica não adquirir a sua estrutura tridimensional, ela não vai
ser funcional. Assim, há uma relação muito direta entre estrutura e função.

• Os ribossomas dos procariotas constituem uma ribonucleoproteína de 70S, que


está dividida em duas subunidades: uma pequena de 30S, onde está localizado
o rRNA de 16S, acompanhado de cerca de 21 proteínas, e na grande subunidade
de 50S, onde se localizam os rRNA de 5S e de 23S, acompanhado de cerca de
34 proteínas.

Página 11 de 109
• O que está representado na figura ao lado, é a
estrutura terciária da subunidade do rRNA de 16S.
Se ele estivesse estendido na sua forma primária,
não seria funcional.

CLASSES DE RNA
• RNA mensageiro (mRNA): tem como função
armazenar a informação genética contida nos
genes, e transportá-la para o citoplasma, onde é
traduzido em proteína. É sintetizado a partir do
DNA no núcleo, pelo processo de transcrição, como
um precursor do mRNA chamado pré-mRNA. Este
precursor é processado de modo a formar um
mRNA funcional.
• RNA de transferência (tRNA): é sintetizado e
processado no núcleo. Tem como função transferir
um aminoácido específico para a cadeia
polipeptídica da proteína que está a ser sintetizada.
• RNA ribossómico (rRNA): é um componente estrutural do ribossoma, componente principal na síntese proteica ou
tradução. A função do rRNA é descodificar e transferir a informação contida no mRNA para aminoácidos.
• Pequenos RNA nucleares (snRNA): encontram-se no núcleo das células eucariotas e possuem uma função no
processamento de mRNA, por exemplo, no splicing. Os snRNA encontram-se sempre associados a proteínas e os
complexos assim formados denominam-se snRNP (small nuclear ribonucleoproteins).
• Pequenos RNA nucleolares (snoRNA): encontram-se no nucléolo e corpos de Cajal, e têm uma função na biossíntese
e modificação de rRNA;
• Os RNA reguladores: incluem os micro-RNA (miRNA), os siRNA (short interfering RNA) e os RNA não codificantes
(lncRNA). Existem muitos RNA não codificantes nas células que regulam a expressão génica, sendo a classe dos
miRNA a mais conhecida. A função dos miRNA é de silenciamento genético, através da degradação do mRNA ou por
inibição da sua tradução.
• As ribozimas são moléculas de RNA com uma estrutura terciária complexa que lhes permite catalisar a hidrólise de
uma ligação fosfodiéster na sua própria molécula ou noutros RNA.

ESTRUTURA DAS PROTEÍNAS


• Os aminoácidos são constituídos por um grupo amina, um grupo carboxilo, um hidrogénio e uma cadeia lateral
variável, todos ligados a um carbono central (carbono α).
• Os α-aminoácidos diferem unicamente no que se refere à estrutura química da cadeia lateral R, nomeadamente ao
tipo de grupos funcionais presentes, à sua dimensão e carga. Estas características influenciam a solubilidade dos
aminoácidos na água e estão na base de uma classificação genética em aminoácidos polares (ou hidrófilos),
aminoácidos apolares (ou hidrófobos) e aminoácidos contendo uma cadeia lateral ionizável (acídicos ou básicos).

Página 12 de 109
• Enquanto que a molécula de DNA tem carga global negativa, nós não podemos dizer o mesmo das proteínas. Como
as proteínas são constituídas por diferentes aminoácidos, com diferentes cargas, elas tanto podem ter carga global
negativa, como positiva.
• Um péptido é formado através de ligações peptídicas, que ocorrem entre o grupo α-carboxilo de um aminoácido e
o grupo α-amina do aminoácido seguinte, pelo que, ao serem estabelecidas, perdem as propriedades iniciais dos
aminoácidos intervenientes.
• A polaridade das extremidades amina e carboxilo está diretamente relacionada com a molécula de DNA, uma vez
que a síntese proteica se inicia na extremidade 5’ do mRNA (que foi transcrito a partir da cadeia de DNA). Desta
forma, a extremidade 5’ do RNA vai corresponder à extremidade amina da proteína. Assim, diz-se que existe uma
colinearidade entre a sequência codificante de nucleótidos num gene e a ordem de aminoácidos num polipéptido.

DNA

RNA

Polipéptido

• A estrutura tridimensional das proteínas pode ser hierarquizada em quatro grandes níveis.
• O primeiro nível é a estrutura primária da proteína, que é uma sequência de resíduos de aminoácidos especificada
pelo código genético. O segundo nível, a estrutura secundária, relaciona-se com os arranjos estruturais locais dos
resíduos de aminoácidos que resultam do processo de enrolamento da cadeia polipeptídica. A estrutura secundária
consiste em elementos repetidos como hélices (hélices α), conformações estendidas (cadeias β) e voltas (turns e
loops).
• O terceiro nível, a estrutura terciária, é a forma tridimensional global assumida pela cadeia polipeptídica. No caso
de a proteína consistir em mais do que uma cadeia polipeptídica, o nível de organização resultante da associação
das várias subunidades constituintes corresponde ao quarto nível estrutural, a estrutura quaternária.
• O estado final da proteína corresponde a um estado de menor energia.
• As proteínas têm diversas funções tais como:
o Transporte (ex: proteínas de canal);
o Estrutural (ex: colagénio, elastina)
o Hormonal (ex: insulina);
o Proteção e defesa (ex: fibrinogénio, anticorpos);
o DNA binding proteins (proteínas de ligação ao DNA);
o RNA binding proteins (proteínas de ligação ao RNA);

Página 13 de 109
DNA BINDING PROTEINS

• As de ligação ao DNA são proteínas que possuem domínios de ligação


ao DNA, e, portanto, possuem uma afinidade específica ou geral para o
DNA de fita simples ou dupla.
• Estas proteínas de ligação de DNA interagem mais no major groove, uma
vez que é mais aberto, dando oportunidade para a proteína interagir
melhor com as bases, e pelo facto de possuir mais grupos químicos que
vão interagir com as proteínas.

MOTIVOS PROTEICOS (PROTEIN MOTIFS)

• Na biologia, as menores unidades de sequência de aminoácidos são


denominadas motivos. Motivos são frequentemente utilizados para identificar
regiões funcionais de proteínas e, quando compartilham um ancestral comum,
são úteis para a classificação da família proteica correspondente. Alguns
exemplos de motivos que se ligam ao DNA são:
o Dedos de zinco;
▪ Duas fitas beta com uma extremidade em hélice-α
dobrada para ligar a um ião zinco. Frequentemente
encontrados nas proteínas de ligação ao DNA.
▪ Na imagem, a presença de duas cisteínas e duas histidinas faz com que seja possível interagir com o
ião zinco. Um dedo de zinco ronda os 30 aminoácidos.
o Helix-turn-helix;
▪ Duas hélices-α unidas por uma fita curta de aminoácidos.
Encontradas em muitas proteínas que regulam a expressão génica.
o Helix-loop-helix;
▪ Consiste em hélices-α ligadas por um trecho em loop de aminoácidos. Este motivo é visto em fatores
de transcrição.
▪ Este motivo normalmente liga-se à sequência CACGTG.
o Fecho de leucina (leucine zipper);
▪ As leucinas mantêm as hélice-α unidas;

Página 14 de 109
DOMÍNIOS PROTEICOS (PROTEIN DOMAINS)

• A grande diferença entre motivos e domínios proteicos é que o domínio é uma região mais abrangente da proteína.
• Os domínios proteicos são unidades estruturais, funcionais e evolutivas das proteínas. São normalmente
responsáveis por uma função específica ou interação que contribui para o papel global de uma proteína.
• Um exemplo destes domínios é a estrutura dos fatores de transcrição. Os fatores de transcrição consistem em 2
domínios independentes:
o O domínio de ligação ao DNA que reconhece uma sequência específica de DNA;
o O domínio de ativação que interage com outros componentes da maquinaria transcricional.

O GENOMA (1ª PARTE)


• Seria expetável que à medida que os organismos fossem cada vez mais complexos, que a quantidade de DNA e o
número de genes que estes organismos mais complexos tivessem seria progressivamente maior. Contudo, não é
isso que se verifica. Por exemplo, a quantidade de DNA dos mamíferos pode ser muito inferior à da de algumas
plantas.
• O C-value é a quantidade de DNA (em picogramas) contido num núcleo haploide (ex: gâmeta) ou em metade da
quantidade existente numa célula somática diploide num organismo eucariota.
• O tamanho do DNA é referido em termos do número de pares de bases (pb), sendo a unidade comum 1kb (1000
pb), 1 Mb (1000000 pb) ou Gb (1000000000 pb).
• O organismo complexo como o homo sapiens possui igualmente uma quantidade de DNA (3Gb) superior à da
Drosophila melanogaster (180 Mb), um organismo menos complexo. Quando isto não se verifica, ou seja, quando

Página 15 de 109
o organismo mais complexo não possui uma maior quantidade de DNA, dizemos que se trata de um paradoxo C.
Um exemplo deste paradoxo é a salamandra que possui uma quantidade de DNA (30 a 90 Gb) superior à do homo
sapiens.
• O paradoxo C é quando a quantidade de DNA num genoma haploide (1C) não corresponde à complexidade do
organismo. Deste modo, não existe uma relação quantidade de DNA-complexidade.
• Por outro lado, seria também expetável que um organismo com maior quantidade de DNA possuísse
proporcionalmente um maior número de genes do que um com menor quantidade de DNA. Contudo, o que se
verifica é que o tamanho do genoma eucariótico não é proporcional ao número de genes e à complexidade
anatómica do organismo.
• No genoma procariótico, existe uma proporcionalidade entre o número de genes e a dimensão do genoma (devido
à organização dos genes no genoma).
• Nos genomas menos complexos há uma economia de espaço, ou seja, há pouco espaço entre genes.
• Espécies relacionas diferem no tamanho do genoma, mas têm um número de genes muito similiar. Exemplo: o arroz
(0,43 Gb), o milho (2,5 Gb) e o trigo (16 Gb) têm o mesmo número de genes. Isto acontece por várias razões:
o Existência de intrões nos genes (quanto mais intrões, maior espaço ocupado no genoma);
o Sequências intergénicas (as sequências entre genes podem ser diferentes, havendo um maior ou menos
espaço entre genes);
o Elementos reguladores de genes (existência de sequência reguladoras entre genes);
o Pseudogenes;
o Múltiplas cópias dos genes;
o DNA repetitivo;

CARACTERÍSTICAS GERAIS DOS GENOMAS PROCARIÓTOCO E EUCARIÓTICO


PROCARIOTAS
• As células procarióticas não têm compartimentos celulares e o genoma
corresponde a uma única molécula circular de DNA (na grande maioria).
• São organismos haploides.
• O genomas varia mais ou menos entre 1 a 10 Mb (contudo existem bactérias com
580 kb – Mycoplasma genitalium).
• Presença de plasmídeos (moléculas de DNA que replicam independentemente do
genoma bacteriano), fagos e elementos móveis.
• A informação genética está mais compacta (os genes estão muito mais próximos uns dos outros).
• Grande diversidade de organização (nalgumas bactérias).
• Há uma grande discussão sobre o que se considera ou não genoma. Há quem considere que o genoma bacteriano
é apenas o DNA cromossómico, e há quem considere que para além deste, o DNA plasmídico também faz parte do
genoma bacteriano. Apesar de não se ter chegado a um consenso, devido à existência de bactérias (ex: vibrio
cholerae) que têm genes fundamentais para a sua sobrevivência no genomas plasmídico, a maioria dos
investigadores considera que o genoma bacteriano é apenas o DNA cromossómico.

Página 16 de 109
EUCARIOTAS
• As células eucarióticas têm compartimentos celulares, rodeados por
membranas.
• A nível do genoma existem duas ou mais moléculas de DNA lineares.
• São organismos diploides.
• Ao contrário dos procariotas, os eucariotas têm DNA mitocondrial e/ou
plastidial. Estas moléculas são de menores dimensões do que as moléculas
de DNA do núcleo, normalmente são circulares, contudo, também possuem
genes.
• O genoma das células eucarióticas normalmente considera-se o genoma que existe no núcleo (DNA cromossómico),
contudo, para além deste existe o genoma mitocondrial e plastidial, que de forma semelhante aos procariotas, é
assunto de discussão sobre o que se considera ou não o genoma da célula.

ESTRUTURA DO GENOMA PROCARIÓTICO: CROMOSSOMA DA E. COLI

• O genoma da E. coli, com aproximadamente 4600 kb, é composto por uma única molécula circular de DNA. Cerca
de 99 a 100% desta sequência é codificante, contendo cerca de 4280 genes.
• Verificou-se que o cromossoma da E. coli estava concentrado numa região da célula e que formava um nucleoide.
O facto de ele estar concentrado numa região da célula permitiu verificar que existia um centro proteico ao qual o
DNA se ia ligar, formando loops (40-50 domínios independentes).
• Verificou-se também a existência de topoisomerases, enzimas que iam cortando partes do genoma de forma a
aliviar a tensão que se gerava durante o processo de replicação.
• Estas proteínas que se ligam ao DNA (DNA binding proteins) são proteínas
associadas ao nucleoide entre as quais: HU; H-NS (H1); Fis1; IHF; Lrp;
• Ao observar-se com detalhe o genoma da E. coli, verificou-se que quando
um gene tinha de ser transcrito, não era a RNA polimerase que se deslocava
ao longo da cadeia. Existem regiões no genoma onde se concentram RNAs
polimerases (zonas denominadas por fábricas de transcrição), e em vez de
serem as RNAs polimerases a deslocarem-se, verificou-se que é o próprio
DNA que se vai moldando e se movimenta para estas fábricas
de transcrição.
• No fundo, são as proteínas que se ligam ao DNA que vão conferir esta capacidade da molécula se moldar e de se
mobilizar, criando pontes, protegendo a cadeia, dobrando ou enrolando a cadeia, as diferentes proteínas permitem
a mobilização da molécula de DNA.
• As proteínas podem ter sequências mais ou menos específicas para se ligarem (ex: H-NNS – AT e TCGATAAATT),
mas no fundo, se as proteínas se ligam, é porque têm algum tipo de afinidade com aquela região de DNA.
• Normalmente, estas ligações não são muito fortes.

1
Mantém a natureza dinâmica dos loops.

Página 17 de 109
ESTRUTURA E ORGANIZAÇÃO DOS CROMOSSOMA EUCARIÓTICOS

• Os cromossomas dos eucariotas são lineares, logo vão ter extremidades.


• O número de cromossomas varia consoante as espécies, mas uma vez que são compostos por vários cromossomas,
consequentemente terão várias moléculas de DNA.
• Nos cromossomas eucarióticos observa-se diferentes níveis de organização de fibras de cromatina.
• Nos eucariotas, o DNA encontra-se sempre associado a proteínas básicas, designadas histonas, dando origem à
cromatina. A associação do DNA às histonas conduz a vários níveis de compactação ordenada do DNA que
permitem, num estado extremo, uma redução do comprimento desta molécula em cerca e 10000 vezes.
• O nucleossoma constitui o nível mais simples de organização da cromatina. Este é formado por um domínio central
que consiste em 146 pb de DNA em torno do octâmero de histonas (8 proteínas).
• Este octâmero de histonas é constituído por duas moléculas de cada uma das histonas H2A, H2B, H3 e H4. A histona
H1 é a quinta histona que faz parte deste complexo, permitindo fechar esta estrutura que é a unidade básica da
organização da cromatina.

• A cromatina permite a organização da molécula de DNA em cromossomas. Ela pode existir numa estrutura mais
estendida ou numa estrutura mais condensada.
• Em torno do octâmero, o DNA nucleossomal enrola-se em duas voltas, apresentando pequenas regiões de DNA
de ligação (linker DNA) que podem variar em tamanho (10-100 pb), que permite associar-se a outro
nucleossoma. Associado ao linker DNA encontra-se uma molécula adicional da histona de ligação H1, ou a
proteína hómologa H5.

FUNÇÕES DA CROMATINA

• Empacotamento do DNA num volume menor, de forma a caber na célula;


• Conferir rigidez aos cromossomas durante a mitose;
• Prevenir danos na molécula de DNA;
• Regula a expressão génica e a replicação de DNA;

Página 18 de 109
• Ao contrário daquilo que se possa pensar, não existe um único gene que codifica cada uma destas histonas, existem
cerca de 10 a 15 genes por cada tipo de histona. Isto acontece para garantir que caso aconteça alguma mutação
num dos genes, as células vão continuar a poder formar os seus cromossomas. Por outro lado, isto mostra a
quantidade de histonas que são necessárias por cada célula.
• Para além destas histonas mencionadas, existem outras variantes (ex: H2AX – envolvida na reparação do DNA).
• A maioria dos genes que codificam as histonas, não contém intrões.
• Como sabemos, em cada polipéptido há sempre um N-terminal e um C-terminal. Uma particularidades das histonas
é precisamente terem estas “caudas flexíveis” projetadas para fora. Estas caudas das histonas são constituídas
maioritariamente por aminoácidos básicos (20-30% arginina e lisina), o que lhes confere uma carga global positiva
(contrariamente ao DNA que tem carga negativa). Estes aminoácidos de carga positiva são importantes para que se
possa formar uma cromatina, uma fibra de 30 nm.

ESTRUTURA DA FIBRA DE CROMATINA

• A cromatina no seu nível mais baixo de compactação, resulta no


encurtamento do DNA em cerca de 7 vezes. Por microscopia eletrónica,
a cromatina é observada como uma fibra de 10 nm de diâmetro ou, mais
frequentemente, como uma fibra com contas de 10 nm de diâmetro.
Cada uma destas contas de 10 nm de diâmetro corresponde a um
nucleossoma (forma de disco). A cadeia de nucleossomas sofre um grau
de compactação maior, originando uma fibra mais curta e mais larga,
designada por fibra de 30 nm.
• Pensa-se que dentro do núcleo celular o DNA raramente se encontra na
sua forma mais estendida (beads on string), mas sim enrolado em
formas mais compactas, como a fibra de 30 nm.
• Os modelos propostos para o empacotamento dos nucleossomas
variam, uma vez que as fibras de cromatina são de uma fragilidade
extrema e, consequentemente, de difícil análise estrutural. Estudos de
cristalografia sobre a estrutura de um tetranucleossoma, apontam para
um arranjo em forma de zig-zag, onde as interações entre
nucleossomas imediatamente alternados estabilizam a fibra. No entanto, análises de criomicroscopia de arranjos
mais longos de nucleossomas sugerem que a fibra se organiza por um enrolamento helicoidal, com interações entre
nucleossomas largamente espaçados, originando uma hélice solenoide ordenada (com enrolamento para a
esquerda).
• Pensa-se que ambos os arranjos possam coexistir dentro do núcleo, possivelmente refletindo diferentes estados
funcionais da cromatina.
• Caso ocorra uma reação química que mude a carga global das proteínas, a fibra de 30 nm não se conseguirá formar,
ou seja, a cromatina descondensa. No fundo, estas modificações químicas podem interferir na conformação da
cromatina e poderão afetar a expressão génica.

Página 19 de 109
ESTRUTURA GLOBAL DA CROMATINA INTERFÁSICA

• O enrolamento do DNA em fibras de 30 nm, não é, certamente,


suficiente para compactar o DNA dentro do núcleo, pois apenas
promove uma compactação total de cerca de 40 vezes. Os
cromossomas humanos, por exemplo, teriam
aproximadamente 0,1 cm de comprimento e, por isso, não
caberiam num núcleo com um diâmetro 100 vezes inferior.
Níveis mais elevados de compactação estão presentes no
cromossomas, mesmo em interfase, permitindo um maior empacotamento da cromatina.
• Verificou-se que se os cromossomas fossem tratados com NaCl2, as histonas eram removidas da cromatina. Se as
histonas permitiam que o DNA estivesse enrolado, as histonas ao serem removidas, o DNA formava loops. Para além
de se observar estes loops, ou seja o DNA já sem a sua estrutura de beads, o que se verificou é que se formava um
esqueleto proteico, denominado por scaffold, que é um cromossoma constituído por todas as proteínas não
histonas que permaneceram após a remoção de histonas. O que se concluiu foi que devem existir outras proteínas
para além dos nucleossomas que ajudam a formar estas conformações, as
chamadas scaffold proteins. Estas proteínas vão organizar a cromatina, não só nos
cromossomas metafásicos, mas também nos interfásicos.
• Quando estão em interfase, os cromossomas não estão todos “baralhados” com
outros cromossomas por estarem desenrolados, eles ocupam regiões bem
definidas, não se sobrepondo.
• Para além de todas as estruturas mencionadas anteriormente, os cromossomas possuem ainda duas estruturas
importantes na integridade dos cromossomas durante a replicação, os telómeros e os centrómeros, que permitem
que haja uma herança estável dos cromossomas para as células-filha. Os telómeros serão abordados mais adiante,
e os centrómeros são regiões específicas ao longo da fibra de cromatina, que desempenham um papel
preponderante no movimento dos cromossomas durante a mitose e a meiose.
• Para além das histonas, alguns exemplos de proteínas associadas aos cromossomas são:
o Acetilases, metilases, cinases, etc. (envolvidas na condensação e descondensação da cromatina –
transformações químicas).
o Scaffold proteins;
o DNA polimerases, helicases, primases, etc.
o RNA polimerases, fatores de transcrição;
o HMP (High mobility group proteins);
o Proteínas associadas ao centrómero, cinetocoro
e telómero.
• Resumindo, a cromatina é, de facto, DNA mais histonas, mas para além disto, tem uma panóplia de proteínas que
podem estar associadas.

Página 20 de 109
ESTRUTURA E ORGANIZAÇÃO DOS GENES NO GENOMA (PROCARIOTAS E EUCARIOTAS)

DEFINIÇÃO DE GENE

• O gene é unidade básica da hereditariedade que contém toda a informação genética e que é passada de uma
geração para a outra.
• Em termos moleculares, um gene é uma sequência de nucleótidos específica que está numa região discreta do
cromossoma (região específica), que vai ser necessária para que haja a produção de um polipéptido ou de um RNA.
• Existem genes que vão ser transcritos e traduzidos, dando origem a um polipéptido, enquanto que outros vão ser
transcritos, não dando origem a um polipéptido (ex: rRNA e tRNA existem na célula porque existem genes que os
codificaram, mas depois já não são traduzidos, eles por si só já são o produto final desses genes).
• A dimensão dos genes varia imenso (75 pb a 2300000 pb).
• A combinação dos 4 nucleótidos existentes vai codificar todas as proteínas que existem, desde as bactérias até aos
mamíferos (uma sequência de 6 nucleótidos pode dar origem a 4096 sequências diferentes).
• A informação biológica está nos genomas, está no DNA (com raras exceções, pode estar no RNA), torna-se
disponível através da expressão génica que é altamente regulada e controlada. O primeiro passo para a expressão
génica é a transcrição.
• Os genes têm diferentes organizações nos organismos.
• Ambas as cadeias de DNA são codificantes, ou seja,
possuem informação genética, contudo, apenas uma
das cadeias contém informação para cada gene, ou seja, pegando no exemplo acima, o gene A só vai ser transcrito
numa das cadeias, e não em ambas (o mesmo para o gene C e para o gene B). Denote-se que todos os genes em
cima representados têm o sentido 5’-3’.
• Neste exemplo, o gene A quando for transcrito, o mRNA que vai ser sintetizado tem uma sequência igual à cadeia
codificante, a única coisa que difere é a substituição de timina por uracilo (CCUAGUUACGG). Isto é possível porque
a RNA polimerase liga-se à cadeia não codificante (cadeia antisense template ou cadeia molde), neste caso a que
está em baixo, para saber quais os nucleótidos a incorporar. Assim, a sequência do mRNA é idêntica à sequência
codificante e complementar à cadeia não codificante, a partir da qual ela é transcrita.
• Nota: Denote-se que a “cadeia de baixo” não é sempre o molde, uma vez que depende da perspetiva. No caso do
gene A, a cadeia de cima é a codificante e a debaixo é a cadeia molde, contudo, no caso dos genes B e C, a cadeia
codificante é a de baixo e a cadeia molde será a de cima. Ambas as cadeias são codificantes. É também possível
haver genes que se sobrepõem.

ESTRUTURA DO GENE PROCARIÓTICO

UNIDADE TRANSCRICIONAL SIMPLES

• Na sequência de DNA, existem sequências específicas, os promotores, às quais a RNA polimerase se pode ligar para
iniciar a transcrição. A transcrição inicia-se num nucleótido (a nível do DNA) que denominamos por +1, que
corresponderá ao primeiro ribonucleótidos. Denote-se que os promotores não vão ser transcritos.
• A RNA polimerase finaliza a transcrição quando chega a uma sequência denominada por terminador da transcrição.

Página 21 de 109
• Por outras palavras, no DNA existem sinais, ou seja, sequências, que vão ser responsáveis pelo início e pelo fim da
transcrição, e que delimitam as chamadas unidades transcricionais (sequência de DNA transcrito).
• Na molécula de RNA formada após a transcrição, também têm de existir sequências que indiquem onde se irá iniciar
a tradução, os chamados codões de iniciação
(AUG) e o codão de terminação (UAG, UAA,
UGA).
• A sequência de DNA que sofre tradução, é
delimitada pelo 5’ UTR e pelo 3’UTR, que são
regiões não codificantes.
• Nos procariotas, estas regiões são
consideradas exões não traduzidos, que delimitam um único exão traduzido, não existindo intrões.
• Nota: dizemos que o promotor se encontra a montante (a 5’) e um terminador a jusante (a 3’).

OPERÕES

• A nível da estrutura do genoma procariótico, podemos ter uma unidade transcricional simples (só têm um gene e
dão origem a um polipéptido), ou operões. Operões são genes que fazem parte de uma mesma unidade
transcricional, ou seja, são genes que estão sujeitos ao mesmo promotor, mas são genes diferentes (apesar de
poderem estar funcionalmente relacionados).
• Isto significa que cada um deles terá o seu início de tradução e o seu fim de tradução. Entre genes poderá haver
regiões que não são traduzidas.
• Um operão é por definição, um conjunto
de genes que vai ser transcrito a partir
de um único promotor, que dará origem
a um RNA que contém todas as
sequências codificantes de diferentes
proteínas.

ESTRUTURA DO GENE EUCARIÓTICO

• Nos eucariotas só existem unidades transcricionais


simples. Existe a montante um promotor e a jusante
um terminador (para iniciar e terminar a transcrição),
e sequências específicas para iniciar e terminar a
tradução.
• Contrariamente aos procariotas, os eucariotas vão ter
intrões, o que implica que haja um processamento da
molécula de RNA, denominado por splicing.
• Existem vários mecanismos que vão permitir, que apesar de ser uma única unidade transcricional, originar
diferentes proteínas, que veremos mais à frente.

Página 22 de 109
• Nas topografias, os genes dos eucariotas são
globalmente maiores em relação aos genes procariotas
devido à presença de intrões. No genoma humano, os
intrões são de maiores dimensões do que os exões.
• A densidade de genes vai sendo cada vez menor, ou seja,
os genes vão estar mais espaçados, à medida que a
complexidade do organismo aumenta. O DNA repetitivo aumenta à medida que a complexidade organismo
aumenta.

EXPRESSÃO GÉNICA
TRANSCRIÇÃO

• Os precursores para haver síntese de RNA são os


ribonucleótidos trifosfatados.
• A transcrição, produção da molécula de RNA a partir
do molde da cadeia de DNA codificante, ocorre em três fases: a iniciação, a elongação e a terminação.
• A iniciação da síntese de RNA ocorre numa sequência específica de DNA denominada promotor, ao qual a RNA
polimerase se liga. Denote-se que não é necessário um primer para iniciar a transcrição.
• Após a iniciação, ocorre a elongação, fase em que a cadeia de RNA é aumentada, ocorrendo o movimento da
“bolha” transcricional, que envolve uma alteração da estrutura do DNA. Nesta fase, a RNA polimerase percorre a
cadeia molde, adicionando ribonucleótidos no terminal 3’ da cadeia em crescimento, na direção 5’-3’. À medida
que avança, vai separando as duas cadeias de DNA (atividade helicásica, de forma e expor a cadeia molde (template
DNA) ao quebrar as pontes de hidrogénio que existem entre os pares de base.
• Devido ao caráter helicoidal das cadeias de DNA, e às proteínas ligadas, ocorre um super-enrolamento que é
normalmente resolvido por topoisomerases.
• À medida que o enzima RNA polimerase avança, a molécula de RNA formada vai se
dissociando, e a dupla hélice do DNA volta a formar-se.
• A sequência de bases do RNA transcrito é complementar à cadeia molde ou não codificante
(template DNA) e idêntica à das bases na cadeia de DNA codificante (à exceção da timina,
que é substituída por uracilo).
• Denote-se que quando um ribonucleótido se integra numa cadeia, o grupo fosfato que se
liga à extremidade 3’ e 5’ é sempre o fosfato mais interno (no caso de haver mais do que
um grupo fosfato). Este nucleósido trifosfatado é que é o precursor para que possa haver
síntese de DNA. Os 2 grupos fosfato desintegram-se, libertando-se energia que irá
estabelecer a ligação fosfodiéster. Logicamente durante este processo, o emparelhamento
de bases tem de ser respeitado.
• A RNA polimerase catalisa a reação entre o grupo 3’OH da cadeia em formação e o grupo
5’fosfato da base azotada imediatamente a seguir.
• O RNA sintetizado é complementar e antiparalelo à cadeia molde (template strand).

Página 23 de 109
• Cada gene é transcrito de uma única cadeia de DNA, mas genes diferentes podem ser transcritos a partir de uma
ou outra cadeia de DNA.

RNA POLIMERASE BACTERIANA

• A core da RNA polimerase bacteriana, ou centro catalítico, consiste em 5 subunidades


catalíticas: duas cópias de α, uma cópia de β, uma cópia de β’ e uma cópia de ω.
o A subunidade α possui um papel de reconhecimento do promotor, embora tenha
também um papel na interação da RNA polimerase com fatores reguladores.
o A subunidade β é responsável pela catálise, ou seja, é aqui que se encontra o centro ativo para a ligação
fosfodiéster.
o A subunidade β’ permite que haja uma ligação ao DNA;
o A subunidade ω permite que todas as subunidades estejam ligadas;
• Para além destas subunidades que formam a RNA polimerase, existe uma subunidade
sigma (σ) ou fator sigma, que se liga à core da RNA polimerase. A RNA polimerase com
todas as suas subunidades designa-se de holoenzima.
• Esta subunidade sigma é muito importante, pois é ela que vai conferir especificidade ao promotor. O centro
catalítico tem a capacidade de sintetizar RNA a partir da cadeia molde de DNA, mas não pode iniciar a transcrição
nos locais apropriados. A função do fator sigma é conseguir que a RNA polimerase bacteriana se ligue de maneira
estável ao DNA apenas nos promotores.
• Na imagem ao lado, vemos que na região do
promotor há uma sequência específica que irá
ser reconhecida pelo fator sigma. Estas
sequências específicas são denominadas por
sequências consenso -10 e -35, o que nos indica
a localização destas sequências.
• O sequenciamento de bases de diferentes promotores bacterianos, mostrou que há sequências básicas que estão
presentes em todos eles. Por essa razão, elas são chamadas de sequências consenso. Essas sequências, no entanto,
não possuem todas as bases iguais, havendo alguma variação entre elas.
• Estas sequências de DNA podem ser definidas em termos de uma sequência ideal que representa cada uma das
bases que estão presentes com maior frequências em cada uma das posições, mas não obrigatoriamente em todas
as sequências.

Página 24 de 109
• Como é que se define uma sequência consenso? Neste
exemplo ao lado, compararam-se várias sequências e
verificaram-se as frequências apresentadas. Neste
caso, a sequência consenso seria CTTTGA.
• Existem quatro características conservadas num promotor bacteriano:
o O ponto de iniciação (purina em mais de 90% dos casos);
o A sequências -10 (geralmente TATAAT);
o A sequência -35 (sequência de consenso TTGACA);
o Local de início da transcrição +1;
• Denote-se que isto não quer dizer que todos os genes para serem reconhecidos pela unidade sigma tenham de ter
exatamente esta sequência. Contudo, isso irá refletir-se na eficiência da transcrição, ou seja, vão ter uma expressão
génica mais, ou menos, eficiente.
• Se uma das regiões (-35 ou -10) sofrer alguma mutação, a RNA polimerase não irá conseguir ligar-se, e
consequentemente, não haverá transcrição. Do mesmo modo, se as sequência específicas destas regiões
trocassem, ou seja, se a sequência TATAAT estivesse na região -35, e vice-versa, também não haveria transcrição.
• Existem outras classes de promotores de E. coli, em que diferentes holoenzimas da RNA polimerase se ligam com
diferentes fatores sigma (σ), como, por exemplo, o caso de promotores de genes de choque térmico. Nestes genes,
a RNA polimerase liga-se ao promotor quando a subunidade σ70 é substituída pela σ32, específica para este tipo
de promotores. Estes genes vão promover a defesa para o choque térmico, daí só serem ativados aquando do
choque térmico.
• Assim, usando diferentes fatores σ, a célula pode coordenar a expressão de um conjunto de genes que permitirão
alterações a nível morfológico.
• Estas subunidades σ mencionadas anteriormente, são relativas à E. coli. Todas as outras bactérias também vão ter
subunidades σ com outros nomes, que vão ser responsáveis pela transcrição de conjuntos de genes.
• Há outro caso que ainda deve ser mencionado, é que se verificou que quando a bactéria Bacillus subtilis foi infetada
com fagos (vírus que afetam bactérias), a RNA polimerase bacteriana (com o fator σ 43(55)) reconheceu sequências
que estavam no fago. Este fator σ43 (ou σ55) é semelhante ao fator σ70 presente na E. coli.
• Os genes do fago vão ser transcritos pela RNA polimerase bacteriana (early genes) e vão dar origem a um pequeno
polipéptido, o gp28, que vai funcionar como um fator σ, e vai ligar-se à RNA polimerase bacteriana e reconhecer
outros promotores, ou seja, vai permitir que outras sequências de genes sejam transcritas (middle genes), dando
origem a um polipéptido, o gp34. Este vai também funcionar como um fator σ, ligar-se à RNA polimerase e
reconhecer os promotores de outros
genes (late genes).
• Resumindo, os fagos têm uma
transcrição desfasada temporalmente
que é mediada por diferentes fatores
σ, que vão sendo expressos na fase
anterior.

Página 25 de 109
TERMINAÇÃO DA TRANSCRIÇÃO EM PROCARIOTAS

• Tão importante como iniciar a transcrição, é também fundamental terminar corretamente. Existem duas maneiras
de terminar a transcrição em procariotas. Uma é denominada terminação intrínseca (ou independente do
terminador Rho), e outra terminação dependente do terminado Rho. Rho é uma proteína, mais especificamente,
uma helicase de DNA/RNA hexamérica.
• Na primeira, a RNA polimerase reconhece uma sequência específica de DNA denominada por terminador. Isto
significa que se a proteína Rho estiver mutada, os genes podem ser transcritos na mesma (uma vez que é
independente). No segundo caso, é necessária uma proteína adicional (Rho) para permitir que a RNA polimerase
reconheça os sinais de terminação.

TERMINAÇÃO RHO INDEPENDENTE (TERMINAÇÃO INTRÍNSECA)

• Uma característica da terminação da transcrição dos Rho independentes, é


a capacidade de o RNA sintetizado formar estruturas secundárias, tais como
os stem-loops e os hairpin. Estas estruturas formam-se porque existe
complementaridade de bases em regiões próximas na sequência de RNA,
como mostra a imagem ao lado. Isto acontece frequentemente nas
chamadas sequências repetitivas (IR Inverted Repeats).
• No fundo, um terminador Roh independente corresponde a uma sequência
IR, seguida de uma fiada de uracilos.
• Assim que o RNA se forma, este tem tendência a emparelhar-se e a criar um
stem-loop. Esta estrutura secundária vai provocar uma instabildidade, uma
vez que vai reduzir o contacto entre a cadeia molde de DNA e o RNA
sintetizado, levando à dissociação da RNA polimerase, e consequentemente
ao final da transcrição.

Página 26 de 109
TERMINAÇÃO RHO DEPENDENTE

• O fator Rho tem uma atividade helicásica, sendo dependente de


ATP. Este fator tem a capacidade de clivar as pontes de hidrogénio
entre as bases e vai ligar-se preferencialmente a uma região rica em
citosinas (rho utilization site) no RNA sintetizado.
• Esta proteína Rho vai se movendo ao longo da molécula de RNA, e
quando se depara com uma estrutura secundária, como um hairpin
ou um stemp-loop, ela vai clivar as bases, terminando assim a
transcrição.
• Praticamente metade dos genes de E. coli dependem desta proteína
para terminar a transcrição.
• Além da proteína Rho, existem outras proteínas que também estão envolvidas na terminação da transcrição (ex:
Tau e NusA).

ESTRUTURA DO GENE PROCARIOTA (REVISÃO)

Unidade transcricional simples

Operão

• Nos operões, apesar de no início e fim da


transcrição, os sinais serem comuns aos 3 genes,
os sinais de início e fim de tradução são
específicos de cada gene, para se obter 3
diferentes proteínas.

REGULAÇÃO DA TRANSCRIÇÃO

• Nem todos os genes são expressos, ou seja, transcritos ao mesmo tempo. Existe uma regulação da expressão génica,
que podemos dividir em: regulação positiva ou regulação negativa. Dentro da regulação negativa, podemos ainda
ter uma regulação induzível (vias catabólicas) e regulação repressível (vias anabólicas).

REGULAÇÃO NEGATIVA

• Quando um gene está sujeito à regulação da expressão negativa, significa que existe um repressor, que é uma
proteína que vai reprimir a transcrição.
• Os repressores ligam-se a regiões específicas que designamos, a nível dos procariotas, por operadores.

Página 27 de 109
• A transcrição com regulação negativa pode ainda
ser induzível, ou seja, a transcrição está off e vai ser
induzida por um indutor, ou ser repressível, ou seja,
a transcrição está ativa, e vai ser reprimida.
• Em certas circunstâncias a transcrição está ativa
porque o repressor ativo é formado pela interação
entre o apo-repressor e o co-repressor, e deste modo, se o co-repressor não estiver presente, o repressor está
inativo e a transcrição ativa. É frequente em processos de síntese (vias anabólicas), em que quando há produção
em excesso, o co-repressor liga-se de forma a reprimir a transcrição.
• Um exemplo de controlo negativo induzível é o do operão lac, e um exemplo de controlo negativo repressível é o
do operão trp.

REGULAÇÃO POSITIVA

• Quando um gene está sujeito à regulação da


expressão positiva, significa que existe um ativador,
que é uma proteína que vai ativar a transcrição. As
regiões onde os ativadores se vão ligar variam nos
procariotas, mas por exemplo nos eucariotas
designam por enhancers.
• Um exemplo de regulação positiva é o operão
maltose e o operão lac.
• No caso da regulação negativa, o repressor liga-se ao operador, impedindo que a RNA polimerase se ligue e inicie a
transcrição. Na regulação positiva, o que acontece é que o ativador vai ligar-se ao repressor, alterando a
conformação do mesmo, levando-o a dissociar-se. Deste modo, a transcrição é ativa.

OPERÃO LAC - Regulação negativa induzível

• O gene lac I é transcrito a partir do seu próprio promotor, e codifica uma proteína chamada repressor Lac. Este
repressor liga-se ao operador reprimindo a expressão dos genes estruturais lacY, Z e A (responsáveis pela
degradação da lactose).
o O lac Z é o gene que codifica a β-Galactosidase que vai clivar a lactose e dar origem à galactose, à glucose
e também à alolactose.
o O lac Y vai codificar a permease, ou seja, a proteína de membrana que permite a entrada da lactose na
célula.
o O lac A codifica a uma proteína (transacetilase) associada à desintoxicação de produtos da lactose que não
são utilizados pela célula. Este gene não é essencial para a utilização de lactose.
• Na ausência de lactose, os genes estruturais do operão lac estão reprimidos. Nesta situação, a proteína repressora
liga-se ao operador, inibindo a ligação da RNA polimerase ao promotor e, consequentemente, a transcrição dos
genes estruturais.

Página 28 de 109
• Quando existe lactose, as bactérias têm de
expressar os genes codificantes para os
enzimas necessários para o seu metabolismo.
Então, o operão é induzido e inicia-se a
transcrição. A lactose (mais especificamente, a
alolactose) atua como um indutor, ligando-se à
proteína repressora e levando à sua
dissociação do operador, permitindo a ligação
da RNA polimerase e transcrição dos genes.
• A primeira dúvida que surge é: para transcrever o gene lac Z precisamos de um indutor – a alolactose – que vai ser
codificada pelo gene lac Z (por outras palavras, para arranjar trabalho, precisamos de experiência que só ganhamos
se trabalharmos). Então como é que isto acontece? Na verdade, apesar de estar a haver repressão da expressão
está sempre a haver uma transcrição basal, ou seja, a repressão nunca é total, está sempre a haver transcrição de
baixo nível de β-Galactosidase e de permeases, exatamente para permitir a formação de alolactose.
• No gráfico ao lado, vemos que se a lactose for adicionada ao meio, começa a haver
síntese do mRNA do operão lac. Contudo, se a lactose for removida do meio, ou
simplesmente se tiver esgotado, deixa de haver síntese do mRNA do operão lac muito
rapidamente, porém, observa-se que a β-galactosidase e as permeases, enquanto
proteínas que estavam a ser traduzidas, mantêm a sua concentração por um tempo,
mas eventualmente, são degradadas.
• Os RNA’s são transcritos, mas têm um período de vida média muito curto. Isto deve-se ao facto de as células terem
de se adaptar rapidamente a novas exigências do ambiente, deste modo, não é produzido nada que já não seja
necessário à célula num determinado meio (daí haver uma descida tão rápida na concentração de mRNA).

Nota: O promotor do gene lacI é um promotor constitutivo, ou seja, ele não está sujeito a nenhum tipo de relação
(positiva, negativa, induzível, etc), uma vez que existe uma expressão constante do gene lacI. Por outras palavras, na
célula, está sempre a haver produção do repressor.

MUTAÇÕES DO OPERÃO LAC

• Mutação no gene lacI (lacI-)


o Quando temos lacI-, significa que, independentemente de qual seja a mutação, a proteína que é codificada
por este gene não é sintetizada. A proteína que é codificada por este gene é o repressor lac que se irá ligar
(na ausência de lactose) ao operador, reprimindo a
transcrição dos genes necessários à metabolização da
lactose.
o Uma mutação neste gene vai impedir a produção do
repressor lac, quer esteja ou não presente a lactose. Esta
mutação é constitutiva, uma vez que vou ter uma expressão constante do
operão lac.

Página 29 de 109
• Mutação no gene IacI (lacIs)

o Esta mutação ocorre quando a alolactose (o indutor) não se consegue


ligar à proteína repressora, não havendo dissociação da mesma, e
como consequência, a transcrição não vai ocorrer mesmo na presença
de lactose. O s vem de super-repressor, uma vez que a proteína
repressora não se irá dissociar do operador.

• Mutação no operador lac (lacOc)

o O operador é a sequência de nucleótidos que vai ser reconhecida


pelo repressor. Caso, esta sequência específica seja alterada, o
repressor não irá reconhecer o operador, logo, a transcrição, e por
sua vez a expressão do gene operão lac vai ser constante.
Esta é também uma mutação constitutiva e dizemos que
está in cis¸ ou seja, só os genes que estão nesta molécula de
DNA é que vão ter uma expressão constante.
o Denote-se que esta proteína (o repressor) não tem complementaridade com o operador, mas sim afinidade.
• Mutação no promotor lac (P-)
o Mutação no promotor que faz com que este não seja
reconhecido pela RNA polimerase. Como consequência a RNA
polimerase não se liga ao promotor, logo não há transcrição
(nem expressão do gene lac).
• Mutação no gene lacZ (Z-)
o Uma mutação neste gene irá fazer com que não seja produzida β-galactosidase (codificada por este gene).
Como consequência, esta não irá clivar a lactose, logo, a alolactose não se irá ligar ao repressor. Se o
repressor não se dissocia do operador, não há transcrição.
• Mutação no gene lacY (Y-)
o Uma mutação neste gene irá fazer com que não sejam produzidas permeases (codificadas por este gene).
Como consequência, a lactose não vai conseguir entrar na célula, logo não se formará alolactose e o
repressor não se dissocia do operador, não havendo transcrição.

EXEMPLO 1

• No exemplo que se segue temos uma célula que no seu genoma tem a informação do operão lac. Nesta célula
introduziu-se um plasmídeo que também tem informação para o operão lac. Esta célula é então designada por
merodiploide, ou seja, um diploide parcial, sendo neste caso uma merodiploidia para o operão lac.
• Supondo que o genoma da célula é lacI- lacP+ lacO+ lacZ- lacY+, e que o genoma do plasmídeo é lacI+ lacP+ lacO+
lacZ+ lacY-. Nesta situação, será que na presença e na ausência de lactose temos transcrição e produção de β-
galactolosidase e de permeases? Temos de observar a célula num todo.
• Como o produto final do gene lacI+ do plasmídeo é o repressor lac, este por ser uma proteína difusível pode ligar-
se também ao operador do operão lac da célula (expressão constitutiva do operão lac in trans).

Página 30 de 109
• Deste modo, a célula na ausência de lactose não terá
transcrição ativa (uma vez que o repressor se vai
ligar).
• Na presença de lactose, a alolactose vai ligar-se ao
repressor, de forma a induzir a transcrição. Para isto
ocorrer, as permeases (codificadas pelo gene lacY)
têm de deixar a lactose entrar na célula e a β-
galactolosidase tem de clivar a lactose para dar
origem à alolactose. Como a célula vai produzir
permeases, e o plasmídeo vai produzir β-
galactolosidase, a alolactose vai induzir a transcrição.

EXEMPLO 2

• Uma célula tem um genoma Lac I+ P+ O+ Z- Y+, e é introduzido um plasmídeo dentro da célula com o genoma Lac

IS P+ O+ Z+ Y-.

• Neste caso, o genoma do plasmídeo tem uma mutação na proteína repressora que impede que a alolactose se ligue,
e como consequência, que a proteína repressora não se dissocie do operador e impedindo a transcrição dos genes
lac, mesmo na presença de lactose.
• Como os repressores atuam sempre em trans,
ou seja, o repressor sintetizado pelo plasmídeo
pode ligar-se quer ao genoma do plasmídeo,
quer ao genoma bacteriano (e vice-versa). Esta
bactéria apesar de ter um genoma I+, como o
plasmídeo vai sintetizar proteínas repressoras
defeituosas, estas ao ligarem-se ao genoma
bacteriano não vão mais dissociar-se, logo, esta
bactéria nunca vai expressar o gene lac.

Nota: Quando a ação se passa na própria molécula que está a produzir, por exemplo, quando uma molécula produz
um repressor que vai atuar nessa mesma molécula, diz-se que é uma ação em cis. Pelo contrário, quando a molécula
produz um repressor, por exemplo, e este atua noutra molécula que não a que lhe deu origem, diz-se que é uma
ação em trans.

OPERÃO LAC - Regulação positiva

• O operão lac é sujeito a regulação negativa induzível, mas também a regulação positiva.
• Isto quer dizer que vai existir uma proteína, o ativador, que vai ativar a transcrição. A função do ativador é ajudar a
RNA polimerase a estabelecer as suas ligações com o promotor.

Página 31 de 109
• O operão lac tem uma sequência promotora que não é muito forte, ou seja, o seu promotor é fraco. Deste modo,
a ligação da RNA polimerase com o promotor não é muito estável, daí precisar de um ativador.
• Na molécula de DNA a montante (mais à esquerda – 5’), vai haver uma sequência de nucleótidos para a qual o
ativador tem afinidade (não existe complementaridade de bases). Esta sequência não tem de estar localizada
imediatamente antes do promotor uma vez que o DNA tem uma capacidade de se dobrar (ver a imagem seguinte).

• O operão lac não tem um promotor forte, e por tanto existe um fator de transcrição auxiliar, o ativador, que
designamos por CAP-cAMP complex ou CRP-cAMP complex: complexo formado pelo AMP cíclico ou cAMP e a
Proteína Recetora do cAMP (CRP), também conhecida como Proteína Catabólica Ativadora (CAP).
• A glucose é a fonte de energia preferida da E. coli. Quando a lactose e a glucose existem no meio, a bactéria
metaboliza a glucose e reprime o uso da lactose.
• Esta via reguladora chama-se repressão catabólica e representa um meio de reprimir os operões que codificam
para enzimas de vias metabólicas da lactose, e outras oses, de modo que a bactéria utilize preferencialmente a
glucose.

Página 32 de 109
• O efeito da glucose é mediado pelo AMP cíclico (cAMP) e pela proteína rectora do
cAMP (CAP ou CRP).
o Na ausência de glucose, a CAP liga-se perto do promotor lac e estimula a
transcrição cerca de 50 vezes. Esta proteína tem um local de ligação de
cAMP e quando existe cAMP em altas concentrações, liga-se mais
fortemente ao DNA.
o Na presença de glucose, a síntese de cAMP é inibida. À medida que a
concentração de cAMP diminui, diminui também a capacidade da CAP de
se ligar ao DNA, e diminui deste modo a expressão do operão lac.
• A adenilato ciclase é um enzima que catalisa a hidrólise de ATP em cAMP. Na
ausência de glucose, a adenilato ciclase vai ser fosforilada e vai transformar o ATP
em cAMP, para que este se ligue à CAP, e deste modo ativar a transcrição do
operão (neste caso é o lac, mas isto acontece para outros operões).
• Neste gráfico ao lado, observamos que se tivermos uma cultura de células em
crescimento num meio com glucose e lactose, o que vai acontecer é que as
células vão crescendo utilizando a glucose como fonte de carbono.
• Quando a glucose é esgotada, observa-se uma “reta”, que corresponde ao
tempo que os genes do operão lac demoram a expressar-se, para que a lactose
seja utilizada como fonte de carbono.
• Na presença de glucose, há pouco cAMP, logo não há proteína ativadora, nem
expressão do gene lac. Este tipo de crescimento designa-se por crescimento diáuxico (quando o crescimento ocorre
na presença de dois substratos que podem ser utilizados como fonte de carbono).
• Se uma estirpe estiver a crescer num meio
com:
o ↓glucose e ↑lactose - os genes lac são
fortemente expressos.
• ↑glucose e ølactose – os genes lac não são
expressos.
• ↓glucose e ølactose – os genes lac não são
expressos.
• ↑glucose e ↑lactose – os genes lac são
expressos numa quantidade muito baixa
(transcrição basal).

OPERÃO TRP – Regulação negativa repressível

• O operão trp está sujeito a regulação negativa repressível. Isto quer dizer que a transcrição está ativa numa
determinada circunstância, porque o repressor está inativo. O repressor é ativo quando o co-repressor se liga ao
apo-repressor, e desta forma, o complexo liga-se ao operador e a transcrição é reprimida.

Página 33 de 109
• O operão triptofano contém 5 genes envolvidos na
síntese do triptofano (trpE, trpD, trpC, trpB e trpA),
que vão dar origem a 5 enzimas envolvidas no
processo. Na região a montante destes 5 genes
estruturais existe o promotor, o operador e uma
região trpL. O apo-repressor é codificado por um
gene trpR.
• Neste caso, o co-repressor é o próprio triptofano.
Em condições normais há uma transcrição e
expressão constante do operão trp, uma vez que o
triptofano é essencial para a sobrevivência da célula. Contudo, quando existe triptofano em excesso, não é
necessário continuar a sintetizar. Em tais circunstâncias, o próprio triptofano vai ligar-se ao apo-repressor, e desta
forma, reprimir a transcrição.

OPERÃO TRP – Atenuação da transcrição

• O operão trp, para além de estar sujeito a regulação negativa repressível, está também sujeito a um mecanismo de
atenuação da transcrição. Este mecanismo está diretamente relacionado com a região trpL. Esta região localiza-se
imediatamente após o início da transcrição (+1).
• Quando o triptofano é abundante, liga-se ao repressor provocando uma alteração conformacional de modo que
este complexo se torna ativo, liga-se ao operador e inibe a expressão do operão, como vimos anteriormente.
Quando deixa de haver esta repressão e se inicia a transcrição, exerce-se um segundo processo regulador
denominado por atenuação, no qual a transcrição se inicia normalmente, mas a RNA polimerase pára abrutalmente
antes de transcrever os genes do operão.
• A frequência com que a transcrição é atenuada é também regulada pela abundância de triptofano.
• O mecanismo de atenuação usa sinais na sequência trpL (leader) na região terminal 5’ que antecede o codão de
iniciação do primeiro gene estrutural. Esta região contém o atenuador que consiste numa sequência que forma
uma estrutura ansa, rica em G-C seguida por Us. Este atenuador atua como um terminador da transcrição.
• A formação desta estrutura depende do péptido leader, que consiste num péptido pequeno de 14 resíduos de
aminoácidos, contendo dois triptofanos.
• A região 2 e a região 3, devido à
sequência que têm, podem formar
um stemp-loop, assim como a
região 3 e 4. Quando ocorre a
formação desta estrutura
secundária entre a região 3 e 4,
forma-se o atenuador, que vai
atuar como um terminador da
transcrição.

Página 34 de 109
• Quando o triptofano é abundante, as concentrações do tRNA carregado com triptofano são também elevadas, o
que permite que a tradução do péptido leader se processe com muita rapidez. Este péptido é traduzido por um
ribossoma que se posiciona imediatamente a
montante da RNA polimerase. O ribossoma, como
demonstra na imagem, ao ligar-se à região 1 que
codifica o péptido leader, vai bloquear a região 2.
Como consequência, a região 3 só vai conseguir
emparelhar com a região 4, formando-se assim o
atenuador. Deste modo, os genes estruturais não são transcritos.
• Quando o triptofano é escasso, o ribossoma pára na sequência leader nos codões de Trp, porque há menos tRNA
carregado com triptofano disponível, ocorrendo uma
tradução muito lenta da região 1. Isto permite que se
formem outras estruturas secundárias que não o
atenuador, ou seja, a região 2 pode ligar-se à região 3,
e a RNA polimerase pode prosseguir com a transcrição.
Os genes estruturais vão ser transcritos.
• Para além do operão trp, os operões thr, his e phe também estão sujeitos ao mecanismo de atenuação da
transcrição.

TRANSCRIÇÃO EM EUCARIOTAS

• A célula eucariota é confrontada com o desafio de regular cada um dos seus milhares de genes. Quando se considera
que cada gene temo seu único programa de expressão, torna-se evidente que o controlo genético em eucariotas
requer uma quantidade enorme de fontes de informação e fatores.

PROCARIOTAS EUCARIOTAS
• 1 RNA polimerase; • 3 RNAs polimerases (I, II, III);
• A RNA polimerase reconhece o promotor (auxiliada • A RNA polimerase liga-se ao promotor auxiliada por
por fatores sigma); fatores gerais de transcrição (GTF);
• A região do promotor é muito mais restrita e • A região do promotor é muito mais extensa;
localizada; • A maior parte dos transcritos são monocistrónicos
• Transcritos mono ou policistrónicos (transcritos que (cada unidade de transcrição codifica um gene);
codificam um ou mais genes); • Existência de um transcrito primário (pré-mRNA) que
• Não existem transcritos primários; sofre processamento.
• Estrutura do gene complexa;
• A regulação é feita por numerosos elementos
reguladores da transcrição.

Página 35 de 109
• Nos eucariotas só existem unidades transcricionais simples. Existe a montante um promotor e a jusante um
terminador (para iniciar e terminar a transcrição), e sequências específicas para iniciar e terminar a tradução.
• Contrariamente aos procariotas, os eucariotas vão ter intrões, o que implica que haja um processamento da
molécula de RNA, denominado por splicing.
• Nos eucariotas existem três RNAs polimerases (I, II, III), com diferentes localizações e diferentes funções.
o A RNA polimerase I transcreve genes de rRNA;
o A RNA polimerase II transcreve a grande maioria dos transcrito (mRNA) e de uma série de outros RNAs
reguladores, como o snRNA (envolvido no splicing de mRNA);
o A RNA polimerase III transcreve outros RNA funcionais, tais como o tRNA;
• Todas as RNAs polimerases eucariotas são proteínas de grandes dimensões, aparecendo como agregados de 500
kDa, com uma composição de subunidades complexa.
• As RNAs polimerases eucariotas têm subunidades semelhantes à da RNA
polimerase bacteriana. As RNAs polimerases entre elas são muito
semelhantes, possuindo subunidades comuns, e subunidades
adicionais que conferem especificidade a cada uma delas.
• A RNA polimerase II possui uma “cauda” CTD (Carboxyl-Terminal
Repeat) composta por uma sequência específica de aminoácidos,
que se repete 26 vezes.

INICIAÇÃO DA TRASNCRIÇÃO NOS EUCARIOTAS

• A RNA polimerase II não consegue iniciar a transcrição por si só,


necessita de fatores gerais de transcrição (GTF), que são proteínas
que reconhecem o promotor.

Página 36 de 109
• Deste modo, a RNA polimerase II em conjunto com os fatores
gerais de transcrição, forma o complexo de pré-iniciação.
• Apenas para termos uma ideia da complexidade destes GTF,
na imagem ao lado temos o TFIID (fator geral de transcrição
associado à RNA polimerase II).
• É constituído por um TBP (proteína com afinidade para se ligar
à TATA-box) e por 13 TAFs (fatores associados ao TBP).
• A TBP é uma subunidade dos GTF presente nas três RNAs
polimerases, apesar de os promotores da RNA polimerase I e
III, normalmente não conterem TATA boxes.
• Na prática o que acontece é que muitos promotores possuem uma sequência consenso (sequência de nucleótidos
encontradas numa grande variedade de eucariotas), chamada TATA box, geralmente localizada a cerca de 25 pb a
montante do ponto de iniciação.
• A escolha do ponto de iniciação depende da TATA box, uma vez que o seu papel é de alinhar a RNA polimerase, com
o auxílio de GTF, de modo a que se inicie no local certo.
o Nesta imagem vemos a TBP a interagir com a TATA-box
por afinidade, é assistida pela TFIIB (outro fator geral de
transcrição associado à RNA polimerase II), e auxiliada
pela TFIIF de forma a posicionar corretamente a RNA
polimerase.
o Posteriormente, a TFIIE cria um local de encaixe para a
TFIIH, que tem atividade helicásica e de cinase (vai
fosforilar o CTD). A RNA polimerase só irá iniciar a transcrição após a fosforilação da cauda CTD.
o Esta descrição serve para ilustrar a complexidade da transcrição nos eucariotas.

• Para se iniciar a transcrição, tem de haver esta modificação química (fosforilação do CTD), mediada pela TFIIH, que
vai fosforilar as serinas em cada uma destas repetições (26 a 54).

Página 37 de 109
• O núcleo do promotor (core promoter) está normalmente localizado a cerca de -40 a +40 do local de iniciação.
Algumas sequências do promotor necessárias para a sua funcionalidade: a TATA box, a CAAT box e a GC box. Estas
sequências do promotor são comuns e têm sido encontradas em promotores expressos em diferentes tecidos.
• Um dado core promoter pode conter algumas, ou até nenhumas destas sequências consenso. A TATA box é um
elemento um elemento do core promoter comum, contudo existem outros elementos tais como o BRE (elemento
reconhecido pelo TFIIB), o iniciador (Inr) ou até o DPE (Downstream promoter element).

• A região que se designa por região próxima do promotor está tipicamente localizada de -40 a -250 relativamente
ao local de iniciação +1. Exemplos de elementos proximais do promotor são a CAAT box e a GC box. Estes
elementos proximais/reguladoras ajudam na regulação dos genes eucariotas, mas são maioritariamente
responsáveis pela expressão constitutiva.
• Denote-se que nenhum destes elementos é essencial para o promotor funcionar. Alguns promotores não
possuem TATA box, outros não possuem CAAT box e/ou não têm GC boxes.
• Os genes eucariotas têm de ser regulados de uma forma muito cuidadosa visto que muitos genes são expressos
em células ou tecidos específicos em alturas precisas da vida do organismo. Para conseguir este nível de
regulação, para além dos promotores, os genes contêm também regiões reguladoras chamadas enhancers.
• Além de tudo isto, ainda existem as chamadas ilhas
CpG a envolver a região +1. Estas ilhas estão
localizadas próximas da região +1, e frequentemente
presentes em genes housekeeping (genes essenciais
à sobrevivência da célula).
• Assim, os genes housekeeping usam muitas vezes
promotores que dependem destas ilhas CpG.
• Estima-se que 60 a 70% dos genes nos mamíferos
estão embebidos entre regiões genómicas ricas em
ilhas CpG (Citosina – fosfato – Guanina).
• Quando as citosinas não estão metiladas, o DNA está livre de nucleossomas, ou seja, está descondensado
(eucromatizado) e está a ser transcrito. Quando as citosinas estão metiladas, há uma heterocromatização, o
DNA está condensado e não há transcrição.

Página 38 de 109
• No fundo, para além de todos estes fatores, das RNAs polimerases, dos GTF, pode haver modificações químicas
ao nível do DNA (como a metilação) que vão condicionar a transcrição.
• Existem outros sistemas de transcrição nos eucariotas, por exemplo nas mitocôndrias e nos cloroplastos. Estes
organelos contêm também DNA próprio. A transcrição e tradução dos genes que estão nestes organelos ocorre
com o auxílio de uma RNA polimerase semelhante à RNA polimerase bacteriana. É a própria mitocôndria (ou
cloroplasto) que contém a sua própria RNA polimerase, que é muito mais simples (contribui para a teoria
endossimbiótica).
ANALOGIA PARA VISUALIZAR MELHOR A MATÉRIA

• Supondo que se fazia uma corrida:


• Equipas (genes)
o Equipas de manutenção (genes housekeeping);
o Equipas especializadas (genes específicos de tecidos);
• Corredor (RNA polimerase)
o 3 classes de corredores especializados (3 RNAs polimerases) que reconhecem diferentes locais de início
de percurso: praia (RNA polimerase I), pradaria (RNA polimerase II), montanha (RNA polimerase III);
• Elementos necessários ao corredor (GTF)
o Dirigem-se para local específico (seq. Consenso), se existirem próximo do ponto de partida do corredor
para fornecer o necessário ao início da corrida;
o Mas esses locais podem ter alterado a sua configuração (conformação – modificações químicas que
condicionam a ligação dos GTF e outros fatores);
• Elementos extra de ajuda ao corredor (ativadores transcricionais)
o Têm de existir em quantidade / tempo certo / reconhecer o local de ajuda;

PROCESSAMENTO DE mRNA EM EUCARIOTAS

• Em eucariotas, copiar simplesmente a informação genética contida numa molécula de DNA molde num transcrito
de RNA não resulta na síntese de uma molécula de mRNA. A molécula de RNA originada pela transcrição,
denominada transcrito primário ou pré-mRNA, tem a mesma organização que o gene e tem de ser convertida num
RNA maduro através de um conjunto de mecanismos denominados processamento de RNA (capping, splicing e
poliadenilação).

CAPPING

• Este processo consiste na adição de uma guanosina (nucleosídeo – guanina ligada a um anel de ribose) metilada na
posição 7 à extremidade 5’ da molécula de RNA.
• O capping é desenvolvido por três atividades enzimáticas que ocorrem logo após o início da transcrição:
o RNA 5’ trisfosfatase, que hidrolisa o trifosfato do primeiro nucleótido do pré-mRNA num difosfato;
o RNA guanililtransferase, que transfere guanililmonofosfato (GMP) para a extremidade do difosfato do
primeiro nucleótido através de uma ligação 5’ – 5’ trifosfato:
o RNA metiltransferase, que adiciona um grupo metilo à posição N7 do GMP;

Página 39 de 109
• A maior parte dos mRNAs eucariotas possuem
esta região 5’ cap.
• O cap aumenta a estabilidade do mRNA.
• O cap influencia na remoção de intrões.
• Como vimos anteriormente, a RNA polimerase
II possui uma “cauda” CTD, composta por
aminoácidos, e que é fosforilada, permitindo o
início da transcrição.
• Esta fosforilação para além de ser essencial
para ativar a transcrição, é também muito
importante para o cap, porque é a estes
aminoácidos fosforilados que a região cap se
vai ligar.
• O cap representa também um papel
importante na medida em que estimula a
tradução, por promover a ligação das
subunidades do ribossoma ao mRNA através
do eIF-4E, um fator que tem afinidade com a
região cap metilada. Deste modo, a tradução
será mais eficiente. Isto é em parte conseguido
pela interação da eIF-4E com a PABPC
(proteína citoplasmática de ligação a poli(A)).
• Denote-se que apenas a RNA polimerase II é que sintetiza transcritos com 5’cap.
• No fundo, tudo isto é um mecanismo para assegurar que só os mRNAs devidamente processados é que vão ser
traduzidos.

SPLICING

• A maioria dos genes de mamíferos são interrompidos por sequências não codificantes (intrões). De modo a gerar
uma mensagem funcional a partir do DNA molde, tem que que ocorrer splicing, que consiste na excisão de intrões
durante o processo de transcrição.
• Os intrões estão presentes nos genes nucleares, mitocondriais e cloroplastidiais. Do mesmo modo, todas as classes
de RNA (desde tRNA, rRNA, etc) podem conter intrões.
• À medida que a complexidade do organismo aumenta, também aumenta o número de intrões.
• A dimensão dos intrões é muito superior, na grande maioria das vezes, à dimensão dos exões.
• A maioria dos intrões não codifica proteínas, no entanto, atualmente sabe-se que a partir de alguns intrões são
transcritos pequenos mRNAs que têm funções reguladoras.
• As bactérias não contêm intrões, contudo, sabe-se que ao nível dos elementos móveis das bactérias pode haver
sequências que se podem considerar intrões (intrões do grupo II).

Página 40 de 109
TIPOS DE INTRÕES

• Existem vários tipos de intrões. Os que iremos abordar são apenas os intrões GU-AG e os intrões AU-AC .

• O splicing do pré-mRNA ocorre no núcleo e é necessário para que o RNA se mova para o citoplasma.
• A ordem dos exões no DNA é normalmente mantida no m-RNA processado.
• O self-splicing é a capacidade do próprio pré-mRNA fazer a remoção dos seus próprios intrões.
• A maquinaria celular necessária para o splicing consiste na sua grande maioria em pequenas ribonucleoproteínas
nucleares (snRNP ou snurps) descobertas em 1979. As snRNP são os componentes de um grande complexo
dinâmico denominado spliceossoma, que se forma para remover cada intrão do pré-mRNA.
• Observou-se que muitos intrões tinham
“GU” na sua extremidade 5’ e “AG” na
sua extremidade 3’, e a estes intrões
designamos por intrões GU-AG.
• Para além da sequência consenso a 5’
AG/GURAGU e da sequência consenso a 3’ YAGR (onde R – purina (A/G) e Y uma pirimidina (U/C)), existe também
uma região a montante do local 3’ ss (splice site) onde se situa o branchpoint (BP), cuja sequência de consenso é
YYRAY.
• O splicing processa-se em dois passos:
o No primeiro passo, dá-se um ataque hidrófilo
pela adenosina do branchpoint ao 5’ss. O tipo de
reação que se dá é uma transesterificação e a
estrutura que se forma é chamada “laço” (lariat).
o No segundo passo, o terminal 3’ que se formou
ataca a ligação do 3’ss. Esta reação liberta o
intrão em forma de laço, que é rapidamente
degradado enquanto os exões se ligam.
• O mecanismo de splicing requer assim as sequências de consenso que definem os sítios de splicing a 5’ e a 3’, o
branchpoint, e um conjunto de proteínas que fazem parte do spliceossoma.

Página 41 de 109
• O spliceossoma é constituído por cinco snRNP,
chamadas U1, U2, U4, U5 e U6 e muitos outros
fatores proteicos. Os spliceossomas são
capazes de detetar fronteiras exão/intrão,
cortar o RNA no ponto apropriado e ligar os
exões adjacentes para produzir o mRNA
maduro.
• Estas ribonucleoproteínas ligam-se por
complementariedade de bases, uma vez que
são compostas por snRNAs.
• Alguns intrões (nomeadamente do grupo I e do
grupo II) são removidos por self-splicing,
quando o pré-mRNA tem atividade enzimática.
Neste caso denominamos estas moléculas de
RNA por ribozimas.

SPLICING ALTERNATIVO

• O splicing alternativo consiste na utilização diferencial de locais de splicing presentes num pré-mRNA de modo a
produzir isoformas distintas de mRNA a partir desse transcrito.
• Os mRNAs produzidos possuem diferentes exões e consequentemente, são traduzidos em proteínas diferentes.
• Este fenómeno é frequente em eucariotas e contribui para o aumento da biodiversidade de proteínas codificadas
pelo genoma.
• Mais de 90% dos pré-mRNAs humanos podem estar sujeitos a
vários tipos de splicing alternativo que estão representados na
figura ao lado e podem ser sumarizados como:
o Exões em cassette ou skipping de exão;
o Local dador (ou 5’ss) competidor
o Retenção de intrão;
o Exões mutuamente exclusivos;
o Local aceitador (ou 3’ss) competidor;
• Para além das snRNP, o splicing é regulado pelas trans-acting proteins que podem atuar como ativadores ou
repressores de splicing, e por outras proteínas específicas de ligação ao DNA (RBPs). Cada tipo de célula expressa
diferentes arranjos de RBPs, uma vez que desempenham diferentes funções, ainda que o genoma seja o mesmo.

EXEMPLO DE SPLICING ALTERNATIVO NO GENE DSCAM EM DROSOPHILA

• Este gene quando é transcrito apresenta uma série de sequências de exões, mas quando ocorre splicing, o mRNA
final contém apenas 24 exões (ver imagem seguinte).
• Isto faz com que se possam produzir 38016 diferentes proteínas a partir deste gene DSCAM.

Página 42 de 109
POLIADENILAÇÃO

• À exceção das histonas em eucariotas superiores, todos os mRNAs que codificam proteínas contêm um terminal 3’
que consiste em cerca de 200 adenosinas, a cauda poli(A).
• Esta sequência não se encontra codificada no gene. O gene contém apenas o sinal de poliadenilação que causa a
clivagem do pré-mRNA e
subsequente síntese da cauda
poli(A). Este sinal é definido por
um hexâmero cujo consenso
mais frequente é AAUAAA. A
distância entre este hexâmero
e o local de clivagem varia
entre 10 e 30 nucleótidos.
• Vai haver uma interação de várias proteínas (fatores de clivagem CF, fatores
estimuladores de clivagem CstF, fatores de clivagem e poliadenilação CPSF,
Poli(A) polimerase PAP). Deste modo forma-se um complexo estável.
• A clivagem do pré-mRNA ocorre pelos CFI e CFII (fatores de clivagem).
• A Poli(A) polimerase (PAP) é a enzima que vai adicionar as adeninas e
formar a cauda poli(A).
• A jusante do local de clivagem, podem-se encontrar sequências que
modulam a eficiência do processamento do terminal 3’, denominadas DSE
(downstream sequence elements), que consistem numa região rica em GU
ou U.
• A montante do sinal poli(A), podem também estar presentes sequências
que regulam a eficiência do processamento do terminal 3’, que se designam
USE (upstream sequence elements).
• Existem outros mecanismos para clivagem do terminal 3’ em eucariotas,
nomeadamente no caso dos genes das histonas, que não vão sofrer
poliadenilação, mas sim outro mecanismo de clivagem. O local de clivagem
é definido pelo emparelhamento de uma sequência denominada HDE
(histone dowstream element).

Página 43 de 109
• Por vezes, um gene pode ter mais do que um
promotor. A este promotor adicional
designamos por promotor alternativo, que irá
dar origem a um transcrito diferente. Do mesmo
pode podemos ter splicing alternativo e
poliadenilação alternativa.
• Um exemplo destes processos é a síntese de anticorpos por linfócitos B quando não foram estimulados e quando
foram estimulados. O que se sabe é que quando os linfócitos B não foram estimulados, os anticorpos estão
ancorados na membrana do linfócito.
• Quando os linfócitos B não são estimulados o splicing ocorre desta forma: o exão 3 junta-se ao exão 4, mas este
estão 4 pode ser clivado em duas regiões diferentes. No caso em que não são estimulados, o exão 4 perde uma
região (mais escura na imagem) que continha o sinalizador para a poliadenilação. Como consequência, não há
formação da cauda poli(A), e os exões 5 e 6 (que codificam para o ancoramento dos anticorpos na membrana) são
incluídos.
• Por outro lado, quando os linfócitos são estimulados, o splicing ocorre sem se perder a região do exão 4 que contém
o sinal para a poliadenilação. Deste modo, os anticorpos são secretados.

TERMINAÇÃO DA TRANSCRIÇÃO EM EUCARIOTAS

• A transcrição, o processamento e a remoção de intrões ocorre toda no mesmo local.


• O transcrito estende-se entre 200 a 2000 nucleótidos para a frente do local onde ocorreu a clivagem para a
poliadenilação.
• A terminação da transcrição requer outros fatores que ainda não são muito conhecidos, para além dos que estão
envolvidos na poliadenilação.

Página 44 de 109
• Muitas vezes a terminação da transcrição não ocorre num lugar preciso. A terminação da transcrição pela RNA
polimerase II não está ainda completamente entendida, podendo ocorrer a uma distância grande em relação ao
final do gene.
• A terminação envolve o reconhecimento do ponto no qual não devem ser adicionadas mais bases à cadeia de RNA.
Para terminar a transcrição, a formação de ligações fosfodiéster deve ser interrompida e o complexo de transcrição
deve ser “desmontado”. Quando o último nucleótido é adicionado à cadeia de RNA, a bolha transcricional colapsa,
o DNA retoma a dupla hélice e a cadeia de RNA e a RNA polimerase II são libertados.

REGULAÇÃO DA TRANSCRIÇÃO EM EUCARIOTAS

• O principal modo de regulação da expressão génica, tanto em eucariotas como procariotas, é a nível da transcrição.
• Deste modo, existem sequências reguladoras, os enhancers, às quais se vão ligar fatores transcricionais, permitindo
assim a transcrição desse gene.
• A razão principal para que exista regulação da expressão génica em eucariotas é a especialização celular, uma vez
que os eucariotas superiores são organismos multicelulares e consistem em milhares de células de tipos diferentes,
cada uma diferenciada para servir uma função especializada diferente. Cada célula diferencia-se ativando um
conjunto de genes diferentes.
• A expressão de um gene pode depender de um fator de transcrição estar ou não ativo num determinado tecido.
Por exemplo, considere-se dois genes diferentes, um regulado pelo enhancer A, que é reconhecido pelo fator de
transcrição A, e outro regulado pelo enhancer B, que é reconhecido pelo fator de transcrição B. Numa célula
muscular o fator de transcrição A pode estar ativo e o B não estar. Nesta célula, só o primeiro gene será transcrito.
Noutro tipo de célula, por exemplo epiderme, pode estar ativo apenas o fator B. Nesta célula só segundo gene seria
transcrito.
• O enhanceossoma é um complexo proteico
composto por diferentes sequências enhancers
(que são reconhecidas por diferentes fatores de
transcrição) e pelos próprios fatores de
transcrição.
• No fundo, para que possa haver transcrição nos
eucariotas tem que haver várias estruturas
modulares às quais se liga a RNA polimerase
(promotores + enhancers). Em resumo (com exemplos):
• Estruturas do núcleo do promotor (core promoter) – expressão constitutiva
o TATA box (sequência consenso 5’ TATAWAW 3’, onde W representa A ou T);
o Sequência Inr (sequência consenso 5’ YYCARR 3’, onde Y representa as pirimidinas C e T, R representa as
purinas A e G).
o ….
• Elementos da região proximal do promotor – expressão constitutiva
o CAAT box (sequência consenso 5’ GGCCAATCT 3’)

Página 45 de 109
o GC box (sequência consenso 5’GGGCGG 3’)
o…
• Módulos de resposta (genes que são transcritos como resposta a estímulos exteriores à célula)
o Genes de choque térmico;
o Genes de glucocorticoides,
• Módulos específicos da célula (são expressos em apenas um tipo de tecido)
o Eritrócitos;
o Mioblastos;
• Módulos reguladores do desenvolvimento (genes que são ativos numa etapa específica do desenvolvimento);
o Genes bicoid em Drosophila;
o Genes controlo par em Drosophila;
• Isto quer dizer que a montante do gene alvo está uma determinada sequência à qual se vai ligar um determinado
fator de transcrição, ocorrendo transcrição aquando dessa ligação.

FATORES DE TRANSCRIÇÃO

• Os fatores de transcrição (ou ativadores transcricionais) são compostos por pelo menos 2 domínios modulares:
o Domínio de ativação;
o Domínio de ligação ao DNA;
• Contudo, alguns fatores de transcrição possuem também um domínio de dimerização. Estes fatores, muitas vezes,
não funcionam isoladamente mas sim em dímeros, ou seja, têm de interagir com outro fator de transcrição para se
ativarem (homodímeros – quando se ligam a um ativador idêntico, ou heterodímero quando se ligam a um
diferente). Alguns fatores de transcrição podem também ter um domínio de ligação do ligando, como é o caso dos
recetores nucleares.
• Para percebermos melhor o funcionamento dos fatores de transcrição, vamos ver um exemplo da superfamília dos
recetores nucleares. Estes recetores nucleares são uma classe de proteínas encontradas no interior das células que
são responsáveis por sentir a presença de hormonas e outras moléculas.
• Os recetores nucleares têm a capacidade de se ligarem diretamente ao DNA e regular a expressão de genes
adjacentes, sendo por isso classificados como fatores de transcrição.
• A regulação da expressão génica pelos recetores nucleares só acontece quando um ligando (uma molécula que
afeta o comportamento do recetor) está presente, ou por outras palavras, a ligação do ligando a um recetor nuclear
resulta numa mudança conformacional no recetor, ativando-o, resultando na regulação positiva da expressão dos
genes alvo.
• No caso do recetor do glucocorticoide (GRE), este vai ligar-se a uma sequência específica AGAACA. Este fator
transcricional, na ausência de estímulos, está no citoplasma ligado a uma proteína Hsp (que confere estabilidade).
Na presença de um ligando, uma hormona, o recetor liga-se a este estímulo exterior, dissocia-se da proteína Hsp, e
torna-se ativo. Uma vez ativo, o fator de transcrição desloca-se até ao núcleo onde vai ligar-se à sua sequência
específica.
• O recetor do glucocorticoide é um exemplo de um homodímero.

Página 46 de 109
• No fundo, a transcrição nos eucariotas depende de vários fatores, como os que já vimos até agora (desde a RNA
polimerase, os fatores gerais de transcrição, fatores de transcrição, etc). Para além de todos os que já vimos, para
iniciar a transcrição é necessário também um mediador.
• Um mediador não tem de ser uma proteína,
pode ser um conjunto de proteínas como é o
caso de um mediador humano envolvido no
ciclo celular.
• Como vemos na imagem, o mediador não
interage com o DNA.
• Existem portanto uma panóplias de proteínas
que vão ser determinantes na velocidade e no padrão de transcrição dos genes das células.
• Existem também modificações na conformação do DNA, nomeadamente a nível da cromatina, que influencia a
expressão (eucromatina – DNA descondensado – transcrição / heterocromatina – DNA condensado – não há
expressão).

MECANISMOS QUE PERMITEM QUE OS FATORES DE TRANSCRIÇÃO TENHAM ACESSO ÀS SUAS SEQUÊNCIAS ESPECÍFICAS

• A Epigenética é usada para descrever diferentes fenótipos que não são explicados pela alteração da sequências das
bases, ou seja, há mais qualquer coisa que está a influenciar a expressão génica.
• Há um estado de condensação e descondensação da cromatina que é herdado.
• Esta regulação epigenética, que vai influenciar a expressão génica nomeadamente durante o desenvolvimento e
proliferação celular, está diretamente relacionada com modificações que ocorrem a nível da cromatina.
• Por exemplo, nesta imagem vemos o gene que codifica
a globina. Nos eritroblastos (células que vão dar origem
aos glóbulos vermelhos) a cromatina encontra-se
descondensada, logo vai haver expressão deste gene.
• Por outro lado, nas células estaminais mesenquimais,
este gene encontra-se completamente
heterocromatizado, não havendo expressão.

Página 47 de 109
• O facto de a cromatina estar ou não condensada deve-se a modificações no DNA que ocorrem devido a enzimas
muito específicas:
o DNA metiltransferases (Dnmt): como o próprio nome indica, vão transferir grupos metilo (CH 3) para o DNA.
Tipicamente vão metilar as ilhas CpG.
o Acetiltransferases de histonas (HATs): vão transferir o grupo acetil para determinados aminoácidos das
histonas (frequentemente as lisinas).
o Desacetilases de histonas (HDACs): vão remover o grupo acetil de um aminoácido das histonas.
o Metiltransferase de histonas (HMT): vão transferir grupos metilo para aminoácidos das histonas.
• Uma das principais modificações químicas envolvidas na cromatina é a acetilação, nomeadamente de lisinas, das
histonas. As lisinas como têm carga positiva interagem com o DNA, que tem carga negativa, o que contribui para a
condensação da cromatina. Quando a lisina é acetilada, deixa de haver esta interação com o DNA, o que contribui
para a descondensação da cromatina. Deste modo, a desacetilação irá contribuir para a condensação da cromatina.

CÓDIGO DE HISTONAS

• Quando se começou a perceber que estas modificações químicas das histona tinham um papel importante na
eucromatização e na heterocromatização e portanto, na expressão génica, pensou-se que provavelmente também
existe um código de histonas.
• Verificou-se que existia uma constância do tipo de modificações que pode ocorrer nas diferentes histonas. Isto não
quer dizer que uma lisina que seja frequentemente acetilada não possa ser metilada, por exemplo, contudo,
verificou-se que existem de facto modificações preferenciais.

Página 48 de 109
• Dentro destas modificações existem duas que já estão tipicamente definidas: H3K9me3 e H3K27me3 (Na histona
H3, a lisina 9 e a lisina 27 quando estão trimetiladas leva à inativação daquela região - heterocromatização).
• Também se sabe que as modificações H3K4me3, H3K9ac, H3K14ac, H3K18ac, H3K27 estão envolvidas na
eucromatização, ou seja, criam um estado de descondensação do DNA, havendo expressão génica.
• Este código de histonas permite controlar a condensação da cromatina e a sua capacidade de transcrever, replicar
e reparar.

METILAÇÕES DAS ILHAS CpG

• Estas ilhas estão localizadas próximas da região +1, e frequentemente presentes em genes housekeeping (genes
essenciais à sobrevivência da célula).
• Quando as citosinas não estão metiladas, o DNA está livre de nucleossomas, ou seja, está descondensado
(eucromatizado) e está a ser transcrito. Quando as citosinas estão metiladas, há uma heterocromatização, o DNA
está condensado e não há transcrição.
• Esta regulação da expressão génica verifica-se sobretudo em vertebrados.
• A teoria mais aceite para explicar o porquê de isto acontecer é de que as metilações todas que ocorrem nestas ilhas
são uma forma de recrutamento de fatores que vão reprimir a expressão, como os complexos de desacetilação.

COMPLEXOS REMODELADORES DA CROMATINA (CRC)

• Estes complexos são capazes de heterocromatizar e de eucromatizar.


• Estes complexos são importantes para o controlo da transcrição, para replicação e reparo de DNA, e para a
recombinação.

Página 49 de 109
• Ocasionalmente pode haver repressão de um
gene, por existir competição entre um
ativador e repressor. Como vemos na imagem
ao lado, o repressor ao ligar-se impede que o
ativador se ligue. O contrário também
acontecer, ou seja, o ativador ao ligar-se
impede que o repressor se ligue.
• Por outro lado, pode também acontecer
termos dois fatores ligados a uma região (ativador e repressor), e como estão suficientemente perto, interagem
entre si. Esta interação “mascara” o local, impedindo que o ativador ajude a RNA polimerase a estabelecer as suas
ligações com o promotor, reprimindo a expressão do gene.
• No fundo, para haver transcrição nos eucariotas, tem que haver uma ação concertada de uma série de fatores.
• Contudo, denote-se que a ordem por qual estes fatores ocorrem não tem de ser necessariamente: o ativador liga-
se – a cromatina descondensa – Ligação de proteínas adicionais ligam-se (por ex GTF) – Ligação a zonas regulatórias
enhancers – Ligação ao promotor – Transcrição.

CLASSES DE RNA

• Cerca de 80 a 90% do RNA procariota e eucariota é


RNA ribossomal, e cerca de 15% é RNA de
transferência. Depois, restam cerca de 4%, que
corresponde ao RNA codificante. Nos eucariotas
existem também snRNA e snoRNA.
• A maior parte dos RNA é não codificante, contudo, a
maior parte dos RNAs não codificantes têm função.
• RNA mensageiro (mRNA): tem como função
armazenar a informação genética contida nos genes,
e transportá-la para o citoplasma, onde é traduzido
em proteína. É sintetizado a partir do DNA no núcleo,
pelo processo de transcrição, como um precursor do mRNA chamado pré-mRNA. Este precursor é processado de
modo a formar um mRNA funcional. O pré-mRNA pode ser designado também por transcrito primário ou RNA
nuclear heterogéneo (hnRNA), sendo este último um estado intermédio entre o pré-mRNA e o mRNA.
• RNA de transferência (tRNA): é sintetizado e processado no núcleo. Tem como função transferir um aminoácido
específico para a cadeia polipeptídica da proteína que está a ser sintetizada.
• RNA ribossómico (rRNA): é um componente estrutural do ribossoma, componente principal na síntese proteica ou
tradução. A função do rRNA é descodificar e transferir a informação contida no mRNA para aminoácidos.
• Pequenos RNA nucleares (snRNA): encontram-se no núcleo das células eucariotas e possuem uma função no
processamento de mRNA, por exemplo, no splicing. Os snRNA encontram-se sempre associados a proteínas e os
complexos assim formados denominam-se snRNP (small nuclear ribonucleoproteins).

Página 50 de 109
• Pequenos RNA nucleolares (snoRNA): encontram-se no nucléolo e corpos de Cajal, e têm uma função na biossíntese
e modificação de rRNA;
• Os RNA reguladores: incluem os micro-RNA (miRNA), os siRNA (short interfering RNA) e os RNA não codificantes
(lncRNA). Existem muitos RNA não codificantes nas células que regulam a expressão génica, sendo a classe dos
miRNA a mais conhecida. A função dos miRNA é de silenciamento genético, através da degradação do mRNA ou por
inibição da sua tradução.

RNA DE TRANSFERÊNCIA (tRNA)

• O RNA de transferência tem como função transferir um aminoácido específico para a cadeia polipeptídica da
proteína que está a ser sintetizada, que se encontra ligado covalentemente à sua extremidade 3’, para a cadeia
polipeptídica da proteína que está a ser sintetizada durante a tradução.
• O tRNA tem uma estrutura secundária muito característica, em forma de trevo, e contém três bases designadas
anticodão, que emparelham com o codão correspondente no mRNA.
• O tRNA contém cerca de 80 nucleótidos (alguns nucleótidos são modificados quimicamente, frequentemente por
metilação, e são chamadas de bases raras).

• Por cada aminoácido existe uma enzima – a aminoacil-tRNA-sintetase(aaRS). Para os 20 aminoácidos standard
existem 20 enzimas aaRS diferentes.
• Estas enzimas são responsáveis por fazer a correspondência do aminoácido ao respetivo tRNA. Aos tRNAs que são
reconhecidos pela mesma enzima, dizem-se isoaceitadores.
• No genoma de E. coli existem 4 moléculas de tRNAs diferentes que fazem parte de um operão que possui
informação para genes estruturais. O que acontece, é que após o transcrito ser formado vai haver um
processamento, mais precisamente uma
clivagem, para que as moléculas clivadas se
organizem e formem os tRNAs.
• Os genes que codificam os tRNAs podem estar
inseridos no mesmo transcrito do de genes que
codificam o rRNA.

Página 51 de 109
• Estes tRNAs e rRNAs não vão ser traduzidos, vão é ser processados (vão sofrer clivagens endonucleolíticas), para
que depois se originem as moléculsa de tRNAs rRNAs funcionais. Estas moléculas funcionais vão ser pós-
transcricionalmente processadas a partir de moléculas mais longas.
• O conteúdo dos genes de cada tRNA varia muito entre espécies, quer em número, quer em distribuição.
• Nas bactérias podemos ter uma única cópia, ou várias cópias dos genes que levam à síntese de tRNAs, já nos
eucariotas estão frequentemente presentes várias cópias desses genes.
• O número de cópias dos genes dos tRNAs está relacionado com o codon usage de cada espécie.
• Como sabemos, existem 20 aminoácidos para 61 codões. O código genético é degenerado (ou redundante), ou seja,
temos mais do que um codão para o mesmo aminoácido.
• Inicialmente pensou-se que existiriam 61 tRNAs diferentes para cada um destes codões. Contudo, o que acontece
é que nas diferentes espécies, os codões podem ser preferenciais, por exemplo, em E. coli apenas 3% dos codões
que codificam a leucina são CUA (sendo 55% o codão CUG). Como estes codões preferenciais variam entre espécies,
chamou-se a este “código” codon usage, podendo não estar presentes os 61 tRNAs diferentes.
• Percebeu-se também que o codão preferencial está diretamente relacionado com o número de tRNAs disponíveis
na célula. (No caso de E. coli, o codão CUG existe em maior quantidade no seu genoma).

• Outro conceito importante é o da posição wobble.


• O que se percebeu foi que a base em 5’ do anti-codão pode ter um
emparelhamento não canónico, ou seja, tem uma certa
maleabilidade de emparelhamento (por exemplo ligar-se quer a
uma citosina, quer a um uracilo). Isto tem a ver com a constituição
do “braço” do anti-codão.
• Isto permite que nós não necessitemos de ter todos os tRNAs, porque havendo wobble, há sempre a possibilidade
de um anti-codão poder emparelhar com mais do que um codão.
• Este emparelhamento não canónico pode trazer problemas à célula. Por exemplo,
o anti-codão UAU, pode emparelhar com os codões AUG e AUA que codificam
coisas diferentes, o que é por um lado, uma desvantagem.

Página 52 de 109
• Nos eucariotas o tRNA é sintetizado e processado no núcleo, mas a incorporação de um aminoácido na extremidade
3’ ocorre no citoplasma.

RNA RIBOSSÓMICO (rRNA)

• O rRNA é um componente estrutural do ribossoma, componente principal na síntese proteica ou tradução. A função
do rRNA é descodificar e transferir a informação contida no mRNA para aminoácidos, interagindo com regiões do
mRNA e do tRNA.
• Os ribossomas dos procariotas
constituem uma ribonucleoproteína
(RNP) de 70S, que está dividida em
duas subunidades: uma pequena de
30S, onde está localizado o rRNA de
16S, acompanhado de cerca de 21
proteínas, e na grande subunidade
de 50S, onde se localizam os rRNA de
5S e de 23S, acompanhado de cerca
de 31 proteínas.
• Nos eucariotas, a pequena subunidade é formada por uma molécula de rRNA de 18S, rodeada por cerca de 30
proteínas diferentes, constituindo uma RNP de 40S. A grande subunidade ribossómica é uma RNP de 60S. É formada
por três moléculas de rRNA: uma de rRNA de 28S, outra de rRNA de 5,8S e ainda uma de rRNA de 5S, e por cerca
de 50 proteínas diferentes.
• Os rRNAs são processados do ponto de vista químico, sofrendo modificações químicas para se tornarem funcionais
(clivagens endonucleolíticas).
• Como vimos anteriormente, cerca de 80% do RNA é ribossomal. Em E. coli existem 7 operões de rRNA, ou seja,
existem 7 locais dispersos que codificam rRNAs. Então, como é que é possível que 80% do RNA seja ribossomal?
Deve-se ao facto do promotor destes operões ser muito forte, ou seja, tem muita afinidade com a RNA polimerase.
• Nos eucariotas, os genes dos rRNAs estão organizados em unidades transcricionais em tandem, ou seja, várias
cópias que se repetem consecutivamente.
Posteriormente são processados (sofrem clivagens
endonucleolíticas) e depois vão ser modificados
quimicamente.
• Estas modificações químicas ocorrem a nível do
nucléolo com o auxílio de snoRNAs (pequenos RNA
nucleolares). Estes snoRNAs vão marcar as regiões
que vão ser modificadas (metiladas) no rRNA.
• Os rRNAs para serem funcionais não basta serem
clivados, precisam de sofrer também estas
modificações.

Página 53 de 109
RNA MENSAGEIRO

• O mRNA tem como função armazenar a informação genética contida nos genes, e transportá-la para o citoplasma,
onde é traduzido em proteína. É sintetizado a partir do DNA no núcleo, pelo processo de transcrição, como um
precursor do mRNA chamado pré-mRNA. Este precursor é processado de modo a formar um mRNA funcional. O
pré-mRNA pode ser designado também por transcrito primário ou RNA nuclear heterogéneo (hnRNA), sendo este
último um estado intermédio entre o pré-mRNA e o mRNA.
• Um aspeto importante da expressão génica é a estabilidade do mRNA citoplasmático, ou seja, a sua modulação. Se
ele for muito estável, há a possibilidade de haver constantemente tradução.
• O que determina se o mRNA é estável ou não é uma série de determinantes que estão associados a características
do próprio RNA mensageiro.
• Os mRNAs citoplasmáticos sofrem uma regulação subcelular.
• Os determinantes da degradação do mRNA são:
o A sua própria sequência nucleotídica (que vão ser mais ou menos sujeitas aos cortes das RNases – enzimas
que vão clivar o mRNA). Frequentemente são cortes endonucleolíticos, ou seja, cortam dentro da molécula
de mRNA.
o As estruturas que o RNA forma (algumas estruturas são substrato para a clivagem destas enzimas).
o Os ribossomas (Os ribossomas ao ligarem-se ao mRNA vão impedir que as enzimas se liguem ao RNA).
o Proteínas de ligação ao RNA (as proteínas associadas ao RNA impedem também que estas enzimas se
liguem).
o sRNAs (miRNAs/siRNAs) e lnRNAs (o próprio RNA pode estar sujeito a um mecanismo de degradação
endógeno).
• A degradação do mRNA em bactérias ocorre primeiramente por
endonucleases, ou seja, clivagens que ocorrem dentro da molécula de
RNA. Mas para a degradação global do RNA é preciso também haver cortes
exonucleolíticos pelas exonucleases que degradam no sentido 3’- 5’.
• As exonucleases muitas vezes não têm capacidade de degradar estruturas
secundárias da molécula de RNA, é quase uma “barreira”. Quando isto
acontece, a PNPase (que existe só em procariotas) adiciona uma curta
cauda de poli-(A), e desta forma consegue clivar o mRNA (tem as duas
atividades). Já a RNase só tem a capacidade de adicionar a cauda poli(A),
não conseguindo degradar a estrutura secundária. Então, tem de haver
uma clivagem após a estrutura secundária, e os fragmentos resultantes
dessas clivagens pelas exonucleases são demasiado pequenos, sendo
posteriormente degradados pelas oligoribonucleases.
• No fundo, há uma ação conjunta de endoribonucleases e
exoribonucleases (que apenas funcionam no sentido 3’-5’).
• Este é o modelo mais aceite atualmente.

Página 54 de 109
• A degradação do mRNA em eucariotas é mais complexa. Estão envolvidas exonucleases (quer de 3’-5’, quer 5’-3’),
endonucleases, desadenilases (enzimas que vão retirar caudas poli-(A)), e enzimas decapping (vão remover o cap).
• Existem três mecanismos fundamentais:
o Remoção do cap: inicialmente uma enzima (DCP1) vai remover o cap, e o mRNA sem este cap já pode ser
degradado por uma exonuclease 5’-3’.
o Remoção da cauda poli-A: como a cauda poli(A) confere estabilidade à molécula de mRNA, inicialmente
para degradarmos a molécula temos de a remover. A enzima (PARN ou DAN) vai desadenilar. Após a
remoção das adeninas, pode acontecer um decapping (remoção do cap), ou a participação de um exossoma
(conjunto de várias proteínas que vão degradar a molécula de 3’-5’. Estes exossomas podem existir também
no núcleo/nucléolo para degradarem molécula de mRNA que não foram corretamente sintetizadas.
o Mediado por uma RNAi: mecanismos da célula que vão conduzir à degradação dos mRNAs,
independentemente dos determinantes que o mRNA já tenha.

• Para além destes mecanismos pode existir um outro chamado nonsense mediate RNA. Sabe-se que hoje em dia ele
está na origem de várias doenças. Por vezes ocorre formação de codões STOP prematuros (PTC), ou seja, a proteína
fica mais pequena do que era suposto (proteína truncada) e não irá cumprir a função que deveria ter. Estes mRNAs
podem derivar de erros de síntese ou de processamento, ou de mutações.
• A célula distingue um sinal de terminação prematuro de um verdadeiro sinal de terminação quando o codão de
terminação se encontra a montante de uma junção exão-exão, ou quando existe um intrão a seguir a este codão.
Codões de terminação verdadeiros estão localizados
PTC
tipicamente no último exão do mRNA, não existindo
nenhum intrão a seguir.
EJC
• Após ocorrer splicing, os intrões deixam uma “marca”, o
EJC (representado a laranja) que é um complexo proteico
de junção exão-exão. O EJC é reconhecido pela
maquinaria de transcrição numa primeira volta de
tradução pioneira que serve para verificar se o mRNA está
normal para que possa ser traduzido numa proteína
funcional.

Página 55 de 109
• Em mRNA com mutações nonsense, o ribossoma pára no codão prematuro de terminação e converte-se num
complexo de vigilância. Para haver degradação, o EJC vai interagir com outros fatores (eRF), causando uma
fosforilação, que é o suficiente para despoletar a degradação do RNA mensageiro.
• Este processo de NMD (mecanismo de decaimento do mRNA mediado por mutações nonsense) destrói mRNAs que
contenham codões de terminação prematuros. O NMD vai assim impedir a síntese de proteínas que resultariam
truncadas.
• Estima-se que cerca de 30% de doenças genéticas humanas resultam de mutações que geram codões STOP
prematuros.

EDIÇÃO DE RNA

• Um dos princípios da biologia molecular era que a sequência do mRNA representava, exatamente, a informação
genética que se encontrava codificada no DNA. No entanto, a informação genética contida numa molécula de mRNA
em eucariotas pode ser alterada, quer por splicing ou poliadenilação alternativos, quer por um mecanismo
denominado de edição do RNA, onde a sequência da proteína traduzida é diferente da que está codificada no seu
gene.
• Este mecanismo consiste na modificação da sequência nucleotídica do RNA, de modo a alterar a informação
genética em relação ao DNA que a codifica. Verificou-se este tipo de mecanismos em mitocôndrias, cloroplastos e
em alguns mRNAs nucleares em eucariotas superiores.
• Os mecanismos de edição de RNA podem consistir em:
o Inserção ou remoção de uracilos através de um RNA guia (gRNA), que emparelha com o mRNA e define a
região a editar. As regiões não emparelhadas do gRNA (adenosinas) servem como molde para a inserção
de uridinas2 no mRNA, catalisada por um complexo enzimático, o editossoma, contendo uma
endoribonuclease, uma terminal uridiltransferase (TUTase) e uma RNA ligase. Este tipo de edição ocorre
em mitocôndrias de tripanossomas;

2
molécula formada quando um uracilo é ligado a um anel de ribose (também conhecido como ribofuranose) por uma ligação β-N1-
glicosídica, formando um nucleosídeo.

Página 56 de 109
o Substituição de citidina para uridina (C-U) e adenosina para inosina3 (A-I) por deaminação (remoção do
grupo amina pelas enzimas ADARs – adenosine deaminase acting on RNA), respetivamente, pela citidina
desaminase e adenosina desaminase, que ocorrem no núcleo de mamíferos.
▪ Um exemplo é o caso do mRNA da apo-
lipoproteína B (Apo-B) que no intestino sofre
uma edição de C para U, alterando o codão
CAA (que codifica a glutamina) para o codão
stop UAA e, deste modo, produz uma proteína
mais pequena (Apo-B48) que aquela que é
produzida no fígado (Apo-B100).
• Este mecanismo aumenta o número de proteínas diferentes
disponíveis no organismo, sem aumentar o número de genes
existentes no genoma.
• Este mecanismo afeta o splicing alternativo, e protege a molécula de ser destruída pelo RNA de interferência.

RNAS NÃO CODIFICANTES MAS FUNCIONAIS (ncRNA)

• Pequenos RNA nucleolares (snoRNA): encontram-se no nucléolo e corpos de Cajal, e têm uma função na biossíntese
e modificação de rRNA;
• Pequenos RNA nucleares (snRNA): encontram-se no núcleo das células eucariotas e possuem uma função no
processamento de mRNA, por exemplo, no splicing. Os snRNA encontram-se sempre associados a proteínas e os
complexos assim formados denominam-se snRNP (small nuclear ribonucleoproteins).
• Os RNA reguladores que incluem os micro-RNA (miRNA), os siRNA (short interfering RNA) e os lncRNAs.

RNA DE INTERFERÊNCIA (RNAi)

• Existem dois tipos de precursores de RNAi: o miRNA e o siRNA.


• Os miRNA:
o São pequenos RNA de 20 a 30 nucleótidos, com cadeia dupla, com uma estrutura secundária em forma de
gancho, cuja função é o silenciamento genético, através da degradação do mRNA ou por inibição da sua
tradução.
o Pode existir mismatches (emparelhamento incorreto das bases).
o Os genes que codificam o miRNA encontram-se localizados no genoma e contêm o seu próprio promotor.
• Os siRNA:
o São também pequenas moléculas de RNA de cadeia dupla com origem exógena (normalmente viral),
podendo também ser endógeno.
o O emparelhamento das bases é perfeito.

• 3 Base rara semelhante à guanina. A inosina é um nucleosídeo formado pela desaminação da adenosina pela ação da adenosina
desaminase (ADA). A adenosina e a inosina possuem grande semelhança química, tendo como diferença um grupamento amina.

Página 57 de 109
MICRORNA – miRNA

• Os miRNA são transcritos pela RNA polimerase II num


transcrito primário (pri-miRNA).
• Embora haja várias vias de produção de miRNA maduros, a
que se conhece melhor é a via dependente de Drosha.
• Ainda no núcleo, a estrutura em gancho contida no pri-
miRNA é clivada por um complexo chamado
microprocessor, cujos componentes principais são a Drosha,
uma endorribonuclease, e uma proteína de ligação a RNA de
dupla cadeia (dsRNA), designada por Pasha.
• A Drosha processa o pri-miRNA em pré-miRNA, definindo os
terminais 5’ e 3’ com um grupo fosfato e dois nucleótidos
desemparelhados respetivamente.
• O pré-miRNA é exportado para o citoplasma, onde é clivado
por outra endorribonuclease, a Dicer, produzindo um
miRNA maturo de 20 a 30 nucleótidos, de dupla cadeia com
uma estrutura característica em forma de gancho.
• Este miRNA de dupla cadeia vai ser incorporado num
complexo, o RISC (complexo silenciador induzido por RNA),
e apenas uma das cadeias de miRNA é que vai servir como
silenciador.
• Este processo acontece quer para RNAs de interferências endógenos e exógenos.
• Posteriormente, por complementaridade (parcial ou total) vão ligar-se a um mRNA alvo, que vai ser degradado por
este complexo RISC.
• Os miRNA e os siRNA ligam-se mais frequentemente à região 3’ UTR por ser uma região mais disponível (se houver
complementaridade).

lncRNA (longos RNAs não codificantes)

• O lncRNA é um RNA envolvido na regulação e


possui mais de 200 nucleótidos.
• Os genes que codificam o lncRNA podem estar
localizados no espaço intergénico, pode estar
dentro de um intrão, e pode ser transcrito na
direção antisense (com sobreposição ao gene)
ou bidirecional (não se sobrepõem ao gene).
• Os lncRNA podem ligar-se aos fatores transcricionais e impedir que estes se liguem a montante dos genes (no
enhancer), impedindo assim que sejam transcritos.

Página 58 de 109
• Por outro lado, eles podem também funcionar como “esponjas” dos mi-RNA. Desta forma, os lncRNA impedem a
ação dos mi-RNA.
• Os lncRNA podem ainda conduzir a molécula de mRNA à degradação, modular o splicing e inibir a tradução.
• Por fim, os lncRNA tem ainda a capacidade de se associarem a modificadores da cromatina e desta forma
influenciarem a expressão génica.
o Ex: um dos cromossomas X nas fêmeas está inativado, ou seja, não vai expressar os genes que contem. Ele
é inativado porque estes lncRNA vão ligar-se ao longo de todo o cromossoma X, inibindo a expressão génica.

RNAs REGULADORES EM PROCARIOTAS

• sRNA ou sncRNA (small non-coding RNA)


o Nas bactérias podemos ter cis-acting antisense
RNAs que se vão ligar por complementaridade ao
mRNA. Ao ligarem-se vão formar uma cadeia
dupla, que vai ser clivada pela RNAse, impedindo
que haja expressão.
o Por outro lado, podem existir moléculas de RNA
que foram codificadas por outro gene, ou por
outras regiões e que não são completamente
complementares, mas vão emparelhar numa região onde está o início da ligação do ribossoma (SD – Shine-
Dalgarmo). Desta forma, o ribossoma não vai conseguir ligar-se ao SD, impedindo assim a expressão génica.
o Os sRNA podem também sequestrar subunidades (ligar-se a elas), por exemplo a subunidade σ70
(responsável por transcrever a grande maioria dos genes de E. coli), impedindo a transcrição dos genes.
• CRISPRs

Página 59 de 109
RIBOSWITCHES

• Os riboswitches estão presentes em bactérias,


mas também já foram encontrados em
eucariotas (plantas, algas verdes).
• Riboswitches são regiões de mRNA que adotam
estruturas secundárias e terciárias bem
definidas, e que mediante a ligação a um
ligando, alteram a conformação da molécula de
mRNA, podendo-se ativar ou reprimir a
expressão génica (quer a nível da transcrição,
do splicing e da tradução).
• Trans regulation – Quando a uma molécula de RNA se liga um ligando, e vai atuar noutra molécula.

TRADUÇÃO

• A tradução refere-se ao último passo da expressão génica: a formação de uma proteína a partir da descodificação
da informação contida numa molécula de RNA mensageiro (mRNA). Assim, uma sequência de nucleótidos é
traduzida numa sequência de aminoácidos.
• Esta descodificação é feita de 3 em 3 nucleótidos (tripletos), codão a codão, gerando uma proteína, existindo uma
colinearidade, ou seja, se o primeiro codão codifica a metionina e o segundo codifica a leucina, esta vai ser
necessariamente a ordem dos aminoácidos na proteína.
• Caso aconteça a síntese de um aminoácido diferente do que aquele que está codificado no genoma, isto poderá
dever-se ao mecanismo de wooble, ou a um RNA editing.
• O código genético é redundante ou degenerado, ou seja, temos mais do que um codão para o mesmo aminoácido.
A metionina e o triptofano são os únicos aminoácidos que são sintetizados a partir de um único codão.
• A tradução do mRNA começa quase sempre no codão AUG, que codifica o aminoácido metionina. Os codões UGA,
UAG e UAA não codificam aminoácidos, antes significam a terminação da tradução e são conhecidos como codões
STOP.
• Existem algumas exceções como por exemplo a bactéria Mycoplasma capricolum, em que o codão UGA não é um
codão STOP, mas sim um codão que codifica o triptofano, ou seja, não se pode dizer que o código genético é
universal.
• Durante o processo da tradução, estão envolvidas três moléculas de RNA: o mRNA, o tRNA e o rRNA.
• O ribossoma vai avançando ao longo da molécula de RNA de 5’-3’.
• A função dos tRNA é a de relacionar uma sequência de nucleótidos com um aminoácido. Para traduzir a mensagem
do mRNA numa sequência proteica, o tRNA funciona como um adaptador. A sua extremidade 3’ tem a capacidade
de ligar um resíduo de aminoácido. Outra região importante do tRNA possui uma sequência de três bases (o
anticodão) correspondentes a esse aminoácido, isto é, as bases de um codão do mRNA que codifica aquele
aminoácido.
• O processo da síntese de proteínas consiste numa série de reações consecutivas, divididas em 3 passos principais:

Página 60 de 109
o Ligação de um novo tRNA associado a um
resíduo de aminoácido ao ribossoma.
o Estabelecimento de uma ligação peptídica pela
peptidil transferase entre um COOH de um
aminoácido com o NH2 do outro aminoácido.
▪ Nota: Quando o aminoácido se liga ao
aminoácido anterior dissocia-se do
tRNA. Esta ligação peptídica ocorre
devido à ação do RNA ribossomal da
subunidade maior (23S nos
procariotas, e 28S nos eucariotas), ou
seja é mediada pela molécula de RNA. Estas moléculas de RNA designam-se por ribozimas
(moléculas de RNA com atividade enzimática).
o Movimento do ribossoma em relação ao mRNA
para descodificar o codão seguinte.
• Um ribossoma tem 3 locais de ligação de tRNA localizadas
na subunidade menor:
o O local A (aminoacil-tRNA): onde entra o tRNA
com o aminoácido;
o O local P (peptidil-tRNA): onde se estabelece a
ligação peptídica;
o O local E (exit): por onde sai o tRNA já sem o
aminoácido.
• Os ribossomas vão ligar-se, por maior ou menor afinidade na extremidade 3’ deste rRNA altamente estruturado, a
uma sequência consenso no mRNA (também chamada Shine-Dalgarmo). Esta sequência consenso encontra-se
entre 5 e 11 nucleótidos antes do codão de iniciação AUG. Esta região consenso é rica em G e A, e não é exatamente
igual nos vários genes, o que irá fazer com tenha menor ou maior afinidade com o ribossoma, e consequentemente,
menor ou maior expressão génica.
• Denote-se que o tRNA que leva a metionina no codão de iniciação não é igual aos outros tRNAs que levam a
metionina, ele tem algumas variações.
• Hoje em dia sabe-se também que para além do codão de iniciação AUG, existem outros codões que podem iniciar
a tradução (AUG 50%; GUG 10%; UUG 1%).
• Nos operões dos procariotas, é possível sintetizar proteínas independentes a partir de um mesmo operão, porque
os sinais de início e fim de tradução e o local de ligação do ribossoma (RBS) são independentes.
• Nos procariotas, a transcrição e a tradução ocorrem simultaneamente, uma vez que não existe compartimentação
celular.
• Os ribossomas são organizados em polissomas ou polirribossomas.

Página 61 de 109
OPEN READING FRAME

• Chama-se open reading frame (grelha de leitura aberta) a cada uma das sequências de DNA compreendida entre
um codão de início (ATG) da tradução e um codão de terminação, excetuando-se os intrões. Esta leitura é feita de
3 em 3 (cada 3 nucleótidos corresponderá a um codão). Vejamos o seguinte exemplo:
• Na primeira grelha de leitura, a cadeia de DNA
vai codificar aminoácidos específicos,
formando um polipéptido específico.
• Na grelha de leitura 2, vemos que ocorre uma
mutação (o nucleótido G não existe). Isto vai
fazer com que os aminoácidos sintetizados
sejam outros. O mesmo acontece na grelha de
leitura 3.
• Caso ocorra uma mutação que elimine os três
nucleótidos (GCU), os aminoácidos a serem sintetizados serão os mesmo, com a exceção do aminoácido que é
sintetizado por este codão, que não irá existir. Nestes casos, o dano
pode ser menor.

ETAPAS DA TRADUÇÃO

• Aminoacilação (tRNA charging) – ligação do aminoácido ao tRNA


(ligação covalente). Esta ligação é catalisada por enzimas
denominados aminoacil-tRNA sintetases.
• Iniciação - A tradução do mRNA começa quase sempre no codão
AUG, que codifica o aminoácido metionina. É utilizado um tRNA
iniciador especial, transportando metionina, que tem uma sequência
diferente do tRNA “normal” da metionina (formilmetionina em
bactérias).
• Elongação – síntese da cadeia polipeptídica;
• Terminação - Quando um codão STOP ocupa o local A do ribossoma,
proteínas especiais chamadas fatores de terminação (RF)
reconhecem e ligam o ribossoma, causando a terminação da
transcrição.

Página 62 de 109
• A iniciação da tradução em bactérias requer vários fatores de iniciação e energia (GTP).

TRADUÇÃO EM EUCARIOTAS

• Nas células eucariotas, a tradução inicia-se pela incorporação de metionina correspondente ao codão AUG, que
participa na formação de um complexo. Denote-se que nos eucariotas não existe nenhuma região específica de
ligação ao ribossoma (RBS).
• A identificação do codão de iniciação é feita por “varrimento” do mRNA desde a sua extremidade 5’ até que o
ribossoma encontre o primeiro codão AUG.
• Várias evidências experimentais sugerem que a seleção do codão de iniciação é mediada pela interação entre a
subunidade 40S e o fator eIF-4F associado à estrutura cap na
extremidade 5’ do mRNA, de modo que o primeiro AUG é
posicionado no local P para o início da síntese polipeptídica.
• Este processo é facilitado pela ação de outros fatores de iniciação,
tais como os eIF-4A e eIF-4B (com atividade helicásica).
• Para o início da tradução é necessário que a cauda poli(A) seja ligada
pelas PABP (poly-A-binding-proteins) a fatores de iniciação que
estão ligados a proteínas de ligação do 5’cap. Desta forma, tem se a
certeza que ambas as extremidades (cap e cauda poli-A) estão
intactas antes de se iniciar a tradução.
• Assim, a estrutura circular do mRNA aumenta a eficiência da
tradução.

• A elongação e a terminação têm mecanismos muito semelhantes quer em eucariotas, quer em procariotas.
• A maior parte dos mRNAs eucariotas são traduzidos por um mecanismo dependente de cap, que requer uma série
de fatores de iniciação que só irão desempenhar a sua função na presença da região 5’ cap e da cauda poli-A.
• Existe uma sequência consenso, denominada sequência Kozak,(ACCAUGG) que circunda o codão de iniciação AUG.
Nota: não é a mesma coisa que a sequência SD, uma vez que o ribossoma não se vai ligar diretamente a ela neste
caso.

Página 63 de 109
• Existem também eucariotas que são traduzidos por um mecanismo dependente de IRES (Internal Ribosome Entry
Sites). Há genes que no seu mRNA formam estruturas secundárias às quais se vão ligar o fator eIF-4G modificado.
Isto permite que a tradução se inicie a partir desta sequência IRES, uma vez que é esta a região onde o ribossoma
vai interagir. Apesar deste mecanismo ter sido descoberto nos vírus, a própria célula também pode traduzir algum
dos seus genes a partir deste mecanismo. Na mitose, o eIF-4E é desfosforilado, deixa de estar funcional e muitos
dos genes envolvidos na mitose vão ser traduzidos a partir destas sequências IRES. Também se verificou que genes
envolvidos na apoptose são traduzidos por este mecanismo.

TRADUÇÃO EM PROCARIOTAS

• Nos procariotas, verifica-se que o primeiro aminoácido a ser incorporado é a forma formilada da metionina
(formilmetionina). A seleção do código AUG que inicia a tradução é feita pela presença de características adicionais
na região 5’ do mRNA. O início da tradução está dependente do emparelhamento de bases entre a sequência
específica de mRNA (Shine-Dalgarno) e do rRNA 16S, que permite ao ribossoma encontrar o codão AUG (ao ligar-
se à região RBS) responsável pelo início da tradução.
• A elongação e a terminação têm mecanismos muito semelhantes quer em eucariotas, quer em procariotas.

REGULAÇÃO DA EXPRESSÃO GÉNICA A NÍVEL DA TRADUÇÃO

• A eficiência da tradução é influenciada pela maior ou menor afinidade dos ribossomas às regiões RBS.
• Nos procariotas, uma quantidade maior de uma proteína em relação a outras cujos genes estão localizados no
mesmo operão, pode ser explicado pelo facto da transcrição e a tradução ocorrerem simultaneamente. A proteína
que é codificada pelo gene que se encontra mais a 5’ vai ser logo traduzida, podendo aparecer em maior
quantidade. Contudo, a afinidade com a região RBS tem também muita influência, uma vez que se este gene mais
a 5’ tiver uma afinidade fraca, pode não aparecer em maior quantidade.

Página 64 de 109
• A polaridade dos genes deve-se à sua localização (se
está mais a 5’ ou a 3’).
• O codon usage também influencia a eficiência da
tradução. Por exemplo, em E. coli o codão AGA só existe
em 1%, logo, não vai haver tantos tRNAs disponíveis. Se
eu tiver um gene de E. coli com essa sequência, a
tradução é mais lenta (menos eficiente).
• A nível dos eucariotas, a extremidade 5’ UTR e a extremidade 3’ UTR tem muita influência na regulação da tradução.
Um exemplo clássico é o do recetor da transferrina e a ferritina. A ferritina é uma proteína que vai complexar o
ferro, ou seja, disponibiliza o ferro consoante a necessidade da célula. A transferrina é uma proteína de membrana
responsável pela entrada de ferro para dentro da célula.
o Na região 5’ UTR do mRNA que codifica a ferritina, existe uma sequência que gera uma estrutura secundária
à qual se liga a proteína IRE-BP (iron response elemento – binding protein).
o No mRNA da transferrina, existe também uma estrutura secundária à qual se liga também esta proteína
IRE-BP, mas na região 3’ UTR.
o O efeito da ligação desta proteína é diferente nas duas regiões.
▪ Na ausência de ferro, a proteína IRE-BP mantem-se ligada à estrutura secundária do mRNA. Na
região 5’ UTR, a presença desta proteína vai impedir a tradução, e portanto, não há produção de
ferritina. Isto faz sentido, uma vez que se não há ferro não há necessidade de eu produzir ferritina
para complexar o ferro. A ligação desta proteína na região 3’ UTR tem um efeito diferente, o de
estabilizar o mRNA, permitindo assim que haja tradução de transferrina para transportar o ferro
para dentro da célula.
▪ Na presença de ferro, o ferro liga-se à proteína IRE-BP, levando esta a dissociar-se. Ao dissociar-se
da região 5’ UTR vai permitir que haja tradução de ferritina. Por outro lado, ao dissociar-se na região
3’ UTR vai destabilizar o mRNA, não havendo tradução de transferrina.

Página 65 de 109
• Alguns vírus podem fazer frameshifting na sua leitura. Como vimos
anteriormente, a grelha de leitura é lida de 3 em 3 nucleótidos. Quando existe
uma mutação, perda de nucleótidos, a leitura que é feita gera uma cadeia
polipeptídica completamente diferente da que era suposto.
• O frameshifting da tradução ocorre quando o ribossoma “salta” (para trás ou para
a frente) na grelha de leitura, um ou dois nucleótidos durante o processo de
tradução. O resultado é a formação de uma proteína diferente.
• Este fenómeno pode ocorrer em duas situações:
o Quando temos codões para os quais existem poucos tRNAs (tradução
lenta), havendo uma tendência para saltar;
o Quando existem estruturas secundárias, os “slippery sequences”, que são
sequência com codões para os quais existem muitos tRNAs, resultando
numa tradução rápida, e portanto, mais sujeita a erros.
• Este fenómeno pode acontecer por engano, ou pode
estar programado para acontecer. Isto acontece
frequentemente nos vírus, como é o caso do SARS
coronavírus e do HIV.

VARIABILIDADE DE PROTEÍNAS

• Atualmente sabe-se que o número de genes do genoma humano varia entre 20000 e 25000 genes, contudo,
também se sabe que existe cerca de 1 milhão de proteínas, o que vem desmitificar a ideia de 1 gene corresponder
a 1 proteína.
• Algumas razões para termos mais do que uma proteína codificada por um gene é o splicing alternativo, a
poliadenilação alternativa, o RNA editing, promotores alternativos e uma terminação da transcrição diferencial,
entre outras. A existência de codões mais frequentes num determinado organismo, ou seja, o codon usage pode
influenciar também no destino final da proteína, uma vez que existe uma tradução mais rápida de uma proteína
cuja sequência de aminoácidos tenha sido codificada por codões cujos tRNAs sejam mais numerosos na célula.
• Apesar destes fatores todos, o que contribui para uma maior variabilidade de proteínas é as chamadas modificações
pós-traducionais das proteínas (PTMs).

MODICAÇÕES PÓS-TRADUCIONAIS

• As proteínas após serem traduzidas, elas têm de sofrer um


enrolamento (folding), podem sofrer clivagens proteolíticas para
exercerem a sua função, e ainda estão sujeitas a modificações
químicas e ainda ao sorting das proteínas (movimento das
proteínas para os locais onde irão desempenhar as suas funções).
• Quando ocorrer o folding da proteína, o enrolamento da proteína, há uma tendência para que ela enrole para o
estado de menor energia e para que os aminoácidos hidrofóbicos fiquem virados para dentro e que os aminoácidos

Página 66 de 109
hidrofílicos fiquem na parte externa da proteína. Quando isto não acontece, as proteínas têm tendência a agregar
formando complexos insolúveis (corpos de inclusão).
• Muitas vezes, durante este processo de enrolamento, as proteínas são conduzidas para a sua degradação. Isto
acontece porque foram incorretamente enroladas, ou porque têm um tempo de vida que já terminou.

FOLDING

• Quando a proteína está a ser sintetizada pelos ribossomas, pode haver uma tendência para ela sofrer algum
enrolamento que posteriormente pode sofrer alguns ajustes.
• Este processo de folding pode ser espontâneo ou auxiliado por um grupo essencial de proteínas, conhecidas como
chaperones. A ação destas chaperones favorece o enrolamento, não promovendo diretamente o mesmo, mas sim
impedindo a formação de agregados impedindo interações incorretas entre as cadeias polipeptídicas.
• Existem duas classes de chaperones:
o Chaperones moleculares: Estes chaperones são por vezes conhecidos como proteínas de choque térmico4,
das quais se destaca a Hsp70 (proteína monomérica). Estes chaperones
estão associados aos ribossomas e vão se ligar às proteínas que estão a
ser sintetizadas pelos ribossomas quase imediatamente, ligando-se às
zonas hidrofóbicas do polipéptido emergente, impedindo assim que
sofram um incorreto enrolamento e impedindo a formação de
agregados. É um processo que o corre simultaneamente com a tradução.
o Chaperoninas: As chaperoninas são também proteínas de choque térmico, das quais se destaca a Hsp60
(proteína polimérica). As chaperoninas estão associadas ao enrolamento de proteínas que não foram
corretamente enroladas (ou não enroladas de todo) mas que já foram complemente sintetizadas. As
proteínas entram no interior da chaperonina, e através de uma reação que envolve a hidrólise do ATP ela
vai sofrer um folding correto.

• Relativamente à quantidade e ao tipo de proteínas que existem nos vários tecidos, há alguns aspetos que temos de
ter em consideração. Por exemplo, o facto de existir muito RNA na célula não significa necessariamente que vá
existir muita proteína, uma vez que esse RNA pode ser facilmente degradável, ou mesmo a própria proteína que foi
sintetizada ser muito instável, podendo ser degradada. Assim, quando se faz a análise da expressão génica, é

4
Estas proteínas possuem o nome de heat shock proteins, porque foram descobertas quando as células eram sujeitas a altas
temperaturas e havia uma produção elevada deste tipo de proteínas.

Página 67 de 109
importante analisar a nível do RNA e a nível da proteína, ou seja, ver se existem alterações na quantidade de RNA e
na quantidade de proteína.
• 5% das enzimas do nosso proteoma são enzimas que estão envolvidas nestas modificações pós-traducionais (PTMs).
Alguns exemplos destas enzimas são:
o As cinases, as fosfatases, as transferases, as ligases, etc., enzimas responsáveis por adicionar ou remover
grupos funcionais (fosfato, metil, acetato, acetil, hidroxilo…), proteínas, lípidos ou açucares nas ou das
cadeias de aminoácidos.
o As proteases, enzimas que clivam as ligações peptídicas para remover sequências específicas ou
subunidades reguladoras.
o Muitas proteínas são capazes de se modificarem a elas mesmas, usando domínios auto-catalíticos, como
os domínios autoproteolíticos. Um exemplo de regiões das proteínas que vão ser removidas pelas própria
proteínas são as inteínas.
• Identificar e perceber que modificações estão a ocorrer, ou que ocorreram, é crucial para o estudo da biologia
celular e de tratamentos de doenças e sua prevenção.
• Estas modificações podem ocorrer em qualquer altura do “ciclo da vida” de uma proteína.
o Podem ocorrer durante ou imediatamente a seguir à sua tradução estar completa.
o Estas modificações medeiam o correto enrolamento e consequentemente a estabilidade da proteína.
o Ativam ou inativam atividade catalítica ou influenciam a atividade biológica de uma proteína.
o Podem ocorrer na extremidade N- ou C- de uma cadeia de aminoácidos.
o Estas modificações podem ser reversíveis ou irreversíveis dependendo da natureza da modificação.
• Os principais aminoácidos que vão ser alvo destas modificações com os respetivos grupos afetados são:
o Serina, treonina e tirosina – grupo hidroxilo
o Lisina, arginina e histidina – grupo amina
o Aspartato e glutamato – grupo carboxilo

Página 68 de 109
• Existem vários estados em que as proteínas estão inativas. Para estas passarem a ser ativas, várias coisas podem ter
de acontecer:
o Ligação de um ligando;
o Fosforilação;
o Adição de uma subunidade à proteína;
o Dissociação da proteína com um inibidor (por fosforilação por ex);
o Clivagens proteolíticas;

• Cada um destes mecanismos é tipicamente controlado por sinais extracelulares. A esta via chamamos de transdução
de sinal (um sinal externo à célula envia um sinal e provoca uma alteração no interior da célula.
• Um exemplo desta via é o do recetor Notch.
o O recetor Notch é uma proteína
membranar e é um heterodímero
(possui duas subunidades). Quando esta
proteína membranar é sintetizada no
complexo de golgi, esta proteína possui
uma única cadeia polipeptídica.
Posteriormente ela sofre uma clivagem,
originando duas cadeias polipeptídicas
diferentes, mas que interagem
formando este heterodímero.
o Esta proteína vai depois exercer a sua
função na membrana, recebendo sinais
externos de células adjacentes que estão

Página 69 de 109
associadas a determinados ligandos. Quando o recetor Notch entra em contacto com um destes ligandos
de outra célula, sofre 2 outras clivagens.
o O resultado de uma destas clivagens é uma pequena porção, a NICD (Notch Inter-Celular Domain), que
estava associada àquela proteína de membrana, e que vai migrar para o núcleo e funcionar como um
ativador transcricional, ativando uma série de genes alvo. Deste modo, existem genes que vão ser
transcritos como resposta a um estímulo exterior.
o Neste caso, não só a própria proteína sofreu uma modificação pós-traducional para ser funcional enquanto
recetor membranar, como ainda sofre mais duas clivagens para passar a ser um ativador transcricional.
• Acabamos de ver um exemplo de uma clivagem proteolítica.
Existem dois tipos de clivagens proteolíticas.
o Clivagens que ocorrem numa extremidade (end
processing);
o Clivagens que ocorrem no meio de uma cadeia
polipeptídica (polyprotein processing);
• Existem mais de 11000 proteases responsáveis por estas clivagens proteolíticas.

DEGRADAÇÃO DE PROTEÍNAS

• Quando uma proteína começa a ser sintetizada, se ela não sofrer um correto enrolamento, ela pode ser logo
enviada para degradação. Isto acontece frequentemente com proteínas truncadas.
• Nas células eucariotas, existem dois mecanismos de degradação proteica: um mediado por lisossomas e outro (mais
frequente) por uma via do proteassoma.
• A degradação mediada por via lisossomal está relacionada, preferencialmente, com os fenómenos de endocitose
celular, degradação de proteínas dentro dos lisossomas, os quais contêm enzimas proteolíticos.
• A degradação mediada pelo proteassoma implica uma marcação específica das proteínas pela ubiquitina, havendo
consumo de ATP. Esta marcação consiste na adição de várias unidades de ubiquitina a determinados resíduos de
aminoácidos da proteína a ser marcada para degradação.
• A ubiquitina é uma proteína com 76 resíduos de aminoácidos. O proteassoma 26S é um complexo proteico
constituído por proteases, o qual, com gasto de energia proveniente da hidrólise de ATP, degrada substratos
proteicos marcados por poliubiquitinação.

REGRA DO N-TERMINAL

• Em 1986, Alexandre Varshvsky demonstrou que existia uma correlação entre o resíduo de aminoácido na
extremidade N-terminal e o tempo de semi-vida de uma proteína. Por exemplo, proteínas com um resíduo de serina
apresentavam um tempo de semi-vida superior a 20 horas, enquanto que se o resíduo fosse uma asparagina, o
tempo de semi-vida da proteína era cerca de 3 minutos.
• O mecanismo de reconhecimento dos resíduos na extremidade N-terminal não está identificado, mas curiosamente
a regra do N-terminal também se aplica a procariotas, os quais não têm ubiquitina e consequentemente o
mecanismo de ubiquitinação de proteínas.

Página 70 de 109
• A presença de determinados aminoácidos no N-
terminal pode de alguma forma influenciar a
estabilidade da proteína. Contudo, isto ainda é alvo de
estudo.
• Quando temos uma cadeia polipeptídica com um dos
aminoácidos prolina, glutamato, serina ou treonina,
dizemos que estamos perante uma sequência PEST, e
portanto, sabemos que estamos provavelmente
perante uma proteína com pouco tempo de semi-vida.

PROTEIN SORTING

• O mecanismo de sorting é um mecanismo biológico pelo qual as proteínas são transportadas para os locais na célula
onde irão exercer a sua função (ou no exterior à célula).
• A informação para onde elas irão já está contida na própria proteína, num signal peptide (frequentemente
localizado no N-terminal, mas pode estar noutras regiões da proteína).
• Um erro neste mecanismo pode levar a doenças, como é o caso da fibrose cística, em que a proteína membranar
CFTR (Cystic fibrosis transmembrane conductance regulator) responsável por fazer o transporte ativo de iões dentro
e fora das células epiteliais do trato respiratório, não está presente.

REPLICAÇÃO DO DNA
• Quando Watson e Crick postularam a estrutura da molécula de DNA, sugeriram logo à partida que o facto de haver
um emparelhamento de bases tão específico, poderia estar na base de um mecanismo de cópia do material
genético.
• O princípio de emparelhamento de bases complementares subjacente ao modelo de Watson e Cricl sugeria que
duas novas cadeias de DNA seriam copiadas a partir das duas cadeias pré-existentes que serviriam de molde
(template), permitindo uma cópia exata da informação genética. Contudo, dois modelos foram sugeridos:
o Replicação conservativa – em que duas novas cadeias formavam uma nove hélice dupla, permanecendo a
hélice pré-existente intacta.
o Replicação semiconservativa – em que cada uma das cadeias pré-existentes ficaria emparelhada com uma
nova cadeia à qual serviu de molde.
• Os primeiros dados experimentais que apoiaram a hipótese da replicação semiconservativa tiveram origem na
experiência clássica de Meselson e Stahl.
o Meselson e Stahl cresceram E. coli em meio contendo átomos pesados de azoto até que este isotipo
estivesse presente em todo o DNA celular. Seguidamente, as células foram mudadas para meio contendo
isótopos “leves” de azoto (14N) e recolhidas a intervalos regulares. Em cada colheita, o DNA extraído foi
submetido a centrifugação em gradiente, capaz de separar em bandas distintas moléculas constituídas por
duas cadeias pesadas, uma pesada e uma leve ou duas leves. O padrão de bandas obtido é consistente com
a replicação semiconservativa de DNA.

Página 71 de 109
MECANISMO DE AÇÃO DA DNA POLIMERASE

• A DNA polimerase é a enzima responsável pela síntese de


uma nova cadeia de DNA, e possuem algumas características
que determinam a forma como ocorre o processo de
replicação.
o As DNA polimerases não efetuam a separação das
cadeias da dupla hélice a serem copiadas;
o Todas as DNA polimerases até agora descritas não
iniciam a nova cadeia – apenas estendem uma nova
cadeia a partir de um fragmento pré-existente de
RNA, o iniciador (primer).
o Toda as DNA polimerases catalisam a adição de
nucleótidos à extremidade 3’ OH livre da nova
cadeia em crescimento que, portanto, só pode ser
sintetizada na direção 5’-3’.

Nota: Quando falamos de replicação, os primers são pequenos fragmentos de RNA; se estamos a falar de PCR, falamos
de pequenos fragmentos de DNA. No fundo, os primers são sequências iniciadoras.

• A primase é uma enzima que vai sintetizar este fragmento de RNA, o fragmento iniciador (primer – entre 10 e 12
nucleótidos), a partir da extremidade 5’ de cada uma das novas cadeias a sintetizar. Este primer tem como função
permitir a ligação das enzimas que constituem o complexo da DNA polimerase, à cadeia nascente, para que continue
a síntese da cadeia filha na direção 5’ para 3’.
• No entanto, devido ao antiparalelismo da cadeia de DNA parental e das duas cadeias filhas a sintetizar, só uma delas
poderá ser elaborada de modo contínuo (na direção 5’-3’) a partir da região de cada cadeia parental imediatamente
adjacente à origem de replicação. Esta será a cadeia
líder ou a leading strand. A outra cadeia filha não
poderá ser sintetizada de forma contínua, pois estará
condicionada pelo facto de a DNA polimerase ter uma
única direção de síntese (5’-3’), denominando-se por
cadeia atrasada ou lagging strand. Assim esta cadeia
irá ser sintetizada na direção oposta ao avanço do
“garfo de replicação”, de forma descontínua, através
da síntese e posterior ligação de múltiplos segmentos
de DNA, todos iniciados por um pequeno fragmento
de RNA iniciador colocado, na maioria dos casos, pela
primase. Estes fragmentos de DNA, contendo, de
forma temporária, um RNA iniciador, são
denominados por fragmentos de Okazaki.

Página 72 de 109
• Deste modo, enquanto que na cadeia
líder, apenas é necessário 1 primer, na
síntese da cadeia atrasada tem de
existir um primer de RNA cada vez que
se inicia a síntese de um dos fragmentos
de Okazaki. Para haver uma ligação
entre os vários fragmentos de Okazaki,
é necessário que haja remoção destes
fragmentos de RNA iniciadores
(primers), substituindo-se por
desoxirribonucleótidos.
• Como falamos anteriormente, para
aliviar as tensões que se geram devido à abertura da dupla cadeia e do avanço do “garfo de replicação”, existem as
topoisomerases (pág. 10). Existe um grupo de antibióticos, as quinolonas, que interferem com a síntese de DNA na
medida que inibem a ação das topoisomerases, mais frequentemente, a topoisomerases II bacteriana (também
denominada de gyrase).
• Todos os organismos têm de duplicar fielmente o seu DNA antes do início de uma nova divisão celular. Todas as
células usam o mesmo tipo de enzimas, que incluem:
o As DNA polimerases que sintetizam uma nova cadeia de DNA, alinhando desoxirribonucleótidos de acordo
com a sequência complementar da cadeia molde pré-existente; os nucleótidos são adicionados à
extremidade 3’-OH do nucleótido anterior;
o As helicases, que desenrolam a dupla hélice e separam as cadeias de DNA de modo a expor as bases para
emparelhamento (cliva as pontes de hidrogénio entre as bases);
o As proteínas SSB (proteínas que ligam cadeias de DNA simples) que se ligam ao DNA de cadeia simples
estabilizando-o (protege a molécula de cortes das endonucleases);
o Ligases que restabelecem ligações fosfodiéster entre nucleótidos adjacentes;
o Topoisomerases que desfazem o super-enrolamento na cadeia dupla:
• Na imagem seguinte temos as enzimas envolvidas na replicação de E. coli, que no seu conjunto formam um
complexo, o replissoma.

Página 73 de 109
REPLICAÇÃO DE DNA EM E. COLI

DNA POLIMERASE III

• A polimerização procede no sentido 5’-3’ a partir do iniciador


por ação, em E. coli, da DNA polimerase III, uma das DNA
polimerases identificadas nesta bactéria. Deste modo, a DNA
polimerase III apresenta atividade de polimerização, mas,
também apresenta uma atividade 3’-5’ exonucleásica, a
chamada atividade de revisão de provas. Esta atividade exonucleásica 3’-5’ permite uma correção imediata de erros
de emparelhamento no momento da replicação, ou seja, quando uma base é colocada incorretamente, a DNA
polimerase III é capaz de detetar esse erro, voltar atrás, remover esse nucleótido, e colocar o correto.
• A fidelidade da replicação de DNA é cerca de 10-10, ou seja, pode ocorre 1 erro por cada 10000000000 de bases.
• Ora, apesar da DNA polimerase III apresentar atividade exonucleásica, não é ela que vai remover os fragmentos de
RNA iniciadores dos fragmentos de Okazaki, mas sim a DNA polimerase I, que esta sim apresenta atividade
exonucleásica 5’-3’.
• Quando a DNA polimerase III encontra a extremidade 5’ do primer precedente, é substituída pela DNA polimerase
I, que, atuando como exonuclease, remove em primeiro lugar o RNA no sentido 5’-3’ e, seguidamente prossegue
com a atividade de polimerase substituindo o segmento de RNA por DNA.
• Os diferentes fragmentos de DNA da cadeia secundária ou atrasada, são por fim ligados pela DNA ligase. Este enzima
catalisa a formação de uma ligação fosfodiéster entre a extremidade 5’ monofosfatada de um fragmento de DNA e
a extremidade 3’ hidroxilo do fragmento adjacente da mesma cadeia.
• Os nucleótidos precursores da replicação são desoxirribonucleótidos trifosfatados.

Página 74 de 109
CARACTERÍSTICAS DAS DNA POLIMERASES EM E.COLI

Síntese Revisão de provas


DNA polimerase 5’-3’ Exonuclease Função
5’-3’ Polimerização 3’-5’ Exonuclease
I Sim Sim Sim Remove e substitui
os primers
II Sim Sim Não Envolvida na
reparação de DNA
III Sim Sim Não Elongação do DNA
IV Sim Não Não Reparação de DNA
V Sim Não Não Reparação de DNA

• A replicação de DNA ocorre simultaneamente nas duas cadeias filhas. Isto é explicado por um modelo, que se baseia
no facto de conhecermos a composição das DNA polimerases.
• A DNA polimerase I é composta por apenas uma subunidade, é pequena, e possui as 3 atividades mencionadas
anteriormente. Denote-se que esta DNA polimerase é a única que possui a atividade 5’-3’ exonucleásica.
• A DNA polimerase III é composta por muitas subunidades, como se vê na figura abaixo.
• Este modelo afirma que:
o Subunidade α: responsável pela
atividade 5’-3’ polimerásica.
o Subunidade ε: responsável pela
atividade de revisão de provas.
o Subunidade β: responsável pelo
aumento da processividade5.
o Subunidade θ: auxilia a formação do complexo.
o Subunidade τ: Mantém o contacto com a DNA helicase;
• Este modelo, também conhecido como o “modelo do trombone” diz que a replicação de DNA ocorre
simultaneamente em ambas as cadeias devido a esta estrutura da DNA polimerase III (sendo que cada lado estará
ligado a uma das cadeias). Este modelo é o mais aceite atualmente.
• Para uma melhor visualização deste modelo: https://www.youtube.com/watch?v=IjVLhoyfGAM (a partir dos 2:40);

Como é que se inicia a replicação?

• No modelo de E. Coli sabe-se que existe uma proteína iniciadora, a DnaA que se vai ligar a uma região muito
específica do genoma de E. Coli designada por origem da replicação. Em E. Coli existe apena uma única origem de
replicação, que denominamos por oriC (rica em A e T), que está bem caracterizada por sequências consenso – a
DnaA box. Esta ligação da proteína DnaA à oriC possibilita a separação das cadeias de DNA de E. coli.

5
Propriedade da DNA polimerase relacionada com o tamanho da extensão que a polimerase consegue fazer.

Página 75 de 109
• O prosseguimento da separação (ou desnaturação) das duas cadeias é mediado pela proteína DnaB, uma DNA
helicase. As helicases deslocam-se ao longo do DNA, utilizando energia derivada de ATP para separar as cadeias. As
cadeias separadas são impedidas de voltar a emparelhar pelas proteínas SSB, que se ligam a cada uma das cadeias
simples de DNA.
• A primase, também designada por DnaG, vai sintetizar curtos iniciadores de RNA (cerca de 15 nucleótidos)
complementares a cada uma das cadeias de DNA molde, e ao terminar dissocia-se.
• Após a replicação, existe uma proteína, a proteína SeqA, que se vai ligar à origem de replicação, de forma a que não
ocorra outra replicação (garantindo a existência de apenas 2 cromossomas por cada divisão celular).

REPLICAÇÃO UNIDIRECIONAL VS BIDIRECIONAL

• A replicação semiconservativa de DNA podia ser explicada por diferentes mecanismos moleculares que foram
propostos para o modo como se iniciava e progredia a nova cadeia.
o Na forma mais simples, as extremidades da molécula constituem os pontos fixos de início e de terminação
da síntese da nova cadeia. A replicação teria início numa região da molécula original de DNA, a origem de
replicação, a partir da qual as duas cadeias seriam copiadas dando origem a um garfo de replicação que
progrediria unidireccionalmente ao longo do DNA (formando um D loop). Este mecanismo é aplicável em
moléculas de DNA linear como o genoma de certos vírus, ou o genoma mitocondrial.
o Dados experimentais sugerem que, regra geral, a replicação de DNA ocorre de forma bidirecional, a partir
de uma única origem de replicação. Ambas as cadeias são assim copiadas em cada um de dois garfos de
replicação. Este parece ser o modo mais comum de replicação de DNA em procariotas e eucariotas. Em
moléculas de DNA bacteriano e em alguns vírus encontra-se uma única origem de replicação, enquanto que
nos cromossomas eucarióticos podem ser encontradas várias origens, cada uma com dois garfos de
replicação. Quando estamos a falar de um modelo bidirecional, falamos num modelo theta, porque faz
lembrar a letra θ.

Página 76 de 109
TERMINAÇÃO DA REPLICAÇÃO EM E. COLI

• O problema da replicação bidirecional, é que a certa altura, os dois garfos


de replicação encontram-se. O modelo mais aceite para explicar como é
que isto é solucionado, afirma que na região diametralmente oposta da
oriC de cada uma das moléculas que entretanto foi sintetizada, existem
sequências designadas por sequências ter. Os garfos de replicação após
ultrapassarem estas regiões (T1 e T2), forma-se um concactâmero, que
por recombinação, separa-se, originando duas cadeias de DNA.
• Ainda não se sabe muito sobre este processo, mas sabe-se que este é
auxiliado por ter binding proteins (Tus), recombinases e topoisomerases.
• Esta interligação entre moléculas chama-se catenates.
• Para além do modelo theta, existe outro modelo associado ao DNA circular que é o modelo círculo rolante. Este
modelo existe sobretudo nas mitocôndrias das plantas, de alguns vírus, fagos e do Fator F (plasmídeo). O que se
sabe é que na dupla cadeia de DNA há uma região que vai sofrer um corte (Nick – quando há um corte na ligação
fosfodiéster; Gap – quando há remoção de nucleótidos).
• A replicação do DNA de círculo rolante é iniciada por uma proteína que vai clivar uma fita da molécula de DNA
circular de cadeia dupla. A proteína continua ligada à extremidade 5’- fosfato da fita cortada, e a extremidade 3’-
OH é libertada, servindo como um iniciador para a síntese de DNA. Usando a fita não cortada como molde, a
replicação prossegue em torno da molécula de DNA circular, deslocando a fita cortada como DNA de cadeia simples.

REPLICAÇÃO DE EUCARIOTAS

• Nos eucariotas o processo de replicação é globalmente semelhante ao que ocorre nos procariotas. É, contudo, mais
lento e a organização do DNA em cromatina aumenta a complexidade do processo que ainda não está
completamente elucidado. Contudo, uma coisa que vai diferir, é que em eucariotas, geralmente falamos da
replicação de DNA nuclear, ou seja, moléculas de DNA predominantemente lineares.
• Nos eucariotas, predomina o modelo da replicação bidirecional.
• Para haver replicação do DNA, vai ter de haver uma descondensação da cromatina.
• Enquanto que nos procariotas existe uma única origem de replicação, nos eucariotas existem múltiplas origens de
replicação. Contudo, estas várias bolhas de replicação, não começam todas a funcionar ao mesmo tempo.

Página 77 de 109
• Mais uma vez, vai haver fusão dos garfos de replicação com o auxílio de topoisomerases.

• O número de origens de replicação e o replicão6 varia entre organismos como está demonstrado na tabela seguinte:

• Em E. coli conseguiu-se identificar e caracterizar muito bem a origem de replicação. Nos eucariotas é muito difícil,
sobretudo a nível do genoma humano, identificar uma sequência que seja responsável por uma origem de
replicação. Pensa-se que para além da sequência, existem muitos outros fatores que contribuem para o local de
uma origem de replicação.
• Em Saccharomyces (yeast), um eucariota unicelular, foi mais fácil. Numa experiência, clonou-se diferentes regiões
do genoma de Saccharomyces. Em cada um dos plasmídeos com cada uma destas sequências de Saccharomyces,
colocou-se um gene leu+, e implantou-se esse plasmídeo numa célula leu-. O que se verificou é que só houve
crescimento destas células num meio sem leucina (ou seja, houve replicação do gene leu+), nas células que
continham a região do genoma de Saccharomyces com uma determinada sequência que se denominou por ARS
(autonomously replicating sequence). Deste modo, conseguiu identificar-se uma origem de replicação no genoma
de Saccharomyces.

6
Nº de kbases que replica por unidade de replicação. Cada origem de replicação dá origem a um replicão.

Página 78 de 109
• A esta sequência ARS, assim como ao sub-domínio
B1, vai se ligar um conjunto de proteínas, que vão
funcionar de modo semelhante à proteína
iniciadora dos procariotas, que vai dar origem ao
ORC (origin of replication complex). A desnaturação
do DNA ocorre no sub-domínio B2, induzido pela
ligação da ABFI (ARS binding protein) ao sub-
domínio B3.
• Em leveduras identificaram-se já várias origens de
replicação, e encontra-se 1 origem de replicação
por cada 40 kbp.
• Ao contrário dos procariotas, nos eucariotas não existe uma primase. Existe sim uma DNA polimerase α que catalisa
a síntese de iniciadores ao nível das origens de replicação (atividade primase). Em suma, foram identificadas as
seguintes DNA polimerases nos eucariotas:
o DNA polimerase α: catalisa a síntese de iniciadores ao nível das origens de replicação (atividade primase),
mas também apresenta atividade de 5’-3’ de polimerização (inicia a síntese da cadeia líder).
o DNA polimerase ε: assegura a extensão da cadeia nucleotídica da cadeia líder (atividade 5’-3’ polimerização)
e procede à correção de possíveis erros (atividade 3’-5’ exonucleásica).
o DNA polimerase δ: assegura a extensão da cadeia nucleotídica atrasada (atividade 5’-3’ polimerização) e
procede à correção de possíveis erros (atividade 3’-5’ exonucleásica).

• No fundo, a replicação em eucariotas funciona de modo semelhante ao dos procariotas, apenas mudam os nomes
das enzimas responsáveis por determinada função (ex: em vez de helicase, a enzima que desempenha essa função
é a MCM).
• Evidências mostram que o PCNA está na base de muitos processos celulares essenciais como a reparação do DNA,
a replicação, estabilidade da cromatina e segregação de cromossomas e ciclo celular.

Página 79 de 109
• O PCNA (proliferating cell nuclear antigen) é o equivalente da subunidade β (β clamp) de procariotas. Para se
descobrir a função da PCNA, tentou-se comparar com a sequência da subunidade β (porque sequências parecidas
poderão indicar uma mesma função), e verificou-se que não tinham nada a ver. Contudo, quando se fez a estrutura
tridimensional, verificou-se que estas duas proteínas tinham uma estrutura muito semelhante.

MATURAÇÃO DA CADEIA ATRASADA

• Nos procariotas, é a DNA polimerase I que remove os fragmentos dos primers devido à sua atividade 5’-3’
exonucleolítica e depois polimeriza (atividade 5’-3’ de polimerização).
• Nos eucariotas, é a DNA polimerase δ é a principal enzima responsável pela maturação e polimerização dos
fragmentos de Okasaki, contudo, ela não tem atividade exonucleolítica 5’-3’¸ou seja, não é capaz de remover os
primers. A proteína envolvida na remoção dos primers é a FEN1, sendo que não foi identificada atividade de
exonuclease 5’-3’ em qualquer polimerase de origem eucariótica.
• Contudo, o que se verificou, é que esta FEN1 não tem a capacidade de começar a degradar um primer de RNA que
está trifosfatado (o primeiro ribonucleótido do primer de RNA é um ribonucleótido trifosfatado). Deste modo, a
FEN1 cliva mais à frente (branch point) devido à sua atividade de endonuclease, a DNA polimerase δ continua a
polimerização, e a DNA ligase faz a ligação.

Página 80 de 109
PROBLEMA DO FINAL DA REPLICAÇÃO DOS CROMOSSOMAS LINEARES

• Ao contrário dos cromossomas circulares bacterianos, os cromossomas


eucarióticos são lineares, possuindo extremidades especializadas
denominadas telómeros.
• Enquanto que a síntese da cadeia primária (leading strand) pode prosseguir até à extremidade do cromossoma, a
cadeia secundária (lagging strand) estende-se
em sentido contrário, a partir de novos
iniciadores de RNA (primers) colocados
sucessivamente em direção à mesma
extremidade à medida que o avanço do garfo
expõe novos locais de emparelhamento. Assim
que o garfo de replicação atinge o cromossoma
líder, não há lugar para produzir o iniciador de
RNA necessário para iniciar o último fragmento
de Okasaki que inclua a extremidade da molécula
linear de DNA, o que resulta numa cadeia
secundária mais curta em cada divisão celular, e
consequentemente, perda de DNA em cada
divisão celular.
• Assim, à medida que as células replicam, há um
encurtamento dos telómeros.
• Este problema deve-se:
o A DNA polimerase só conseguir sintetizar de 5’-3’;
o Síntese descontínua da cadeia secundária;
o Extremidade 3’ OH que é degradada;
• No entanto, o encurtamento progressivo da cadeia secundária é evitado pela ação da telomerase.

TELOMERASE

• A telomerase é uma ribonucleoproteína, formada por um complexo de proteína e RNA, com uma atividade de tipo
transcriptase reversa.

Página 81 de 109
• Uma sequência de RNA, que é parte integrante da enzima, é usada como molde para a síntese de DNA.
• A telomerase reconhece a extremidade rica em guaninas característica de um telómero, e procede à sua extensão
na direção 5’-3’. O enzima sintetiza uma nova cópia da sequência repetitiva (sequências repetitivas teloméricas)
usando como molde uma sequência de RNA que faz parte dele próprio.

• Ora, poderíamos pensar, porque é que a telomerase vai estender uma extremidade que já estava estendida, não
seria mais inteligente ela adicionar nucleótidos apenas na extremidade mais curta até ficar do mesmo tamanho?
Porque é que é precisamente a cadeia molde da síntese descontínua que vai ser estendida?
o Quando a cadeia molde estiver suficientemente alongada na sua extremidade 3’, a síntese da porção
remanescente da cadeia secundária pode ocorrer, possivelmente a partir de novos iniciadores.
• Existem sequências repetitivas consenso que foram identificadas em telómeros de alguns organismos.
• Em muitos organismos os telómeros são adicionados repetidamente em estádios iniciais do desenvolvimento, em
células da linha germinativa. Em células somáticas, isto não acontece (ou pelo menos, não frequentemente), o que
leva ao encurtamento progressivo dos telómeros e eventualmente ao encurtamento dos cromossomas e perda de
informação genética. Este fenómeno poderá estar relacionado com fenómenos de envelhecimento e morte celular.
• É a adição de sequências teloméricas pela telomerase durante a replicação do DNA, que vai impedir: o
encurtamento do DNA, a reparação do DNA (onde não é preciso reparar) e recombinação (onde não é suposto
haver). Confere assim integridade e estabilidade aos cromossomas.
• A estrutura dos telómeros pode formar diferentes complexos proteicos, que contribuem para a proteção dos
mesmos tais como:
o D-loop;
o Shelterin;
o G-quadruplex;

Página 82 de 109
MUTAÇÕES NO DNA E MECANISMOS DE REPARAÇÃO
• Uma mutação num só gene pode levar a consequências graves no organismo. Por
exemplo os genes Hox, que são genes que estão envolvidos na programação do
eixo antero-posterior (cabeça, cauda) durante o desenvolvimento embrionário: a
expressão do gene Hox10 vai impedir que se formem vértebras na região lombar.
Ao provocarmos uma mutação neste gene, inativamos o gene Hox10, e a
consequência é a formação de vértebras na região lombar. A sequência consenso
é CTAATTG.
• Nas cobras, verificou-se que existia também uma sequência consenso, muito
semelhante à que existe no ratinho, com a alteração de um único nucleótido
(CCAATTG), que originava um fenótipo completamente diferente (esqueleto
típico de uma serpente). Experiências e análises de sequências sugerem que por
vezes, uma única alteração de um nucleótido, do ponto de vista evolutivo, é suficiente para originar fenótipos tão
diferentes entre os diferentes organismos.

MUTAÇÕES

• A manutenção da estabilidade genética requer, assim, não só mecanismos rigorosíssimos de cópia assegurados pelo
mecanismo sofisticado de replicação, anteriormente descrito, mas também mecanismos de reparação de DNA que
possam corrigir rapidamente as muitas alterações acidentais que ocorrem continuamente na sequência do DNA.
• Estas alterações são causadas não só por erros introduzidos durante a replicação, mas também por alterações das
bases, espontâneas ou induzidas (por ação de agentes ambientais mutagénicos, como certos agentes químicos e
radiações).
• Estas alterações espontâneas são, na maior parte das vezes, transitórias, pois são imediatamente corrigidas pelo
pelos processos de reparação. Contudo, se um dos processos de reparação falha, ocorre uma alteração permanente
do DNA, mantida na geração celular seguinte, chamada mutação.
• Deste modo, uma mutação pode ocorrer:
o Espontaneamente ou induzida;
o Durante a replicação do DNA;
o Durante a reparação do DNA;
• As mutações pontuais (alteração de 1 única base) mais comuns são:
o SUBSTITUIÇÕES;
▪ As substituições podem ser transições em que uma purina é substituída por uma purina, ou uma
pirimidina é substituída por uma pirimidina, ou tranversões, em que uma purina é substituída por
uma pirimidina, ou uma pirimidina é substituída por uma purina. No caso das transversões existe
uma alteração na estrutura de DNA (uma vez que se uma purina que está emparelhada com uma
pirimidina é substituída por uma pirimidina, vamos ter duas pirimidinas a “emparelhar”).
▪ As substituições podem dar origem também a diferentes tipos de mutações:
• Missense: Quando a substituição de um nucleótido, origina um aminoácido diferente;

Página 83 de 109
o Missense conservativa: caso origine um aminoácido diferente, mas do mesmo
grupo;
o Missense não conservativa: caso origine um aminoácido diferente, de um grupo
diferente;
• Nonsense: Quando a substituição gera um codão STOP; origina uma proteína incompleta;
• Silenciosa: Quando a substituição gera o mesmo aminoácido; isto não implica
necessariamente que o organismo seja fenotipicamente silencioso, uma vez que o codão
originado poderá não estar tão disponível na célula (devido ao codon usage), levando a
uma tradução lenta e consequentemente provocar um fenótipo mutante.
• Para além disso, é preciso ter em conta onde ocorrem estas mutações. Ocorrer no
primeiro, no segundo ou no terceiro nucleótido de um codão, poderá ter diferentes níveis
de gravidade. Do mesmo modo, uma mutação, por exemplo que leve à formação de um
codão stop, poderá ter diferentes níveis de gravidade, consoante ocorre no início ou no fim
da região codificante.

• Alterações de nucleótidos em regiões não codificantes também podem apresentar efeitos


graves, porque pode alterar o splicing de mRNA. Uma substituição numa região onde
deveria acontecer splicing, fará com que esse intrão seja mantido no mRNA, o que poderá
levar a fenótipos mutantes. Por exemplo, uma alteração de um nucleótido na região do
promotor (região não codificante) poderá levar uma menor ou a uma maior afinidade da
RNA polimerase, o que se traduzirá numa menor ou maior eficiência na tradução, e
consequentemente, da expressão génica. Deste modo, as mutações não significam sempre
uma perda de função, podem ser um ganho de função.

Página 84 de 109
o INSERÇÕES E DELEÇÕES;
▪ Uma das mutações mais frequentes em vírus são as mutações frameshift (pág. 66), que consistem
na alteração da grelha de leitura por inserção ou remoção de um nucleótido.

▪ As mutações de inserção e deleção de nucleótidos designam-se por mutações indel.


▪ De modo semelhante às substituições, quando ocorrem mutações indel nas regiões não
codificantes, esta mutação poderá ter ou não consequências, que poderão ser de perda ou ganho
de função.
▪ Nota: Uma inserção ou uma deleção numa região não codificante, não altera a grelha de leitura,
uma vez que só é válido falar disso numa região codificante. Por exemplo, se a minha região
codificante se inicia num ATG, o número de nucleótidos que está atrás desse codão de iniciação
não vai influenciar a grelha de leitura, e como tal, uma inserção ou uma deleção nessa região não
codificante, não vai provocar mutações frameshift.
• Como vimos, as mutações pontuais podem ter efeitos nas regiões não codificantes como:
o Promotor;
o Sequências reguladoras (ex: enhancer);
o Origem de replicação;
o Junções exão-intrão ou intrões (poderão eliminar ou gerar novas regiões de splicing alternativo);
• Na imagem seguinte observamos as consequências das mutações numa eletroforese. O mRNA é quantificado pelo
nº de nucleótidos; a proteína que se formou é quantificada em Dalton. Numa mutação missense, por exemplo,
observa-se o mesmo padrão de um gene selvagem, porque não é possível detetar uma diferença na massa
molecular, uma vez que não afeta nem a dimensão do mRNA, nem da proteína sintetizada. No caso de uma mutação
nonsense, a dimensão do transcrito é igual, mas a proteína traduzida terá uma massa molecular potencialmente
menor (devido à formação de um
codão stop). Numa mutação
frameshift, o tamanho do transcrito
mantem-se igual, mas a proteína
traduzida pode variar consoante o
tipo de mutação.
• Deste modo, é possível detetar e
analisar algumas mutações pela
técnica da eletroforese.

Página 85 de 109
• Alguns conceitos importantes:
o MUTAÇÃO FORWARD: mutação que provoca
um fenótipo mutante;
o MUTAÇÃO REVERSE: mutação que provoca
um fenótipo selvagem;
o MUTAÇÃO SUPRESSORA: mutação que origina
um supressor do gene mutante resultando num organismo com fenótipo selvagem. Pode ocorrer no
mesmo gene ou num mesmo codão, ou num diferente.
▪ MUTAÇÃO SUPRESSORA INTRAGÉNICA NO MESMO CODÃO: Exemplo: um determinado codão que
codifica a leucina sofre uma mutação e passa a produzir fenilalina. Este codão volta a sofrer uma
mutação, originando um codão diferente do inicial que codifica também a leucina. Poder-se-ia
pensar que se trata de uma mutação reverse, mas apesar de provocar o mesmo efeito, a mutação
é diferente do genótipo selvagem, pelo que se considera ser uma mutação supressora intragénica
(suprime o efeito do fenótipo mutante) que ocorre no mesmo codão.

▪ MUTAÇÃO SUPRESSORA INTRAGÉNICA EM CODÕES DIFERENTES. Por exemplo, suponhamos um


determinado gene que contém um codão que codifica a tirosina e outro codão que codifica a
glicina. Estes aminoácidos têm afinidade um com o outro e vão formar uma estrutura específica.
Se o codão da glicina sofrer uma mutação e passar a ser ácido glutâmico, provavelmente teremos
uma mutação com um fenótipo mutante visível, uma vez que deixa de haver afinidade nestas
regiões (e a estrutura muda). Uma
nova mutação faz com que o codão
que codifica a tirosina passe a
codificar a cisteína (que tem afinidade
para o ácido glutâmico). Apesar de ser
genotipicamente diferente de um
selvagem, fenotipicamente este
organismo vai ser selvagem. Neste
caso, falamos de uma mutação
supressora intragénica em codões
diferentes.

Página 86 de 109
▪ Uma mutação frameshift também pode atuar como uma mutação intragénica supressora.
Suponhamos que um determinado gene sofreu uma inserção de um nucleótido numa região
codificante, alterando assim a grelha de leitura.
• Exemplo: AUG UCU ACC U…. Inicialmente este gene codificaria Met – Ser – Pro - (…). Após
a inserção de uma adenina temos Met - Ser - Thr - (o resto da grelha toda alterada). Se
posteriormente ocorrer uma mutação frameshift que “salte” a leitura do terceiro
nucleótido do segundo codão, temos a seguinte leitura: AUG UCA CCU – (…tudo igual ao
genótipo selvagem…). O codão UCA à semelhança do codão UCU também codifica a serina,
pelo que vamos ter um fenótipo selvagem, mas com um genótipo diferente.
• Denote-se que se a mutação frameshift saltasse a leitura do nucleótido que foi inserido,
estaríamos a falar de uma mutação reverse e não numa mutação supressora.
▪ MUTAÇÃO SUPRESSORA INTERGÉNICA:
Exemplo: um gene sofre uma mutação
nonsense, gerando-se um codão stop
prematuro no local onde deveria ser
codificada uma leucina. Caso ocorra uma
mutação no gene que codifica o tRNA que
transporta o aminoácido leucina ao nível do
seu anticodão, esta mutação poderá levar a
que o tRNA que transporta a leucina
emparelhe com o codão stop. Deste modo,
esta mutação intergénica (ocorre em
diferentes genes) poderá funcionar como um
supressor do fenótipo mutante, uma vez que
a leucina é incorporada no polipéptido e a
tradução continua. Denote-se que esta
supressão não é 100% eficiente.
• Nota: Na imagem ao lado, o genótipo selvagem codificava uma tirosina, que é depois
substituída por uma leucina, mas denote-se que mais vale estar parcialmente ativa com
uma leucina do que estar truncada.
• Podemos também pensar que estas mutações podem fazer danos no organismo, uma vez
que este tRNA mutante da leucina pode emparelhar com verdadeiros codões stop,
resultando em proteínas maiores do que era suposto. Isto é verdade, poderá ter
consequências no organismo, contudo, isso não é assim tão frequente, porque a
terminação da tradução não é exclusivamente determinada pelos codões stop. Os
nucleótidos que circundam o codão stop determinam uma maior ou menos afinidade para
os RF (Fatores de terminação).

Página 87 de 109
CLASSIFICAÇÃO DAS MUTAÇÕES EM TERMOS FENOTÍPICOS

• MUTAÇÃO DE GANHO DE FUNÇÃO:


o GANHO DE FUNÇÃO HIPERMORFO: Usualmente uma mutação de ganho de função deve-se a grandes
níveis/aumento da expressão génica, ou quando uma proteína começa a ser produzida constitutivamente.
o GANHO DE FUNÇÃO NEOMORFO: Também ocorre quando temos um gene a ser expresso numa célula onde
não devia ser expresso, ou é expresso no tempo incorreto.
o Normalmente as mutações de ganho de função são dominantes sob o alelo selvagem.
o Denote-se que uma mutação de ganho de função, nem sempre é vantajoso para a célula.
• MUTAÇÃO DE PERDA DE FUNÇÃO
o KNOCK-OUT OU NULL: perda completa da função do gene (perda de função amorfa). A forma mais fácil de
isto ocorrer é a remoção/deleção do gene.
o HAPLOINSUFICIENTE: quando o gene em questão requer duas cópias no organismo para apresentar um
fenótipo selvagem, ou seja, quando um indivíduo heterozigótico não tem o nível de expressão génica
necessária à manifestação de um fenótipo normal.
o KNOCK-DOWN: a mutação provoca uma redução funcional do gene, usualmente devido a baixos níveis de
expressão génica. Também se designa por knock-down quando existe uma perda parcial da função génica
(perda de função hipomorfa); O RNAi é frequentemente utilizado para provocar um knock-down quando
se está a estudar e a analisar a função de um determinado gene.
o DOMINANTE-NEGATIVO: quando um gene mutado afeta o normal funcionamento de um gene selvagem
na mesma célula. Isto ocorro por exemplo, em complexos com muitas subunidades, onde todas as proteínas
deveriam estar ativas. Uma subunidade mutada que seja dominante-negativa, quando inserida no
complexo, vai fazer com que todas as proteínas do complexo deixem de ser funcionais (perda de função
antimorfa). Um exemplo de um dominante negativo é o ativador transcricional MAML do recetor Notch
(pág. 69).

OUTROS TERMOS DE CLASSIFICAÇÃO DE MUTANTES:

• AUXOTRÓFICOS: mutantes que são incapazes de crescer em meio mínimo, ou seja, o mutante é dependente da
presença do ou dos aminoácidos que não consegue sintetizar. (Ex: leu- não consegue crescer num meio sem
leucina).
• CONSTITUTIVO: mutantes que permitem uma expressão génica constante de um determinado gene em oposição
ao que acontece a organismos selvagens. Na maioria dos casos deve-se a uma mutação num gene regulador (ex:
lac I-) ou numa sequência (ex: lacOc).
• CONDICIONAL: mutantes que só se replicam em situações específicas (não se manifestando na ausência dessas
condições). Exemplos: mutações termosensíveis.
• NÃO CONDICIONAL: mutantes que se replicam em qualquer situação.

Página 88 de 109
CONSEQUÊNCIAS DAS MUTAÇÕES BASEADAS NO TIPO DE CÉLULA MUTADO

• As mutações podem ocorrer em células somáticas ou em células germinais.


• Se a mutação ocorrer em células da linha germinativa, esta vai afetar todos os indivíduos que são descentes dessa
célula, ou pode até impedir a viabilidade da descendência.
• No caso das mutações que ocorrem nas células somáticas, se a mutação ocorrer num indivíduo adulto, a mutação
só afeta o próprio indivíduo naquelas células. Contudo, se a mutação ocorrer nas células somáticas durante o
desenvolvimento embrionário, as células que derivam dessa célula somática mutante vão também ser mutantes.
Quando isto acontece, dizemos que o indivíduo é um mosaico, porque as células que o constituem possuem mais
do que um genótipo que deriva de um mesmo zigoto (genótipo que herdou dos pais e genótipo mutante).

CAUSAS DAS MUTAÇÕES

• Dos fatores mais mutagénicos que pode existir são os produtos do metabolismo celular, como por exemplo, a água
e as espécies reativas de oxigénio. A água é um mutagénico na medida em que pode criar reações de hidrólise. No
entanto, muitas destas mutações são corrigidas. Alguns livros classificam este tipo de mutações como espontâneas.
• O DNA é uma molécula estável, mas possui algumas ligações químicas que são de alguma forma, instáveis, podendo
estas estar na origem de algumas mutações. Também o facto da molécula de DNA possuir carga global negativa,
faz com que esteja mais sujeita à atração de espécies reativas de oxigénio e à hidrólise da água.
• Alguns agentes ambientais também estão por trás da origem de algumas mutações.

MUTAÇÕES ESPONTÂNEAS

• Entende-se por mutações espontâneas, mutações que ocorrem naturalmente no DNA.


• A maioria das mutações espontâneas origina-se devido a erros durante a replicação.
• As mutações espontâneas ocorrem ao acaso, mas cada vez mais sabe-se que não são completamente aleatórias,
uma vez que se conseguiu identificar “hotspots”, ou seja, regiões que têm uma maior tendência para sofrer
mutações espontâneas.
• A taxa de mutação foi estimada em E. coli, em aproximadamente uma alteração por 109 nucleótidos e pensa-se que
será aproximadamente a mesma em organismos eucariotas.
• Algumas mutações ocorrem após a replicação como o resultado de modificações químicas.

Página 89 de 109
MODIFICAÇÕES QUE PODEM LEVAR AO APARECIMENTO DE MUTAÇÕES ESPONTÂNEAS

• TAUTOMERIZAÇÃO:
o As bases azotadas podem existir sob formas diferentes chamadas tautómeros ou formas raras, que são
isómeros diferindo na posição dos átomos e suas ligações. Ocorrem raramente, dependem da temperatura
e do pH. Existem apenas durante um período muito curto de tempo.
o O problema dos tautómeros é o seguinte: por exemplo, algumas moléculas de guanina, normalmente
incorporada no DNA, podem interconverter-se espontaneamente na forma enólica (como está
demonstrado na imagem abaixo) de guanina no momento da replicação, o que tem como consequência o
seu emparelhamento com um nucleótido de timina (e não citosina, como normalmente).

o Do mesmo modo, a adenina pode emparelhar com a citosina quando a citosina está na forma tautomérica.
Nestes casos temos sempre transições (purinas são substituídas por purinas, e as pirimidinas são
substituídas por pirimidinas).
o Um dos grandes problemas deste emparelhamento incorreto, é que muitos mecanismos de reparação não
conseguem reconhecer formas tautoméricas, e por esse motivo, o erro não é corrigido.

Página 90 de 109
• DEPURINAÇÃO
o A depurinação é a perda de uma purina ou de uma pirimidina, levando à criação de locais apurínicos ou
abásicos.
o A depurinação pode ocorrer devido à presença de produtos do metabolismo celular, como a água, uma vez
que esta pode levar à clivagem da ligação glicosídica (ligação da pentose à base) por hidrólise.
o Este fenómeno é mais frequente nas purinas do que nas pirimidinas.
o Ao formar-se um local apurínico (ausência de uma base), quando ocorre a replicação do DNA, pode ser
incorporada qualquer base (o que faz com que haja 75% de chances de ocorrer uma mutação). Poderá
ocorrer uma transversão ou uma transição consoante a base que é colocada.

• O mecanismo de reparação que normalmente repara este tipo de mutações é o sistema de reparo de excisão de
bases (BER).

Nota: Quer a tautomerização, quer a depurinação podem ocorrer espontaneamente ou ser induzidos por agentes
químicos ou fatores físicos.

MODIFICAÇÕES QUÍMICAS QUE PODEM LEVAR AO APARECIMENTO DE MUTAÇÕES INDUZIDAS

• Mutações que são induzidas pela presença de um mutagénio. A mutação induzida vai ocorrer a uma velocidade
superior à mutação espontânea, uma vez que é induzida por agentes químicos e físicos.
• MODIFICAÇÃO DE BASES: modificações químicas que alteram a estrutura das bases causando mispairs
(emparelhamento incorreto) (ex: desaminação) ou que impedem o emparelhamento (ex: agentes alquilantes);
• BASES ANÁLOGAS: as bases podem ser substituídas por substâncias químicas análogas (ex:O 5-bromouracil é um
análogo de timina em que o grupo CH3 é substituído por bromo).
• AGENTES CROSS-LINKING: agentes que ligam uma cadeia à outra, impedindo a replicação;
• AGENTES INTERCALANTES: intercalam-se entre as bases do DNA, produzindo uma distorção física, seguida de
remoção e erro na reparação (ex: proflavina).

Página 91 de 109
DESAMINAÇÃO

• A desaminação pode ocorrer de uma forma espontânea ou


induzida.
• A desaminação é a perda do grupo amina (NH2).
• Os bissulfitos (HSO3-) são o principal agente mutagénico que
provoca a desaminação das citosinas e o ácido nitroso é o
principal agente mutagénico responsável pela desaminação da
adenina. Na presença destes agentes mutagénicos há perda do
grupo amina. A desaminação também pode ocorrer devido à
hidrólise da água.
• A timina não possui um grupo amina, pelo que não fica sujeita à
desaminação.
• A desaminação da citosina origina uracilo, enquanto que a
desaminação da adenina e da guanina dá origem,
respetivamente, à hipoxantina e à xantina.
• Na dupla cadeia de DNA, quando uma citosina perde o grupo
amina e vira um uracilo, têm de existir mecanismos de reparação (uma vez que não é suposto haver uracilo na
cadeia de DNA). Deste modo, pode-se considerar que esta desaminação é a menos preocupante, uma vez que o
próprio organismo tem mecanismos para reparar.
o Quando uma 5-metilcitosina é desaminada gera uma timina, logo, dificilmente vai ser reparada, uma vez
que a timina faz parte dos componentes normais do DNA, ocorrendo frequentemente uma mutação. Neste
caso específico, o mecanismo de reparação usado é o Mismatch repair (MMR).
o Deste modo, devido à grande presença de citosinas nas ilhas CpG, estas podem ser consideradas “hotspots”
de mutações se forem mutagenizadas gerando timinas.
• Se for uma adenina a ser desaminada, dá origem a uma hipoxantina, (que vai emparelhar com a citosina uma vez
que é semelhante à guanina), originando-se assim uma mutação.
• Quando a guanina é desaminada, forma a xantina que é muito instável, o que faz com que não emparelhe muito
bem com nenhuma base, e portanto, nem sempre ocorre uma mutação.
• Frequentemente, a desaminação é corrigida pelo reparo de excisão de bases (BER).

LESÕES OXIDATIVAS

• Lesões oxidativas ocorrem devido às espécies reativas do oxigénio. Estas espécies reativas de oxigénio aparecem
durante o nosso metabolismo normal, nomeadamente a nível do fígado.
• No nosso metabolismo normal, quando aparecem estes radicais livres, vamos ter enzimas específicas (a catalase e
a peroxidase) que vão “limpar” estes agentes oxidativos. Contudo, estas espécies reativas podem formar-se devido
a radiações, devido à ingestão de agentes químicos que vão gerar essas espécies, e nessa altura a dose é tal que
podem gerar mutações se não forem reparadas.
• Nota: As mutações só se geram se não forem reparadas.

Página 92 de 109
• Uma guanina, por exemplo, quando sofre este dano oxidativo, vai ligar-se preferencialmente à adenina (em vez de
se ligar a uma citosina), ou seja, uma pirimidina a ser substituída por uma purina (transversão).
• Estes danos podem afetar o emparelhamento das bases, podem gerar locais abásicos (pela remoção de bases),
adicionar diferentes grupos químicos (criando ainda outro tipo de lesões no DNA, nomeadamente parar a
replicação). Portanto, podem estar na base de muitos tipos de mutações.

AGENTES ALQUILANTES

• Alguns agentes mutagénicos não são incorporados na molécula de DNA mas causam a alteração de uma base. São
exemplos os agentes alquilantes como o etilmetilsulfonato (EMS) e nitrosoguanidina (NG) que transferem
respetivamente grupos enol ou metilo para várias posições nas quatro bases.
• Consoante o grupo alquilo e consoante o lugar onde eles se vão ligar, vamos ter um efeito mais ou menos drástico,
porque podem afetar o emparelhamento das bases, como também podem causar uma distorção tal na estrutura
de DNA que bloqueia a replicação do DNA.
• A adição destes grupos alquilo pode ser reparados pelo reparo de excisão de bases (BER) ou pelo reparo de excisão
de nucleótidos (NER), ou por um mecanismo direto (como as alquiltransferases que podem fazer reverter
diretamente estas modificações).

AGENTES CROSS-LINKING

• De entre os agentes alquilantes, existem os agentes cross-linking.


• Estes agentes vão adicionar um grupo alquilo que vai permitir uma ligação entre bases da mesma cadeia (intra-
strand) ou com uma base de outra cadeia (inter-strand).
• Exemplos:
o O Benzo[α]pyrene (alcatrão constituinte do cigarro) por si só não é mutagénico, mas quando é hidroxilado
no fígado, ele forma uma espécie reativa (epóxido) que vai alquilar as bases. O grupo alquilo adicionado vai
permitir que haja ligações cross-linking dentro da mesma cadeia (que vão impedir a replicação).
o O gás-mostarda também vai permitir que haja cross-linking entre as bases, mas entre cadeias diferentes.
o A cisplatina é um agente que é utilizado em quimioterapia que também queria estas ligações cross-linking,
intra e inter cadeias, ou seja, é muito difícil de ser reparado (por isso é utilizado, para impedir a replicação
das células cancerígenas). Obviamente, a quimioterapia ataca quer células boas, quer células más, daí
existirem efeitos secundários notórios.
• Estes cross-linkings são muito difíceis de se reparar, o DNA não replica, e na maioria das vezes, leva à morte celular.

Página 93 de 109
AGENTES INTERCALANTES

• Outro tipo de agentes químicos que pode causar modificações são os


agentes intercalantes como o brometo de etídio que utilizamos nas aulas
práticas.
• Os agentes intercalantes provocam modificações pois podem introduzir-
se entre duas bases, podendo provocar a adição ou deleção de um
nucleótido durante a replicação. Deste modo os agentes intercalantes
provocam uma distorção física na molécula de DNA. São exemplos a
proflavina e o laranja-de-acridina.
• Se os erros não forem corrigidos, ocorre mutação.

MODIFICAÇÕES FÍSICAS QUE PODEM LEVAR AO APARECIMENTO DE MUTAÇÕES INDUZIDAS

• Para além dos agentes químicos que vimos anteriormente, existem também agentes físicos como as radiações
(nomeadamente as radiações de elevada energia, ou seja, de baixo comprimento de onda) Temos os raios-x, os
raios-γ e os raios-UV.
• Estas radiações atuam como mutagénios na medida em que o DNA pode absorver essa energia, e isso pode criar
cortes (Nicks) numa cadeia simples ou nas duas cadeias, ou até provocar dano em nucleótidos isolados. Nesta
situação dizemos que é um dano direto. Um dano indireto é o caso de a radiação levar à formação de espécies
reativas que posteriormente danificam o DNA.
• Quando ocorre só um Nick, como existe uma cadeia completa, poderão existir mecanismo de reparação que vão
tirar partido disso, e usar como molde para reparar o que falta. Quando ocorrem dois Nicks, a reparação é muito
difícil.

• A radiação ultravioleta gera mais frequentemente uma mutação que é a formação dos dímeros de pirimidina,
também chamada fotodimerização.
• O DNA é particularmente suscetível a danos causados pela radiação ultravioleta que causa a dimerização de timinas
adjacentes (exemplo representado na imagem seguinte).

Página 94 de 109
• Um dímero de timina é no fundo, uma ligação covalente
entre dois resíduos de timina adjacentes dentro de uma
molécula de DNA.
• Os dímeros de pirimidina, podem ocorrer entre timinas,
entre uma citosina e uma timina e entre citosinas.
• Dois fotoprodutos comuns da radiação UV são o cyclobutane
pyrimidine dímer e o 6-4 products (o carbono 6 de uma
pirimidina liga-se ao carbono 4 de outra pirimidina).
• Quando o fotoproduto é um cyclobutane pyrimidine dímer,
existem 2 mecanismos de reparação diferentes, enquanto que no caso do 6-4 products, só existe 1 mecanismo
possível.
• A principal consequência da formação dos dímeros de timina devido à UV, é o bloqueio da transcrição, e
consequentemente morte celular.

SISTEMAS DE REPARAÇÃO DO DNA

• Onde a célula despende mais energia do ponto de vista das reações enzimáticas é nos mecanismos de reparação,
o que reforça a importância de manter a integridade do genoma.
• Estes mecanismo de reparação estão evolutivamente conservados, portanto, muito do que se sabe em eucariotas,
por exemplo, é muito devido ao estudo em bactérias, revelando também a importância de manter a integridade do
genoma.
• A importância da integridade no genoma é tal, que a célula desenvolveu mecanismos “checkpoints”, (para que não
aconteça o caso de ocorrerem muitas mutações e a célula se encontrasse em risco de sobrevivência) onde há uma
paragem no ciclo celular para que haja tempo para célula reparar esses danos.
• Estes mecanismos existem para reparar os danos causados pelas mutações, mas quando ocorrem mutações nos
genes que estão envolvidos nos sistemas de reparação, deixa de haver uma reparação eficiente, estando este
fenómeno na origem de muitas doenças.
• Existem:
o MECANISMOS DE REPARAÇÃO ESPECÍFICOS
▪ Mecanismos de reparação direta;
▪ Mecanismos de excisão de bases (BER – base excision repair);
▪ Mecanismos de substituição de nucleótidos como é o caso do (NER – nucleotide excision repair) e
o (MMR – mismatch repair);
o MECANISMOS DE REPARAÇÃO DE CORTES NA CADEIA DE DNA
▪ Mecanismos que se baseiam na recombinação homóloga (HDR – homologous direct repair)
(sobretudo em organismos 2n);
▪ Mecanismos de recombinação não homóloga: non-homologus end-joining (NHEJ);
▪ DNA ligases que vão ligar os nicks das cadeias simples;
▪ DNA polimerases específicas para reparar grandes danos;

Página 95 de 109
MECANISMOS DE REPARAÇÃO DIRETA: REPARAÇÃO ENZIMÁTICA

• Quando falamos em mecanismos de reparação direta, significa que vamos ter uma enzima específica para reparar
aquele dano específico.
• Exemplo 1: a CPD fotoliase é uma enzima que só vai reparar os dímeros de CPD (Cyclobutane pyrimidine dímer).
Esta enzima vai ser ativada na presença da luz visível, e ao ser ativada entra num processo de transferência de
eletrões e acaba por reparar os dímeros de timina. Esta CPD fotoliase já foi identificada em bactérias, archaea,
plantas, animais, mas nunca foi identificada em humanos ou animais placentários (nestes o mecanismo de
reparação de dímeros de timina é o NER). Recentemente, também já foi identificada uma 6-4 fotoliase que repara
os dímeros de 6-4 products.
• Exemplo 2: uma guanina quando é metilada no grupo 06, as enzimas ADA 7 (identificada em E. coli) e MGMT 8
(identificada em humanos) vão remover este grupo metilo, e volta a ser uma guanina normal.

MECANISMOS DE EXCISÃO DE BASES – BER

• Quando ocorre um dano que não confere grande distorção da molécula de DNA, normalmente o mecanismo de
reparação é o BER, porque basta que seja removida a base e que se substitua, que o dano é reparado.
• Este mecanismo vai tirar partido das glicosilases específicas.
• Este mecanismo existe em todas as espécies. Envolve várias enzimas, cada uma com um papel específico e possui
várias etapas.
• Neste mecanismo a base vai ser excisada e posteriormente substitui-se o nucleótido inteiro.
o Nota: uma coisa é a base ser excisada, outra coisa é remover o nucleótido inteiro.
• As etapas são:
1. REMOÇÃO DA BASE: esta base é removida por uma DNA
glicosilase específica para o tipo de dano e para uma
base específica. A remoção da base cria um local
abásico ou apurínico (AP site). Ex: remoção do uracilo
quando a citosina é desaminada.
2. AÇÃO DE UMA ENDONUCLEASE AP: esta endonucleases
vai clivar a ligação fosfodiéster entre o 5’-fosfato e a
pentose, removendo-se o nucleótido inteiro.
3. AÇÃO DA DNA POLIMERASE: A DNA polimerase repõe o
respetivo dNTP (que tem de corresponder à cadeia
complementar);
4. Ação da DNA ligase: A DNA ligase vai ligar o nucleótido
incorporado aos nucleótidos adjacentes.

7
Quando a ADA retira o grupo CH3, ela incorpora-o e transforma-se num ativador transcricional que vai ajudar a ativar genes
envolvidos na reparação deste tipo de danos.
8
Quando a MGMT retira o grupo CH3, ela incorpora-o e torna-se inativa. Esta enzima é depois dirigida para degradação.

Página 96 de 109
MECANISMOS DE SUBSTITUIÇÃO DE NUCLEÓTIDOS – NER

• Quando o dano implica uma distorção significativa da molécula de DNA (como dímeros de timina ou a adição de
um grupo alquilo de grandes dimensões), normalmente o mecanismo de reparação envolvido é o NER.
• Este mecanismo em E. coli envolve 3 enzimas: UvrA, Uvr B e Uvr C.
o A UvrA tem atividade de reconhecimento;
o A UvrB tem atividade helicásica (para abrir aquela região);
o A Uvr C vai fazer um corte a jusante e a montante do local da distorção;
• As etapas deste processo são: Não temos de saber o que acontece em cada uma destas etapas (porque
1. RECONHECIMENTO existem descrições diferentes do que acontece). Temos de saber que este
2. INCISÃO sistema está associado à remoção de vários nucleótidos a montante e a jusante
3. EXCISÃO onde houve a distorção da molécula de DNA (ao contrário do BER que há
4. SÍNTESE remoção de uma base apenas). Posteriormente haverá DNA polimerases e DNA
ligases que vão completar o que foi removido.

• Uma das doenças conhecidas que ocorre devido a mutações nos genes envolvidos neste mecanismo é a Xeroderma
pigmentosum. Torna as pessoas extremamente sensíveis à luz.

MECANISMOS DE SUBSTITUIÇÃO DE NUCLEÓTIDOS – MMR

• O MMR é um mecanismo que ocorre após a replicação, ou seja, a mutação aconteceu, o mecanismo de revisão de
provas não corrigiu, mas ocorreu uma distorção qualquer a nível da molécula de DNA, que vai ser então corrigida
por este mecanismo logo após a replicação. Este mecanismo baseia-se na capacidade do sistema em distinguir a
cadeia neosintetizada e a que serviu de molde, uma vez que quando há um emparelhamento incorreto, o sistema
de reparação tem de saber qual das duas cadeias é a neosintetizada (com o nucleótido incorreto) para assim
proceder a correção.
o Em bactérias sabe-se que o que distingue a cadeia neosintetizada e a cadeia molde é o facto de a cadeia
neosintetizada ainda não estar metilada (por isso é que este mecanismo tem de acontecer logo após a
replicação).
o Esta deteção é possível através da diferença no tempo da metilação da cadeia neosintetizada.
o Em eucariotas ainda não se sabe muito bem como é que se faz esta distinção, mas existem enzimas
homólogas às que existem em E. coli. Contudo ainda não se identificou nenhuma enzima homóloga à MutH.
• Em E. coli, as enzimas responsáveis por detetar qual a cadeia neosintetizada que possui um mismatch são a MutH,
a MutL e a MutS.
o A MutS e a MutL atuam em conjunto no reconhecimento do mismatch da cadeia neosintetizada; estas duas
enzimas vão ativar a Mut H.
o Em E. coli existem muitas sequências GATC ao longo do genoma, em que a adenina está metilada. A MutH
vai estar localizada junto a estas regiões metiladas, uma vez que a sua função quando ativa é clivar estas
regiões metiladas específicas.

Página 97 de 109
o Quando ocorre uma mutação, esta vai estar necessariamente entre duas destas sequências GATC com a
adenina metilada. Deste modo, qualquer uma das Mut H (a jusante ou a montante) pode detetar a mutação
e clivar a região metilada.
o Quando isto acontece, existem
enzimas que vão abrir a cadeia e
permitir que haja degradação da
cadeia neosintetizada. Quem faz esta
excisão vão ser DNA polimerases com
atividade 5’-3’ e 3’-5’ exonucleolítica
(consoante se foi clivado a montante
ou a jusante, respetivamente).
o A degradação ocorre do local onde o
Mut H foi ativado até à mutação.
o Posteriormente a DNA polimerase III
vai polimerizar e a DNA ligase vai ligar
os nucleótidos.
o Este sistema exige um grande gasto de energia.

Mutações Mecanismos de Reparação


muitos mecanismos de reparação não conseguem
Tautomerização reconhecer formas tautoméricas, e por esse motivo,
muitas vezes, o erro não é corrigido
Depurinação sistema de reparo de excisão de bases (BER)
Desaminação BER
*Desaminação da 5-metilcitosina em timina MMR
Lesões Oxidativas BER
Agentes alquilantes BER / NER / Método Direto (alquiltransferases)
Agentes Cross-Linking NER
Agentes intercalantes MMR
Fotodimerização CPD – NER / Método direto (CPD fotoliase – não
detetada em animais placentários)
6-4 products: Método direto (6-4 fotoliase)

DOENÇAS ASSOCIADAS A MUTAÇÕES

• Existem doenças que são fruto do incorreto funcionamento dos sistemas de reparação, ou até mesmo provocadas
pela próprias existência de um sistema de reparação.

Página 98 de 109
FRAGILE-X SYNDROME

• Por vezes a DNA polimerase quando encontra sequências muito


repetidas (ex: GGCGGCGGCGGC) ela por vezes faz o que se chama
replication slippage, ou seja, ela está a polimerizar e como as
sequências são tao repetidas, ela recua e volta a polimerizar, gerando-
se um loop de sequências repetidas. Isto é um fenómeno que se
verifica em regiões com sequências muito repetitivas.
• Ora, a primeira coisa que pensamos é que o mismatch repair (MMR)
deveria remover esta sequência. Mas não, o MMR em vez de remover,
vai compensar e preenche na outra cadeia. A este fenómeno chama-
se uma expansão de trinucleótidos repetidos (neste caso
trinucleótidos porque eram 3 nucleótidos que se estavam a repetir).
• Estas sequências repetidas estão localizadas a montante do codão de
iniciação do gene FMR19. Um indivíduo que possua entre 6 a 59
repetições é considerado normal.
• Quando existem entre 60 e 200 repetições, já falamos de pré-mutação, ou seja, o indivíduo ainda é considerado
normal, mas já é transmissor dessa mutação.
• Intuitivamente percebemos que quanto maior for o número de repetições, maior será a tendência da DNA
polimerase fazer estes
“replication slippages”.
• Quando existem mais de 200
repetições, estas regiões vão ser
metiladas e vai haver
silenciamento da expressão, ou
seja, deixamos de ter expressão
de um gene envolvido na
regulação da tradução de genes
relacionados com a maturação
sinática.
• Como este gene está localizado
no cromossoma X, chama-se Síndroma X-Frágil. O fenótipo desta
doença é um atraso cognitivo do indivíduo.
• O diagnóstico desta doença pode ser feito através de PCR. Caso
tenha havido expansão (sugerindo uma replication slippage), a
dimensão do produto PCR vai ser maior do que o normal.

9
Gene expresso maioritariamente nas células cerebrais. Regula a tradução de vários genes envolvidos na maturação sinática.

Página 99 de 109
• Outras doenças que sofrem esta expansão de trinucleótidos são: doença de Huntington e spinocerebellar ataxia,
por exemplo.
• Existem muitas outras desordens, mas todas partilham uma característica em comum: o facto de se tornarem mais
severas ao longo das gerações, devido à progressão da expansão das repetições.

HEREDITARY NONPOLYPOSIS COLORECTAL CANCER

• Mutações no genes envolvidos no sistema MMR são responsáveis pelos síndromes de suscetibilidade ao cancro
hereditários mais comuns, como é o caso do cancro colorretal hereditário (HNPCC). Aproximadamente 15% de
cancros no cólon são deste tipo.
• No nosso genoma, temos genes de cópia única, temos genes que se podem repetir mais do que uma vez e temos
sequências altamente repetitivas que não codificam nada. Temos muito DNA repetitivo no nosso genoma (mais de
50% do DNA humano são sequências repetitivas).
o De entre essas sequências repetitivas existem os microssatélites.
▪ Os microssatélites são sequências (do género do exemplo do GCCGCCGCC) que se repetem ao
longo do genoma. São conhecidas as regiões onde estes microssatélites estão.
o Como vimos anteriormente, os eucariotas (nomeadamente nós humanos) possuem enzimas homólogas às
que existem em E. coli, que são a MLH1 e a MSH2 (semelhantes à MutL e MutS). Este tipo de cancro está
relacionado com uma perda de função de um alelo, dos genes que codificam o MLH1 e o MSH2 em
humanos.
• Através do PCR, conseguimos perceber se o tumor está ou não relacionado com uma mutação nestes sistemas de
reparação. Se a dimensão dos microssatélites variar nas várias células tumorais, é evidência que está relacionado
com uma mutação num gene de MMR.

TRANSLESION DNA POLYMERASES

• Por vezes, quando ocorre uma mutação, se esta não for reparada, a DNA polimerase para a replicação. Contudo,
existem DNA polimerases (translesion DNA polimerases) que “ultrapassam” as lesões, ou seja, mesmo que a
mutação não seja reparada, elas continuam a replicação.
• A lesão mantém-se, mas pelo menos a célula não morreu.
• Estas DNA polimerases ocorrem frequentemente quando existem muitas lesões na célula e esta não tem a
capacidade de responder por todas aquelas
lesões através dos seus sistemas de reparação.
No fundo, estas DNA polimerases são uma
“estratégia de desespero”.
• A lesão ficou e vai se propagar nas divisões
celular seguintes se não houver mecanismos de
reparação, aumentando assim a taxa de
mutação.

Página 100 de 109


REPARAÇÃO DE MUTAÇÕES QUE GERAM QUEBRAS DE DNA EM CADEIA DUPLA (DSB)

• As DSB (Double-strand break) são as lesões de DNA mais letais, que se não forem corrigidas, a célula morre.
• Os dois principais mecanismos que existem para a reparação destas quebras são:
o Reparação por recombinação homóloga (HR);
▪ Este mecanismo normalmente corrige o erro, desde que existe uma cadeia molde para o DNA ser
copiado.
▪ Quando existem defeitos nos genes responsáveis pela recombinação homóloga, vai haver uma
série de doenças (nomeadamente cancro) associadas.
o Reparação por recombinação não homóloga (non-homologous end-
joining - NHEJ);
▪ Este mecanismo pode gerar uma série de mutações no local
de reparação;
• Esta quebra na dupla cadeia por ocorrer devido:
o Exposição de raios UV ou raios γ;
o Durante a replicação, quando o garfo de replicação chega a um local
com um corte devido à ação de mecanismo como o BER e o NER, que
ainda não tiveram tempo de substituir completamente e reparar o
dano. Como o DNA tem uma quebra, torna-se impossível que a
replicação continue. (Ver a imagem ao lado).

REPARAÇÃO POR RECOMBINAÇÃO HOMÓLOGA (HR)

• O mecanismo de reparação por recombinação homóloga,


ocorre entre duas regiões de DNA que possuam
sequências semelhantes.
• O que acontece é que as extremidades que se formaram
nas cadeias devido ao corte, vão ser processadas em 3’ ss
extensions pela ação de helicases e nucleases, formando
extremidades projetadas.
• Posteriormente ocorre uma strand invasion, em que
basicamente estas extremidades em cadeia simples vão
invadir por recombinação homóloga a cadeia de DNA
molde intacta.
• Deste modo, forma-se um D-loop, que vai permitir a
polimerização da região onde ocorreu o corte como está
demonstrado na imagem ao lado.

Página 101 de 109


REPARAÇÃO POR RECOMBINAÇÃO NÃO HOMÓLOGA (NHEJ)

• O outro mecanismo de reparação é o NHEJ, um


importantíssimo mecanismo de reparação nos eucariotas,
embora já se tenha sido detetado em bactérias e leveduras.
• O NHEJ permite reparar os DSB que ocorrem fora da meiose,
durante as fases G1 e G0 do ciclo celular (quando os
cromossomas homólogos não estão emparelhados). Deste
modo, o mecanismo HR é preferencial nos eucariotas nas
fases S e G2 (onde os cromossomas estão a ser replicados).
• As nossas células estão na grande maioria das vezes estão
em fases G1 e G0 porque são células diferenciadas, só as
células estaminais é que estão sempre em divisão (daí este mecanismo ser muito importante nos eucariotas).
• Contrariamente ao que acontece no HR, no mecanismo NHEJ é raro a sequência manter-se idêntica.
• O que acontece no fundo é: as proteínas Ku70 e Ku80 formam um heterodímero, e juntamente com uma cinase
dependente de DNA e uma proteína Artemis, vão se
ligar às extremidades que se formaram devido ao
corte na dupla cadeia. O heterodímero tem atividade
helicásica, e vai separar as cadeias de DNA.
• Posteriormente, a Artemis quando é fosforilada, vai
atuar como endonucleases e criar um desfasamento
nas cadeias (há perda de informação, daí se dizer que
ao contrário da HR é raro a sequência manter-se
igual). Este desfasamento vai formar regiões de
microhomologia entre as duas cadeias, formando-se
sinapses de DNA.
• Depois, as DNA polimerases translesion vão estender
as cadeias, e as DNA ligases vão ligar os nucleótidos
entre si.
• Deste modo, podemos ver que de facto houve
reparação, contudo, é um processo que introduz
muitas vezes mutações. Assim, este é um sistema de
reparação que funciona porque repara o corte na
cadeia dupla, mas gera mutações.

CHECKPOINTS

• No fundo, quando a célula sofre mutações, umas são reparadas, outras nem por isso, mas existem mecanismos
checkpoint no ciclo celular, que são pontos estratégicos (checkpoint G1, checkpoint G2 e checkpoint M), em que a
célula para o seu ciclo celular para que haja reparação a vários níveis.

Página 102 de 109


• Quando existem danos a nível do DNA, existe uma série de moléculas que se chamam sensores de corte em cadeia
dupla, que se vão logo ligar às extremidades que se formam do corte da cadeia dupla. Estes sensores vão
desencadear uma série de sinais que seguem vias de transdução de sinal. Assim, as quatros respostas possíveis
destes sensores são:
o A célula vai reparar;
o A célula vai parar o ciclo celular;
o A célula vai ativar a transcrição de genes que vão ajudar a superar os danos que ocorreram;
o A célula entra em apoptose;
• A resposta dada pela célula vai depender da quantidade, do tipo de dano e das vias que foram selecionadas para
responder a estes danos.
• Na tabela seguinte está um apanhado de várias coisas que se falou que a professora projetou no final desta aula:
Raios-X Raios-X
Agente
Agentes alquilantes Raios UV Agentes anti- Erros na replicação
mutagénico
Reações espontânesas tumorais
A-G mismatch
Mutação Locais abásicos Cross-link T-C mismatch
CPD
Guaninas oxidadas DSB Inserção ou deleção
Reparação BER NER HR, RJ MMR

RECOMBINAÇÃO HOMÓLOGA
• A primeira vez que o termo recombinação homóloga surge é em 1860, quando Mendel fala de sorteamento
independente dos genes, e que havia crossing-over.
• O primeiro modelo que surgiu que explicava molecularmente o que acontecia na molécula de DNA para que
houvesse recombinação foi em 1960, o modelo de Robin Holliday.
• Para haver recombinação, é preciso que haja sempre uma interação entre duas moléculas de DNA que leve à troca
de informação genética e que pelo menos uma delas altere a sua sequência.
• É um mecanismo universal, é muito semelhante em todos os organismos com algumas variantes.
• Os eventos da recombinação são muito importantes na natureza, porque têm um papel importante na reparação
do DNA, permite a diversidade genética (crossing-over), permite que haja adaptação e evolução e atualmente sabe-
se que ocorre recombinação para a manutenção dos telómeros.
• Os eventos moleculares que ocorrem na recombinação são:
o Clivagem e depois ligação das moléculas de DNA.
o Existem várias vias de transdução de sinal, envolvendo diferentes enzimas (nucleases, helicases, SSB, DNA
polimerases, DNA ligases).
o O mecanismo mais conhecido quando falamos de recombinação, é a recombinação homóloga quando há
homologia entre as duas sequências que estão a recombinar. Contudo, também existem mecanismos de
recombinação entre sequências que não partilham homologia (chamadas “recombinações ilegítimas”)

Página 103 de 109


TIPOS DE RECOMBINAÇÃO

• RECOMBINAÇÃO HOMÓLOGA: requer


homologia entre as sequências de DNA (ou
homologia parcial)
o Ex: Meiose, Mecanismos de reparação,
Mitose, Tranferência horizontal entre
bactérias;
• RECOMBINAÇÃO NÃO HOMÓLOGA: ocorre
quando não há homologia entre as sequências
de DNA;
o Ex: Mecanismos de reparação, Recombinações ilegítimas;
• RECOMBINAÇÃO SITIO-ESPECÍFICA: envolve homologia entre sequências muito curtas (entre 20 e 200 pb) em
regiões muito específicas, que é mediada por enzimas específicas (recombinases).
o Ex: Integração de fagos no genoma de bactérias.
• TRANSPOSIÇÃO: envolve interação entre as extremidades dos elementos móveis do DNA e sequências alvo na célula
hospedeira. Tipo muito especializado de recombinação.
o Ex: Integração de transposões.

RECOMBINAÇÃO HOMÓLOGA

• É um processo biologicamente universal. Está conservada nos três domínios da vida.


• Pode variar nas suas vias nos vários organismos e tipos de célula. Contudo existem passos fundamentais que são
comuns a todos:
o Clivagem de DNA;
o Strand Invasion (de pelo menos uma das cadeias) e emparelhamento de bases;
o Há dissociação da dupla cadeia;
o Formação de uma heteroduplex (dupla hélice que tem cadeias de origens diferentes);
o Resolução dessa invasão e de alguma migração;
o Ligação do DNA;

MODELO DE HOLLIDAY

• O modelo de Holliday ele preconiza que há um corte em cadeia simples em


ambas as cadeias de DNA, há invasão das cadeias, e o ponto onde estas cadeias
se cruzam, designa-se por junção de Holliday. A partir desta strand invasion vai
acontecer o branch migration que levará à formação de uma heteroduplex.

Página 104 de 109


• Na strand invasion está envolvida uma proteína, a RecA, que é uma proteína charneira na medida em que está
envolvida em todos os mecanismos de recombinação homóloga. Deste modo, uma mutação nos genes que
codificam esta proteína, fará com que este organismo não consiga efetuar mecanismos de recombinação homóloga.
• Esta proteína chama-se RecA em E. coli, mas nos outros sistemas ela poderá ter outros nomes, mas apresenta
sempre homologia com esta proteína RecA da E. coli. É das proteínas que se pode dizer que está mais conservada
nestes sistemas.
• Após a invasão, há uma migração (branch migration) que
é possível devido à ação de duas proteínas (RuvA e a RuvB)
que têm atividade helicásica (são chamadas de DNA
helicases ou DNA translocases porque permitem que haja
este avanço). As cadeias vão então ser “abertas”, e vai
haver uma resolução que faz com que as moléculas deixem
de estar interligadas.
• Ela pode girar sobre si própria, ela abre, e depois vai sofrer uma clivagem por uma proteína chamada RuvC que
pode clivar num plano horizontal ou vertical (como está demonstrado na imagem).
• Consoante se a clivagem ocorre no plano horizontal ou vertical, os recombinantes que se formam serão diferentes.
• Como é possível observar na imagem ao lado,
no primeiro caso, os recombinantes mantêm o
genótipo parental. Isto não quer dizer que não
houve recombinação, apenas não é detetável.
• No segundo caso, os recombinantes que se
formam apresentam um genótipo diferente.
• O facto de nós detetarmos ou não que houve
recombinantes tem a ver com uma resolução, com
um corte, contudo há recombinação nos dois casos.
• Este é o grande problema dos mecanismos que
envolvem a recombinação homóloga, é olhando só
para os produtos da recombinação, não se consegue
perceber o que é que aconteceu.
• O que Robin Holliday conseguiu fazer, foi detetar a formação da heteroduplex por microscopia eletrónica. Contudo,
o seu modelo não explicava tudo, e a partir daí surgiram outros modelos.

ENZIMOLOGIA EM EUCARIOTAS ENVOLVIDA NA RECOMBINAÇÃO

• Existem muitas enzimas descritas, algumas existem quer na meiose, quer na mitose, outras existem
especificamente para uma delas.
• Muito complexa, não temos que saber detalhes.

Página 105 de 109


ENZIMOLOGIA EM PROCARIOTAS NA RECOMBINAÇÃO

• Em E. coli há um sistema muito bem estudado e caracterizado, que é o sistema RecBCD que envolve as enzimas
RecB, RecC e RecD.
• Este sistema é o principal sistema para explicar as quebras e o arranjo que existe quando há cortes em cadeia dupla.
o A RecB tem atividade helicásica e nucleásica (cliva);
o A RecD tem atividade helicásica;
• Quando há um corte, estas enzimas ligam-se e começam a
progredir ao longo da cadeia de DNA que foi clivada, vão
degradando e clivando ambas as cadeias da molécula de
DNA. A determinada altura, surge uma sequência Chi (5’
GCTGGTGG 3’), à qual se vai ligar a RecC. Existem cerca de
1000 e tal sequências destas no genoma de E. coli. É nestas
sequências que este conjunto de enzimas fica ancorado
(através da proteína RecC que fica ligada). Isso vai fazer com
que comece a haver degradação apenas de uma das cadeias,
formando uma extremidade 3’ projetada.
• A RecB tem a capacidade de recrutar a RecA (proteína
principal de todos os mecanismos de HR), que vai ligar-se à
sequência Chi e vai fazer com que ocorra uma strand invasion.
• Nesta clivagem e resolução, sobretudo em bactérias, podemos ter duas moléculas em que ambas as moléculas
trocam informação e são recombinantes (recombinação recíproca), ou só uma delas é que fica recombinante
(recombinação não recíproca). A resolução e a migração são efetuadas pelas proteínas Ruv A, B e C.
• Por vezes, é do nosso interesse ter uma estirpe RecA-, porque não queremos que haja integração de qualquer DNA
no genoma de E. coli.
• Para além deste sistema que repara os cortes de cadeia dupla em E. coli, temos também um sistema de RecF que
repara cortes de cadeia simples.

Nota: A imagem acima não é fantástica, porque não ilustra exatamente o que acontece (há uma região que devia estar
toda degradada por exemplo). Para perceber melhor: https://www.youtube.com/watc?v=GzUE-Qdf3bM

MECANISMOS DE TRANSFERÊNCIA DE DNA EM BACTÉRIAS

• Os 3 principais mecanismos de transferência de informação em


bactérias são:
o TRANSFORMAÇÃO: Quando DNA livre entra para
dentro da bactéria e por recombinação integra o
genoma da bactéria
o TRANSDUÇÃO: Transferência de informação genética
mediada por um fago.
o CONJUGAÇÃO: Passagem de plasmídeos que entram para dentro da bactéria.

Página 106 de 109


TRANSFORMAÇÃO

• A transformação é a capacidade que as bactérias têm de, com muita facilidade captarem de uma forma dinâmica e
ativa pedaços de DNA de bactérias (não necessariamente da mesma espécie) que existam no seu meio extracelular.
• As bactérias introduzem os nucleótidos no seu meio intracelular e degradam-nos, de forma a utilizá-los. Desta
forma, não têm que “perder tempo” a sintetizá-los.
• Graças a esta capacidade, as bactérias podem ganhar aptidões novas, características genómicas que antes não
possuíam, como por exemplo, ganharem resistência a um determinado antibiótico.
• Na imagem seguinte temos uma célula dadora que possui cópias dos genes a,b e c selvagens (funcionais) e uma
célula recetora que é mutante para estes genes.
• Na transformação, pega-se na estirpe
dadora e fragmenta-se
mecanicamente e aleatoriamente o
DNA, e estes fragmentos são postos
em contacto com a estirpe recetora.
• Desta forma, através do processo de
transformação, a estirpe recetora
pode incorporar estes fragmentos no
seu genoma. Por vezes, se dois genes
estiverem suficientemente perto (como é o caso dos genes a e b), poderão ser incorporados em simultâneo a partir
do mesmo fragmento. Estes fragmentos irão ser incorporados na célula recetora através de crossing-over.
• As bactérias que sofrem transformação, são chamadas de transformantes.
• Se estes genes estiverem envolvidos na síntese de determinados aminoácidos, o meio em que elas vão crescer terá
de ter o aminoácido para o qual são mutantes. Assim, para detetarmos se a bactéria transformante incorporou por
exemplo o a+, colocamos a bactéria num meio que possua b e c (caso a bactéria cresça, é sinal que incorporou).
Isto não quer dizer que a bactéria não seja também, por exemplo, c+, mas como não selecionamos um meio para
isso, não é detetável.

APLICAÇÕES

• Existem vários exemplos de como é que podemos utilizar estes mecanismos


na tecnologia.
• Um exemplo é quando nós queremos eliminar completamente um gene do
genoma, criar uma mutação num gene alvo, por exemplo um gene que
confere sensibilidade a um antibiótico. Eu posso arranjar um DNA
plasmídico que tem uma região de homologia com a região a montante e a
jusante desse gene, mas que contenha o gene que confere resistência ao
antibiótico. Então promovemos a transformação (a estirpe tem de ser
RecA+ para poder recombinar), e depois colocamos a estirpe num meio
com o antibiótico. Só vão crescer nesse meio, as estirpes transformantes.

Página 107 de 109


• Vejamos o seguinte exemplo:
o Temos uma estirpe recetora que é
lis+ e his-. Queremos incorporar
um plasmídeo com o gene his+,
contudo, estes plasmídeo possui a
ladear o gene his+ regiões de
homologia com as regiões que
ladeiam o gene lis+ da célula
recetora. Caso ocorra transformação (recombinação homóloga), a estirpe transformante passa a ser his+,
mas também lis-.
o PERGUNTAS:
▪ Qual deve ser a composição do meio para o crescimento da célula recetora (se é recetora, ainda
não é transformante)? Meio mínimo com histidina.
▪ Como é que selecionamos os recombinantes? Colocamos num meio mínimo com lisina (os que
crescerem são recombinates).

TRANSDUÇÃO

• Os fagos têm dois tipos de ciclos: ciclo lítico e ciclo lisogénico. No ciclo lítico o fago adsorve a superfície bacteriana
e injeta o seu DNA no interior da bactéria, que por sua vez vai-se replicar e provocar a lise do hospedeiro.
• No ciclo lisogénico, os fagos integram o seu DNA no interior de uma bactéria, e vão incorporar o genoma do
hospedeiro. Estes fagos transdutantes vão poder transferir qualquer gene bacteriano a uma bactéria recetora.
• Desta forma, a transdução é uma forma de trocar material genético nas bactérias mediada por fagos. Estas, tal
como nós, têm vírus que as parasitam designados bacteriófagos ou fagos. Eles adsorvem a parede bacteriana e
injetam o seu DNA na célula bacteriana. Esse DNA, aproveitando a maquinaria do seu hospedeiro, vai ser replicado
e vai eventualmente provocar a lise da célula.
• Por vezes acontece, que após a lise
celular, uma das partículas fágicas
transdutantes resultantes da lise, pode
por engano, transportar um gene da
bactéria hospedeira que sofreu lise. Ao
parasitar uma nova bactéria, pode por
recombinação homóloga incorporar
esse gene na bactéria recetora (pró-
fago).
• O fago lambda (λ) é um bacteriófago
lisogénico que tem no seu genoma uma região attP, que é muito semelhante a uma região attB que existe no
genoma de E. coli, localizado entre os genes gal e bio. Neste caso falamos de uma transdução sitio-específica,
porque vai ocorrer recombinação sempre num local específico. Isto é possível devido a uma enzima que existe no

Página 108 de 109


fago, chamada integrase, que vai
gerar cortes desfasados na dupla
cadeia do fago e da bactéria,
formando-se uma heteroduplex, e o
fago incorpora a bactéria, sempre no
mesmo local. Esta enzima é um tipo
1 2 3
de recombinase e vai também ligar o
DNA.
• A partir daqui, começou a perceber-se que há uma recombinação que é sitio-específica, que tem curtas sequências,
e é mediada sempre por enzimas muito específicas que só reconhecem aquele local.
• Desenvolveram-se entretanto outros sistemas de recombinação que são muito utilizados para manipulação do
genomas.
o Exemplos: sistema que envolve uma recombinase CRE; sistema que envolve uma recombinase FLP (flipase).
o Os locais que elas reconhecem estão bem identificados (locais loxP e FRT respetivamente);
o Estes sistemas são chamados CRE-lox e FLP-FRT.
o Ambas as sequências reconhecidas
por estas enzimas são “inverted
repeats”, mas no centro destas
sequências existe um core que não
é palindrómico (ver imagem ao
lado).
o É esta sequência do meio que
confere uma direccionalidade em
relação à sequência onde ela é inserida. Assim, na imagem seguinte temos o seguinte caso: Duas sequências
FRT estão no genoma com direccionalidades opostas. Vai haver homologia entre estas sequências, e
quando ocorre recombinação pelas flipases, o resultado é aquela região “ficar ao contrário”, dá-se uma
inversão. No caso de terem a mesma direccionalidade, poderá acontecer a inserção ou deleção de
sequências, como está demonstrado na imagem seguinte.
• Deste modo, através de uma
recombinação sitio-específica,
e com recombinases tão
específicas, é possível utilizar
estes mecanismos em
qualquer organismo, para
manipular o genoma (ativar
um gene, inserir um gene, ou
até mesmo substituir um
gene).

Página 109 de 109

Você também pode gostar