LivroBiologiaMolecular 1

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 355

Biologia Molecular

MATERIAL GENÉTICO

Dario Abel Palmieri


Gleice Ribeiro Orasmo
Sérgio Emílio dos Santos Valente

1
Biologia Molecular

2
Biologia Molecular

SUMÁRIO

CAPÍTULO 1. MATERIAL GENÉTICO

1.1. ESTRUTURA DO MATERIAL GENÉTICO...................05


1.2. CÓDIGO GENÉTICO.....................................................09
1.3. SÍNTESE PROTÉICA.....................................................11
1.4. MUTAÇÃO......................................................................16
1.4.1. ANEMIA FALCIFORME...............................................21
1.4.2. SISTEMA DE REPARO..............................................22
1.5. CONSIDERAÇÕES FINAIS............................................23
1.6. GUIA DE ESTUDO.........................................................24

3
Biologia Molecular

4
Biologia Molecular

1.1. ESTRUTURA DO MATERIAL GENÉTICO

Desde 1865, quando Gregor Mendel propôs as leis da he-


reditariedade, até o momento atual, houve um grande avanço
na Área das Ciências Biológicas. Embora a Biologia Molecular
tenha sua existência há apenas seis décadas, foi a área que
mais avançou no último século.

Hoje em dia, qualquer estudante com um mínimo de infor-


mação em biologia sabe que as características genéticas da
grande maioria dos seres vivos são transmitidas de geração
a geração pelo ácido desoxirribonucléico (DNA). No entanto,
somente na década de 1940 se definiu que o DNA era a molé-
cula responsável pelo armazenamento e transmissão das ca-
racterísticas hereditárias. Em 1953, James D. Watson e Fran-
cis H. Crick esclareceram que a molécula de DNA seria uma
macromolécula (polímero) formada pela associação de vários
monômeros, os nucleotídeos.

O Genoma Humano é constituído de aproximadamente três


bilhões de pares de nucleotídeos, sendo que um cromossomo
humano formado apenas por uma molécula de DNA, muito longa
a qual se enrola, compactando-se. A cromatina é o material de
que são feitos os cromossomos, composta por DNA e proteínas.
A unidade estrutural básica da cromatina é denominada nucleos-
somo (fibra de 10nm). O nucleossomo é um conjunto de proteí-
nas histônicas sobre o qual a molécula de DNA dá duas voltas,
formando uma fibra com aspecto de contas em um colar.

Há dois níveis de empacotamento do DNA nos cromosso-


mos. O primeiro é a formação da fibra de 10 nm. O segundo
nível de compactação da cromatina é obtido pelo fato dos nu-
cleossomos enrolarem-se sobre si, formando uma estrutura
que pode ser visualizada ao microscópio eletrônico, o Solenói-
de (fibra de 30nm).
5
Biologia Molecular

Os 46 cromossomos de uma célula somática humana


contêm 6109 nucleotídeos. Se considerarmos cada base ni-
trogenada como uma letra, o conteúdo de informação de um
cromossomo humano corresponderia a cerca de 500 milhões
de palavras. Se existem cerca de 300 palavras em uma pági-
na impressa comum, isso corresponde a mais ou menos dois
milhões de páginas. Se um livro comum contém 500 páginas
desse tipo, o conteúdo de informação de um único cromosso-
mo humano corresponde a aproximadamente quatro mil volu-
mes, ou seja, a sequência de bases contidas no nosso DNA
representa uma enorme quantidade de informação.

Os nucleotídeos são moléculas formadas pela ligação de


compostos de carbono contendo nitrogênio com estruturas em
anel denominadas bases nitrogenadas, com uma molécula de
açúcar (desoxirribose) e um grupo fosfato. As bases nitroge-
nadas encontradas na molécula de DNA são: adenina (A) e
guanina (G), chamadas púricas; e citosina (C) e timina (T),
chamadas pirimídicas.

A informação hereditária é determinada pela sequência


desses quatro tipos de nucleotídeos. Podemos dizer que a lin-
guagem do mecanismo da hereditariedade é escrita com um
alfabeto de apenas quatro letras. Em todos os organismos,
com exceção de alguns vírus, a molécula responsável pelas
características hereditárias é o DNA, bem como as instruções
genéticas de todas as formas de vida da Terra são escritas
na mesma língua, usando o mesmo código genético. Na rea-
lidade, essa linguagem genética comum a todas as espécies
constitui um ponto de apoio à teoria de que todos os organis-
mos da Terra descendem de um único ancestral.

Em 1890, foi descoberto em levedura (fermento biológico)


outro tipo de ácido nucléico, que possuía uracila (U) ao invés
de timina e o açúcar ribose ao invés da desoxirribose. Dessa
6
Biologia Molecular

maneira, foram caracterizados dois tipos de ácidos nucléicos,


de acordo com o glicídio que possuíam: ácido ribonucléico
(RNA) e ácido desoxirribonucléico (DNA).

Tanto a molécula de DNA, quanto a de RNA, são políme-


ros de nucleotídeos, os quais estão unidos por ligações fos-
fodiéster. Esta ligação ocorre entre a oxidrila do grupo fosfato
ligado no carbono 5 da pentose e a hidroxidrila do carbono 3
da pentose de nucleotídeos adjacentes.

Enquanto a molécula de RNA é constituída por apenas


uma cadeia linear de polinucleotídeos, a molécula de DNA
apresenta dois filamentos com conformação espacial em hé-
lice, chamada por isso de dupla hélice. Numa representação
plana, a molécula de DNA se assemelha a uma escada, onde
a pentose e o grupo fosfato seriam o corrimão e as bases
nitrogenadas, unidas por meio de pontes de H, seriam os de-
graus.

É importante observar que a molécula de DNA por ser uma


fita dupla apresenta orientação oposta entre as fitas, uma vez
que a DNA polimerase, a enzima que catalisa a ligação fosfo-
diéster, adiciona um nucleotídeo à hidroxila livre na extremida-
de 3’, quando da formação de uma nova molécula. De manei-
ra que o crescimento de uma das fitas se dá para um sentido
e a outra fita para o outro sentido. Assim, a configuração de
dupla hélice da molécula de DNA se dá justamente pelo senti-
do oposto das duas fitas.

As células representam a unidade dos organismos vivos


e são compostas de dois compartimentos básicos: o núcleo
e o citoplasma. O DNA é encontrado principalmente no nú-
cleo de células eucariontes e em pequenas quantidades nas
mitocôndrias e nos cloroplastos (em células vegetais). Já o
RNA é encontrado principalmente no citoplasma e, em menor
7
Biologia Molecular

quantidade, no interior do núcleo, nas mitocôndrias e nos clo-


roplastos.

Em células procariontes o DNA está contido no cromosso-


mo bacteriano e em moléculas pequenas denominadas plas-
mídeos, que se situam dispersas no citoplasma bacteriano, já
que essas células não possuem envoltório nuclear.

Tabela 1 - Principais características dos ácidos nucléicos.

O DNA consegue armazenar a informação genética por con-


seguir produzir cópias perfeitas de si mesmo, por meio da repli-
cação semiconservativa. Nesse modelo de replicação, uma molé-
cula sintetiza duas idênticas a ela, com cada uma das moléculas
filhas apresentando uma fita antiga (fita molde), oriunda da molé-
cula original, e uma molécula nova, recém sintetizada.
8
Biologia Molecular

A informação genética fica armazenada no DNA e no RNA


(formados por nucleotídeos); porém, os organismos são cons-
tituídos basicamente por proteínas, formadas por aminoáci-
dos.

1.2. CÓDIGO GENÉTICO

O dogma central da Biologia Molecular consiste na trans-


crição das informações genéticas do DNA em moléculas de
RNA, que por sua vez são traduzidas nas proteínas. Os genes
seriam, em geral, sinônimos de proteínas, flanqueaods por se-
quências que regulam a atividade gênica.

Alguns anos se passaram para o homem esclarecer como


ocorria a síntese de proteínas. Sabia-se que a molécula de
DNA variava em apenas quatro tipos de nucleotídeos. Portan-
to, o código genético construído a partir de quatro letras deve-
ria ser capaz de informar às células quais dos 20 aminoácidos
tinham de ser ligados a fim de formar os milhares de proteínas
constituintes de bilhões de formas de vida.

Combinações de duas letras possibilitariam apenas 16


possíveis “palavras”. Mas combinações triplas produziriam 64
“palavras”, quantidade mais que suficiente para a produção
dos 20 aminoácidos.

O código genético foi então decifrado na década de 1960,


mostrando que os aminoácidos se organizam a partir de uma
sequência de 3 bases nitrogenadas apenas, sequências de-
nominadas de códons. Cada três letras do DNA controlam a
adição de um aminoácido na molécula da cadeia polipeptídica,
de acordo com o código genético (Tabela 2). Primeiramente,
a informação genética do DNA é transcrita em um RNAm que
leva essa informação do núcleo para o citoplasma, objetivan-
do a tradução em uma sequência de aminoácidos.
9
Biologia Molecular

Tabela 2 - O código genético. Cada conjunto com três bases


(códons) determina a entrada de um aminoácido específico ou
marca o fim da síntese na cadeia polipeptídica.

Até 1965, os aminoácidos correspondentes de pratica-


mente todos os 64 códons possíveis haviam sido determina-
dos em laboratório. Observou-se que alguns códons eram re-
dundantes, com certos aminoácidos sendo especificados por
dois, quatro e até seis trincas diferentes. O código genético
foi então chamado degenerado. Surgem então algumas ques-
tões não esclarecidas ainda. Por que 20 e somente 20 amino-
ácidos padrão? Por que alguns aminoácidos têm seis códons
correspondentes, enquanto outros têm só um ou dois?

Além disso, observou-se que o código genético não era ambíguo


(não há um mesmo códon que codifique aminoácidos diferentes).

Em termos evolutivos, a distribuição de códons para ami-


noácidos teria sido obra do acaso. Porém, uma vez que o có-
digo havia surgido, tornou-se tão fundamental para a vida que
10
Biologia Molecular

qualquer modificação nele seria extremamente prejudicial. Às


vezes, uma mutação em um único gene pode ser benéfica,
se permitir aos organismos um desempenho melhor. Porém,
ao modificarmos a forma de leitura do código genético, esta-
ríamos introduzindo alterações em inúmeros pontos de seu
material genético, resultando em numerosas modificações em
todas as enzimas de um indivíduo. Seria como trocarmos to-
das as letras de um texto ao acaso. O prejuízo seria enorme e
a morte daquele organismo seria praticamente certa.

Observou-se que todo ser vivo apresentava as mesmas


regras de codificação, ou seja, o código genético era o mesmo
para todos os seres vivos (o código genético é universal), com
raras exceções.

Por exemplo, enquanto a maioria dos organismos leria


o códon de RNA “CUG” como o aminoácido leucina, muitas
espécies do fungo Candida o traduzem como serina. No ge-
noma mitocondrial do fermento de pão, ou levedura de cer-
veja (Saccharomyces cerevisiae), quatro dos seis códons que
normalmente codificam a leucina significam treonina. Porém
a base continua a mesma: códons de trincas de nucleotídeos
são traduzidos em aminoácidos.

Salienta-se ainda que existam códons iniciadores e de térmi-


no. O códon iniciador da síntese da cadeia polipeptídica seria a
trinca AUG em eucariotos e procariotos. Os códons de término
(fatores de liberação de proteína) seriam UAA, UAG e UGA.

1.3. SÍNTESE PROTÉICA

Para que a sequência de genes seja convertida em uma


sequência de aminoácidos, primeiramente o gene, que é um
segmento da molécula de DNA, é transcrito em uma molécula
de RNA, usando bases similares do DNA, sendo a timina do
11
Biologia Molecular

DNA substituída pela uracila no RNA. No local do DNA que


haja um gene ativo, as duas fitas do DNA se abrem para que a
cópia de uma das fitas da sequência do gene no DNA possa
produzir um RNA. Algumas das moléculas de RNA resultan-
tes acabam nunca se traduzindo em proteínas, mas atuam
nos mecanismos de regulação. As transcrições de RNA dos
genes que realmente codificam proteínas são traduzidas na
sequência correspondente de aminoácidos. Mas, primeira-
mente, o RNA proveniente da transcrição preliminar precisa
passar por um processo de edição.

Essas transcrições de RNA iniciais ou primários são como


livros que contêm muitos capítulos sem nenhum significado,
inseridos em intervalos do texto, ou seja, a molécula de RNA
recém transcrita contém trechos que não serão traduzidos em
proteínas. Ocorre então um fenômeno denominado splicing,
onde regiões sem sentido, chamadas íntrons, precisam ser
extraídas para que as regiões codificadoras (éxons) se liguem,
permitindo a formação de um RNA mensageiro maduro.

Esse RNA mensageiro origina-se no núcleo e leva para o


citoplasma as informações do DNA nuclear. No citoplassma,
ao se prender ao ribossomo, passa a ser denominado polirri-
bossomo e comanda a síntese protéica. Pequenas estruturas
celulares, conhecidas como RNA transportadores, carregam
os aminoácidos que serão ligados na cadeia polipeptídica,
que se origina nos ribossomos, local da síntese protéica.

Mas em 1980, Randolph Wall, da Universidade da Califór-


nia de Los Angeles (UCLA), demonstrou que essa visão bási-
ca do processamento pré-RNAm, em que todos os íntrons são
sempre descartados e todos os éxons são sempre incluídos,
nem sempre é verdadeira. Na realidade, os mecanismos celu-
lares podem “decidir” remover um éxon ou manter um íntron,
ou partes dele, na transcrição final do RNAm. Essa capacidade
12
Biologia Molecular

de editar de forma alternativa as transcrições de RNAm possi-


bilita a produção de diferentes proteínas pelo mesmo gene.

Em organismos complexos, dois sistemas regulatórios es-


tão envolvidos no splicing das transcrições do pré-RNAm.

O primeiro sistema é encontrado em todos os organismos


cujos genomas possuem íntrons, dos fungos até os seres hu-
manos, sendo extremamente conservado ao longo da evolu-
ção. É constituído de cinco moléculas que se aliam a até 150
proteínas para formar um complexo chamado spliceossomo,
responsável por reconhecer os locais onde os íntrons come-
çam e terminam, removendo-os da transcrição do pré-RNAm
e ligando os éxons para formar o RNAm. Quatro curtas sequ-
ências de núcleotídeos dentro dos íntrons servem como sinal
para indicar ao spliceossomo onde cortar. Um desses sinais
fica no começo do íntron e é chamado de ponto de splicing 5’;
outro, localizado na extremidade final do íntron, é conhecido
como ponto de splicing 3’.

Outro sistema regulatório envolve a presença de proteínas


reguladoras de splicing, onde cada uma pode ser expressa
em estágios distintos do desenvolvimento dentro do mesmo
tecido. Essas proteínas podem se ligar a sequências curtas
de nucleotídeos localizadas dentro de regiões ativadoras ou
supressoras dos éxons.

O splicing alternativo permite aos humanos produzir mais


de 100 mil proteínas sem precisar possuir 100 mil genes,
pois esse mecanismo origina mais de um tipo de molécula de
RNAm e, portanto, mais de uma proteína por gene. Em mé-
dia, cada um de nossos genes dá origem a três RNAms por
meio do splicing alternativo. Mesmo assim, esse número não
explica nossa necessidade de ter tantos íntrons, nem por que
eles ocupam tanto espaço dentro dos genes, de modo que
13
Biologia Molecular

os exons correspondam a apenas cerca de 2% do genoma


humano.

Em organismos unicelulares, o mecanismo de splicing só


reconhece sequências intrônicas de menos de 500 nucleotí-
deos. Esse sistema é adequado para os fungos, que possuem
poucos íntrons, em média com apenas 270 nucleotídeos de
comprimento. Mas, conforme os genomas foram se expandin-
do ao longo da evolução, seus trechos intrônicos se multipli-
caram e cresceram. O mecanismo celular de splicing prova-
velmente foi obrigado a mudar de um sistema que reconhecia
sequências intrônicas curtas dentro dos éxons para um que
reconhecesse éxons curtos no meio de um mar de íntrons. Um
gene humano possui, em média, 28 mil nucleotídeos, com 8,8
éxons separados por 7,8 íntrons. Os éxons são relativamente
curtos, em geral têm cerca de 120 nucleotídeos, enquanto os
íntrons variam de 100 a 100 mil nucleotídeos de comprimento.

Outro ponto a ser abordado é o fato de a espécie huma-


na apresentar o maior número de íntrons por gene de todos
os organismos. Grande parte do gasto energético de nossas
células é dedicada à manutenção e ao reparo de íntrons na
forma de DNA, à transcrição do pré-RNAm e ao processo
de splicing. Diante disso, algumas questões são levantadas:
por que tantos íntrons se o splicing é um procedimento caro
do ponto de vista energético? Como os íntrons não codificam
proteínas, por que são tão abundantes nos eucariontes, mas
inexistentes nos procariontes?

Além disso, a ocorrência de splicing pode levar a erros


com graves consequências. Cada erro no corte e na ligação
do pré-RNAm leva possivelmente à síntese de uma proteína
defeituosa. Por exemplo, na síndrome de Riley Day há uma
mutação em um único nucleotídeo de um gene, que faz com
que ele sofra splicing alternativo em tecidos do sistema ner-
14
Biologia Molecular

voso, acarretando na redução da proteína produzida por esse


gene o que leva a um desenvolvimento anômalo do sistema
nervoso. Sabe-se que pelo menos 15% das mutações que
provocam doenças genéticas e vários tipos de câncer, afetam
o splicing do pré-RNAm. Então, por que a evolução preservou
um sistema tão complicado e que ainda pode causar doen-
ças? Talvez a resposta a este paradigma seja que as vanta-
gens tenham superado os riscos.

Apesar de homens e camundongos terem tido um an-


cestral comum há aproximadamente 100 milhões de anos,
99% dos genes dos camundongos e dos humanos deriva
daquele ancestral. A maioria possui a mesma organização
em íntrons e éxons, apresentando sequências de nueleotí-
deos altamente conservadas dentro de seus éxons. Se há
diferenças tão pequenas entre o genoma dos humanos e
o dos camundongos, o que é que nos torna tão diferentes
desses animais?

Um estudo recente revelou que um quarto dos éxons que


sofrem splicing alternativo em ambos os genomas são espe-
cíficos ou dos seres humanos ou dos camundongos. Esses
éxons têm, portanto, o potencial de criar proteínas especiais
para determinadas espécies, que podem ser responsáveis
pela diferenciação entre elas. Uma das categorias dos éxons
de processamento alternativo é realmente exclusiva dos pri-
matas e pode ter contribuído para sua divergência em relação
a outros mamíferos. Dessa forma, podemos começar a en-
xergar as vantagens da existência de um grande número de
íntrons, que constituem 95% ou mais dos genes comuns que
codificam proteínas nos seres humanos.

Outros pesquisadores defendem o fato de que os íntrons


poderiam proteger os organismos eucariontes dos efeitos da-
nosos das mutações (há uma maior chance das mutações
15
Biologia Molecular

ocorrerem em regiões não codificadoras, não gerando prejuí-


zo aos organismos).

Da mesma forma, os biólogos supõem que a ausência de


íntrons nos procariontes foi uma consequência da pressão se-
letiva entre esses microrganismos. O processo evolutivo teria
eliminado os íntrons tornando a célula procarionte mais efi-
ciente do ponto de vista energético.

Outra corrente afirma que, como as bactérias não têm


núcleo, a transcrição e tradução ocorrem juntas: o RNA é
traduzido em proteína com a mesma rapidez com que é
transcrito. Não dá tempo para o RNA proveniente dos ín-
trons se remover do RNA codificador de proteína. Na maio-
ria dos casos, um íntron incapacitaria o gene onde ele está
contido, causando graves consequências para a bactéria
hospedeira. Nos eucariontes, a transcrição ocorre no nú-
cleo e a tradução, no citoplasma, separação que abre uma
janela de oportunidade para o RNA, originado a partir dos
íntrons, ser removido.

1.4. MUTAÇÃO

A herança se baseia na transmissão da informação ge-


nética dos pais aos seus descendentes por meio dos genes,
buscando preservar ao máximo o conteúdo da informação.
Contudo, alterações ocorridas nas bases do DNA e que são
herdáveis, são também transmitidas, constituindo uma muta-
ção.

A mutação já é conhecida há bastante tempo. Darwin re-


latou em meados do século XIX, vários casos de animais do-
mesticados onde de repente surgiam características novas.
Porém, foi De Vries (1910) que chamou estas grandes altera-
ções de mutações.
16
Biologia Molecular

A mutação refere-se tanto a alterações nas moléculas de


DNA, quanto ao processo que gerou a mutação, resultando
num novo fenótipo, ou mutante. É importante ressaltar que as
mutações provocam alterações aleatórias nas bases nitroge-
nadas que compõem os nucleotídeos; portanto, os indivíduos
não sofrem mutações para se adaptarem ao meio ambiente.
Essa alteração é ao acaso e posteriormente haverá uma sele-
ção dos genótipos que apresentem uma reprodução diferen-
cial, acarretando na evolução da população.

A palavra mutante tornou-se sinônimo popular de altera-


ções fenotípicas, gerando alterações estruturais ou funcionais
prejudiciais aos seres vivos. Certamente, por serem modifica-
ções aleatórias no DNA, a maioria das mutações é prejudicial
por modificar sequências que são fruto de milhões de anos de
Seleção Natural e do processo evolutivo. Fazendo uma ana-
logia, é extremamente difícil aperfeiçoarmos um computador
moderno por meio de uma alteração aleatória nas instruções
de sua fabricação.

Porém, vale a pena ressaltar que as mutações são a única


forma com que novos alelos de um gene são produzidos e,
portanto, imprescindíveis à evolução das espécies, principal-
mente em um meio ambiente que está em constante modifi-
cação.

Mutação gênica representa alterações (substituições, adi-


ções ou perdas) que ocorrem ao nível de um ou de alguns nu-
cleotídeos na molécula de DNA, podendo acarretar na produ-
ção de uma enzima alterada, incapaz de realizar sua função.
Esta mutação é dita ‘de ponto’, uma vez que abrange apenas
um gene, e uma mutação que ocorra dentro de um gene, ori-
ginará um novo alelo. Há também a possibilidade de haver
um RNA transportador (RNAt) que adicione um aminoácido
incorreto na cadeia polipeptídica formada.
17
Biologia Molecular

As mutações podem ocorrer em todos os organismos, de


maneira espontânea, ou induzida por determinados agentes.
As mutações induzidas resultam da exposição de organis-
mos a agentes físicos e químicos que provocam alterações
na molécula de DNA; portanto, são causadas por sustâncias
mutagênicas como, por exemplo, o cigarro, a luz ultravioleta,
raios-X ou até mesmo por raios cósmicos vindos do espaço.
Podemos ter também as mutações espontâneas, que ocor-
rem sem uma causa conhecida, ou por rearranjos espontâ-
neos dos nucleotídios. Na prática, é impossível provar que
uma mutação ocorreu por indução de um agente ou de forma
espontânea.

As mutações são eventos raros, ocorrendo a uma taxa


média de 10-7; mesmo em condições laboratoriais não con-
seguimos elevar em demasia os níveis de mutação pois eles
poderiam ser fatais.

Uma mutação que ocorre em uma molécula de DNA de


um cromossomo de uma célula somática não influi sobre a
hereditariedade, não apresentando importância evolutiva. As
mutações que apresentam importância evolutiva são as ger-
minativas, que ocorrem nos gametas, por gerarem indivíduos
que apresentam no DNA de todas as suas células aquela mo-
dificação, podendo transmiti-la a seus descendentes.

Mutações ocorridas em células somáticas podem ter


seu valor econômico em se tratando de plantas comerciais
propagadas vegetativamente. Como, por exemplo, as cul-
tivares de uva da espécie Vitis vinifera (Rubi, Benitaka e
Brasil), surgiram a partir de mutações somáticas ocorridas
na original Itália, em parreirais do sul e sudeste brasileiros,
e por apresentarem coloração vinho em diferentes intensi-
dades, houve grande interesse pelos consumidores, sur-
gindo assim, novas cultivares (Figura 1).
18
Biologia Molecular

C D

Figura 1 - Mutações somáticas ocorridas em cultivares de


uva; na cultivar Itália (A), originaram as cultivares Rubi (B) e
Benitaka (C); e, desta última, originou-se a cultivar Brasil (D)
de Vitis vinifera L.

As mutações, em sua maioria, também são recessivas,


ou seja, não se manifestam imediatamente em organismos
diplóides. Supondo que o novo fenótipo produzido pelo gene
recessivo, quando em homozigose, seja vantajoso; quantas
gerações seriam necessárias para que surgisse um indivíduo
homozigoto recessivo em uma espécie diplóide? Certamente
centenas de milhares de anos. Estima-se que seriam neces-
sários pelo menos 200 mil anos para que houvesse 1% de
indivíduos homozigotos recessivos (apresentando o fenótipo
recessivo), considerando o tempo de uma geração como sen-
do de 20 anos em média.

Organismos haplóides, como as bactérias, apresentam a


vantagem de expressar diretamente um gene e, se este for
19
Biologia Molecular

responsável pelo surgimento de uma característica favorável,


em pouco tempo a frequência deste novo gene terá aumenta-
do consideravelmente na população. Por serem organismos
haplóides, não podemos nos referir a um gene bacteriano
como sendo dominante ou recessivo. Em resumo, as bacté-
rias possuem a vantagem de apresentarem uma reprodução
extremamente rápida (uma colônia pode se duplicar a cada 20
minutos) e toda mutação que sofrerem será expressa direta-
mente nos descendentes.

O deslocamento dos átomos de hidrogênio para diferen-


tes posições nas bases nitrogenadas ocasionam mudanças
tautoméricas, nas quais as formas estáveis das bases se
mudam para formas menos estáveis, acarretando em um
mal pareamento de bases durante a replicação do DNA. O
pareamento normal entre A-T e G-C, se alteram para A-C e
G-T, respectivamente. Nestas circuntâncias, quando há troca
entre duas bases púricas ou entre duas bases pirimídicas
convencionou-se denominar transição. A troca entre uma
base púrica e uma pirimídica, ou vice-versa, é denominada
transversão.

As mutações de ponto ocorrem devido à troca de apenas


uma base nitrogenada em um nucleotídeo. Molecularmente,
as mutações de ponto podem ocorrer de diferentes maneiras:
mutação silenciosa (há uma mudança no códon sem alterar
o aminoácido), mutação “missense” (se modifica o códon e
se altera o aminoácido), mutação “frameshift” (que acarreta
no deslocamento do quadro de leitura, levando a uma alte-
ração em todos os aminoácidos seguintes àquela alteração)
e mutação “nonsense” (onde há a introdução de um códon
de terminação no local da alteração). Esta última costuma ser
mais prejudicial pois pode levar uma proteína que possua 300
aminoácidos, passar a ter apenas quatro ou vinte aminoáci-
dos, por exemplo.
20
Biologia Molecular

1.4.1. ANEMIA FALCIFORME

Há 60 anos definiríamos gene como sendo um fragmento


de DNA capaz de produzir uma enzima, mais tarde essa defi-
nição foi alterada para um fragmento capaz de produzir uma
proteína. Alguns anos se passaram para que o conceito de
gene fosse modificado para um segmento de DNA capaz de
produzir uma cadeia polipeptídica, por possuir a informação
para o sequenciamento de aminoácidos na fabricação desta
cadeia. No caso de uma proteína ser composta por mais de
uma cadeia polipeptídica, existem vários genes atuando no
processo, cada um codificando uma cadeia.

A função de uma enzima depende da forma de sua mo-


lécula, a qual é definida pela sequência de aminoácidos na
cadeia polipeptídica. Como exemplo pode-se citar o caso da
hemoglobina humana, uma proteína formada por quatro ca-
deias polipeptídicas, duas cadeias a e duas b, compostas de
141 e 146 aminoácidos, respectivamente. As cadeias a são
codificadas por genes localizados no cromossomo 16 e as ca-
deias b são codificadas por genes que estão situados no cro-
mossomo 11.

Em indivíduos normais, as hemácias, por possuírem a hemo-


globina são responsáveis pelo transporte de oxigênio e gás carbô-
nico no nosso organismo e possuem forma arredondada côncava
e flexível. Essa constituição permite que as hemácias consigam
executar sua função mesmo através dos mais finos capilares.

Um exemplo clássico de uma modificação em uma base


de um gene que acarreta vários efeitos finais é o da anemia
falciforme na espécie humana. A anemia falciforme caracte-
riza-se pela presença de hemácias em forma de foice com a
produção de uma hemoglobina S. A sequência na cadeia beta
difere em um ponto somente: um ácido glutâmico da homoglo-
21
Biologia Molecular

bina A (hemoglobina normal) está substituído por uma valina


na hemoglobina S. A sequência de aminoácidos das cadeias
alfa de ambos os tipos de hemoglobina são iguais.

Indivíduos homozigotos (SS) apresentam a anemia falci-


forme. Esses indivíduos conseguem transportar o oxigênio,
mas, quando o mesmo passa para os tecidos, as moléculas
da sua hemoglobina tornam-se duras e quebradiças devido às
mudanças na sua membrana. Quando recebem novamente
o oxigênio, podem ou não recuperar o seu formato e se de-
formar de forma irrecuperável. Nessa forma, sua vida útil se
extingue mais rapidamente, o que pode vir a causar anemia
hemolítica. Em decorrência do gene causador da anemia fal-
ciforme apresentar uma herança co-dominante com o gene
normal, os heterozigotos apresentariam uma forma suave da
doença por possuírem metade de suas hemácias normais (A)
e metade em forma de foice (S).

1.4.2. SISTEMA DE REPARO

As diferentes formas de vida que conhecemos possuem


cromossomos, que são formados por um DNA capaz de sofrer
alterações (mutações) e ser transmitido através das gerações
de forma praticamente perfeita.

O próprio organismo tem a capacidade de corrigir certos


tipos de danos estruturais ocorridos no DNA; há nas células
um sistema de reparo do DNA representado por um conjunto
de enzimas que desempenha as funções de reconhecer uma
mutação no DNA, retirando-a e consertando o erro. Se esse
sistema de reparo falha por algum motivo, há ainda outras for-
mas de proteção, como exemplo pode-se citar a existência de
um código genético degenerado que faz com que alguns có-
dons, ao serem modificados, continuem a codificar o mesmo
aminoácido, não alterando a cadeia polipeptídica.
22
Biologia Molecular

Porém, se não houvesse a mínima possibilidade de ocor-


rência de erros, não haveria o surgimento de novos genes e
consequentemente não teríamos a evolução das espécies.
A capacidade de minimizar os efeitos geralmente deletérios
das mutações, com seus códons sinônimos e com aminoáci-
dos bioquimicamente semelhantes, faz com que as mutações
de menor efeito, ao contrário das que acarretam em grandes
modificações, possuam maior probabilidade de ser benéficas,
tornando a proteína formada mais eficiente. Além disso, có-
dons com duas ou três bases em comum eram bem parecidos
no que diz respeito à atração ou repulsão pela água. Essa
propriedade é crucial para o funcionamento da proteína.

1.5. CONSIDERAÇÕES FINAIS

Demonstrou-se, em condições laboratoriais, que em 1 mi-


lhão de alternativas, apenas uma superou o desempenho do có-
digo genético natural (apresentava uma taxa de mutação menor
que a do código natural). Uma explicação simples e direta para
a impressionante resistência do código genético é que resulte
da seleção natural. Talvez tenham existido muitos códigos, com
vários graus de suscetibilidade a erros. Os organismos cujos
códigos resistissem melhor às falhas tinham mais chance de
sobreviver, e o código genético padrão, aquele utilizado por pra-
ticamente todos os seres vivos, foi o vencedor. Como variações
do código são possíveis, essa suposição é razoável.

Como dificilmente ocorrem eventos inúteis na Natureza,


pois todos os eventos biológicos estão constantemente sob
a ação de forças evolutivas, podemos sugerir que a Natureza
permitiu que as mutações ocorressem raramente, o que apre-
sentou um papel decisivo na evolução dos organismos. Dessa
forma, elas têm a possibilidade de criar variabilidade genética,
combustível para o processo evolutivo. Portanto, é imprescin-
dível que o reparo do DNA não seja totalmente eficiente.
23
Biologia Molecular

1.6. GUIA DE ESTUDO

1 - A respeito da natureza química e da funcionalidade do DNA,


julgue as seguintes afirmações:
a) “Moléculas de DNA isoladas de diferentes tecidos da mes-
ma pessoa possuem a mesma composição de bases.” Sim ou
não? Justifique.
b) “O conteúdo informacional do DNA reside na sequência em
que suas unidades monoméricas estão ordenadas.” Sim ou
não? Justifique.

2 - Quantas moléculas de DNA existem em cada célula do


corpo humano?

3 - Por que o nível de compactação do DNA é maior em euca-


riontes do que em procariontes?

4 - Em que estágio do ciclo celular eucariótico você espera


que o DNA esteja mais compactado? Em que estágio você
espera que ele esteja menos compactado? Por quê?

5 - O que acontece com as histonas durante a replicação?

6 - O gene para a proteína humana albumina ocupa uma re-


gião cromossômica de 25000 pares de bases (25 quilobases
ou kb) do começo da sequência codificante de proteínas até
sua ponta, mas o RNA mensageiro para essa proteína tem
apenas 2,1kb de tamanho. O que você imagina que explique
esta grande diferença?

7 - Como a radiação está relacionada ao aumento na incidên-


cia de câncer?

8 – Por que uma célula geneticamente idêntica a outra pode


assumir forma e função tão distinta?
24
Biologia Molecular

9 - Explique o que é um gene.

10 - Existem três tipos de RNA. Qual a função de cada um?

11 - O DNA contém informações que a célula utiliza para a


síntese de proteínas. Sim ou não? Justifique.

12 - O RNA pode agir como catalisador. Sim ou não? Justifique.

13 - A respeito da natureza química e da funcionalidade do


DNA, julgue a seguinte afirmação: “Espécimes de DNA isola-
dos de diferentes tecidos da mesma pessoa possuem a mes-
ma composição de bases.” Sim ou não? Justifique.

14 - “Durante a desnaturação do DNA são quebradas as liga-


ções covalentes presentes em sua estrutura.” Sim ou não?
Justifique.

15 - “Nas moléculas de DNA dos eucariotos, a ocorrência das


bases G + C é aproximadamente igual à de T + A. Sim ou não?
Justifique.

25
Biologia Molecular

26
Biologia Molecular

INSTABILIDADE GENÔMICA:
RISCOS, EFEITOS E REPARO

Ana Amélia de Carvalho Melo Cavalcante


Doutora em Biologia Celular e Molecular pela URGS.
Professora pesquisadora da Faculdade NOVAFAPI.

Tatiana Vieira Chaves


Doutora em Farmacologia Clínica UFC.
Professora da Faculdade NOVAFAPI

Aracelli de Sousa Leite


Doutoranda em Biotecnologia na RENORBIO.
Professora do IFPI Floriano-Pi

Márcia Fernanda Paz


Mestranda em Genética Toxicológica pela ULBRA

Sandra Maria Mendes de Moura Dantas


Doutora em Ciências Biológicas, Professora Associada da
UFPI - Departamento de Biologia.
E-mail:sdantas@ufpi.edu.br

27
Biologia Molecular

28
Biologia Molecular

INSTABILIDADE GENÔMICA:
RISCOS, EFEITOS E REPARO

Ana Amélia de Carvalho Melo Cavalcante


Tatiana Vieira Chaves
Aracelli de Sousa Leite
Márcia Fernanda Correia Jardim Paz
Sandra Maria Mendes Moura Dantas

29
Biologia Molecular

30
Biologia Molecular

Sumário

CAPÍTULO 2. INSTABILIDADE GENÔMICA: RISCOS,


EFEITOS E REPARO

2.1. INTRODUÇÃO...............................................................33
2.2. RISCOS AMBIENTAIS E OCUPACIONAIS..................35
2.3. ESPÉCIES REATIVAS DE OXIGÊNIO.........................37
2.4. RADIAÇÕES IONIZANTES...........................................38
2.5. AGROTÓXICOS.............................................................40
2.6. QUIMIOTERÁPICOS......................................................42
2.7. HIDROCARBONETOS AROMÁTICOS..........................45
2.8. EFEITOS DE AGENTES QUÍMICOS E
FÍSICOS ENDÓGENOS E EXÓGENOS......................46
2.9. REPARO DE DNA...........................................................52

31
Biologia Molecular

32
Biologia Molecular

2.1. INTRODUÇÃO

Dados da Organização Mundial de Saúde apontam que,


a partir de 2020, pode se atingir a casa de 16 milhões de ca-
sos novos ano de câncer, contribuindo para ocupar a primeira
causa de mortalidade no mundo. Além disso, resulta em um
problema de saúde pública ao provocar, em indivíduos produ-
tivos, incapacidades que afetam segmentos sociais e econô-
micos.

A instabilidade genética acontece devido a inúmeras al-


terações no DNA que deixam como resquícios modificações
na sua estrutura ocasionadas por quebras de fitas (simples
e/ou duplas), inserções e deleções ou modificações de ba-
ses, adutos, pontes de DNA-DNA ou DNA-proteínas, pontes
intercadeias, substituições ou reagrupamento de pares de ba-
ses, que podem levar à produção de proteínas não funcionais.
Esses eventos estruturais induzem mutações, culminando em
doenças hereditárias, mutagênese, teratogênese e a carcino-
gênese.

O DNA celular é diariamente exposto a vários agentes ci-


totóxicos, genotóxicos e mutagênicos endógenos e exógenos
às células. As fontes endógenas consistem de produtos de pe-
roxidação lipídicas e de espécies reativas de oxigênio, produ-
tos do metabolismo celular normal. Vários danos ao DNA são
oriundos de fontes exógenas de genotóxicos ambientais ou
ocupacionais, tais como os compostos alquilantes, hidrocar-
bonetos aromáticos policíclicos, bifenóis, aminas heterocícli-
cas, radiações ionizantes, radiações UV, dentre outros.

Os danos oxidativos ao DNA são um dos fatores etioló-


gicos endógenos e exógenos implicados no envelhecimento,
em doenças crônicas e no câncer. Aumento dos níveis de es-
pécies reativas de oxigênio é designado como estresse oxi-
33
Biologia Molecular

dativo, representando um potencial tóxico que pode provocar


lesões nas células, nos ácidos nucléicos, inativação de prote-
ínas e peroxidação lipídica.

O DNA também é o alvo de drogas metabólitas que rea-


gem diretamente com o DNA ou indiretamente com a incor-
poração de nucleotídeos análogos, ou bloqueando funções
metabólicas do DNA, tais como as DNA polimerases e topoi-
somerases. Duas estratégias estão envolvidas nas respostas
aos danos ao DNA: os danos são reparados ou tolerados, ou
as células são removidas por apoptose. O não reparo leva
a consequências como as aberrações cromossômicas, muta-
ções em genes e transformações malignas.

As mutações podem ocorrer tanto em células de linhagem


germinativa como em células somáticas e são detectadas, fre-
quentemente, através da expressão fenotípica, causada por uma
mudança súbita e hereditária no genótipo de um organismo, al-
terando suas características. A ocorrência de mutações, no en-
tanto, depende da natureza da lesão e das respostas celulares
aos danos no DNA. Basicamente, as mutações são divididas em
duas grandes categorias: mutações gênicas e cromossômicas.
As primeiras são alterações que ocorrem na sequência de nucle-
otídeos do DNA, ou por substituição de bases, ou, ainda, adição
ou deleção de nucleotídeos; e as segundas, são as que produ-
zem alterações no número ou na estrutura dos cromossomos e
são detectadas por análises citogenéticas celular.

Alterações na dinâmica do genoma são indicativos de


câncer, as quais refletem em mutações que acometem genes
importantes para manutenção celular, produzindo ganho (on-
cogene) ou perda de função (genes supressores tumorais).
Várias evidências indicam que a tumorogênese em humanos é
um processo que envolve vários passos e que esses refletem
em alterações genéticas que guiam a progressiva transforma-
34
Biologia Molecular

ção de células humanas. Algumas alterações como sinais de


crescimento autossuficientes, não sensibilidade a inibidores
de crescimento, perda da morte celular programada (apopto-
se), potencial replicativo sem limite, angiogênese sustentada,
invasão tecidual e metástase, são essenciais e podem expli-
car a grande diversidade de cânceres e tumores, as quais de-
terminariam o crescimento maligno.

A instabilidade genética pode ser originada por falhas na


maquinaria de reparo. Ativação dos caminhos de checkpoint e
de reparo de DNA governam a estabilidade genômica depois
de estresses genotóxicos. Modificações pós-translacional em
proteínas envolvidas nesses processos são importantes na
resposta celular. Estresse genotóxico induz uma variedade de
lesões ao DNA.

Assim, no decorrer da vida, o DNA sofre alterações que


podem ser causadas por erros durante a replicação do DNA,
na divisão celular. No entanto, a justificativa da preocupação
da exposição a agentes químicos ambientais é que a exposi-
ção adicional representa um aumento na carga mutagênica, e
que todo risco em excesso precisa ser monitorado como uma
estratégia eficaz para a prevenção do câncer.

O presente capítulo discutirá alguns dos principais riscos


para a instabilidade genética de fontes endógenas, especial-
mente, os danos oxidativos e de fontes exógenas (ambientais e
ocupacionais), seus efeitos sobre o DNA e as possibilidades de
reparo dos danos induzidos, bem como sobre as consequên-
cias do reparo incorreto ou do não reparo de danos ao DNA.

2.2. RISCOS AMBIENTAIS E OCUPACIONAIS

A vida moderna expõe o homem a uma infinidade de com-


postos que, aliado ao bem-estar que provocam, trazem tam-
35
Biologia Molecular

bém risco à população. São várias as consequências que a


exposição de substâncias de potencial mutagênico pode cau-
sar no DNA, a molécula responsável pela informação genética
da célula, o que pode ocasionar instabilidade genética. A Ta-
bela 3 relaciona algumas das fontes, em potencial, de exposi-
ção humana a agentes mutagênicos.

Tabela 3 - Fontes de exposição humana a agentes mutagênicos

Adaptada de Ribeiro e Marques (2003)

Estudos de exposição ocupacional a agentes genotóxi-


cos são mais frequentes em populações expostas ao ferro
em fundições em fornos de carvão, alumínio, trabalhadores
de oficinas automotivas, motoristas de ônibus, trabalhadores
em asfaltos, policiais, soldadores, trabalhadores de indústrias
de plásticos e sujeitos expostos aos epicloritos, derivados de
benzidina e aos agrotóxicos.

36
Biologia Molecular

2.3. ESPÉCIES REATIVAS DE OXIGÊNIO

Espécies reativas de oxigênio (ERO) produzidas durante o


metabolismo normal podem interagir com uma variedade de ti-
pos de lesões. As lesões oxidativas acumuladas podem levar a
mutações, lesões pré-malignas e transformações que requerem
investigações. A identificação de susceptibilidade ao câncer, e,
particularmente, a identificação de fatores ambientais pode auxi-
liar na etiologia do câncer, seu desenvolvimento e terapêutica.

O estresse oxidativo pode lesar o DNA e causar mutações,


resultando em doenças hereditárias, câncer e envelhecimen-
to. A capacidade de a célula suportar ERO é monitorada por
antioxidantes enzimáticos e não-enzimáticos. Quando essa
capacidade é comprometida, ultrapassando as defesas antio-
xidantes naturais, podem ocorrer danos em macromoléculas
como o DNA, proteínas e lipídios, resultando em cânceres.
O radical (OH•) danifica o DNA ao retirar átomos de H das
desoxirriboses e das bases levando a quebras duplas de cer-
tas bases. O aumento de danos oxidativos induzidos ao DNA
tem sido reportado em vários casos de patogênese humana
relacioandas à idade e a doenças crônicas, com intabilidade
genômica e transformação de oncogênese.

Os biomarcadores de câncer são importantes para o


diagnóstico, acompanhamento do desenvolvimento do tumor,
análise individual de tumores, repostas a terapias, bem como
para avaliação de reocorrências. A resistência de reparos em
lesões oxidativas serve como um indicador da malignidade
de células e de tumores. Nos últimos anos, os estudos relati-
vos aos efeitos das radiações ionizantes têm ganhado desta-
que, uma vez que se sabe que a energia das mesmas altera
a órbita dos elétrons, tornando os átomos, especialmente os
de oxigênio, altamente reativos, com formação de ERO e ra-
dicais livres.
37
Biologia Molecular

2.4. RADIAÇÕES IONIZANTES

O termo radiação significa emissão de energia. As radia-


ções ionizantes (RI), como os Raios X, Raios gama e partícu-
las b, ao atravessarem uma substância, têm a propriedade de
remover elétrons orbitais de átomos constituintes de suas mo-
léculas. Esses átomos se tornam instáveis com carga positiva.
Os elétrons que ficaram livres no meio poderão incorporar-se
a outros átomos, conferindo-lhes carga negativa. Essa trans-
formação de átomos em íons resulta em efeitos biológicos,
ou seja, podem danificar as substâncias químicas dentro das
células. O núcleo é considerado mais radiossensível que o
citoplasma por conter o DNA nuclear.

Em um átomo eletricamente neutro, que se encontra no


estado fundamental, o número de elétrons orbitais é igual ao
número de prótons no núcleo. Quando o átomo perde elétrons
ao interagir com essas radiações, ele se torna um íon positivo e
o elétron livre se torna um íon negativo (com mais elétrons que
prótons). O processo de converter átomos em íons é chamado
de ionização. Ionização é a perda e ganho de elétrons. Entre-
tanto, os prótons não participam deste processo, tendo apenas
um papel passivo. Quando um elétron é removido das camadas
mais internas K, L e M, a vacância é preenchida por um átomo
mais externo. Neste salto, ocorre a produção de um fóton que
corresponde a raios X característicos. Muitas vezes, os raios X
característicos são formados quando os elétrons da camada K,
ou eventualmente da camada L, são capturados pelo núcleo e
se fundem aos prótons, dando origem a um nêutron para com-
pensar a falta destes à coesão de prótons no núcleo.

A exposição da molécula de DNA a radiações desenca-


deia uma cascata complexa de transdução de sinais provo-
cando danos no material genético. Recentemente, estudos
têm demonstrado deleções e alterações no genoma, com al-
38
Biologia Molecular

terações na expressão de genes após exposição a doses de


radiações, com resposta tardia para a transformação maligna
em fibroblastos humano. Desta forma, a RI é conhecida pelo
seu potencial para carcinogenicidade. Devido a sua frequen-
te aplicação médica em diversos procedimentos, e, especial-
mente, como agente terapêutico na terapia do câncer, a RI
se constitui como risco para a saúde humana. Em células de
mamíferos, a RI induz vários tipos de danos ao DNA, incluindo
as quebras simples e duplas, danos nas bases nitrogenadas,
ligação DNA-DNA e DNA-proteínas.

A exposição a raios X, que ocorre, principalmente, em pro-


fissionais da área de saúde, pode provocar um aumento na in-
cidência de câncer. Há relatos de alta frequência de alterações
cromossômicas e presença de micronúcleos nesses profissio-
nais. Danos citogenéticos são comprovados em funcionários
expostos, ocupacionalmente, a baixos níveis de RI que induzem
aberrações cromossômicas e quebras de fita dupla de DNA.

Durante a terapia do câncer, humanos são expostos a altas


transferências lineares de energia, que causam vários efeitos
biológicos, incluindo inativação celular, mutações genéticas,
cataratas e indução de câncer. Muitos desses parâmetros
biológicos são relatados como causadores de danos em cro-
mossomos e a avaliação destes pode ser realizada através de
biomarcadores. Entretanto, os mecanismos pelos quais as RI
induzem alterações cromossômicas a partir de quebras duplas
de DNA ainda não estão bem compreendidos.

Desta forma, os estudos relativos aos efeitos das ra-


diações ionizantes têm ganhado destaque, uma vez que os
avanços científicos possibilitaram a compreensão de que
a energia das mesmas altera a órbita dos elétrons, tornan-
do os átomos, especialmente os de oxigênio, altamente
reativos, com formação de ERO’s, relacionadas com mu-
39
Biologia Molecular

tações no material genético e promoção de diversas doen-


ças como câncer, mal de Alzheimer, diabetes, doença de
Parkinson, aterosclerose, entre outras. Mesmo em doses
pequenas de radiação, existem relatos de câncer em exa-
mes radiográficos dentários. Desta forma, o monitoramen-
to e a determinação da dose-resposta podem representar
uma contribuição expressiva à medida que oferecem segu-
rança à população.

A interação das radiações ionizantes com o DNA pode


ocasionar efeitos diretos e indiretos. Estima-se que 70% dos
efeitos biológicos ocorrem por “ação indireta”, proporcionado
através da radiólise da água, pois esta é dissociada em seus
dois elementos H+ e OH-, os quais reagem com bases do DNA
e interferem no processo de replicação. As alterações estrutu-
rais podem ocorrer nas bases nitrogenadas e nas desoxirri-
boses, como danos oxidativos, eliminação de bases, quebras
de fitas simples (Single-Strand Break, SSB), quebras de fitas
duplas (Double-Strand Break, DSB), pontes DNA – proteínas
e danos de trocas de bases de purina para pirimidina. Estas
lesões podem acontecer inclusive com níveis baixos de ex-
posição, mas são proporcionais à dose, pelos fenômenos de
excitação e de ionização da matéria

A instabilidade induzida pelas RI pode ocorrer em células


germinativas e somáticas e são caracterizadas por produzi-
rem reagrupamentos cromossomais, aneuploidia, micronúcle-
os, amplificação de genes, mutações e reduções em células
oriundas de outras que tiveram efeitos das radiações.

2.5. AGROTÓXICOS

A exposição humana aos agrotóxicos no meio ambiente e


em alimentos acontece por contato direto e indireto, por dife-
rentes rotas, tais como: inalação, ingestão e contato dérmico,
40
Biologia Molecular

ocasionando problemas agudos e crônicos à saúde, especial-


mente a do agricultor, com relatos da incidência de câncer,
doenças crônicas, problemas de esterilidade, desordens en-
dócrinas, neurológicas e comportamentais, assim como o au-
mento de linfomas, sarcomas e câncer de pâncreas, fígado,
bexiga e doença de Parkinson.

Dados experimentais revelam que vários agroquímicos in-


duzem mutações, alterações nos cromossomos e danos ao
DNA. O biomonitoramento dos riscos de instabilidades gené-
ticas ocasionadas por misturas complexas de químicos em
trabalhadores expostos, ocupacionalmente, constitui uma es-
tratégia preventiva do câncer. Correlações positivas entre a
exposição ocupacional às misturas complexas de agrotóxicos
vêm sendo relatadas em muitos estudos, em relação ao au-
mento da frequência de MN, quebras de cromátides irmãs e
AC. As AC induzidas por agrotóxicos são resultados, principal-
mente, da exposição continua às misturas agroquímicas.

A exposição em grandes doses por um curto período causa


os chamados efeitos agudos, bastante descritos na literatura
médica, cuja relação causa/efeito é de fácil identificação. A in-
toxicação aguda varia de intensidade leve até grave, podendo
ser caracterizada por náusea, vômito, cefaleia, tontura, deso-
rientação, hiperexcitabilidade, parestesias, irritação de pele e
mucosas, fasciculação muscular, dificuldade respiratória, he-
morragia, convulsões, coma e morte.

Os agrotóxicos são reportados em muitos estudos como


responsáveis por vários efeitos adversos na saúde humana,
incluindo além das intoxicações agudas, efeitos imune, nervo-
sos, endócrinos e no sistema reprodutivo. Os danos ao DNA
também têm sido relatados. Esses compostos interagem com
o DNA, causam doenças degenerativas e ultimamente pode
levar ao câncer, na ausência de processos de reparação de
41
Biologia Molecular

DNA. Os organismos respondem à ação de agentes genotóxi-


cos por reparo livre de erros e sujeito aos erros, morte celular
por citotoxicidade e/ou por apoptose e por modulação do con-
trole do ciclo celular.

2.6. QUIMIOTERÁPICOS

Os medicamentos citostáticos são substâncias citotóxicas


que se utilizam, especificamente, para causar um dano celular,
que não é seletivo para as células tumorais, mas que afetam
todas as células do organismo, resultando efeitos citotóxicos e
genotóxicos adversos. Seu uso inicial foi na década de 40, nas
observações de aplasias medulares de pessoas expostas ao
gás mostarda, o que proporcionou a utilização de mostardas
nitrogenadas em algumas neoplasias, a exemplo da Doença
de Hodgkin. Com o passar dos anos, a evolução dos estudos
farmacológicos e genéticos trouxe esperança na obtenção de
novas drogas que sejam sensíveis para tratamentos com ab-
soluta seletividade, que terão cada vez mais impactos na vida
das pessoas.

Entre alguns critérios de classificação, como a do me-


canismo de ação e estrutura química, estão: os agentes al-
quilantes, como as mostardas nitrogenadas (ciclofosfamida,
clorambucila, melfalana, mecloretamina); como os derivados
da etilamina (tiotepa, altretamina); como os alquilsufonatos,
(bissulfano); como as nitrosureias (carmustina, lomustina,
semustina, estreptozocina); como os triazenos (procarbazi-
na, dacarbazina); os derivados da platina, (cisplatina, car-
boplatina, oxaliplatina); os agentes metabólicos, como os
antagonistas do ácido fólico (metotrexato, permetrexato, ral-
titrexato); como os análogos da primidina (citarabina, 5-fluo-
rouracila, gencitabina,tegafur,5-azatidina); como os análogos
da purina, (mercaptopurina, tioguanina, cladribina); como os
antagonistas da adenosina (pentostatina, fludarabina); os
42
Biologia Molecular

agentes inibidores dos microtúbulos, os produtos naturais


como os alcaloides da vinca (vincristina, vimblastina); como
os Taxanos (paclitaxel, diocetaxel); os antibióticos, como as
antraciclinas (dactinomicina, doxorrubicina, daunorrubicina,
idarubicina) e outros (bleomicina, mitramicina, mitomicina);
os agentes hormonais, como os moduladores do receptor
estrogênico (tamoxifeno, letrozol, anastrozol, estramustina,
fulvestranto); como os moduladores do receptor androgêni-
co (biculatamida, flutamina; os agentes enzimáticos, como
os inibidores das topoisomerases (irinotecano, topotecano,
etoposídeo, teniposídeo); os agentes inibidores de tirosina-
cinase (imatinib, geftinib, erlotinib); os inibidores de proteos-
somos (bortezomib); os anticorpos monoclonais (rituximab,
transtuzumab, cetuximab); Fatores de Crescimento Hema-
topoiético (filgrastina, sargramostina); entre outros agentes
antineoplásicos.

Os agentes citostáticos são usados, principalmente, para


o tratamento de processos oncológicos, assim os trabalhado-
res podem estar expostos durante a fabricação, preparação,
distribuição ou transporte interno, administração, tratamento
de contaminantes acidentais ou derrames, ou eliminação dos
resíduos procedentes das atuações anteriores e excretadas.
As vias de penetração dessas substâncias são: inalação dos
aerossóis e micro gotas que se desprendem durante a prepa-
ração de soluções de citostáticos e durante sua administração,
ou por ruptura de ampolas; por contato direto, por penetração
do medicamento através da pele ou das mucosas; por via oral:
ingestão de alimentos, bebidas, cigarros contaminados. Por
via parenteral: por introdução direta do medicamento através
de pinçagens ou cortes produzidos pela ruptura das ampolas.
Os efeitos dos agentes citostáticos mais estudados sobre a
saúde com ações tóxicas são: teratogênico, citostático, carci-
nogênico, mutagênico, alteração corneal, cardiotóxico, hepa-
totóxico, nefrotóxico, hemorrágico, vesicante, irritante da pele
43
Biologia Molecular

e mucosa, hematológico. Isto não quer dizer que todos produ-


zam estas reações específicas dos agentes citostáticos, po-
dendo ou não serem apresentadas simultaneamente. A maior
parte dos mesmos tem sido estudada em pacientes subme-
tidos a estes tratamentos. As células cancerosas crescem e
reproduzem muito rápido, e pelos medicamentos que se usa
para o tratamento da quimioterapia, em geral, são aqueles que
atacam as células de crescimento rápido, interatuando com o
seu DNA, seu RNA ou com a síntese das proteínas celulares.
De igual forma, os medicamentos que se usa para combater
o câncer também podem afetar as células normais de tecidos
de rápida renovação, e em ocasiões causarem efeitos secun-
dários indesejáveis.

A doxorrubicina (DOX) é um antibiótico da família das an-


traciclinas, com uma relação estrutural perto da daunomicina,
sendo como esta última um intercalante de DNA. A DOX é um
antibiótico antitumoral que age formando um complexo terná-
rio com o DNA e a topoisomerase II, ocasionando a morte ce-
lular por apoptose. Neste caso, a apoptose induzida pela DOX
pode estar relacionada com a ativação da p53, uma proteína
supressora tumoral, que induz a transcrição do gene WAF1/
CIP1, que codifica a proteína p21 e é inibidora de algumas
cinases responsáveis pela regulação do ciclo celular. Essa ati-
vação pode acarretar uma parada no ciclo celular, possibilitan-
do a reparação de danos no DNA.

A maioria dos agentes quimioterápicos age não especifica-


mente, afetando também as células normais. O fluorouracil é
um agente antimetabólico de baixo peso molecular, que exer-
ce seu efeito devido às semelhanças estuturais e funcionais
que apresentam com os metabólitos envolvidos na síntese
de ácidos nucléicos. Como são confundidos pela célula como
metabólitos normais, tanto podem ser incorporados ao ácido
nucleico e produzir códigos incorretos, como podem inibir as
44
Biologia Molecular

enzimas envolvidas na síntese de ácidos nucléicos. Esses


mecanismos resultam em inibição da síntese do DNA e, con-
sequentemente, morte celular.

Um dos agentes antineoplásicos mais utilizados na qui-


mioterapia é a Ciclofosfamida (CP), que faz parte da família
das mostardas nitrogenadas e é um agente alquilante bifun-
cional, pois atua tanto no tratamento de diversos cânceres
como droga imunossupressora. Porém, como dito, os antitu-
morais lesam não apenas as células neoplásicas, mas tam-
bém as células normais. A CP, por exemplo, induz apoptose
na placa de crescimento da zona proliferativa, ou seja, parada
do crescimento ósseo e alterações osteoporóticas decorrente
de quimioterapia para câncer pediátrico com ciclofosfamida.
A ciclofosfamida é um agente antineoplásico do tipo alquilan-
te. Estes reagem com os centros de muitos tipos distintos de
moléculas e, pelo seu caráter bifuncional ou trifuncional, per-
mitem estabelecer reações cruzadas com o DNA de cadeia
dupla, evitando, assim, que as cadeias se separem para sua
replicação. O efeito final da interação entre os agentes alqui-
lantes e o DNA seria a alteração da informação codificada na
molécula de DNA ou replicações levando à ocorrência de mu-
tações ou morte celular.

2.7. HIDROCARBONETOS AROMÁTICOS

Os hidrocarbonetos aromáticos são considerados perigo-


sos poluentes ambientais devido aos seus efeitos prejudiciais
exercidos sobre diferentes grupos de organismos vivos. A de-
tecção dessa classe de poluentes ambientais por bioensaios,
utilizando plantas superiores, é controvérsia entre alguns au-
tores. Para alguns autores, as plantas superiores são relativa-
mente insensíveis para detectar alguns poluentes, entretanto
outros autores têm demonstrado uma grande sensibilidade
desses organismos na detecção de poluentes. Benzeno, to-
45
Biologia Molecular

lueno e xileno são compostos derivados do petróleo através


do processo da destilação.

A exposição ao benzeno e outros derivados do petróleo


pode induzir efeitos genotóxicos como aumento significante
de aberrações cromossômicas, aneuploidias, micronúcleos e
outros danos ao DNA. O benzeno e seus metabólitos têm se
mostrado potenciais formadores de mutações in vitro e in vivo.
A relação entre os níveis de exposição ao benzeno e citoto-
xicidade é um importante mecanismo para entendimento dos
danos celulares e genômico. Exposições elevadas ao benze-
no está associada à maior frequência de aberrações cromos-
sômicas e aneuploidias. O benzeno é carcinógeno pela ação
conjunta de seus metabólitos que produzem quebras no DNA,
inibição de topoisomerase e danos no fuso mitótico, os quais
desencadeiam recombinação mitótica, translocação cromos-
sômica e aneuploidia.

2.8. EFEITOS DE AGENTES QUÍMICOS E FÍSICOS


ENDÓGENOS E EXÓGENOS

As lesões no DNA podem ter origem física, química e bio-


lógica, afetando funções vitais como a duplicação, transcrição
gênica, alterações cromossômicas que podem desencadear
morte celular e processos cancerosos. Esses efeitos nocivos à
saúde podem ser expressos imediatamente ou levar anos para
sua manifestação. Os efeitos tardios incluem, além de doenças
genéticas nas gerações seguintes, a indução de cânceres.

Os danos endógenos e exógenos em tecidos normais são


decorrentes do aumento da produção de espécies reativas
de oxigênio (ERO), potencialmente mutagênicas, capazes de
induzir danos em macromoléculas como DNA, proteínas e li-
pídios. As células são detentoras de mecanismos de defesa
antioxidante que inclui glutationa, ácido ascórbico, ácido úrico
46
Biologia Molecular

e enzimas como a catalase, superóxido dismutase (SOD), glu-


tationa peroxidase, dentre outras. O aumento de produção de
ERO compromete o mecanismo de defesa, implicando dano
oxidativo nos constituintes celulares. Embora vários produtos
químicos tenham sido testados, em experimento animal, para
proteção contra radiação gama, a sua utilização clínica se tor-
na inviável pela alta toxicidade em administrações repetidas.

Os efeitos diretos e indiretos das radiações ionizantes são


responsáveis pelos danos ao DNA, proteínas e outros comple-
xos in vitro em células e in vitro, solução aquosa. Os efeitos
diretos envolvem a ionização e excitação de macromoléculas
por partículas primárias e secundárias. Entretanto, os indire-
tos são induzidos por produtos da ionização e excitação de
moléculas de água que envolvem macromoléculas. Um dos
mais agressivos da radiólise, o radical hidroxil (OH•), é res-
ponsável pelos efeitos indiretos das radiações ionizantes no
DNA em condições aeróbicas. A importância dos efeitos dire-
tos versus efeitos indiretos depende do LET da radiação, ou
seja, da energia transferida por unidade de comprimento que
está diretamente relacionada com a probabilidade de ocorrer
interação biológica resultando em lesão no DNA.

A exposição às radiações ionizantes induz danos em sites


clustered, definidos como duas ou mais lesões, como quebras
duplas associadas com lesões abásicas (AP). Os sítios abási-
cos (AP) são conhecidos como sítios apurínicos ou apirimidí-
nicos, que são formados quando bases são perdidas do DNA
por clivagem na ligação N-glicosil, deixando a cadeia açúcar-
fosfato intacta. Em condições fisiológicas normais, estimam-
se cerca de 50,00-200,00 lesões AP persistentes em células
de mamíferos. Os AP são, potencialmente, mutagênicos e po-
dem ser produzidos por reações espontâneas de depuriniza-
ção (perdas de purinas-hidrólise da desoxirribose na ligação
N-glicosil) e depirimidização (perdas de pirimidinas) do DNA.
47
Biologia Molecular

As depurinizações são menos comuns que as depirimidiza-


ções devido à ligação N-glicosil ser mais estável. Os sítios AP
também são produzidos por ERO, como também por ineficien-
te ou imcompleto reparo por excisão de bases.

Os agrotóxicos são usados, mundialmente, na agricultura


para proteger as culturas. Entretanto, as exposições a estas
substâncias representam um risco, em potencial, para a saúde
humana, mas também representam toxicidade em exposição
ocupacional e não ocupacional, especialmente devido suas
propriedades genotóxicas. Em estudos usando a frequência
de aberrações cromossômicas (AC), teste de cromátides ir-
mãs em linfócitos de sangue periférico, micronúcleos (MN) em
células epiteliais de mucosa bucal, frequência de MN, anor-
malidades nucleares, cariorrexe (CR), cariólise (CL), brotos
e células binucleadas (BN), encontraram-se aumentadas em
indivíduos expostos aos agrotóxicos, especialmente para os
fumantes, em relação aos indivíduos não expostos.

As aberrações cromossômicas são quaisquer mudanças


na estrutura do cariótipo, que criam um novo contexto gené-
tico pela movimentação do DNA de um lugar para outro, dife-
rente do original. A análise de AC é um teste de mutagenicida-
de para a detecção de AC estruturais. Aberrações estruturais
podem ser de 2 tipos: cromossômicas (quando ocorre simulta-
neamente nas duas cromátides de um cromossomo) e croma-
tídicas (em uma só cromátide).

A maioria dos mutagênicos químicos induz aberrações do


tipo cromatídico, mas as do tipo cromossômico também ocor-
rem. Determinar a frequência de AC em linfócitos do sangue
periférico humano, com o propósito de dosímetro biológico de
exposição a agentes mutagênicos químicos, constitui uma téc-
nica importante para estimar o risco em exposições ocupacio-
nais. Detectar apenas AC indica que existe um dano genético
48
Biologia Molecular

grosseiro. A ausência destas não exclui outras possíveis alte-


rações no DNA. Porém, a presença de AC indica uma possível
ligação com a exposição à genotóxicos.

As alterações cromossômicas são assim denominadas


porque afetam a estrutura dos cromossomos, sendo resul-
tantes de quebras que ocorrem, em geral, antes da duplica-
ção do DNA. Tais quebras são ditas espontâneas quando
não têm uma causa aparente, mas é sabido que sua fre-
quência aumenta sob a ação de agentes diversos que são
denominados agentes clastogênicos. As quebras originam
segmentos sem telômeros, os quais são estruturas essen-
ciais para manter a individualidade dos cromossomos. As
extremidades livres ficam literalmente pegajosas, favore-
cendo a reunião com outro segmento nas mesmas condi-
ções, isto é, que tenha perdido também a região telomérica.
Os segmentos quebrados podem se soldar, quando entra
em ação a síntese de reparo de DNA da célula, na qual in-
tervêm outras polimerases, diferentes daquelas que atuam
na duplicação semiconservativa que antecede às divisões
celulares. As quebras não produzem, necessariamente, mo-
dificação na estrutura do cromossomo, pois os segmentos
podem se reunir no mesmo ponto onde foram quebrados.
Contudo, cromossomos com estrutura alterada podem ser
formados, quando os segmentos se unem de forma distinta
da original ou quando fragmentos são simplesmente perdi-
dos. As quebras não ocorrem, aleatoriamente, em qualquer
região do cromossomo, existindo os chamados sítios frá-
geis mais propensos a se quebrarem. As AC são eventos
importantes no desenvolvimento tumoral pelo fato de que
quebras em sítios específicos da molécula do DNA podem,
às vezes, coincidir com a localização de oncogenes

As maiores fontes e tipos de danos ao DNA, como também


os mecanismos de reparo, estão associados com o envelhe-
49
Biologia Molecular

cimento, podendo levar à disfunção celular. Danos ao DNA e


mutações vão se acumulando com a idade em tecidos, su-
gerindo que o elevado nível de danos ao DNA pode acelerar
declínio fisiológico e proporcionar o aparecimento de doenças
não limitadas ao câncer.

O mecanismo pelo qual a célula decide pelo reparo ou


pela apoptose ainda não é bem conhecido, mas ambos ne-
cessitam de ATP. Entretanto, para reparo, o gasto de energia
é maior do que para apoptose. Esses mecanismos são im-
portantes para a compreensão do desenvolvimento do cân-
cer.

Quando as células são expostas a agentes que lesionam


o DNA, a proteína p53 age induzindo uma parada no ciclo
celular, permitindo a reparação do DNA lesionado antes da
síntese replicativa do mesmo. Uma disfunção na proteína p53
resulta na replicação de lesões mutagênicas que, quando acu-
muladas no genoma, favorecem as mudanças genéticas que
podem originar neoplasias. Recentemente foi mostrado que a
proteína p53 também está envolvida na reparação de danos
no DNA, atuando em conjunto com as vias de reparação por
excisão de nucleotídeos e de excisão de bases.

Os danos induzidos por agentes químicos e ou físicos po-


dem, dependendo do agente, induzir ou inibir necroses e ou
apoptose. A indução de necrose pode resultar na liberação de
enzimas degradativas que podem causar a digestão parcial
de DNA. A inibição da apoptose pode ser descrita por signifi-
cantes danos ao DNA que sobreviveram nas células mutantes
micronucleadas. A apoptose pode ser identificada como mor-
te e ou suicídio celular caracterizada, morfologicamente, por
processos ativos, genes regulados envolvendo condensação
e fragmentação de DNA. A morte celular não é somente impor-
tante no desenvolvimento embrionário e no desenvolvimento
50
Biologia Molecular

de tecidos adultos, mas também em crescimento de tecidos


de tumores. A comparação entre apoptose e necrose é apre-
sentada na Tabela 4.

Tabela 4 - Comparações morfológicas e bioquímicas entre


apoptose e necrose.

A importância da apoptose no organismo é de remover cé-


lulas com problemas funcionais. A maquinaria regulatória da
apoptose é altamente diferenciada por tecido, para responder
a diversos agentes estressores. Entretanto, apoptose e ne-
crose são dois caminhos diferentes de morte celular, sendo a
apoptose regulada por genes FAS, CD 95, FADDS, envolvidos
na ativação de caspases, processo esse que acontece por
mecanismos extrínsecos e intrínsecos. A necrose é o ponto
final das alterações celulares, sendo uma consequência co-
51
Biologia Molecular

mum de inflamações, processos degenerativos e infiltrativos e


de muitas alterações circulatórias. O mesmo agente etiológico
pode provocar tanto necrose quanto apoptose, sendo que a
severidade da agressão parece ser o fator determinante do
tipo de morte celular.

2.9. REPARO DE DNA

Níveis altos de danos ao DNA podem resultar em vários


caminhos, tais como a apoptose, que resulta em depleção
celular, contribuindo para acelerar o envelhecimento. Mani-
pulações genéticas em camundongos sobre os caminhos de
reparo de DNA indicam que disrupção de caminhos específi-
cos, tais como reparo por excisão de nucletotídeos e recom-
binação não homóloga são mais associados com fenótipos
de envelhecimento prematuro, tais como reparo por excisão
de nucleotídeos, sugerindo que o reparo de DNA tem papel
na modulação da longevidade, possivelmente por disfunção e
perdas celulares.

O DNA celular é constantemente exposto a vários citotó-


xicos e a agentes endógenos, de origem espontânea, e exó-
genos (ambientais) que danificam o DNA. Fontes endógenas
que oxidam o DNA consistem de produtos reativos oriundos
de peroxidação lipídica e ERO’s formadas como subprodutos
do metabolismo celular normal. Agregados às mutações em
genes que ativam proto-oncogêneses ou inativam genes su-
pressores de tumor. Vários estudos sugerem a importância do
papel de danos oxidativos ao DNA e seu reparo no desenvol-
vimento do câncer.

Todos os agentes mutagênicos induzem lesões ao DNA


celular, que podem ser eficientemente reparadas por diferen-
tes mecanismos de reparo. O não reparo ou o reparo incorre-
to leva a alterações cromossômicas. Dependendo do agente
52
Biologia Molecular

mutágeno diferentes caminhos de reparo estão envolvidos,


tais como o reparo por excisão de nucleotídeos (NER), reparo
por excisão de bases (BER), reparo por recombinação não
homóloga (NHEJ), recombinação homóloga (HRR) reparo de
crosslink e anelamento de fitas simples. As quebras de fitas
duplas de DNA (DSBs) são as lesões genotóxicas com signi-
ficâncias biológicas, que aumentam as quebras e reagrupa-
mentos de cromossomos, com mutagenese e perda crucial da
informação genética.

A replicação de DNA celular é um processo vulnerável a


quebras simples de DNA, que quando não reparadas podem
ser convertidas em quebras duplas (1). As células de mamífe-
ros respondem às DSBs ativando proteínas na sinalização de
caminhos de reparo, com eficiência para a maioria das lesões,
com checkpoint no ciclo celular e podendo, em reparo não
eficientes, induzir a morte celular.

O reparo por excisão de bases é o mais importante no re-


paro de danos oxidativos induzidos por ERO’s, mas proteínas
envolvidas no reparo por excisão de nucleotídeos, que são
mutadas em síndromes humanas, podem ser envolvidas no
reparo. A recente identificação de doenças humanas relaciona-
das com mutações em genes de reparo para danos oxidativos
mostra que esses defeitos podem aumentar a incidência de
câncer, mas também podem causar doenças neurológicas.

Quando as células são expostas a agentes que lesam o


DNA, genes críticos, a exemplo do gene p53, que atua na pa-
rada do ciclo celular, promovendo um atraso para prover o
tempo destinado ao reparo do dano antes da síntese replica-
tiva do DNA. Uma disfunção nesses genes e falhas no reparo
resulta na replicação de lesões mutagênicas, que, em acúmu-
lo, favorecem as mudanças genéticas, incluindo transforma-
ções neoplásicas.
53
Biologia Molecular

A maquinaria de reparo de DNA é importante na prevenção


da acumulação de danos ao DNA e protege contra uma varie-
dade de cânceres. A eficiência do reparo de DNA é sugerida
como um determinante no processo de envelhecimento e de-
senvolvimento de doenças degenerativas tais como o câncer.
Existem evidências da influência da genética e da dieta sobre
o reparo de DNA. Vários polimorfismos em genes de reparo,
por excisão de nucleotídeos (XPD, XPG, XPC) e em reparo
por excisão de bases (XRCC1, APE1, hOGG1), e em reparo
de quebras duplas e por recombinação (XRCC3, NBS1), têm
sido avaliados pelas suas associações com genotoxicidade e
risco de câncer.

A perda de reparo devido à redução na detecção do dano


ou por deficiências nos mecanismos de reparo pode ser obser-
vada em um grande número de doenças genéticas, incluindo o
câncer. O não reparo de lesões ao DNA ou o reparo incorreto
pode induzir as mutações que afetam os genes responsáveis
pelo controle da divisão e diferenciação celular. As alterações
nos genes podem alterar proto-oncogênese ou inativar os ge-
nes supressores de tumores, o que pode levar à instabilidade
genética, associado também aos erros na maquinaria de re-
paro de DNA. Numerosos estudos sugerem a importância da
maquinaria de reparo no câncer, pois altos níveis de estresse
oxidativos e defeitos em seus reparos têm sido associados
aos tumores.

54
Biologia Molecular

REGULAÇÃO DA AÇÃO GÊNICA

Dario Abel Palmieri


Licenciado em Genética, Dr., Universidade Estadual
Paulista Julio de Mesquita Filho, Departamento
de Ciências e Letras.
e-mail: darioap@assis.unesp.br

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

55
Biologia Molecular

56
Biologia Molecular

REGULAÇÃO DA AÇÃO GÊNICA

Dario Abel Palmieri


Sérgio Emílio dos Santos Valente

57
Biologia Molecular

58
Biologia Molecular

SUMÁRIO

CAPÍTULO 3. REGULAÇÃO DA AÇÃO GÊNICA



3.1 REGULAÇÃO DA AÇÃO GÊNICA...................................61
3.2 CONSIDERAÇÕES FINAIS............................................66

59
Biologia Molecular

60
Biologia Molecular

3.1 REGULAÇÃO DA AÇÃO GÊNICA

Durante o desenvolvimento de um indivíduo adulto, uma


única célula fertilizada se transforma em um organismo com-
plexo constituído de trilhões de células com centenas de formas
e funções diferentes. O mecanismo de como é efetuada a re-
gulação da ação gênica em organismos procariontes e em eu-
cariontes unicelulares e multicelulares continua sendo uma das
grandes questões da Biologia que permanece sem respostas.

Células simples, como por exemplo, uma bactéria, apre-


sentam um elevado número de diferentes proteínas sinteti-
zadas, necessitando de um DNA com mais de 3 milhões de
pares de bases (pb). Esse DNA se torna pequeno quando
comparamos ao de outros seres vivos unicelulares eucarion-
tes. Por exemplo, uma bactéria (Escherichia coli) apresenta
um genoma com 4 milhões pb e 2350 genes no seu cromosso-
mo único. Já a levedura (Saccharomyces cerevisiae) apresen-
ta um genoma com 13 milhões pb e 5200 genes. A quantidade
de DNA na mosca das frutas (Drosophila melanogaster) é de
140 milhões pb onde se situam 13000 genes. Já na espécie
humana, o genoma apresenta 3 bilhões pb e aproximadamen-
te 23000 genes. Resumindo, organismos simples têm menos
complexidade e menos funções a desempenhar e, portanto,
necessitam de menor quantidade de informação genética.

Organismos mais complexos geralmente possuem um


DNA enorme, só que grande parte desse DNA não está envol-
vido na síntese protéica. Nas células humanas, por exemplo,
somente 2 a 3% do DNA constituem os genes (formados por
“íntrons” e “éxons”).

Durante muito tempo os pesquisadores acharam que o


número de genes codificadores de proteínas tivesse maior
correspondência com a complexidade. Desde então, os ge-
61
Biologia Molecular

nomas de diversas espécies foram decifrados, e ficou claro


que a correlação entre número de genes e complexidade é
duvidosa. O verme nematóide Caenorhabditis elegans (que
tem menos de mil células) possui 19 mil genes, enquanto os
insetos possuem aproximadamente 13 mil genes e os seres
humanos cerca de 22 mil genes.

Além disso, a quantidade de DNA de um organismo não


corresponde exatamente à sua complexidade. Por exemplo,
alguns anfíbios possuem cinco vezes mais DNA que os ma-
míferos.

Uma bactéria é um organismo unicelular que necessita


produzir todas as enzimas necessárias para o seu metabolis-
mo por meio da ativação de seus genes. Apesar de possuirem
uma quantidade de DNA e genes bem menor que as células
eucariontes, não são capazes de produzir todas as suas enzi-
mas ao mesmo tempo.

Já organismos multicelulares apresentam uma divisão de


trabalho entre as células, acarretando em uma maior eficiên-
cia do organismo. No corpo humano a diferenciação celular
permite que as células do pâncreas produzam insulina, as do
estômago secretem suco gástrico, enquanto as do cérebro
encarregam-se de transmitir impulsos nervosos, e assim por
diante.

Todas as células de um organismo contêm os mesmos ge-


nes, embora em cada célula alguns genes estejam ativos e
outros inativos, em um sistema semelhante ao do interruptor
que acende ou apaga a luz. Dentro das células, há comandos
que determinam quais genes serão ativos ou permanecerão
inativos. Dessa forma, as enzimas necessárias em cada tipo
celular são diferentes, e somente uma porcentagem do total
dos genes presentes em uma pessoa será ativada em um
62
Biologia Molecular

determinado tecido. Além disso, diferentes genes expressam-


se em diferentes fases do desenvolvimento do organismo, do
embrião ao adulto.

Dessa forma, é necessário que haja uma regulação da


atividade gênica, de modo a definir quais genes serão trans-
critos e quais proteínas serão produzidas em cada tecido
e a quantidade delas nos diferentes estágios de desenvol-
vimento. O controle da expressão gênica é realizado por
sequências de DNA que se situam próximas dos genes, os
sítios promotores e reguladores, e que ativam um gene, in-
formando o momento que ele será expresso, em que tecido,
em qual fase do desenvolvimento e a quantidade de proteína
a ser produzida. Um gene é ativado quando ele é transcrito
em um RNAm, sendo posteriormente traduzido em uma ca-
deia polipeptídica.

Um dos primeiros estudos sobre os mecanismos que re-


gulam os genes foi desenvolvido por Jacob e Monod, e que
rendeu a eles o Prêmio Nobel na década de 1960. De acordo
com esse modelo, ao estudarem a ação de um gene especí-
fico, observaram que a síntese de proteínas era obtida atra-
vés do bloqueio da atividade do tetrâmero repressor (proteína
produzida pelo gene regulador), o que permitia total liberdade
ao sítio operador (sequência de nucleotídeos que se liga à
proteína repressora, evitando assim a transcrição de um gene
adjacente). Dessa forma a RNA polimerase se ligava ao sítio
promotor, ocorrendo então o processo de transcrição do RNA
e posteriormente a tradução em proteínas. O bloqueio da ati-
vidade da proteína repressora era realizado pela lactose, cha-
mada de indutora do processo de transcrição e tradução no
gene estudado por Jacob e Monod. Dessa forma, eles conclu-
íram que as proteínas controlavam todas as informações ge-
néticas na bactéria E. coli, explicando em parte como ocorre
a regulação gênica em organismos procariontes; porém, até
63
Biologia Molecular

os dias de hoje este trabalho continua sendo um dos poucos


que elucida como ocorre a regulação da ação dos genes nos
seres vivos.

O dogma central da Biologia Molecular refere-se ao fato


de que as proteínas são sintetizadas a partir de uma molécu-
la de RNA que por sua vez provém de um DNA; a molécula
de DNA por sua vez, é capaz de produzir cópias idênticas a
ela por meio da replicação semiconservativa. Esse modelo é
universal, ou seja, é válido para todos os seres vivos. O bi-
ólogo Jacques Monod sintetizou a universalidade do dogma
central numa frase: “O que é verdade para a E. coli também é
verdade para o elefante”, obviamente sendo verdade também
para plantas, fungos, organismos multicelulares e unicelulares
eucariontes.

Porém, Monod não estava totalmente certo. Apenas o


dogma central da Biologia Molecular não esclarece totalmente
como ocorre a regulação gênica nos seres vivos. As proteínas
ajudam a regular a expressão dos genes, mas há evidências
de que a regulação gênica seja efetuada por meio de RNAs
que atuem diretamente no DNA. Dessa forma, seria de se es-
perar que muitos genes tenham evoluído apenas para expres-
sar sinais de RNA como reguladores (milhares de RNAs que
nunca são traduzidos em proteína foram identificados no pro-
cesso de transcrição em mamíferos).

Além disso, a mitose e a meiose parecem depender de


processos bioquímicos que afetam o processamento do RNA.
Centenas de “micro-RNAs” derivados de íntrons e transcritos
de RNA não-codificadores maiores já foram identificados em
plantas, animais e fungos, onde vários RNA não-codificadores
controlam a proliferação de células e o mecanismo da morte
celular programada (apoptose).

64
Biologia Molecular

Quando os íntrons são removidos do transcrito primário de


um gene, os éxons podem ser montados de várias maneiras
para produzir mais de um tipo de proteína. Esse evento é de-
nominado splicing alternativo e produz vários tipos de RNAs
e proteínas nas células que constituem os diferentes tecidos
de um organismo, apesar de todas as células de um mesmo
organismo possuírem o mesmo conjunto de genes.

O splicing alternativo é fundamental para o desenvolvimen-


to dos seres vivos, mas compreendemos muito pouco como as
células especificam qual o tipo e a quantidade de proteína que
produzirão. Como células geneticamente idênticas formam
células tão diferentes funcionalmente e morfologicamente?
Pouquíssimas proteínas que controlam esse fenômeno foram
encontradas. Os pesquisadores supõem que haja a ativação
ou a inativação do splicing alternativo em diferentes situações.

Outra possibilidade é o fato dos RNAs atuarem diretamen-


te no processo do splicing alternativo. Dessa forma, essas
moléculas atuariam em sequências específicas de transcritos
primários e direcionariam a montagem do RNAm. Suportando
essa hipótese há o fato das sequências de DNA nas junções
íntron-éxon, onde ocorre o splicing alternativo, serem regiões
muito conservadas durante o processo evolutivo.

Além dos íntrons, outra grande fonte de DNA aparentemen-


te sem função (por não participar ativamente da formação das
cadeias polipeptídicas) é constituída pelos transposons e ou-
tras sequências repetitivas (várias sequências de nucleotídeos
idênticas na mesma orientação em uma molécula de DNA) .

Os transposons são sequênciass de nucleotídeos que po-


dem se auto-inserir, com a ajuda de uma enzima (transposa-
se), em novos locais no genoma. Essas sequências, assim
como os íntrons, geralmente são consideradas parasitas mo-
65
Biologia Molecular

leculares que colonizaram nossos genomas em diferentes épocas


do processo evolutivo. Elas podem ter sido invasoras no início;
porém, uma vez inseridas no genoma, elas e seus descendentes
sofreram modificações e evoluíram juntamente com os nossos
genes. Há fortes indícios que os transposons contribuam para a
regulação da ação gênica de organismos superiores.

3.2 CONSIDERAÇÕES FINAIS

Sabe-se que 99% das proteínas dos seres humanos são


encontradas em camundongos e vice-versa. Muitas dessas
proteínas também são conservadas em outros animais, em
outros seres eucariontes e até mesmo em organismos pro-
cariontes. Desse modo, as diferenças entre os seres vivos
residem em modificações estruturais nas proteínas. Essas
alterações na estrutura das proteínas seriam originárias de
diferentes combinações das proteínas reguladoras que intera-
giriam umas com as outras e com os ácidos nucléicos.

Descobriu-se que o número de reguladores de proteína


nos procariontes aumenta à razão do quadrado do tamanho
do seu genoma e que haveria um ponto em que o número
de novos reguladores não pudesse ultrapassar o número de
novos genes funcionais. Este ponto estaria próximo do limite
superior do tamanho dos genomas das bactérias. Durante a
evolução, portanto, a complexidade dos procariontes pode ter
sido limitada pela sobrecarga reguladora genética, e não por
fatores ambientais ou bioquímicos, como se supunha antes.

Essa conclusão também é compatível com o fato de que a


vida na Terra consistiu unicamente de organismos procarion-
tes por mais de 2 bilhões de anos. A combinação das proteí-
nas não poderia por si só elevar o nível de complexidade dos
organismos, a ponto de originar uma célula eucarionte a partir
de uma célula procarionte.
66
Biologia Molecular

Os eucariontes devem ter encontrado uma solução para


esse problema, que pode ter sido a transição para um novo tipo
de controle baseado, em grande parte, em moléculas de RNA.
Isso certamente ajudaria a explicar o fenômeno da explosão
Cambriana, há aproximadamente 500 milhões de anos, quando
animais invertebrados com uma enorme diversidade evoluíram,
em um curto período de tempo, a partir de formas de vida mui-
to mais simples. Na verdade, esses resultados sugerem que a
complexidade organizada é devido às regiões reguladoras.

Em resumo, o RNA apresenta um importante papel no


controle da atividade gênica. Por exemplo, esse papel do RNA
permite às células animais atingirem uma complexidade estru-
tural muito maior quando comparadas a uma bactéria.

Recentemente verificou-se que os genomas dos vertebra-


dos contêm milhares de sequências não-codificadoras que
permaneceram praticamente inalteradas por muitos milhões
de anos. Essas sequências estão muito mais conservadas do
que aquelas que codificam proteínas, o que é totalmente ines-
perado. Podemos supor que, no genoma humano (e o dos
outros organismos complexos), esses RNAs desempenham
alguma função, pois todos os eventos biológicos estão sob a
ação de forças evolutivas constantemente. Dessa forma po-
demos imaginar que muitos genes em organismos complexos
não codifiquem proteínas, mas originem moléculas de RNA
com funções reguladoras e que apresentam funções essen-
ciais no desenvolvimento e na evolução desses organismos.

Desse modo, os genomas dos seres humanos e de outros


organismos complexos, em vez de serem vistos como por-
tadores de sequências codificadoras no meio de muito DNA
lixo, deveriam ser vistos como ilhas de fábricas de proteínas
em um mar de regiões reguladoras. Em suma, a maior parte
dos genomas em organismos complexos não é constituída de
67
Biologia Molecular

DNA-lixo; são sequências de DNA funcional, que se modifica


e que evolui.

A existência de um grande sistema regulador baseado no


RNA também possui implicações na Área da Saúde. Doenças
genéticas tradicionais, como fibrose cística e talassemia, são
causadas por um dano em um componente: uma das proteínas
do indivíduo simplesmente não funciona. No entanto, é provável
que muitas, se não a maioria, das variações genéticas que de-
terminam a suscetibilidade à maioria das doenças residam nas
regiões reguladoras. RNAs não-codificadores já foram associa-
dos a diversas doenças, como o linfoma de células B, câncer do
pulmão, câncer da próstata, autismo e esquizofrenia.

Estudos a respeito dos mecanismos envolvidos na regula-


ção da atividade gênica permitirão a compreensão do porque
uma célula, a partir de um dado momento, começa a se dividir
de forma descontrolada dando origem ao câncer. Também po-
deremos esclarecer por que envelhecemos e quem sabe, como
procedermos para retardar esse envelhecimento e até mesmo
como impedir a evolução de um determinado tipo de câncer.

É importante ressaltar que essas perspectivas não são


para os próximos anos ou quem sabe para as próximas dé-
cadas, mas compreender esse sistema regulador poderá
também ser fundamental para entendermos o polimorfismo
genético existente em várias espécies, além de possibilitar a
criação de estratégias sofisticadas de intervenção médica e
de transferência de genes funcionais entre espécies distantes
geneticamente.

68
Biologia Molecular

TECNOLOGIA DO DNA
RECOMBINANTE

Fábio Barros Britto


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: fbbritto@ufpi.edu.br

Paulo Sarmanho da Costa Lima


Agrônomo, Dr., Empresa Brasileira de
Pesquisa Agropecuária.
e-mail: paulosarmanho@yahoo.com.br

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

69
Biologia Molecular

70
Biologia Molecular

TECNOLOGIA DO DNA
RECOMBINANTE

Fábio Barros Britto


Paulo Sarmanho da Costa Lima
Sérgio Emílio dos Santos Valente

71
Biologia Molecular

72
Biologia Molecular

SUMÁRIO

CAPÍTULO 4. TECNOLOGIA DO DNA RECOMBINANTE

4.1 INTRODUÇÃO................................................................75
4.2 CONSTRUÇÃO DA MOLÉCULA DE DNA
RECOMBINANTE............................................................77
4.3 CONSIDERAÇÕES FINAIS............................................87
4.4 GUIA DE ESTUDO........................................................89

73
Biologia Molecular

74
Biologia Molecular

4.1 INTRODUÇÃO

As descobertas sobre o funcionamento dos genes e de


como eles atuam para produzir fenótipos (o “Dogma da Biolo-
gia Molecular”) foi muito importante para o avanço da ciência.
O processo se dá com a informação presente no DNA sendo
convertida em moléculas intermediárias de RNA que, por sua
vez, são traduzidas em sequências de aminoácidos. Entretan-
to, o que mais chamou a atenção dos cientistas foi o fato do
processo de conversão da informação genética acontecer de
forma universal para qualquer que fosse a espécie, mostrando
a existência de um código genético que era interpretado utili-
zando os mesmos mecanismos celulares. Este código é lido
em unidades de três em três bases nucleotídicas chamadas
de códon. Uma sequência de DNA que, por exemplo, possui
os nucleotídeos CAT, é transcrito em um RNA mensageiro
(RNAm) com as bases complementares GUA. Este códon de
RNAm é convertido no aminoácido valina em qualquer espé-
cie pelo processo de tradução.

A descoberta deste código abriu as portas para uma nova


discussão: seria possível introduzir o DNA de uma espécie
em outra, e fazer com que a segunda espécie produzisse a
proteína da primeira? Pela teoria esta hipótese era plausível,
porém, seria preciso dissecar o DNA em busca dos genes de
interesse. Ou seja, era necessário analisar o DNA, definir em
qual posição se encontrava o gene de interesse e recortar
este gene para somente depois tentar introduzi-lo em outra
espécie. Que “tesoura” seria suficientemente pequena para
fazer este trabalho? A resposta para esta questão foi encon-
trada graças a Hamilton Smith e Daniel Nathans, que em 1970
descobriram as enzimas de restrição. Estas enzimas abriram
caminho para metodologias que levaram à Tecnologia do DNA
Recombinante, devido a sua capacidade em realizar cortes
precisos em sequências específicas da molécula de DNA.
75
Biologia Molecular

No processo da construção da molécula de DNA Recombi-


nante, o fragmento de DNA isolado é ligado a um vetor e introduzi-
do na célula hospedeira para que seja multiplicado. Em decorrên-
cia da universalidade do código genético, é possível a produção
de diversas substâncias de importância econômica por meio da
inserção do gene de interesse em outro organismo, que passaria
então a ser denominado de organismo transgênico.

As bactérias são ideais para esse trabalho por apresenta-


rem alta capacidade de multiplicação, em condições ideais as
bactérias podem se reproduzir a cada 20 minutos, e sempre
que as bactérias duplicarem o seu material genético, a molé-
cula de DNA recém inserida também será duplicada. Nestes
organismos, os vetores mais utilizados para a inserção de frag-
mentos DNA são os plasmídeos, que são moléculas de DNA
extracromossômicas circulares bifilamentares. Eles variam de
cerca de 1 kb (1000 pares de bases) a 200 kb, sendo que mui-
tos podem sofrer replicação independente. Assim, podemos
ter a multiplicação do fragmento de interesse em quantidade
muito superior se a multiplicação ocorresse apenas quando o
DNA cromossômico da bactéria fosse replicado. Dessa ma-
neira, as bactérias podem produzir bilhões de cópias de um
fragmento de DNA em poucas horas. O cultivo simples e bara-
to também colaboram para a utilização desses organismos no
processo de clonagem gênica.

Para diminuir o risco de um acidente biológico, os cien-


tistas preferem trabalhar com espécies de bactérias que
já convivem com o homem há milhares de anos, como a
E. coli, que normalmente habita o intestino humano. Além
disso, para uma maior garantia, os cientistas desenvolveram
linhagens de E. coli enfraquecidas e que, praticamente, só
sobrevivem em tubos de ensaio sob condições especiais. O
que se pretende com esses cuidados é evitar que bactérias,
carregando um DNA exógeno (estranho ao seu genoma),
76
Biologia Molecular

“escapem” do laboratório para se cruzarem com bactérias


selvagens na natureza.

4.2 CONSTRUÇÃO DA MOLÉCULA DE DNA


RECOMBINANTE

As primeiras etapas na construção da molécula de DNA


Recombinante são a extração de DNA (ver capítulo 7) e o iso-
lamento do gene que codifica a proteína de interesse. No pro-
cesso do isolamento de um gene específico o primeiro proce-
dimento é cortar o DNA por meio de enzimas de restrição que
hidrolisam a ligação fosfodiester, ou seja, quebram as ligações
fosfodiéster que ligam um nucleotídeo aos seguintes. Os pon-
tos de corte são chamados de sítios de restrição (Figura 2)
que estão presentes em uma sequência específica de DNA
que é reconhecida pela enzima.

EcoRI

. . . ATCCAGTACCTGAATTCGAAGGCTTACG . . .
. . . TAGGTCATGGACTTAAGCTTCCGAATGC . . .

Resultado

. . . ATCCAGTACCTG AATTCGAAGGCTTACG . . .
. . . TAGGTCATGGACTTAA GCTTCCGAATGC . . .

Figura 2 - Trecho de DNA mostrando um sítio de restrição


(GAATTC) para a enzima EcoRI. A enzima reconhece esta se-
quência específica e corta o DNA exatamente nos locais in-
dicados pelas setas menores, formando dois fragmentos que
apresentam uma pequena cauda de quatro nucleotídeos.

As enzimas de restrição ou endonucleases são sinteti-


zadas por vários gêneros bacterianos com a finalidade de
77
Biologia Molecular

protegê-los contra o DNA proveniente de vírus. As bactérias


reconhecem e destroem esse DNA heterólogo, clivando em
vários fragmentos por meios das enzimas de restrição. O DNA
da bactéria é protegido por um grupo metil (CH3) que impede
que a enzima de restrição atuem no DNA da bactéria hospe-
deira desse sistema de restrição e modificação.

Existem centenas de enzimas de restrição conhecidas e


cada uma delas corta a dupla fita de DNA toda vez que surgir o
sítio de restrição que ela reconhece. Dessa maneira, milhões
de fragmentos de DNA podem ser produzidos. As extremida-
des resultantes da ação das enzimas de restrições cortadas
são ligantes, ou seja, a metade das pontas dos fragmentos
recém-cortados apresenta sequências complementares à ou-
tra metade das pontas quando do uso de enzimas coesivas
(Figura 2). As enzimas de corte abrupto provocam corte reto
no meio da sequência de reconhecimento, gerando extremi-
dades perpendiculares e retas (Figura 3).

5’ GAT↓ATC 3’
3’ CTA↑TAG 5’

Figura 3: Sequência de reconhecimento e sitio de restrição


da Enzima EcoRV

Isso significa que a cauda de cada segmento de DNA é


capaz de se religar, não somente ao fragmento ao qual estava
unido anteriormente, mas a qualquer outro fragmento que lhe
seja complementar ou proveniente de uma reação de restrição
em que seja usada uma mesma enzima de corte abrupto, in-
clusive de outras espécies, que permite a obtenção de novas
combinações na sequência da molécula de DNA. Estas novas
78
Biologia Molecular

combinações de DNA são responsáveis pelo nome da técnica:


Tecnologia do DNA Recombinante.

As enzimas de restrição clivam a ligação fosfodiéster


deixando grupos 5’ fosfato (5’P) e 3’hidroxila (3’OH) nas
extremidade dos fragmentos resultantes. Esses grupos
constituem exatamente o substrato da enzima DNA ligase
que permite maior estabilidade quando o inserto (fragmen-
to) é clonado no vetor plasmidial, de modo que os fragmen-
tos gerados por ação de uma enzima de restrição poderão
ser facilmente reunidos, através de ligação covalente, por
ação da DNA ligase, que catalisa a formação de novas liga-
ções fosfodiéster (ligação dos nucleotideos) entre hidroxila
3’ na ponta de uma cadeia de DNA e o fosfato 5’ da ponta
de outra cadeia.

Existem dois tipos de ligases que são classificadas quanto


a origem: a T4 DNA ligase que é oriunda do fago T4 e a DNA
ligase oriunda da E.coli. A T4 utiliza o ATP como cofator e a
DNA ligase que requer o NAD .

No processo de obtenção do vetor recombinante, pode-se


usar duas estratégias de ligação:

a) Ligação intramolecular-formação da molécula circular


recombinante. Este tipo de ligação é favorecida pelo aumento
da frequência de contato.

b) Ligação intermolocular-ligação entre fragmentos lineares.

Alguns aspectos devem ser observados no preparo da re-


ação de ligação:

1-Concentração dos fragmentos: Se a razão molar vetor:


inserto for incorreta, a ligação pode gerar alta proporção de
79
Biologia Molecular

plasmídeos sem inserto ou plasmídeos carregando os inser-


tos em tandem (sequências de insertos, um após o outro).

2-Os fragmentos menores são mais fáceis de clonar.


Quando o fragmento é maior que 5kb a eficiência de clonagem
é reduzida consideravelmente. Para atingir o máximo de efi-
ciência de ligação, deve-se preparar a reação em um volume
menor (5-10mL).

3-Uma das formas de aumentar a concentração de frag-


mentos de extremidades abruptas na reação de ligação é
utilizar reagentes de condensação com o polietilenoglicol
(PEG). Uma das desvantagens desse tipo de ligação é que
a amostra de DNA deve ser diluída ou precipitada com eta-
nol antes da transformação em razão de que o PEG inibe
a eficiência de transformação de algumas células compe-
tentes.

4-Submeter os estoques dos fragmentos a temperatura de


45°C durante cinco minutos para dissociar aglomerados de
DNA e em seguida esfriar o DNA a 0°C antes da adição dos
outros componentes da ligação.

5-As ligações intermoleculares deverão ter o período de


incubação de 1 hora que é menor do que os períodos utiliza-
dos nas ligações intramoleculares que são de 12 horas, pois
períodos longos de incubação favorecem a formação de mo-
léculas circulares.

6-Uma estratégia usada para aumentar o número de


moléculas circulares recombinantes é a clonagem direcio-
nal na qual as extremidades do vetor linerizado não são
complementares, pois dessa forma evita-se a recirculari-
zação do vetor plasmidial e a obtenção de clones indese-
jáveis.
80
Biologia Molecular

7- A eficiência de ligação é medida pelo número de recom-


binantes obtidos por mg de DNA utilizado.

8- A temperatura ótima para ação da T4 DNA ligase é 37°C.


Entretanto, deve-se considerar a temperatura de fusão (TM)
das extremidades dos fragmentos como parâmetro importan-
te na taxa e na extensão da ligação. Dessa forma devem-se
utilizar temperaturas que sejam ótimas para ação da ligase
e próxima à TM das extremidades, de modo a proporcionar
grande número de moléculas com pontes de hidrogênio liga-
das (anelamento das extremidades).

Em geral usa-se para ligação de extremidades coesivas


a temperatura de 12 a 15°C com objetivo de proporcionar um
equilíbrio entre a hibridização das extremidades e a atividade
enzimática. Reações de ligações de fragmentos com extre-
midades perpendiculares devem ser conduzidas em tempe-
ratura ambiente, pois a hibridização das extremidades não é
necessária.

Como todos os seres vivos apresentam um DNA forma-


do por nucleotídeos que variam em apenas quatro bases
nitrogenadas, as moléculas de DNA de espécies diferen-
tes, cortadas com a mesma enzima de restrição, apresen-
tam a mesma probabilidade de se ligar nas extremidades
que os fragmentos complementares de uma mesma espé-
cie. Dessa forma podemos transferir genes entre espécies
muito distantes geneticamente, que nunca se cruzariam
naturalmente; como por exemplo, inserir um gene humano
no genoma de uma bactéria. Neste caso a molécula recom-
binante seria montada pela junção do gene humano com o
DNA do vetor bacteriano (ou seja, o plasmídeo) (Figura 4).

81
Biologia Molecular

Figura 4 - Procedimento de inserção de fragmento de DNA


em plasmídeo por complementaridade de bases nas extremi-
dades unifilamentares.

82
Biologia Molecular

Em geral, os procedimentos de construção de uma molécula


de DNA recombinante levam em consideração o isolamento de
um ou poucos genes específicos. Falta então “apenas” encon-
trar este gene específico no meio dos milhões de fragmentos de
DNA gerados após os cortes com as enzimas. Em decorrência
do código genético ser degenerado e do fato de que um gene é
quimicamente igual a qualquer outra região do DNA, já que os
componentes básicos são os mesmos (nucleotídeos); o trabalho
de se isolar um determinado gene é sem dúvida a etapa mais
difícil e trabalhosa de todo o processo. Existem diferentes meto-
dologias para se identificar um gene em questão e seus detalhes
não serão discutidos neste capítulo.

Após a recombinação do DNA, a etapa seguinte consiste em


multiplicar inúmeras vezes a molécula de DNA recombinante.
Como vimos anteriormente, as bactérias são organismos ideais
para se replicar os fragmentos de DNA; para isso, necessitamos
primeiramente transportar os inúmeros fragmentos para dentro
das bactérias por meio de um vetor, que pode ser um plasmídeo,
um bacteriófago, um cosmídio ou um YAC.

As bactérias possuem um cromossomo bacteriano, que é


uma longa molécula de DNA circular que controla suas funções
e sua reprodução. Além desse cromossomo, elas possuem pe-
quenas moléculas de DNA circular, denominadas plasmídeos. Ao
contrário do cromossomo bacteriano, os plasmídeos carregam
genes que não são essenciais para as bactérias, como por exem-
plo, genes de resistência a antibióticos. Na natureza, as bactérias
conseguem trocar genes por meio dos plasmídeos, o que é bas-
tante vantajoso já que são organismos de reprodução assexuada.

Os plasmídeos são os vetores mais utilizados na constru-


ção da molécula de DNA Recombinante, como por exemplo,
o plasmídeo pBR322. Esse plasmídeo apresenta dois genes
que conferem resistência aos antibióticos ampicilina e tetraci-
83
Biologia Molecular

clina, ou seja, as bactérias que carregam esse plasmídeo são


capazes de sobreviver e de se multiplicar mesmo em um meio
com esses dois antibióticos, o que dificulta a contaminação
por bactérias exógenas. Nos dois genes que conferem resis-
tência aos antibióticos ampicilina e tetraciclina, existem sítios
para as enzimas de restrição PstI e BamHI (Figura 5). A clo-
nagem de um fragmento entre esses dois genes (inativação) é
uma estratégia que pode ser usada para seleção de colônias
recombinantes. O pBR322 foi muito usado em razão de ter
sido um dos primeiros plasmídeos a ser utilizado, entretanto,
atualmente há uma grande disponibilidade de plasmídeos que
são usadas conforme as necessidades do mercado (tamanho,
tipo, extremidade do fragmento, sitio de múltipla clonagem,
marcadores de seleção e organismo a ser transformado).

Figura 5 - Plasmídeo pBR322 com os genes de resistência


aos antibióticos ampicilina e tetraciclina, ilustrando também os
sítios para as enzimas de restrição PstI e BamHI.
84
Biologia Molecular

Apenas algumas bactérias incorporam o plasmídeo re-


combinante, havendo então a necessidade de selecioná-las.
Várias colônias bacterianas (clones) são obtidas, onde cada
colônia apresenta inúmeras cópias de um mesmo fragmento
de DNA. Se, por exemplo, fragmentos de DNA forem incor-
porados ao plasmídeo pBR322 no local em que há um gene
de resistência ao antibiótico ampicilina, há a inativação deste
gene e as bactérias não serão resistentes à ampicilina. Por-
tanto, basta identificarmos a que colônia essas bactérias per-
tenciam e selecionar aquelas que apresentam o plasmídeo
recombinante.

A maneira como o plasmídeo penetra na bactéria ainda


não foi totalmente elucidada; porém, acredita-se que seja atra-
vés de poros na membrana. Entretanto, com o intuito de se
aumentar a probabilidade de absorção de plasmídeos pelas
bactérias, os pesquisadores adicionam íons cálcio (Ca++) para
anular a repulsão gerada pelo fato da membrana celular e do
plasmídeo apresentarem cargas negativas.

Por apresentarem uma capacidade natural de penetrar nas


bactérias, os plasmídeos são, portanto, ideais para realizarem
o transporte de fragmentos de DNA para o interior das célu-
las bacterianas. Se digerirmos os plasmídeos com a mesma
enzima de restrição usada para cortar o DNA humano, o gene
humano e os plasmídeos terão as extremidades ligantes, o
que possibilita a inserção do DNA humano nos plasmídeos e
posteriormente o transporte para o interior das bactérias. Des-
sa forma, toda vez que houver a duplicação dos plasmídeos, o
gene humano também será multiplicado. Vale a pena ressaltar
que a multiplicação dos plasmídeos pode ocorrer em um ritmo
bem mais acelerado do que o da duplicação bacteriana (uma
bactéria pode ter até 500 cópias de um plasmídeo). Isso per-
mite a formação de várias cópias do plasmídeo, com o gene
de interesse inserido, dentro de cada bactéria.
85
Biologia Molecular

Para que um plasmídeo seja considerado um bom vetor de


clonagem, deve possuir uma região de origem de replicação
(oriC) que é uma sequência de DNA que permite que o ve-
tor seja replicado na célula hospedeira, deve apresentar sítios
únicos de clivagem para endonucleases de restrição, que é a
mesma região onde o inserto é incorporado ao vetor de clona-
gem e possuir um gene que codifica um produto que distingue
a célula transformada da célula não transformada, ou seja, um
gene marcador. Uma desvantagem na utilização dos plasmí-
deos como vetores é que eles aceitam apenas a inserção de
pequenos fragmentos de DNA, com tamanho médio de até
4000pb. Para solucionar esse problema, o homem buscou na
Natureza outro vetor capaz de transferir material genético para
uma bactéria, os bacteriófagos (vírus que atacam bactérias).

Se um fragmento de DNA humano for ligado ao DNA de


um bacteriófago, é possível que o gene humano seja injetado
no interior da bactéria juntamente com o material genético vi-
ral. Quando utilizamos um bacteriófago como vetor, células de
bactérias não infectadas por vírus crescem e formam colônias.
Se ocorrer a infecção viral, as bactérias serão destruídas no
momento em que o vírus entrar no ciclo lítico, já que haverá a
lise (quebra) da parede bacteriana. Dessa forma, cada colô-
nia destruída, nesse caso, representa um clone com múltiplas
cópias do mesmo fragmento de DNA inserido no bacteriófago.
Basta então os pesquisadores retornarem às colônias origi-
nais e selecionar a(s) colônia(s) que apresentam o plasmídeo
recombinante.

Entre os bacteriófagos, o fago lambda é o mais utilizado,


aceitando fragmentos de até 20 mil pb. Se o objetivo do traba-
lho for transportar fragmentos maiores de DNA, podemos utili-
zar os cosmídios, moléculas construídas artificialmente e que
são capazes de aceitar a clonagem de fragmentos de DNA de
até 50 mil pb.
86
Biologia Molecular

Já para fragmentos de DNA muito grandes, em média


com 400 mil pb, há a necessidade de se utilizar levedu-
ras. Esse vetor é denominado YAC, abreviação do termo
em inglês Yeast Artificial Chromosome (cromossomo arti-
ficial de levedura), pois se comporta dentro da célula como
um cromossomo que se duplica antes de cada divisão celular
(as leveduras são organismos unicelulares, mas com vários
cromossomos lineares como os organismos superiores). Os
YACs possuem origem de replicação (sítios de início de dupli-
cação do DNA), centrômero e telômeros, da mesma forma que
um cromossomo de uma célula eucarionte.

Em resumo, a construção de uma molécula de DNA re-


combinante envolve cinco etapas principais:

1) Extração de DNA;

2) Isolamento do gene que codifica a proteína de interesse;

3) Clonagem em um vetor de forma a garantir que o gene


inserido esteja ativo, ou seja, sendo capaz de produzir um
RNAm e consequentemente uma cadeia polipeptídica;

4) Integração, expressão e herança do gene transferido na


célula hospedeira;

5) Purificação do produto final.

4.3 CONSIDERAÇÕES FINAIS

A Tecnologia do DNA Recombinante, que já é uma reali-


dade na criação de plantas transgênicas, também é extrema-
mente importante na produção de proteínas de interesse eco-
nômico como, por exemplo, a insulina. De fato, toda a insulina
87
Biologia Molecular

comercial utilizada por indivíduos diabéticos é produzida por


esta metodologia, tornando o produto mais barato e acessí-
vel para a população. Como vimos anteriormente, é possível
efetuarmos cortes no plasmídeo e no DNA humano por meio
de enzimas de restrição. Dessa forma o DNA humano é incor-
porado ao plasmídeo e é multiplicado toda vez que ocorrer a
duplicação do DNA plasmídico.

As aplicações da Tecnologia do DNA Recombinante são


praticamente ilimitadas e podem, no curto e médio prazo, tor-
nar alimentos e produtos farmacêuticos muito mais baratos e
portanto, acessíveis a todos os indivíduos.

Para visualizarmos como essa técnica é poderosa,


tomemos como exemplo a produção de um hormônio hu-
mano que é sintetizado a partir de um gene. Cada célu-
la humana irá apresentar duas cópias desse gene (uma
no cromossomo de origem paterna e outra no de origem
materna). Estima-se que cada indivíduo adulto tenha 1013
células; portanto, um indivíduo adulto teria um total de 2 x
1013 cópias desse gene.

Se utilizássemos um litro de cultura de bactérias, que


apresenta aproximadamente 5 x 1011 células, e considerando
que cada uma das bactéria pode ter até 500 cópias de um
plasmídeo, teoricamente seria possível a obtenção de 25 x
1013 cópias desse gene, o equivalente ao encontrado em 12
indivíduos adultos aproximadamente. Além disso, temos que
considerar o fato de que alguns genes só estão ativos em de-
terminados tecidos e em algumas fases do desenvolvimento.
Por exemplo, a insulina só é produzida pelas células do pân-
creas, nesse caso precisaríamos de um número bem maior
do que os 12 indivíduos citados anteriormente para produzir
a quantidade de proteína sintetizada em um litro de cultura
de bactérias.
88
Biologia Molecular

4.4 GUIA DE ESTUDO

1 - Cite duas características dos plasmídeos.

2 - Explique como podemos transferir um gene de um or-


ganismo para outro através da Tecnologia do DNA Recombi-
nante.

3 - O que são vetores de clonagem? Qual a importância


dos mesmos? Cite os principais vetores e o tamanho máximo
dos fragmentos que cada um pode carregar.

RESPONDA AS QUESTÕES 4 e 5 A PARTIR DO SEGUINTE


TEXTO QUE RELATA OS PROCEDIMENTOS BÁSICOS DA
TECNOLOGIA DO DNA RECOMBINANTE:

- Considerando como (A) o plasmídeo intacto, (B) o plas-


mídeo tratado com Eco RI, (C) um fragmento de DNA exógeno
também tratado com Eco RI e (D) o plasmídeo de DNA recom-
binante.

4 - Se o fragmento de DNA (C) tivesse sido tratado com


uma enzima de restrição diferente da Eco RI, seria possível
obter o plasmídeo recombinante? Sim ou não? (JUSTIFIQUE)

5 - Para se unir o DNA de (B) ao de (C) é necessária a uti-


lização da enzima transcriptase reversa? Sim ou não? (JUS-
TIFIQUE)

89
Biologia Molecular

6 - Para ser expressa em novos organismos, a sequência


codificadora do gene de interesse deve ser colocada sob con-
trole de genes regulatórios. Sim ou não? (JUSTIFIQUE)

7 - A integração de forma estável de um gene em um novo


organismo garante que seu produto gênico se expresse de
maneira hereditária. Sim ou não? (JUSTIFIQUE)

8 - As enzimas de restrição têm um papel fundamental em


genética molecular. Explique:
a) Como as enzimas de restrição atuam?
b) Por que essas enzimas são tão importantes?

90
Biologia Molecular

APLICAÇÕES E DERIVAÇÕES
DA TECNOLOGIA DO DNA
RECOMBINANTE

Fábio Barros Britto


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: fbbritto@ufpi.edu.br

Paulo Sarmanho da Costa Lima


Agrônomo, Dr., Empresa Brasileira de
Pesquisa Agropecuária.
e-mail: paulosarmanho@yahoo.com.br

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

91
Biologia Molecular

92
Biologia Molecular

APLICAÇÕES E DERIVAÇÕES DA
TECNOLOGIA DO DNA
RECOMBINANTE

Fábio Barros Britto


Paulo Sarmanho da Costa Lima
Sérgio Emílio dos Santos Valente

93
Biologia Molecular

94
Biologia Molecular

SUMÁRIO

Capítulo 5. APLICAÇÕES E DERIVAÇÕES DA


TECNOLOGIA DO DNA RECOMBINANTE

5.1 INTRODUÇÃO.................................................................97
5.2 VANTAGENS DA TECNOLOGIA DO DNA
RECOMBINANTE...........................................................99
5.2.1 Produção de substâncias de interesse..............101
5.2.2 Produção de vacinas...........................................105
5.2.3 Aconselhamento Genético..........................................108
5.2.4 Detecção de Doenças Genéticas...............................110
5.2.5 Terapia Gênica............................................................111
5.2.6 Produção de Organismos Transgênicos.....................112
5.3 DESVANTAGENS DA TECNOLOGIA DO DNA
RECOMBINANTE..........................................................114
5.3.1 Produção de Proteínas................................................114
5.3.2 Produção de Vacinas..................................................116
5.3.3 Produção de Organismos Transgênicos.....................117
5.4 GUIA DE ESTUDO.........................................................118

95
Biologia Molecular

96
Biologia Molecular

5.1 INTRODUÇÃO

A área da Biologia Molecular, dentro das Ciências Biológi-


cas, foi a que mais evoluiu nos últimos anos. Com o sequencia-
mento do Genoma Humano, inúmeras possibilidades surgem
para o futuro, aumentando a compreensão da forma como o
material genético é organizado e realiza as suas funções; e
possibilitará, por meio da Tecnologia do DNA Recombinante,
a utilização de fragmentos do DNA para a realização de mais
funções das que são realizadas atualmente.

Microorganismos, principalmente vírus e bactérias, são


muito utilizados na Tecnologia do DNA Recombinante. A pala-
vra “vírus” deriva da palavra latina que significa ‘’veneno’’ e co-
meçou a ser usada numa época em que os biólogos não conse-
guiam observá-lo por ainda não existir o microscópio eletrônico.
Porém, sabia-se da existência dos vírus por certos preparados
conterem algo que causava doenças em vegetais. Os vírus di-
ferem das bactérias e de todos os demais organismos por não
serem compostos de células. São muito menores que uma célu-
la, sendo do tamanho de uma macromolécula. O vírus é consti-
tuído de uma molécula espiralada de ácido nucléico envolta por
uma camada protéica. Neste aspecto, assemelha-se aos cro-
mossomos de uma célula, de forma que podemos considerá-lo
quase como um “cromossomo livre”. Os vírus são considerados
parasitas obrigatórios, pois só podem se multiplicar no interior
de uma célula hospedeira, uma vez no interior de uma célula,
os vírus utilizam da maquinaria celular para produzir mais vírus.
Em alguns casos, os vírus podem ocasionar doenças graves,
como por exemplo, AIDS, poliomelite, raiva ou dengue.

Já as bactérias pertencem ao Reino Monera e são orga-


nismos procariontes. Elas constituem um grupo de organismos
unicelulares que possuem uma parede celular. São as menores
células existentes e não apresentam um núcleo definido. Assim,
o material genético fica disperso no citoplasma bacteriano.
97
Biologia Molecular

A vantagem da utilização desses microorganismos em pro-


cedimentos que envolvam a Tecnologia do DNA Recombinante
reside no fato dos vírus e bactérias representarem um sistema
muito simples de se manipular, podendo ser cultivados em grande
número em um curto espaço de tempo. Com técnicas molecula-
res, sua informação genética pode ser manipulada para que os
mesmos possam produzir quantidades abundantes de proteínas
a um baixo custo. Além disso, esses microorganismos podem
eliminar a proteína de interesse diretamente no meio de cultura,
simplificando a purificação do produto final. Isto permite com que
a proteína de interesse seja recuperada sem a necessidade de se
romper a parede celular bacteriana. Dessa forma, após a retira-
da das bactérias por centrifugação, a proteína é concentrada no
meio de cultura e, se necessário, submetida a outros processos
para se obter maiores graus de pureza. O nível de purificação de-
penderá do destino que será dado à proteína obtida e, por razões
econômicas, esse nível é mantido ao mínimo necessário para que
o produto final desempenhe eficientemente as funções deseja-
das. Por exemplo, proteínas produzidas em grandes quantidades
para o emprego na indústria são submetidas a um nível mais bai-
xo de purificação, enquanto proteínas que se destinam à injeção
em pacientes necessitam passar por várias etapas de purificação.

Porém, algumas vezes a utilização de um sistema eucariótico


é essencial para a produção de proteínas humanas ou de outros
mamíferos. A levedura (utilizada por séculos no preparo do pão e
da cerveja) é o organismo eucarioto mais simples e apresenta al-
gumas características favoráveis à execução de experimentos na
área da Tecnologia do DNA Recombinante. Seu crescimento pode
ser feito em meio de cultura como as bactérias, sendo, portanto,
rápido, fácil e de baixo custo. As leveduras também podem ser
induzidas a secretar a proteína recombinante no meio de cultura.

Mesmo com essas características, as proteínas produzidas


em leveduras às vezes não substituem adequadamente uma
98
Biologia Molecular

proteína humana ou uma de origem animal. Assim, o sistema


ideal para a expressão do gene e a obtenção da proteína ainda
é o que utiliza células de mamíferos. Por exemplo, o ativador
de plasminogênio e a eritropoetina exigem células de mamífe-
ros como sistemas de expressão. A desvantagem na utilização
de culturas de células de mamíferos é que a manutenção das
células é um processo caro e difícil, mas, em compensação, é
uma alternativa que garante a produção de proteínas humanas
complexas e com sua atividade biológica conservada.

Recentemente, os cientistas começaram a alterar a


sequência de aminoácidos nas proteínas para torná-las mais
estáveis ou mais eficientes no desempenho de suas funções.
Essa nova área da ciência, que tem sido chamada de enge-
nharia das proteínas, torna possível aumentar as propriedades
das proteínas de maneira lógica. Vale salientar que a enge-
nharia das proteínas requer um profundo conhecimento so-
bre as relações entre a estrutura e conformação das proteínas
assim como da função que elas desempenham, ou seja, para
que a humanidade seja beneficiada por essa nova tecnologia
certamente se passarão vários anos ou até mesmo décadas.

5.2 VANTAGENS DA TECNOLOGIA DO DNA RECOMBINANTE

A Tecnologia do DNA Recombinante teve início em 1973,


logo após a obtenção da primeira molécula de DNA recombi-
nante. Várias substâncias de interesse têm sido produzidas
por meio dessa nova tecnologia e encontram-se no mercado
desde 1976 quando a empresa Genetech, localizada em São
Francisco-EUA, anunciou a obtenção do primeiro hormônio
produzido por essa nova tecnologia, a somatostatina (hormô-
nio produzido no pâncreas, responsável por auxiliar o contro-
le do crescimento). Essa proteína é muito pequena, contém
somente 14 aminoácidos, e na época foi mais fácil sintetizar
um oligonucleotídeo com a sequência dos nucleotídeos co-
99
Biologia Molecular

dificantes na ordem correta do que isolar o gene natural. O


oligonuceotídeo foi ligado a um plasmídio para sua posterior
expressão na bactéria E. coli. Dessa forma, quantidades con-
sideráveis de somatostatina humana foram produzidas em
bactérias, demonstrando que, com certos ajustes do sistema,
essa técnica poderia ser utilizada com grande sucesso.

Na década de 1980 foram inauguradas várias companhias


de Biotecnologia nos Estados Unidos e na Europa, com muitas
promessas que seriam concretizadas em pouco tempo. Na épo-
ca as ações de companhias relacionadas à Tecnologia do DNA
Recombinante subiram vertiginosamente na bolsa de valores de
New York. Entretanto, por volta de 1987, houve a quebra de várias
dessas companhias gerando enormes prejuízos a vários acionis-
tas de Wall Street. Somente as grandes empresas, ou aquelas
que de alguma forma produziram lucros a curto ou médio pra-
zo, foram capazes de se manter. Como saída alternativa, muitas
companhias de Biotecnologia passaram a produzir material de
consumo e equipamentos especializados necessários à pesquisa
baseada em métodos de Biologia Molecular.

A Tecnologia do DNA Recombinante promete uma verdadeira


revolução nos métodos de produção de proteínas e outras subs-
tâncias de importância, encontrando aplicações na medicina, na
indústria farmacêutica, na indústria de alimentos e até mesmo em
processos de despoluição do meio ambiente. Devido ao fato do
código genético ser praticamente universal, podemos, por exem-
plo, retirar um gene humano e inseri-lo em uma bactéria que pas-
saria a produzir a proteína codificada por esse gene.

Apesar do enorme potencial das aplicações da Tecnologia


do DNA Recombinante, existe um longo caminho até que haja
o lançamento do produto no mercado. Estima-se que para se
lançar um novo produto farmacêutico no mercado seja neces-
sário pelo menos 10 anos de pesquisa e de testes clínicos e
investimentos de pelo menos 100 milhões de dólares.
100
Biologia Molecular

5.2.1 Produção de substâncias de interesse

A primeira droga aprovada para ser produzida em larga


escala por meio de técnicas moleculares foi a insulina. A in-
sulina é um hormônio muito importante, produzido nas células
do pâncreas e excretado na corrente sanguínea, que regula
o metabolismo do açúcar. Um dos tipos de diabetes ocorre
devido à incapacidade das células do pâncreas em produzir
insulina, entretanto os sintomas da doença podem ser evita-
dos com injeções diárias desse hormônio.

Antes do aparecimento da Tecnologia do DNA Recombinante, a


insulina era produzida a partir do pâncreas bovino ou suíno. Embora a
insulina animal seja biologicamente ativa em humanos, ela apresenta
uma sequência de aminoácidos um pouco diferente, o que pode pro-
vocar reações imunes nos pacientes que a reconhecem como uma
proteína estranha. Isso pode levar ao bloqueio da ação da insulina
injetada pelos anticorpos produzidos no corpo do paciente e pode sur-
gir no local da injeção uma reação inflamatória. Entretanto, a insulina
produzida em um sistema de expressão a partir da clonagem do gene
humano, por ser exatamente igual àquela normalmente secretada
pelo pâncreas, não apresenta tais efeitos (Figura 6).

Outros produtos pioneiros, produzidos por meio da


Tecnologia do DNA Recombinante, desde 1985, foram o hor-
mônio do crescimento e o interferon. O hormônio do cresci-
mento é produzido na glândula pituitária e regula o crescimento
e o desenvolvimento do organismo. Um tumor nessa glândula
pode causar a superprodução desse hormônio, resultando em
indivíduos com crescimento aumentado. Por outro lado, crian-
ças que nascem com deficiência do hormônio do crescimento
nunca atingem a estatura normal e podem ser tratadas com
injeções regulares do hormônio do crescimento.

101
Biologia Molecular

Figura 6 - Etapas para a produção de insulina por meio da


Tecnologia do DNA Recombinante.
102
Biologia Molecular

No caso do hormônio do crescimento, a proteína seme-


lhante de origem animal não é eficiente em humanos e, por
muitos anos, esse hormônio foi extraído das glândulas pitui-
tárias de cadáveres. Entretanto, dado o tamanho reduzido
dessa glândula e a baixa concentração na qual o hormônio
é normalmente produzido no organismo, sua extração era
extremamente trabalhosa e onerosa. Além disso, algumas
crianças tratadas com hormônio do crescimento desenvol-
veram sintomas da doença de Creutzfeldt-Jakob, uma do-
ença fatal que causa degeneração do cérebro. Quando se
descobriu que essa doença era causada por um vírus trans-
mitido por um dos doadores de pituitária, a prática de extra-
ção do hormônio do crescimento a partir de cadáveres foi
suspensa.

Os fatores de crescimento são substâncias que exer-


cem o controle do crescimento e da multiplicação celular,
ou seja, as células recebem as instruções para se dividi-
rem através dos fatores de crescimento. Quando ocorre
produção aumentada ou descontrolada desses fatores, as
células podem continuar se multiplicando de forma desor-
denada, levando ao desenvolvimento de um tumor ou cân-
cer. Quem sabe em um futuro próximo possamos impedir
o surgimento de novas células cancerosas indiferenciadas
por meio de drogas que evitem a produção excessiva de
fatores do crescimento?

Há várias décadas se reconhece que quando uma célula


é infectada por um vírus, ela passa a produzir quantidades
muito pequenas de uma substância antiviral (interferon) que
interfere e impede o crescimento viral. A produção comercial
do interferon, por meio da Tecnologia do DNA Recombinante,
teve início em 1985, o que levou a um estudo mais aprofunda-
do a respeito da importância dessa proteína no tratamento de
infecções por vírus.
103
Biologia Molecular

Em 1988 iniciou-se a produção comercial da primeira


substância produzida por meio da Tecnologia do DNA Re-
combinante em cultura de células de mamíferos: o ativador
de plasminogênio nos tecidos (tissue plasminogen activator
- TPA). O TPA é uma enzima que ativa o plasminogênio para
produzir plasmina, acarretando na destruição das fibras do
coágulo. Dessa forma, a produção de TPA em larga escala é
extremamente benéfica a indivíduos com depósito de gordura
nas artérias e que, eventualmente, possam sofrer um bloqueio
devido a um coágulo de sangue que se forme sobre o depó-
sito de gordura, impedindo que o músculo cardíaco receba
suplementos de sangue e de oxigênio, causando um ataque
do coração (infarto do miocárdio).

Em 1989 começou a produção em larga escala da eritropoe-


tina (EPO), por meio da expressão do gene responsável por sua
produção em cultura de células de mamíferos. A EPO é um fator
de crescimento produzido nos rins e liberado na corrente sanguí-
nea. Sua função é estimular a divisão celular na medula óssea,
induzindo a formação de células vermelhas maduras do sangue
(hemácias), na medida da necessidade do organismo.

Em pacientes com doenças renais graves a quantidade de


EPO secretada pode encontrar-se reduzida de tal forma que
seja insuficiente para estimular a formação de novas hemá-
cias. Assim, à medida que as hemácias circulantes morrem,
não sendo substituídas por células novas, o paciente torna-se
anêmico. Grande parte dos pacientes submetidos à diálise de-
vido à insuficiência renal necessita de transfusão sanguínea
regularmente. Entretanto, pacientes com doença renal crônica,
tratados com EPO, passam a produzir hemácias de maneira
eficiente, dispensando as transfusões e apresentando grande
melhora no quadro geral. Dessa forma, haveria também uma
diminuição na demanda nos bancos de sangue o que levaria à
redução no risco de transmissão de doenças infecciosas.
104
Biologia Molecular

Além disso, a EPO teria aplicação também em pacientes


que devem ser submetidos a grandes cirurgias. Tais pacientes
poderiam ser tratados com EPO por um a dois meses antes da
cirurgia, aumentando, assim, a produção de hemácias. O san-
gue recentemente produzido nesses pacientes seria coletado
e se efetuaria uma nova transfusão com esse mesmo sangue
após a cirurgia, eliminando, dessa forma, os riscos envolvidos
nas transfusões com sangue de doadores estranhos (qualquer
produto extraído do sangue humano apresenta potencialmen-
te risco de transmissão de vírus).

Também é possível a produção, por meio da Tecnologia do


DNA Recombinante, dos fatores VIII e IX de coagulação para
que sejam administrados em pacientes portadores de hemo-
filia A e B, respectivamente. Esses hemofílicos são deficien-
tes para um desses fatores e podem morrer por hemorragias.
Antes da descoberta do vírus da AIDS, inúmeros pacientes
com hemofilia foram contaminados. Mesmo hoje em dia, não
podemos afirmar que o risco das transfusões sanguíneas seja
zero; pois o vírus da AIDS apresenta um tempo de latência no
qual sua presença é dificilmente detectada; além disso, sem-
pre existe a possibilidade de infecção por um vírus novo, ainda
não identificado.

5.2.2 Produção de vacinas

Atualmente existem cerca de 20 tipos diferentes de vaci-


nas, sendo utilizadas em larga escala e quase 200 tipos sendo
testados. A tecnologia para o desenvolvimento e a produção
de vacinas permaneceu praticamente inalterada por mais de
200 anos, desde que Edward Jenner realizou as primeiras
imunizações em 1798.

O princípio das vacinas baseia-se no fato de o simples con-


tato com os antígenos do organismo invasor é suficiente para
105
Biologia Molecular

mobilizar o sistema imunológico a formar anticorpos. Podemos


dizer que antes da Tecnologia do DNA Recombinante existiam
dois tipos de vacinas: inativadas e atenuadas. No caso das va-
cinas inativadas, o agente infeccioso é morto antes de ser in-
jetado no corpo e, embora não provoque a infecção, uma vez
que esse agente não se multiplica mais, seus antígenos são
capazes de desencadear a resposta imune. Na fabricação de
vacinas atenuadas, a virulência do organismo infeccioso é en-
fraquecida devido às várias passagens em culturas de tecido
ou em hospedeiros não usuais, de forma a se selecionar mu-
tantes com capacidade reduzida de desencadear doenças.

Porém, esses dois tipos apresentam problemas. As vaci-


nas produzidas com organismos mortos, por exemplo, para
resultarem em uma imunização duradoura exigem altas do-
ses de antígeno e repetidas aplicações. Além disso, não po-
dem ser administradas com a alimentação ou a água, o que
pode ser problemático principalmente no caso de vacinação
de aves. Já as vacinas produzidas com vírus atenuado, em-
bora na maioria das vezes sejam mais eficientes na indução
da resposta imune, podem apresentar problemas quanto à se-
gurança. As mutações que causam a atenuação do vírus são
produzidas ao acaso, raramente caracterizadas e, portanto,
impossível de se prever sob que circunstâncias poderia ocor-
rer a reversão à virulência.

A comunidade científica sempre buscou aperfeiçoar as


vacinas existentes, objetivando uma imunização tão eficiente
como aquela alcançada em indivíduos que se recuperaram de
uma infecção. As vacinas são particularmente importantes no
caso das infecções virais, pois os vírus não podem ser destru-
ídos com antibióticos, que matam exclusivamente bactérias.

Atualmente tem-se utilizado a Tecnologia do DNA Re-


combinante para a produção de vacinas mais eficazes. Essa
106
Biologia Molecular

Tecnologia do DNA Recombinante aplicada à produção de va-


cinas parte do princípio que para um indivíduo estar protegido
contra um agente infeccioso não é necessário que ele produza
anticorpos contra todos os antígenos do microorganismo. Os
vírus, por exemplo, possuem diferentes proteínas, onde ape-
nas algumas são importantes na indução da resposta imune.
Assim, a questão é determinar uma ou duas proteínas que
sejam cruciais para a proteção imunológica e, uma vez que
elas tenham sido identificadas, realizar o isolamento dos ge-
nes que codificam tais proteínas.

Além disso, em muitos casos não é necessário a inocu-


lação da molécula completa do antígeno para se induzir uma
boa resposta imune. Uma pequena porção da proteína anti-
gênica, conhecida como epítopo, composto de não mais que
20 aminoácidos, pode ser suficiente na produção de vacinas.
Sempre há o risco de que uma vacina desenvolvida contra
uma pequena porção da molécula antigênica seja prejudicada
pelo fato do vírus sofrer mutações, de forma a originar uma
linhagem resistente aos anticorpos produzidos pela vacina.
Para evitar esse risco, basta se produzir vacinas a partir de
um conjunto de diferentes cadeias polipeptídicas, referentes
a vários epítopos, exigindo que haja várias mutações no vírus
para que ocorra o desenvolvimento de resistência.

O primeiro exemplo de sucesso alcançado na produção


de vacinas de DNA foi o desenvolvimento de uma vacina de
subunidade contra o vírus da hepatite B (HBV), que ataca o fí-
gado. Há muitos anos se sabia que indivíduos infectados com
hepatite B apresentam no soro uma grande quantidade de
uma proteína presente na cápsula do vírus da hepatite B. Os
cientistas então isolaram apenas o gene do HBV que codifica
essa proteína e o inseriram em levedura para a obtenção de
quantidades suficientes desse antígeno. O fato de que a vacina
assim produzida não apresenta o DNA do HBV torna-a muito
107
Biologia Molecular

segura, uma vez que não existe o risco do vírus ser recupera-
do. Atualmente a vacina contra a hepatite B é comercializada
para imunizar grande parte da população. Da mesma forma,
podemos em um futuro próximo desenvolver vacinas contra o
HIV, vírus causador da AIDS.

Outra possibilidade para se incrementar a eficiência das


vacinas consiste na clonagem de um ou mais genes de grande
importância antigênica, no genoma de um vírus não patogê-
nico, mas que passaria a expressar essas subunidades junta-
mente com os seus genes. Por exemplo, é possível se clonar
no genoma do vírus vaccínia, reconhecidamente inofensivo à
saúde humana e animal, os genes das glicoproteínas da cáp-
sula do vírus da hepatite B, herpes e influenza, de tal forma
que o vírus vaccínia recombinante passa a expressar em sua
cápsula as proteínas específicas para esses três outros vírus.
Uma vacina produzida dessa maneira induziria, portanto, a
resposta imune simultaneamente contra três doenças a partir
de uma única imunização.

Os métodos de DNA recombinante devem diminuir os ris-


cos das pessoas envolvidas na produção de vacinas, pois po-
dem ser produzidas a partir de uma subunidade do agente
infeccioso, não necessitando, portanto, do crescimento em
larga escala do organismo responsável pela infecção.

5.2.3 Aconselhamento Genético

Quando nasce uma criança afetada por uma doença gené-


tica grave e incurável, é normal que os pais fiquem ansiosos
e desejem saber como será a evolução dessa doença (prog-
nóstico) e qual a probabilidade de, vindo a ter outro filho, este
ser afetado pela mesma anomalia (risco de recorrência). O
aconselhamento genético são as informações fornecidas, por
um médico geneticista, a uma família com relação ao risco de
108
Biologia Molecular

recorrência, prognóstico e possíveis tratamentos para que o


casal tome uma decisão consciente com relação às próximas
gestações.

É extremamente importante o diagnóstico correto dos por-


tadores do gene e dos indivíduos assintomáticos no aconse-
lhamento genético. Algumas doenças genéticas manifestam
sinais clínicos muito semelhantes a outras doenças. Somente
determinando-se qual é exatamente a doença que afeta uma
determinada família pode-se estabelecer qual o seu padrão de
herança e qual é o risco deste casal, ao gerar outro filho, de
ele ser afetado.

Em algumas situações de alto risco para uma próxima ges-


tação, é possível oferecer ao casal a alternativa do diagnósti-
co pré-natal, permitindo a análise das células de uma criança
ainda em desenvolvimento no útero materno. Dessa forma,
pode-se determinar se o feto é normal ou afetado. O diagnós-
tico pré-natal permite que se inicie o tratamento ainda durante
a gestação ou logo após o nascimento, evitando, algumas ve-
zes, a manifestação da doença genética.

Por exemplo, na fenilcetonúria, uma doença grave que


causa retardo mental severo e óbito ainda na infância, pode-
se evitar a manifestação do quadro clínico desde que o diag-
nóstico seja precoce. A criança diagnosticada como afetada
terá desenvolvimento normal se receber uma dieta pobre no
aminoácido fenilalanina.

A abordagem básica do diagnóstico pré-natal é obter


amostras de tecido fetal, com o qual podemos realizar exa-
mes enzimáticos, cariotípicos ou até mesmo de DNA, para se
determinar a presença de uma doença genética. O tecido fetal
pode ser obtido por meio de dois procedimentos: amniocente-
se e coleta de amostras da vilosidade coriônica.
109
Biologia Molecular

A amniocentese consiste na coleta, por volta da 16ª sema-


na de gestação, do fluido amniótico (líquido que envolve o feto
no útero) com o auxílio de uma agulha de injeção inserida no
abdômen materno, monitorando-se o caminho da agulha com o
aparelho de ultra-som. Esse líquido contém principalmente uri-
na fetal e células que se desprenderam do feto. As vilosidades
coriônicas são formadas também por tecido fetal e compõem o
tecido que formará a placenta. A coleta de uma pequena amos-
tra das vilosidades coriônicas acontece por meio de um cateter
introduzido na vagina. Neste caso, também, o tecido pode ser
utilizado diretamente para os exames ou pode-se estabelecer
uma cultura para aumentar o número de células.

Apesar de altamente polêmico e de ser uma prática proi-


bida no Brasil, exceto quando autorizada judicialmente (em
casos de estupro ou de anencefalia do feto), quando não há
tratamento disponível ou maneiras de se evitar a manifesta-
ção da doença, o diagnóstico pré-natal permite ao casal optar
na realização do aborto.

5.2.4 Detecção de Doenças Genéticas

Antes do desenvolvimento da Biologia Molecular, o diag-


nóstico das doenças genéticas era restrito a testes bioquími-
cos. Porém esses testes só podem ser aplicados quando se
conhece o produto primário dos genes, situação que é bastan-
te rara no genoma humano. Além disso, como poucos genes
dessa minoria, se expressam em células recuperadas do flui-
do amniótico, o diagnóstico pré-natal é praticamente impos-
sível de ser realizado. Outra limitação dos testes bioquímicos
refere-se ao estudo de doenças genéticas com manifestação
tardia, como por exemplo, na doença de Huntington (Coréia
de Huntington). É necessário considerarmos também o fato
de que podemos ter modificações pós-traducionais gerando
resultados que não refletem a condição gênica.
110
Biologia Molecular

Atualmente, com o desenvolvimento das técnicas de análise


por meio do DNA, podemos comparar a sequência de nucleotí-
deos de um gene de um indivíduo normal com a de um indivíduo
afetado por uma doença genética e determinar com precisão de
até mesmo uma mutação em apenas uma base nitrogenada no
seu DNA. Dessa forma, podemos identificar indivíduos portado-
res que não apresentam o fenótipo alterado, mas que podem
transmitir o gene defeituoso para seus descendentes.

Com a detecção de genes alterados por meio de técnicas


moleculares, podemos identificar genes mutantes que apresen-
tam ausência de penetrância ou penetrância reduzida, assim
como genes com expressividade variável. É possível determinar
a presença de um gene mutante mesmo antes do aparecimento
de qualquer sinal clínico da doença, favorecendo o diagnóstico
em indivíduos assintomáticos, pré-sintomáticos ou em mulheres
portadoras de genes recessivos ligados ao cromossomo X. Des-
sa forma, o diagnóstico é muito preciso e sensível, pois quando
se analisa o gene (DNA) ao invés do polipeptídeo produzido, es-
tamos focados diretamente na fonte do problema.

5.2.5 Terapia Gênica

Ao se detectar uma mutação em um indivíduo, há a possi-


bilidade da substituição do gene mutante por um gene normal.
Embora haja poucos casos de sucesso relatados na literatura,
as perspectivas de sucesso na terapia gênica são infinitas. Na
grande maioria dos casos, a medicina atual faz um tratamento
dos sintomas do indivíduo. Fazendo uma analogia, seria como se
pintássemos a laje de uma casa que apresenta uma goteira. Com
a terapia gênica haveria o reparo da fonte do problema; ou seja,
seria como se consertássemos o telhado da casa.

O grande problema da Terapia Gênica é o fato de não sa-


bemos o local que um gene inserido vai se ligar, podendo acar-
111
Biologia Molecular

retar na ativação de um oncogene e/ou inativação de um gene


supressor tumoral, resultando no aparecimento de um câncer.
Além disso, podemos gerar vários problemas de ordem ética,
como por exemplo, o caso de um adolescente americano, por-
tador de uma doença não severa, que veio a falecer em decor-
rência da utilização da terapia gênica como tratamento.

Há poucos casos de sucesso desta técnica, devido princi-


palmente ao uso limitado, por haver ainda vários riscos. Além
disso, os pacientes que se submetem à Terapia Gênica já se
apresentam em um estágio avançado da doença, contribuindo
ainda mais para o insucesso dessa técnica.

É importante salientarmos que há algumas décadas a re-


alização de um transplante de coração era o mesmo que sen-
tenciar o indivíduo à pena de morte. Hoje em dia, a técnica
de transplante cardíaco é realizada com grande sucesso, pois
houve uma grande aprendizagem da comunidade médica com
os erros das décadas passadas. Se não utilizarmos a Terapia
Gênica em decorrência dos riscos, a humanidade toda será
prejudicada. Ninguém discute os benefícios das viagens por
meio de aviões, mas quantas pessoas já morreram devido a
um desastre aéreo?

5.2.6 Produção de Organismos Transgênicos

A partir da Tecnologia do DNA Recombinante, produzir or-


ganismos transgênicos, realizando transferências genéticas
que nunca ocorreriam espontaneamente na natureza. Por
exemplo, um experimento foi realizado em que houve a trans-
ferência do gene de um vaga-lume para uma planta de taba-
co, onde o vegetal emitia uma luminosidade. Na natureza, a
interação de bactérias do gênero Agrobacterium com células
vegetais é o único caso de transferência de genes entre reinos
diferentes.
112
Biologia Molecular

Companhias de Biotecnologia do mundo todo objetivam


desenvolver plantas e animais transgênicos que funcionem
como “fábricas biológicas” de proteínas recombinantes com-
plexas, como por exemplo, polímeros naturais biodegradá-
veis, hormônios de mamíferos e anticorpos. Com o passar dos
anos a tendência natural é que haja uma redução dos custos
de produção dessas proteínas. Pode-se também manipular
geneticamente vegetais e animais para produzir mais vitami-
nas, leite ou carne.

Devido ao fácil cultivo e por não haver problemas éticos na


experimentação, os vegetais foram material de várias pesqui-
sas relacionadas com a produção de transgênicos. Em relação
às técnicas de melhoramento genético clássico, as técnicas
para a obtenção de organismos transgênicos apresentam a
vantagem de permitir a adição de uma única característica em
uma variedade melhorada sem a necessidade de retrocruza-
mento para remover ligações gênicas não desejáveis.

Os vegetais transgênicos são importantes para a agri-


cultura por apresentarem várias características de interesse
econômico: tolerância a herbicidas, resistência a vírus, quali-
dade superior do produto, resistência a insetos e resistência
a fungos. Podem inclusive ter o seu teor de proteínas e/ou
vitaminas aumentado, sendo uma boa opção no combate à
fome, já que as áreas agricultáveis no planeta praticamen-
te se acabaram, com raras exceções na África e no Brasil.
Porém, cabe salientar que o problema da fome atualmente
não é devido à falta de alimento e sim a uma má distribuição
desses alimentos.

Há também a possibilidade de criarmos uma planta trans-


gênica que tenha incorporado no seu genoma o gene de um
vírus patogênico e que produza a proteína (antígeno) viral em
grande quantidade nas suas células. Dessa forma, bastaria as
113
Biologia Molecular

pessoas ingerirem o fruto, raízes ou folhas dessa planta que es-


tariam sendo imunizadas. Isso seria muito interessante já que a
maioria das vacinas atualmente disponíveis é sensível ao calor,
o que dificulta e encarece sua distribuição em locais remotos
onde a temperatura chega a mais de 40°C e nem sempre se
dispõe de luz elétrica. Há quem acredite que a erradicação da
varíola, anunciada em 1977 pela Organização Mundial de Saú-
de, somente foi possível porque a vacina não exigia refrigera-
ção, facilitando grandemente sua distribuição nas regiões mais
distantes. Com as plantas transgênicas, produtoras de antíge-
nos virais, essa questão seria facilmente resolvida.

De acordo com os preceitos éticos e sócio-econômicos é


necessário que os produtos transgênicos sejam avaliados por
testes fisiológicos, bioquímicos, alimentares, de impacto am-
biental e testes de campo. A produção de organismos transgê-
nicos acelerou o progresso de muitas áreas da Biologia e da
Agronomia, trazendo benefícios ao produtor e ao consumidor.
Não há provas concretas de que organismos transgênicos fa-
çam mal (2,5 bilhões de pessoas consomem transgênicos).

5.3 DESVANTAGENS DA TECNOLOGIA DO


DNA RECOMBINANTE

5.3.1 Produção de Proteínas

Como foi visto anteriormente, podemos utilizar a Tecno-


logia do DNA Recombinante para inserir o gene responsável
pela produção de insulina no genoma de uma bactéria, que
passaria a produzir a proteína codificada pelo gene. Porém,
algumas vezes, a bactéria não consegue expressar o gene
ou produz menos proteína que o esperado. É possível tam-
bém ocorrer a produção de uma proteína modificada, pois,
dependendo do organismo, podemos ter uma preferência a
determinados códons na formação de algumas proteínas. Por
114
Biologia Molecular

exemplo, o código padrão tem seis códons para o aminoáci-


do arginina, e os genes humanos apresentam uma preferên-
cia aos códons AGA e AGG. A Escherichia coli, porém, quase
nunca usa o AGA e muitas vezes a tradução não ocorre de
forma correta. Espera-se que em um futuro próximo, o homem
possa compreender como essas variações ocorrem possibili-
tando a inserção de genes ativos em outros organismos, com
as mesmas funções do gene de interesse.

Outro problema na produção de proteínas por bactérias,


através da Tecnologia do DNA Recombinante, é o fato de que
várias proteínas são formadas pela associação de várias ca-
deias polipeptídicas e que, dependendo da proteína, as bacté-
rias não possuem um sistema enzimático capaz de processar
as diferentes cadeias polipeptídicas ao mesmo tempo. A insu-
lina é uma proteína que apresenta duas cadeias polipeptídicas
e é produzida por meio da Tecnologia do DNA Recombinante
desde 1984. Devido ao grande interesse comercial, estima-se
que 0,5% da população mundial sofra de diabetes, o homem
criou uma saída engenhosa para solucionar esse problema. O
gene para cada cadeia foi expresso em culturas separadas de
bactérias e, após a purificação, ligou-se as duas cadeias para
formar a insulina recombinante ativa.

Apesar das vantagens da utilização de bactérias na pro-


dução de proteínas, as bactérias, por serem organismos pro-
cariontes, apresentam algumas dificuldades para a produção
de uma proteína humana. Frequentemente a proteína de eu-
cariotos é incapaz de se dobrar adequadamente para assumir
sua configuração final em um sistema procariótico. Nesse
caso, a proteína pode se tomar insolúvel e biologicamente
inativa. Isso ocorre principalmente em relação às proteínas
grandes. Outro problema é que a proteína heteróloga pode
ser tóxica para a bactéria. Um terceiro problema é que al-
gumas proteínas de eucariotos são mais complexas e a
115
Biologia Molecular

atividade dessas proteínas depende de modificações na


cadeia polipeptídica após a tradução, como, por exemplo,
a adição de cadeias de açúcar ou fosfato, porém as bac-
térias não possuem as enzimas necessárias para executar
tais modificações.

Uma saída seria a utilização de um organismo eucarion-


te, por exemplo, as leveduras. Embora as leveduras realizem
várias modificações pós-traducionais, o padrão dessas modi-
ficações nem sempre é exatamente igual ao observado nas
células humanas. Assim, a proteína produzida em leveduras
às vezes não substitui adequadamente uma proteína humana
ou uma de origem animal. Além disso, as leveduras possuem
enzimas que degradam proteínas e isso pode diminuir a pro-
dução final da proteína heteróloga.

5.3.2 Produção de Vacinas

A pesquisa de vacinas de DNA é onerosa, com resultados


incertos e pequenas perspectivas de lucros, pois os progra-
mas de vacinação geralmente são gerenciados pelos gover-
nos. Além disso, ao contrário do que acontece com as drogas
farmacêuticas, nas quais doses diárias são administradas ao
paciente, às vezes, durante a vida toda, o processo de vacina-
ção requer uma única injeção, ou algumas poucas repetições
da dose, para a proteção completa do indivíduo, diminuindo o
consumo. Essas dificuldades inibem as grandes indústrias far-
macêuticas a se envolverem na produção e comercialização
de novas vacinas.

A Tecnologia do DNA Recombinante no desenvolvimento


de vacinas pode levar o vírus a readquirir a forma virulenta;
provocando a doença ao invés de prevenir. Um trabalho de
1994 revelou que a vacina atenuada preparada com a versão
do vírus HIV para macacos, embora segura e eficiente para
116
Biologia Molecular

macacos adultos, foi capaz de provocar a AIDS em macacos


recém-nascidos; ressaltando o cuidado antes do lançamento
de uma vacina no mercado.

5.3.3 Produção de Organismos Transgênicos

Um possível risco para a saúde humana pode ser analisa-


do sob o ponto de vista do desencadeamento de processos
alérgicos. Por exemplo, podemos criar um feijão transgênico
que tenha o gene da castanha-do-Brasil responsável por um
alto teor protéico. Este feijão, quando ingerido por humanos,
pode desencadear uma reação alérgica em indivíduos que
apresentem sensibilidade à castanha do Pará. Entretanto, é
possível detectar características indesejáveis no transgene
antes de disponibilizar ao mercado consumidor e neste caso
a alternativa seria encontrar outras fontes de metionina ou
separar a parte alérgica do aminoácido presente na casta-
nha. Dessa forma, ressalta-se a necessidade da realização
de testes de avaliação de segurança alimentar dos produtos
derivados de plantas transgênicas e que devem ser obrigató-
rios antes de sua comercialização.

Podem ocorrer também possíveis riscos para os ecossis-


temas. Um exemplo é o da soja transgênica, que possui em
seu genoma um gene de bactéria para torná-la resistente a
herbicidas. Nesse caso, os herbicidas só exterminariam as
ervas daninhas, que são alimentos de pássaros e estes mor-
reriam de fome (o que já está ocorrendo). Além disso, há a
possibilidade ainda que remota, em razão das barreiras pré
e pós-fertilização que dificultam o cruzamento entre as espé-
cies cultivadas e selvagens, como a presença de cleistoga-
mia nestas espécies, de haver a troca de genes com a soja
selvagem (não transgênica) plantada próxima à transgênica,
acarretando em um dano irreversível ao meio ambiente.

117
Biologia Molecular

5.4 GUIA DE ESTUDO

1 - Um paciente deseja ingerir o chá de uma planta medi-


cinal transgênica. Você indicaria o uso de uma planta transgê-
nica? Justifique sua resposta com pelo menos três argumen-
tos.

2 - Defina o termo “organismo transgênico”.

3 - A síntese de insulina por bactérias é:

a) impossível, pois o RNAm correspondente à insulina não


seria transcrito.

b) impossível, pois as bactérias não apresentam enzimas


capazes de promover as ligações peptídicas encontradas na
insulina.

c) impossível, pois o DNA bacteriano seria destruído pelo


DNA humano e as células perderiam a atividade.

d) possível, pois se excetuando a referida sequência de


DNA, as bactérias apresentam os componentes necessários
à síntese de proteínas.

e) possível, se além do referido gene forem introduzidos


ribossomos, responsáveis pela síntese protéica.

118
Biologia Molecular

4 - Cite quatro aplicações da Tecnologia do DNA Recom-


binante.

5 – Defina DNA recombinante.

6 – Cite três benefícios e dois possíveis riscos na utiliza-


ção de organismos transgênicos.

7 - O emprego de moléculas recombinantes nos processos


biotecnológicos pode levar à produção industrial de moléculas
de interesse humano, como a insulina ou o hormônio de cres-
cimento? Sim ou não? (JUSTIFIQUE)

119
Biologia Molecular

120
Biologia Molecular

MARCADORES ISOENZIMÁTICOS

Gleice Ribeiro Orasmo


Bióloga, Dra., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: gleice@ufpi.edu.br

Marcelo Dib Bechara


Biólogo, Dr., Universidade de Marília,
Faculdade de Medicina.
e-mail: dib.marcelo1@gmail.com

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

121
Biologia Molecular

122
Biologia Molecular

MARCADORES ISOENZIMÁTICOS

Gleice Ribeiro Orasmo


Marcelo Dib Bechara
Sérgio Emílio dos Santos Valente

123
Biologia Molecular

124
Biologia Molecular

Sumário

Capítulo 6. MARCADORES ISOENZIMÁTICOS

6.1 INTRODUÇÃO AOS MARCADORES


MOLECULARES...........................................................127
6.2 ELETROFORESE..........................................................127
6.2.1 Eletroforese de Proteínas...........................................130
6.3 ISOENZIMAS.................................................................132
6.4 CONSIDERAÇÕES FINAIS...........................................139

125
Biologia Molecular

126
Biologia Molecular

6.1 INTRODUÇÃO AOS MARCADORES MOLECULARES

A caracterização da variabilidade genética pode ser rea-


lizada utilizando-se caracteres morfológicos e moleculares. A
morfológica é essencial, pois permite avaliar o material dispo-
nível para que seja utilizado em programas de melhoramento
genético. Entretanto, apresenta a desvantagem de sofrer uma
grande influência do meio ambiente, o que pode acarretar em
procedimentos errôneos na organização, caracterização, con-
servação e uso de recursos genéticos nos programas de me-
lhoramento.

Já os marcadores moleculares possuem a vantagem de


sofrerem pouca ou nenhuma influência ambiental já que impli-
cam em uma caracterização protéica, enzimática ou de DNA.
Além disso, as técnicas de marcadores baseadas no DNA per-
mitem a análise de um número ilimitado de loci, que em geral
são mais polimórficos quando comparados aos outros tipos de
marcadores.

Entre os marcadores moleculares mais utilizados estão:


isoenzimas, RFLP (Restriction Fragment Length Polymorphism
- Polimorfismo no Comprimento de Fragmentos de Restrição),
RAPD (Random Amplified Polymorphic DNA – Polimorfismo
de DNA Amplificado ao Acaso), AFLP (Amplified Fragment
Length Polymorphism – Polimorfismo de Comprimento de
Fragmentos Amplificados) e microssatélites. Os marcadores,
de um modo geral, têm sido desenvolvidos, visando possibili-
tar a análise de um maior número de loci polimórficos, aumen-
tando, assim, o poder da análise genética em questão.

6.2 ELETROFORESE

A técnica de eletroforese foi desenvolvida na década de


1950 e se baseia na movimentação de moléculas (proteínas,
127
Biologia Molecular

isoenzimas ou ácidos nucléicos) através de uma matriz tam-


ponada (agarose, amido, penetrose, poliacrilamida etc.) que é
solidificada na forma de gel, no qual se formam orifícios onde
são colocadas as amostras das moléculas que se quer anali-
sar e, posteriormente, o gel é submetido a um campo elétrico.
Esta matriz (ou gel) funciona como um filtro, cuja porosidade é
inversamente proporcional à concentração do gel, separando
as moléculas de acordo com o tamanho e carga elétrica (Figu-
ras 7, 8 e 9).

Figura 7 - Isoenzimas esterases de uva (Vitis vinífera L.) em


gel de poliacrilamida (sistema PAGE) (Orasmo, 2006).
128
Biologia Molecular

Figura 8 - Padrão isoenzimático, em gel de amido, por meio do


sistema das isocitrato desidrogenases, ilustrando um locus mo-
nomórfico. Um locus é considerado monomórfico quando a fre-
quência do alelo mais comum exceder 99% (VALENTE, 1995).

Figura 9 - Padrões isoenzimáticos, em gel de amido, por


meio do sistema das esterases, ilustrando um locus mono-
mórfico (Est1) e um locus monomérico polimórfico (Est2) com
quatro alelos, sendo um deles um alelo nulo (alelo incapaz de
gerar um fenótipo). Um locus é considerado polimórfico quan-
do a frequência do alelo mais comum for igual ou inferior a
99% (VALENTE, 1995).
129
Biologia Molecular

Durante a eletroforese, as moléculas (proteínas, isoenzi-


mas ou ácidos nucléicos) se posicionam em paralelo ao cam-
po elétrico; a dificuldade de transpor a matriz (gel) em direção
ao pólo positivo é inversamente proporcional ao tamanho de
cada molécula. As moléculas menores migram mais rapida-
mente possibilitando a separação por tamanho ou peso mo-
lecular. Assim, quanto maior a molécula, maior o tempo de
migração; possibilitando a separação dos fragmentos. Além
disso, a mobilidade das proteínas no gel depende, também da
conformação da molécula e de sua carga elétrica, entre outras
variáveis.

6.2.1 Eletroforese de Proteínas

Em decorrência das populações humanas diferirem em rela-


ção às frequências gênicas relativas ao sistema sanguíneo ABO,
o locus ABO foi o sistema de grupo sanguíneo pioneiro em estu-
dos de variação genética entre indivíduos. Por exemplo, o antíge-
no A é frequente em populações do Oeste europeu, já o antígeno
B é comum entre os asiáticos e, entre índios do continente sul-
-americano, o sangue do tipo O apresenta uma frequência extre-
mamente alta. Como ocorre no sistema ABO, o sistema Rh apre-
senta variação entre as populações humanas, sendo bastante útil
em estudos de genética populacional humana.

Análises do polimorfismo protéico foram amplamente uti-


lizadas nas décadas de 1950 e 1960, acarretando em um au-
mento considerável no número de sistemas polimórficos de-
tectáveis. A eletroforese de proteínas se baseia no fato de que
uma única diferença de aminoácidos em uma proteína pode
acarretar em uma leve diferença na carga elétrica de uma pro-
teína, modificando o padrão eletroforético observado.

Um exemplo clássico na genética humana é a mutação


da anemia falciforme. Os indivíduos normais são homozigotos
130
Biologia Molecular

(HbA / HbA), os afetados apresentam o genótipo homozigoto


HbS / HbS, já os indivíduos heterozigotos (HbA / HbS) geral-
mente não manifestam os sintomas da doença e são denomi-
nados portadores do traço falcêmico. Esta doença é ocasio-
nada por uma alteração na forma normalmente arredondada
das hemácias, que passam a apresentar uma forma de foice,
particularmente sob condições de baixa tensão de oxigênio.
A anemia falciforme possui uma grande incidência nas popu-
lações africanas negras, explicada pelo fato dos indivíduos
que possuem o gene HbS serem resistentes à malária. Em
portadores do traço falcêmico haveria uma vantagem por eles
apresentarem resistência à malária, e, geralmente não mani-
festarem os sintomas da anemia falciforme. Em regiões onde
a malária é endêmica, na África, por exemplo, essa vantagem
do heterozigoto seria benéfica.

O pesquisador Vernon Ingram observou, em 1957, que a


única diferença entre a hemoglobina mutante dos afetados e
a hemoglobina normal é a presença do aminoácido valina no
lugar do ácido glutâmico, no sexto aminoácido da cadeia beta
da hemoglobina humana. Essa substituição produz uma dife-
rença na carga elétrica porque o ácido glutâmico possui dois
grupos carboxila, enquanto a valina só tem uma carboxila;
dessa forma, a eletroforese pode ser usada para determinar
se uma pessoa tem a hemoglobina normal (HbA) ou a muta-
ção que causa anemia falciforme (HbS).

No processo eletroforético a hemoglobina é colocada em


um gel de amido ou poliacrilamida, que é submetido a uma
corrente elétrica. A ligeira diferença de carga resultante da di-
ferença de aminoácido causará a migração das formas HbA
e HbS com velocidades diferentes pelo gel. Após deixar que
as proteínas migrem pelo gel durante várias horas, elas po-
dem ser coradas com soluções químicas de modo que suas
posições possam ser observadas e determinar se a pes-
131
Biologia Molecular

soa é homozigota HbA, homozigota HbS, ou um heterozigoto


com HbA/HbS. Uma vantagem da eletroforese de proteínas
é que ela permite a detecção de heterozigotos possibilitando,
por exemplo, o cálculo do risco de um casal vir a ter um filho
portador de uma doença genética.

A separação eletroforética de proteínas apresenta a des-


vantagem de não ser capaz de detectar mutações silenciosas,
aquelas que alteram a base nitrogenada, mas que não alteram
os aminoácidos das cadeias polipeptídicas, em decorrência
do código genético ser degenerado. Outra desvantagem resi-
de no fato de que algumas substituições de aminoácidos não
alteram a carga elétrica da molécula protéica, impossibilitando
a detecção dessas mutações. Além disso, a eletroforese de
proteínas utiliza-se apenas do produto primário dos genes. De-
pendendo do organismo, estaríamos analisando apenas uma
pequena parte do genoma; no genoma humano, por exemplo,
os genes representam apenas cerca de 3% do DNA total.

6.3 ISOENZIMAS

Isoenzimas são diferentes formas moleculares da mesma


enzima que degradam o mesmo substrato, já que há mais de
um gene codificando cada uma dessas enzimas. Como as iso-
enzimas são proteínas, também utilizamos a técnica da ele-
troforese citada anteriormente para visualizarmos o padrão
isoenzimático. A separação eletroforética é possível, pois as
isoenzimas apresentam a mesma atividade catalítica, entre-
tanto, possuem diferenças na sequência de aminoácidos que
as formam, resultando, na maioria dos casos, em migrações
diferenciais quando submetidas a um campo elétrico. Dessa
forma, se dois indivíduos apresentam padrões de bandas di-
ferentes, podemos presumir que estas diferenças refletem o
DNA de cada um, sendo, portanto, transmitidas às gerações
futuras segundo as Leis de Mendel.
132
Biologia Molecular

Para que os padrões isoenzimáticos sejam analisados é ne-


cessária a extração de proteínas do tecido vegetal, o qual pode
ser de semente, raiz, caule ou folhas jovens. A separação des-
tas proteínas, através de eletroforese e a coloração histoquími-
ca, possibilita a visualização do produto da reação enzimática
na forma de uma “banda” no gel. O padrão de bandas isoen-
zimáticas observado (zimograma) resulta da catalisação de
uma reação química pela isoenzima presente naquela posição
do gel, permitindo a visualização de uma banda eletroforética.
Desta forma, genótipos de indivíduos de uma população podem
ser identificados no locus isoenzimático em questão.

O padrão de bandeamento das isoenzimas pode ser in-


terpretado em termos de alelos e loci que codificam para os
polipeptídios. As bandas correspondentes às isoenzimas po-
dem ser produtos de diferentes loci, ou de diferentes alelos de
um mesmo locus ou, ainda, produto de processamentos dife-
renciais na molécula de RNAm ou pós-traducional, no próprio
polipeptídio. Além disso, o padrão isoenzimático pode variar
em função de muitos fatores, entre eles, o tipo de tecido, o
estágio fenológico, a espécie, a variedade e/ou a cultivar, em
se tratando de plantas, entre outros fatores.

Os dados eletroforéticos podem ser apresentados de di-


versas formas. Métodos estatísticos têm sido desenvolvidos
para a genética de populações, taxonomia numérica e classifi-
cações cladísticas. Cada banda sobre o gel assume um valor
baseado na migração da banda de origem (valor Rf) ou na
posição relativa da banda com o alelo mais comum (Micales
et al., 1986). Em comparações mais complexas, quando a in-
terpretação se dá em termos de loci e frequência de alelos, os
dados podem ser expressos em termos de similaridade ge-
nética ou distância genética. Diferentes fórmulas podem ser
usadas para calcular distância e similaridade genética.

133
Biologia Molecular

Apesar da técnica de isoenzimas ser relativamente ba-


rata e simples, os marcadores isoenzimáticos apresentam a
desvantagem de não serem um produto direto do genoma,
como os marcadores de DNA, pois, como foi mencionado, po-
dem exibir diferenças nas sequências de aminoácidos devido
a modificações pós-traducionais e por isso não necessaria-
mente representam sequências de DNA, as quais sofreram
alterações nas bases nitrogeneadas. Além disso, apesar de
sofrerem pouca influência ambiental, pode-se observar um
polimorfismo isoenzimático em resposta a condições do meio
ambiente.

Já que as enzimas são termossensíveis, uma etapa ex-


tremamente importante é a da extração, pois deve-se extrair
enzimas com a sua atividade catalítica preservada além de
impedir a oxidação de compostos fenólicos associados. Para
cada espécie faz-se necessário a otimização do protocolo, le-
vando em consideração: o tipo de tecido e o tampão de extra-
ção utilizado, tendo em vista que a quantidade e os tipos de
complexadores de fenóis podem interferir na extração, além
disso, é necessário manter as amostras resfriadas durante
todo o processo para não degradar as proteínas.

É necessária também a otimização das condições de ele-


troforese, em relação a: tipo de gel utilizado (amido ou poliacri-
lamida), a concentração do gel, o tempo da corrida eletroforé-
tica, o tipo de tampão e o pH do mesmo, entre outros detalhes
mais específicos.

Apesar do gel de poliacrilamida apresentar uma resolução


melhor, a eletroforese em gel de amido permite cortar o gel
longitudinalmente em até seis fatias, permitindo análise de vá-
rios loci isoenzimáticos de forma rápida e simultaneamente, já
que vários sistemas isoenzimáticos podem ser revelados em
uma única corrida eletroforética. Atualmente, mesmo existin-
134
Biologia Molecular

do vários marcadores de DNA, as isoenzimas continuam sen-


do úteis para análises genéticas que não necessitem de uma
amostragem ampla do genoma.

Por conseguirem detectar apenas um baixo número de


alelos em poucos locus que podem ser identificados, as isoen-
zimas não são eficientes em estudos que requerem uma am-
pla investigação do genoma, como no caso do mapeamento
genético já que o nível de polimorfismo enzimático possui um
limite, uma vez que estas enzimas possuem função metabó-
lica. Em resumo, o número de locus analisados é limitado e o
nível de polimorfismo é baixo quando se compara as isoenzi-
mas aos marcadores de DNA.

Além disso, um número limitado de sistemas isoenzimá-


ticos é geralmente visualizado em cada espécie. Com uma
cobertura apenas parcial do genoma, as chances de se en-
contrar associações significativas entre isoenzimas e genes
que controlam caracteres de interesse agronômico, geralmen-
te caracteres quantitativos, ficam muito próximo de zero.

Os alelos isoenzimáticos são codominantes, isto é, em um


indivíduo diplóide, os genótipos heterozigotos e homozigotos
de um determinado locus são facilmente identificados. O fato
de serem marcadores co-dominantes possibilita estimar as
frequências gênicas e genotípicas e, a partir destes, coeficien-
tes de diversidade gênica e heterozigosidade.

O bandeamento por isoenzimas, obtido no gel, pode ser


interpretado sob diferentes aspectos, dependendo do objetivo
do estudo; por exemplo, se o interesse for distinguir indivíduos
ou clones entre si, o zimograma é suficientemente informati-
vo, mas se o objetivo for examinar os processos evolutivos de
uma população, os marcadores são necessariamente os loci
e seus respectivos alelos.
135
Biologia Molecular

Além disso, para interpretar os padrões de bandas resultan-


tes, é importante, se possível, ter um conhecimento prévio sobre
o número de subunidades da enzima. Entretanto, se não houver
este conhecimento prévio, é ainda possível deduzir a estrutura
da proteína através do bandeamento revelado. Por exemplo, en-
zimas monoméricas, formadas por um único polipeptídeo, apre-
sentam uma banda no gel, correspondendo ao homozigoto, ou
duas bandas, correspondendo ao heterozigoto; enquanto que in-
divíduos heterozigotos para uma enzima dimérica, formadas por
dois polipeptídeos, além das duas bandas correspondentes aos
dois polipeptídeos, apresentam uma terceira banda intermediária,
produto da conjugação dos dois polipeptídeos. Da mesma forma,
indivíduos heterozigotos para uma enzima tetramérica apresen-
tam cinco bandas intermediárias (Figura 10).

Figura 10 - Ilustração esquemática das relações entre os fenótipos eletro-


fonéticos, o estado alélico (homozigose ou hoterozígose) e o número de
subunidades enzimátias. Modificado de WENDEL & WEEDEN (1989).
136
Biologia Molecular

O controle genético das isoenzimas ocorre através de


vários genes que podem ser alelos de um mesmo locus
ou não, acarretando, na migração, a formação de bandas
de cada locus em zonas diferentes (isoenzimas codificadas
por genes de um mesmo locus podem ser denominadas de
aloenzimas). Apesar do controle genético para a maioria
das isoenzimas ser conhecido, o que facilita a análise dos
zimogramas, se as subunidades de uma enzima forem co-
dificadas por loci genéticos distintos, a análise do padrão
de bandas isoenzimáticas fica mais complexa. Podemos
ter, por exemplo, isoenzimas com mobilidades eletroforé-
ticas idênticas representando os produtos de dois loci dis-
tintos do mesmo sistema enzimático. Se observarmos uma
variação alélica nestes loci, pode ser impossível determi-
nar quais alelos pertencem a cada locus.

Alelos nulos podem também causar dificuldades na in-


terpretação dos zimogramas, os quais podem representar
enzimas defeituosas, ou instáveis em relação aos proce-
dimentos utilizados na eletroforese, a figura 11 mostra a
ocorrência de alelo nulo em folhas da uva Rubi (Vitis viní-
fera L.). Também loci duplicados podem estar presentes
nos diferentes genomas de uma espécie poliplóide, que
codificam enzimas com a mesma mobilidade eletroforéti-
ca, resultando na sobreposição de bandas no zimograma,
nestes casos, a análise genética só é possível quando o
polimorfismo se restringe a um só genoma.

137
Biologia Molecular

Figura 11 - Alelo nulo em folhas da cultivar Rubi de Vitis vini-


fera L. (amostras 5 e 6) (Orasmo, 2006).
138
Biologia Molecular

6.4 CONSIDERAÇÕES FINAIS

Os marcadores isoenzimáticos têm sido utilizados com su-


cesso na identificação e caracterização da variabilidade gené-
tica de cultivares, populações naturais e acessos de bancos
de germoplasma em diferentes espécies de plantas. Entretan-
to, seu uso é mais limitado para categorias taxonômicas mais
altas e inferências sobre filogenias. Para tais fins, marcadores
de DNA são os mais recomendados.

As isoenzimas permitem a análise rápida de um grande


número de amostras a um custo relativamente baixo. Assim,
conclui-se que a técnica de isoenzimas é mais indicada para
estudos de processos de micro evolução como análise de sis-
temas de cruzamento, migração, estrutura de populações e
hibridação.

Mesmo com o surgimento dos marcadores de DNA, as iso-


enzimas continuam apresentando importância em estudos de
variabilidade genética dentro e entre populações naturais e
em menor escala em análises filogenéticas. Nos programas
de melhoramento genético vegetal, as isoenzimas têm sido
mais utilizadas na avaliação de bancos de germoplasma, os
quais são menos afetados pelas variações ambientais, sendo,
portanto, muito úteis em tais programas.

139
Biologia Molecular

140
Biologia Molecular

EXTRAÇÃO DE DNA

Camila Campêlo de Sousa


Bióloga, mestranda em Genética e Melhoramento
Universidade Federal do Piauí.
e-mail: camilacampelobr@hotmail.com

Fábio Barros Britto


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: fbbritto@ufpi.edu.br

João Paulo Gomes Viana


Biólogo, mestrando em Genética e Melhoramento
Universidade Federal do Piauí.
e-mail: jpgv2004@hotmail.com

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

141
Biologia Molecular

142
Biologia Molecular

EXTRAÇÃO DE DNA

Camila Campêlo de Sousa


Fábio Barros Britto
João Paulo Gomes Viana
Sérgio Emílio dos Santos Valente

143
Biologia Molecular

144
Biologia Molecular

Sumário

Capítulo 7. EXTRAÇÃO DE DNA



7.1 INTRODUÇÃO...............................................................147
7.2 MÉTODOS DE EXTRAÇÃO DE DNA............................148
7.2.1 Extração de DNA vegetal...........................................152
7.2.2 Extração de DNA animal............................................155
7.2.3 Extração de DNA de bactérias e fungos.....................160
7.3 OTIMIZAÇÃO.................................................................161
7.4 MÉTODOS COMERCIAIS DE EXTRAÇÃO...................162
7.5 QUANTIFICAÇÃO..........................................................163
7.6 GUIA DE ESTUDO.........................................................166

145
Biologia Molecular

146
Biologia Molecular

7.1 INTRODUÇÃO

A extração de um DNA íntegro e livre de restos celu-


lares e metabólitos é o primeiro passo para que possam
ser desenvolvidos vários estudos que utilizem técnicas
de Biologia Molecular para estimar a divergência gené-
tica entre populações; efetuar o diagnóstico precoce de
diversas doenças; analisar a estrutura e organização de
genomas; na realização de testes de paternidade e até
mesmo na criação de organismos geneticamente modi-
ficados.

Pode-se extrair DNA de diferentes organismos: bac-


térias, protozoários, fungos, tecidos vegetais e animais.
Preferencialmente a extração deve ser realizada a partir
de tecidos frescos, contudo pode-se obter DNA a partir
de tecidos fósseis, herbarizados ou que foram subme-
tidos a um desastre de grandes proporções, como por
exemplo tecidos de pessoas que morreram em um aci-
dente aéreo.

Na literatura, são descritos inúmeros métodos de


extração de DNA para diferentes organismos e tecidos.
Essa diversidade de protocolos existe para se adequar
às diferentes composições bioquímicas das espécies
existentes.

Dependendo do protocolo escolhido e da espécie en-


volvida na pesquisa, podem surgir alguns problemas no
momento do procedimento, em virtude das particulari-
dades de cada espécie, havendo a necessidade de se
adaptar os protocolos básicos para que se consiga DNA
de maneira prática e rápida e em quantidade e qualida-
de suficientes para que possa ser utilizado em estudos
moleculares posteriores.
147
Biologia Molecular

7.2 MÉTODOS DE EXTRAÇÃO DE DNA

O primeiro passo para se fazer uma extração de DNA


é a coleta do material, que deve seguir normas específicas
para cada tipo de amostra. Posteriormente, deve-se arma-
zenar o tecido coletado em ambiente refrigerado (-20ºC a
-80ºC), até o início do procedimento.

Devemos ter em mente que o DNA fica confinado no


interior das células, em meio a diversas organelas mem-
branosas e proteínas diversas relacionadas com o metabo-
lismo celular. Assim, a extração de DNA pode ser dividida
em dois processos básicos: lise das membranas celulares
e purificação do DNA, onde o DNA é separado dos restos
celulares e das proteínas, sendo precipitado e suspenso
em volumes de água ultra pura ou em soluções tampão
(Figura 12).

148
Biologia Molecular

FIGURA 12 - Principais etapas do processo de extração


de DNA.
149
Biologia Molecular

No caso das espécies vegetais e alguns tipos de fungos


há a necessidade da lise da parede celular; dessa forma, as
amostras de tecidos podem ser cortadas em pequenas porções
e colocadas em contato com nitrogênio líquido cuja função é
o congelamento do tecido; facilitando assim, a maceração do
material. Além disto, pode-se utilizar moedores elétricos con-
juntamente com o auxílio de esferas de vidro, cerâmica ou
metal, que aceleram o processo da maceração.

Após maceradas, as amostras devem ser colocadas em


tubos de polipropileno esterilizados, para diminuir os riscos de
contaminação. Como o DNA tem grande afinidade pelo vidro,
não se deve utilizá-lo, a fim de evitar que o DNA seja adsorvi-
do na presença de alguns sais.

Para digestão do material, adiciona-se uma solução tam-


pão que contém detergentes responsáveis pela lise das mem-
branas plasmáticas. Isso ocorre devido à composição lipídica
das membranas, que rompem e solubilizam-se na presença
de detergentes. Os detergentes mais utilizados são o brometo
de cetiltrimetilamônio (CTAB); dodecil sulfato de sódio (SDS);
sarcosil e o isotianato de guanidina. O CTAB é o mais utilizado
nos protocolos por apresentar melhor potencial de solubiliza-
ção em comparação com o SDS, além de não exigir a prepara-
ção prévia do tecido e ser adaptável a vários tipos de tecidos e
a diferentes quantidades de material. O sarcosil e o isotianato
de guanidina apresentam a vantagem de romperem tanto as
paredes celulares quanto as membranas plasmáticas.

Juntamente com os detergentes, as soluções tampão con-


têm cloreto de sódio (Na+Cl-). Os íons de sódio contribuem
com a carga positiva que neutraliza a carga negativa do DNA,
ligando-se ao grupo fosfato da molécula. Por outro lado, os
íons de cloro contribuem com a carga negativa, estabilizando
a molécula de DNA durante o processo de separação das pro-
150
Biologia Molecular

teínas histônicas, pois à medida que o DNA se associa com


os íons de sódio, as extremidades das proteínas histônicas,
portadoras de carga positiva, se associam aos íons de cloro,
mantendo o equilíbrio eletrolítico da solução.

Também se adiciona ao tampão, ácido etinolenodiamino


tetra-acético (EDTA), um composto quelante de cátions biva-
lentes, tais como o Mg2+ e Ca2+. Esse ácido forma um com-
plexo com esses íons inibindo, assim, a ação de DNases que
usam tais moléculas como co-fatores.

Além disso, utiliza-se um tampão específico, como por


exemplo, o Tris-HCl, para que a solução de extração apre-
sente um pH constante em torno de 8,0 ou 9,0 para impedir
a ação de nucleases endógenas que degradam o DNA e que
atuam em um pH ótimo de aproximadamente 7,0.

Após a adição do tampão, a amostra é colocada em


banho-maria a uma temperatura acima de 50ºC, uma vez
que temperaturas elevadas facilitam a solubilização e a
homogeneização da suspensão, além de contribuir para o
processo de desnaturação das proteínas e consequente-
mente inibir a ação das DNAses. O tempo de incubação
varia normalmente de 15 minutos a 16 horas ou até que a
amostra apresente um aspecto viscoso. Em seguida, a so-
lução é centrifugada para promover a separação da parte
aquosa (que contém o material genético) da parte sólida
(composta por restos celulares).

Descartada a parte sólida, inicia-se o processo de purifica-


ção da parte líquida. O método mais utilizado para purificação
do DNA é a extração com fenol tamponado, que provoca a
desproteinização, a qual ocorre em virtude da desnaturação
protéica, ou seja, a perda da estrutura tridimensional; desta
forma os aminoácidos insolúveis apresentam afinidade pelos
151
Biologia Molecular

solventes orgânicos. Outros reagentes também utilizados na


purificação do material e suas respectivas funções estão rela-
cionados na Tabela 5.

Tabela 5 - Funções dos reagentes utilizados na purificação do DNA

O processo de purificação objetiva evitar a degradação do


DNA pelas DNases e eliminar os polissacarídeos e compos-
tos secundários que podem contaminar a amostra, fornecen-
do um DNA de excelente qualidade e em grande quantidade
para que possa ser utilizado em estudos moleculares com a
espécie desejada.

7.2.1 Extração de DNA vegetal

O processo de extração de DNA vegetal consiste inicial-


mente da coleta de material e posterior rompimento da parede
celular e membranas para que ocorra a liberação dos consti-
tuintes das células.

Na coleta de tecido vegetal, deve-se utilizar luvas cuja


função é evitar a ação das nucleases presentes nos fluidos
152
Biologia Molecular

corporais das mãos, que podem degradar o DNA. Deve-se co-


letar, sempre que possível, tecido novo na fase ativa de cresci-
mento, pois tecidos maduros de muitas espécies contêm com-
postos fenólicos envolvidos na defesa contra herbivoria que
podem interferir nos procedimentos de extração de DNA, uma
vez que os polissacarídeos presentes na parede celular ade-
rem irreversivelmente ao DNA. Entretanto, quando se trabalha
com espécies arbóreas em populações naturais, nem sempre
se tem acesso a tecidos jovens, havendo a necessidade de se
padronizar um protocolo específico para essas espécies.

A extração deve ser realizada sempre com material fresco,


porém, quando for necessário o seu armazenamento, pode-se
optar pela liofilização, onde as folhas passam por uma desi-
dratação a baixa temperatura, possibilitando a sua conserva-
ção por tempo indeterminado onde apenas no momento da
extração; as plantas são descongeladas, lavadas com água
destilada e enxugadas ou esterilizadas.

Para que ocorra o rompimento das paredes celulares, o teci-


do foliar deve ser cortado, congelado por meio do nitrogênio líqui-
do e pulverizado manualmente (utilizando um bastão de vidro ou
pistilo, no caso de amostras maiores) ou mecanicamente (através
de equipamentos próprios, tais como o moinho elétrico).

Em seguida, procede-se com a ruptura das membranas


fazendo uso de detergentes. A escolha do detergente varia de
acordo com o protocolo; por exemplo, Dellaporta et al. (1983)
usaram o SDS como detergente, enquanto Doyle e Doyle
(1987) utilizaram o CTAB e Cheung et al. (1993) efetuaram
extrações com o sarcosil.

Após a lise das membranas celulares, realiza-se a purifica-


ção do material genético que, independente do protocolo, se-
gue os seguintes passos: a) extração com solvente orgânico;
153
Biologia Molecular

b) adição de um álcool e c) ressuspensão do precipitado.

Na extração com solvente orgânico como, por exemplo,


o clorofórmio-álcool isoamílico visa-se separar a fase orgâni-
ca (composta de lipídios, proteínas e polissacarídeos) da fase
aquosa (que contém DNA e RNA). Nessa etapa, ocorre a des-
naturação protéica; tornando as proteínas insolúveis à fase
aquosa. Alguns protocolos ainda incorporam proteases (pro-
teinase K, por exemplo) para facilitar a separação do DNA das
proteínas da cromatina.

Posteriormente a amostra é centrifugada e transferida para


novos microtubos, onde se adiciona um álcool (isopropanol e/
ou etanol) para precipitar o DNA, já que o DNA na presença
de sal e álcool forma um precipitado visível denominado pellet
que pode ser “pescado” ou sedimentado por ultra centrifuga-
ção. A precipitação com etanol absoluto, além de concentrar o
DNA, ajuda a remover resíduos de fenol e clorofórmio presen-
tes na amostra.

Para finalizar a extração, o precipitado DNA-RNA deve


ser ressuspendido em RNase, que degrada o RNA, e em
Tris-EDTA (TE) que acondiciona o DNA para armazenamen-
to. Quando se deseja obter um DNA com alta pureza, alguns
autores ainda recomendam uma purificação por centrifugação
em gradiente de densidade de cloreto de césio, que apesar de
laboriosa, remove quantidades significativas de contaminan-
tes da amostra. Soluções com alta concentração de cloreto
de césio (5M) formam um gradiente de densidade sob alta
centrifugação, e o sal de césio de DNA possui uma densidade
intermediária entre os extremos de concentração desse gra-
diente. É possível a separação de RNA do DNA, assim como
tipos de DNA com densidade diferente devido à composição
de bases.

154
Biologia Molecular

Uma alternativa para purificação é a precipitação com ace-


tato de amônio, que é rápida porém menos eficiente que a
anterior. Neste procedimento, são realizadas sucessivas cen-
trifugações intercaladas por lavagens em etanol absoluto e
dissolução em TE.

Existem várias metodologias disponíveis para o isolamento


de DNA genômico vegetal; mas na prática, esses procedimen-
tos são empíricos em função da variabilidade existente entre
as espécies. Os métodos convencionais simples de extração
de DNA não são reprodutíveis para todas as plantas, sendo
necessárias adaptações e modificações.

7.2.2 Extração de DNA animal



Muitos dos experimentos em Biologia Molecular envolven-
do extração de DNA de tecidos animais exigem um DNA não
degradado e de alto peso molecular, que pode ser obtido atra-
vés de eficientes métodos de extração.

Em relação aos métodos de extração de DNA de tecidos


vegetais, a extração de DNA animal não encontra tantas bar-
reiras para obtenção de material que atenda as necessidades
das pesquisas. Isso se deve à constituição da célula animal,
além da ausência de parede celular.

No entanto, em razão da diversidade biológica dos animais


surge a necessidade de adaptações nos métodos para que a
extração ocorra atendendo aos requisitos de concentração e
qualidade do material genético. Além disso, muitas vezes é
necessário se extrair DNA de tecidos em material parafinado,
ossos antigos, tecidos congelados, mumificados ou fossiliza-
dos, o que também requer etapas auxiliares que aperfeiçoam
o método padrão para extração de DNA de tecidos animais.

155
Biologia Molecular

As técnicas de otimização de extração de DNA para utili-


zação na reação em cadeia pela polimerase (PCR) permitem
a investigação diagnóstica em diferentes amostras biológicas,
mesmo quando o DNA está presente em pequenas quantidades.
Resquícios de saliva, esfregaço bucal, sangue, bulbos capilares,
tecidos incluídos em parafina, ossos, gotas de esperma, entre ou-
tros, podem fornecer informações importantes. Tais técnicas va-
riam por serem mais ou menos invasivas, sendo os métodos não
invasivos atrativos por serem menos onerosos e mais rápidos,
além de proporcionar uma coleta simples.

Segundo Miller et al. (1988), uma maneira rápida e eficaz


para extração de DNA de sangue de tecido periférico, é des-
crita de acordo com as seguintes etapas:

1) As células obtidas de sangue periférico devem ser sus-


pendidas em solução de lise, na concentração de 10 mM de
Tris-HCl, 400 mM de NaCl e 2 mM de Na2EDTA (pH 8.2);

2) Em seguida, o conteúdo celular é extraído adicionando-


se solução a 10% de SDS e solução de proteinase K, deixan-
do-se digerir por 12 horas;

3) Logo após, acrescenta-se cerca de 6M de solução de


NaCl saturada, agitando-se por cerca de 15 minutos para ho-
mogeneizar as amostras;

4) Enfim, o sobrenadante deve ser transferido para um


novo tubo, onde será precipitado ao se triplicar o volume com
etanol absoluto em temperatura ambiente.

Com a aplicação deste método, é possível evitar o uso de


soluções desnaturantes como a de Clorofórmio:Álcool Isoamí-
lico, bem como a solução de Fenol:Clorofórmio. Além disso,
a partir deste primeiro contato com a extração de DNA animal,
156
Biologia Molecular

é possível notar que o mesmo dispensa o uso de muitos rea-


gentes utilizados na extração de DNA vegetal.

Ao se extrair DNA em mamíferos, pode-se utilizar amos-


tras de pêlo do animal, sendo necessárias etapas especiais
para isolar o material genético. Segundo Lacorte et al. (2004),
alguns procedimentos podem ser adotados antes de se extrair
DNA de bulbos capilares:

• Fervura da amostra por 8 minutos em água bidestilada,


deionizada, estéril.

• Extração em TTE (1mM Tris pH 8,0; Triton X-100 1%;


0,5 M EDTA pH 8,0) que consiste em colocar os bulbos em
50μL de solução de TTE seguido de fervura por 10 minutos,
centrifugação e troca de tubo.

• Extração com 0,2 M NaOH, 0,04 M Tris pH 7,5; adição


de 5μL de NaOH, agitação leve, segunda do tamponamento
com 45 μL de Tris pH 7,5.

• Adição de 50 μL de Chelex 100 a 5% seguido de fervura


por 8 minutos; sendo as amostras centrifugadas antes do uso.

• Digestão com proteinase K (20 mg/ml) seguida de


extração com Chelex-100 5% e adição de 50 μL de Chelex
100, 1 μL de proteinase K, seguido de incubação a 56 °C por
aproximadamente 16 horas. Fervura por 8 minutos, sendo as
amostras centrifugadas antes do uso.

De modo geral, na extração de DNA genômico animal, ge-


ralmente se utiliza o método Fenol-Clorofórmio, adaptado por
Sambrook e Russel (2001). Esta técnica se divide em três eta-
pas, que geralmente funcionam como base para os métodos
otimizados. O método consiste em três etapas: lise celular e
157
Biologia Molecular

eliminação do RNA, fase de desproteinização e fase de preci-


pitação do DNA:

a) Lise celular e eliminação do RNA

• Adiciona-se o tampão Tris-EDTA (100mM Tris HCl pH


8,0; 0,1M EDTA pH 8,0), SDS a 20% e Proteinase K (50µg/mL
de solução) à amostra até que esta triplique seu volume.

• Homogeneíza-se a amostra para que as células man-


tenham contato com o tampão de lise, nesta etapa haverá o
rompimento da membrana plasmática e a exposição dos com-
postos celulares.

• Incuba-se em banho-maria a 55ºC durante 14 horas,


sob agitação periódica por 12 horas. Haverá a desnaturação
por proteinase K, que deve ser seguida de incubação a 95ºC
durante 10 minutos.

• Em seguida, resfria-se a amostra para que haja a adi-


ção de RNase (20mg/ml);

• Novamente incuba-se em banho-maria a 37ºC durante


2 horas.

b) Fase de Desproteinização

• Adiciona-se uma solução de fenol na proporção volu-


me/volume. O fenol é um poderoso agente para eliminação
das proteínas no processo de extração, pois este auxilia na
desnaturação tornando-as insolúveis e facilitando o processo
de separação da fase que contem o DNA.

• Homogeneiza-se em vortex durante 15 minutos.

158
Biologia Molecular

• Centrifuga-se a 12000g durante 5 minutos, em tempe-


ratura ambiente, para acelerar o processo de separação das
fases.

• Remove-se o sobrenadante, transferindo-o para outro mi-


crotubo, este sobrenadante é a fase em que o DNA está diluído.

• Para uma maior pureza do DNA, pode-se repetir esta


etapa duas ou três vezes. No entanto, ao se realizar mais eta-
pas de desproteinização, haverá maiores perdas de DNA, re-
duzindo a concentração final.

c) Fase de Precipitação do DNA

• Adiciona-se etanol absoluto gelado.

• Homogeneíza-se por inversão.

• Adiciona-se de acetato de sódio a 3M.

• Homogeneiza-se por inversão.

• Incuba-se a -20ºC durante 14 horas.

• Centrifuga-se a 12000g durante 15 minutos a 4ºC, em


seguida descarta-se o sobrenadante.

• Adiciona-se etanol a 70%, em seguida centrifuga-se a


12000g durante 15 minutos a 4ºC.

• Descarta-se o sobrenadante, inverte-se o tubo para se-


cagem do pellet e suspende-se o DNA em água ultrapura.

159
Biologia Molecular

7.2.3 Extração de DNA de bactérias e fungos

Na literatura são descritos muitas técnicas para extração


e purificação de DNA de bactérias e fungos, com a maioria
sendo baseada no método CTAB, descrito originalmente para
isolamento de DNA vegetal.

O grande desafio para o isolamento de DNA de fungos


reside em quebrar as paredes celulares rígidas, assim como a
presença de nucleases, polissacarídeos e outros metabólitos.

Todos os métodos de extração apresentam em comum


o uso de detergentes como o SDS para lise da parede ce-
lular, e isso muitas vezes requer mais manipulações de pu-
rificação. Como alternativa à lise por SDS, têm-se utilizado
o fenol.

Mendonza et al. (2010) descreveram o seguinte méto-


do para extração de DNA de fungos: romper as paredes
celulares com auxílio de esferas de vidro que devem ser
adicionadas à suspensão celular. Em seguida, acrescentar
cerca de 200µL de solução extração (SDS a 3%; 0,5mM
de EDTA; 1M de NaCl; 0,1M de Tris-HCl pH 8.0) e agitar
por cerca de 15 segundos para que ocorra a lise celular.
Aproximadamente 200 µL de Fenol:Clorofórmio (1:1) deve
ser adicionado e misturado vagarosamente e, em seguida,
incubado a 65°C por 5 minutos. Deve-se resfriar a mistu-
ra até que se atinja a temperatura ambiente e centrifuga-
-se a 10000g por 5 minutos a 4ºC. O sobrenadante deve
ser transferido para um novo tubo, onde será adicionado
um volume igual de isopropanol ou etanol absoluto gela-
do para que ocorra a precipitação dos ácidos nucléicos.
Centrifuga-se a mistura por 10 minutos a 10000g. O pellet
de DNA deve ser lavado com etanol a 75% e centrifugado
a 10000g a 4°C por 5 minutos.
160
Biologia Molecular

7.3 OTIMIZAÇÃO

Alguns problemas podem ser encontrados no isolamen-


to e purificação de DNA vegetal de boa qualidade. Esses
problemas são resultantes principalmente do co-isolamen-
to de polissacarídeos, substâncias fenólicas e compostos
secundários.

A diversidade biológica das espécies faz com que estas re-


servem características peculiares, composição celular e mor-
fologia distintas. Estas características são de grande impor-
tância quando se pretende extrair o DNA genômico, pois não
existe um protocolo padrão para todas as espécies existentes,
logo, há necessidade que estes métodos sejam modificados,
buscando atingir concentrações e qualidade satisfatórios.

KHANUJA et al. (1999) sugerem que ao extrair DNA


de plantas com altos níveis de compostos secundários e
óleos essenciais, além de modificações nos componentes
do tampão de extração, sejam feitas várias extrações com
clorofórmio:álcool isoamílico, a fim de se obter um sobre-
nadante aquoso contendo DNA de melhor qualidade, livre
destes contaminantes.

Em folhas jovens, quando a região em crescimento é li-


mitada ou quando não há crescimento ativo no momento da
coleta, a pureza do DNA torna-se cada vez mais difícil de ser
alcançada. O DNA obtido a partir de material além da fase
de brotamento apresenta dificuldades na extração além de se
mostrar instável para o armazenamento a longo prazo. Isso
ocorre pois com a maturidade, as folhas passam a conter maior
quantidade de polifenóis, taninos e polissacarídeos. Lidar com
tais componentes nas folhas adultas torna-se necessário, já
que nem sempre se encontra folhas jovens em desenvolvi-
mento no momento da coleta.
161
Biologia Molecular

Em animais também há necessidade de mudanças no pro-


tocolo padrão para que se adeque à região do organismo de
onde estão sendo coletadas as amostras ou ao grupo a qual
a espécie pertence. Em artrópodes, por exemplo, há neces-
sidade de um processo de maceração vigorosa, semelhante
ao aplicado em plantas e em fungos, devido à presença do
exoesqueleto quitinoso.

Em bactérias e fungos, os métodos de extração também


variam em sua composição e etapas de acordo com a diver-
sidade biológica destes grupos. Bactérias Gram-Positivas e
Gram-Negativas podem necessitar de etapas diferentes na
extração do DNA. Em caso de fungos e leveduras, os diferen-
tes metabólitos secundários produzidos por estes, interferem
em diferentes graus no processo de extração, sendo necessá-
rias adaptações nos protocolos padrões para que resulte em
DNA de boa qualidade e em grandes concentrações.

7.4 MÉTODOS COMERCIAIS DE EXTRAÇÃO

Alguns métodos comerciais utilizam princípios de digestão


convencional das amostras biológicas sem a utilização de sol-
ventes orgânicos. Nestes protocolos, as células são digeridas
e os ácidos nucléicos são seletivamente ligados a membranas
de sílica, na presença de sais caotrópicos. Com este tipo de
reação, todo o DNA fica aderido a uma membrana de sílica
enquanto os outros componentes celulares (restos de membra-
nas e proteínas) permanecem livres na solução e podem ser
lavados e descartados do sistema. Podem ser realizados vá-
rios banhos com soluções próprias de lavagem (desenvolvidas
pelos fabricantes) e álcool. Após a limpeza, o DNA pode ser
recuperado com a utilização de substâncias eluentes com bai-
xas concentrações de sais. Estas reduzem a afinidade química
entre o DNA e a sílica e, assim, o DNA é liberado do sistema em
um novo tubo, livre de contaminantes e restos celulares.
162
Biologia Molecular

7.5 QUANTIFICAÇÃO

Após a obtenção do DNA, as amostras devem ser quantifi-


cadas para que o pesquisador possa conhecer as quantidades
de seu material e sua integridade. Para isso, existem várias
técnicas para a quantificação do DNA: eletroforese, fluome-
tria, cromatografia, espectrofotometria e difração de raios X.

A eletroforese se fundamenta na separação de material


orgânico (proteínas, enzimas, DNA, RNA) que apresentam
cargas elétricas definidas em pHs específicos. A eletrofore-
se em gel de agarose é utilizada para separar fragmentos
de DNA. O princípio básico desta técnica consiste na utili-
zação de uma corrente elétrica para identificar ou separar
moléculas contidas em uma matriz (gel de agarose). Esse
gel fica submerso em um recipiente contendo tampão sali-
no que conduzirá a eletricidade, além disso, o gel deve ser
preparado com este mesmo tampão afim de que haja íons
suficientes para manutenção da corrente elétrica pela malha
do gel de agarose. O DNA é então colocado em poços con-
tidos no gel e o brometo de etídio, corante fluorescente, se
intercala entre as bases de DNA permitindo a visualização do
DNA. Os padrões de bandas são visualizados e comparados
a um marcador de peso molecular conhecido para se esti-
mar a concentração de DNA por µL e, consequentemente, a
quantidade total de DNA extraído.

A fluorometria é utilizada para a quantificação de baixas con-


centrações de DNA, geralmente se usa um corante chamado
bisbenzimida. Esse corante apresenta alterações nas caracterís-
ticas de fluorescência na presença de DNA, o que permite a esti-
mativa da concentração na solução. Na ausência de DNA, o es-
pectro de excitação do corante apresenta um pico fraco. Quando
o corante se liga ao DNA, a fluorescência emitida é medida e é
empregada como um indicador direto da concentração de DNA.
163
Biologia Molecular

A cromatografia é uma técnica da química analítica utili-


zada para a separação de misturas e substâncias. Baseada
no princípio da adsorção seletiva, a cromatografia está fun-
damentada na migração diferencial dos componentes de uma
mistura que ocorre devido a diferentes interações através
de duas fases: uma estacionária (fixa) e outra que é móvel.
Através da adsorção diferenciada de proteínas e DNA em um
meio, realiza-se a separação dessas moléculas e obtém-se a
quantidade de DNA extraído.

A quantidade e a pureza do DNA genômico podem ser de-


terminadas por densidade óptica em espectrofotometria, que
se baseia na absorção da radiação nos comprimentos de onda
entre o ultravioleta e o infravermelho. Um espectrofotômetro é
um aparelho que faz passar um feixe de luz monocromática
através de uma solução e mede a quantidade de luz que foi
absorvida por essa solução usando um prisma (que separa a
luz em feixes com diferentes comprimentos de onda). Esse
equipamento mostra a quantidade de luz que é absorvida a
cada comprimento de onda e com esses resultados pode-se
verificar o nível de contaminação do DNA por proteínas e com-
postos secundários.

A desvantagem da espectrofotometria é que a quantifica-


ção não é específica para o DNA, e sim para ácidos nucléicos
em geral. Os ácidos nucléicos absorvem o comprimento de
onda 260nm, as proteínas absorvem o comprimento de onda
280nm e os componentes do tampão de extração absorvem o
comprimento de onda 230nm. Uma absorbância para 260nm
igual a um, significa que na amostra possui 50ng/µL de so-
lução. A razão entre A260nm e A280nm fornece a principal
estimativa da pureza dos ácidos nucléicos. Soluções puras de
DNA possuem valores de A260/280 entre 1,8 e 2,2. Se existe
contaminação por proteínas, essa relação será muito menor e
a precisão nas quantidades de ácidos nucléicos será baixa. Se
164
Biologia Molecular

a relação for maior que a estimada sugere-se a contaminação


com fenol. A razão calculada entre A260/230 provê uma esti-
mativa secundária na determinação das purezas as amostras,
ou seja, se a relação A260/280 não está dentro dos valores
limites, A260/230 pode ser relevante. A razão deve situar-se
entre 2 e 2,2. Um valor superior a 2,2 indica possível contami-
nação do DNA por peptídeos, aminoácidos, ou componentes
de lise presentes no tampão de extração.

Na difração de raios X, ocorre a interação dos raios X com


os elétrons da rede cristalina da amostra e são difratados, pos-
sibilitando a visualização de DNA. Foi através dessa técnica
que se elucidou a estrutura espacial do DNA em 1953.

165
Biologia Molecular

7.6 GUIA DE ESTUDO

1 - Os métodos padrões para extração de DNA genômico


em animais são eficientes para todas as regiões do organismo
e para todas as espécies de animais existentes? Justifique
sua resposta.

2 – Quais os dois procedimentos básicos envolvidos na


extração de DNA? Explique cada um.

3 – Na coleta de tecido vegetal para a realização de uma


extração de DNA:
a) deve-se coletar tecidos mais maduros, pois esses têm
maior quantidade de compostos secundários usados na defe-
sa contra herbivoria;
b) deve-se coletar tecidos mais jovens, já que esses têm
menor quantidade de compostos secundários que podem con-
taminar o DNA;
c) deve-se coletar sempre tecidos maduros e velhos, uma
vez que esses não possuem mais os compostos secundá-
rios;
d) deve-se coletar tecidos jovens, que são ricos em com-
postos secundários;
e) tanto faz, já que a quantidade de DNA é a mesma em
qualquer idade da planta.

4 –Quais as dificuldades encontradas no isolamento do


DNA genômico de bactérias e fungos?

5 - Cite três metodologias utilizadas na quantificação de


DNA.

166
Biologia Molecular

MARCADORES DE DNA

Dario Abel Palmieri


Licenciado em Genética, Dr., Universidade Estadual Paulista
Julio de Mesquita Filho, Departamento de Ciências e Letras.
e-mail: darioap@assis.unesp.br

Fábio Barros Britto


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: fbbritto@ufpi.edu.br

Jomar Patrício Monteiro


Biólogo, Dr., Embrapa Caprinos e Ovinos
email: jomar@cnpc.embrapa.br

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

167
Biologia Molecular

168
Biologia Molecular

MARCADORES DE DNA

Dario Abel Palmieri


Fábio Barros Britto
Jomar Patrício Monteiro
Sérgio Emílio dos Santos Valente

169
Biologia Molecular

170
Biologia Molecular

Sumário

CAPÍTULO 8. MARCADORES DE DNA



8.1 O QUE SÃO MARCADORES DE DNA?.......................173
8.2 RFLP (POLIMORFISMO NO COMPRIMENTO DE
FRAGMENTOS DE RESTRIÇÃO).................................174
8.2.1 Vantagens e desvantagens dos RFLPs......................180
8.3 VNTRs (NÚMERO VARIÁVEL DE REPETIÇÕES EM
SEQUÊNCIA)................................................................182
8.4 GUIA DE ESTUDO.........................................................184

171
Biologia Molecular

172
Biologia Molecular

8.1 - O QUE SÃO MARCADORES MOLECULARES?

Antes de responder o que são marcadores moleculares,


podemos discutir simplesmente o que são marcadores. Como
o próprio nome indica, os marcadores nada mais são do que
características (marcas) que podem ser utilizadas como cri-
térios para diferenciar dois ou mais indivíduos, sendo que
estas são herdadas geneticamente. Por exemplo, atribuímos
ascendência oriental às pessoas que possuem a caracterís-
tica definida como “olhos puxados”. Este fenótipo funciona
como uma marca da população e essa marca a distingue das
demais populações do planeta. Sabemos que indivíduos que
apresentam essa marca são, em algum grau, geneticamente
relacionados entre si. Existem diversos marcadores nas mais
variadas espécies que podemos utilizar como critério para a
realização de estudos genéticos e evolutivos.

Neste sentido, podemos voltar à questão inicial: o que


são marcadores moleculares? Os marcadores moleculares
são definidos como proteínas ou sequências de nucleotídeos
(DNA) que apresentam variações entre indivíduos e também
são herdadas geneticamente. Por exemplo, podemos utilizar
uma sequência de nucleotídeos para estabelecer o grau de
parentesco entre quatro indivíduos:

Sequência de nucleotídeos

Indivíduo 1 AAAAGGGG
Indivíduo 2 AAAAGGGG
Indivíduo 3 AAAAGGGA
Indivíduo 4 AAAAGCCT


Estas sequências de nucleotídeos funcionam como mar-
cadores moleculares porque a própria molécula de DNA nos
173
Biologia Molecular

permite estabelecer que os indivíduos 1 e 2 são mais geneti-


camente semelhantes do que qualquer um dos demais (suas
sequências são idênticas). Portanto, em nossa análise sim-
plificada, estes apresentam maior grau de parentesco. Deste
modo, ao invés de estudar os fenótipos dos indivíduos (que
são frutos da ação genes), estamos estudando diretamente o
seu genótipo, obtendo a informação diretamente da molécula
de DNA. Neste sentido, o DNA pode ser considerado como um
marcador molecular. Se a informação estiver sendo obtida de
uma molécula de proteína expressa, também consideramos o
mesmo princípio, analisando a variações nas proteínas (por
exemplo, em sua sequência de aminoácidos).

Os tópicos que seguem, mostram as diferentes técnicas


utilizadas para detecção de variações (ou mais propriamente
dizendo, detecção de polimorfismos) em moléculas de DNA.
Em outras palavras, veremos como podemos detectar as va-
riações na informação genética do ponto de vista molecular e
como utilizar estas informações em estudos genéticos e evo-
lutivos.

8.2. RFLP (POLlMORFISMO NO COMPRIMENTO DE


FRAGMENTOS DE RESTRIÇÃO).

Marcadores RFLP (Restriction Fragment Length Polymorphism)


foram estudados pela primeira vez em um experimento que vi-
sava a detecção de mutações em DNA viral, aumentando o inte-
resse na análise genômica. Dessa forma, os marcadores RFLP
logo se tornaram uma importante ferramenta em várias áreas das
Ciências Biológicas.

A técnica de RFLP se baseia no polimorfismo do compri-


mento de fragmentos de DNA obtidos através do corte de sua
fita dupla, por meio de enzimas de restrição. O DNA digeri-
do com estas enzimas é colocado em um gel e submetido à
174
Biologia Molecular

eletroforese. A eletroforese separa os fragmentos de DNA de


acordo com seu tamanho. O DNA é desnaturado e transferido
para uma membrana sólida, onde se hibridiza com uma sonda
radioativa.

Após a extração, o DNA dos indivíduos a serem estudados


é exposto a uma ou mais enzima(s) de restrição que cortam o
DNA em sítios de sequência específica. Como a distribuição
dos sítios de restrição apresenta variações individuais nós te-
remos uma coleção de fragmentos de DNA de diferentes ta-
manhos para cada indivíduo e que podem ser separados por
meio da técnica da eletroforese. No caso dos ácidos nucléi-
cos, o grupo fosfato é responsável pela forte carga negativa
em condições de pH neutro, fazendo com que os fragmentos
migrem para o pólo positivo (ânodo) durante a eletroforese.
Como a carga elétrica líquida dos fragmentos é negativa, a se-
paração ocorrerá com base no comprimento dos fragmentos.
A separação de fragmentos de DNA variando de 100 pb a 60
Kb pode ser verificada eficientemente utilizando agarose, uma
forma refinada de ágar extraído de algas marinhas. O processo
de separação de fragmentos de DNA por eletroforese depen-
de, basicamente, do tamanho do fragmento, da concentração
da agarose e da voltagem aplicada durante a eletroforese.

Como a agarose age como se fosse um filtro separando


os fragmentos de diferentes tamanhos durante a eletroforese,
observa-se que os fragmentos menores migrarão mais rapida-
mente na direção do pólo positivo, enquanto os fragmentos de
maior comprimento migrarão lentamente. Desta forma, frag-
mentos de diferentes tamanhos são separados ao longo dos
dois pólos no gel de agarose.

Ao aumentar a concentração de agarose, dificulta-se a


movimentação dos fragmentos ao longo da matriz, permitindo
que maior resolução seja obtida na separação de fragmentos
175
Biologia Molecular

de menor comprimento. A redução na concentração de agaro-


se; por outro lado, favorece a separação de fragmentos maio-
res. O incremento de voltagem aumenta proporcionalmente a
velocidade de migração dos fragmentos ao longo da matriz. O
conhecimento destas variáveis permite estabelecer a condição
ideal para otimizar a separação de fragmentos de DNA de dife-
rentes tamanhos. Alta voltagem, bem como alta concentração
de agarose, vai separar fragmentos menores de maneira mais
eficiente. O inverso separa fragmentos maiores com maior pre-
cisão. Por isso se faz necessário a otimização das condições da
eletroforese para se obter a separação ideal dos fragmentos de
interesse. Na prática, um gel de agarose a 0,8% é apropriado
para separação de fragmentos de DNA de 0,5 até 30 kb, apro-
ximadamente. Géis de agarose a 0,5% separam fragmentos
com até 50 kb. Géis com maiores concentrações (2,5 até 3%)
separam fragmentos menores (80 até 500 pb); já moléculas de
DNA maiores que 50kb são de difícil separação, mesmo com a
diminuição da concentração de agarose.

Algumas pessoas podem ter a sequência GAA TTT ao in-


vés da sequência GAA TTC, reconhecida pela EcoRI. A en-
zima não clivará a sequência GAA TTT, embora vá clivar os
outros sítios de restrição não alterados (GAA TTC) que estão
situados em ambos os lados da sequência polimórfica. Este
fragmento específico de DNA será maior na pessoa que não
tem o sítio de restrição do que naquela que o tem, tornando
possível observar diferenças na sequência de DNA entre es-
sas pessoas.

As diferenças na sequência de DNA dos indivíduos não


podem ser visualizadas diretamente no gel, uma vez que os
milhares de fragmentos, dispostos segundo seu tamanho, que
resultam do tratamento com enzima de restrição ao serem se-
parados pela eletroforese produzem o efeito de um arraste
contínuo no gel. Dessa forma, seria impossível distinguir um
176
Biologia Molecular

fragmento do outro devido ao grande número de fragmentos


produzidos.

Posteriormente o DNA é desnaturado (ou seja, convertido


da forma bifilamentar para a unifilamentar) pela exposição a
soluções químicas alcalinas. Para fixar permanentemente as
posições dos fragmentos de DNA, eles são transferidos do gel
para uma membrana sólida, de nylon (ou nitrocelulose) por
capilaridade ou vácuo através de um processo denominado
Southern Blot.

Como a membrana de nylon é colocada sobre o gel, a or-


dem dos fragmentos separados por eletroforese é mantida na
transferência. A seguir, os fragmentos são fixados covalente-
mente na membrana através de alta temperatura em forno a
vácuo ou com luz ultravioleta, o que permite a reutilização da
membrana algumas vezes. Esta reutilização é importante, pois
diminui significativamente o custo da técnica de RFLP.

Posteriormente, identificaremos fragmentos específicos por


meio de uma característica da molécula de DNA: a complemen-
taridade do pareamento de bases. A tecnologia do DNA recom-
binante permite a síntese de pequenos fragmentos clonados de
DNA unifilamentar denominados “sondas”, marcadas com um
isótopo radioativo e que apresentam sequências homólogas ao
DNA fixado na membrana. Dessa forma, somente os fragmen-
tos fixados na membrana que são homólogos ao DNA da sonda
serão identificados entre os milhares de fragmentos resultantes
do corte com enzima de restrição. Por ter apenas alguns quilo-
bases de tamanho, a sonda identifica uma parte específica do
DNA, geralmente apenas um ou dois fragmentos.

Os clones a serem utilizados como sondas podem ser ob-


tidos de diferentes formas:

177
Biologia Molecular

(1) através da transcrição reversa do RNAm do organis-


mo em estudo, produzindo-se uma biblioteca de moléculas de
DNA complementar (“cDNA library”) ;

(2) através de fragmentos de DNA genômico clonados ao


acaso (“genomic library”);

(3) através da amplificação via PCR de sequências conhe-


cidas utilizando iniciadores específicos;

(4) através de bandas RAPD selecionadas e obtidas de gel


de eletroforese, e amplificadas via PCR.

Uma vez obtida uma biblioteca de clones, um passo


importante no processo de análise de RFLP é a seleção
daqueles clones que serão utilizados como sondas. Neste
processo objetiva-se selecionar os clones que possuam có-
pia única, ou seja, que não contenham sequências de DNA
repetitivo. Clones contendo DNA repetitivo hibridizam com
vários fragmentos na membrana, o que resulta em borrões
de difícil interpretação na auto-radiografia ou em padrões
de bandas múltiplas difíceis de acompanhar do ponto de
vista de distinção de locus e alelos. Por outro lado, sondas
contendo sequências moderadamente repetidas no geno-
ma tornam-se muito úteis quando o objetivo for a obtenção
de uma impressão digital genética (genetic fingerprint) es-
pecífica para cada indivíduo.

Após a hibridização com as sondas, a membrana é expos-


ta a filme de raios-X em um processo chamado auto-radiogra-
fia, que escurece na posição da sonda devido à emissão de
partículas radioativas da sonda marcada, revelando bandas
que constituem os marcadores RFLP. O filme é chamado de
auto-radiograma. Estas bandas são produzidas como resulta-
do da sensibilização do filme pela emissão de partículas beta
178
Biologia Molecular

do fósforo radioativo, ou fótons de luz. Em geral, cada sonda


detecta um locus, ocasionalmente mais do que um.

Se os dois indivíduos diferem entre si em relação à po-


sição do sítio de restrição enzimática na fita de DNA, geran-
do fragmentos de tamanho distinto, a banda será observada
em posições diferentes na auto-radiografia. Se caracterizada
a segregação Mendeliana de tais bandas, conclui-se que elas
representam um locus RFLP e, portanto, podem ser utilizadas
b
como marcador genético. Segregação Mendeliana é, em geral,
evidenciada através da utilização de populações segregantes
(F2), retrocruzamento ou análise de indivíduos descendentes
ou ascendentes em relação aos indivíduos estudados.

Por ser uma técnica eficaz na detecção de polimorfismo,


os RFLPs podem diferenciar indivíduos que possuam altera-
ção em apenas uma base no DNA. Por exemplo, na anemia
falciforme, há a troca de apenas uma base nitrogenada no
sexto códon da cadeia b da hemoglobina humana, acarretan-
do na substituição da valina pelo ácido glutâmico.

Em indivíduos não acometidos pela anemia falciforme,


homozigotos normais, a enzima de restrição MstII cliva a se-
quência de DNA do cromossomo “normal”, produzindo dois
fragmentos de DNA: um que tem 1100 pb de comprimento e
outro de apenas 200 pb de comprimento. Nos homozigotos
falcêmicos, a MstII não reconhece este sítio em particular, de
modo que o DNA não é clivado, produzindo um fragmento mais
longo com 1,3 kb. O resultado é um fragmento de DNA mais
longo, agora com 1300 pb de tamanho em vez de 1100 pb. Os
homozigotos falcêmicos têm, portanto, uma única banda com
1,3 kb, enquanto os homozigotos normais possuem uma única
banda de 1,1 kb. Nos heterozigotos ocorrem as três bandas: a
de 1,1 kb, a de 200 pb e a de 1,3 kb.

179
Biologia Molecular

A localização e a identificação de genes específicos são


o primeiro passo para a realização de testes para diagnósti-
co, que podem elucidar os mecanismos que levam à mani-
festação dos sintomas, bem como estabelecer novas formas
de prevenção, tratamento e, eventualmente, de cura com-
pleta. Haverá muitos benefícios para os indivíduos acome-
tidos por doenças genéticas e seus familiares, porém não
se podem criar falsas expectativas a portadores de doenças
genéticas, pois há uma distância enorme entre a localização
de um gene e a disponibilidade de tratamento adequado para
a população.

8.2.1. Vantagens e desvantagens dos RFLPs

Comparados às isoenzimas, os marcadores RFLP apre-


sentam a vantagem de cobrir, potencialmente, todo o geno-
ma do organismo estudado, dependendo do tipo de bibliote-
ca de sondas utilizada. O uso de RFLP aumenta, portanto, a
probabilidade de se encontrar associações estatisticamente
significativas entre marcadores e genes que controlam um
caráter de interesse. Acredita-se que uma única população
segregante seja suficiente para analisar um grande número
de caracteres através de marcadores espalhados por todo o
genoma, desde que tais caracteres estejam segregando na
população.

Da mesma forma que isoenzimas, marcadores baseados


em RFLP possuem expressão co-dominante, isto é, em cada
locus estudado é possível identificar genótipos heterozigotos
e homozigotos, gerando mais informação a nível genético e
permitindo uma análise detalhada da ação gênica e interação
entre alelos em estudos de mapeamento de características
quantitativas. Conforme descrito anteriormente, as sondas po-
dem ser de regiões transcritas (cDNA) ou não (sondas de DNA
genômico clonado ao acaso).
180
Biologia Molecular

RFLPs amostram variação genética na sequência de nu-


cleotídeos de regiões que codificam produtos gênicos e, em
menor escala, em regiões não-transcritas, enquanto as isoen-
zimas limitam-se a regiões transcritas, pois tratam-se do pro-
duto resultante dos processos de transcrição e tradução.

Ao contrário de isoenzimas, o número de marcadores


RFLP é praticamente ilimitado, e o nível de polimorfismo alé-
lico em cada locus é muito maior. Várias enzimas de restrição
podem ser utilizadas, que, combinadas com um número qua-
se infinito de sequências clonadas, podem gerar uma enorme
quantidade de marcadores. O uso de várias enzimas de restri-
ção pode ser informativo também no que tange à natureza do
RFLP formado, se causado por mutações ao nível do sítio de
restrição, ou por rearranjos de maior magnitude, como translo-
cações e inversões entre os sítios de restrição.

Outra característica importante de marcadores baseados


em DNA em relação a marcadores isoenzimáticos é a alta es-
tabilidade do DNA, que pode ser extraído, conservado e reuti-
lizado por longos períodos de tempo. As membranas de hibri-
dização também podem ser conservadas e reutilizadas por 15
ou mais vezes, o que assegura que o laborioso processo de
obtenção das mesmas (Southern Blot) seja compensado por
seu prolongado uso. Em comparação com isoenzimas, isto
equivaleria à possibilidade de se utilizar uma mesma fatia de
gel de eletroforese para estudar 15 ou mais sistemas isoenzi-
máticos. Umas poucas dezenas de Southern Blots permitem
construir, por exemplo, mapas genéticos com elevado nível de
saturação de marcadores.

Milhares de sondas diferentes já foram clonadas, cada uma


representando um pequeno pedaço diferente da sequência to-
tal do DNA humano. Combinando estas diferentes sondas e
enzimas, milhares de sítios polimórficos foram revelados nos
181
Biologia Molecular

cromossomos humanos. Estes polimorfismos são imprescin-


díveis na detecção de várias doenças originadas por apenas
um gene mutante, como por exemplo, fibrose cística, doença
de Huntington e Neurofibromatose tipo 1. Existem milhares
de combinações possíveis de sondas e enzimas de restrição
que podem revelar polimorfismo genético, tornando os RFLPs
uma importante ferramenta no estudo da variação genética e
no diagnóstico de patógenos e de várias doenças genéticas.

Como desvantagem, a técnica de RFLP é extremamente tra-


balhosa, requer quantidades relativamente grandes de DNA pu-
rificado (em geral vários microgramas) e geralmente há a neces-
sidade de se construir uma biblioteca de sondas. Bibliotecas de
sondas são em geral disponíveis para as principais culturas, tais
como milho, tomate, arroz, trigo, soja, feijão e batata. Isto não é
o caso, entretanto, de culturas de menor expressão e da grande
maioria das espécies florestais e frutíferas. Nestes casos é co-
mum a utilização de sondas heterólogas, isto é, derivadas de es-
pécies do mesmo gênero ou de gêneros afins.

Além disso, o uso de RFLP requer pessoal técnico habili-


tado para a manipulação de DNA recombinante, e no caso do
uso de 32P, de instalações adequadas ao manuseio e descarte
do material radioativo, portanto, é uma técnica mais complexa
e onerosa do que a eletroforese de isoenzimas.

8.3. VNTRs (NÚMERO VARIÁVEL DE REPETIÇÕES


EM SEQUÊNCIA).

Os VNTRs (Variable Number of Tandem Repeats) nada


mais são do que uma classe especial de RFLP, pois também
produzem alteração no tamanho do fragmento de restrição.
Entretanto, enquanto os RFLPs revelam polimorfismos devido
à presença ou ausência de um sítio de restrição, os VNTRs
revelam polimorfismos devido a números diferentes de repe-
182
Biologia Molecular

tições situadas entre dois sítios de restrição, sendo que o nú-


mero destas repetições varia consideravelmente nas popula-
ções. Estas sequências de repetições variáveis são descritas
como DNA minissatélites.

Os VNTRs são detectados de maneira semelhante à técni-


ca de RFLP. O DNA é digerido com uma enzima de restrição e
os fragmentos são submetidos a uma eletroforese, sendo então
desnaturados e transferidos para um meio sólido. A diferença prin-
cipal é que o DNA é digerido com qualquer enzima que não corte
a unidade repetida, sendo posteriormente hibridizado com uma
sonda que só se hibridiza com uma determinada região de mi-
nissatélites. Dessa forma, o polimorfismo resulta das diferenças
observadas no número das sequências repetidas.

Marcadores VNTR podem possuir inúmeros alelos e por isso


eles são especialmente úteis para a identificação de indivíduos
com vistas às aplicações em testes de paternidade e medici-
na forense. A grande vantagem de se analisar VNTRs para a
identificação de indivíduos é que se trata de regiões hipervari-
áveis. Embora cada indivíduo apresente no máximo dois alelos
diferentes (geralmente se é heterozigoto para esse tipo de lo-
cus), muitos alelos podem estar presentes na população. Este
grande número de alelos se deve ao fato de que a repetição de
sequências idênticas ou muito semelhantes na região dos minis-
satélites pode causar erros no alinhamento dos cromossomos
homólogos, o que acarreta em crossing-over desigual durante
a meiose. Há então a produção de alelos com número de có-
pias aumentado ou diminuído em relação à sequência repetida
original. Dessa forma, apesar da posição dos VNTRs ser cons-
tante no genoma humano, o número de sequências repetidas
em cada VNTR é altamente variável entre os indivíduos. Esta
grande variação permite a identificação de indivíduos e seus pa-
rentes mais próximos pois somente os parentes mais próximos
possuirão os mesmos alelos que um referido indivíduo.
183
Biologia Molecular

8.4 - GUIA DE ESTUDO

1 – Maria da Graça das Dores tem um filho (Rogério) e ale-


ga que João da Silva é o pai. João tem dúvidas quanto a esse
fato e o caso vai parar na justiça. O juiz determina que seja
feito um teste de paternidade. Se João possui um marcador
VNTR específico de 500 pares de bases, Maria tem o mesmo
marcador com 1500 pares de bases (ambos são homozigotos)
e Rogério tem dois marcadores (um com 1500 e outro de 2000
pares de bases). Qual o veredito final do caso? Esquematize o
resultado do autoradiograma e justifique a resposta.

184
Biologia Molecular

MARCADORES DE DNA BASEADOS


NA REAÇÃO EM CADEIA DA
POLIMERASE (PCR)

Dario Abel Palmier


Licenciado em Genética, Dr., Universidade Estadual Paulista
Julio de Mesquita Filho, Departamento de Ciências e Letras.
e-mail: darioap@assis.unesp.br

Fábio Barros Britto


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: fbbritto@ufpi.edu.br

Jomar Patrício Monteiro


Biólogo, Dr., Embrapa Caprinos e Ovinos
e-mail: jomar@cnpc.embrapa.br

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

185
Biologia Molecular

186
Biologia Molecular

MARCADORES DE DNA BASEADOS


NA REAÇÃO EM CADEIA DA
POLIMERASE (PCR)

Dario Abel Palmieri


Fábio Barros Britto
Jomar Patrício Monteiro
Sérgio Emílio dos Santos Valente

187
Biologia Molecular

188
Biologia Molecular

Sumário

CAPÍTULO 9. MARCADORES DE DNA BASEADOS NA


REAÇÃO EM CADEIA DA POLIMERASE

9.1 REAÇÃO EM CADEIA DA POLIMERASE (PCR)........191
9.2. RAPD (Random Amplified Polymorphic DNA)............194
9.3. MICROSSATÉLITES....................................................198
9.3.1 Vantagens e desvantagens dos microssatélites.........202
9.4. ISSR (INTER SIMPLE SEQUENCE REPEATS)..........203
9.5. AFLP (Amplified Fragments Length Polymorphism).....205
9.6. MARCADORES BASEADOS NO
SEQUENCIAMENTO DIRETO DE GENES .................209
9.6.1. SNPs (Single Nucleotide Polymorphisms)................209
9.6.2. Marcadores de Herança Uniparental .................213
9.7. APLICAÇÕES DOS MARCADORES MOLECULARES...214
9.8. GUIA DE ESTUDO.......................................................217

189
Biologia Molecular

190
Biologia Molecular

9.1 REAÇÃO EM CADEIA DA POLIMERASE (PCR)

Uma das maiores limitações anteriormente observadas


para o trabalho com marcadores de DNA era justamente
a quantidade de DNA disponível para as análises. Como
exemplo, citamos que a técnica de RFLP requer quanti-
dades relativamente grandes de DNA purificado (em geral
vários microgramas) para ser realizada. No entanto, o co-
nhecimento acerca das enzimas responsáveis pela síntese
de DNA permitiu o desenvolvimento de uma técnica capaz
de fazer cópias artificiais de trechos específicos de DNA
de interesse (na ordem de alguns quilobases ou menos),
aumentando significativamente sua quantidade para uma
análise molecular (em geral, gerando milhões de cópias da
sequência alvo). Esta técnica foi chamada de PCR (Poly-
merase Chain Reaction) em decorrência de ser baseada
em ciclos de replicação artificial do DNA utilizando a enzi-
ma DNA-polimerase.

A PCR tem muitas vantagens em relação à clonagem gê-


nica. A técnica da PCR produz grandes quantidades de DNA
puro a partir de quantidades extremamente pequenas de DNA
(nanogramas ou mesmo picogramas). Por exemplo, a quan-
tidade de DNA em uma mancha de sangue muito antiga, ou
mesmo em um único fio de cabelo, é, em geral, suficiente para
análise. Além disso, o procedimento é muito mais rápido, o
diagnóstico genético da anemia falciforme, que necessitava
de uma semana ou mais usando as técnicas antigas, pode ser
feito em um único dia com PCR.

As técnicas baseadas na PCR apresentaram uma nova


opção ao uso de marcadores moleculares. O uso de uma po-
limerase termicamente estável (Taq polimerase), extraída da
bactéria Thermus aquaticus, possibilita ciclos contínuos de
amplificação e a automatização do processo. Desta maneira é
191
Biologia Molecular

possível montar uma reação de PCR que permanece funcio-


nal ao longo dos ciclos de amplificação enquanto que no início
utilizava-se DNA-polimerases clonadas de E. coli e era neces-
sário adicionar mais enzima à reação a cada ciclo pois após
cada passo de desnaturação (em geral a 92-95º C) a enzima
desnaturava e perdia sua função.

A PCR é baseada na desnaturação (separação da ca-


deia dupla) do DNA molde e anelamento de primers (ou
iniciadores). Os primers são sequências curtas de nucle-
otídeos (comumente de 10 a 25 pares de bases) que vão
se ligar por complementaridade à sequência alvo do DNA.
Este complexo (DNA molde + primer) abre caminho para a
ação da DNApolimerase, que constrói uma nova molécula
de DNA a partir dos primers específicos (processo de alon-
gamento da cadeia). A mistura da reação é aquecida a 92-
95º C para desnaturar as fitas de DNA. Há então um res-
friamento para 35-50ºC a fim de que os primers se liguem
em sítios específicos no DNA. Então a mistura é aquecida
a 72º C para permitir que a polimerase sintetize novas fitas
de DNA, usando o DNA genômico como um molde. Esses
três passos (desnaturação, ligação do primers e síntese do
DNA) representam um ciclo da PCR. O uso da PCR propor-
ciona a amplificação de um segmento de DNA, delimitado
por dois primers que são complementares a dois sítios de
nucleotídeos posicionados inversamente a uma distância
geralmente não superior a dois mil pares de bases.

Os produtos resultantes da amplificação podem ser visu-


alizados como bandas em géis de agarose ou poliacrilamida.
Diferenças ao nível de DNA são inferidas de duas formas: a)
pela presença ou ausência de um determinado fragmento am-
plificado (presença ou ausência da banda no gel); b) pela dife-
rença de comprimento dos fragmentos (bandas em diferentes
posições no gel).
192
Biologia Molecular

Os componentes da reação para a amplificação de


DNA possuem a seguinte função: os primers determinam
quais segmentos de DNA serão amplificados, os dNTPs
são formas trifosfatos de nucleotídeos que fornecem subu-
nidades de nucleotídeos para o DNA (matéria prima para
a molécula que está sendo formada) e energia para sua
síntese, a Taq DNA polimerase é a enzima que catalisa a
síntese do DNA a 72 o C, uma solução de cloreto de mag-
nésio pois a DNA polimerase é dependente de Mg +2 para
seu funcionamento, o tampão da reação fornece cofatores
e o tamponamento necessário à reação e, finalmente, o
DNA genômico que é a amostra original a ser amplificada
(molde a ser copiado).

A PCR apresenta duas desvantagens: a) dependendo da


técnica a ser empregada a síntese do primer requer o co-
nhecimento prévio das sequências de DNA que flanqueiam
a região de interesse, tornando o procedimento inicial mais
oneroso e complexo; b) a sensibilidade da PCR torna-a sus-
cetível à contaminação no laboratório, onde pequenas quan-
tidades de DNA contaminante podem ser amplificadas junto
com o DNA alvo, gerando resultados falsos. Obviamente, vá-
rias precauções são comumente tomadas para evitar essa
contaminação.

A PCR fornece um meio eficaz e conveniente de se fa-


zerem milhões de cópias de uma sequência curta de DNA.
Devido ao curto tempo necessário para se realizar a téc-
nica e facilidade de uso, esta metodologia é amplamente
utilizada para atingir os mais variados objetivos, como por
exemplo em avaliações de variabilidade genética, diag-
nóstico de doenças genéticas ou até mesmo em questões
judiciais. Aplicações da PCR na obtenção de marcadores
moleculares serão discutidas com maiores detalhes neste
capítulo.
193
Biologia Molecular

9.2. RAPD (Random Amplified Polymorphic DNA)

A técnica de RAPD (Polimorfismo de DNA amplificado ao


acaso) é baseada na amplificação ao acaso de loci de DNA
com sequências alvo desconhecidas, por meio de primers que
apresentam sequências arbitrárias. Geralmente estes primers
são curtos, com aproximadamente 10 bases de comprimen-
to e as PCRs são realizadas com apenas um único primer
(na PCR convencional, são utilizados pares diferentes de pri-
mers). Entretanto, o princípio da técnica não difere da PCR
convencional já que as moléculas de primer de RAPD, apesar
de serem de um único tipo e possuírem a mesma sequência,
irão, da mesma forma, se anelar em dois sítios de nucleotíde-
os posicionados inversamente, cada um em uma cadeia de
DNA antiparalela.

Por utilizarem sequências curtas e definidas aleatoria-


mente, os primers em geral não se restringem ao anelamen-
to em apenas um único locus, mas sim a vários. Por este
motivo, são amplificados em torno de 10 a 20 fragmentos por
PCR de acordo com o tamanho e complexidade do genoma a
ser estudado. Assim, uma das vantagens desta técnica é que
com um pequeno número de primers, diversos locus aleato-
riamente distribuídos pelo genoma podem ser avaliados. As
diferenças genéticas (ou polimorfismos) entre os indivíduos
são detectadas pela presença ou ausência de uma banda no
gel de eletroforese após a PCR. Estes polimorfismos detec-
tados pelo RAPD provavelmente são resultado de processos
que incluem a substituição de nucleotídeos justamente nos
locais de anelamento dos primers. Bandas amplificadas re-
sultam de um anelamento perfeito do primer no locus a ser
amplificado. Porém, quando há diferenças genéticas no local
de anelamento, não haverá amplificação (ou seja, o anela-
mento não ocorrerá de forma correta) e as bandas estarão
ausentes (Figura 13).
194
Biologia Molecular

Figura 13: Gel de agarose mostrando o perfil de uma ele-


troforese realizada com marcadores do tipo RAPD em cinco
indivíduos diferentes. Note a presença de várias bandas por
indivíduo.

Outras vantagens relacionadas ao RAPD estão relaciona-


das com a operacionalidade da técnica, quando comparada
com outros marcadores de DNA. Por exemplo, em relação aos
RFLPs, a técnica de RAPD é mais barata, fácil, rápida e re-
quer quantidades mínimas de DNA, não necessariamente de
alta qualidade. Os RAPDs, por serem baseados na amplifica-
ção do DNA e não na sua hibridização, permitem a visualiza-
ção dos marcadores sem a necessidade da transferência de
195
Biologia Molecular

DNA para membranas (Southern Blot), da construção de bi-


bliotecas de sondas específicas, da hibridização do DNA com
essas sondas e da utilização de radioisótopos. Por se basear
na técnica de PCR, RAPDs geram um grande polimorfismo
distribuído por todo o genoma e permitem que um conjunto de
primers arbitrários seja utilizado em qualquer espécie alvo de
estudo. Porém, este fato também apresenta um lado negativo,
pois exige com que as condições de trabalho sejam extrema-
mente controladas para evitar a contaminação com algum tipo
de DNA não desejado no estudo. Além disto, o pequeno com-
primento dos primers e as baixas temperaturas de anelamento
tornam a técnica pouco reprodutível, fazendo com que nem
sempre os mesmos resultados sejam obtidos em repetições
de experimentos.

Apesar da técnica amplificar vários locus em uma única


reação, outra de suas desvantagens ocorre porque um baixo
conteúdo de informação genética é detectado para cada locus,
pois são marcadores moleculares considerados dominantes.
Como exemplo, se um locus for respresentado por dois alelos
(A e a), isto quer dizer que uma população pode ser composta
por indivíduos que apresentam os genótipos, AA, Aa e aa. Se
o marcador for dominante, isto quer dizer que apenas o alelo A
poderá ser detectado. Assim, após a realização da PCR, o pa-
drão de amplificação do DNA do indivíduo homozigoto domi-
nante (AA) não poderá ser distinguido do padrão de amplifica-
ção do indivíduo heterozigoto (Aa), pois ambos apresentarão
a mesma banda no gel após a eletroforese (Figura 14). Isto
quer dizer que apenas um tipo de alelo é detectado para cada
locus e os heterozigotos não podem ser distinguidos dos ho-
mozigotos que carregam apenas alelos dominantes. A presen-
ça de uma banda, não é indicativa da amplificação de uma ou
duas cópias da sequência alvo ou molde. Outra desvantagem
é que para locus com mais de dois alelos, a ausência de ban-
das no gel após a PCR acaba por representar todos os outros
196
Biologia Molecular

alelos daquele locus que não foram detectados e que podem


ter se originado por eventos diferentes (mutação, deleção ou
inserção no sítio de anelamento, interrompendo um determi-
nado sítio; ou entre sítios, elevando a distância entre eles a
mais de 4 kb, o que impede a amplificação do fragmento de
DNA pela enzima Taq polimerase).

Figura 14 - (A) Perfil de eletroforese de um locus para um


marcador dominante. Observando-se apenas o gel de aga-
rose, não podemos distinguir o indivíduo AA (homozigoto do-
minante) do Aa (heterozigoto). Neste tipo de marcador, ape-
nas a presença de um dos alelos é identificada. (B) Perfil de
eletroforese de um locus para um marcador co-dominante.
Observando-se o gel, podemos perfeitamente distinguir cada
um dos genótipos. Os heterozigotos são representados pela
presença de duas bandas. Neste tipo de marcador, ambos os
alelos são identificados.

Os marcadores RAPD têm sido empregados na identifica-


ção de cultivares (diferentes formas de uma planta cultivada),
no estudo das relações taxonômicas, no melhoramento gené-
tico, na avaliação de recursos genéticos vegetais e na corre-
lação desses marcadores com características de importância
econômica.

197
Biologia Molecular

9.3. MICROSSATÉLITES

Microssatélites, ou apenas SSR (Simple Sequence Repeats)


são sequências simples e curtas de DNA repetidas diversas
vezes em vários pontos no genoma de um organismo. Estes
loci de DNA repetitivo são altamente variáveis entre indivíduos
e, portanto, são amplamente usados como marcadores mole-
culares. As unidades de repetição variam de um a seis pares
de bases, no entanto, as repetições di, tri e tetranucleotídeo
são as mais comumente utilizadas nas análises genéticas.
O polimorfismo analisado na técnica se dá pela variação em
comprimento, ou número de unidades de repetição, dos loci.
Um indivíduo poderia, por exemplo, apresentar um locus de
microssatélite com a sequência ATATATAT. Poderiamos dizer
que este seria um microssatélite com o tipo de repetição dinu-
cleotídeo AT4 (AT repetido quatro vezes). Outro indivíduo po-
deria apresentar no mesmo locus a sequência ATATATATATAT
(ou seja, AT6). Portanto, do ponto de vista genético, ambos
são diferentes e o polimorfismo foi observado.

Os polimorfismos de microssatélites podem ser detectados


pela amplificação do locus via PCR e eletroforese em gel de
poliacrilamida. Os resultados podem ser visualizados usando
a coloração com nitrato de prata, autorradiografia ou por meio
do sequenciamento do locus após PCR com primers marca-
dos com fluorocromos (por exemplo, 6-FAM, HEX e NED);
sendo a última opção, a mais usada atualmente.

Os microssatélites de DNA são provavelmente a classe


mais poderosa de marcadores na análise genômica de estru-
tura populacional, mapas de ligação, testes de paternidade e
relações de parentesco. Este fato ocorre principalmente pela
alta taxa de mutação sofrida por estes loci do DNA (em torno
de uma mutação a cada 1000 a 10000 meioses). Acredita-se
que estas mutações ocorram devido ao processo chamado
198
Biologia Molecular

de slippage (ou deslizamento) da DNA-polimerase durante o


processo natural de replicação do DNA, fazendo com que uma
ou mais unidades de repetição sejam adicionadas ao locus de
microssatélite. Além disto, esta alta taxa de mutação confe-
re uma vantagem adicional aos microssatélites, pois faz com
que, em geral, estes marcadores apresentem vários alelos
para cada locus (marcador multialélico). Isto torna cada locus
extremamente informativo já que diferentes perfis genéticos
podem ser observados na mesma posição de um genoma (Fi-
gura 15).

Figura 15 - Perfil eletroforético de um marcador microssatélite


multialélico. Cada linha pontilhada evidencia a presença de um
fragmento de tamanho distinto, que corresponde a um alelo dife-
rente. No gel acima observamos a presença de 12 alelos distin-
tintos presentes em oito amostras de DNA analisadas. Note que
as amostras 2 e 4 pertencem a indivíduos homozigotos. Todas as
demais representam indivíduos heterozigotos. Os indivíduos 5 e
6 compartilham alelos do mesmo tamanho, bem como o 4 e 5. O
DNA Ladder serve como padrão de comparação na análise. Cada
uma de suas bandas apresenta tamanho conhecido.
199
Biologia Molecular

Microssatélites são marcadores co-dominantes e, por-


tanto, permitem avaliar a presença de loci heterozigotos
nos indivíduos. Os polimorfismos de repetição de micros-
satélites diferem dos VNTRs discutidos em termos de nú-
mero de repetições e tamanho das mesmas e também por-
que não são definidos por sítio de restrição que flanqueiam
a região repetida.

Marcadores microssatélites já foram considerados mar-


cadores de alto custo, devido ao fato de ser necessário
o desenvolvimento de bibliotecas, sequenciamento e de-
tecção utilizando-se radioatividade e, portanto destinado a
apenas poucas espécies de grande interesse econômico.
Atualmente esses marcadores têm sido utilizados ampla-
mente devido às simplificações no processo de obtenção
dos marcadores, como através do desenvolvimento de bi-
bliotecas enriquecidas e pela grande diminuição no custo
do sequenciamento.

Além disso, há a possibilidade de transferência de mar-


cadores de uma dada espécie para espécies relacionadas
do mesmo gênero. Foi observado que as sequências ad-
jacentes a microssatélites são conservadas em espécies
relacionadas, permitindo a amplificação de microssatélites,
utilizando-se primers heterólogos, isto é, primers que foram
sintetizados, baseados na sequência de DNA de uma dada
espécie, mas que são úteis em espécies relacionadas. A
possibilidade do uso de primers desenvolvidos para uma
espécie em outras espécies relacionadas é de grande im-
portância devido ao fato das vantagens desses marcado-
res serem “automaticamente” transferidas para outras es-
pécies. Isto elimina o passo de desenvolvimento de primers
específicos que é um processo muitas vezes trabalhoso e
de alto custo.

200
Biologia Molecular

Para seleção de primers complementares às regiões


que flanqueiam microssatélites, é necessária a construção
de uma biblioteca genômica utilizando-se fragmentos de
250 a 600 pb. Os passos para a construção dessa biblio-
teca são os seguintes: extração de DNA, digestão de DNA
com uma ou várias enzimas de restrição, separação dos
fragmentos em gel de agarose de baixo ponto de fusão,
retirada dos fragmentos de 250 a 600 pb do gel e inserção
dos fragmentos em vetores (plasmídeos ou bacteriófagos)
para clonagem. Após a preparação da biblioteca genômica,
os próximos passos são a transformação das bactérias e a
seleção dos clones que carregam microssatélites.

A primeira metodologia desenvolvida para seleção dos


clones positivos, isto é, aqueles que carregavam microssa-
télites, envolvia várias etapas de hibridação com oligonucle-
otídeos complementares às sequências dos microssatélites
sob seleção. A baixa eficiência desta metodologia tornava o
processo de seleção de primers extremamente caro. Para
se aumentar a eficiência, foram criados vários métodos de
enriquecimento das bibliotecas genômicas para sequências
microssatélites específicas.

Os métodos de enriquecimento visam basicamente o


aumento da frequência dos clones positivos através da di-
minuição dos clones negativos na biblioteca genômica. Es-
ses métodos podem ser divididos em dois grupos: 1 - aque-
les que permitem o enriquecimento, através da seleção por
hibridação dos clones positivos com oligonucleotídeos de
mesma sequência dos microssatélites sob seleção, os quais
estão ligados a membranas de nitrocelulose; 2 - métodos
que identificam os clones positivos na biblioteca genômica
através da hibridação com oligonucleotídeos marcados com
biotina e de sequência complementar ao microssatélite que
está sendo selecionada seguida pelo isolamento dos mes-
201
Biologia Molecular

mos utilizando-se estreptavidina acoplada a uma par-


tícula magnética. Este isolamento é possível devido à
propriedade da biotina de ligar-se à estreptavidina. As-
sim é possível isolar somente os clones que carregam
microssatélites através do uso de um ímã para coletar
as partículas magnéticas com o DNA alvo aderido.

Após a seleção, os clones positivos são sequenciados


e a partir das sequências dos fragmentos, são escolhidos
primers adjacentes às extremidades da região repetitiva
para serem utilizados na amplificação via PCR. Em geral,
são desenhados primers para microssatélites formados
por um número de repetições maior que 10, pois aqueles
formados por menos de 10 repetições não são tão polimór-
ficos.

9.3.1 Vantagens e desvantagens dos microssatélites

Microssatélites são de grande importância, devido ao


fato de serem co-dominantes (é possível identificar tanto
homozigotos quanto hetorozigotos numa dada análise) e
específicos. Podem ser mapeados em cruzamentos dife-
rentes, servindo como loci marcadores para o alinhamento
de mapas baseados em RFLP e RAPD, gerados a partir
de diferentes loci e construídos em laboratórios diferentes.

Marcadores microssatélites têm sido utilizados no ma-


peamento genético, na análise genômica, na análise de
genes ligados a caracteres quantitativos, no melhoramento
genético, em estudos de diversidade genética, na conser-
vação de germoplasma e na identificação de genótipos.

202
Biologia Molecular

Da mesma forma que os VNTRs, os polimorfismos de


repetição de microssatélites são altamente úteis para o ma-
peamento gênico. Ambos os tipos de polimorfismos são úteis
em aplicações forenses, tais como testes de paternidade e na
identificação de suspeitos de crimes.

Para várias espécies de plantas preferencialmente alóga-


mas, o elevado nível de diversidade genética no DNA, detec-
tável com técnicas mais acessíveis, não justifica atualmente, a
magnitude do investimento necessário para o desenvolvimen-
to de marcadores baseados em SSR.

A escolha das partes do DNA (ou locus) a serem analisadas


pode depender da quantidade de variação que se está bus-
cando. Se o objetivo for comparar indivíduos dentro da mes-
ma espécie (próximos geneticamente), a utilização de locus
altamente polimórficos é a mais indicada. Se, ao contrário, o
trabalho objetiva a comparação entre espécies geneticamente
distantes, a preferência terá que ser por locus conservados ou
semi-conservados.

9.4. ISSR (INTER SIMPLE SEQUENCE REPEATS)

Os marcadores ISSR também são baseados em regiões


de microssatélites, porém, a técnica se assemelha em diver-
sos aspectos aos RAPD. Assim como nesta última, as PCRs
com estes marcadores também são realizadas com pares de
primers idênticos. Entretanto, a sequência dos primers é defi-
nida de forma semi-arbitrária, pois os primers são complemen-
tares a locus de microssatélites (ao contrário do RAPD, onde
as sequências dos primers são escolhidas completamente de
forma aleatória). Admite-se que as sequências destes primers
sejam semi-arbitrárias por se assumir que os loci de micros-
satélites sejam abundantes nos organismos. Assim, a chance
de anelamento destes primers em alguma região do genoma
203
Biologia Molecular

é considerada alta. E de fato, estes primers se anelam em di-


versas regiões de um único genoma.

Por exemplo, um primer pode ter a seguinte sequência:

5’-CACACACACACACACATG-3’

Este amplificaria uma região entre duas sequências de mi-


crossatélites (sendo que este fato derivou o nome da técnica).
Além disto, em geral este primer possui em sua extremidade
3’ a chamada “sequência âncora”, correspondente aos nucle-
otídeos TG mostrados no exemplo acima, que posicionam o
primer na extremidade da região microassatélite. Os polimor-
fismos genéticos com este marcador poderiam ser detectados
como mostra a Figura 16.

Figura 16 - Polimorfismo genético entre dois indivíduos


evidenciado por marcadores ISSR. O polimorfismo ocorre
na posição onde o indivíduo 1 apresenta as bases AC en-
quanto o 2 possui GG. Após a separação da cadeia dupla
do DNA durante a PCR, a amplificação do fragmento ocorre
no indivíduo 1, mas não no 2 devido ao anelamento incom-
pleto do primer. Assim, a variação genética é evidenciada
em gel após a eletroforese, onde o indivíduo 1 apresentará
uma banda e o 2 não.
204
Biologia Molecular

Os resultados observados na técnica de ISSR são seme-


lhantes aos do RAPD, com um perfil eletroforético apresentan-
do varias bandas (ou vários locus amplificados) por amostra
(Figura 17).

Figura 17 - Padrões RAPD de amplificação de DNA genômi-


co de espécies do gênero Arachis obtidos por meio do primer
OPP16. M = marcador molecular de 1 kb (VALENTE, 2000).

9.5. AFLP (Amplified Fragments Length Polymorphism)

A técnica de AFLP tem seu princípio baseado na identi-


ficação de polimorfismos no comprimento de fragmentos de
restrição seletivamente amplificados por PCR.

Os procedimentos iniciais da técnica são semelhantes


àqueles aplicados à técnica de RFLP, onde após a extra-
ção, o DNA é exposto a uma ou mais enzimas de restrição
o que gera fragmentos de diferentes tamanhos. Devido à
205
Biologia Molecular

grande população de fragmentos gerados, no RFLP não é


possível se observar polimorfismos imediatamente após o
procedimento de digestão. A quantidade de fragmentos é
tão grande que uma eletroforese não mostraria a presença
de bandas no gel, mas sim um rastro com fragmentos de
diversos tamanhos muito próximos entre si. Desta maneira,
a técnica não seria informativa. Por isso, no RFLP torna-
-se necessário a utilização de sondas para capturar uma
subparcela de fragmentos e, em seguida, a aplicação do
processo de Southern Blot, que possibilita a visualização
das bandas através do uso de sondas. Porém, isto torna o
processo um tanto quanto complexo e oneroso.

Como já mencionado, a técnica de AFLP possui um


princípio semelhante, pois se inicia com a digestão do DNA
genômico utilizando enzimas de restrição. Essa digestão
também leva à formação de uma grande população de
fragmentos e, mais uma vez, a detecção de polimorfismos
imediatamente após a digestão é impossibilitada. Assim,
a estratégia utilizada neste marcador considera a obten-
ção de uma subparcela de fragmentos selecionados com
o auxílio de moléculas adaptadoras. As moléculas adapta-
doras nada mais são do que pequenos oligonucleotídeos
de DNA, em cadeia dupla e de sequência reconhecida que
são ligados às extremidades dos fragmentos gerados por
complementaridade de bases com as protrusões geradas
após a etapa de restrição. Os adptadores são de extrema
importância, pois sem eles, como poderíamos amplificar os
milhares de fragmentos gerados sem conhecer as sequên-
cias dos fragmentos? Que sequências deveríamos utilizar
para o anelamento dos primers? Eles são ligados com o
auxílio da enzima Dna-ligase que tem a propriedade de li-
gar moléculas de DNA umas as outras pelas suas extremi-
dades 5’ e 3’. Desta forma, cada fragmento gerado passa
a ter as pontas com sequências conhecidas que servirão
206
Biologia Molecular

de sítios de anelamento para os primers. Assim, a identifi-


cação dos polimorfismos não ocorre com o uso de sondas,
mas sim com a utilização de duas PCRs especiais que am-
plificarão apenas os fragmentos de interesse (amplificação
pré-seletiva e amplificação seletiva).

E como a sub-parcela de fragmentos é selecionada?


Para entendermos melhor, vejamos um caso fictício. Imagi-
nemos inúmeros fragmentos de DNA gerados por enzimas
de restrição onde sua sequência não é conhecida. Se adi-
cionarmos em ambas as extremidades uma sequência de
cadeia dupla de oito nucleotídeos como 3’-CATTCGGC-5’,
poderíamos produzir primers de oito nucleotídeos com a
sequência 5’-GTAAGCCG-3’ para amplificar todos os frag-
mentos por PCR. No entanto, a intenção é reduzir o núme-
ro de fragmentos amplificados para que os polimorfismos
possam ser observados por eletroforese. Assim, ao invés
de utilizarmos simplesmente o primer 5’-GTAAGCCG-3’,
podemos adicionar uma base qualquer em sua extremi-
dade 3’. Por exemplo, uma timina. O primer agora apre-
sentaria nove bases e sua sequência é 5’-GTAAGCCGT-3’
(este é o primer da PCR pré-seletiva). Quais os efeitos des-
ta base extra? A base extra não está mais na posição do
adaptador. Ela buscará um sítio de anelamento no primeiro
nucleotídeo após o adaptador, presente na região de sequ-
ência desconhecida. Nos fragmentos gerados, esta primei-
ra posição desconhecida pode apresentar uma Guanina,
ou uma Citosina, ou uma Timina, ou uma Adenina. Porém,
apenas os fragmentos que possuem a Adenina serão am-
plificados, já que o primer foi gerado com uma Timina extra
que se anelará neste local por complementaridade (Figura
18).

207
Biologia Molecular

Figura 18 - Princípio da PCR pré-seletiva na técnica de AFLP


para redução da população de fragmentos gerados por diges-
tão do DNA com enzimas de restrição. A figura mostra dois
fragmentos aleatoriamente obtidos após a digestão, sendo
que apenas o primeiro fragmento será amplificado.

O mesmo princípio é utilizado na PCR seletiva, que agora


conta com mais bases extras adicionadas ao primer (por exem-
plo: 5’-GTAAGCCGTGC-3’). Em procedimentos de rotina que
utilizam esta técnica, a redução dos fragmentos amplificados
ocorrem em cerca de 65000 vezes, e assim, os polimorfismos
podem ser observados como mostra a Figura 19.

Figura 19 - Representação esquemática de duas eletrofore-


ses mostrando os resultados da técnica de AFLP realizada em
dois indivíduos (1 e 2) em diferentes etapas do procedimento.
208
Biologia Molecular

Após a digestão do DNA o perfil do gel mostra apenas uma


imensa população de fragmentos gerados onde os polimorfis-
mos não podem ser observados pois as bandas de tamanho
próximo ficam sobrepostas. Como existem fragmentos de to-
dos os tamanhos possíveis, estes não conseguem se separar
uns dos outros, e o que observamos no gel é apenas um gran-
de rastro. Com a redução do número de fragmentos nas PCRs
pré-seletiva e seletiva, podemos visualizar o aparecimento
dos polimorfismos, mostrados pela presença de bandas nos
indivíduos 1 e 2.

9.6. MARCADORES BASEADOS NO SEQUENCIAMENTO


DIRETO DE GENES

9.6.1. SNPs (Single Nucleotide Polymorphisms)

Os marcadores SNPs representam os polimorfismos de


nucleotídeos simples. Estes polimorfismos são muito abun-
dantes nos genomas eucariotos, ocorrendo em média a cada
500 pares de bases. Em geral os polimorfismos são decorren-
tes de substituições de bases por processos de mutação do
tipo transição – ou seja, substituição de uma purina por outra
purina, ou de uma pirimidina por outra pirimidina. No entanto,
as transversões – substituição de uma purina por uma pirimi-
dina ou vice-versa – também ocorrem com certa frequência.
Deste modo, em geral, os SNPs representam uma classe de
marcadores considerados bialélicos. Um indivíduo pode ter
uma base G em um determinado locus, enquanto outro pode-
ria apresentar uma base A:

Indivíduo 1  CCTGACTG
Indivíduo 2  CCTAACTG

Estas diferenças refletem o passado evolutivo destes indi-


víduos, onde por um processo de transição, uma guanina pode
209
Biologia Molecular

ter sido convertida em uma adenina, ou vice-versa. Como es-


sas alterações são passadas para as gerações seguintes, os
polimorfismos observados podem ser utilizados como marca-
dores genéticos.

Quando analisados sozinhos, estes polimorfismos em nu-


cleotídeos simples podem não representar muita informação,
porém, analisando-se um número substancial de locus pos-
suindo SNPs, podemos obter muita informação genética de
qualquer organismo. Como exemplo, calcula-se que dois se-
res humanos escolhidos ao acaso na população possam ter
mais de alguns milhões de variações em nucleotídeos simples.

Em geral esta técnica é baseada no sequenciamento di-


reto dos loci polimórficos, porém, algumas alternativas vêm
sendo desenvolvidas para facilitar o trabalho operacional.
Como exemplo, alguns trabalhos vem utilizando enzimas de
restrição e eletroforese para detectar os polimorfismos nos loci
contendo SNPs.

Atualmente, com a disponibilidade do genoma completo


de inúmeros organismos é possível trabalhar com SNPs pré-
-caracterizados e uma vez conhecidas as sequências que
flanqueiam e contém os SNPs eles podem ser estudados em
larga escala através da metodologia de microarranjos de DNA
ou PCR em tempo real.

A metodologia de PCR em tempo real corresponde a de-


tecção de um produto de PCR específico à medida que ocorre
sua amplificação em uma reação de PCR. Esta metodologia
pode ser feita com ou sem a utilização de sondas marcadas
com compostos fluorescentes. Na ausência de sondas, um
dos primers está posicionado sobre um SNP específico e, no
caso da presença do SNP, ocorre a amplificação do fragmento
alvo. Esta amplificação é monitorada com a adição de uma
210
Biologia Molecular

substância fluorescente que tem afinidade com o DNA. À me-


dida que aumenta a concentração do fragmento de PCR que
contém o SNP aumenta a fluorescência detectada gerando
um resultado positivo. A ausência do SNP não gera amplifi-
cação e portanto não ocorre aumento da fluorescência. Desta
maneira, é possível genotipar rapidamente uma amostra de
DNA para um SNP específico a um custo relativamente baixo.
Uma desvantagem da não utilização de sondas é a presença
de falsos positivos devido à formação de dímeros de primers
ou anelamento em posições inesperadas no genoma alvo.
Isto pode tornar necessário checar os resultados através de
eletroforese para conferir o tamanho do produto de PCR ou
de acrescentar um passo onde uma curva de dissociação da
cadeia dupla é calculada pelo equipamento de PCR em tempo
real indicando a presença dos dímeros de primers.

No caso da utilização de sondas os primers flanqueiam


o SNP alvo a uma distância de algumas centenas de pares
de bases e utiliza-se uma sonda marcada com um compos-
to fluorescente em uma extremidade e um composto inibi-
dor de fluorescência na outra. Esta sonda se posiciona na
região do SNP e em um caso positivo ocorre o anelamento
da mesma nos fragmentos de PCR à medida que ocorre a
amplificação. Esta técnica tira proveito de uma proprieda-
de das DNA polimerases que é a propriedade de despoli-
merizar DNA no sentido 3´ para 5´ na fita dupla de DNA.
Desta maneira, à medida que a DNA polimerase estende a
cadeia no passo de extensão ela se choca com a sonda,
que hibridizou com sua região específica no passo anterior
de anelamento. Isso faz com que a sonda seja gradativa-
mente removida de seu sítio de hibridização gerando uma
protusão de fita simples de DNA na posição 3´da sonda. A
sonda é então degradada pela DNA polimerase, separando
a molécula fluorescente da molécula inibidora de fluores-
cência gerando portanto um aumento nos valores de fluo-
211
Biologia Molecular

rescência detectados na amostra positiva para um determi-


nado SNP. No caso de amostras negativas a amplificação
também ocorre porém a sonda não hibridiza, não é degra-
dada e a fluorescência detectada não aumenta ao longo
dos ciclos da PCR. Neste caso não é necessário conferir o
resultado da amplificação por eletroforese ou fazer curvas
de dissociação das cadeias pois a sonda é específica para
o SNP de interesse e só gera fluorescência significativa se
hibridizar com o produto de PCR específico gerado pelos
primers. Esta metodologia permite a análise de centenas
de SNPs simultaneamente pois os equipamentos de PCR
em tempo real podem geralmente realizar 96 reações ao
mesmo tempo. Pode-se ainda projetar ensaios multiplex
onde vários SNPs são analisados em uma única reação
desde que as condicões da PCR sejam compatíveis para
diferentes pares de primers e as sondas sejam marcadas
com compostos fluorescentes diferentes.

Nos microarranjos de DNA, milhares de oligonucleotí-


deos são depositados na superfície de slides de vidro em
posições conhecidas e as amostras de DNA são marcadas
com compostos fluorescentes através de reações de PCR
e hibridizadas com os oligos depositados nos arranjos. Es-
ses slides são escaneados por lasers com comprimentos
de onda específicos e a fluorescência emitida correspon-
dente a cada posição no microarranjo é coletada em um
arquivo digital. Esses valores de fluorescência serão altos
onde houver hibridização indicando a presença de um SNP
específico. Inversamente, a ausência de fluorescência indi-
ca os SNPs que não estão presentes nas amostras. Des-
ta forma, é possível analizar simultaneamente milhares de
SNPs em sua amostra de interesse sejam elas linhagens
de microrganismos patogênicos, células tumorais, cultiva-
res de plantas ou amostras de tecido animal das mais va-
riadas origens.
212
Biologia Molecular

9.6.2. Marcadores de Herança Uniparental

Existem diferentes formas de herança do material genéti-


co em organismos eucariontes. Animais, por exemplo, herdam
metade de seus cromossomos autossômicos da linhagem
paterna e a outra metade da linhagem materna. No entanto,
alguns genes são exclusivamente herdados de apenas um
dos genitores (herança uniparental). Como exemplo podemos
citar o DNA mitocondrial (DNAmt), que é herdado exclusiva-
mente da linhagem materna na maioria das espécies. Por ou-
tro lado, grande parte dos genes presentes no cromossomo
Y de mamíferos é transmitido de geração a geração exclusi-
vamente pela linhagem paterna. Algumas vantagens podem
ser observadas na utilização destes genes como marcadores
genéticos. A maior delas é que estes genes não passam pelos
processos de recombinação (crossing-over) observados nos
autossomos. Portanto, as diferenças de nucleotídeos entre
indivíduos que possuem estes genes é um reflexo direto da
distância evolutiva que os separa.

Fêmeas e machos apresentam papéis diferenciados na


criação e manutenção da estrutura genética das populações,
principalmente em decorrência dos sistemas de acasala-
mentos e padrões de dispersão. Dessa forma, uma estraté-
gia molecular atualmente utilizada considera a identificação
e análise da variabilidade das linhagens maternas e pater-
nas das raças e/ou espécies separadamente. A utilização do
DNAmt tem sido feita para investigação filogeográfica de po-
pulações, pois o DNAmt tem se destacado como o elemento
genômico mais informativo para o entendimento da origem
de muitos animais.

Um dos motivos é devido a sua rápida taxa de substituição


de nucleotídeos, principalmente na denominada Região Con-
trole, também conhecida como D-Loop em vertebrados. Esta
213
Biologia Molecular

alta taxa de substituição reflete o fato deste locus não codifica


genes funcionais. Isto o torna uma fonte de informação evo-
lutiva muitas vezes mais sensível do que os loci codificadores
de proteínas que são mais suscetíveis à eliminação do pool
gênico se adquirirem mutações deletérias.

Diversos trabalhos vem utilizando polimorfismos no cro-


mossomo Y como marcadores para restaurar a história evo-
lutiva das linhagens paternas ao longo de grandes regiões
geográficas. O cromossomo Y de mamíferos é composto por
duas regiões distintas, a região pseudo-autossômica (PAR) e
a região Y-específica (MSY). A região MSY é composta por
sequências repetitivas e por uma pequena região que codifica
genes relacionados com a determinação do sexo masculino.
Esta região pode ser considerada haplóide por não se combi-
nar com o cromossomo X.

9.7. APLICAÇÕES DOS MARCADORES MOLECULARES

Nos últimos 40 anos houve uma grande evolução da tec-


nologia de marcadores moleculares, com o desenvolvimento
da técnica de eletroforese de isoenzimas, de RFLPs e com o
desenvolvimento da técnica de reação em cadeia da polime-
rase (PCR). Aliado a isso, progressos na detecção da variabi-
lidade genética ao nível de sequências de DNA e automatiza-
ção das análises de DNA permitem hoje analisar a estrutura
de genomas complexos em um curto espaço de tempo.

Os marcadores moleculares são empregados na avaliação


da variabilidade genética e em estudos filogenéticos. A aplica-
ção de marcadores moleculares vem fornecendo excelentes
resultados na caracterização de germoplasma e na identifi-
cação de duplicatas em um banco ativos de germoplasma
(BAG). Além disso, os marcadores moleculares são utilizados
no processo de amostragem de coleções nucleares, porque
214
Biologia Molecular

podem identificar o grau de diversidade genética presente e


apresentam informação adicional a outros métodos de estu-
do de diversidade, como a distribuição geográfica e a análi-
se morfológica. Além disto, uma de suas grandes vantagens
é que não são influenciados pelo meio como os marcadores
morfológicos.

Associações entre marcadores moleculares e caracteres


de importância econômica têm tornado possível a construção
de mapas genéticos saturados para um grande número de es-
pécies de plantas anuais e perenes. A utilização desses mar-
cadores na construção de mapas genéticos de alta densidade
vem permitindo aumentar a taxa de obtenção de materiais ge-
neticamente superiores em culturas de interesse agronômico,
principalmente em plantas perenes e de ciclo longo. A cons-
trução de tais mapas é a base para estudos avançados de ge-
nética, como a localização de marcadores flanqueando genes
de interesse agronômico.

Tais marcadores são úteis aos programas de melhoramen-


to, pois permitem a identificação das características deseja-
das sem a necessidade de empregar métodos clássicos de
avaliação e seleção. Além disso, permitem a seleção precoce
de características que somente irão se expressar no estágio
adulto da planta.

A análise do DNA permite apontar com segurança se um


determinado indivíduo é o pai de uma criança (inclusão de
paternidade), ao invés de somente poder-se concluir que ele
não é o pai verdadeiro (exclusão de paternidade). A análise do
DNA para a identificação dos indivíduos baseia-se no fato de
que cada ser humano tem uma aparência física e caracterís-
ticas fenotípicas próprias porque possui uma composição ge-
nética única. Assim, com exceção dos gêmeos idênticos, não
existem dois indivíduos com exatamente o mesmo genótipo.
215
Biologia Molecular

O estudo do DNA também revolucionou os métodos de


identificação humana aplicados na resolução de crimes. Em
decorrência do fato do DNA de um indivíduo ser exatamente
igual em qualquer tecido, podemos identificar um “perfil mo-
lecular” para cada indivíduo a partir de uma amostra de qual-
quer material biológico como, por exemplo, sangue, saliva ou
esperma, encontrado na cena do crime ou na vítima.

Evidentemente, para se traçar este perfil molecular as di-


ferenças encontradas no DNA de cada um são importantes, e
não as semelhanças. Quando ocorre mutação dentro de um
gene, esta pode causar alteração na sequência de aminoáci-
dos da proteína codificada por este gene, às vezes, com con-
sequências drásticas para o indivíduo portador desta muta-
ção. Entretanto, somente 2-3% do DNA humano é expresso.
Grande parte do genoma humano não é composta de genes
que transcrevem um RNA importante para a produção de uma
proteína fundamental. Dessa forma, mutações ocorridas neste
DNA não chegam a ter um efeito no fenótipo do indivíduo e,
por essa razão, não são eliminadas das populações. Em re-
sumo, o DNA que não transcreve está mais sujeito a acumular
mutações, sendo uma grande fonte de variabilidade entre indi-
víduos. O exame do DNA revela diferenças entre os genótipos
dos indivíduos, que nem sempre são observadas no fenótipo.

É importante salientar que a abordagem de um problema


não deve ser justificada pela utilização da técnica mais so-
fisticada ou da “moda”. É necessário que se avalie o custo-
benefício da técnica e dos objetivos a serem alcançados pelo
trabalho científico, levando-se em consideração as vantagens
e limitações de cada marcador disponível.

216
Biologia Molecular

9.8. GUIA DE ESTUDO

1 - Explique a técnica do PCR.

2 - Você precisa amplificar um fragmento específico de


DNA utilizando a reação em cadeia da polimerase (PCR).
a) Quais seriam os componentes da reação?
b) Explique a função de cada um deles.

3 - “Os marcadores de DNA, quando comparados aos mar-


cadores convencionais, possibilitam a identificação de vestí-
gios em elevado estado de putrefação ou submetidos a altas
temperaturas.” Sim ou não? (JUSTIFIQUE SUA RESPOSTA).

4 - Em uma investigação de estupro seguido de morte,


na tentativa de identificação do criminoso por meio da técnica
de reação em cadeia da polimerase (PCR), os investigadores
coletaram material junto ao corpo da vítima. A respeito desse
assunto, julgue os itens seguintes.

a) “Sangue, cabelo e sêmen encontrados no local do crime


constituem material com potencial para fornecimento de DNA
para a realização da técnica de PCR.” Sim ou não? (JUSTIFI-
QUE SUA RESPOSTA).

b) “A técnica de PCR possibilita a clonagem de sequên-


cias específicas de DNA, de forma rápida, numerosa e sem a
necessidade de uma célula viva.” Sim ou não? (JUSTIFIQUE
SUA RESPOSTA).

217
Biologia Molecular

c) “Por ser bastante simples, a técnica de PCR dispensa o


uso de luvas descartáveis, reagentes e soluções de alta quali-
dade ou micropipetas de uso exclusivo.” Sim ou não? (JUSTI-
FIQUE SUA RESPOSTA).

d) “Independentemente da técnica de PCR, a presença de


espermatozóides do criminoso em esfregaço vaginal da vítima
de estupro possibilita a identificação inequívoca deste.” Sim
ou não? (JUSTIFIQUE SUA RESPOSTA).

e) “Além da molécula de DNA, o RNA também pode ser


usado como molde original para a técnica de PCR”. Sim ou
não? (JUSTIFIQUE SUA RESPOSTA).

218
Biologia Molecular

SEQUENCIAMENTO DE DNA

Lívio Carvalho de Figueirêdo


Biólogo, Dr., Universidade Federal do Piauí.
e-mail: liviocf@gmail.com

Girlene Soares de Figueirêdo


Bióloga, Dra., Universidade Estadual do Piauí.
e-mail: girlenesf@gmail.com

219
Biologia Molecular

220
Biologia Molecular

SEQUENCIAMENTO DE DNA

Lívio Carvalho de Figueirêdo


Girlene Soares de Figueirêdo

221
Biologia Molecular

222
Biologia Molecular

Sumário

CAPÍTULO 10. SEQUENCIAMENTO DE DNA



10. SEQUENCIAMENTO DE ÁCIDOS Nucléicos............225
10.1. O que é sequenciamento de DNA e qual
sua importância?..........................................................225
10.2. MÉTODOS CLÁSSICOS DE SEQUENCIAMENTO...226
10.2.1. Método de Sanger – terminadores
de cadeia..............................................................230
10.2.1.1. Modificações do Método de Sanger......................233
10.2.2. Método de Maxam e Gilbert
degradação química .......................................236
10.3. SEQUENCIAMENTO DE ALTO RENDIMENTO.........239
10.3.1. Pirosequenciamento paralelizado...........................240
10.3.2. Sequenciamento por terminadores reversíveis.......243
10.3.3. Sequenciamento por ligação...................................245
10.3.4. Sequenciamento por semicondutores de íons.........248
10.4. APLICAÇÕES.............................................................250
10.5 GUIA DE ESTUDO.......................................................252

223
Biologia Molecular

224
Biologia Molecular

10.1. SEQUENCIAMENTO DE ÁCIDOS NUCLÉICOS

Em 1974, Winston Salser publicou uma revisão sobre as


técnicas que começavam a revolucionar a biologia como se
conhecia até então: era o sequenciamento de ácido nucléicos.
Algo ainda novo, que despertava o interesse de muitos pes-
quisadores. Naquela revisão, uma pergunta expressava bem
o interesse do público até então:

“Que questões biológicas podem ser respondidas com téc-


nicas de sequenciamento de DNA?”

Neste capítulo vamos mostrar que muitas questões bio-


lógicas foram e estão sendo respondidas através do sequen-
ciamento do DNA e explanar um pouco sobre as principais
técnicas usadas para sequenciar essas moléculas.

10.1.1. O que é sequenciamento de DNA e qual sua importância?

O sequenciamento de DNA é um processo que determina


a ordem dos nucleotídeos – adenina, timina, guanina e cito-
sina (A, T, G, C) – em uma amostra de DNA. Existem vários
métodos disponíveis, e cada um apresenta vantagens e des-
vantagens.

Técnicas de sequenciamento de DNA são instrumentos


fundamentais em muitos campos. Um grande número de dife-
rentes ciências está recebendo os benefícios destas técnicas,
que vão desde a arqueologia, antropologia, genética, biotec-
nologia, biologia molecular, ciências forenses, entre outros.

Uma revolução silenciosa e notável está em curso em mui-


tas disciplinas; o sequenciamento de DNA está promovendo
novas descobertas que estão revolucionando os fundamentos
conceituais de muitos campos.
225
Biologia Molecular

O advento do sequenciamento de DNA acelerou significa-


tivamente as pesquisas e as descobertas biológicas. A rápida
velocidade de sequenciamento alcançada com a tecnologia
moderna de sequenciamento de DNA foi fundamental para o
sequenciamento do genoma humano, no Projeto Genoma Hu-
mano. Projetos relacionados, muitas vezes, pela colaboração
científica em todos os continentes, geraram as sequências
completas de DNA de muitos animais, plantas e genomas mi-
crobianos.

Obter a sequência completa de nucleotídeos de um seg-


mento de DNA em geral é uma parte importante da compre-
ensão de um gene e sua regulação, sua relação com outros
genes ou a função de seu RNA ou proteína.

10.2. MÉTODOS CLÁSSICOS DE SEQUENCIAMENTO

Diversos métodos foram, e ainda estão sendo, desenvolvi-


dos para se obter sequências de DNA. Entretanto, o sequen-
ciamento de RNA foi a primeira forma de sequenciamento de
nucleotídeos.

A primeira molécula de ácido nucléico sequenciada foi o RNA


transportador (RNAt) do aminoácido alanina de Escherichia coli
por Holley e colaboradores em 1965. Mas podemos conside-
rar dois grandes marcos históricos para o sequenciamento:
as publicações da sequência completa do primeiro gene, do
bacteriófago MS2 – um vírus de RNA com um dos menores
genomas conhecidos, 3569 nucleotídeos – (1972) e do geno-
ma completo desse mesmo organismo (1976), ambos desen-
volvidos por Walter Fiers e colaboradores na Universidade de
Ghent (Ghent, Bélgica).

O primeiro sequenciamento de DNA foi realizado por Wu e


Kaiser, em 1968. Um pequeno seguimento do genoma do bac-
226
Biologia Molecular

teriófago λ (fago lambda), uma molécula linear de DNA com


extremidades coesivas. Nas extremidades das moléculas de
DNA do fago λ, as fitas 5’-terminais são 20 nucleotídeos mais
longas do que as fitas 3’-terminais. Parte da sequência de ba-
ses dessas extremidades coesivas foram determinadas pela
adição de nucleotídeos catalisada pela DNA polimerase de
Escherichia coli, alongando as fitas 3’-terminais. Desta forma
13 resíduos de dG, 13 de dC, 7 de dA e 7 de dT foram incor-
poradas e, devido a equivalência de dG para dC e de dA para
dT observada, concluiu-se que as fitas possuíam sequências
de bases complementares.

No entanto, o método utilizado no primeiro sequenciamen-


to de DNA só era aplicável a curtos trechos de DNA próximos
às extremidades de genomas do fago lambda ou fagos rela-
cionados.

Outros métodos foram desenvolvidos e utilizados para


sequenciar pequenos trechos de DNA, como regiões regu-
latórias ou sinalizadoras; um bom exemplo é a sequência
do operon lac1 de Escherichia coli. Mas nenhum deles foi
poderoso o suficiente para determinar sequências comple-
tas de genes.

Em 1975, Sanger introduziu seu método de sequen-


ciamento de DNA denominado “mais e menos”. Esta era
uma técnica de transição que levou à geração de mé-
todos que dominaram completamente o cenário do se-
quenciamento por cerca de 30 anos. Esse método ana-
lisava os produtos de reações da DNA polimerase, ao
estender um primer hibridizado em um molde de DNA de
fita simples, como Wu e Kaiser haviam feito no sequen-
1 O operon lac é um operon (operador) requerido para o transporte e o metabolismo da lactose em Es-
cherichia coli e outras bactérias entéricas. O operon lac é regulado por diversos fatores, em particular a
disponibilidade de glicose e lactose no meio extracelular

227
Biologia Molecular

ciamento das extremidades coesivas do fago lambda.

Numa síntese inicial de DNA, o primer era estendido resul-


tando numa população de todos os produtos possíveis esten-
dendo 1, 2, 3, a até algumas centenas de bases. Um nucleo-
tídeo marcado com 32P era incorporado nesta etapa para que
os mesmos pudessem ser posteriormente revelados sob um
filme de raios-X.

Esse produto era dividido em oito alíquotas e utilizado para


preparar uma segunda rodada de reações da DNA polimera-
se. Nessas reações, a síntese era terminada de uma maneira
específica para a sequência, fornecendo apenas um dos qua-
tro trifosfatos de nucleosídeos (reações “mais”), ou então três
dos quatro (reações “menos”). Por exemplo, em uma reação o
dATP era acrescentado (reação “mais”) e nas outras três era
omitido (reação “menos”).

As oito reações eram submetidas a eletroforese em linhas


adjacentes de gel desnaturante de 12% de acrilamida e 8M de
uréia. Posteriormente, o gel era colocado em contato com um
filme de raios-X por um tempo apropriado, geralmente duran-
te a noite. Quando o filme era analisado, moléculas diferindo
por um único nucleotídeo de comprimento poderiam ser re-
solvidas como bandas discretas na autorradiografia resultante
(Figura 20).

228
Biologia Molecular

Figura 20 – Autorradiografia de gel de sequenciamen-


to “mais e menos” de uma região do fago ΦX174, como o
realizado por Sanger e Coulson. Modificado de Friedmann
(1979).
229
Biologia Molecular

O método era extremamente laborioso e não resolvia


adequadamente algumas sequências de homopolímeros.
Apesar disso, o método “mais e menos” foi utilizado para
sequenciar o genoma completo do bacteriófago ΦX174, em
1977.

Os problemas com o método “mais e menos” foram resol-


vidos com o desenvolvimento do “método didesoxi”, também
por Sanger e seus colaboradores, em 1977, e será descrito a
seguir.

10. 2.1. Método de Sanger – terminadores de


cadeia

Devido à ineficácia do método “mais e menos”, dois


anos depois, Sanger e seus colaboradores descreveram
um novo avanço para o sequenciamento de nucleotíde-
os via polimerização enzimática. Esse método, o qual
iria revolucionar o campo da genômica em poucos anos,
foi inicialmente conhecido como método terminador de
cadeia, método didesoxinucleotídeo ou simplesmente
método didesoxi. Mas ficou mundialmente conhecido
como método de Sanger.

Esse método consistia de uma reação de polimerização


de fragmentos de DNA complementares ao DNA da amostra
de interesse, semelhante ao método “mais e menos”, descrito
anteriormente. O conceito fundamental foi a utilização de aná-
logos de nucleotídeos terminadores de cadeia, ao invés de
nucleotídeos naturais para causar terminação base específica
da síntese de DNA.

Resumidamente, um primer era hibridizado a uma re-


gião conhecida e específica do DNA alvo, promovendo o
ponto de início da síntese de DNA. Na presença da DNA
230
Biologia Molecular

polimerase I, de E. coli, a polimerização dos dNTPs ocor-


riam naturalmente até a incorporação de um nucleotídeo
modificado, que interrompia a polimerização da cadeia de
DNA. A implementação original usava arabinosídeos trifos-
fatos (que possuíam a arabinose no lugar da desoxirribose)
e 2’,3’-didesoxinucleosídeos trifosfatos (que não possuíam a
hidroxila na posição 3’, presente na desoxirribose) como ter-
minadores de cadeia.

O princípio do método é simples: se um primer e um


DNA molde eram incubados com DNA polimerase na
presença de uma mistura de ddTTP e dTTP, assim como
os outros três desoxinucleotídeos (um dos quais estava
marcado com 32P), uma mistura de fragmentos, todos
possuindo a mesma extremidade 5’ e com um resíduo
ddT na extremidade 3’, era obtida. Quando a mistura
era fracionada por eletroforese em gel de poliacrilamida
desnaturante o padrão de bandas representava a posi-
ção de todos os dTs no DNA recém-sintetizado. Usando
terminadores análogo de nucleotídeos em incubações
separadas e executando as amostras em paralelo no
gel, um padrão de bandas era obtido a partir do qual
uma sequência de aproximadamente 100 nucleotídeos
poderia ser lida por autorradiografia, na maioria dos ca-
sos (Figura 21).

231
Biologia Molecular

Figura 21 - Autorradiografia de um experimento de se-


quenciamento do fago ΦX174 usando os terminadores ddATP,
ddTTP, ddGTP e ddCTP ao invés de araCTP. Modificado de
Sanger e colaboradores.(1977).
232
Biologia Molecular

10.2.1.1 Modificações do Método de Sanger

Diversas modificações do método de Sanger vieram


em seguida. Uma das principais modificações foi a in-
corporação de marcadores não radioativos nos termina-
dores. Uma das alternativas aos radioisótopos baseava-
-se em detecção de quimioluminescência com o sistema
biotina-estreptavidina. O mesmo desencadeava uma re-
ação luminescente que emitia fótons detectáveis por um
filme fotográfico.

Entretanto, mesmo com modificações, o método de


Sanger ainda requeria quatro linhas em gel de eletrofore-
se para cada leitura da mesma reação. Esse problema foi
solucionado por Smith e colaboradores (1986) ao desen-
volverem um conjunto de quatro fluorocromos (corantes
fluorescentes) diferentes, que permitiu que todas as quatro
reações fossem resolvidas numa única linha de gel, duran-
te a eletroforese.

Os primeiros fluoróforos foram: fluoresceina, 4-clo-


ro-7-nitrobenzo-2-1-diazole (NBD), tetrametil-rodamina
e Texas Red. Cada fluoróforo emitia luz em um compri-
mento de onda diferente quando excitado por um laser,
podendo ser separado por quatro filtros diferentes de
cores (Figura 22).

233
Biologia Molecular

Figura 22 – Comparação entre o sequenciamento usan-


do radioisótopos (a) e o sequenciamento usando fluorófo-
ros (b). Neste último os nucleotídeos são representados por
picos de fluorescência – cromatogramas. Modificado de http://
en.wikipedia.org/wiki/File:Radioactive_Fluorescent_Seq.jpg2

Essa modificação na técnica inaugurava a era do “sequen-


ciamento automatizado de DNA”, pois não necessitava de tem-
2 Imagem sob a licença GNU Free Documentation License. (Texto completo disponível em: http://
www.gnu.org/licenses/fdl-1.3.txt)

234
Biologia Molecular

po de exposição demorado, manipulação manual de gel, nem


mesmo de filmes fotográficos, tão comuns ao “sequenciamento
manual de DNA”.

O uso de fluorocromos era realizado em duas estratégias dis-


tintas: i) na primeira, o fluorocromo era ligado à extremidade 5’ do
primer e o mesmo era associado a um ddNTP em particular. Por
exemplo, a reação com o primer marcado com fluoresceina pos-
suía o terminador ddCTP e a reação com o primer marcado com
Tex Red possuía o terminador ddTTP, e assim por diante (Figura
23a); ii) na segunda, as moléculas fluorescentes eram ligadas aos
terminadores ddNTP. Isso permitiu o uso dos quatro terminadores
ao mesmo tempo em uma única reação (Figura 23b).

Os primers marcados necessitavam de quatro reações se-


paradas enquanto os terminadores somente uma. E devido a
síntese de primers marcados ser muito cara, o terminador mar-
cado foi a química escolhida para a maioria dos sequenciamen-
tos de DNA.

Figura 23 – Comparação entre reações com primers mar-


cados com fluorocromos (a) e terminadores marcados com
fluorocromos (b). F, FAM ; J, JOE ; T, TAMRA ; R, ROX Modifi-
cado de França et al. (2002).
235
Biologia Molecular

Outra importante modificação no método de sequencia-


mento de Sanger foi o uso de eletroforese em gel capilar. Esta
técnica utiliza capilares de diâmetro estreito (diâmetro interno
inferior a 100 µm) e pode resolver misturas complexas de bio-
polímeros em um campo elétrico intenso. Por essa razão a
eletroforese em gel capilar (EGC) era 10 vezes mais rápidas
que as eletroforeses em géis convencionais.

Mas somente após o desenvolvimento de instrumentos ca-


pazes de realizar uma modificação desse tipo de eletroforese: a
eletroforese em matriz capilar (EMC), que usava uma solução de
polímero com propriedades superiores ao gel de poliacrilamida,
pois podia ser removido do capilar facilmente e, assim, reutilizar o
mesmo capilar para várias eletroforeses em série .

Com essas e outras modificações, diversos projetos de se-


quenciamento foram acelerados, inclusive possibilitando a conclu-
são do Projeto Genoma Humano muitos anos antes do previsto.

2.2. Método de Maxam e Gilbert – degradação


química

No mesmo ano que Sanger e seus colaboradores de-


senvolveram o método didesoxi, Maxam e Gilbert apresenta-
ram sua técnica de sequenciamento de DNA conhecida por
sequenciamento por degradação química. Os dois métodos
eram semelhantes por determinar a sequência da molécula
de DNA através de eletroforese que resolviam fragmentos ter-
minados em cada base marcada especificamente. Entretanto,
os dois eram muito diferentes na forma que os produtos eram
terminados nas bases específicas.

Esse método iniciava com fragmentos de restrição de DNA


fita dupla marcados em uma das extremidades com 32P. Os
fragmentos eram submetidos, para cada base específica, a
modificações químicas sob quantidade limitante do agente
modificante, onde somente algumas dessas bases eram mo-
236
Biologia Molecular

dificadas em determinadas moléculas. Uma reação clivava o


DNA quimicamente tratado em ambas as purinas (reação ‘A
+ G’), uma preferencialmente em A (‘A > G’), uma nas pirimi-
dinas (‘C + T’) e uma somente nas citosinas (‘C’) (Figura 24).

Figura 24 – Autorradiografia de um gel de sequenciamen-


to de DNA pelo método de degradação química. Modificado de
Maxam e Gilbert (1977).
237
Biologia Molecular

Por exemplo, resíduos de guanina do DNA podiam ser


metilados usando dimetil sulfato. O DNA tornava-se suscetível
à clivagem com piperidina somente nas posições de resídu-
os modificados de guanina. As reações eram realizadas para
que, em uma dada molécula, somente alguns dos resíduos G
fossem metilados, mas na mistura inteira, então todos os re-
síduos G eram modificados. Após a reação com piperidina, as
fitas de DNA eram clivadas, resultando numa série de molé-
culas marcadas em uma das extremidades e estendendo para
cada resíduo G no fragmento (Figura 25).

Figura 25 – Modificação química parcial de resíduos de G


de um fragmento de DNA por reação com dimetil sulfato. Em
cada molécula, apenas alguns resíduos de G foram metilados.
O comprimento do fragmento radioativo após a clivagem com
piperidina é indicado por setas abaixo dos fragmentos de DNA
modificado. Modificado de Friedmann (1979).
238
Biologia Molecular

Similarmente, as reações base específica eram reali-


zadas com NaOH para resíduos A, hidrazina para resíduos
C e T juntos, hidrazina com alta concentração de sal para
resíduos C sozinhos e tetróxido de ósmio para resíduos T
especificamente. Cada mistura de reações base específi-
ca era carregada em linhas separadas em longos géis de
poliacrilamida desnaturante, como no método de Sanger, e
examinados após a eletroforese. A sequência de nucleotí-
deos podia ser determinada da mesma maneira do método
de Sanger.

10.3 SEQUENCIAMENTO DE ALTO RENDIMENTO

Os métodos anteriormente descritos, principalmente o mé-


todo de Sanger, dominaram o cenário dos projetos de sequen-
ciamento durante aproximadamente três décadas. No entanto,
mesmo com os avanços em automação e otimização dessas
técnicas, o custo por sequenciamento ainda era bastante ele-
vado.

Com o aumento da demanda e a necessidade em reduzir


custos, diversas tecnologias foram desenvolvidas na expec-
tativa de substituir os métodos, até então, dominantes. Assim
surgiram as tecnologias de sequenciamento de alta demanda,
baseadas no processo de sequenciamento em paralelo, ca-
pazes de produzir centenas, milhões ou bilhões de sequên-
cias de uma vez.

Essas novas tecnologias de sequenciamento foram


capazes de reduzir custos e diminuir o tempo gasto em
cada projeto, aumentando radicalmente o número de se-
quências e elevando a acurácia para valores próximos
de 100%, em alguns casos. Dessa forma, essas tecnolo-
gias inauguraram a “Nova Geração” de sequenciamento
de ácidos nucléico.
239
Biologia Molecular

10.3.1. Pirosequenciamento paralelizado

O Pirosequenciamento foi o primeiro método de sequen-


ciamento de alta demanda disponível comercialmente. O pi-
rosequenciador foi desenvolvido pela 454 Life Sciences (em
2004) e é baseado na técnica de “pirosequenciamento”.

No pirosequenciamento, cada incorporação de um nucleo-


tídeo pela DNA polimerase resulta na liberação de pirofosfato,
o qual inicia uma cascata de reações que finaliza com a pro-
dução de luz pela enzima luciferase (Figura 26). A quantidade
de luz produzida é proporcional ao número de nucleotídeos
incorporados.

Figura 26 – Cascata de reações enzimáticas do método


de pirosequenciamento.
240
Biologia Molecular

Esse sistema permite sequenciamentos do tipo shotgun


de genomas inteiros sem etapas de clonagem em células
hospedeiras. Primeiro o DNA é randomicamente fragmen-
tado (geralmente por processos físicos) e ligado a oligonu-
cleotídeos adaptadores que permitem a captura de molé-
culas individuais nas superfícies de uma esfera de agarose
(bead) para serem amplificadas isoladamente dentro de
gotícula em emulsão, que contém os reagentes para o PCR
(PCR em emulsão – ePCR). Essa etapa produz aproxima-
damente um milhão de cópias de cada fragmento na super-
fície de cada bead e essa única molécula amplificada será
massivamente sequenciada.

Primeiro, as beads contendo os fragmentos amplifica-


dos são arranjadas numa Placa PicoTiter TM (PPT – uma
placa plana com múltiplos poços), que mantém uma úni-
ca bead em cada um das centenas de milhares de poços,
providenciando uma localização fixa na qual a reação de
sequenciamento pode ser monitorada. Novas beads con-
tendo as enzimas que catalisam a cascata de reações do
pirosequenciamento são adicionadas à PPT e misturadas
às beads com fragmentos.

No equipamento, a PPT é submetida a um fluxo de


solução contendo cada tipo de nucleotídeo separada-
mente. Para cada passo de incorporação de nucleotí-
deo, uma imagem é gerada e captada por uma câmera
digital CCD que grava a luz emitida por cada bead (Fi-
gura 27).

241
Biologia Molecular

Figura 27 – Exemplo das etapas de sequenciamento


usando um pirosequenciador em paralelo (Roche/454 geno-
me sequencer). a) Construção da biblioteca de DNA; b) Re-
alização de PCR em emulsão usando beads de agarose; c)
Sequenciamento em paralelo em placa PicoTiterTM; e d) Pi-
rograma, mostrando as bases sequenciadas. Modificado de
Zhou et al. (2010).
242
Biologia Molecular

Enquanto as primeiras máquinas foram capazes de ler cer-


ca de 100 nucleotídeos, a atual geração desses equipamentos
são capazes de ler cerca de 1000 nucleotídeos por corrida,
gerando aproximadamente 700 milhões de bases (700Mb) em
apenas 23 horas de processamento.

10.3.2 Sequenciamento por terminadores reversíveis

O método foi desenvolvido pela Solexa, hoje parte da Illu-


mina. Essa tecnologia de sequenciamento também utiliza ter-
minadores de cadeia, mas com capacidade de reverter essa
condição e possibilitar a continuação da síntese da cadeia de
nucleotídeos.

Nesse sistema, as moléculas de DNA são fragmentadas


e ligadas a adaptadores em ambas as extremidades e poste-
riormente a uma lâmina de vidro, já na forma de fita simples
(ssDNA). Essa lâmina contém primers previamente fixados
que permitem uma “amplificação em ponte”, resultando em um
agrupamento de aproximadamente 1 milhão de cópias de um
único fragmento.

O sistema utiliza uma abordagem de sequenciamento por


síntese, na qual todos os quatro nucleotídeos são adicionados
simultaneamente, juntamente com a DNA polimerase, para in-
corporação nos fragmentos previamente fixados na lâmina.

Especificamente, os nucleotídeos possuem um marcador


fluorescente (fluoróforo) de base única e o grupo 3’-OH qui-
micamente bloqueado de forma que cada incorporação é um
evento único. Após a excitação por laser, uma imagem é cap-
turada pelo sistema óptico do equipamento em cada passo de
incorporação das bases. Antes do próximo ciclo de incorpo-
ração de bases, o grupo 3’ bloqueado e o fluoróforo de cada
base incorporada são quimicamente removidos, preparando
243
Biologia Molecular

cada fita para a próxima incorporação pela DNA polimerase


(Figura 28).

Figura 28 – Exemplo das etapas de sequenciamento


usando o sistema da Illumina. a) Preparo da mostra e amplifi-
cação em ponte; b) Incorporação das base com terminadores
reversíveis e fluoróforos específicos, seguida por captura de
imagem. Modificado de Mardis (2008).
244
Biologia Molecular

Atualmente, o equipamento mais avançado da Illumina® é


capaz de ler 250 nucleotídeos por corrida, bem superior aos
35 nucleotídeos da primeira geração dos seus sequencia-
dores e pode gerar aproximadamente 600 bilhões de bases
(600Gb). No entanto o processamento se estende por cerca
de 10 dias.

10.3.3 Sequenciamento por ligação

A plataforma SOLiD, da Applied Biosystems, usa uma bi-


blioteca de fragmentos ligados à adaptadores semelhante a
outras plataformas de nova geração, e também usa PCR em
emulsão para amplificar os fragmentos que serão sequencia-
dos, mas com beads magnéticas que posteriormente são liga-
das a uma lâmina de vidro.

Diferente das outras plataformas, o SOLiD usa uma es-


tratégia mediada pela enzima DNA ligase para sequenciar
os fragmentos amplificados. O sequenciamento inicia pela
hibridização de um primer (de comprimento n) ao adapta-
dor de cada fragmento amplificado, seguida pela ligação,
promovida pela DNA ligase, de uma sonda de 8 nucleotí-
deos marcada com uma fluorescência específica, cujas 1ª
e 2ª bases são codificadas pelo grupo fluorescente ligado.
Cada passo de ligação é seguido pela detecção da fluores-
cência, depois por um passo de regeneração que remove
bases da sonda (incluindo o grupo fluorescente) e conco-
mitantemente prepara o primer (n), agora estendido, para
outra rodada de ligação (Figura 29).

245
Biologia Molecular

Figura 29 – Exemplo das etapas de sequenciamento


usando a plataforma SOLiD da Applied Biosystems, ilustran-
do desde a etapa de fixação das beads à lâmina de vidro até
o término das rodadas de primers. Modificado de http://www.
lifetechnologies.com

Após diversos ciclos de ligação, o primer (n) estendido é


removido e um novo primer, agora possuindo uma base a me-
nos de comprimento (n-1) reinicia o processo de ligação de
novas sondas. Dessa forma, a sonda que iniciará esse novo
246
Biologia Molecular

processo de ligação deve ter a sua 2ª base igual à 1ª base


da sonda que iniciou a extensão do primer anterior (n). Como
cada grupo fluorescente é identificado pela combinação de
duas bases (1ª e 2ª bases da sonda), a sequência resultante
pode ser identificada pela análise das fluorescência de cada
ciclo de ligação nas subsequentes rodadas de hibridização de
primers. Assim, cada base é confirmada duplamente, por duas
rodadas de primers, assegurando uma altíssima qualidade e
confiabilidade nos nucleotídeos lidos.

Atualmente, a Applied Biosystems utiliza uma abordagem


melhorada desse método, utilizando um segundo tipo de son-
da, onda três bases são confirmadas durante os ciclos de liga-
ção, aumentando massivamente a qualidade e confiabilidade
da leitura (Figura 30).

O número de bases lidas pelo SOLiD é de 35 a 75 pb e


cada corrida produz cerca de 20 Gb de dados, durante 7 dias
de processamento.

Figura 30 – Exemplo das etapas de sequenciamento


usando a plataforma SOLiD da Applied Biosystems, ilustrando
a identificação da sequência usando o código de duas e três
bases. Modificado de http://www.lifetechnologies.com
247
Biologia Molecular

10.3.4 Sequenciamento por semicondutores de íons

O sequenciador Ion Torrent da Life Tecnology inaugurou


um novo e diferenciado método de sequenciamento de alto
desempenho: o sequenciamento por semicondutores de íons.
Essa tecnologia difere das demais por não usar nucleotídeos
modificados ou sistemas ópticos. O método baseia-se na de-
tecção de íons de hidrogênio (prótons H+) que são liberados
durante a polimerização do DNA, no processo de síntese da
nova fita de DNA complementar à fita molde pela DNA polime-
rase.

A biblioteca de fragmentos é preparada de forma seme-


lhante a outros métodos de sequenciamento de alto desempe-
nho, onde os fragmentos são ligados à adaptadores e a am-
plificação inicial também é por meio de PCR em emulsão com
beads magnéticas.

As beads carregando os fragmentos de DNA são dis-


tribuídas em 1,2 milhões de poços de 3,5 μm de diâme-
tro que cobrem um pequeno chip contendo sensores que
detectam a alteração de pH provocada pela liberação de
um íon hidrogênio na incorporação de um único nucleo-
tídeo pela DNA polimerase. Para isso, o chip é subme-
tido a fluxos dos quatro diferentes nucleotídeos, um de
cada vez, seguidos da remoção dos nucleotídeos não
incorporados em cada fluxo. A alteração de pH dentro
do poço gera um sinal elétrico indicando que a base,
durante o fluxo de nucleotídeo em questão, assinalando
a sequência do DNA (Figura 31).

248
Biologia Molecular

Figura 31 – Etapas do sequenciamento por semiconduto-


res de íons, usando a plataforma Ion Torrent da Life Tecno-
logy. Modificado de http://en.wikipedia.org/wiki/Ion_semicon-
ductor_sequencing3

3 Imagem sob a licença GNU Free Documentation License. (Texto completo disponível em: http://www.
gnu.org/licenses/fdl-1.3.txt)

249
Biologia Molecular

Atualmente, a Life tecnology lançou um novo sequencia-


dor baseado nessa tecnologia capaz de ler cerca de 400 nu-
cleotídeos por corrida e pode gerar aproximadamente 1 bilhão
de bases (1Gb), mas em apenas 4,5 horas de processamento
e utilizando um chip que custa 99 dólares.

10.4 APLICAÇÕES

Atualmente existem diversas técnicas de sequenciamento


de DNA, e mesmo o método de Sanger, com seus quase 40
anos de existência, ainda possui diversas aplicações. A medi-
da que os sequenciadores de nova geração evoluem, novas
aplicações surgem e outras se consolidam.

Podemos listar as principais aplicações biológicas de acor-


do com a plataforma de sequenciamento:

Método de Sanger – Sequenciamento automatizado


Sequenciamento de novo4 de genomas (de pequena esca-
la); resequenciamento de regiões de interesse, como genes;
busca de SNPs em genes ou regiões específicas do genoma;
sequenciamento de transcritos inteiros; sequenciamento de
pequena escala como um todo.

Pirosequenciamento paralelizado
Sequenciamento de novo de genomas de larga escala,
organismos complexos ou de pequenos genomas; resequen-
ciamento genomas ou alvos específicos; busca de SNPs em
genomas; sequenciamento de transcriptomas inteiros de orga-
nismos complexos; captura de exomas inteiros ou de grandes
regiões alvo; sequenciamento de metagenomas; descoberta
de novos genes; descoberta de patógenos.
4 Sequenciamento de novo refere-se ao sequenciamento de genomas desconhecidos, ou seja, sequen-
ciado pela primeira vez.

250
Biologia Molecular

Sequenciamento por terminadores reversíveis


Sequenciamento de novo de genomas de larga escala;
resequenciamento genomas ou alvos específicos; busca de
SNPs em genomas; identificação de variação do número de
cópias; rearranjos cromossômicos; sequenciamento de trans-
criptomas; captura de exomas ou de regiões alvo; sequencia-
mento de metagenomas; descoberta de novos genes; análise
de regulação gênica.

Sequenciamento por ligação


Sequenciamento de novo de genomas de larga escala;
resequenciamento de genomas ou alvos específicos; busca
de SNPs em genomas; sequenciamento de transcriptomas;
captura de exomas ou de regiões alvo; análise de small RNA;
análise de metilação do DNA; ChIP-Seq5 .

Sequenciamento por semicondutores de íons


Sequenciamento de novo ou resequenciamento de pe-
quenos genomas, como microrganismos, vírus ou genoma
mitocondrial; sequenciamento de regiões alvo; busca de
SNPs; validação de genomas ou exomas inteiros realiza-
dos por outras plataformas; sequenciamento de produtos
de PCR de múltiplas amostras; ChIP-Seq; estudos de small
RNA e expressão gênica; geração de sequências genéticas
iniciais em sequenciamento de novo de genomas de gran-
de escala.

Provavelmente faltarão várias aplicações na nossa lista


para as diversas técnicas de sequenciamento discutidas nes-
se texto, mas isso já é esperado para essa área da ciência que
passa por uma intensa e constante evolução.

5 ChIP-Seq é uma método usado para determinar a localização de sítios de ligação de proteínas de
interesse no genoma.

251
Biologia Molecular

10.5 GUIA DE ESTUDO

1- O que é sequenciamento de DNA e qual importância do


mesmo para as diversas áreas do conhecimento científico?

2- O sequenciamento revolucionou e revoluciona o co-


nhecimento adquirido sobre o papel dos ácidos nucléicos nos
organismos vivos. Neste processo muitos métodos foram de-
senvolvidos e outros tantos se encontram em desenvolvimen-
to para a elucidação das sequencias de DNA. Enumere as
técnicas de sequenciamento desenvolvidos com este fim.

3- Em que se baseia o princípio da técnica de sequencia-


mento criada por Sanger? Relacione as vantagens e desvan-
tagens desta técnica.

4- Muitas modificações foram introduzidas ao método de


Sanger com o objetivo de obter maior eficiência no sequencia-
mento de DNA. Cite estas modificações e relacione as vanta-
gens adquiridas pelas mesmas.

5- Explique o método de sequenciamento de Maxam e Gil-


bert, relacionando as vantagens e desvantagens deste método.

6- Diversas técnicas de sequenciamento foram desenvol-


vidas para a elucidação das sequências de DNA. Você pode-
ria descrever as principais mudanças entre os métodos tradi-
cionais e os de nova geração?

252
Biologia Molecular

7- As técnicas de sequenciamento de DNA por sua impor-


tância incrementaram as pesquisas em biologia molecular nas
últimas décadas, gerando um aumento na demanda e conse-
quente necessidade em reduzir os custos em sequenciamen-
to. Deste modo surgiram as tecnologias de sequenciamento
de nova geração. Quais são estas técnicas?

8- Faça uma tabela comparativa constando as técnicas de


sequenciamento de nova geração, o princípio de cada técnica
e relacione as vantagens e desvantagens de cada uma.

253
Biologia Molecular

254
Biologia Molecular

METAGENÔMICA

Alexandre Morais do Amaral


Embrapa, Secretaria de Relações Internacionais,
Parque Estação Biológica - PqEB s/n°. Brasília, DF - Brasil -
e-mail: alexandre.amaral@bbsrc.ac.uk

Dario Abel Palmieri


Licenciado em Genética, Dr., Universidade Estadual Paulista
Julio de Mesquita Filho, Departamento de Ciências e Letras.
e-mail: darioap@assis.unesp.br

255
Biologia Molecular

256
Biologia Molecular

METAGENÔMICA

Alexandre Morais do Amaral


Dario Abel Palmieri

257
Biologia Molecular

258
Biologia Molecular

SUMÁRIO

CAPÍTULO 11. METAGENÔMICA



11.1. INTRODUÇÃO............................................................261
11.2. METAGENÔMICA FUNCIONAL.................................264
11.3. A CONSTRUÇÃO DA BIBLIOTECA METAGENÔMICA.......265 

259
Biologia Molecular

260
Biologia Molecular

11.1 INTRODUÇÃO

O primeiro registro da expressão “metagenômica” ocorreu


no final da década de 1990 (Handelsman et al., 1998) e sua
origem significa “além do genoma” (meta em grego indica,
neste contexto, “além”), enquanto sua aplicação na biologia
significa basicamente a análise genômica de organismos não-
cultivados (Schloss e Handelsman, 2004). A técnica consis-
te na análise biológica de microrganismos que ainda não são
cultivados mas que estão presentes em grande diversidade
de nichos, desde solos, ambientes aquáticos e biofilmes ate
órgãos humanos e vegetais, entre outros. Através da monta-
gem de “bibliotecas metagenômicas”, tais organismos podem
ter o nível de informação biológica aumentada enormemente
(Williamson et al., 2008; Schloss e Handelsman, 2008; Liles et
al., 2008).

A estratégia é baseada na análise genética global de uma


determinada situação (ambiente) onde se encontra um conjun-
to de microrganismos. Frequentemente, tal ambiente está as-
sociado a alguma característica de particular interesse, pouco
frequente ou bastante singular, ou em localizações extremas
do planeta, como no sedimento marinho do fundo do mar Bál-
tico (Hardeman e Sjoling, 2007), no fundo do mar na região
oriental do Mediterrâneo, no ambiente hiper-salino, com mais
de 3000 metros de profundidade, alta pressão, baixo teor de
oxigênio e ausência de luz (Ferrer et al., 2005), ou em rios com
altíssimos teores de metais pesados e extremamente baixo
teor de pH (Amaral Zettler et al., 2002), no rúmen de bovinos
(Hess et al., 2011), no intestino de insetos (Guan et al., 2007;
Duan et al., 2009), entre outros.

De forma geral, como primeiro passo para a construção de


uma biblioteca metagenômica é realizada uma amostragem
“massal” de material (solo, água, tecido, etc.) e a separação
261
Biologia Molecular

entre o meio e os microrganismos; em seguida, é realizada


a extração de DNA total (na verdade, um “bulk” de DNA), o
qual é fragmentado e então se produz uma biblioteca de
DNA (pequenos e/ou grandes fragmentos chamados de in-
sertos) (Frias-Lopez et al., 2008; Schloss e Handelsman,
2008). Esta biblioteca pode ser submetida a um screening
para identificação de uma determinada situação de inte-
resse (busca por função), como a busca por operons de
função específica, por exemplo, para uso industrial ou far-
macêutico (Broderick et al., 2006; Lefevre et al., 2008), ou
então sequenciada para posterior busca por contigs e mon-
tagem de grandes sequências ou mesmo para o sequen-
ciamento de regiões que indiquem a origem e consequen-
te variabilidade naquele nicho. Normalmente, a sequência
mais comumente utilizada para inferir sobre tal variabilida-
de é o fragmento 16S. A partir daí podem ser identificadas
sequências complementares a regiões já catalogadas (ge-
ralmente o RNAr 16S, utilizado como “âncora filogenética”)
e, com isso, o enriquecimento da informação genômica de
determinado organismo.

Mais recentemente, com o advento com novas técnicas


de sequenciamento, genomas inteiros tem sido completa-
mente sequenciados a partir da combinação da metagenô-
mica e de tecnologias como a da polimerase de DNA phi29.
Esta abordagem permite a geração (amplificação) de mate-
rial de DNA suficiente para o sequenciamento partindo-se de
material original correspondente a mil, cem ou mesmo uma
célula apenas (Hongoh e Toyoda, 2011). Cabe lembrar que,
normalmente, técnicas de sequenciamento necessitam aci-
ma de 1010 células para fornecimento de quantidade adequa-
da de DNA.

De forma geral, no campo da microbiologia, o primeiro pro-


cedimento para que um microrganismo possa ser estudado é
262
Biologia Molecular

o seu isolamento em meio de cultivo; entretanto, acredita-se


que atualmente menos de 1% de todos os microrganismos
presentes nos diferentes ambientes terrestres já tenham sido
cultivados. Estima-se, por exemplo, que há mais de 5000 es-
pécies de espécies microbianas por grama de solo, no entanto
apenas uma parcela mínima (0,1-10%) é cultivada (Schloss e
Handelsman, 2007).

Embora a taxa ou espécie de alguns destes microrganis-


mos possa ser identificada através das informações genéticas
contidas na região que codifica para o RNAr ribossomal 16S
(análise filogenética), poucos dados para a abordagem funcio-
nal dos demais genes presentes no organismo podem ser ex-
plorados apenas a partir deste gene (Schmeisser et al., 2007).

A partir do DNA genômico de picoplanctons clonado


em bibliotecas de grandes insertos BAC (bacterial artificial
chromossome), e selecionado para sequências que conti-
nham o gene para RNAr de uma bactéria específica, foi possí-
vel a identificação de um clone BAC de 140 kb que continha o
gene para RNAr previamente catalogado e ORFs adjacentes
a esta região com alta homologia para bacteriorhodopsinas,
proteínas adaptadas para aproveitar energia solar através de
mecanismo inédito, o que foi comprovado com estudos poste-
riores (Béjà et al., 2000a, 2000b).

Em estudo com biblioteca metagenômica de solo, um clo-


ne BAC permitiu a identificação do operon RNAr completo de
um membro da divisão Acidobacterium, grupo que até então
não foi cultivado, e outras 20 ORFs adjacentes, que incluem
genes teoricamente envolvidos com divisão celular, biossín-
tese de ácido fólico, metabolismo de substratos, absorção de
aminoácidos, reparo de DNA e regulação de transcrição, entre
outros (Liles et al., 2003).

263
Biologia Molecular

Recentemente, o genoma completo da bactéria Candidatus


asiaticus, causadora do HLB, doença transmitida por inseto e
causadora dos principais prejuízos econômicos para a indústria
de citros nos últimos anos, foi completamente sequenciada a
partir da técnica de metagenômica, utilizando-se DNA extraído
de apenas um inseto (Duan et al., 2009; Tyler et al., 2009).

11.2 METAGENÔMICA FUNCIONAL

Atualmente, devido aos avanços alcançados nos últimos


anos e formação de bibliotecas metagenômicas, grande ên-
fase tem sido dada na exploração destes dados, para o qual
há o termo “metagenômica funcional”, que significa a caracte-
rização de elementos críticos do microbioma (ambiente espe-
cífico habitado por populações de microorganismos) que mais
influenciam o funcionamento do hospedeiro e, portanto, sua
saúde (Li et al., 2008). Os mesmos autores analisaram biblio-
tecas formadas a partir de sequências de microrganismos pre-
sentes no trato intestinal de seres humanos e puderam consi-
derar várias inferências do ponto de vista terapêutico.

Em suma, a metagenômica funcional visa combinar dife-


rentes estratégicas como a busca através de cultivo e avalia-
ção in silico baseado em técnicas apropriadas de seleção e
avaliação massal (screening) focada em mecanismo de inte-
resse. Naturalmente, a bactéria Escherichia coli e o principal
instrumento biológico para a expressão heteróloga em siste-
mas de busca e análise funcional de genes com característi-
cas fenológicas de interesse em bibliotecas metagenômicas
(Uchiyama e Miyazaki, 2009; Taupp et al., 2011).

Exemplos de busca funcional em bibliotecas metagenômi-


cas podem ser descritos em estudos que busquem enzimas
com atividade hidrolítica na microbiota do rúmen de bovinos
(Ferrer et al, 2007), enzimas que degradem compostos quími-
264
Biologia Molecular

cos tóxicos em solos (González-Pastor e Mirete, 2009), entre


tantos outros.

Para a caracterização de uma biblioteca metagenômica de


microrganismos de solo formada com cosmídeos, a análise de
microarranjos foi desenvolvida através da hibridação entre DNA
de insertos desta biblioteca (produtos de PCR com cerca de 1
kb) e DNA de referência (conjunto controle de DNA ribossomal
16S), o que permitiu auxiliar na seleção de clones através de
sequências parcialmente já descritas (Sebat et al., 2003).

Outro aspecto que poderia ser abordado como perspectiva


é o aumento de informação, a partir dos dados gerados, rela-
cionada com a incapacidade da bactéria em crescer em meios
de cultivo convencionais. Uma possibilidade é a identificação
de genes que codificam para proteínas relacionadas a ciclo me-
tabólico pouco conhecido e que, por isso, poderiam restringir a
capacidade de adaptação da bactéria. Cabe lembrar que a bac-
téria habita dois hospedeiros bastante distintos (planta e inse-
to), o que indica uma capacidade adaptativa bastante particular
e geralmente associada a genomas de tamanho consideravel-
mente reduzido (Rio et al., 2003; van Ham et al., 2003).

Pode-se supor que bibliotecas metagenômicas geradas a


partir de clonagem de grandes insertos de bactérias extraídas
de amostras de interesse, e selecionadas a partir de contigs
“ancorados” na sequência dos genes RNAr 16S, possam au-
mentar consideravelmente o volume de informação genética
do agente causador da doença.

11.3 A CONSTRUÇÃO DA BIBLIOTECA METAGENÔMICA

A construção das bibliotecas para análise genômica é ini-


ciada pelo isolamento de DNA de alta qualidade de tal maneira
que possa ser utilizado para clonagem. Ela se divide em al-
265
Biologia Molecular

guns passos, que são caracterizados pela finalidade com que


é construída (Figuras 32 e 33).

O isolamento de DNA na formação de bibliotecas metage-


nômicas é particularmente difícil pois envolve material de ori-
gens muitas vezes incomum, como parte de tecidos animais,
amostras originadas de ambientes atípicos como solos de re-
giões extremas (como por exemplo muito salino, arenoso, ra-
dioativo, pH muito alcalino, etc....). Tais peculiaridades levam
à necessidade de desenvolvimento de protocolos específicos,
como aqueles já identificados para rúmen de búfalo (Duan et
al., 2009), solo da Antártica (Heath et al, 2009), sedimentos do
fundo do mar (Hardeman e Sjoling, 2007), solos (Waschko-
witz et al., 2009; Mettel et al., 2010), entre outros.

Basicamente, a formação da biblioteca se baseia no iso-


lamento do DNA da amostra desejada, em seguida, quando
este material genético está “limpo”, ou seja, sem contaminan-
tes (detritos) do material de origem, ele pode ser separado por
tamanho ou digerido enzimaticamente (enzimas de restrição)
e simplesmente clonado em vetor que seja adequado para os
tamanhos que se deseja clonar (plasmídeos para pequenos
fragmentos e fosmídeos e clones BAC para fragmentos gran-
des). Alternativamente, os pequenos fragmentos podem ser
encaminhados para sequenciamento, dependendo da técnica
de interesse. Caso haja a opção por clonagem, os clones po-
dem ser submetidos a método de screening massal com téc-
nica de interesse específico, normalmente em placas. Caso
haja identificação de clone de fenótipo de interesse específi-
co, o clone selecionado é finalmente submetido ao sequencia-
mento.

266
Biologia Molecular

Figura 32 - Esquema de formação de biblioteca metagenômi-


ca a partir de material de onde há a sequência especifica para
o organismo de interesse (ex. Sequência 16S).

267
Biologia Molecular

Figura 33 - Esquema de formação de biblioteca metagenômi-


ca na busca por característica de interesse específico (busca
por função).

268
Biologia Molecular

BIOINFORMÁTICA
Luciano Takeshi Kishi
Doutor em Microbiologia Agropecuária, especialista em
Bioinformática, Centro de Citricultura Sylvio Moreira – IAC.
e-mail: luciano.kishi@gmail.com

Mauricio Egideo Cantao


Doutor em Bioinformática, Dr., Laboratório Nacional de
Computação Científica - LNCC, Laboratório de Bioinformática.
e-mail: cantao@lncc.br

Rodrigo Matheus Pereira


Doutor em Microbiologia Agropecuária, especialista em
Bioinformática, Universidade Federal da Grande Dourados,
Faculdade de Ciências Biológicas e Ambientais.
e-mail:rodrigopereira@ufgd.edu.br

Luciano Carlos da Maia


Engenheiro Agrônomo, Doutor em Melhoramento
Vegetal - Universidade Federal de Pelotas
Faculdade de Agronomia Eliseu Maciel -
Departamento de Fitotecnia
Centro de Genômica e Fitomelhoramento.
e-mail: lucianoc.maia@gmail.com

Dario Abel Palmieri


Licenciado em Genética, Dr., Universidade Estadual Paulista
Julio de Mesquita Filho, Departamento de Ciências e Letras.
e-mail: darioap@assis.unesp.br

269
Biologia Molecular

270
Biologia Molecular

BIOINFORMÁTICA

Luciano Takeshi Kishi


Mauricio Egideo Cantao
Rodrigo Matheus Pereira
Luciano Carlos da Maia
Dario Abel Palmieri

271
Biologia Molecular

272
Biologia Molecular

SUMÁRIO

CAPÍTULO 12. BIOINFORMÁTICA

12.1. INTRODUÇÃO...........................................................275
12.2. OBTENÇÃO DOS DADOS GENÔMICOS..................276
12.3 MONTAGEM DO GENOMA........................................278
12.4 MONTAGEM POR REFERÊNCIA...............................284
12.5 BANCO DE DADOS BIOLÓGICOS ...........................287
12.6 ALINHAMENTO DE SEQUÊNCIAS.............................289
12.7 ALINHAMENTO LOCAL..............................................292
12.8 ALINHAMENTO GLOBAL............................................295
12.9 SISTEMA OPERACIONAL..........................................296
12.10 LINUX........................................................................297
12.11 NÚCLEO....................................................................298
12.12 PROCESSO..............................................................298
12.13 SISTEMA DE ARQUIVOS E ESTRUTURA DE
DIRETÓRIOS............................................................301
12.14 COMANDOS LINUX..................................................303
12.15 LINGUAGEM PERL..................................................304
12.16 BIOPERL...................................................................305
12.17 MEU PRIMEIRO PROGRAMA..................................305
12.18 A BIOINFORMÁTICA E A INTERNET........................307

273
Biologia Molecular

274
Biologia Molecular

12.1 INTRODUÇÃO

A área conhecida como bioinformática, usa os conhe-


cimentos adquiridos principalmente em biologia, ciência da
computação e matemática para serem aplicados na solução
de problemas biológicos.

Com os avanços das técnicas de sequenciamento de


DNA, um grande volume de dados foi disponibilizado aos
pesquisadores que necessitam agora de ferramentas com-
putacionais que automatizem os sistemas de processamento
de dados e organizem os resultados para a compreensão
humana.

No Brasil, a partir de 2000, o campo da bioinformática


teve o seu papel fundamental e crucial para o sucesso no
sequenciamento da primeira bactéria fitopatogênica, a
Xylella fastidiosa.

A princípio a bioinformática é vista como parte nos servi-


ços de análises de DNA, RNA ou proteínas, mas o coração da
bioinformática envolve não só o entendimento, mas o desen-
volvimento de técnicas computacionais na área de reconhe-
cimento de padrões, mineração de dados, aprendizagem de
máquina, banco de dados, para que pesquisadores possam
aplicar estes recursos em seus mais diferentes projetos, sen-
do eles de análises de sequência, estudos gênicos, proteômi-
ca, genômica, metabolômica, transcriptômica, metagenômica,
entre outras.

A bioinformática é uma área tão ampla que seria neces-


sário mais de um livro só para descrever as diversas técni-
cas e suas aplicações. Porém, para não deixar de falar sobre
bioinformátca, procuramos descrever nesse capítulo um breve
resumo de algumas das áreas mais empregadas.
275
Biologia Molecular

12.2 OBTENÇÃO DOS DADOS GENÔMICOS

O sequenciamento de genoma é o processo que determi-


na a ordem das sequências de nucleotídeos ao longo da molé-
cula de DNA de um organismo. Identificar todas as bases que
compõem o genoma é importante para aprender mais sobre o
organismo e pode ajudar os cientistas a entender como os ge-
nes e as células funcionam. O sequenciamento pode ser apli-
cado em: diagnósticos de doenças, genética forense, teste de
paternidade, comparação de genomas, estudos moleculares,
entre outros. Existem duas técnicas que os cientistas usam
para realizar o sequenciamento, sendo elas sequenciamento
hierárquico e o sequenciamento completo por fragmentos ale-
atórios (Whole Genome Shotgun Sequencing).

A estratégia de sequenciamento hierárquico é geralmente


aplicada no sequenciamento de grandes genomas, e uma das
primeiras etapas é a construção do mapa físico do genoma
para auxiliar no momento da montagem. No segundo passo,
grandes fragmentos do DNA genômico são clonados em veto-
res específicos, tais como BACs e YACs. O DNA desses clo-
nes serão fragmentados novamente em pedaços menores de
tamanho variando de 1 a 10 kb, inseridos em vetores conheci-
dos como plasmídeos e submetido ao processo de sequencia-
mento. Entretanto, o sequenciamento pela técnica de shotgun
também chamado de WGS (Whole Genome Shotgun) é muito
mais rápido e dispensa a fase de mapeamento físico, uma
etapa difícil e demorada de ser realizada. Nesta abordagem,
o DNA genômico é fragmentado aleatoriamente em tamanho
que varia de 1 a 10 kb, inseridos em plasmídeos para a cons-
trução de bibliotecas e sequenciados. Além das bibliotecas
de plasmídeos, bibliotecas de cosmídeos e/ou fosmídeos con-
tendo fragmentos maiores, em torno de 40 kb são construí-
dos e sequenciados para auxiliar no processo de montagem
e fechamento do genoma (Teixeira e Araújo, 2006). Com o
276
Biologia Molecular

sequenciamento das extremidades de milhares de clones, por


meio de ferramentas específicas de montagem é possível re-
construir com muito esforço e processamento o DNA do geno-
ma completo in silico.

Em ambos os métodos, computadores são usados para


juntar os fragmentos sequenciados e restaurar a sequência
original do genoma. O Projeto Genoma Humano que sequen-
ciou todas as bases no DNA humano, utilizou ambos os mé-
todos e combinou os dados para gerar a sequência final do
genoma (Venter et al., 2001).

Uma abordagem alternativa ao sequenciamento completo


do DNA genômico é o sequenciamento do produto gênico que
está sendo expresso pela célula, chamado de transcriptoma.
Em projetos de transcriptoma o sequenciamento ocorre nas
sequências dos genes que estão sendo expressos no momen-
to da extração do RNA mensageiro (RNAm). Sendo assim, o
perfil transcricional pode variar dependendo da situação, por
exemplo, uma determinada fase do ciclo celular, estado fisio-
lógico, estímulos físicos, químicos, biológicos, doenças ou
condição experimental.

A molécula de RNAm é muito instável fora da célula, e


por esse motivo, primeiro é necessário convertê-los em se-
quência de dupla fita, chamado de DNA complementar (cDNA).
O cDNA é muito mais estável e foi produzido a partir de uma
sequência de RNAm no qual os íntrons já foram removidos.
Uma vez convertido em DNA de dupla fita, esses fragmentos
são clonados para serem posteriormente sequenciados. Em
muitos projetos de transcriptoma o sequenciamento ocorre
apenas nas extremidades dos clones, e os produtos gera-
dos são denominados de etiquetas de sequências expressas
(Expressed Sequence Tag - EST). Os ESTs são pequenos pe-
daços de sequência de DNA com tamanho em torno de 200
277
Biologia Molecular

a 500 nucleotídeos gerados pelo sequenciamento de uma ou


ambas as pontas dos genes expressos. Essas sequências são
úteis para ajudar a identificar genes desconhecidos e mapear
suas posições ao longo do genoma.

Uma vantagem dos projetos de transcriptoma é o sequen-


ciamento apenas das regiões que codificam proteínas. Este
tipo de projeto é muito abordado em genomas eucariotos, cuja
sequências intergênicas e íntrons constituem grande parte do
genoma. O sequenciamento apenas dos genes ajuda a re-
duzir os custos do projeto, mas por outro lado, genes pou-
co expressos dificilmente serão sequenciados, e aqueles que
não foram transcritos durante as condições experimentais em
estudo não serão identificados.

12.3 MONTAGEM DO GENOMA

Todo método de sequenciamento, sendo ele de primeira


ou segunda geração de sequenciadores, produz milhares de
fragmentos de DNA. O tamanho dos fragmentos pode variar
entre 25 a 100 bases, como é o caso dos reads gerados pelos
sequenciadores das plataformas Solexa (Illumina) e Solid (Ap-
plied Biosystems), ou mesmo 300-500 bases pelo sequencia-
dor Roche 454 (454 Life Sciences) ou chegar até 1000 bases
utilizando o método de Sanger em sequenciadores de primei-
ra geração (Shendure e Ji, 2008). Não importa de qual méto-
do ou plataforma que se produziu o fragmento de DNA, cada
sequência contém pouca informação a respeito do organismo
ao qual foi originado.

Para sequenciar completamente um genoma ou regiões do


DNA que é longo demais para o sequenciamento direto, uma
alternativa é usar a abordagem de shotgun. Os fragmentos
sequenciados são chamados de reads e contém informação
de apenas uma pequena região do DNA original. Com frag-
278
Biologia Molecular

mentos curtos, torna-se necessário obter leituras maiores para


poder desenvolver estudos seguros na sequência do genoma.
Uma forma de estender a região do genoma é alinhar os
reads produzidos contra os demais sequenciados. Para isso,
o uso de ferramentas computacionais passa a ser indispensá-
vel para o processo que chamamos de montagem do genoma.

Uma vez obtida as sequências, é importante definir


qual a melhor ferramenta e estratégia para fazer a monta-
gem do genoma. Se o sequenciamento veio pelo método
de Sanger, reads longos serão gerados, mas em contrapar-
tida, um número menor de sequências será produzido por
corrida. Enquanto o sequenciador 454 gera em torno de
um milhão de reads/corrida, um sequenciador de primeira
geração, ABI 3130 chega a produzir algumas centenas de
reads/dia. O método de Sanger tem suas vantagens, como
uma menor taxa de erro por base, leitura mais longa que
auxilia na solução de problemas em regiões repetidas do
genoma durante a montagem, não tem problema de ho-
mopolímeros, que é o sequenciamento de bases idênticas
ao longo do DNA, mas como desvantagem, o método de
Sanger apresenta um maior custo por base sequenciada,
menor número de sequência por corrida, dificuldade em
sequenciar regiões ricas em bases GC, além da necessi-
dade de clonar os fragmentos em vetores para o sequen-
ciamento. Para o processo de montagem, uma ferramenta
muito utilizada nos genomas sequenciados pelo método de
Sanger é o pacote Phred/Phrap/Consed (Nickerson et al.,
1997), desenvolvidos por Phil Green, Brent Ewing e Da-
vid Gordon na Universidade de Washington. Os programas
Phred e Phrap são utilizados no processo de montagem do
genoma, já o programa Consed é um programa de visua-
lização das montagens, sendo todos livres para uso não
comercial. Para obtê-los, entre no endereço web http://
www.phrap.org e segue as instruções contidas no site. O
279
Biologia Molecular

programa Consed não precisa compilar, isto é, você baixa


a versão binária específica para sua plataforma, sendo ele,
Linux, Unix, 32 ou 64 bits. Já os programas Phred e Phrap
serão necessários compilar, para isso, é desejado que o
usuário tenha alguns conhecimentos básicos de Linux/Unix
para deixá-los instalados e configurados corretamente.

Para o método de Sanger, antes de aplicar qualquer pro-


grama de montagem, primeiro é necessário converter os ele-
troferogramas produzidos pelos sequenciadores em arquivos
contendo as bases e as qualidades para cada uma delas. Este
processo de conversão é chamado de base calling e o pro-
grama Phred é um dos mais utilizados para isso. O progra-
ma Phred lê os eletroferogramas gerados pelo sequenciador,
identifica os nucleotídeos lidos e atribui um valor de qualidade
para cada base. O valor de qualidade gerado pelo programa
Phred tornou-se tão popular que é chamado de “qualidade
Phred” e está relacionado com a probabilidade de confiança
para cada base lida. O valor 20 atribuído para um nucleotídeo
significa uma probabilidade de 1 erro para cada 100 bases,
enquanto que qualidade 30 significa 1 erro para cada 1000
bases e assim sucessivamente de acordo com a fórmula Q =
-10 log10(P), onde Q é a qualidade e P é a probabilidade de
erro da base (Ewing e Green, 1998).

Para o processo de montagem pelo método de Sanger,


primeiro verifica se as sequências contêm bases de vetores
utilizados no processo de clonagem dos fragmentos e subs-
titui pela letra X, processo conhecido como mascaramento.
Dessa forma, o programa de montagem desconsidera es-
sas bases quando faz o alinhamento contra as sequências
do genoma. Para as plataformas 454, Solid e Solexa não
são necessários mascarar as sequências de vetor, uma vez
que nestes métodos os fragmentos não foram clonados. É
comum também antes de iniciar o processo de montagem,
280
Biologia Molecular

retirar os reads que apresentam baixa qualidade Phred ao


longo de sua sequência. Um exemplo é retirar todos os
reads que não possuam uma região com no mínimo 150
bases com qualidade Phred ≥ 20 para sequências de San-
ger e 454, enquanto para Solid e Solexa é comum aplicar
programas de correção de erro de sequenciamento, ou se
desejar, também é possível excluir as bases das extremi-
dades dos reads que apresentam baixa qualidade. Adotan-
do este procedimento, aumenta a qualidade da montagem,
diminui o número de sequências para serem analisadas,
consequentemente, diminuindo o tempo de processamento
e o espaço alocado em memória. Um programa muito utili-
zado para mascarar as sequências de vetor e retirar reads
de baixa qualidade é o programa Lucy (Chou e Holmes,
2001). Este programa possui versão para Linux, Windows,
Mac OS X e pode ser baixado gratuitamente no endereço
http://lucy.sourceforge.net.

No processo de montagem de genoma conhecido como


de novo, no qual a montagem dos reads ocorre sem nenhum
auxílio de genomas de referência relacionados, os algoritmos
alinham as sequências uma contra as outras para identifi-
car regiões de similaridade. A idéia é alinhar a extremidade
de um fragmento com outra sequência, e assim, aos poucos,
estender as sequências em fragmentos maiores, chamados
de contigs. Os contigs podem conter dezenas, centenas ou
milhares de reads dentro, dependendo do tamanho e de sua
cobertura. O processo de montagem alinhando as sequências
só é eficaz devido ao método aleatório de quebra dos DNA,
que possibilita a redundância entre os fragmentos e permite
assim que as sequências sejam alinhadas umas às outras. A
figura 34 mostra o alinhamento dos reads estendendo a região
sequenciada e a figura 35 a sequência de um contig com os
reads montados dentro dele.

281
Biologia Molecular

Figura 34 - O alinhamento dos reads pelas extremidades pos-


sibilita a sobreposição das sequências e sua extensão. Com a
sobreposição dos reads é possível gerar uma sequência con-
senso da região.

Sequência consenso

Figura 35 -Nesta figura é possível ver um contig (sequência


consenso) formado pela sobreposição de diversos reads ao
longo de sua sequência.

Além do programa Phrap para montagem de genomas de


bactérias, eucariotos, outros programas muito utilizados para
a montagem de novo são:

Arachne - Programa desenvolvido no Broad Institute of


MIT, amplamente utilizada em projetos genoma de bactérias e
eucariotos para montagem de sequências geradas por Sanger
(http://www.broad.mit.edu/wga).
282
Biologia Molecular

Celera Assembler - Programa desenvolvido na Celera


Genomics usado para a montagem de genoma de bactérias
e eucariotos. Este programa foi utilizado para a montagem do
genoma humano pela Celera Genomics. Celera Assembler
pode ser usado com sequências geradas por Sanger, 454 e
Illumina (http://wgs-assembler.sourceforge.net).

Mira – Um programa de montagem de genoma de bacté-


rias, eucariotos e ESTs. Ele suporta sequências geradas por
Sanger, 454 e Illumina (http://sourceforge.net/projects/mira-
assembler).

Newbler – O programa Newbler é desenvolvido pela pró-


pria Roche® e distribuído junto com o sequenciador 454. Ele é
recomendado para montagem de genomas de bactérias, ESTs
e pequenos genomas de eucarioto sequenciado pela própria
plataforma 454 (http://www.454.com)

CAP3 – Programa muito utilizado em montagem de sequ-


ências de ESTs em projetos de transcriptomas. Ele também
pode ser utilizado na montagem de genomas pelo método de
Sanger (http://seq.cs.iastate.edu).

Velvet – Velvet faz montagem de novo de genomas e foi


projetado para sequências curtas, mas também permite a adi-
ção de sequências de outras plataformas, como Sanger e 454
(http://www.ebi.ac.uk/~zerbino/velvet).

AbySS – Montador de genomas pelo método de novo de-


senvolvido para sequências curtas. Este montador está pre-
parado para executar em várias máquinas ao mesmo tempo
através de processamento distribuído (http://www.bcgsc.ca/
platform/bioinfo/software/abyss).

283
Biologia Molecular

12.4 MONTAGEM POR REFERÊNCIA

Para fazer a montagem de um genoma, duas formas po-


dem ser adotadas, sendo elas, a montagem de novo, ou por
referência. O método de novo é o mais tradicional de montagem
de genomas, e para isso, as sequências são alinhadas uma
contra as outras estendendo em contigs de modo a usar so-
mente reads produzidos pelo projeto sem o auxílio de nenhum
genoma já sequenciado. Outra forma de fazer a montagem é
pelo uso de genoma de referência. Nesta abordagem, os reads
são mapeados contra um genoma já sequenciado que orienta
na montagem. Quando se faz uma montagem usando referên-
cia, o genoma gerado é similar, mas não será necessariamente
igual ao da sequência passada como referência. Em relação
ao processamento, o custo computacional de se fazer este tipo
de montagem é bem menor, uma vez que as sequências não
serão alinhadas contra todos os reads produzidos, mas apenas
com a sequência passada como referência, reduzindo consi-
deravelmente o tempo necessário da montagem. Então por-
que fazer a montagem pelo método de novo se é mais “fácil”
e menos custoso computacionalmente fazer a montagem por
meio de um genoma usando referência? Bom, são poucos os
organismos que possuem um genoma com similaridade alta e
finalizado que estão disponíveis para serem usados neste pro-
cesso. Além disso, as partes do genoma que tem menores si-
milaridades ficarão com resultados comprometidos. Quando se
faz montagem por referência, nem todos os reads serão mape-
ados. Isso acontece quando regiões do genoma sequenciado
não existem no genoma de referência, ou mesmo regiões de
baixa similaridade impedem o alinhamento. Quando isso acon-
tece, aplica-se a montagem de novo aos reads não alinhados
para tentar montar regiões exclusivas do genoma alvo.

Montagem por referência é comumente usado em rese-


quenciamento, nos estudos de polimorfismos como na detec-
284
Biologia Molecular

ção de polimorfismo de nucleotídeo simples (Single Nucleotide


Polymorphism - SNPs), indels (inserção ou deleção de nu-
cleotídeos) entre indivíduos eucariotos, estirpes de bactérias
próximas, projetos de transcriptomas e são geralmente apli-
cados nos reads produzidos pelas tecnologias Solid e Sole-
xa. Estas tecnologias geram reads de comprimento pequeno
quando comparado com Sanger e 454, e podem variar de 25
a 100 bases. Os reads curtos dificultam o processo de mon-
tagem com ferramentas que utilizam a abordagem de novo,
uma vez que a região de sobreposição será menor e repetição
na sequência do genoma será praticamente impossível de ser
resolvido. Com fragmentos curtos, uma boa alternativa é fa-
zer a montagem do genoma baseando-se em uma referência.
Para sequências geradas pelos projetos de transcriptomas, é
comum mapear os reads contra um genoma montado. Esse
processo alinhará as sequências conta às regiões que foram
transcritas e deixará vazias (sem reads mapeados) as regiões
intergênicas e íntrons do genoma.

A seguir, uma lista de programas usados para mapear


reads contra sequências de genoma é apresentada:

GS Reference Mapper – programa desenvolvido pela pró-


pria Roche e usado para fazer montagem de genoma por refe-
rência (http://www.454.com).

CLC Workbench – Ferramenta comercial utilizada para


fazer montagem de novo ou por referência de reads gerados
por Sanger, 454, Solexa, Solid e Helicos. Tem versões para
os sistemas operacionais Windows, Mac OS X e Linux (http://
www.clcbio.com).

NextGENe – Ferramenta comercial desenvolvida para


fazer montagem de novo e por referência de sequências de
Solid, Solexa e 454 (http://softgenetics.com/NextGENe.html).
285
Biologia Molecular

MAQ – Mapeamento e montagem de sequências com


qualidade para sequências curtas geradas pelas plataformas
Solid e Solexa (http://sourceforge.net/projects/maq).

Bowtie – Mapeamento rápido de sequências curtas e com


eficiente uso de memória. Este programa chega a alinhar 25
milhões de reads por hora contra o genoma humano usando
uma estação de trabalho comum com 2 Gb de memória RAM.
Possui versão para Linux, Mac OS X e Windows (http://bowtie-
-bio.sourceforge.net).

BWA – Programa para alinhamento de sequências curtas


e longas contra genomas de referência (http://bio-bwa.source-
forge.net).

GenomeMapper – Ferramenta para mapear reads


curtos contra genomas de referência. Esta ferramenta
foi criada para o projeto “1001 Genomes Project – http://
www.1001genomes.org”, o download do software encon-
tra-se no mesmo site.

GMAP – Programa para mapear e alinhar sequências de


RNAm e EST contra genomas (http://research-pub.gene.com/
gmap).

Muitos são os programas disponíveis para mapear as se-


quências contra genomas já finalizados e a cada mês, novos
algoritmos de montagem são lançados ou aperfeiçoados. En-
tão o melhor a fazer é ler os artigos e estudar cada programa,
pois geralmente eles fazem comparações contra outras ferra-
mentas disponíveis. Uma alternativa, caso tenha muito tempo
disponível é testar cada programa em seu conjunto de reads,
analisar a saída de cada um e escolher o programa que me-
lhor gerou a montagem.

286
Biologia Molecular

12.5 BANCO DE DADOS BIOLÓGICOS

Devido ao aumento exponencial no número de dados obti-


dos em projetos genomas em consequência dos avanços nas
tecnologias de geração de dados de sequenciadores de segun-
da e terceira geração, torna-se imprescindível o uso de bancos
de dados para armazenar e organizar os dados produzidos.

Os dados armazenados são controlados e gerenciados por


meio de Sistemas Gerenciadores de Banco de Dados (SGBD)
no qual os mais conhecidos e utilizados em bioinformática são:
Mysql, PostgreeSQL, e Oracle.

Os bancos de dados biológicos contêm dados inter-rela-


cionados de informações e experimentos biológicos que estão
estruturados de forma específica para facilitar e agilizar nos
processos de consultas dos dados.

Em projetos genomas, informações como sequências de


DNA, proteínas, estruturas, funções biológicas são armazena-
dos de maneira que grandes quantidades de dados possam
ser utilizadas pelos pesquisadores para auxiliar na compreen-
são e no entendimento de um projeto.

Um dos bancos de dados biológicos mais conhecidos e


acessados é o NCBI (National Center for Biotechnology
Information - http://www.ncbi.nlm.nih.gov), contendo infor-
mações biomédicas e genômicas como sequências de DNA,
RNA, proteínas, estruturas, taxonomia e também diversas fer-
ramentas para análises de dados, sendo uma delas o BLAST
(Basic Local Alignment Search Tool), uma das ferramentas
mais utilizadas e conhecidas do NCBI.

O EMBL-EBI (European Bioinformatics Institute - http://


www.ebi.ac.uk) é um banco europeu de sequências de DNA
287
Biologia Molecular

e proteínas, cuja missão é disponibilizar sequências de pro-


teínas e informações funcionais. O banco Uniprot é com-
posto por 4 componentes: UniProtKB é o ponto central de
acessos para dados curados de proteínas, incluindo fun-
ção, classificação e referências, sendo este banco subdi-
vidido em 2 seções o UniProtKB/Swiss-Prot, banco anota-
do e revisado manualmente, e o UniProtKB/TrEMBL que
é anotado automaticamente, mas não revisado. O UniProt
Reference Clusters (UniRef) é um banco contendo clusters
de sequências do UniProtKB e dados selecionados do ar-
quivo UniProt Archive. O UniProt Archive (UniParc) é um
abrangente repositório de sequências e suas informações.
E por último o UniProt Metagenomic and Environmental
Sequences (UniMES), um repositório de dados metagenô-
micos e ambientais.

Vários outros bancos de dados biológicos estão dis-


poníveis na internet, cada um com sua particularidade,
como:

KEGG (http://www.genome.ad.jp/kegg), EcoCyc (http://


ecocyc.org), um banco de rotas metabólicas, funções de ge-
nes e proteínas.

INTERPRO (http://www.ebi.ac.uk/interpro), um banco de


domínio de proteínas, muito utilizado em processos de anota-
ção gênica.

PDB (http://www.rcsb.org/pdb), banco de estruturas resol-


vidas de proteínas, contendo várias informações de proteínas,
nucleotídeos e anotação, além de ferramentas utilizadas para
análise de estrutura de proteínas.

TIGR Database (http://www.tigr.org/tdb) e JGI (http://www.


jgi.doe.gov/) são bancos de dados contendo vários genomas
288
Biologia Molecular

com informações detalhadas do sequenciamento, como fer-


ramentas para visualizar coordenadas de genes, informações
sobre um gene, bem como o genoma total.

Com o aumento crescente de dados em análises metage-


nômicas, bancos específicos para isto estão em amplo desen-
volvimento, repositórios como o JGI e NCBI (http://www.ncbi.
nlm.nih.gov/Traces/home), análises de estrutura da região
16S Ribossomal Database Project (http://rdp.cme.msu.edu) e
18S Silva RNA Database (http://www.arb-silva.de) vem sendo
muito utilizados.

Após o sequenciamento de genomas de procariotos ou


eucariotos é fundamental identificar os genes presentes e
suas funções para assim compreender sua biologia, para tan-
to, nos processos de anotação de genes o Gene Onthology –
GO (http://www.geneontology.org) é um banco muito utilizado
para padronizar a representação dos genes e suas funções.
O GO provém de um vocabulário específico de termos para
característica do produto gênico e função.

Dados de expressão de genes também são armazenados


no NCBI, o Gene Expression Omnibus - GEO (http://www.ncbi.
nlm.nih.gov/geo) é um banco público de repositórios de dados
de “microarray” contendo o mínimo de informação de experi-
mentos de ”microarray” – MIAME.

12.6 ALINHAMENTO DE SEQUÊNCIAS

O alinhamento de sequências é um dos processos mais


elementares na bioinformática e oferece recursos para orga-
nizar as sequências primárias de DNA, RNA e Proteínas por
meio de ferramentas computacionais poderosas. Estas ferra-
mentas utilizam algoritmos de alinhamento que identificam re-
giões similares nas sequências e podem ser utilizadas pelos
289
Biologia Molecular

pesquisadores para tentar identificar correlação entre função


gênica, estruturas, domínios ao longo das regiões alinhadas.
Através do alinhamento de sequências é possível inferir as
seguintes funções:

-Identificar sequências similares;


-Inferir estrutura e função (anotação);
-Identificar padrões conservados e variabilidade;
-Predizer o local e função de proteínas e regiões de regu-
lação de transcrição através do sequenciamento completo de
genomas.

Alinhar sequências em bioinformática é identificar corres-


pondências de nucleotídeos ou aminoácidos entre duas ou
mais sequências verificando sua similaridade. Para melho-
rar o alinhamento podem ser introduzidas lacunas (também
chamadas de gaps em inglês) em uma ou mais sequências.
Também com o objetivo de melhorar o alinhamento deleções
podem ser realizadas.

Um sistema de matriz de pontuação (score) pode ser uti-


lizado para auxiliar os programas na obtenção do melhor ali-
nhamento possível dando pontuações diferentes para cada
tipo de alinhamento. Por exemplo: quando ocorre a substitui-
ção de uma purina por outra purina (ou seja, uma adenina por
uma guanina) ou de uma pirimidina por outra pirimidina (timina
por citosina). Nesse caso haverá uma pequena penalidade im-
posta pela matriz e a substituição é chamada de transição. A
alteração de uma base purina por outra pirimidina é chamada
de transversão e ocorre com uma frequência muito pequena,
pois leva a uma alteração do DNA que poderá causar uma
mutação e/ou problema estrutural na dupla hélice. No caso
de transverções a penalidade é maior, pois a probabilidade de
ocorrência é muito pequena.

290
Biologia Molecular

Um exemplo de matriz de pontuação simples é atribuir va-


lores +1 para correspondência de nucleotídeos, -1 para lacu-
nas (gaps), -2 para transições e -3 para transversões.

Os programas de análise de sequências utilizam a matriz


para tentar obter a maior pontuação (score) e com isso o me-
lhor alinhamento possível. Para aminoácidos as matrizes são
mais complexas, pois diferentes aminoácidos podem perten-
cer a um mesmo grupo químico, logo a substituição de um por
outro pode não afetar a constituição tridimensional da prote-
ína. Nesse caso a pontuação seria a mesma, desde que o
grupo químico permanecesse inalterado.

Há matrizes com diferentes pontuações para diferentes ti-


pos de sequências, para aminoácidos é possível trabalhar com
a PAM (Point Accepted Mutation) e as BLOSUM (Bocks Subs-
titution Matrix) que variam entre BLOSUM45, BLOSUM62 e
BLOSUM80 (Mcentyre, 2002). A matriz mais comumente usa-
da é a BLOSUM62.

A sigla BLOSUM significa matriz de substituição em blo-


cos. Esta matriz dá a pontuação para o alinhamento a partir
da frequência de substituições em blocos de alinhamentos lo-
cais em proteínas relacionadas. A distância evolucionária é o
fundamento para a construção de uma matriz específica. Por
exemplo, na BLOSUM 45, o alinhamento de onde os escores
foram derivados foi construída a partir de blocos com no má-
ximo 45% de identidade. Em outras palavras se duas sequên-
cias são mais de 45% idênticas, o alinhamento entre elas não
será empregado no cálculo da matriz. Ou seja, quanto maior o
número da matriz BLOSUM, menos divergentes devem ser as
sequências relacionadas.

A matriz PAM foi criada no final da década de 50, pelos


cientistas Margaret Dayhoff, o biofísico Robert S. Ledley e o
291
Biologia Molecular

biólogo Richard V. Eck. Eles haviam desenvolvido rotinas para


computadores que possibilitavam criar sobreposições (alinha-
mentos) de qualquer grupo de proteínas, resultando nos pri-
meiros programas de computador destinados a criar alinha-
mentos e na primeira matriz de probabilidades para mudanças
entre todos os aminoácidos (PAM – Point Accept Mutation),
ainda utilizadas como sistemas de escores em alinhamentos.

A matriz PAM 1 foi produzida baseada em um determinado


tempo de evolução (PAM 1 unidade de tempo em que 1% dos
aminoácidos mudam). Outras matrizes (PAM 100, PAM 250)
foram derivadas a partir desta primeira matriz. Quanto maior
a unidade de PAM mais adequada é a matriz para comparar
sequências mais divergentes.

Cada uma delas possui pontuações diferentes, mas o


mesmo objetivo, obter o melhor alinhamento possível.

Há três tipos de alinhamentos comumente utilizados em


bioinformática: local, global e semiglobal.

12.7 ALINHAMENTO LOCAL

O programa mais conhecido que realiza o alinhamento lo-


cal em sequências de DNA e Proteínas é o BLAST (Basic Local
Alignment Search Tool). Quando se trabalha com alinhamen-
to, é importante ressaltar a diferença entre similaridade e ho-
mologia, pois são conceitos diferentes e que comumente são
utilizados de maneira errônea. O termo similaridade significa
que existe algum grau de equivalência entre duas sequências
podendo ser inteiras ou não, geralmente são apenas parciais.
Similaridade é o grau de semelhança entre as sequências, ba-
seado na identidade da sequência. O escore é baseado nos
valores das tabelas de matrizes.
292
Biologia Molecular

Já o conceito de homologia é corretamente utilizado quan-


do as sequências em estudo possuem um ancestral comum.
Além disso, nos estudos filogenéticos, sequências completas
devem ser preferencialmente usadas, pois para compará-las
elas deverão ter a mesma extensão, por isso é realizado um
alinhamento global como será visto mais a frente. Embora se-
quências parciais também possam ser usadas em análises fi-
logenéticas, seus resultados são menos precisos.

O alinhamento local possui esse nome porque ele irá ali-


nhar apenas a região da sequência mais similar, podendo ser
uma sequência inteira ou não. O algoritmo do BLAST (Altschul
et al.,1990) funciona de maneira a buscar a melhor pontuação
possível, o que nem sempre resulta na sequência inteira que
está sendo analisada. Ele começa adicionando um pequeno
fragmento da sequência pesquisada, que é chamado de se-
mente, ou “palavra” geralmente com tamanho de 11 para nu-
cleotídeos ou 3 para aminoácidos. Compara a semente com
as demais sequências, e na medida em que encontra um exa-
to alinhamento, ele vai adicionando os demais pedaços da se-
quência que esta sendo pesquisada, até obter a maior pontu-
ação possível. Quando os valores de pontuação começam a
cair, ele para de adicionar o restante da sequência retornando
o resultado da consulta com as regiões mais similares.

De modo bem resumido o algoritmo do BLAST pode ser


definido em três estágios básicos (Amaral, 2007). No primeiro
passo compila uma lista de palavras de alta pontuação. No
segundo passo procura essas palavras nos bancos de dados.
No terceiro e último passo faz a extensão de alinhamentos a
partir das palavras encontradas.

Como mencionado anteriormente um dos recursos utiliza-


dos para auxiliar no alinhamento são as matrizes que podem
variar de acordo com a necessidade do pesquisador. Através
293
Biologia Molecular

das matrizes é que são obtidas também as pontuações (score)


que fornecem um parâmetro para analisar o alinhamento.

Além da pontuação, outro parâmetro utilizado para avaliar


o alinhamento local é o “e-value”. Ele é um valor estatístico
que representa qual é a probabilidade de um alinhamento ter
ocorrido ao acaso. Quanto menor for o e-value, menor será a
chance do alinhamento ter ocorrido ao acaso. Outro termo de
uso comum no BLAST é identidade, que é o número de nucle-
otídeos ou aminoácidos idênticos entre as sequências, no ali-
nhamento expresso em porcentagem, a partir da comparação
com este alinhamento.

O programa BLAST permite comparar sequências de cin-


co formas diferentes, sendo que para cada uma delas há uma
versão diferente do BLAST. O Blastn compara a sequência de
entrada de nucleotídeos contra um banco de dados de sequ-
ências de nucleotídeos. O Blastp permite comparar sequên-
cia de aminoácidos contra um banco de dados de sequências
de aminoácidos. O Blastx compara a sequência de nucleo-
tídeos de entrada traduzida para os seis frames de leituras
possíveis contra um banco de dados de sequências de prote-
ínas. O tBlastn compara a sequência de aminoácido de entra-
da contra um banco de dados de sequências de nucleotídeos
traduzidas para todas os seis frames de leitura possíveis. Por
último o tBlastx compara os seis frames de leitura possíveis
de uma sequência de nucleotídeos contra um banco de dados
de sequências de nucelotídeos traduzidos para todos os seis
frames de leitura possíveis.

Além dessas opções o NCBI disponibiliza uma versão para


download, que pode ser usada em computadores pessoais ou
em servidores. Essa versão, popularmente conhecida como
“blast local”, funciona na interface web, como também no modo
texto em um terminal. Essa versão é muito útil quando se quer
294
Biologia Molecular

analisar sequências sem expor seus dados na web, antes de


se tornarem públicas, além de oferecer a opção de analisar
grande número de sequências de uma só vez pelo modo texto
(blastall). O Blast local pode ser obtido através do endereço
ftp://ftp.ncbi.nih.gov/blast/ e funciona em diferentes sistemas
como Windows, Linux, MacOS X e Solaris.

Outros programas que também realizam o alinhamento


local de sequências é o FASTA do Instituto Europeu de Bioin-
formática (EBI).

O FASTA pode ser usado para uma comparação rápida de


sequências de proteínas ou nucleotídeos. Este programa atin-
ge um alto nível de sensibilidade para a busca de similaridade
em alta velocidade. Isto é conseguido através da realização
de buscas otimizadas para alinhamentos locais usando uma
matriz de substituição. A alta velocidade do programa é obtida
usando o padrão observado de palavras (fragmentos da se-
quência original) para identificar possíveis correspondências
antes de tentar consumir mais tempo, otimizando a busca. A
troca entre a velocidade e a sensibilidade é controlada pelo
parâmetro ktup, o qual especifica o tamanho da palavra. Au-
mentar o ktup diminui o número de resultados errôneos. Nem
toda palavra é procurada, mas ao invés disso, inicialmente
procura-se segmentos contendo muitos resultados próximos
(Pearson, W.R.; 1990). O FASTA pode ser utilizado a partir
do link http://www.ebi.ac.uk/Tools/sss/fasta/ e assim como o
BLAST também possui versão para download.

12.8 ALINHAMENTO GLOBAL

O alinhamento global é utilizado para alinhar sequências


inteiras e é fundamental nos estudos de filogenia e na busca
por sequências homólogas. O alinhamento múltiplo global é
chamado assim, pois várias sequências foram alinhadas glo-
295
Biologia Molecular

balmente ao mesmo tempo. Exemplos de programas popula-


res que o utilizam são: clustalW, clustalX, T-Coffe e Muscle.
Ainda dentro de alinhamentos múltiplos há dois principais mé-
todos de busca: o método de perfis e o método de modelos
ocultos de markov.

Os perfis expressam os padrões inerentes a um alinha-


mento múltiplo de sequências de um conjunto de sequências
homólogas. Em outras palavras a técnica de alinhamento por
perfis busca os padrões conservados dentro de um conjunto
de sequências homólogas.

A técnica de alinhamento por modelos ocultos de Markov


(HHM) é muito útil para revelar homologias distantes e na pre-
dição de famílias de genes.

Outro método de alinhamento é o gráfico de pontos.


Esse é o método mais primitivo e simples de alinhar e visu-
alizar duas sequências (alinhamento par a par). Linhas ver-
ticais contínuas em um gráfico de pontos representam re-
giões similares. Rupturas na linha vertical entre dois genes
representam inserções e/ou deleções. Um programa que
realiza esse tipo de alinhamento é o dotlet (http://myhits.
isb-sib.ch/cgi-bin/dotlet).

12.9 SISTEMA OPERACIONAL

Muitas pessoas trabalham com computador há muito tem-


po e não faz idéia da importância e da finalidade do sistema
operacional. O sistema operacional é o conjunto de progra-
mas que gerencia o hardware e atua como intermediário entre
um usuário e o seu computador. Seu propósito é fornecer um
ambiente onde os usuários possam executar seus programas
de maneira eficiente. Ele é responsável por inicializar e contro-
lar os dispositivos físicos do computador, tais como, memória,
296
Biologia Molecular

processador, dispositivos de entrada/saída, assim como ge-


renciar os programas aplicativos e usuários do sistema.

Existem muitos tipos de sistemas operacionais, alguns mais


complexos e destinados a trabalhar em máquinas com muitos
processadores, no gerenciamento de centenas de usuários co-
nectados simultaneamente, e para executam tarefas críticas,
por exemplo, controlar dispositivos de uma usina nuclear. Há
também sistemas operacionais mais simples que podem ser
armazenados e executados de um chip de memória ROM (me-
mória de somente leitura) ou até em dispositivo de memória
USB flash (popularmente conhecido como pen drive).

Entre os diversos sistemas disponíveis, um dos mais utili-


zados em Bioinformática é o sistema operacional Linux, e por
este motivo será o sistema abordado neste capítulo.

12.10 LINUX

Linux geralmente é o nome dado a qualquer sistema ope-


racional que utiliza o núcleo desenvolvido por Linus Torvalds.
O desenvolvimento do Linux foi inspirado no sistema Minix,
um sistema Unix gratuito de código fonte aberto. O Linux pos-
sui o seu código fonte disponível sob licença GPL (Licença
Pública Geral) e permite que qualquer pessoa utilize, estude,
modifique e distribua de acordo com os termos da licença.

O Linux é um sistema multiusuário, multitarefa, gratuito, de-


senvolvido para rodar desde computadores simples como um
PC, até servidores com milhares de processadores e usuários.
Existem várias distribuições Linux, e as mais conhecidas são:
Debian (http://www.debian.org), RedHat (http://www.redhat.
com), Slackware (http://www.slackware.com), Suse (http://
www.novell.com/linux), Fedora (http://www.fedoraproject.org),
Ubuntu (http://www.ubuntu.com). Alguns sistemas Linux são
297
Biologia Molecular

mais fáceis de instalar/configurar/mexer, por exemplo, Ubun-


tu, já outros são mais difíceis, como o Debian e Slackware.

O sistema operacional Linux está dividido em vários módulos,


alguns deles são: Núcleo, Processos e Sistema de Arquivos.

12.11 NÚCLEO

Em computação, o núcleo de um sistema (em inglês: kernel)


é o coração do sistema operacional, sendo ele o responsável
por alocar os recursos do computador e escalonar os proces-
sos para permitir que todos os usuários compartilhem os re-
cursos do computador, no qual inclui acesso a CPU (Unidade
Central de Processamento); dispositivos periféricos tais como,
HD (Disco Rígido), DVD e CD-ROM; impressoras, teclado e
mouse. O núcleo do sistema Linux faz o trabalho de ponte
entre os dispositivos do computador (hardware) e os progra-
mas (softwares), e também tem a função de gerenciamento
de memória, criação, eliminação, sincronização, comunica-
ção, escalonamento dos processos que executam na CPU,
gerenciamento do sistema de arquivo, suporte a redes locais
e distribuídas. O acesso ao núcleo do sistema não é feito de
modo direto, para isso, é necessário que o programa faça uma
chamada de sistema para requisitar o serviço ao sistema ope-
racional, que depois passa ao núcleo o controle de realizar
todo o trabalho. Como exemplo de uma chamada de sistema,
podemos citar um programa que está em execução e precisa
de mais espaço na memória para continuar alocando os da-
dos que estão vindos de um arquivo.

12.12 PROCESSO

Em sistema de computação, um processo é a forma de re-


presentar um programa instanciado e que está em execução.
No Linux, tudo que executa no processador e na memória do
298
Biologia Molecular

computador é um processo. Em um determinado momento,


dezenas de processos estão em execução no computador, e
desta forma, é preciso ter meios que permitam controlá-los
através de algumas características, sendo elas: propriedade
do processo; estado do processo e prioridade de execução.
É importante lembrar que apenas um processo é executado
por vez no processador, e os estados em que os processos
podem se encontrar são: execução (running); prontos (ready)
esperando na fila para sua execução ou então “dormindo”
(sleeping), que é quando o processo está esperando alguma
condição para a sua execução.

Todo processo é identificado por um número, e este é cha-


mado de PID (Identificador do Processo). Para cada processo
criado, um novo número é atribuído, sendo assim, não existem
dois processos com o mesmo número executando ao mesmo
tempo.

Alguns comandos são muito utilizados para visualizar e


controlar os processos que estão sendo executados no siste-
ma, e alguns deles são apresentados a seguir:

- Visualizar processos em execução: para visualizar


os processos que estão sendo executados; o tempo que
cada um está alocado na CPU; o usuário que instanciou o
programa; assim como a prioridade e o PID do processo,
dois comandos podem ser utilizados, sendo eles o top e
ps. Para executar os comandos, basta abrir um terminal,
também conhecido como shell, digitar um dos comandos e
apertar a tecla Enter. O comando top mostra na tela os pro-
cessos que estão sendo executados, e a cada 2 segundos,
atualizará a lista no monitor até ser finalizado com a tecla
q. Já o comando ps apenas mostra uma lista contendo as
informações dos processos instanciados na tela do compu-
tador.
299
Biologia Molecular

- Alterando a prioridade do processo: quando o pro-


cesso é criado, atribui-se a ele uma prioridade de execução
representada por um valor que varia de -20 a 19, e quanto
menor for este valor, maior será a prioridade de execução do
processo. Este valor serve para que processos que tenham
prioridades maiores (valor menor) sejam executados primeiros
do que os processos que tenham prioridades menores (valor
maior) quando estão numa fila de execução.

Um comando utilizado para alterar a prioridade de um


processo chama-se renice. A execução deste comando tem a
seguinte sintaxe: renice –n prioridade PID. É importante res-
saltar que um usuário comum só poderá alterar a prioridade
dos processos instanciados em seu nome, e que o valor que o
usuário poderá atribuir aos processos está entre 0 e 19. Para
atribuir valores menores que zero (maior prioridade de execu-
ção), é necessário ter privilégios de administrador do sistema
(root), uma vez que prioridades muito baixas poderão compro-
meter o sistema se não for usado corretamente.

A seguir é apresentado um exemplo da utilização do co-


mando renice:

renice –n -5 1908

Neste exemplo, o processo com o PID identificado pelo


número 1908 teve sua prioridade aumentada alterando o valor
para -5. A execução passará na frente dos processos com prio-
ridades menores quando estiver na fila, e como consequência,
entrará mais vezes no processador para ser executado.

Sinais de processos: Os sinais são usados para que o


sistema se comunique com o processo e interfira em sua exe-
cução. A seguir são apresentados alguns dos sinais de pro-
cessos:
300
Biologia Molecular

STOP – interrompe a execução de um processo;

CONT – Reativa um processo parado. Um processo que


foi interrompido pelo sinal STOP pode ser reativado usando o
sinal CONT;

TERM – Tem por objetivo finalizar a execução de um pro-


cesso. Após a sua execução, o processo deixará de existir
sem a possibilidade de reativá-lo.

Estes sinais podem ser passados para os processos por


meio do comando kill, que por padrão, assume o sinal TERM
caso não seja passado nenhum e assim finalizará o processo.
A sintaxe do comando kill é a seguinte: kill -SINAL PID.
Exemplos de utilização do comando kill:
kill -STOP 1452
kill -CONT 1452
kill -TERM 1452
Neste exemplo, primeiro a execução do processo com o
PID 1452 foi interrompido com o sinal STOP. Em seguida, o
processo foi reativado para sua execução com o sinal CONT.
E por fim, o processo foi finalizado por meio do sinal TERM.

12.13 SISTEMA DE ARQUIVOS E ESTRUTURA


DE DIRETÓRIOS

Sistema de arquivos é uma estrutura lógica no Linux


que possibilita que os arquivos sejam armazenados e re-
cuperados no computador. Os arquivos estão organizados
em pastas (diretórios) e conectados em uma estrutura em
forma de árvore que começa na pasta raiz que é designa-
do por uma barra “/” no sistema Linux. Todos os disposi-
tivos de armazenamento conectados no computador, por
exemplo, HDs, CD, DVD, pen drives necessitam estar co-
nectados nesta árvore para que seus dados possam ser
301
Biologia Molecular

acessados. Todos os dispositivos antes de ser acessados


precisam estar montados, isto é, conectar a estrutura de
pasta do dispositivo a árvore de diretório raiz do sistema.
O processo de montar um dispositivo no Linux é feito por
meio do comando mount. Enquanto que para desmontar o
dispositivo e desconectá-lo do computador, usa-se o co-
mando umount. Para montar ou desmontar uma partição, é
necessário ter acesso de administrador do sistema.

A árvore de diretórios do Linux está dividida em várias par-


tições, e as mais comuns são:

/ – diretório raiz do sistema, local onde se encontra todas


as demais pastas e partições montadas;
/lib – bibliotecas de tempo de execução ou compartilha-
das, além daquelas necessárias a compilação de progra-
mas;
/bin – contém os programas binários do sistema;
/sbin – programas utilizados pelo usuário administrador
(root) do sistema para controle e gerenciamento do computador;
/etc – guarda todos os arquivos de configuração de seu
computador;
/dev – contém todos os drives de dispositivos necessários
para conectar periféricos ao sistema;
/usr – repositório para a maioria dos programas, compila-
dores, bibliotecas de documentação do sistema de arquivos
do Linux;
/mnt – diretório de montagem dos dispositivos;
/home – armazena todas as pastas e arquivos dos usuá-
rios;
/opt – local de instalação de pacotes, geralmente os pro-
gramas comerciais são instalados aqui.
/tmp – local de armazenamento dos arquivos temporários
dos usuários e do sistema.

302
Biologia Molecular

12.14 COMANDOS LINUX

O Linux oferece um conjunto de comandos que são utiliza-


dos para controlar, gerenciar e configurar o sistema, e também
para criar, mover e remover pastas, arquivos, usuários, docu-
mentos, e acessar dispositivos locais e remotos. Enfim, tudo o
que o usuário necessita fazer no sistema Linux, sempre existe
um comando específico para realizar tal tarefa.

Entre os comandos do sistema, os mais comuns e usados


frequentemente pelos usuários são:

mkdir, rmdir – o primeiro cria uma pasta em vazia, en-


quanto que o segundo remove uma pasta desde ela esteja
vazia (ex: mkdir teste; rmdir teste);
touch – cria um arquivo vazio (ex: touch config.txt);
rm – remove um arquivo (ex: rm arquivo). Caso seja execu-
tado o comando rm -rf, ele excluirá todas as pastas e subpas-
tas contendo arquivos ou não (ex: rm -rf docs);
cd – entra em uma pasta (ex: cd /home). Caso queira vol-
tar uma pasta é só digitar dois pontos (..) na frente do coman-
do da seguinte forma: cd .. (lembrando de colocar um espaço
entre o comando e o primeiro ponto);
ls – lista o conteúdo do diretório local (ex: ls). Para visu-
alizar arquivos ocultos, coloque a opção -a na frente do co-
mando, assim: ls -a. Caso queira ver detalhes dos arquivos e
diretórios, coloque os parâmetros alh, desta forma: ls -alh.
cat, less e more: mostram o conteúdo de um arquivo (ex:
cat leiame.txt; less leiame.txt; more leiame.txt);
head: mostra as primeiras linhas de um arquivo (ex: head
-100 leiame.txt);
tail: mostra as últimas linhas de um arquivo (ex: tail -50
leiame.txt);
vi: editor de texto simples em modo texto, mas com muitos
recursos (ex: vi leiame.txt);
303
Biologia Molecular

ps: mostra os processos existente no sistema (ex: ps).


Para visualizar mais detalhes dos processos em execução,
adicione os parâmetros, aux, desta forma: ps -aux
find: comando de busca (ex: find / -name foto.jpg).

O Linux é um Sistema Operacional muito robusto, prepa-


rado para rodar em diferentes plataformas e computadores,
sendo eles pessoais (PC, Laptop) ou grandes servidores com
centenas de processadores interligados uns aos outros. Uma
abordagem mais profunda exigiria vários capítulos, mas para
não deixar de falar deste assunto tão importante para quem
trabalha com bioinformática, uma breve introdução foi apre-
sentada sobre o Sistema Operacional Linux.

12.15 LINGUAGEM PERL

Com o grande crescimento da Bioinformática nos últimos


anos, aumentou a importância da programação de computa-
dores no campo da biologia. Muitas linguagens de programa-
ção como C/C++, Java, Python e Perl tem sido exaustivamente
usado na área de Bioinformática. A linguagem Perl é muito
usada em programação Web e uma das mais utilizadas para
o desenvolvimento de programas em Bioinformática. A Perl
por ser uma linguagem de scripts e de fácil programação, tem
sido largamente aplicada na solução de problemas biológi-
cos, tais como: encontrar a sequência reversa e complemen-
tar de DNA; converter sequência de DNA em aminoácidos;
identificação de genes, domínios conservados, montagem de
sequências, conversões de formatos, entre outros.

Pela linguagem Perl ter sido originalmente desenvolvida


para trabalhar com strings (textos), ela contém recursos que
conseguem gerenciar e analisar facilmente longos textos,
como é o caso das sequências de DNA, RNA e aminoácidos.
A linguagem Perl pode ser baixada gratuitamente no endereço
304
Biologia Molecular

http://www.perl.org tendo versões para trabalhar em diver-


sos sistemas operacionais, como: Linux, Unix, Windows,
Mac OS X.

12.16 BIOPERL

Bioperl é um conjunto de mais de 500 módulos em lin-


guagem Perl que foram desenvolvidos para atender as mais
diferentes necessidades de programação quando se trata de
análises de dados em Bioinformática. Os módulos são escritos
e mantidos por um grupo internacional de voluntários espalha-
dos em vários países e continentes. Portanto, os módulos en-
contrados no BioPerl são todos de código aberto, orientados a
objetos contendo várias funções para conversão de formatos,
processamento de relatórios, manipulação de dados, análises
de sequências entre outros. O BioPerl pode ser baixado no
endereço http:/bioperl.org e utilizado gratuitamente.

12.17 MEU PRIMEIRO PROGRAMA

A linguagem Perl é fácil para aprender e de programar


quando comparada com as demais linguagens existentes no
mercado. Uma particularidade muito interessante em Perl é
que não é necessário escrever muito para o programa fazer
o que realmente você deseja que ele faça. Em muitas lingua-
gens de programação é necessário declarar os tipos de va-
riáveis e sub-rotinas que serão usadas antes de escrever a
primeira instrução de seu programa. Como alguns problemas
demandam complexas estruturas de dados, neste caso, de-
claração torna-se uma boa idéia. Porém, em muitos casos do
dia a dia, você deseja fazer coisas simples, como imprimir a
seguinte frase na tela: “Olá mundo”. Para fazer isso na lingua-
gem Perl, basta escrever:

print “Olá Mundo!!!\n”;


305
Biologia Molecular

Pronto, em apenas uma linha temos o exemplo de um pro-


grama completo.

Para você escrever o seu primeiro programa e ver esta


mensagem na tela, primeiro tenha certeza de ter a linguagem
instalada em seu sistema operacional. Depois disso, abra um
editor de texto favorito e escreva exatamente o que está no
exemplo acima. Salve o arquivo com um nome qualquer, por
exemplo, “Ola.pl” e saia do editor. A extensão “.pl” é geral-
mente colocada em scripts Perl para o usuário identificar do
que se trata aquele arquivo, o mesmo caso acontece com os
documentos do Microsoft Word que terminam com a extensão
“.doc” ou “.xls” com arquivos de planilha do Microsoft Excel.

Pronto, uma vez que o arquivo esteja salvo, basta digitar


perl antes do nome do programa em um terminal e dar enter,
desta forma:

perl Ola.pl #depois aperte a tecla Enter

Se tudo foi feito corretamente, aparecerá a seguinte frase


na tela do computador:
Olá Mundo!!!

Neste exemplo temos o comando print que tem a função


de imprimir na saída padrão (monitor) do computador o texto
que está entre aspas. Já o “\n” colocado no final serve para
pular para a próxima linha após imprimir na tela.

A linguagem Perl é muito poderosa e o usuário pode usar


diferentes tipos de variáveis (escalar, array, hash), estruturas
de repetição (for, while), condição (if else, unless, switch), ope-
radores (+, -. *, /, >, <, >=, <=,==, !=) como em qualquer outra
linguagem.

306
Biologia Molecular

Aprofundar na linguagem Perl está fora do escopo deste


livro, mas para não deixar de falar desta área tão importante
para a Bioinformática, uma breve introdução e um exemplo de
programa foi apresentado.

12.18 A BIOINFORMÁTICA E A INTERNET

Atualmente quando falamos em bioinformática é impossí-


vel pensar na viabilidade desta nova área do conhecimento
sem pensar no compartilhamento de informações pelos gran-
des bancos de dados distribuídos pelo mundo. Desta forma
é justo dizer que o sucesso da utilização de boa parte dos
recursos da bioinformática é diretamente dependente da rede
mundial de computadores (Internet).

Ainda nos anos 60 vários grupos empresariais (Bell La-


boratories, AT&T, Texas Instruments, etc...) e grupos de pes-
quisa em Universidades foram os pioneiros em desenvolver
protótipos de sistemas operacionais que permitiam o compar-
tilhamento de informações em curtas distâncias ou mesmo
dentro de seus laboratórios, dando origem ao que chamamos
de computação distribuída e que posteriormente deu origem
as arquiteturas cliente/servidor, ou seja, usuários que através
de terminais acessam dados em centralizados servidores de
dados (Intranet).

Também neste período o Departamento de Defesa dos


EUA desenvolveu um sistema de rede que interligou bases
militares do país, com o objetivo de transmitir informações mi-
litares sobre a guerra fria, esta rede foi chamada de ARPAnet
(Advanced Research Projects Agency Network). No inicio dos
anos 80 pesquisadores da ARPA tornaram público os proto-
colos de transmissão de dados chamados TCP (Transmission
Control Protocol) e IP (Internet Protocol) que serviram como
base pro avanço desta tecnologia. A maioria destes protocolos
307
Biologia Molecular

e da arquitetura utilizadas na conectividade foi desenvolvida


sob o sistema operacional Unix ou de seus derivados, utiliza-
dos gratuitamente em centros de pesquisa e universidades.

No final dos anos 80 toda a tecnologia envolvida em


grandes redes de conexões já tinha alcançado um gran-
de desenvolvimento e muitas redes surgiram, como por
exemplo NFSnet criado pelo NFS (National Science Foun-
dation). Com o término da guerra entre Estados Unidos e a
ex-União Soviética, no inicio dos anos 90 a ARPAnet foi ex-
tinta e sua estrutura foi agregada e utilizada pela NFSnet.
Até a primeira metade da década de 90 muitos departa-
mentos governamentais em diferentes países, institutos de
pesquisa, universidades e empresas mantinham separada-
mente suas redes privadas. Neste período acordos políti-
cos liberaram a interconexão entre todas as redes existen-
tes no mundo e também liberaram esta grande rede para
uso comercial e público, dando origem ao que foi chamado
de rede mundial de computadores, a Internet.

A primeira experiência de compartilhamento de dados


de proteínas em endereço remoto foi feita pelo NBRF (Na-
tional Biomedical Research Foundation) nos Estados Uni-
dos em 1984, liderados por Margaret Dayhoff, considerada
a pioneira no desenvolvimento de métodos computacionais
para alinhamento de proteínas. Dayhoff acumulou sequên-
cias de proteínas desde a década de 60, e juntamente com
seus colaboradores compilaram o primeiro banco de dados
online de proteínas chamado PIR (Protein Information Re-
source).

Para sequências de DNA as primeiras experiências foram


desenvolvidas no Theoretical Biology and Biophusics Group,
em Los Alamos-USA. Estes cientistas utilizaram os dados de
proteínas de Dayhoff (PIR) e criaram rotinas de computador
308
Biologia Molecular

para tradução e acesso das suas sequências na forma de pro-


teínas e nucleotídeos, disponibilizando em 1979 como protóti-
po do atual GenBank.

Como explicado anteriormente, nesta época já estavam


disponíveis tecnologias para a conexão remota destes e mui-
tos outros bancos de dados criados na Europa e no Japão,
entretanto, o acesso a estes bancos demandava muito conhe-
cimento de computação, pois as tecnologias da época eram
demasiadamente difíceis, acrescidos da baixa velocidade das
conexões, comparados com a velocidade de transmissão de
dados conhecidos atualmente. Outro fato muito importante é
que os bancos de dados disponíveis até o final da década
de 80 somente utilizavam sistemas de menus onde a busca
por sequências era feita por palavras chaves, isto é, o usuário
escrevia uma palavra chave sobre o nome de uma proteína e
o banco de dados dava como resultado uma ou mais sequên-
cias, que continham estas palavras chaves na sua descrição.

Estas sequências eram analisadas em computadores lo-


cais, geralmente utilizando ferramentas de alinhamento glo-
bal. Este fato é devido à impossibilidade do uso do alinhamen-
to global para encontrar regiões parecidas entre diferentes
sequências, problema que só foi solucionado com a criação
do sistema de semeadura seguido do alinhamento local feito
nos programas FASTA e BLAST, permitindo que um usuário
submeta uma sequência de entrada e o programa percorra o
banco de dados procurando por sequências contendo regiões
parecidas (similaridades).

Felizmente, o avanço científico e tecnológico do sequen-


ciamento genômico, da transformação da ARPAnet e demais
redes num sistema aberto e mais estável e da criação de sis-
temas de alinhamento local de sequências (FASTA e BLAST)
convergiram num mesmo período da década de 90.
309
Biologia Molecular

Como comentado anteriormente, é importante lembrarmos


que o desenvolvimento das arquiteturas de conectividade evo-
luiu na sua maioria sob o sistema operacional Unix ou seus
derivados, juntando a isso o fato de que estas derivações do
Unix eram os sistemas operacionais mais utilizados nas insti-
tuições de pesquisa e universidades, onde ocorreu o grande
avanço do sequenciamento de genomas é fácil entendermos
porque a maioria dos programas de bioinformática são nativos
do Unix.

Os primeiros grandes projetos de sequenciamento de ge-


nomas foram feitos em cooperação entre vários laboratórios
distribuídos em vários países, criando a necessidade da troca
de grandes quantidades de sequências entre os diferentes la-
boratórios. Juntando o fato da Internet rodar sobre sistema
operacional Unix e que a maioria dos programas de trata-
mento de sequências genômicas e de proteínas também se-
rem nativos no Unix, surge este casamento perfeito entre a
Internet e a Bioinformática. Esta relação da bionformática e
das tecnologias computacionais da Internet também foi a res-
ponsável por criar alguns padrões técnicos para a evolução
da bioinformática, tais como, a preferência pelo uso de lingua-
gens de programação interpretadas (CGI) como Perl, PHP e
bancos de dados MySQL, que por definição, são tecnologias
mais aplicadas à Internet.

Finalmente, além destes fatos técnicos sobre o surgimento


e convergência da genômica e da Internet, nos moldes atuais
dos estudos moleculares o compartilhamento de informações
torna-se essencial, com isso, é cada vez mais difícil fazer uti-
lização eficiente da bioinformática sem utilizar as facilidades
providas pela Internet.

310
Biologia Molecular

ASPECTOS ÉTICOS DA
TECNOLOGIA DO DNA

Fábio Barros Britto


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: fbbritto@ufpi.edu.br

Maria das Graças Medina Arrais


Bióloga, Dra.,Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: magma@ufpi.br

Sérgio Emílio dos Santos Valente


Biólogo, Dr., Universidade Federal do Piauí,
Centro de Ciências da Natureza.
e-mail: svalente@ufpi.edu.br

311
Biologia Molecular

312
Biologia Molecular

ASPECTOS ÉTICOS DA
TECNOLOGIA DO DNA

Fábio Barros Britto


Maria das Graças Medina Arrais
Sérgio Emílio dos Santos Valente

313
Biologia Molecular

314
Biologia Molecular

Sumário

Capítulo 13. ASPECTOS ÉTICOS DA TECNOLOGIA


DO DNA

13.1 INTRODUÇÃO ............................................................317


13.1.1 Clonagem..................................................................318
13.1.2 Células-Tronco..........................................................321
13.1.3 Aconselhamento Genético........................................324
13.1.4 Detecção de doenças genéticas..............................327
13.1.5 Construção de armas biológicas...............................333
13.2 CONSIDERAÇÕES FINAIS.........................................335

315
Biologia Molecular

316
Biologia Molecular

13.1 INTRODUÇÃO

A ética pode ser definida como o julgamento de várias situ-


ações referentes à conduta humana, de forma a determinar os
valores que são aceitáveis ou não, dentro de uma sociedade
em uma determinada época. Já a ética médica é determinada
por várias normas de comportamento profissional estabeleci-
das pelos Conselhos Regionais e Federal de Medicina.

O avanço das ciências biomédicas pressupõe um conjunto


de pesquisas e práticas pluridisciplinares, envolvendo ques-
tões éticas as quais carecem de reflexão, possibilitando ao
homem se posicionar em relação a si próprio. Neste sentido, a
ética é a ciência que considera a pesquisa como uma garantia
de harmonia resultante da boa conduta.

Os problemas éticos são geralmente muito complexos de


se chegar a um consenso comum, pois em relação a inúmeras
situações podemos classificar uma atitude como inaceitável
e, em outro momento, considerá-la totalmente aceitável e até
mesmo imprescindível. Por exemplo, a proibição da utilização
de células-tronco embrionárias pode significar o fim das espe-
ranças para uma mãe que tem um filho paralítico, visão dife-
rente que pode ser adotada por um casal que possui apenas
filhos saudáveis.

As decisões devem ser tomadas levando-se em conside-


ração o conhecimento científico atual, o respeito às diferenças
nas experiências pessoais, culturais e religiosas, mas, acima
de tudo, o bom senso e a consciência de uma sociedade com
uma sólida educação a respeito de todos os aspectos citados
anteriormente. Várias questões podem ser apresentadas a um
indivíduo: quando participar de um teste genético, a quem dar
o direito de receber os resultados e que atitude tomar diante
de um diagnóstico para uma doença grave incurável.
317
Biologia Molecular

Para que haja sucesso nesse processo é necessário que


a população tenha conhecimento a respeito da disponibilida-
de desses métodos genéticos e suas implicações e, princi-
palmente, que a decisão de cada indivíduo seja respeitada. É
indispensável ainda que se assegure um padrão de qualidade
aos serviços prestados. Já para a sociedade, cabe o papel
de incorporar e compreender as questões científicas e suas
implicações sociais e éticas, participando da decisão de que
indivíduos terão seu DNA investigado; tirar o melhor proveito
dos benefícios da informação gerada e minimizar as possibili-
dades de mau uso.

É inquestionável que toda tecnologia tem um preço que


pode ser cobrado caro no futuro, mas é preciso nos conscien-
tizar que os riscos existem, mas a esperança de sucesso é
muito maior: poderemos substituir tecidos ou até mesmo ór-
gãos deficientes; poderemos acabar com a diabetes ou com o
câncer em todo o planeta. Suponha que em um acidente você
perca um rim, com uma célula de sua pele e essas novas tec-
nologias, a ciência fará outro rim para você.

Toda nova possibilidade científica possui riscos e bene-


fícios. É somente perguntando e ouvindo as respostas que
teremos avanços e não retrocessos para a humanidade.

13.1.1 Clonagem

Um exemplo de clone natural são os gêmeos monozigóti-


cos (idênticos ou univitelinos). São gêmeos que resultam de
um zigoto e que apresentam a mesma bagagem genética.
Há várias décadas o estudo dos gêmeos idênticos vem des-
pertando o interesse da comunidade científica; tais estudos
podem auxiliar na compreensão de quais características são
mais ou menos influenciadas por nossos genes ou pela ação
do meio ambiente.
318
Biologia Molecular

Todos os experimentos de clonagem em mamíferos rea-


lizados atualmente são baseados nos experimentos de Gur-
don, onde óvulos de rã foram submetidos à luz ultravioleta.
Dessa forma o núcleo era quebrado e, em seguida, por meio
de uma micropipeta, inseria-se um núcleo de célula epitelial
do intestino de um girino no óvulo irradiado. Às vezes, este
óvulo produzia uma rã normal, clone do girino doador da célu-
la epitelial intestinal.

Sabe-se que nos organismos multicelulares, o crescimen-


to depende dos processos de proliferação e de diferenciação
celular, que têm início em etapas precoces da morfogênese
(fase da gástrula) quando surgem células pluripotentes (cé-
lulas-tronco), capazes de se auto-renovarem e/ou de origina-
rem diferentes tipos celulares. Até meados da década de 1990
acreditava-se que, em um estágio embrionário inicial, ocorria
a diferenciação celular em mamíferos determinando o tipo que
uma célula e as suas descendentes assumiriam por toda sua
existência. Esses processos dependem de eventos bioquími-
cos que ativam e/ou inativam genes e não estão, ainda, total-
mente esclarecidos (veja capítulo 3).

Em 1997 houve um grande alvoroço na comunidade cien-


tífica pela divulgação do experimento de Wilmut, que conse-
guiu fazer com que uma célula diferenciada, já destinada a ser
célula de mama de uma ovelha, retrocedesse a um estágio
embrionário anterior à gástrula, dando origem a outra ovelha
completa. Ou seja, pela primeira vez o homem havia realiza-
do a “clonagem reprodutiva” com um animal mamífero adulto.
Porém, na época não se deu a devida importância aos riscos
da clonagem (para gerar a Dolly, Wilmut produziu mais de 200
embriões defeituosos).

Como os clones são geneticamente idênticos, as diferen-


ças entre eles são resultados exclusivamente do meio am-
319
Biologia Molecular

biente. Dessa forma, o homem poderia utilizar clones para


verificar a influência dos genes em várias características hu-
manas, como por exemplo, problemas cardíacos, tendência à
obesidade ou propensão a desenvolver diabetes.

A clonagem da ovelha Dolly originou outras clonagens em


animais que podem auxiliar na compreensão do mecanismo
de diferenciação celular e a responder uma das questões mais
intrigantes de toda a biologia: o que leva células com o mesmo
material genético a originar células tão distintas morfologica-
mente e funcionalmente como, por exemplo, células muscula-
res, nervosas ou epiteliais?

Na clonagem de uma célula adulta é necessário que ocor-


ra toda a reprogramação do genoma para que o processo de
diferenciação seja revertido, possibilitando uma célula adulta
a se diferenciar de novo em qualquer tipo celular. Se o homem
conseguir entender como esses genes são ativados ou inibi-
dos, haverá um grande avanço na elucidação dos mecanis-
mos que levam uma célula a regenerar tecidos ou a originar
um câncer.

Por exemplo, as células de um coração de um indiví-


duo infartado possuem todos os genes para fazer um co-
ração completo; quando o homem compreender como es-
ses genes funcionam, poderia ser realizada a ativação e/
ou inativação de determinados genes para regenerarmos
um coração novo ou qualquer outro órgão danificado ou
envelhecido. O homem compreenderia enfim por que algu-
mas células de repente passam a não obedecer à sua pro-
gramação original e começam a se proliferar de forma de-
sorganizada, dando origem a um câncer. Entendendo esse
processo o homem, finalmente, encontraria a cura para os
maiores matadores da sociedade moderna, doenças gené-
ticas como câncer ou diabetes.
320
Biologia Molecular

É possível que possamos compreender, em um futuro próxi-


mo, por que nossas células param de se renovar e funcionar, le-
vando ao envelhecimento. Assim poderemos controlar o proces-
so de envelhecimento e conseguir ampliar o tempo médio de vida
dos seres humanos para 100, 110 ou, quem sabe, 120 anos?

Porém, com a população vivendo mais, teríamos gastos


maiores com medicamentos e tratamentos de doenças relati-
vas a uma idade avançada, como Mal de Parkinson e Mal de
Alzheimer. Isso sem falar no caos que seria gerado ao sistema
previdenciário. Será que os mais jovens estariam dispostos a
pagar essa conta?

Do ponto de vista evolutivo, poderíamos afirmar que a


Evolução da espécie humana teria terminado, já que pesso-
as com genes deletérios, não mais seriam selecionadas, vi-
veriam mais tempo e teriam mais chance de transmitir esses
genes aumentando consideravelmente a frequência de genes
defeituosos nas populações humanas. É fato que a ausência
de Evolução leva ao desaparecimento das espécies; estaria a
espécie humana fadada à extinção em breve?

13.1.2 Células-Tronco

As células-tronco foram isoladas inicialmente a partir de


camundongos na década de 1980 e são derivadas de células
embrionárias na fase de blástula, quando um embrião ainda
é um aglomerado de aproximadamente 200 células. Somente
na fase de desenvolvimento embrionário posterior à blástula,
denominada gástrula, é que haverá a diferenciação nos tipos
de células presentes no embrião: célula sanguínea, muscular,
nervosa, hepática, epitelial, etc.

O nome “célula-tronco” é uma alusão ao tronco de uma


árvore, que origina vários galhos que formam sua copa. Conti-
321
Biologia Molecular

nuando a analogia, uma célula-tronco originará vários tipos


celulares. Por exemplo, o zigoto é uma célula com grau
de diferenciação zero e potencialidade de 100%. Por meio
de sucessivas mitoses o zigoto dará origem a uma série
de outras células mais especializadas, que por sua vez se
dividirão e se diferenciarão ainda mais, até formarem to-
dos os tipos celulares presentes em um indivíduo adulto.
Quando multiplicamos as células-tronco embrionárias em
condições laboratoriais, a diferenciação dessas células é
inibida devido à presença de fatores que simulam as con-
dições em que elas estavam originalmente no embrião no
meio de cultura celular.

Portanto, a célula-tronco é uma célula com capacidade de


se dividir em células idênticas a ela ou em diferentes tipos
de células. Por exemplo, as células-tronco do sangue, encon-
tradas na medula óssea, podem originar plaquetas, glóbulos
brancos ou vermelhos. Em condições laboratoriais, células-
tronco embrionárias de camundongos já foram diferenciadas
em células que dão origem a todos os tipos de células sanguí-
neas. Quando injetadas em camundongos irradiados, essas
células são capazes de reconstituir toda a linhagem de células
sanguíneas desses animais, como se eles tivessem recebido
um transplante de medula óssea, demonstrando que essas
células podem ser uma fonte ilimitada de todos os tipos de
células do sangue.

Dessa forma, poderíamos, por exemplo, utilizar uma célu-


la-tronco embrionária (capaz de formar qualquer tipo celular)
para o tratamento de um acidentado que tenha perdido uma
perna. A célula-tronco embrionária seria programada como
uma célula da perna e poderia realizar a regeneração do
membro amputado, da mesma forma que a lagartixa regenera
a ponta de seu rabo cortado.

322
Biologia Molecular

Essas possibilidades geram um grande interesse por par-


te da comunidade científica na manipulação de células-tronco
embrionárias, apesar dos aspectos éticos envolvidos. O prin-
cipal deles está relacionado com a seguinte questão: seria o
embrião doador das células-tronco considerado um ser vivo?
A utilização de células embrionárias seria uma espécie de as-
sassinato?

Será que um aglomerado de células em um estágio em-


brionário inicial, sem nem ao menos o esboço do sistema
nervoso formado, apresenta os mesmos direitos que uma
criança? Se estivéssemos em uma clínica de fertilização in
vitro no momento de um incêndio e houvesse 30 blastocis-
tos e uma criança de 5 anos e pudéssemos salvar apenas a
criança ou os 30 blastocistos; quem salvaria os 30 blastocis-
tos?

A reprogramação da célula-tronco embrionária já é re-


alizada com sucesso em algumas situações. Se retirarmos
do meio de cultura que estão as células-tronco embrioná-
rias, os fatores que as mantêm indiferenciadas e colocar-
mos ácido retinóico, por exemplo, elas se diferenciam em
neurônios.

Sabemos que os órgãos são estruturas muito complexas,


formadas por vários tipos de células e vasos sanguíneos que
os conectam com o organismo. Essas interações ainda não
são reprodutíveis no laboratório. Porém, é possível que daqui
a algumas décadas possamos comprar órgãos para substituir
aqueles que estejam defeituosos. Surgiria então a “clonagem
terapêutica”, uma espécie de mistura entre o processo da clo-
nagem e a utilização de células-tronco. A “clonagem terapêu-
tica” é a técnica de clonagem realizada sem fins reprodutivos,
objetivando a criação de um rim, um coração ou um pulmão
no laboratório.
323
Biologia Molecular

Atualmente, estamos muito distantes da construção de


órgãos em laboratórios; mas, apesar de não conseguirmos
fazer um cérebro completo a partir das células-tronco embrio-
nárias, podemos diferenciá-las em neurônios que, ao serem
transplantados para o cérebro de um camundongo, são capa-
zes de regenerar regiões danificadas de seu sistema nervoso.
Em outros experimentos, quando essas células-tronco foram
transplantadas para ratos com trauma na coluna vertebral,
houve uma pequena recuperação dos movimentos das patas,
perdidos com o trauma. Da mesma forma, poderíamos em um
futuro próximo tratar paralíticos que tenham sofrido traumas
na coluna.

Poderemos transformar as células-tronco em células do


músculo cardíaco para regenerar um coração de uma pessoa
que tenha sofrido um infarto. Há alguns anos, houve o trata-
mento de um paciente no Rio de Janeiro-RJ com células-tron-
co. Antes da implantação das células-tronco no seu coração,
ele não conseguia nem ao menos subir alguns degraus de
uma escada e após o tratamento ele já conseguia até mesmo
participar de corridas. O que os cientistas não sabem ainda
é se as células-tronco implantadas originaram novas células
cardíacas ou se originaram novos vasos sanguíneos melho-
rando a irrigação cardíaca.

13.1.3 Aconselhamento Genético

No aconselhamento genético, um médico-geneticista


apresenta aos indivíduos afetados por uma doença, e seus
familiares, as consequências, formas de tratamento e qual o
risco de transmissão aos descendentes. Dessa forma, casais,
geralmente já com um filho afetado ou que tenham familiares
também afetados, podem calcular o risco de terem um outro
filho afetado e, assumindo o risco, atuar para reduzir as chan-
ces da doença se desenvolver.
324
Biologia Molecular

Ao realizar o aconselhamento genético, o médico-geneti-


cista deve seguir o código de ética médica e os códigos penal
e civil vigentes no país, apresentando todas as possibilidades
possíveis (uso de métodos contraceptivos, diagnóstico pré-
natal seguido ou não de interrupção da gravidez, inseminação
artificial, adoção, etc.). De posse de todas as informações, o
casal escolhe que procedimento adotar.

Indivíduos não adeptos do aconselhamento genético ale-


gam que se estaria fazendo uma forma de eugenia, prática
adotada nas décadas de 20 e 30, nos Estados Unidos e por
Adolf Hitler, durante a Segunda Guerra Mundial. Trabalhos
recentes têm demonstrado a possibilidade de existência de
genes relacionados com o alcoolismo e a dependência às dro-
gas. Outros mais polêmicos indicam a existência de genes re-
lacionados ao homossexualismo masculino. Há ainda alguns
estudos que relatam a existência de genes relacionados com
o “bom humor”, sendo que estes atuariam no controle da ex-
pressão das serotoninas e dopaminas. Poderíamos nós julgar
as pessoas por conta de uma pré-disposição que elas viessem
a ter? Ainda hoje podemos encontrar movimentos eugênicos
como, por exemplo, a discriminação contra imigrantes, negros
e homossexuais. Será que este problema se agravaria com a
manipulação indevida da informação genética? Vale a pena
ressaltar que estudos sobre a variação das sequências ge-
néticas entre diferentes populações, ao redor do mundo vêm
demonstrando que a maior parte da variabilidade observada
entre os seres humanos ocorre entre os membros de uma
mesma raça e não entre indivíduos de raças diferentes, como
era de se esperar. Essa informação deve ajudar a eliminar dis-
criminações raciais, uma vez que foi verificada a inexistência
de raças distintas na espécie humana.

Definitivamente, o aconselhamento genético possibilita a


identificação de portadores de defeitos hereditários; informan-
325
Biologia Molecular

do aos portadores dessas alterações o risco do nascimento


de um filho afetado. Em países onde o aborto é permitido,
pode-se interromper a gravidez de uma criança portadora de
um defeito genético grave. Em doenças como a fenilcetonúria,
onde a restrição de alguns alimentos pode evitar o surgimento
dos sintomas, possibilita à família de um afetado o tratamento
antes da instalação ou da progressão da doença.

Em algumas situações, o médico é obrigado a realizar


procedimentos que nem sempre são considerados aceitá-
veis por uma parte da população. De acordo com o artigo
128 do código penal em vigor no Brasil é proibido a prática
do aborto, a não ser quando, precedido do consentimento
da gestante, não há outro método de salvar a sua vida, ou
quando a gravidez resultar de estupro comprovado judicial-
mente. Se houver apelação judicial, há também a possibi-
lidade do aborto quando o feto é portador de anencefalia
(ausência de cérebro).

É necessário salientar que essa lei é de 1940, necessi-


tando ser atualizada face o desenvolvimento científico atu-
al. O aborto é previsto em lei em vários países desenvolvi-
dos do hemisfério norte, no México e em Cuba. Apesar de
ilegal no Brasil, é de conhecimento público a realização de
abortos em várias regiões do país. Quais seriam os direitos
de uma criança que ainda está no útero? Qual o sentido
de se levar ao final uma gestação de uma criança que vi-
verá no máximo seis meses? É correto se interromper a
gravidez no caso de síndromes que afetam muito pouco
o indivíduo? Se já é difícil julgarmos esses casos se ocor-
ressem na nossa família, imaginem julgar a opção de um
casal em abortar, por exemplo, uma criança portadora de
uma doença degenerativa, progressiva e fatal, como é o
caso da distrofia muscular. Vários aspectos teriam que ser
considerados: a precariedade do nosso sistema de saúde,
326
Biologia Molecular

as condições financeiras dos pais, o tempo disponível e a


disposição dos pais em fornecer uma assistência adequada a
um filho deficiente.

A prática do aborto sempre será um assunto polêmico pois


envolve questões filosóficas e religiosas, como as citadas a
seguir. Quando a vida se inicia? Em que momento o feto deve
ser considerado como um paciente e merece ser protegido
pela lei como qualquer ser humano? Alguns assumem o mo-
mento da fertilização do óvulo pelo espermatozóide como o
ponto de início da vida. Como a morte é definida a partir do
momento em que há a morte cerebral, algumas pessoas con-
sideram que a vida se inicia quando o sistema nervoso come-
ça a se formar, processo que ocorre algumas semanas após a
fertilização do óvulo pelo espermatozóide.

Vale ressaltar que o geneticista aconselhador necessita


estar consciente de que ele deve apenas informar o casal a
respeito de todos os aspectos envolvidos no aconselhamento
genético. Ele nunca deve influenciar a decisão de um casal
em ter um filho, mesmo tendo um risco aumentado de uma
doença genética. Para um casal que deseja muito ter um filho,
uma chance de 90% de gerarem um filho doente, pode ser
encarada como uma probabilidade de 10% de terem um filho
saudável.

13.1.4 Detecção de doenças genéticas

Na área da saúde, a tecnologia do DNA recombinante pos-


sibilita o diagnóstico de doenças e de patógenos de forma preci-
sa e rápida. É possível, por exemplo, sabermos se uma pessoa
possui o gene de uma doença que só exibiria os sintomas após
vários anos ou até mesmo décadas. Poderíamos antecipar se
uma menina herdou ou não o gene que lhe daria pré-disposição
a desenvolver câncer de mama trinta anos depois.
327
Biologia Molecular

Poderíamos até mesmo realizar esses exames em embri-


ões de mulheres grávidas ou em embriões de clínicas de ferti-
lização in vitro, dando a possibilidade ao médico de selecionar
uma célula de cada embrião a ser implantado, com a finalidade
de determinar o sexo, analisar a constituição cromossômica
ou verificar se o embrião apresenta um gene deletério; objeti-
vando a implantação no útero de apenas embriões saudáveis.
Em relação às doenças recessivas ligadas ao cromossomo X,
os filhos do sexo masculino apresentam um risco muito maior
de serem afetados, enquanto que para as filhas esse risco é
praticamente zero. Atualmente, com a introdução do diagnós-
tico por análise do DNA, é possível determinar com certeza,
no caso de várias doenças recessivas ligadas ao X, se o feto é
afetado ou não, evitando-se o aborto de fetos normais do sexo
masculino (prática adotada antigamente em alguns países).
De qualquer maneira, alguns embriões, portadores de genes
defeituosos, seriam “assassinados”.

Apesar de haver uma complexa interação entre os genes,


e entre o genótipo e os fatores ambientais; e do pouco conhe-
cimento a respeito de como os genes são regulados, quem
sabe, em um futuro não muito distante, o homem não se pre-
ocupe apenas em ter filhos saudáveis, abrindo possibilidades
para que empresas “vendam” filhos com olhos azuis, com ap-
tidão às ciências matemáticas ou de estatura elevada. Por que
não querer programar tudo o que é possível para ter um filho
perfeito?

Os mais céticos alegarão que primeiramente as pessoas


saudáveis irão querer garantir que não terão um filho portador
de doenças genéticas. Aos poucos, poderá atingir coisas de
importância menor, como depressão; e finalmente chegar a
escolhas de personalidade, temperamento, cor de olhos azuis
ou aptidão à música. O problema é que o uso dessa tecnologia
é um passo extremamente complicado para a ciência efetuar
328
Biologia Molecular

pois estaríamos com um processo eugênico “amistoso”. Po-


deria ser mais devastador que a eugenia proposta por Hitler;
apesar de boas intenções e de motivações nobres os filhos
seriam um artigo de consumo na sociedade moderna.

Ninguém sabe quando todos esses dilemas éticos apa-


recerão e se surgirão realmente mas será que a sociedade
moderna quer presenciar tais acontecimentos? Porém, pais
portadores de genes defeituosos podem ainda alegar que o
fato de quererem um bebê que não morra aos seis meses,
que respire sozinho e possa ver a luz do sol é bem diferen-
te de quererem um bebê loiro e de olhos azuis. Nesse caso,
pensando na saúde da criança e da família os benefícios são
inquestionáveis. Esperamos que ao escolher o destino de um
filho, as pessoas e a lei logo verão o que é e o que não é acei-
tável.

Todos os seres humanos são portadores de aproximada-


mente vinte genes recessivos deletérios. Como vimos ante-
riormente, já é possível a detecção de vários genes que pro-
vocam doenças genéticas. É conveniente sermos capazes de
prever nosso “futuro genético”? Quais problemas éticos surgi-
rão? Por exemplo, se esses exames estivessem disponíveis
no século XVIII, a gestação de Ludwig van Beethoven (um dos
maiores músicos de todos os tempos) poderia ter sido impedi-
da devido o risco de ele se tornar surdo através da presença
de genes que lhe dariam pré-disposição a desenvolver uma
congestão dos centros auditivos internos.

Indivíduos que carregam genes deletérios para doenças


monogênicas raramente podem prevenir ou evitar os sintomas
alterando as condições ambientais. O diagnóstico genético de
um indivíduo trará implicações também para outros membros
da família e para a descendência daquele indivíduo. É correto
interferirmos na liberdade de cada indivíduo em saber, ou não,
329
Biologia Molecular

se é portador de um gene deletério? É ético que os parentes


sejam impedidos de receber informações e de tomar suas pró-
prias decisões quanto à reprodução? Muitos cientistas alegam
que a sociedade do século XXI reinvidicará a sua privacidade
genética, impedindo que essa informação seja mal utilizada.

Quando trabalhamos com doenças genéticas de manifes-


tação tardia, qual a importância de se determinar que um indi-
víduo sadio desenvolva uma doença genética grave e fatal se
não existem formas de tratamento? Um exemplo clássico é o
da coréia de Huntington, uma doença neurodegenerativa que
causa demência progressiva e óbito. O nome coréia deriva
de coreografia em decorrência dos portadores apresentarem
uma série de contrações musculares rítmicas como uma core-
ografia. Por ser autossômica dominante, os indivíduos porta-
dores do gene desenvolverão a doença e apresentarão uma
probabilidade de 50% de transmitir o gene defeituoso a seus
filhos. Geralmente, portadores do gene alterado apresentam
os sintomas por volta da terceira ou quarta década da vida,
época em que a maioria das pessoas já teve seus filhos e,
portanto, já tiveram tempo de transmitir o gene deletério.

Seria adequado oferecer o diagnóstico genético a uma


pessoa jovem e saudável, considerando que nada pode ser
feito no sentido de aliviar os sintomas quando eles surgirem?
Vale a pena angustiar uma pessoa com a possibilidade de vir
a ter uma doença incurável ou é melhor que ela permane-
ça na ignorância? Quais seriam os riscos psicológicos nes-
se caso? Aproximadamente 10% das pessoas que realizam o
teste para verificar a existência do gene causador da doença
de Huntington, jamais conseguem uma adaptação satisfatória
após receber as informações sobre sua condição genética. É
interessante notar que essa parcela de 10% inclui tanto indi-
víduos detectados como portadores do gene, como aqueles
com diagnóstico favorável.
330
Biologia Molecular

Você gostaria de saber que é portador do gene de uma


doença incurável, como por exemplo, a coréia de Huntington?
Estaria preparado para essa informação, mesmo que não pu-
desse alterar seu destino? Caso sua morte fosse precoce,
talvez você sentisse desinteresse em continuar lutando pelos
seus projetos de vida. Por outro lado, isso lhe daria a opor-
tunidade de desfrutar da melhor forma possível o tempo que
lhe resta e de organizar o futuro de sua família. E qual seria a
reação das pessoas ao seu redor se soubessem de sua morte
iminente? Mesmo no caso de doenças facilmente tratadas, se
descobertas no estágio inicial, como ocorre em vários tipos
de cânceres, muitas pessoas ainda preferem não realizar um
teste genético que indicasse a presença, ou não, de um gene
envolvido no aparecimento desta doença.

Além disso, como proceder nos casos onde fica definido que
um indivíduo pode transmitir o gene de uma doença, porém, o
mesmo também descobre que parentes próximo também terão
o mesmo risco? Como exemplo, uma mulher pode ser alertada
sobre seu risco de ter um filho do sexo masculino com distro-
fia de Duchenne (o risco é de 50%). Porém o consultor alerta
à mesma que suas tias ou primas também teriam algum risco
de serem portadoras e adverte que estas deveriam fazer uma
consulta para avaliar os riscos. A mulher, por sua vez, se nega a
alertar seus parentes. Teríamos nós o direito de invadir a priva-
cidade alheia e procurar as pessoas que apresentam risco? Ou
devemos ignorar e deixar que o destino se encarregue de gerar
ou não uma criança com uma doença grave?

Do ponto de vista positivo, o diagnóstico feito pela análise


do DNA daria aos portadores a opção de não gerarem filhos.
Sob outro ponto de vista, aconselhar ou até mesmo impedir
um indivíduo de gerar um filho com a finalidade de impedir a
transmissão de um gene defeituoso, não seria uma forma de
discriminação?
331
Biologia Molecular

É possível que em 30 ou 40 anos os indivíduos tenham um


mapa completo de seus genomas logo ao nascimento. As pes-
soas não seriam discriminadas por apresentar genes defeituo-
sos ou que fujam do que é considerado “normal”? Quem deve-
ria ter acesso a essa informação? No filme de 1997, “Gattaca,
uma experiência genética”; uma mulher que tinha acabado de
dar o primeiro beijo em um possível namorado, retira da sua
mucosa bucal células do seu pretendente e realiza uma aná-
lise do DNA de seu companheiro antes de dar, ou não, con-
tinuidade ao namoro. Em uma entrevista de emprego seriam
aceitos apenas os indivíduos que carreguem genes “bons”?
As empresas de planos de saúde poderiam até mesmo re-
jeitar quem fosse propenso a desenvolver alguma doença. É
fato que existe a necessidade dos governos e da sociedade
se mobilizarem no sentido de protegerem os indivíduos dos
possíveis danos que poderão surgir do mau uso de toda essa
nova informação.

A vantagem de termos todo o nosso DNA decodificado em


um CD, por exemplo, é a possibilidade de termos uma medi-
cina preventiva, com tratamentos prescritos individualmente,
reduzindo-se os efeitos colaterais. Atualmente, existe muito
pouco que se possa fazer no sentido de modificar a informa-
ção genética que herdamos. Em relação a algumas caracte-
rísticas, o papel do meio ambiente é zero, já em relação a
outras características, como por exemplo, na fenilcetonúria
e em vários tipos de câncer, a importância dos fatores am-
bientais é muito maior e, nesses casos, podemos prevenir o
aparecimento dos sintomas, mesmo que tenhamos herdado
genes de pré-disposição ao desenvolvimento dessas doenças
de nossos pais.

Apesar de os médicos aconselharem um hábito de vida


saudável, um indivíduo que tivesse propensão genética à hi-
pertensão teria a oportunidade, desde a infância, de abster-
332
Biologia Molecular

se do cigarro, realizar atividades físicas constantemente e ter


uma dieta mais saudável. Portanto, os testes genéticos para
a doenças de herança multifatorial serviriam de alerta para o
indivíduo. Por outro lado, pessoas mais céticas alegam que o
indivíduo poderia passar a vida inteira preocupando-se com o
surgimento do quadro hipertensivo, esquecendo-se de viver e
passando a apenas “sobreviver” como se estivessem em uma
redoma de vidro.

Se as pessoas souberem que herdaram um gene falho,


podem perder a esperança e esperar que a ciência crie uma
“pílula milagrosa” e pessoas com a ausência desses genes
defeituosos poderem achar que estão livres de problemas.
Além disso, devemos ressaltar que em várias doenças, como
hipertensão e câncer, os genes falhos carregam a arma, mas
o estilo de vida puxa o gatilho.

13.1.5 Construção de armas biológicas

A Tecnologia do DNA Recombinante pode ser utilizada


também no desenvolvimento de armas biológicas. Com tantos
benefícios que essa metodologia pode nos trazer cabe aos
governantes decidirem o que seria eticamente aceitável. Se-
ria justo negarmos a evolução do conhecimento temendo que
a humanidade não esteja preparada para lidar com tais fer-
ramentas? Isso seria mais ou menos como condenarmos a
utilização da eletricidade por haver mortes devido a choques
elétricos.

Na década de 1960 os transplantes de coração eram rea-


lizados com uma taxa de sucesso praticamente zero. Hoje em
dia, os avanços são enormes aos de 50 anos atrás; porém se
os transplantes iniciais de coração tivessem sido proibidos,
com certeza não teríamos tido nenhum avanço nessa área. É
certo interferir em benefício de um indivíduo mesmo que isso
333
Biologia Molecular

represente riscos para a espécie? A sociedade precisa opinar,


por exemplo, se for preciso que algumas vidas humanas se-
jam até mesmo perdidas para que milhões de pessoas sejam
beneficiadas.

13.2 CONSIDERAÇÕES FINAIS

Nas últimas décadas, várias empresas de Biotecnologia


surgiram e houve um enorme avanço científico na área da
Biologia Molecular. Várias parcerias foram realizadas entre
professores e pesquisadores de Universidades ou de Institu-
tos de Pesquisa governamentais com grandes empresas pri-
vadas, principalmente ligadas a área da saúde ou agrícola.
Porém, sabe-se que as grandes empresas, por financiarem a
pesquisa, esperam a obtenção de um produto comercial em
curto prazo; o que é inviável em muitos projetos. É importante
lembrarmos que grandes descobertas científicas foram obra
do acaso, como por exemplo, a descoberta da penicilina. Ou-
tros projetos que resultarem em enormes avanços científicos
não tinham grandes pretensões (na época em que as enzimas
de restrição foram descobertas, não se percebeu a aplicação
prática delas). Por outro prisma, milhões de dólares seriam
gastos se não houvesse um retorno financeiro para cobrir os
gastos com a pesquisa, além de gerar lucro aos acionistas
destas grandes empresas?

Devido ao fato de que os grandes cientistas da atualida-


de estejam trabalhando em empresas privadas, quem terá a
capacidade de emitir um parecer técnico preciso e imparcial
a respeito da ética e segurança de um produto produzido por
meio das novas técnicas de Biologia Molecular? Como será
realizada a orientação aos governantes no momento da apro-
vação de alguma lei que possa beneficiar uma empresa liga-
da à Biotecnologia, e que envolva milhões de dólares, apesar
de levar prejuízos à saúde da maioria da população? Essas
334
Biologia Molecular

questões dizem respeito a todos nós e são muito sérias para


serem decididas somente pelos cientistas. Essas decisões
afetam nossas vidas e a de nossos filhos; a população possui
ou não o direito de opinar a respeito da aprovação de alguma
lei que envolva essas novas técnicas moleculares?

Essas decisões devem ser tomadas baseadas em mui-


ta discussão a partir da disseminação da informação corre-
ta. Para isso, é necessário, desde já um investimento maci-
ço em educação da população desde o Ensino Fundamental,
para que esses indivíduos quando forem intimados a decidir a
respeito de dilemas éticos como por exemplo a utilização de
embriões congelados, a aprovação do aborto terapêutico, do
tratamento intra-uterino ou da clonagem terapêutica, tenham
plena consciência da sua decisão (é muito melhor temos es-
colhas difíceis a fazer do que nenhuma escolha). As questões
éticas, geradas pela aplicação de novas tecnologias na ge-
nética humana, deveriam servir como estímulo para que toda
a sociedade se envolvesse na discussão e participasse das
decisões a respeito de que atitude seria a mais adequada.

Será que essas questões éticas apresentadas estão dis-


tantes de países subdesenvolvidos ou em desenvolvimento?
Pessoas que morrem de fome ou nas portas dos hospitais por
falta de atendimento médico teriam acesso aos diagnósticos
genéticos mais sofisticados? Sob outro ponto de vista não ha-
veria grandes mudanças já que o acesso aos planos de saúde
atualmente não é possível para a fatia da população menos
favorecida economicamente.

O Brasil apresenta um elevado índice de analfabetos e de


analfabetos funcionais (aqueles que conseguem ler, mas não
compreendem um texto); além de apenas 5% da população
concluir algum curso superior. Nessas condições, como re-
alizar uma votação a respeito da aprovação de uma lei que
335
Biologia Molecular

autorize a utilização de embriões congelados em clínicas de


fertilização in vitro para a obtenção de células-tronco? O Brasil
pode aprender com a experiência adquirida em países desen-
volvidos, adaptando soluções a nossa realidade, evitando os
erros cometidos nesses países.

Os novos avanços científicos ocorreram em um curto es-


paço de tempo; se lembrarmos que há alguns milhares de
anos atrás nossos ancestrais adotaram a postura ereta e que
há algumas centenas de anos se acreditava que o Minotauro
era resultado de um cruzamento entre um touro e uma mulher,
vemos como o mundo em que vivemos mudou nas últimas dé-
cadas. De qualquer forma, os avanços científicos ocorrerão e
devem continuar ocorrendo. Eticistas e cientistas podem não
gostar, mas se a pesquisa funcionar, logo será aceita pela opi-
nião pública e consequentemente a lei irá atrás. A ética segue
a ciência, nunca a direciona. Eticistas adoram dizer aos ge-
neticistas o que fazer, mas será que eles irão ouvir? Portanto,
cabe à sociedade usufruir desses importantes avanços cien-
tíficos e exigir que seja garantida a preservação de princípios
éticos.

Podemos perceber que a ciência caminha mais rápido que


a reflexão ética por parte da sociedade. A humanidade ainda
não encontrou resposta para diversas questões éticas. Muitas
requerem discussões e elaboração de leis sobre bioética para
legitimar a sua prática ou para proibir experiências que sejam
julgadas como abusivas. Assim, com o progresso veloz das
pesquisas biomédicas, estas leis correm o risco de estarem
defasadas no momento em que forem promulgadas.

Vale ressaltar que não existem fórmulas éticas infalíveis


a serem aplicadas, haja vistas a constante agregação de no-
vos valores decorrentes de novas investigações, valores estes
que buscam uma integração entre a ética e as biociências.
336
Biologia Molecular

É um erro falarmos que não há riscos, alguns até desco-


nhecidos por nós; mas se não arriscarmos não haverá pro-
gresso, mesmo que isso, infelizmente, custe algumas vidas
humanas. Nenhum geneticista aceitará a frustração de não ter
tentado por dizer que a Genética Molecular é perigosa ou que
nenhum avanço ocorrerá. A única opção é ir em frente.

337
Biologia Molecular

BIBLIOGRAFIA

ALBERTS, B.; BRAY, D.; LEWIS, J.; RAFF, M.; ROBERTS, K.;
WATSON, J. Biologia Molecular da Célula. 3ª ed. Porto Alegre,
Brasil. Editora Artes Médicas Sul LTDA, 1294p., 1997.

ALFENAS, A C. Eletrofrorese de isoenzimas e proteínas afins-


Fundamentos e aplicações em plantas e microrganismos. Edi-
tora UFV – Viçosa MG, 1998, 574p.

ALLENDORF, F.; LUIKART, G. Conservation and the Gene-


tics of Populations. Blackwell Publishing, Oxford, UK, 642 p.,
2007.

ALMEIDA, V.; LEITÃO, A.; REINA, L.; MOUNTANARI, A.; DON-


NICI, C. Câncer e agentes antineoplásicos ciclo-celular espe-
cíficos e ciclo-celular não específicos que interagem com o
DNA: uma introdução. Química Nova, v. 28, p. 118-129, 2005.

ALTSCHUL, S.F.; GISH, W.; MILLER,W. et al. Basic local


alignment search tool. Journal of Molecular Biology, Amster-
dam, v.215, n.3, p.403-410, 1990.

AMARAL, A.M.; REIS, M.; SILVA, F.R. (Org.). O programa


Blast: guia prático de utilização. Brasilia: Embrapa, 2007. 24 p.
(Documentos). Disponível em: http://www.infoteca.cnptia.em-
brapa.br/bitstream/CENARGEN/29678/1/doc224.pdf>. Aces-
so em: 8 fev. 2011.

ARUSEKAR, S.; BRINGHURST, R.S.; VOTH, V. Inheritance of


PGI and LAP isozymes in octoploid cultivated strawberries. J.
Am. Soc. Horticult. Sci., 106: 679-683, 1981.

AVISE, J.C. Molecular Markers, Natural History and Evolution


(second ed.), Sinauer Associates, Massachusetts, 2004.
338
Biologia Molecular

BATTERSHILL, J.M.; BURNETT, K.; BULL, S. Factors


affecting the incidence of genotoxicity biomarkers in peripheral
blood lymphocytes: impact on design of biomonitoring studies.
Mutagenesis, vol. 23, n. 6, pp. 423–437, 2008.

BÉJÀ, O., SUZUKI, M.T.; KOONIN, E.V. et al. Construction


and analysis of bacterial artificial chromosome libraries from
a marine microbial assemblage. Environmental Microbiology,
v.2, n.5, p.516-29, 2000a.

BÉJÀ, O. et al. Bacterial rhodopsin: evidence for a new type of


phototrophy in the sea. Science, v.289, n.5486, p.1902-6, 2000b.

BLANCO, L.; SALAS, M. Characterization and purification of a


phage 29 coded DNA polymerase required for the initiation of
replication. Proceedings of the National Academy of Sciences
of the USA, v.81, p.5325-5329, 1984.

BOLOGNESI, C. Genotoxicity of pesticides: a review of human


biomonitoring studies. Mutat. Res., 543, 251–272, 2003.

BORÉM, A.; SANTOS, F.R. Biotecnologia simplificada. 2ª ed.,


Viçosa: EDUFV, 2003.

BRITO, L.G.; OLIVEIRA, M.C.S.; MOURA, M.M.F. et al. Extra-


ção de DNA a partir de coágulos sanguíneos bovinos. Porto
Velho: Embrapa, 2006.

BRODERICK, N.A.; RAFFA, K.F.; HANDELSMAN, J. Midgut


bacteria required for Bacillus thuringiensis insecticidal activity.
Proceedings of the National Academy of Science of the USA,
v.103, n.41, p.15196-9, 2006.

BROWN, T.A. Genética – Um enfoque molecular. Guanabara


Koogan. Rio de Janeiro, 3a ed., 1999.
339
Biologia Molecular

CHENG, H.R.; JIANG, N. Extremely rapid extraction of DNA


from bacteria and yeasts. Biotechnol. Lett. 28: 55-59, 2006.

CHEUNG, W.Y.; HUBERT, N.; LANDRY, B.S. A simple and ra-


pid DNA microextration method for plant, animal, and insect
suitable for RAPD and other PCR analyses.Technical Tips, v.
3, p. 69-70, 1993.

CHIARI, L.; VALLE, J.V.R.; RESENDE, R.M.S. Comparação


de três métodos de extração de DNA genômico para análi-
ses moleculares em Stylosanthes guianensis. Campo Grande:
Embrapa, 2009.

CHOU, H.; HOLMES, M.H. DNA sequence quality trimming


and vector removal. Bioinformatics 17: 1093-1104, 2001.

CURTIS, H. Biologia. Rio de Janeiro: Guanabara Koogan, 1977.

DA SILVA, J.; ERDTMANN, B.; HENRIQUES, J.A.P. Genética


Toxicológica. Porto Alegre: Alcance, v.1, 424p., 2003.

DA SILVA, J.; MORAES, C.R.; HEUSER, V.D. et al. Evaluation


of Genetic Damage in a Brazilian Population Occupationally
Exposed to Pesticides and its Correlation with Polymorphisms
in Metabolizing Genes. Mutagenesis, v. 23, p. 415-422, 2008.

DEGANI, A.G.; CASS, Q.B.; VIEIRA, P.C. Cromatografia: um


breve ensaio. Química Nova na escola, n. 7, 1998.

DEITEL, H.M.; DEITEL, P.J.; NIETO, T.R; MCPHIE, D.C. Perl


- Como programar. ISBN: 8573079800.

DELLAPORTA, S.L; WOOD, J.; HICKS, J.B. A plant


minipreparation: version II. Plant Molecular Biology Report, v.
1, p. 19-20, 1983.
340
Biologia Molecular

D’ERRICO, M.; PARLANTI, E.; DOGLIOTTI, E. Mechanism


of oxidative DNA damage repair and relevance to human
pathology. Mutation Research, p. 4-14, 2008.

DOYLE, J.J.; DOYLE, J.L. A rapid DNA isolation procedure for


small quantities of fresh leaf tissure. Phytochemical Bulletin, v.
19, p. 11-15, 1987.

DUAN, C.J. et al. Isolation and partial characterization of novel


genes encoding acidic cellulases from metagenomes of buffalo
rumens. Journal of Applied Microbiology, v.107, p.245-256, 2009.

DUAN, Y. et al. Complete genome sequence of citrus


huanglongbing bacterium, ‘Candidatus Liberibacter asiaticus’
obtained through metagenomics. Molecular Plant-Microbe
Interactions, v.22, n.8, p.1011-1020, 2009.

EWING, B.; GREEN, P. Base-calling of automated sequencer


traces using phred. II. Error probabilities. Genome Res., 8:186-
94, 1998.

FARAH, S.B. DNA segredos e mistérios. São Paulo: Sarvier,


2007.

FERREIRA, E.M.; GRATTAPAGLIA, D. Introdução ao uso de


marcadores moleculares em análise genética. 3. ed. Brasília:
Embrapa, 1998.

FERRER, M. et al. Microbial enzymes mined from the Urania


deep-sea hypersaline anoxic basin. Chemistry & Biology, v.12,
p.895–904, 2005.

FERRER, M. et al. Biochemical and structural features of a


novel cyclodextrinase from cow rumen metagenome. Biotech-
nology Journal, p. 207–213, 2007.
341
Biologia Molecular

FRANÇA, L. T. C. CARRILHO, E.; KIST, T. B. L. A review of


DNA sequencing techniques. Quarterly Reviews of
Biophysics, v. 35, n. 02, p. 169-200, 20 ago 2002.

FREDRICKS, D.N; SMITH, C; MEIER, A. Comparison of six DNA


extraction methods for recovery of fungal DNA as assessed by
quantitative PCR. J. Clin. Microbiol. 43: 5122-5128, 2005.

FREITAS, A.B.; MAGALHÃES, J.P. A review and appraisal of


the DNA damage theory of ageing Alex A. Mutation Research,
(2011) IN PRESS.

FRIAS-LOPEZ, J. et al. Microbial community gene expres-


sion in ocean surface waters. Proceedings of the National
Academy of Science of the USA, v.105, n.10, p.3805-10,
2008.

FRIEDMANN, T. Rapid Nucleotide Sequencing of DNA.


American Society of Human Genetics, v. 31, p. 19-28, 1979.

GALVIN, P. B.; SILBERSCHATZ, A. Sistemas Operacionais –


Conceitos. PEARSON BRASIL, 2000, ISBN: 8587918028.

GIBAS, C. e JAMBECK, P. Desenvolvendo Bioinformática:


Ferramentas de software para aplicações em biologia. Tra-
dução Milarepa LTDA. Rio de Janeiro. 2001. ISBN: 85-352-
0923-9.

GONZÁLEZ-PASTOR, J.E.; MIRETE, S. Novel metal


resistance genes from microorganisms: a functional
metagenomic approach. Methods in Molecular Biology,
v.668, p.273-285, 2010.

GRIFFITHS, A.J.F.; GELBART, W.M. Genética moderna. Rio


de Janeiro: Guanabara Koogan, 2001.
342
Biologia Molecular

GRIFFITHS, A.; WESSLER, S.; LEWONTIN, R.; GELBART,


W.; SUZUKI, D.; MILLER, J. Introduction to Genetic Analysis.
Eighth Edition. W. H. Freeman & Company, 2005.

GRUTZMACHER, D.D.; ZIMMER, P.D.; OLIVEIRA, A.C.; LO-


ECK, A.E.; FISCHER, S.; ELIAS, S.A.; VARGAS, C.C.J. Com-
paração de protocolos para extração de DNA de Acromyrmex
heyeri. Revista Brasileira de Agrociência, Pelotas, v. 8, n. 2, p.
165-167, 2002.

GUAN, C. et al. Signal mimics derived from a metageno-


mic analysis of the gypsy moth gut microbiota. Applied
and Environmental Microbiology, v.73, n.11, p.3669-76, 2007.

GUPTA, M. et al. Amplification of DNA markers from


evolutionarily diverse genomes using single primers of
simple-sequence repeats. Theoret. Appl. Genet., 89: 998-
1006, 1994.

HAGMAR L.; STROMBERG, U.; BONASSI, S. et al. Impact


of types of lymphocyte chromosomal aberrations on human
cancer risk: results from Nordic and Italian cohorts. Cancer
Res., v.64, p.2258–2263, 2004.

HANAHAN, D.; WEINBERG, R.A. The hallmarks of cancer.


Genes to cells, v. 100, p. 57-70, 2000.

HANDELSMAN, J. et al. Molecular biological access to the


chemistry of unknown soil microbes: a new frontier for natural
products. Chemistry and Biology, v.5, p.245-249, 1998.

HARDEMAN, F.; SJOLING, S. Metagenomic approach for


the isolation of a novel low-temperature-active lipase from
uncultured bacteria of marine sediment. FEMS Microbiology
Ecology, v.59, p. 524–534, 2007.
343
Biologia Molecular

HEATH, C.; HU, X.P.; CARY, S.C.; COWAN, D.


Identification of a novel alkaliphilic esterase active at low
temperatures by screening a metagenomic library from An-
tarctic desert soil. Applied and Environmental Microbiology,
v.75, p.4657-4659, 2009.

HESS, M. et al. Metagenomic discovery of biomass-degrading


genes and genomes from cow rumen. Science, v.331, n.6016,
p.463-467, 2011.

HONGOH, Y.; TOYODA, A. Whole-genome sequencing of


unculturable bacterium using whole-genome amplification.
Methods in Molecular Biology, v.733, p.25-33, 2011.

HOLLEY, R. W.; APGAR, J.; EVERETT, G. A.; et al.


Structure of a ribonucleic acid. Science, v.147, p. 1462–
1465, 1965.

HUTCHISON, C. A. DNA sequencing: bench to bedside and


beyond. Nucleic acids research, v. 35, n. 18, p. 6227-37, jan
2007.

INVITROGEN. DNA extraction from tissue. Invitrogen Life


Science, 2011.

JAMES, D.W.; MICHEL, G. O DNA recombinante. 2ed. Ouro


Preto: UFOP, 1997.

JUNQUEIRA, L.C. & CARNEIRO, J. 2005. Biologia Celular e


Molecular. Rio de Janeiro: Guanabara Koogan, 2005.

KANAAR, R. C.; WYMAN, R. ROTHSTEIN, Quality control of


DNA break metabolism: in the ‘end’, it’s a good thing. EMBO
J., 27: 581–588, 2008.

344
Biologia Molecular

Kenedy, R.; D’Andrea, A. DNA Repair Pathways in Clinical


Practice: Lessons From Pediatric Cancer Susceptibility
Syndromes. Journal of Clinical Oncology, vol. 24, no. 23,
2006.

KHANUJA, S.P.S.; SHASANY, A.K.; DAROKAR, M.P.; KUMAR, S.


Rapid Isolation of DNA from Dry and Fresh Samples of Plants
Producing Large Amounts of Secondary Metabolites and
Essential Oils. Plant Mol. Biol. Rep., 17: 1-7, 1999.

KULTZ, D. Molecular and evolutionary basis of the cellular


stress response. Annu. Rev. Physiol., 67, 225–257, 2005.

KULKARNI, R.; THOMAS, R. A. e TUCKER, J.D. Expression


of DNA Repair and Apoptosis Genes in Normal Cells Follo-
wing to Ionizing Radiation. Environmental and Molecular
Mutagenesis, 52, 229-237, 2011.

LACORTE, G.A.; DIAS, I.M.G.; CARVALHO, M.R.S. Extração


não-invasiva de DNA de Equus caballus: uma avaliação de
métodos. In: V Simpósio da Sociedade Brasileira de Melhora-
mento Animal. Pirassununga, 2004.

LEME, D.M.; MARIN-MORALES, M.A. Allium cepa test in


environmental monitoring: A review on its application. Mutation
research, 2009.

LESK, A.M. Introdução à bioinformática. Tradução Ardala Elisa


Breda Andrade, et al., 2a. edição. Porto Alegre. 2008.

LI, M. et al. Symbiotic gut microbes modulate human metabolic


phenotypes. Proceedings of the National Academy of Science
of the USA, v.105, n.6, p.2117-22, 2008.

345
Biologia Molecular

LILES, M.R. et al. A census of RNAr genes and linked


genomic sequences within a soil metagenomic library.Applied and
Environmental Microbiology, v.69, n.5, p.2684-91, 2003.

LILES M.R. et al. Recovery, purification and cloning of high


molecular weight DNA from soil microorganisms. Applied
and Environmental Microbiology, v.74, n.10, p.3302-3305,
2008.

LODHI, M.A.; YE, G.; WEEDEN, N. F.; REISCH, B. I. A


simple and efficient method for DNA extractions from grapevine
cultivars and Vitis species. Plant Mol. Biol., 12:6-13, 1994.

LOURENA, M.V. Desenvolvimento de sistemas farmacêuticos


emulsionados para veiculação gênica. Programa de pós-gra-
duação da Genética e Biologia Molecular, Natal, 2007.

MAGALHÃES, V.D.; FERREIRA, J.C.; BARELLI, C.; DARINI,


A.L.C. Eletroforese em campo pulsante em bacteriologia –
uma revisão técnica. Revista Instituto Adolfo Lutz, v. 64, n. 2,
p.155-161, 2005.

MALACINSKI, G.M. Fundamentos de Biologia Molecular. Gua-


nabara Koogan. Rio de Janeiro, 2005.

MALUF, S.W.; ERDTMANN, B. Biomonitoração do dano ge-


nético em humanos. In: SILVA, J. DA; ERDTMANN, B.; HEN-
RIQUES, J. A. P. (Orgs.) Genética toxicológica. Porto Alegre:
Editora: Alcance, p. 183-205, 2003.

MAXAM, A. M.; GILBERT, W. A new method for sequencing


DNA. Proceedings of the National Academy of Sciences of the
United States of America, v. 74, n. 2, p. 560-564, out 1977.

346
Biologia Molecular

MAZZA, M.C.M.; BITTENCOURT, J.V.M. Extração de DNA de


tecido vegetal de Araucaria angustifolia (Araucariae). Boletim
de Pesquisa Florestal, Colombo, n. 41, p. 12-17, 2000.

MCENTYRE, Jo; OSTELL, Jim (Ed.). The NCBI Handbook.


In: MADDEN, Tom. The BLAST Sequence Analysis Tool.
Bethesda: Ncbi, 2002. Cap. 16, p. 1-20. Disponível em:
<http://www.ncbi.nlm.nih.gov/books/NBK21097/#A614>.
Acesso em: 8 fev. 2011.

MENDONZA, D.G.; DELIRA, R.A.; TREJO, A.M.; HERRERA,


A.P.; DIAZ, L.C.; JUAREZ, O.G.; ALACRON, A. A rapid method
for isolation of total DNA from pathogenic filamentous plant
fungi. Genetics and Molecular Research. v. 1, 2010.

METTEL, C.; KIM, Y.; SHRESTHA, P.M.; LIESACK, W.


Extraction of RNAm from soil. Applied and Environmental
Microbiology, v.76, n.17, p.5995-6000, 2010.

MESQUITA, R.A.; ANZAI, E.K.; OLIVEIRA, R.N.; NUNES, F.D.


Avaliação de três métodos de extração de DNA de material
parafinado para amplificação de DNA genômico pela técnica
da PCR. Pesquisa Odontológica Brasileira, São Paulo, v. 15,
n. 4, p. 314-319, 2001.

METZKER, M. L. Sequencing technologies - the next generation.


Nature reviews. Genetics, v. 11, n. 1, p. 31-46, jan 2010.

MICALES, J.A.; BONDE, M.R.; PETERSON, G.L. The use of


isozyme analysis in fungal taxonomy and genetics. Micotaxon.
27: 405-449, 1986.

347
Biologia Molecular

MOLINARE, H.B.; CROCHEMORE, M.L. Extração de DNA


genômico de Passiflora spp. para análises de PCR-RAPD.
Revista Brasileira de Fruticultura, Jaboticabal, v. 23, n. 2, p.
447-450, 2001.

MORETI, T. Identificação humana: Uma proposta metodológi-


ca para obtenção de DNA de ossos e implementação de ban-
co de dados de frequências alélicas de STRs autossômicos
na população de Santa Catarina. Programa de Pós-graduação
em Biotecnologia, Florianópolis, 2009.

MORIMOTO, C.E. Linux, Guia Prático. GDH Press e Sul Edi-


tores, 2009, ISBN: 978-85-99593-15-8.

MOUNT, D.W. Bioinformatics: Sequence and Genome


Analysis. Cold Spring Harbor Laboratory Press, 2 ed, 2004,
ISBN: 0879697121.

MOUSTACCHI, E. DNA damage and repair: consequences on


dose-responses. Mutation Research, v. 464, p. 35 - 40, 2000.

MULLER F.M.; WERNER, K.E.; KASAI, M.; FRANCESCONI,


A. Rapid extraction of genomic DNA from medically important
yeasts and filamentous fungi by high-speed cell disruption. J.
Clin. Microbiol., 36: 1625-1629, 1998.

MURPHY R.W., SITES, J.W.Jr., BUTH, D.G., D. G. & HAU-


FLER, C.H. Proteins I; Isozyme electrophoresis. In: Molecular
systematics. Hillis, D.M. & Moritz, C. (eds) Sinauer Associates,
Sunderland MA. pp. 45-126. 1990.

NICKERSON, D.A.; TOLE, V.O.; TAYLOR, S.L. PolyPhred:


automating the detection and genotyping of single nucleotide
substitutions using fluorescence-based resequencing. Nucleic
Acids Res. 25: 2745-51, 1997.
348
Biologia Molecular

NOVELLI M.V., MACHADO M.A., LOPES C.R. Isoenzymatic


polymorphism in Citrus spp. and Poncirus trifoliata (L.) Raf.
(Rutaceae). Genetics and Molecular Biology. 23, 1, 163-168,
2000.

NOWROUSIAN, M. Next-generation sequencing techniques


for eukaryotic microorganisms: sequencing-based solutions to
biological problems. Eukaryotic cell, v. 9, n. 9, p. 1300-1310, 2
jul 2010.

OLIVEIRA, C.A.; ALVES, V.M.C.; GOMES, E.A.; LANNA,


U.G.P.; SÁ, N.M.H.; MARRIEL, I.E. Otimização da Metodolo-
gia de Extração e Amplificação do DNA de Fungos do Solo.
Sete Lagoas: Embrapa, 2005.

OLIVEIRA, M.C.S. Fundamentos teórico-práticos e protocolos


de extração e de amplificação de DNA por meio de reação em
cadeia da polimerase. São Carlos: Embrapa Pecuária Sudes-
te, 2007.

ORASMO, G.R. Caracterização Genética e Bioquímica de Es-


terase em Cultivares de Videira (Vitaceae). Tese. Universida-
de Estadual de Maringá. Maringá, 65p. 2006.

ORASMO, G.R. & MACHADO, M.F.P.S. Isozyme diversity in


RB (Republic of Brazil) sugarcane (Saccharum spp.) varieties.
Acta Scient.: Biol. Sci., Maringá, v. 25, n. 1, p. 213-219, 2003.

PEARSON, W.R. Rapid and sensitive sequence comparison


with FASTP and FASTA. Methods in enzymology, New York,
n.183, p. 63-98, 1990.

PEVSNER, J. Bioinformatics and Functional Genomics. Wiley-


-Blackwell. 2 ed, 2009, ISBN: 0470085851.

349
Biologia Molecular

PETTERSON, E. LUNDEBERG, J.; AHMADIAN, A.


Generations of sequencing technologies. Genomics, v. 93,
n. 2, p. 105-111, 2009.

PLATT et al. Unexpected DNA damage caused by polycyclic


aromatic hydrocarbons under standard laboratory conditions.
Mutation Research, 650, 96–103, 2008.

RIBEIRO, L.R.; SALVADORI, M.F.; MARQUES, E.K.


Mutagenesis Ambiental, 356 p., 2003.

RICHES, L.C.; LYNCH1, A.M.; NIGEL, J. Gooderham events


in the mammalian response to DNA double-strand breaks.
Mutagenesis, vol. 23, no. 5, pp. 331–339, 2008.

RIO, R.V.; LEFEVRE, C.; HEDDI, A.; AKSOY, S. Comparati-


ve genomics of insect-symbiotic bacteria: influence of host
environment on microbial genome composition. Applied and
Environmental Microbiology, v.69, n.11, p.6825-32, 2003.

ROMANO, E.; BRASILEIRO, A.C.M. Extração de DNA de plan-


tas. Biotecnologia Ciência & Desenvolvimento, Brasília, v. 5, n.
29, p. 40-43, 1999.

ROTHBERG, J. M.; HINZ, W.; REARICK, T. M. et al. An


integrated semiconductor device enabling non-optical genome
sequencing. Nature, v. 475, n. 7356, p. 348-352, 2011.

SÁ, A.L. Ética Profissional. Atlas. São Paulo. 2000.

SACCONE, C.; ATTIMONELLI, M.; SBISA, E. Structural


elements highly preserved during the evolution of the D-Loop-
-containing region in vertebrate mitochondrial DNA. Journal of
Molecular Evolution, 26: 205-211, 1987.

350
Biologia Molecular

SAFFI, J.; HENRIQUES, J.A.P. Reparação de DNA em cé-


lulas eucarióticas. In: Genética Toxicológica. Org. JULIANA
DA SILVA, BERNARDO ERDTMANN, JOÃO ANTONIO PE-
GAS HENRIQUES, Porto Alegre: Editora: Alcance, p. 271-
305, 2003.

SAMBROOK J., FRITSCH E. F. AND MANIATIS T. Molecular


cloning. A laboratory manual, 2nd ed. Cold Spring Harbor La-
boratory Press, Cold Spring Harbor, 1989.

SAMBROOK, J.; RUSSELL, D.W. Molecular Cloning: A


Laboratory Manual. Cold Spring Harbor Laboratory Press,
Cold Spring Harbor, New York, 2001.

SANGER, F. NICKLEN, S.; COULSON, A. R. DNA sequencing


with chain-terminating inhibitors. Proceedings of the National
Academy of Sciences of the United States of America, v. 74, n.
12, p. 5463-5467, 1977.

SCHLOSS, P.D.; HANDELSMAN, J. Status of the microbial


census. Microbiology and Molecular Biology Review, v.68,
p.686–91, 2004.

SCHLOSS, P.D.; HANDELSMAN, J. The last word: books as a


statistical metaphor for microbial communities. Annual Review
in Microbiology, v.61, p.23–34, 2007.

SCHLOSS, P.D.; HANDELSMAN, J. A statistical toolbox for


metagenomics: assessing functional diversity in microbial
communities. BMC Bioinformatics, v.9, p.34, 2008.

SCHLOTTERER, C; WIEHE, T. Microsatellites, a neutral


marker to infer selective sweeps. In: GOLDSTEIN, D.B.;
SCHLOTTERER, C. (eds.) Microsatellites: Evolution and
applications. Oxford University Press, New York, 368p., 1999.
351
Biologia Molecular

SCHMEISSER, C.; STEELE, H.; STREIT, WR. Metagenomics,


biotechnology with non-culturable microbes. Applied and Mi-
crobiology Biotechnology, v.75, n.5, p.955-62, 2007.

SEBAT, J.L.; COLWELL, F.S.; CRAWFORD, R.L. Metagenomic


profiling: microarray analysis of an environmental genomic
library. Applied and Environmental Microbiology, v.69, n.8,
p.4927-34, 2003.

SETUBAL, J.C. & MEIDANIS, J. Introduction to computacio-


nal molecular biology. PWS Publishing Company. 1997. ISBN:
0-534-9526-3.

SHARMA, T.R. Genome analysis and bioinformatics, a practical


approach. Editora I.K. International. 2009.

SHENDURE, J. & JI, H. Next-generation DNA sequencing.


Nature Biotechnology. Review. 2008.

SILVA, J.; ERDTMANN, B.; HENRIQUES, J.A.P. Genética To-


xicológica. Porto Alegre: Editora: Alcance, v.1, 424p, 2003.

SNEATH, P.H.A.; SOKAL, R.R. Numeral taxonomy. San


Francisco, W.R. Freeman, 1973, 573p.

SOBELL, M.G. Practical Guide to Linux Commands, Editors, and


Shell Programming. Prentice Hall, 2 ed, 2009, ISBN 0131367366.

SOLTIS, D.E. & SOLTIS P.S. Isozymes in plant biology. Portland


Oregon Discorides Press, 1989 v.4 : Advances in plant series.
268p

TAUPP M.; MEWIS K.; HALLAM S.J. The art and design
of functional metagenomic screens. Current Opinion in
Biotechnology. 2011 (no prelo)
352
Biologia Molecular

TEIXEIRA, K.R.S.; ARAÚJO, J. L. S. Genômica e Proteômica.


Embrapa Agrobiologia. Documentos 213, 2006, ISSN 1517-8498.

TERRADAS, M.M.; MARTIN, L.; TUSELL, A. DNA lesions


sequestered in micronuclei induce a local defective-damage
response. DNA Repair, 8, 1225–1234, 2009.

THOMPSON & THOMPSON. Genetics in Medicine. 5th ed WB


Saunders, Philadelphia, 1991.

TYLER, H.L.; ROESCH, L.F.; GOWDA, S.; DAWSON, W.O.;


TRIPLETT, E.W. Confirmation of the sequence of ‘Candidatus
Liberibacter asiaticus’ and assessment of microbial diversity
in Huanglongbing-infected citrus phloem using a metagenomic
approach. Molecular and Plant-Microbe Interactions, v.22,
n.12, p.1624-1634, 2009.

TYSON, J.; MATHERS, J.C. Dietary and genetic modulation


of DNA repair in healthy human adults. Proc. Nutr. Soc., 66,
42–51, 2007.

UCHIYAMA, T.; MIYAZAKI, K. Functional metagenomics for


enzyme discovery: challenges to efficient screening. Current
Opinion in Biotechnology, v.20, p. 616–622, 2009.

VALENTE, S.E.S. Caracterização isoenzimática do acesso ori-


ginal de germoplasma de Arachis pintoi e suas populações de-
rivadas. Dissertação. Universidade Estadual Paulista/UNESP,
Campus de Botucatu. Botucatu-SP. 80p. 1995.

VALENTE, S.E.S. Análise da variabilidade genética dentro e


entre espécies de cinco seções do gênero Arachis L. por meio
de RAPDs. Tese. Universidade Estadual Paulista/UNESP,
Campus de Botucatu. Botucatu-SP. 96p. 2000.

353
Biologia Molecular

VAN HAM, R.C. et al. Reductive genome evolution in Buch-


nera aphidicola. Proceedings of the National Academy of
Science of the USA, v.100, n.2, p.581-586, 2003.

VENTER, J.C. et al. The sequence of the human genome.


Science, 291, 1304–1351, 2001.

VIEIRA, T. R. Bioética e Direito. Ed. Jurídica Brasileira. São


Paulo. 1999.

VIEIRA, T. R. Bioética nas Profissões. Ed. Vozes. Rio de


Janeiro. 2005.

WALL, L.; CRISTIANSEN, T.; ORWANT, J. Programming Perl.


O’Reilly Media. 3ed, 2000.

WARMERDAM, O.; KANAAR, R. Dealing with DNA damage:


Relationships between checkpoint and repair pathways.
Mutation Research, 704, 2-11, 2010.

WASCHKOWITZ, T.; ROCKSTROH, S.; DANIEL, R. Isolation


and characterization of metalloproteases with a novel domain
structure by construction and screening of metagenomic libraries.
Applied and Environmental Microbiology, v.75, p.2506-2516,
2009.

WATSON, J.D. Biologia Molecular do Gene. Artmed, Porto


Alegre, 2006.

WENDEL, J.F. & WEEDEN, N.F. Visualization and interpretation


of plant isozymes. In: SOLTIS, D.E.,SOLTIS,P.S. (Eds). Iso-
zymes in plant biology. Portland Oregon Discorides Press,
chap.1, v.4, p.5-45. 1989.

354
Biologia Molecular

WILLIAMS, J.G.K. et al. DNA polymorphisms amplified by ar-


bitrary primers are useful as genetic markers. Nucleic Acids
Res., 18: 6531-6535, 1990.

WILLIAMSON, S.J. et al. The Sorcerer II global ocean


sampling expedition: metagenomic characterization of viruses
within aquatic microbial samples. PLoS ONE, v.3, n.1, 2008.

XIONG, J. Essential Bioinformatics. In: XIONG, J. Pairwise


Sequence Alignment. New York: Cambridge, Cap. 3, p. 31-54,
2006.

ZATZ, M. Projeto Genoma Humano e Ética. São Paulo em


Perspectiva. 14(3): 47-52, 2000.

ZETTLER, L.A.; GOMEZ, F.; ZETTLER, E.; KEENAN, B.G.;


AMILS, R.; SOGIN, M.L. Microbiology: eukaryotic diversity in
Spain’s River of Fire. Nature, v.417, p.137, 2002.

ZHOU, X.; REN, L.; MENG, Q. et al. The next-generation


sequencing technology and application. Protein & cell, v. 1, n.
6, p. 520-36, jun 2010.

ZIERHUT, C.; DIFFLEY, J.F. Break dosage, cell cycle


stage and DNA replication influence DNA double strand break
response. Embo J., 27, 1875–1885, 2008.

ZIETKIEWICZ, E.; RAFALSKI, A.; LABUDA, D. Genome


fingerprinting by simple sequence repeat (SSR) anchored
polymerase chain reaction amplification. Genomics 20: 176-
183, 1994.

355

Você também pode gostar