Cientistas transformam DNA em meio de armazenar dados

Os cientistas sintetizaram pedaços da molécula usando dados de arquivos baixados da Internet, como uma gravação em MP3

Cientistas britânicos anunciaram um salto na busca para transformar o DNA em uma forma revolucionária de armazenamento de dados.

Uma seção de DNA criada pelo homem consegue armazenar montanhas de dados que podem ser congeladas a vácuo, transportadas e armazenadas, potencialmente por milhares de anos, afirmaram.

Os conteúdos são “lidos” decifrando-se o código genético – como é feito rotineiramente hoje – e transformando-os em código de computador.

“Nós já sabemos que o DNA é uma forma robusta de armazenar informação porque podemos extrai-lo de ossos de mamutes, que datam de dezenas de milhares de anos, para estudá-lo”, afirmou Nick Goldman, do Instituto Europeu de Bioinformática (EBI) em Cambridge.

“Também é incrivelmente pequeno, compacto e não precisa de qualquer energia para armazenamento, além de ser fácil de transportar e manter”, acrescentou.

O DNA, molécula da vida, é formada por uma dupla hélice de compostos – uma longa “escada” em espiral molecular, compreendendo quatro degraus químicos: adenina, citosina, guanina e timina, que se combinam aos pares. A citosina (C) combina com a guanina (G), enquanto a timina (T) combina com a adenina (A).


A sequência de letras compõe o genoma ou a estrutura química sobre a qual a vida é criada e sustentada. O DNA humano tem mais de três bilhões de letras, emaranhadas em pacotes de 24 cromossomos.

O projeto consiste em traduzir os dados genéticos para a linguagem binária do computador (0 e 1) e transcrevê-los em um código de “base 3” (ternário), que utiliza zeros, uns e dois.

Os dados são transcritos pela segunda vez como código de DNA, que se baseia em A, C, G e T. Um bloco de cinco letras é usado para um único dígito binário.

As letras são então transformadas em moléculas, usando produtos químicos de laboratório.

Segundo os cientistas, o trabalho não empregou DNA vivo, nem buscou criar qualquer forma de vida e, na verdade, o código feito pelo homem seria inútil para qualquer fim biológico.


“Não temos qualquer intenção de brincar com a vida”, disse Goldman.

Apenas trechos curtos de DNA podem ser feitos, o que significa que a mensagem precisa ser cortada em pequenas seções de 117 letras, cada uma aderida a uma pequena etiqueta, como uma “comutação de pacotes” (técnica em que a mensagem é dividida e enviada em pequenos pacotes) na internet, o que permite que os dados sejam reagrupados.

Para provar sua teoria, a equipe codificou uma gravação em MP3 do discurso “Eu tenho um sonho”, de Martin Luther King; uma foto digital de seu laboratório; um arquivo PDF do estudo de 1953 que descreveu a estrutura de DNA; um arquivo com todos os sonetos de Shakespeare; e um documento que descreve a técnica de armazenamento de dados.

“Nós baixamos os arquivos da internet e os usamos para sintetizar centenas de milhares de pedaços de DNA. O resultado parece com uma minúscula partícula de poeira”, explicou Emily Leproust, da empresa americana de biotecnologia Agilent, que pegou os dados digitais e os utilizou para sintetizar moléculas de DNA no laboratório.

A Agilent enviaram por correio a amostra de volta ao EBI, na Inglaterra, onde os cientistas encharcaram o DNA com água para reconstitui-lo e usaram equipamento padrão de sequenciamento para desvendar o código. Eles recuperaram e leram os arquivos com 100% de exatidão.

O trabalho se segue a um avanço feito no ano passado, quando cientistas da Universidade de Harvard anunciaram ter armazenado 700 terabytes de dados – o suficiente para armazenar cerca de 70.000 filmes – em uma grama de DNA.


O novo método elimina o risco de erro na leitura do DNA, afirmam os cientistas, cujo trabalho foi publicado na edição desta semana da revista Nature.

“Nós pensamos, vamos partir o código em muitos fragmentos sobrepostos indo nas duas direções, com informação indexada indicando onde cada fragmento se encaixa no código geral, e fizemos um esquema codificado que não permite repetições”, explicou Ewan Birney, co-autor do estudo.

“Desta forma, você precisaria cometer o mesmo erro em quatro diferentes fragmentos para falhar e isto seria muito incomum”, emendou.

A informação se acumula maciçamente no mundo e o armazenamento de tantos dados é uma dor de cabeça. Discos magnéticos e ópticos são volumosos, precisam ser mantidos em ambientes frios e secos e são propensos a se degradar.

“A única limitação (ao armazenamento em DNA) é o custo”, disse Birney, ressaltando que estes valores tendem a cair.

O sequenciamento e a leitura do DNA levam umas duas semanas com a tecnologia atual, portanto não seria recomendável para a recuperação instantânea de dados. Mas, seriam apropriados para dados armazenados entre 500 e 5.000 anos, como uma enciclopédia do conhecimento e da cultura humanas, por exemplo.