gewundendes Modell einer DNA-Struktur

Fehlerfreier Datenspeicher aus DNA-Molekülen

Moderne Festplatten speichern schon heute mehrere Tausend Gigabyte an digitalen Daten – und die Kapazität der magnetischen Speichermedien steigt stetig. Noch weitaus größere Speicherkapazitäten ließen sich prinzipiell mit DNA-Molekülen erreichen. Die dazu nötige Codierung digitaler Daten mit den vier Nukleinbasen Adenin, Guanin, Cytosin und Thymin demonstrierten Forscher nun mit einem etwa zwei Megabyte großen Datenpaket. In der Fachzeitschrift „Science“ berichten sie, dass nur ein Gramm DNA ausreiche, um die enorme Datenmenge von 215 000 Terabyte dauerhaft zu speichern.

„Wir glauben, mit unserem Versuch die höchste Speicherdichte für Daten überhaupt erreicht zu haben“, sagt Yaniv Erlich von der Columbia University in New York. Diese Aussage gründet auf einem Experiment, das Erlich gemeinsam mit seiner Kollegin Dina Zielinski vom New York Genome Center durchgeführt hat. Die beiden schnürten aus einem kurzen Video, einem schlanken Betriebssystem und weiteren Bild- und Textdateien ein komprimiertes Datenpaket von insgesamt 2 146 816 Byte. Dieses Paket zerlegten sie anschließend in 67 088 Segmente zu je 32 Byte. Jedes Paket ergänzte das Team um sechs Byte, die der Fehlerkorrektur dienten und die Position der aneinandergereihten Segmente codierten. Jedes Segment bestand aus einer Folge aus insgesamt 304 Nullen und Einsen. Diese ordneten Erlich und Zielinski mit ihrem Algorithmus einer Folge aus den vier Buchstaben A für Adenin, G für Guanin, C für Cytosin und T für Thymin zu. Auf diese Weise entstand eine einfache Textdatei mit dem Bauplan für 72 000 DNA-Stränge aus jeweils 200 Nukleinbasen.

Diese Datei sendeten die beiden Wissenschaftler an ein Unternehmen in Kalifornien, das mit mittlerweile etablierten biochemischen Verfahren synthetische DNA-Stränge entsprechend der Bauplanliste herstellen konnte. Nach zwei Wochen erhielten Erlich und Zielinski einen kleinen Flakon mit den synthetisierten DNA-Schnipseln. Mit ebenfalls bereits kommerziell verfügbaren Sequenzierautomaten lasen sie diese DNA-Stränge wieder aus und rekonstruierten mit dem ursprünglich verwendeten Algorithmus die Zahlenfolge aus Nullen und Einsen. Alle anfangs genutzten Dateien konnten so wiederhergestellt und fehlerfrei ausgelesen werden. Zur Demonstration betrachteten die Forscher die Video-, Bild- und Textdateien und konnten auch das Betriebssystem erfolgreich auf einem Rechner installieren.

Dieser Grundlagenversuch belegt erneut, dass sich DNA-Stränge prinzipiell für das Speichern digitaler Daten eignen. Theoretisch kann eine Nukleinbase exakt zwei Bit speichern – wegen der zu ergänzenden Bytes für eine Fehlerkorrektur und Positionsangabe erreichten die Forscher immerhin einen Wert von 1,6 Bit pro Nukleinbase. Daraus ergab sich rechnerisch eine Speicherkapazität von 215 Petabyte pro Gramm. Der Aufwand dieser Technologie ist derzeit allerdings noch ausgesprochen groß. Allein die Herstellung der künstlichen DNA-Stränge und das Sequenzieren kosteten etwa 9000 US-Dollar. Doch Erlich und Zielinski erwarten, dass diese Kosten in Zukunft drastisch sinken werden.

Als Alternative zur täglich genutzten Festplatte taugt die DNA-Datenspeicherung aber kaum. Vielmehr könnten in Zukunft solche Speicher aus Erbgutmolekülen für möglichst langlebige Datenarchive genutzt werden. Von Vorteil wäre nicht nur die extrem hohe Datendichte, sondern auch die Stabilität von DNA-Molekülen. In kühler und trockener Umgebung erwarten die Forscher eine Haltbarkeit von Hunderttausenden Jahren. Diese Annahme begründen sie mit einem Fund intakter DNA in Knochen von Frühmenschen, die vor etwa 430 000 Jahren im heutigen Spanien lebten.