ADVERTENTIE

DNA als medium om enorme computergegevens op te slaan: binnenkort realiteit?

A breakthrough study takes significant step forward in the quest to develop a DNA-based storage system for digital data.

Digital gegevens groeit tegenwoordig exponentieel vanwege onze afhankelijkheid van gadgets en vereist robuuste langetermijnopslag. Gegevensopslag wordt langzaamaan een uitdaging omdat de huidige digitale technologie geen oplossing kan bieden. Een voorbeeld hiervan is dat er in de afgelopen twee jaar meer digitale gegevens zijn gecreëerd dan in de hele geschiedenis van computers, in feite wordt 2.5 quintiljoen byte {1 quintiljoen byte = 2,500,000 Terabytes (TB) = 2,500,000,000 Gigabytes (GB)} aan gegevens gecreëerd elke dag in de wereld. Dit omvat gegevens op sociale netwerksites, online banktransacties, gegevens van bedrijven en organisaties, gegevens van satellieten, toezicht, onderzoek, ontwikkeling enz. Deze gegevens zijn enorm en ongestructureerd. Daarom is het nu een grote uitdaging om de enorme opslagvereisten voor gegevens en de exponentiële groei ervan aan te pakken, vooral voor organisaties en bedrijven die robuuste langetermijnopslag nodig hebben.

De opties die momenteel beschikbaar zijn, zijn harde schijven, optische schijven (cd's), geheugensticks, flashdrives en de meer geavanceerde tapedrives of optische BluRay-schijven die ongeveer 10 Terabytes (TB) aan gegevens kunnen opslaan. Dergelijke opslaginrichtingen hebben, hoewel ze gewoonlijk worden gebruikt, veel nadelen. Ten eerste hebben ze een lage tot gemiddelde houdbaarheid en moeten ze onder ideale temperatuur- en vochtigheidsomstandigheden worden bewaard om tientallen jaren mee te kunnen gaan en hebben ze daarom speciaal ontworpen fysieke opslagruimtes nodig. Deze verbruiken bijna allemaal veel stroom, zijn omvangrijk en onpraktisch en kunnen bij een simpele val worden beschadigd. Sommige zijn erg duur, worden vaak geplaagd door datafouten en zijn dus niet robuust genoeg. Een optie die universeel door organisaties is geaccepteerd, wordt cloud computing genoemd - een regeling waarbij een bedrijf in feite een "externe" server inhuurt voor het afhandelen van al zijn IT- en gegevensopslagvereisten, ook wel de "cloud" genoemd. Een van de belangrijkste nadelen van cloudcomputing zijn beveiligings- en privacyproblemen en kwetsbaarheid voor aanvallen door hackers. Er zijn ook andere zaken zoals hoge kosten, beperkte controle door de moederorganisatie en platformafhankelijkheid. Cloud computing wordt nog steeds gezien als een goed alternatief voor langdurige opslag. Het lijkt er echter op dat de digitale informatie die wereldwijd wordt gegenereerd ons vermogen om deze op te slaan zeker inhaalt, en er zijn nog robuustere oplossingen nodig om tegemoet te komen aan deze stortvloed aan gegevens en tegelijkertijd schaalbaarheid te bieden om ook rekening te houden met toekomstige opslagbehoeften.

Kan DNA helpen bij computeropslag?

Onze DNA (Deoxyribonucleic acid) is being considered as an exciting alternative medium for digital data storage. DNA is the self-replicating material present in nearly all living organisms and is what constitutes our genetic information. An artificial or synthetic DNA is a durable material which can be made using commercially available oligonucleotide synthesis machines. The primary benefit of DNA is its longevity as a DNA lasts 1000 times longer than silicon (silicon-chip – the material used for building computers). Verbazingwekkend, slechts een enkele kubieke millimeter van DNA can hold a quintillion of bytes of data! DNA is also an ultracompact material which never degrades and can be stored in a cool, dry place for hundreds of centuries. The idea of using DNA for storage has been around for a long time way back to 1994. The main reason is the similar fashion in which information is being stored in a computer and in our DNA – since both store the blueprints of information. A computer stores all data as 0s and 1s and DNA stores all data of a living organism using the four bases – thymine (T), guanine (G), adenine (A) and cytosine (C). Therefore, DNA could be called a standard storage device, just like a computer, if these bases can be represented as 0s (bases A and C) and 1s (bases T and G). DNA is tough and long-lasting, the simplest reflection being that our genetic code – the blueprint of all our information stored in DNA – is efficiently transmitted from one generation to next in a repeated manner. All software and hardware giants are keen on using synthetic DNA for storing vast amounts to achieve their goal of solving long-term archival of data. The idea is to first convert the computer code 0s and 1s into the DNA code (A, C, T, G), the converted DNA code is then used to produce synthetic strands of DNA which can then be put into cold storage. Whenever required, DNA strands can be removed from cold storage and their information decoded using DNA sequencing machine and DNA sequence is finally translated back to binary computer format of 1s and 0s to be read on the computer.

Het is getoond1 that just a few grams of DNA can store quintillion byte of data and keep it intact for up to 2000 years. However, this simple understanding has faced some challenges. Firstly, it is quite expensive and also painfully slow to write data to DNA i.e. the actual conversion of 0s and 1s to the DNA bases (A, T, C, G). Secondly, once the data is “written” onto the DNA, it is challenging to find and retrieve files and requires a technique called DNA sequencing – process of determining the precise order of bases within a DNA molecule -after which the data is decoded back to 0s and 1s.

Een recente studie2 door wetenschappers van Microsoft Research en de Universiteit van Washington hebben een "willekeurige toegang" tot DNA-opslag bereikt. Het aspect "willekeurige toegang" is erg belangrijk omdat het betekent dat informatie kan worden overgedragen naar of van een plaats (meestal een geheugen) waarin elke locatie, ongeacht waar in de reeks en direct toegankelijk is. Met behulp van deze techniek van willekeurige toegang kunnen bestanden op een selectieve manier worden opgehaald uit DNA-opslag in vergelijking met vroeger, toen een dergelijke opvraging de noodzaak vereiste om een ​​volledige DNA-dataset te sequencen en te decoderen om de weinige bestanden te vinden en te extraheren die men wilde. Het belang van "willekeurige toegang" wordt verder vergroot wanneer de hoeveelheid gegevens toeneemt en enorm wordt omdat het de hoeveelheid sequencing die moet worden uitgevoerd, vermindert. Het is voor het eerst dat de willekeurige toegang op zo'n grote schaal is getoond. Onderzoekers hebben ook een algoritme ontwikkeld voor het efficiënter decoderen en herstellen van gegevens met meer tolerantie voor gegevensfouten, waardoor de sequencing-procedure ook sneller gaat. In dit onderzoek werden meer dan 13 miljoen synthetische DNA-oligonucleotiden gecodeerd, bestaande uit gegevens van 200 MB, bestaande uit 35 bestanden (met video, audio, afbeeldingen en tekst) variërend in grootte van 29 KB tot 44 MB. Deze bestanden zijn afzonderlijk zonder fouten opgehaald. Ook hebben auteurs nieuwe algoritmen bedacht die robuuster en fouttoleranter zijn bij het schrijven en lezen van de DNA-sequenties. Deze studie gepubliceerd in Nature Biotechnology in een belangrijke vooruitgang die een levensvatbaar, grootschalig systeem voor DNA-opslag en -ontvangst toont.

DNA storage system looks very appealing because it is having high data density, high stability and is easy to store but it obviously has many challenges before it can be universally adopted. Few factors are time and labour-intensive decoding of the DNA (the sequencing) and also synthesis of DNA. The technique requires more accuracy and broader coverage. Even though advances have been made in this area the exact format in which data will be stored in the long-term as DNA is still evolving. Microsoft has vowed to improve production of synthetic DNA and address the challenges to design a fully operational DNA opslagsysteem in 2020.

***

{U kunt de originele onderzoekspaper lezen door op de DOI-link hieronder in de lijst met geciteerde bron(nen) te klikken}

Bron (nen)

1. Erlich Y en Zielinski D 2017. DNA Fountain maakt een robuuste en efficiënte opslagarchitectuur mogelijk. Wetenschap. 355(6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Willekeurige toegang in grootschalige DNA-gegevensopslag. Natuur Biotechnologie. 36. https://doi.org/10.1038/nbt.4079

SCIEU-team
SCIEU-teamhttps://www.ScientificEuropean.co.uk
Wetenschappelijk Europees® | SCIEU.com | Aanzienlijke vooruitgang in de wetenschap. Impact op de mensheid. Inspirerende geesten.

Abonneer u op onze nieuwsbrief

Om op de hoogte te blijven van het laatste nieuws, aanbiedingen en speciale aankondigingen.

Meest populaire artikelen

Scheurbuik blijft bestaan ​​onder kinderen

Scheurbuik, een ziekte veroorzaakt door een tekort aan vitamine...

Verjonging van oude cellen: veroudering gemakkelijker maken

Een baanbrekende studie heeft een nieuwe manier ontdekt om...

Een unieke baarmoederachtige omgeving wekt hoop voor miljoenen premature baby's

Een studie heeft met succes een externe...
- Advertentie -
94,495FansLike
47,677volgersVolg
1,772volgersVolg
30abonneesInschrijven