Digital storage

Digitale lagre flyder over

Forskere indsamler store mængder information. Men det kniber med digital lagerplads og vigtig viden risikerer at være utilgængelig for næste generation. Videnskabelige data er allerede forsvundet eller reddet i sidste øjeblik.

19. juli 2011 af Ib Salomon

Hjerneforskerne gør det, astronomerne gør det, og især atomfysikerne gør det: skaber umådelige mængder af digitale data.

Når fysikerne for eksempel fyrer op under den store accelerator hos CERN, verdens største center for partikelfysik, leverer den i løbet af et år 15 petabytes information. En petabyte svarer til en milliard megabytes, og det er langt mere, end selv de største biblioteker rummer. Også de mange satellitter producerer astronomiske mængder af data. ESA, den europæiske rumfartsorganisation, har således opsamlet lagre på fem petabytes og regner med, at datamængden vil tidobles de kommende år.

I sig selv er der naturligvis ikke noget galt med store datamængder. Sagen er blot, at problemerne med at opbevare disse data bliver stadig flere – og det samme gør risikoen for, at de på et tidspunkt vil være utilgængelige.

Og det hele bliver ikke nemmere af, at der er tale om komplekse data, som meget gerne skulle kunne genfindes i deres fulde form. Det skyldes ikke mindst, at kravene til videnskabelig dokumentation hele tiden stiger. Hvis et lægemiddel skal godkendes, forlanger myndighederne for eksempel dokumentation for samtlige de undersøgelser og test, der er foretaget. Og rejses der tvivl om forskernes arbejde, som det er sket i klimaforskningen, er det uhyre vigtigt at kunne søge baglæns og tjekke de data, videnskabsmændene baserer deres konklusioner på.

Forskningen bliver digital og kommer aldrig på papir

Meget information findes nu kun i digital form og kommer aldrig på papir – faktisk er det i dag kun omkring 0,1 procent, der trykkes. Også de videnskabelige tidsskrifter går den vej. Tre fjerdedele af verdens 20.000 forskningsmagasiner ventes således kun at udkomme digitalt om 10 år. De vil derved bidrage kraftigt til det voksende lager af digital information.

For tiden fordobles lagrene på få år, og de skønnes at være 40 gange større i 2020 end nu. Blev al den digitale information, vi producerer i dag, udskrevet på papir, ville stakken vokse hurtigere, end en raket kan flyve, og i løbet af et år kunne der bygges 11 stabler fra Jorden til Solen.

Det meste er ny information, og en betydelig del stammer fra forskningen. Men ud over flodbølgen af nye data bliver også gamle dokumenter, film og billeder digitaliseret i rasende tempo. For eksempel har Google sat sig for at digitalisere de cirka 130 millioner bøger, firmaet mener, der er udgivet gennem tiden.

De uhyre datamængder stiller voldsomme krav til lagringsmedierne. En af løsningerne er at pakke informationen tættere og tættere, og det kan man roligt sige, at vi gør. Siden computerens barndom er det lykkedes at lagre informationerne flere millioner gange tættere, og udviklingen fortsætter: En blu-ray-disk kan for eksempel indeholde mere end fem gange så meget som en dvd. Og forskerne er godt på vej med en videreudvikling, hvor informationen populært sagt stables i 20 lag. Sådan et lagermedie vil kunne rumme 500 gigabytes. Også nye holografiske metoder tegner lovende.

Stor risiko når informationer pakkes tæt

Men det er ikke uden risiko at pakke informationer så tæt, mener blandt andre Neil Grindley, der er ekspert i digital bevaring og arbejder for den britiske Joint Information Systems Committee: “Risikoen for at miste informationer er ekstra høj, hvis de opbevares i komprimeret form,” siger han.

Blandt andet derfor bliver lagring på store harddiske mere og mere udbredt blandt forskere. Fordelen er, at det er meget nemt at hente data fra en harddisk. Til gengæld kræver det store servere, der altid kører. En server på størrelse med et køleskab kan rumme op til 200 terabytes, men den bliver varm, når den arbejder. Temperaturen bør ideelt set ligge på 17-18 grader, så der er brug for masser af energi, både til at holde serveren i gang og til løbende at køle den ned.

Blandt andet CERN er derfor på udkig efter steder, hvor deres forskere kan placere de enorme lagre af data og samtidig have let adgang til både energi og kølevand. Løsningen bliver antagelig nybyggede faciliteter i bjerge, hvor der er god mulighed for vandkraft, og hvor vandet samtidig kan bruges til køling. Også de store europæiske biblioteker overvejer noget lignende, for også de får brug for mere og mere lagerkapacitet.

Tema

Læs også

Måske er du interesseret i ...

FÅ ILLUSTRERET VIDENSKABS NYHEDSBREV

Du får dit gratis særtillæg, Vores Ekstreme Hjerne, til download, straks du har tilmeldt dig nyhedsbrevet.

Fandt du ikke det, du ledte efter? Søg her: