Av Kjerstin Gjengedal
Publisert 9. april 2025
Det finst ein eigen artikkelsjanger som vi kan kalle «sjå mi superdatamaskin». Den er kjenneteikna av korte nyhendemeldingar om at no er landet blitt velsigna med ei ny tungreknemaskin som kan gjere opptil ein fantasillion rekneoperasjonar i sekundet! Eit eige avsnitt ramsar opp tekniske spesifikasjonar som skal framkalle stoltheit og ærefrykt (96 parallelle prosessorar! 275 teraflops! 948 vatnkjølte Lenovo NextScale nx360-serverar, kvar med to Intel Xeon E52683v4-prosessorer med 16 kjerner!), etterfølgt av ein kommentar frå einkvan som peikar på at norsk forsking no vil kunne ta eit stort sprang framover, før artikkelen blir avslutta med «men det trengst meir!».
I skrivande stund ventar kongeriket på at den førebels siste i rekkja av superdatamaskiner til forsking, Olivia (totalt 64 512 CPU-kjerner!), skal avdukast i ein ombygd gruvehall på Nordvestlandet i juni. Men sjølv Olivia kan berre dekkje ein del av behovet, som veks enno meir eksponentielt enn før, om ein kan seie det slik, no når det skal satsast for fullt på kunstig intelligens. Så det trengst meir!
Men dei siste par åra har store tal for reknekraft kome med ein bismak: Det viser seg at alle dei digitale operasjonane har eit klima- og miljøfotavtrykk. Dei blir utførte i fysiske maskiner som treng plass, energi, vatn og material. Di meir data, di meir energi osb.
Universitets- og høgskulesektoren (UH-sektoren) ligg i front når det gjeld digitalisering og databehandling. Stortingsmeldinga om forskingssystemet, som nyleg vart lagt fram, har til dømes eit eige kapittel om digitalisering. Samstundes skal sektoren også helst vere fyrtårn for berekraft. Korleis skal dette gå i hop? Har til dømes ein institusjon som Universitetet i Oslo oversikt over klimaavtrykket frå den digitale delen av verksemda?
– Nei, det har vi ikkje, svarar Gard Thomassen, IT-direktør ved UiO.
Men størstedelen av avtrykket skriv seg uansett ikkje frå aktiviteten på campus, fortel han.
– Forbruket vårt skjer mest i dei nasjonale og internasjonale anlegga.
Det vil til dømes seie superdatamaskiner som nemnde Olivia. Det er nemleg lenge sidan kvar institusjon heldt seg med si eiga reknekraft. Koordineringa starta for vel tjue år sidan med at forskarar fekk høve til å nytte tungrekneanlegg ved andre universitet enn sitt eige når det trongst.
– Fram mot 2014 forstod ein at investeringane i tungrekning var så store og dyre at ein måtte gjere det på ein annan måte, seier leiar for tenesteavdelinga i Sigma2, Hans Eide.
Sigma2 (sjå ordliste) er selskapet som har ansvaret for å tilby tungreknetenester og storskala datalagring til forskings- og utdanningsføremål i Noreg. Det er eigd av Sikt, og dataressursane blir drifta i samarbeid med IT-avdelingane ved dei fire eldste universiteta (BOTT), der behovet for storskala reknekraft til forsking først gjorde seg gjeldande.
– Ein måtte prøve å samle ressursane og sjå på samdrift. Teknologiutviklinga går fort, og det må kontinuerleg investerast i nye anlegg. Ein viktig del av det vi gjer, er å køyre offentlege innkjøpsprosessar for desse anlegga, seier Eide.
– I heile verda produserer vi no kvart år meir data enn alle tidlegare år til saman.
Sidan UH-sektoren no treng så mykje reknekraft og datalagringsplass, og dermed straum osb., kan ikkje institusjonane huse nasjonale anlegg framover. Det trengst datasenter. I 2022 vart forskingsnoregs storskala-lagringssystem NIRD installert i ei nedlagd olivingruve i Nordfjord. Der skal også den nye superdatamaskina Olivia (ingen poeng for å gjette kvar namnet kjem frå) plasserast.
Valet av Lefdal Mine som datasenter var mellom anna basert på grøne kriterium, fortel Eide.
– Det viktigaste er at ein kan gjenbruke spillvarmen.
Datasenteret ligg rett ved fjorden og brukar vatn derifrå i kjølesystema. Det oppvarma vatnet skal i sin tur nyttast i eit lokalt akvakulturprosjekt, som dermed slepp å varme opp vatn sjølv med straum. Slik gjenbruk er i vinden: NTNU, som har den heimebygde superdatamaskina Idun til husbruk, har nyleg bygd om datahallen slik at varmen maskina produserer, kan brukast til å varme opp campus.
Det er dette – at norske datasenter er grønare enn andre datasenter – suksessive norske regjeringar dreg fram når dei prøver å trekkje internasjonale datasenterinvesteringar til Noreg. I tillegg til naturleg kjøling og samfunnsnyttig gjenbruk av spillvarme, nyt datasenteret i Lefdal godt av rikelege mengder kortreist og rimeleg vasskraft. Og sidan gruva allereie låg der, trongst det ingen store naturinngrep. Anlegget er knapt synleg sjølv om det ligg rett ved riksvegen.
Også Olivia skal vere så grøn som råd: Ho veg halvparten så mykje som dagens største nasjonale reknemaskin Betzy (som også står hos NTNU), berre 15 tonn, og bruker 30 prosent mindre energi. Men det trengst altså meir. I januar presenterte Forskingsrådet ei konseptvalutgreiing for tungrekning, der dei tilrår at Noreg investerer 3,4 milliardar kroner fram mot 2030, ei løysing regjeringa i systemmeldinga lovar å «vurdere». Konseptet medfører at Sigma2 skal tilby dataressursar ikkje berre til UH-sektoren, men også til forvaltingsdriven forsking og utvikling. Samstundes opplyser dei at eit slikt val vil ha negative miljøkonsekvensar, først og fremst ved auka straumforbruk og nedbygging av areal.
Når lagring og databehandling skjer i eit nasjonalt anlegg langt unna, blir det vanskeleg for kvar enkelt institusjon å vite nøyaktig kor stor del av klima- og miljøavtrykket ein sjølv står for. Dessutan varierer det mykje, fortel Gard Thomassen, IT-sjefen ved UiO.
– Bakpå ein server står det kor mykje straum han maksimalt kan bruke, men om du ikkje gjer noko på serveren, vil han gå i dvale slik di eiga maskin gjer. Diskane vil slutte å spinne, han vil ikkje bruke minnebrikkene, og det vil gå mindre straum gjennom boksen. Så for å få eit fornuftig bilete av forbruket, må du måle over ein lang periode, seier han.
– Men når det er sagt, har vi eit kriterium om at utstyret vi kjøper, skal leve lenge og ha eit greitt straumforbruk.
– Når heile befolkinga skal ta i bruk kunstig intelligens, då vil totalforbruket bli stort.
«Lang levetid» er eit særs relativt omgrep. Utstyr av den typen som står i fjellhallane i Nordfjord, må skiftast ut etter 4–5 år. Då har utviklinga sprunge frå dei.
Når UiO skaffar serverar, prøver dei å få sju års garanti, fortel Thomassen.
– Dessutan har vi avtalar som inkluderer reparasjon, og vi prøver å reparere så mykje som råd innanfor garantitida. Og når vi reparerer utanfor garantitida, brukar vi gjerne delar som er gått ut på dato til reparasjonar.
Her kjem det igjen an på kva utstyret blir brukt til. Er det til lagring, vågar han ikkje å bruke utstyret stort lenger enn sju år.
– Men er det noko som ikkje er kritisk, til dømes reknekraft til forskarar som toler å vente ein dag om det skulle stogge, så blir det gjerne ti år.
Datalagring og reknekraft er nemleg ikkje heilt det same, viser det seg. Datalagring er heller ikkje det same, for den saks skuld.
– Mange data- og IT-senter brukar anten SSD-ar eller spinning disk, seier Thomassen, med referanse til dei to mest vanlege digitale lagringsmedia (sjå ordliste).
– Men mange forskingsdata er kalde, det vil seie at ingen har sett på dei det siste året. Hos oss brukar vi lagringstape til dette. Det er grønare. Det går ikkje fort å lese dei, men sidan det ikkje hastar, går det fint. Noko vi jobbar med no, er å få data som er kalde, til å gli over på tapelagring automatisk.
Lagring er likevel ikkje det som tek mest energi, hevdar Eide i Sigma2.
– Du kan fint lagre noko og skru av straumen etterpå. Det er når du tek til å gjere ting med datamengdene, analysere og sende dei att og fram, at mykje av energien blir svidd av. Så når heile befolkinga skal ta i bruk kunstig intelligens, då vil totalforbruket bli stort.
Når ein forskar har behov for større lagringsplass enn dei kan få ved heimeinstitusjonen, kan dei søke om innpass hos NIRD. Det same gjeld reknekraft frå anlegg som Olivia, og trengst det enno meir, kan ein ty til den europeiske superdatamaskina LUMI, som Noreg er medeigar i.
– Den maskina står i eit datasenter i ei nedlagd papirmølle i Finland. Fabrikken sto der og hadde god straum- og vassforsyning, så det var naturleg å gjere det om til datasenter. Overskotsvarmen blir brukt til å varme opp byen der senteret ligg. Fordelen med datasenter er at ein kan gjere slike ting, det kan du ikkje om du har mindre anlegg spreidde rundt, seier Eide.
Men digitaliseringa avgrensar seg som kjent ikkje til handtering av store forskingsdatamengder. Ein rapport om digitaliseringas miljøavtrykk, utgitt av franske Association Green IT i februar i år, estimerer at klodens 5,35 milliardar internettilknytta menneske brukar i gjennomsnitt seks internettilkopla dingsar kvar. Digital aktivitet står for om lag 3,4 prosent av samla klimagassutslepp.
Thomassen ved UiO fortel at dei aktivt prøver å sette grenser for folks appetitt på stadig fleire dingsar. No må tilsette nøye seg med éin laptop og heller bruke eksterne skjermar og tastatur, framfor å ha både stasjonær og berbar datamaskin.
– Vi har også ein avtale om at når ting går ut på dato, blir dei henta av eit firma som passar på at dei delane som kan gjenbrukast, blir gjenbrukt. Og om nokon sluttar hos oss, tek vi inn utstyret deira og gjev det til andre, seier han.
Men det fysiske utstyret er framleis berre ein del av likninga. Kva med programvara?
Kristina Devochko er utviklar i teknologiselskapet Tietoevry. For eit par år sidan etablerte ho ei fagmiljøgruppe i Oslo under paraplyen til berekraftsorganisasjonen Green Software Foundation.
– Dess mindre ressursar programvara brukar, dess mindre maskinvare trengst til å køyre det, seier ho.
– Personleg ryddar eg heile tida.
Som utviklar kan ho påverke miljøavtrykket frå digitaliseringa på fleire måtar, fortel ho.
– Det enklaste er å ha rutinar for å sjå på tenestene ein brukar og applikasjonane ein køyrer og spørje: Treng eg denne? Må han køyre 24 timar i døgnet, eller kan eg skru av tenesta utanom arbeidstid? Om det ikkje kjem så mykje trafikk inn, kan eg undersøke om tenesta kan slettast.
I neste omgang kan ein bruke berekraft som kriterium når ein bestemmer kva for tredjepartskomponentar ein vil bruke i programvara ein lagar.
– Du kan samanlikne og velje den som er mest ressurseffektiv. Applikasjonar som berre inkluderer dei nødvendige komponentane, er mindre, meir ressurseffektive og sparar kostnader, seier ho.
Det finst også verktøy som kan hjelpe fagfolk som henne sjølv med å samle inn standardiserte data om utslepp frå programvare.
– Når du har samla inn slike data over ei viss tid, kan du analysere dei for å sjå kva du kan gjere med programvara din for at han skal skape mindre utslepp.
– Det har mykje å seie kven skyleverandøren er, korleis dei byggjer tenestene sine og kor opne dei er om det.
Og akkurat som universiteta, bør utviklarar i IT-bransjen tenkje meir på kvar programvara skal køyre, meiner ho. Skjer det på serverar innomhus, eller i serverar ein leiger hos andre og kallar «skya»?
– Då har det mykje å seie kven skyleverandøren er, korleis dei byggjer tenestene sine og kor opne dei er om det. Førebels er det store utfordringar med transparens rundt utslepp frå infrastrukturen hos skyleverandørane, og informasjonen som finst, er ofte utdatert. I Noreg er vi heldige fordi mange skytenester brukar fornybar energi, men det er slett ikkje tilfelle alle stader, seier Devochko.
Og så er det ryddesjauane vi alle blir oppmoda om å ta med jamne mellomrom. Har det eigentleg noko å seie om du samvitsfullt slettar e-postar og gamle filer etter kvart som dei blir irrelevante?
– Det der er same argument som at «Noreg er så lite, kva har det vel å seie kva vi gjer?» Eg trur endring berre kan skje når vi set eit døme med handlingane våre. Personleg ryddar eg heile tida. Dersom alle tenkte meir på det, kunne store ressursar blitt frigjort, seier ho.
Den store elefanten i det digitale rommet er likevel at same kor effektiv maskin- og programvare blir, så blir effektiviteten meir enn nulla ut av det faktum at datamengdene og datastraumane vi tykkjer vi treng, berre blir større og større.
– Personleg ser eg utfordringar ved at tenester som ChatGPT er blitt tilgjengelege for alle, for dei blir brukt til så mange unødvendige ting, og mange tenkjer ikkje over ressursane KI-tenester brukar. Vi snakkar mykje om å optimalisere kunstig intelligens og maskinlæringsmodellar, men vi må også diskutere korleis vi kan unngå å bruke dei i utrengsmål. Her trur eg vi er heilt avhengige av at politikarane kjem på bana. Vi treng reglar og standardar, nasjonalt og globalt, seier Devochko.
– Ja, det pågår ein diskusjon rundt kor vi lyt sette strek, seier Thomassen ved UiO.
– I heile verda produserer vi no kvart år meir data enn alle tidlegare år til saman.
I forsking kjem dei store voluma frå sensorar og måleinstrument, frå store prosjekt som CERN, frå gendata, biletdata i helseforsking, video- og lydopptak, psykologars pasientintervju, klimadata, geologi og fysikk. Dei tradisjonelt datatunge faga blir berre meir datatunge. Men Thomassen minner om at det er sosiale medium som er den verkeleg store dataprodusenten. Ved forskingsinstitusjonane har ein rikeleg høve til å kjenne på ironien i å prøve å skape ei betre verd med forsking, samstundes som verda brenn av stadig meir ressursar på å dele kattevideoar på TikTok.
Eit omgrep frå kampen for open tilgang til forsking blitt nyttig når det gjeld å sette grenser for datavolumet. Det såkalla FAIR-prinsippet seier at forskingsdata skal vere Findable, Accessible, Interoperable og Re-usable, det vil seie at dei skal vere i ein slik tilstand at andre kan forstå og bruke dei i framtida.
– Ved UiO har vi snakka om at det er greitt at mengda kalde data veks, så lenge dei er FAIR. Det er målestandarden vår. Vi gjev eit økonomisk insentiv og har sagt at data som er FAIR, kan du få lagre til ein rimeleg pris. Lagrar du data ingen veit kva er, må du betale så det svir. Det same gjeld hos Sigma2, seier han.
Thomassen fortel at i dei store forskingssamarbeida prøver ein å unngå duplisering av data, og heller strøyme dei frå databasar. Det skapar interessante dilemma i desse dagar, når mange fryktar at Trump-administrasjonen vil øydeleggje viktige amerikanske forskingsdata – eller gjere dei utilgjengelege.
– Men slike avvegingar høyrer til i forskingsmiljøa. Vårt ansvar som IT-avdeling er å halde styr på data som er lagra hos oss, seier han.