Supercomputer ALICE is nu nog krachtiger en dat is goed nieuws voor vele disciplines
Ze is nu sterker en sneller: ALICE, de universitaire supercomputer, is uitgebreid. Hierdoor kunnen onderzoekers en studenten met zwaardere modellen werken. Van onderzoek naar taal tot scans van hersenactiviteiten, de uitbreiding is van belang voor uiteenlopende vakgebieden. Wie werken er met deze prima donna?
Steeds meer onderzoekers hebben een krachtiger computernetwerk nodig voor hun onderzoek, vertellen Robert Schulz en Jan Just Keijser van het ICT Shared Service Centre. Dat zijn bijvoorbeeld wetenschappers die onderzoek doen met machine learning: een methode die computers leert om zelfstandig te leren van data en besluiten te nemen. Of met data mining: het ontdekken van patronen en verbanden uit grote hoeveelheden gegevens. Daarom kreeg ALICE, de prima donna van het datacenter, aanzienlijk meer capaciteit, zie kader.
Gebruikers van diverse faculteiten
Voor de duidelijkheid: ALICE is niet één computer maar het grootste rekenkluster van de universiteit en ging in 2019 van start. De naam staat voor Academic Leiden Interdisciplinairy Computing Environment. De meeste gebruikers zijn afkomstig van de Faculteit Wiskunde en Natuurwetenschappen en het LUMC, maar er komen steeds meer onderzoekers bij van Sociale Wetenschappen, Geesteswetenschappen, Archeologie en Universitaire Bibliotheken Leiden. In 2019 had ALICE ruim 100 gebruikers en in het vierde jaar zijn het er al bijna 250, waarvan ruim 30 % studenten.
Bij een krachtig rekenkluster als ALICE draait alles om de capaciteit van de zogeheten nodes - de aan elkaar verbonden servers. De capaciteit wordt uitgedrukt in het aantal Central Processing Units (CPU’s) en het aantal Graphic Processing Units (GPU’s). Deze grafische verwerkingseenheden zorgen ervoor dat bijvoorbeeld video’s en afbeeldingen snel in 2D of 3D getoond kunnen worden. In 2023 kwamen er 14 nieuwe nodes bij, met in totaal 28 krachtige GPU’s met 7 keer meer geheugencapaciteit en 3 keer meer rekenkracht. ALICE bestaat nu in totaal uit 48 reken-nodes.
Diverse voordelen
Doordat de capaciteit van ALICE is uitgebreid, kunnen nu meer onderzoekers tegelijkertijd het systeem gebruiken. Daarom investeert het ISSC ook in de toegankelijkheid. Sinds 2023 zijn er elke maand workshops voor nieuwe en gevorderde gebruikers. Ook wordt ALICE tegenwoordig vaker gebruikt voor onderwijs. Een ander pluspunt is dat de nieuwe servers duurzamer zijn. Hoewel ze veel betere prestaties leveren, hebben ze ongeveer hetzelfde energieverbruik als de oudere nodes. Vier wetenschappers van diverse disciplines vertellen waarvoor ze het rekenkluster gebruiken.
'Mijn onderzoek is alleen mogelijk met hulp van ALICE'
CT-scans met lagere stralingsdosis
Voor promovendus Jiayang Shi is de uitbreiding van ALICE cruciaal. ‘Mijn onderzoek gaat over het verbeteren van de kwaliteit van CT-scanbeelden met behulp van deep learning-technieken. We proberen de stralingsdosis voor patiënten te verlagen en toch beelden van goede kwaliteit te krijgen. Deep learning helpt ons de beeldkwaliteit te verbeteren die verloren gaat bij een lagere dosis: we verwijderen ruis en reconstrueren beelden uit CT-scans. Voor deze taken is een superkrachtige computer nodig: stel je voor dat je werkt met 625 miljoen getallen voor slechts één beeld! Daarom zijn de nieuwe nodes met heel veel meer geheugen en rekenkracht onmisbaar. Ze maken mijn onderzoek mogelijk en de genoemde taken sneller.’
Rekenen met taalmodellen
Taalwetenschapper Matthijs Westera bestudeert de rol van impliciete vragen in communicatie. ‘Ik gebruik deep learning-taalmodellen om plausibele vragen te genereren en te categoriseren. Dankzij ALICE train ik snel modellen en pas die toe op grote hoeveelheden data. Op een standaard werkcomputer draaien de taalmodellen van vijf jaar geleden al niet zo lekker, laat staan de nieuwste en grotere modellen. Dankzij ALICE kunnen ook studenten voor hun bachelorscriptie al serieus computationeel taalkundig onderzoek doen. Het zou een belangrijke ontwikkeling zijn als we dankzij de uitbreiding ook kunnen werken met de zogenoemde Large Language Models - waar bijvoorbeeld ChatGPT op gebaseerd is. Zeker nu Nederland een eigen GPT-NL wil bouwen.’
'Studenten schrijven met hulp van ALICE hun eerste wetenschappelijke publicatie’
Scans van hersenactiviteiten
Neuropsycholoog Julie Hall onderzoekt de hersenactiviteit van proefpersonen. Ze kijkt naar hun cognitieve gedrag - het vermogen om informatie op te nemen en te verwerken- en emotionele reacties. ‘Hierbij maak ik functionele Magnetic Resonance Imaging (fMRI)-scans van de hersenen. Dat levert 3D-afbeeldingen op waardoor te zien is welke hersengebieden actief zijn. Maar eerst moeten we goed de fMRI-gegevens verwerken en corrigeren voor bijvoorbeeld bewegingen. Ook is het nodig om de beelden glad te strijken. Daar zijn gespecialiseerde programma’s en algoritmen voor nodig die zware berekeningen kunnen maken. Dat kan in sommige gevallen op een laptop, maar het gaat een stuk sneller met ALICE die meerdere taken tegelijkertijd uit kan voeren.’
Studenten publiceren met hulp van ALICE
Universitair docent Thomas Moerland van het Leiden Institute of Advanced Computer Science laat zijn studenten werken met Alice. ‘Ik geef het mastervak Advanced Deep Reinforcement Learning waarin studenten zelf onderzoek leren doen, als voorbereiding op hun masterscriptie en eventueel een toekomst als promovendus. Ze voeren bijvoorbeeld experimenten uit een gerenommeerde paper uit die veel rekentijd vragen. Hiervoor gebruiken de studenten ALICE omdat hun eigen laptop meestal niet krachtig genoeg is. Als het lukt breiden ze de gekozen paper uit met een eigen idee. Sommige studenten schrijven hierdoor met behulp van ALICE hun eerste wetenschappelijke publicatie.’
Tekst: Linda van Putten
Foto boven artikel: Taylor Vick/Unsplash