Ewch i’r prif gynnwys

Ehangu uwchgyfrifiadur Hawk yn sylweddol o fewn dwy flynedd

18 Mehefin 2020

Dark image of the supercomputer with lights

Mae clwstwr Cyfrifiadura Perfformiad Uchel (HPC) Hawk, olynydd gwasanaethau Raven a HPC Cymru, wedi cael ei ehangu gan ffactor ca. 2.5 o fewn dwy flynedd, o'r 8,040 creiddiau cyfrifiadura ar adeg ei sefydlu ym mis Awst 2018, i 19,416 o greiddiau heddiw.  

Gwnaed hyn yn bosibl drwy gynllun pensaernïol y system sydd, drwy athroniaeth "seilwaith y gellir ei blygio" a ddangoswyd yn y lle cyntaf ar Raven, wedi galluogi'r rhaniad "craidd" sydd ar gael i bob ymchwilydd, ynghyd ag is-systemau a ariennir gan ymchwilwyr penodol, i gael eu hintegreiddio mewn modd hynod effeithlon a chadarn.  Mae'r twf hwn wedi'i gyflawni mewn cyfres o gamau gan wella capasiti cymuned ymchwil y Brifysgol yn sylweddol.  

Daeth y system Hawk "graidd" gan Atos a Dell yn weithredol ym mis Awst 2018. Gydag 8,040 o greiddiau cyfrifiadura, roedd y system hon yn cynnwys prosesyddion Intel Skylake Gold 6148 (2.4GHz / 4.8GB fesul craidd / 20 craidd fesul prosesydd) fel y prif raniad paralel (gan gynnwys Cof Uchel, rhaniad Amlbrosesu Cymesur), yn ogystal â 1,040 craidd Skylake Gold fel is-system Cyfrifiadura Trwybwn Uchel gyfresol. Roedd perfformiad wedi’i gyflymu ar gael trwy nodau NVIDIA P100 GPU, adnoddau dan alw uchel gan y gymuned Deallusrwydd Artiffisial (AI) a Dysgu Dwfn (DL) sy’n tyfu.  

Mae'r cynnydd mawr yn nifer yr adnoddau sydd ar gael i'r gymuned o ddefnyddwyr wedi deillio o ehangu rhaniadau "craidd" ac "ariennir gan ymchwil" Hawk, yn ogystal ag ehangiad cyfatebol y lled band uchel, ffabrig rhwydweithio cuddni isel gan Mellanox. Mae'r ehangiad cyffredinol wedi'i gynnal mewn dau gam. Cynhaliwyd y brif ehangiad mawr cyntaf yn ystod haf a hydref 2019. Dan arweiniad Grwpiau ymchwil Caerdydd - Consortiwm LIGO, Sefydliad Ymchwil Dementia, Meddygaeth Seicolegol a'r Niwrowyddorau Clinigol a Chemeg Deunyddiau - mae'r rhaniadau wedi'u hariannu gan ymchwil hyn wedi cynyddu'r system Hawk "graidd" o'r 8,040 gwreiddiol i'r ffigur presennol sef 12,656.  

Digwyddodd y mudiad at ehangiadau system yn seiliedig ar Raven 'mwy newydd', oedd yn cynnwys prosesyddion Haswell a Broadwell Intel, rhaniadau a ariannwyd gan Barc Geneteg Cymru (WGP), Cemeg Deunyddiau (huygens2) a LIGO, sawl mis yn ddiweddarach. Cynyddodd hyn y gwasanaeth Hawk i 14,720 craidd. Ar ddiwedd ehangiad Cam 1, daeth gwasanaeth Raven i ben yn swyddogol ar 30 Medi 2019. Er bod yr is-systemau ychwanegol hyn yn cynnig gwelliannau i’r grwpiau ymchwil penodol, ni wnaethant lawer i leddfu baich y system "graidd" ei hun. Mae'r galw wedi deillio o'r cynnydd triphlyg yn nifer y defnyddwyr cofrestredig, o 750 ym mis Mawrth 2019 i 2,250 ym mis Mawrth 2020.  

Roedd y cynnydd hwn yn nifer y defnyddwyr wrth wraidd achos busnes "Cam 2" i ehangu'r system "graidd", a gyflwynwyd i Fwrdd Gweithredol Prifysgol Caerdydd (UEB) ym mis Medi 2019. Yn dilyn cymeradwyaeth gan UEB, ac ar ôl iddo gael ei ategu gan fuddsoddiad Cyngor Cyllido Addysg Uwch Cymru (CCAUC, Galwad Ymchwil Cymru), cynhaliwyd ail ddiweddariad Hawk, yr un mwyaf diweddar, ar ddiwedd mis Rhagfyr 2019 gan ychwanegu 64 x nod AMD yn cynnwys prosesyddion deuol AMD EPYC Rome 7502 (32 craidd Zen-2, 2.5 GHz) a 15 x nod deuol NVIDIA V100 GPU. Gyda'r nodau hyn bellach yn gweithio'n llawn, mae'r gwasanaeth "Hawk" presennol yn cynnwys 19,416 craidd, gyda 12,736 craidd yn rhan o'r gwasanaeth "craidd" sydd ar gael [8,040 Cam 1 a 4,696 Cam 2], wedi'u hintegreiddio gyda'r 6,680 o greiddiau ychwanegol a ariannwyd gan ymchwil.  

Mae Hawk bellach yn cynnwys 100+ TB o gof ar y cyfan ledled yr holl glwstwr, gydag 1+ PB o le i storio ffeiliau paralel eang drwy'r system ffeiliau Lustre a 420 TB NFS/rhaniad cartref ar gyfer capasiti storio data tymor hirach. Mae’r nodau wedi’u cysylltu drwy dechnoleg InfiniBand EDR (100 Gbps / 1.0 μsec y cuddni) gan Mellanox.  

Wrth i ni nesáu at ddwy flynedd ers lansio'r gwasanaeth Hawk, mae cytundeb gydag Atos yn cael ei gadarnhau ar hyn o bryd i dyfu gwead rhwydwaith presennol Hawk ymhellach er mwyn galluogi parhad o'r dull seilwaith y gellir ei blygio sydd eisoes wedi cyflawni ehangiad mawr iawn ers mis Awst 2018.

Rhannu’r stori hon