NGPcompute

  • Dev-blogg vecka 23

    Dev-blogg vecka 23

    Bonsai & Mimosa

    Bonsai-integrationen har verifierats på NGP-klustret inom ramen för JaseBonsaiMimosa-pipelinen och har visat god funktionalitet.

    Mimosa API är tillgängligt från NGP-klustret, men saknar för närvarande stöd för uppladdning av prover samt initiering av klustringsjobb via API. Vi utreder möjliga lösningar för att hantera denna begränsning.

    Brainchild

    Vi har satt upp nätverkskoppling mellan Brainchilds Fabric-miljö och on-prem HCP-lagring hos VGR där data är tänkt att flöda in. Utvecklare i Fabric ska i första hand nå mock-data från Barntumörbanken/Svenska Barncancerregistret.

    NGPc

    Vi har hittat ett sätt att skala netapp-lagringen mer dynamiskt för att kunna hantera större belastningar både vad det gäller storlek men också throughput. Grundlogiken är färdig men kräver mer arbete för att kunna tas i drift.

    Systemunderhåll

    Vi har diskuterat att införa regelbundna systemunderhåll en gång per månad, med start onsdagen den 10 juni och därefter den andra onsdagen varje månad.

    Under dessa underhållsfönster kommer vi att genomföra systemuppdateringar, omstarter av servrar .etc.

    Underhållsfönstret är planerat till kl. 09:00–17:00 och kan medföra begränsad tillgänglighet eller avbrott för NGPc (https://ood.genmed.se) under denna period. Användare ombeds att inte använda NGPc medan underhållet pågår.

    /Aron C

  • Dev-blogg vecka 22

    Dev-blogg vecka 22

    Autentisering

    Lösning för inloggning med bankID till NGP är under utveckling, och ett avtal är klart med FortifiedID. Vi inväntar konfiguration av IdP med client på deras håll för integration mot Keycloak-uppsättningen för att möjliggöra inloggning med BankID i OpenOnDemand.NGPc

    NGPc

    Vi har påbörjat vidareutveckling och förbättring av granskningssystemet inom klustermiljön. I nuläget använder vi flera olika verktyg för granskning, men målet är att samla loggarna på ett gemensamt ställe. Exempelvis i Graylog, så att de blir enklare att söka i framöver. Arbetet är fortfarande i ett tidigt skede.

    Vi har slutfört arbetet kring att designa och införa ny rutin för skapandet av OS image för arbetsnoderna inom NGPc. Denna möjliggör för enklare skapande, samt validering innan en ny version sätts i produktion.

    NGP Integrations: Bonsai & Mimosa

    Vi har påbörjat testning av Bonsais API från login1. Under arbetet uppkom problem kopplat till rootless Podman, filrättigheter och ägarskap för de filer som skrivs till den NFS-monterade ytan där JASEN-resultaten lagras.

    För att hantera detta använder vi bindfs tillsammans med fuse3, vilket adresserar rättighets- och ägarskapsproblematiken. Det återstår dock att avgöra om detta ska betraktas som en tillfällig workaround eller om det kan vara en hållbar lösning även på längre sikt.

    Vi har även diskuterat hur åtkomsten till Bonsai-mounten bör styras, och om detta exempelvis bör ske på gruppnivå.

    VDP

    Baserat på feedback från referensgruppen som bildats från GMS-RD-gruppen är ny funktionalitet under utveckling.

    • Import av data från Alamut.
    • Ytterligare allternativ gällande hur man gör sökningar i databasen. Detta avser alternativa söksmetoder än genomiska koordinater (kromosom, position, REF, ALT).
    • Tillägg och förändringar av användargränssnittet i portalen.

    // Hedy

  • Dev-blogg vecka 21

    Dev-blogg vecka 21

    Jasen + Bonsai + Mimosa

    Arbetet med att adaptera den befintliga lösningen utifrån de förtydligade ska-kraven har påbörjats. Som en del av detta arbete har en ny delad lagringsyta, “hot storage”, för Jasen-resultat skapats. Denna ska användas av den Jasen-Bonsai-Mimosa-pipeline (JBM) som håller på att utvecklas, samt av Bonsai vid klustringskörningar.

    NGPc

    Patching av dirty frag samt fragnesia sårbarheterna har påbörjats, och vi siktar på att patcha det som återstår nästa vecka.

    Variantdatabasportalen

    Vi har haft möte med en referensgrupp som bildats inom GMS RD-grupp

    Vi håller på att bearbeta den feedback vi har fått.


    /Aisha Alsafi

  • Dev-blogg vecka 20

    Dev-blogg vecka 20

    Brainchild

    Nya användargrupper har skapats och användare från Microsoft och Nexer har bjudits in för att arbeta på BrainChild inom fabricmiljö. En ny kapacitet har skapats och rättigheter konfigurerats för denna.

    Under skapandet/inbjudan av användare har vi stött på inloggningsproblem för nya användare där de slår i en conditional access policy. Denna policy ska hindra inloggning utan MFA men användaren får det aldrig presenterat för sig att konfigurera sin MFA innan inloggnings fallerar. Explicit exklusion av användare för policy gör det möjligt att logga in. Felsökande pågår.

    Jasen + Bonsai + Mimosa

    Vidare diskussioner har klargjort vilka de konkreta stegen är härnäst. Dessa skiljer sig delvis från originaltanken och således behöver vissa delar av uppsättning av infrastruktur förändras.

    Det kvarstår några få frågetecken som vi hoppas reds ut under nästa vecka. Under tiden implementerar vi de delar vi har god känsla för, t.ex. hur kommunikation och dataskyfflande mellan Jasen och Bonsai ska se ut i ett första skede.

    Administration GMC-joint

    Nya rutiner för GMC-joint arbetas fram som rör administration rent generellt. BDC-IT/GMC-west kommer hantera administrationen av denna tenant och dess användare. Exakt utformning är inte färdigställd men i takt med att denna blir klar kommer tekniska administratorer från varje GMC kontaktas för att ta del av dessa nya rutiner.

    Rutinunderhåll NGP

    Vi har tagit fram en grundläggande princip gällande underhåll av infrastruktur. Vi siktar på att ta ner delar av infrastrukturen den 2:a onsdagen i varje månad för att uppdatera underliggande OS och införa diverse förändringar som annars hade stört verksamheten.

    NGPc

    Förra veckan nämndes patchning av “copy fail” och sedan dess har nya liknande kritiska fel identifierats i linux kernel (dirty frag). Vi har inväntat nya kernelversioner för att patcha detta fel och siktar på att lösa detta nästa vecka.

    Ha det fint,
    Jens PW

  • Dev-blogg vecka 19

    Dev-blogg vecka 19

    NGPc

    Under veckan har vi hämtat ner nya kernel-versioner för de mest kritiska virtuella maskinerna i NGPc. Detta görs för att lösa det kritiska felet som alla Linux-distributioner har haft sedan 2017, med id CVE-2026-31431, också kallat copy fail. I samband med detta har även ett antal portaler och andra appar uppdaterats. Arbetet fortsätter med att uppdatera resterande maskiner inom NGP-kontexten.

    Vi har även satt upp InfluxDB3 och Grafana på en ny virtuell maskin. Telegraf har inkluderats på arbetsnoderna, vilket möjliggör detaljerad loggning av arbetsnodernas hälsotillstånd och öppnar upp för djupare insikt i hur mycket resurser som brukas under tiden pipelines kör.

    Ett arbete har påbörjats med målet att omarbeta rutinen för hur man bygger OS-image för arbetsnoderna inom NGPc. Om man behöver lägga till en dependency ska det vara smidigt att skapa en ny image och peka om produktionen att bruka denna efter att funktionen har validerats.

    Diskussionerna kring spårbarhet av prov genom hela NGP har expanderats och inkluderar nu fler personer från olika GMC. Det finns många alternativ som behöver utredas för att hitta en lösning som fungerar med alla olika komponenter som NGP består av.

    GMS-mikro

    Vi har i veckan deltagit i en konferens/workshop arrangerad av GMS-mikro. Där fördes många diskussioner kring slutanvändning av verktyg inom pilotprojektet, det vill säga Jasen, Bonsai och Mimosa. Det fördes även vidare diskussioner med utvecklare för verktygen.

    //Erik B

  • Dev-blogg vecka 18

    Dev-blogg vecka 18

    NGPc: Open OnDemand (OOD) och Keycloak

    Den nya Open OnDemand-miljön är nu konfigurerad och kör i Azure, med Keycloak som del av inloggningsflödet. Just nu tittar vi även på backup för Keycloak, där återställningstester blir en viktig del innan vi kan känna oss trygga med att driftsätta den nya lösningen.

    För att garantera att säkerheten upprätthålls går också igenom detaljerna i autentiseringsflödena, bland annat hur AuthnContextClassRef mappas till acr, och vilka inkommande claims som faktiskt behöver verifieras.

    NGPc: Övervakning

    Övervakning av arbetsnoderna i NGPc håller på att införas.
    Det kommer att gör det enklare att följa resursförbrukning på noderna samt deras hälsa, och ger oss en bättre grund för att bygga logik som tidigt kan varna när fördefinierade riktvärden överskrids.

    Benchmark av pipelines

    Vi jobbar vidare med en rutin för benchmarking av pipelines.
    En ny Grid Engine-kö har satts upp för sekventiella körningar, vilket tillsammans med den nya övervakningen ska hjälpa oss att hitta flaskhalsar i olika pipelines.

    GMC-joint

    Den tekniska administrationen av GMC-joint ses över.
    Nya rutiner tas fram för att tydliggöra vem som har access till vad, och tekniska admins för respektive GMC kommer att kontaktas för att uppdateras kring de nya rutinerna.

    /Johan C

  • Dev-blogg vecka 16

    Dev-blogg vecka 16

    Autentisering

    Inloggningsflödet är testat med LDAP-integration till IdM för matchning av inkommande claim som i sin tur skickas vidare till OpenOnDemand, för att auktorisering fortsatt ska kunna hanteras manuellt och OpenOnDemand inte ska behöva ställa ldap-frågor till IdM för att kunna matcha användare.

    Bonsai + Mimosa

    Arbetet med att integrera Bonsai och Mimosa i NGPn fortsätter.

    Vi har haft dialog med projektägarna för GMS-projektet “Prospektiv regional sekvensering av resistenta bakterier med samordnad nationell dataanalys” för att tydliggöra vilka versioner av Bonsai och Mimosa som ska stödjas i NGP. I samband med detta har vi också lyft att den senaste releasen av Bonsai ännu inte fullt ut stödjer data från de senaste versionerna av Jasen och bonsai-prp.

    Vi inväntar besked om detta, samtidigt som Bonsai-utvecklarna undersöker om stöd för bonsai-prp 1.5 kan backportas till Bonsai 2.1.x. Förhoppningen är också att GMC Örebro under nästa vecka laddar upp ett testdataset och referensisolat till GMC Joint-tenanten, så att vi kan testa med mer verklighetstrogen data.

    Mimosa har uppdaterats av externa utvecklare för publicering bakom reverse proxy och under en subpath, baserat på den feedback vi tidigare delat med dem. Vi inväntar nu en stabil release innan Mimosa-instansen i NGP uppdateras.

    NGP Cluster

    Vi har genomfört testkörningar av pipelines.

    Variantdatabasportalen(VDP)

    Vi har hållit ett möte och en grupp ska bildas för att beta testa portalen. Vidare utveckling av portalen fortsätter.

    /Hedy Pettersson

  • Dev-blogg vecka 15

    Dev-blogg vecka 15

    Bonsai + Mimosa

    Tidigare problem vid import av riktiga Jasen-resultat berodde på att olika versioner av GMC-noder använder olika versioner av JASEN. Den senaste releasen av Bonsai har ej stöd för JASEN 1.2, men stöd för detta är under utveckling.


    Tidigare tester med mock-data bör dock vara tecken på att Bonsai och Mimosa integrationerna i NGP:n fungerar. För den pågående pilotstudien så behöver vi få förtydligat för oss vilken version av JASEN och Bonsai vi behöver ha stöd för i NGP:n.


    Automation

    Testar stackstorm i azure miljö. Stackstorm är en automations-mjukvara som syftar till att lösa problematiken kring när/var/hur/varför analyser ska starta på NGPc. Man kan t.ex. föreställa sig att råa prov som laddats upp i valfri bucket/namespace på NGPr ska detekteras av en Stackstorm-sensor som i sin tur “triggar” ett arbetsflöde att starta som involverar nedladdning, analys, och uppladdning.

    Det är många pusselbitar som behöver sitta ihop korrekt och problem som behöver lösas, t.ex. spårbarhet av jobb när stackstorm lämnar över till grid engine och vice versa.


    Autentisering

    Testar vidare med en Keycloak-uppsättning med två noder som opererar under en lastbalanserare tillsammans med en gemensam databas för att försöka göra en lösning med High Availability.


    Brainchild

    Mer arbete med att igång arbetet med datan från BTB som kommer användas i brainchild

    // Aisha Alsafi

  • Dev-blogg vecka 14

    Dev-blogg vecka 14

    Bonsai + Mimosa

    Import av riktiga Jasen-resultat in i Bonsai har gått mindre bra. Utvecklarna har kontaktats för assistans.

    En testmiljö har skapats inom HCP:n för att hålla exempelfiler för test av diverse integrationer, bland annat automatisk hämtning av data från HCP till lokal lagring för import in i Bonsai och Mimosa.

    Automation

    Stackstorm tittas just nu på som lösning för att lösa automationsbiten inom NGPc. Denna ska kunna agera utifrån triggers för att diktera vilka arbetsflöden som ska starta som respons. Ett primärt användningsområde skulle vara att detektera ny data inom specifika ytor på HCP:n för att sedan låta underliggande logik bestämma vilken pipeline som bör starta, samt vart resultat sedan ska skickas.

    Autentisering

    En uppsättning av Keycloak har gjorts där vi testar olika inloggningsflöden inom NGP. Förhoppningen är att denna ska lösa problematiken kring implementation av multipla inloggningslösningar/flöden, och stödjer bland annat SAML, OAuth2, OpenIDConnect som protokoll.

    Felsökning HCP

    Felsökning fortsätter för att lista ut den underliggande orsaken till de så kallade “non-replicating objects”-felen som har observerats hos HCP:n. BDC, KSD samt Hitachi är involverade i processen.

    // Jens PW

  • Dev-blogg vecka 13

    Dev-blogg vecka 13

    Ny lagringslösning med Azure NetApp Files

    Vi har etablerat och driftsatt en ny lagringslösning baserad på Azure NetApp Files för NGPc-klustret. Detta ersätter den tidigare Lustre-baserade lagringen.

    Framsteg i Bonsai- och Mimosa-integrationerna

    Arbetet med Bonsai och Mimosa har fortsatt med fokus på både praktisk testning och strategiska vägval:

    • Mockdata har laddats upp och klustringar har genomförts framgångsrikt i både Bonsai och Mimosa.
    • Vi har haft en första intern diskussion kring nästa steg i integrationerna, där vi bland annat tittar på:
      • Hantering av större datamängder
      • Stöd för många samtidiga användare
      • Prioritering av uppladdningar och klustringar
      • Data persistence
      • Eventuell utbyte av MongoDB-databaserna
    • Insamlad feedback har skickats vidare till Bonsai- och Mimosa-teamen, och vi har påbörjat nästa runda av frågor och synpunkter.
    • Arbetet med att ladda upp JASEN-data till NGPr (HCP) har inletts, och vi har även börjat testa med verklig data.
    • Nästa steg är att boka ett gemensamt möte för att konkretisera vad som krävs för att få en MVP på plats inför studien. Fokus kommer ligga på:
      • När och var data ska laddas upp
      • Exakt vilken data Bonsai och Mimosa behöver från JASENs output

    Vidareutveckling av Variantdatabasportalen

    Utvecklingen av variantdatabasportalen (VDP) fortsätter inför GMS RD-gruppens månadsmöte i början av april. Arbetet har främst fokuserat på:

    • Förbättringar av befintlig funktionalitet
    • Buggfixar och stabilisering

    NGP IRIS – kommande release

    En ny version av NGP IRIS (v5.6.7) är under utveckling. Den kommer bland annat att introducera stöd för rekursiv uppladdning av mappar, vilket innebär att mappar som innehåller undermappar kan hanteras direkt vid uppladdning.

    // Erik B