Bioinformatikken bliver stadig mere viktig

Det tager år for bioinformatikerne af udvikle serien af programmer til håndtering af data, også kaldet pipelinen. Bioinformatiker Søren Vang viser et eksempel. Den lange røde linje ned over skærmen afmærker en potentiel genfejl. Foto: Helle Arensbak

Aktuelt

Bioinformatikken bliver stadig mere viktig

Men er bioanalytikerne selv i stand til også at udføre de bioinformatiske opgaver? På højtspecialiserede MOMA er det ikke tilfældet. Her arbejder bioanalytikere, bioinformatikere og molekylærbiologer tæt sammen, men med hver deres ekspertise.

Publisert

Endret

Next Generation Sequencing (NGS) har gjort bioinformatikere til en efterstræbt faggruppe på hospitalerne. I Molekylærmedicinsk Afdeling (MOMA), Aarhus Universitetshospital arbejder nu 15 af slagsen, som dog ikke alle sammen beskæftiger sig med NGS. Behovet for bioinformatikere vil stige yderligere i de kommende år, mener ledende bioanalytiker Mie Farsinsen.

For der er brug for bioinformatikernes ekspertise til at sortere og finde afvigelser i de tusindvis af sekvensbidder, som afdelingens bioanalytikere i NGS-laboratoriet producerer som første skridt i en lang proces fra blodprøve til genetisk diagnose.

MOMA har specialiseret sig i arvelig cancer og arvelig hjertesygdom, og afdelingen driver desuden en masse forskning også i bioinformatik. Prisen på sekventering er styrtdykket, og kendskabet til arvelige og sygdomsfremkaldende mutationer stiger år for år. Stadig flere familier kan få svar på, om sygdom i familien skyldes en arvelig mutation, så de kan sætte ind med forebyggende behandling i tide.

Efter sekventering kommer bioinformatisk databehandling, og det har fået flere til at tænke på, om ikke bioinformatikken er et felt, som bioanalytikere kunne kaste sig over. Her kunne blive rigtig mange jobs i fremtiden.

På MOMA er svaret nej. I hvert fald ikke som bioinformatikerne arbejder i MOMA i dag. Bioanalytikerne er eksperter i laboratoriearbejde, prøvetagning, håndtering af prøvemateriale, analysering, DNA-oprensning og NGS analysemetoder, men hverken de eller afdelingens molekylærbiologer har den ekspertviden inden for programmering, som kræves.
”Det er jo heller ikke det, som vi bioanalytikere synes, er det sjove. Vi interesserer os mere for tolkningen af analysen. Ikke programmering”, siger afdelingsbioanalytiker I MOMA Lone Andersen.

Så måske er det i virkeligheden molekylærbiologens arbejde med tolkningen af bioinformatikernes resultater, som frister en bioanalytiker?
Fagbladet er taget på besøg hos MOMA for at følge en prøve fra prøvetagning til diagnose og se, hvad det er, bioanalytikerne, bioinformatikerne og molekylærbiologerne hver især bidrager med, når en familie skal have vished.

Bioanalytikerne sekventerer

Fra prøven ankommer til NGS laboratoriet, og til den er klar til Illuminas sekventeringsmaskiner er der typisk gået 7 arbejdsdage. Processen er et komplekst workflow, hvor alle prøver skal behandles individuelt. Der er rigtig mange håndteringer, rigtig meget apparatur og flere kvalitetssikringstrin, der skal sikre validiteten af data.

”Vi skal hele tiden være på spidserne”, siger afdelingsbioanalytiker Lone Andersen. Hun har været med helt fra gendiagnosernes spæde start, hvor alt foregik ved Sangersekventering og håndholdte procedurer.

Workflowet begynder mandag. Bioanalytikerne starter med at kvantificere det oprensede DNA fra blodprøven med et Qubit flourometer. Denne værdi bruges til bestemmelse af, hvor meget der skal udtages af hver enkelt prøve til fortyndingen i næste trin i processen. Det er vigtigt, at der benyttes samme input mængde i alle prøverne. Derefter fragmenteres DNA´et ved hjælp af lydbølger i en Covaris. DNA- kæderne bliver herved slået i stykker, og man ender med en pæn samling af 200-400 basepar lange fragmenter.

Næste kvalitetssikring foregår med den uundværlige lapchip GX, som bioanalytikeren bruger til at se, om fordelingen på størrelse og længde af de forskellige fragmenter stemmer.

Robotten der laver Librarys. Afdelingsbioanalytiker Lone Andersen placerer bakker og tips ( pipette spidser) i robotten. Foto: Helle Arensbak

Fremstiller patientens ”bog”

Tirsdag klargør bioanalytikerne DNA-fragmenterne til sekventering. Resultatet bliver et såkaldt bibliotek eller patientens ”bog”, der indeholder samtlige genomiske DNA-stykker fra patienten. Det er en lang proces med mange håndteringer, og på MOMA er den automatiseret på en Sciclone Robot. Det hele munder ud i DNA-stykker påsat en adaptor samt en unik stregkode for hver patient. Stregkoden benyttes til at sortere data efter sekventeringen og en adaptor gør det muligt for DNA-stykkerne at binde sig til flowcellen, der benyttes til sekventeringen på Illumina-maskinen.

Udvælger prober

Onsdag laves de sidste kvalitetstjek og koncentrationsbestemmelser på biblioteket. Resultaterne samles og beregnes, og bioanalytikerne laver skemaer til targeteringen med relevante prober. Patienter, der skal analyseres med samme probepanel blandes i lige forhold i en reaktion, på grund af den høje pris på prober. Hvilke prober, der skal benyttes, afhænger af, hvad lægen har bestilt. Probereaktionen skal stå i 72 timer og laves fredag, så den er klar mandag. Proberne binder sig til de regioner, man er interesseret i og overskydende områder kan så efterfølgende vaskes væk ved hjælp af magnetiske beads, der binder sig til proberne.

Stammer prøven fra en hjertepatient, hvor indikationen for analysen var pludselig død, er det ofte et større panel af 111 gener, der skal undersøges nærmere. I starten udviklede bioanalytiker og molekylærbiolog selv proberne, men nu kan de købe mange færdige sæt. Hjerte- og cancerpanelet er dog afdelingens eget design, der løbende redesignes i samarbejde med klinikerne.

Sekventerer på Illumina-maskiner

Mandag i uge to færdiggør bioanalytikeren biblioteket. Efter vask og ny PCR udføres igen kvalitetstjek inklusive kvantificering. Herefter er biblioteket klar til Illumina sekventeringsmaskiner. Selve sekventeringen varer lidt over et døgn.

Sideløbende med NGS laves der ID-SNPs ved hjælp af smeltekurver på en Lightscanner. ID-SNPs og udføres på en anden prøve fra samme patient. Herved kan man sammenholde kombinationer af unikke enkeltbase polymorfier, der tilsammen udgør genomets indre stregkode. ID-SNPs bruger bioanalytikeren til at sikre, at der ikke er sket forbytning af patientmaterialet. Til slut afleverer bioanalytikeren hele biblioteket til bioinformatikeren.

Bioinformatikeren sorterer og finder afvigelser

Når bioanalytikerne er færdige med NGS, overtager bioinformatikeren den gigantiske mængde data. Han ved endnu ikke, hvad han leder efter. Gensekvenserne skal først sorteres, mappes op mod et kendt referencegenom og undersøges for afvigelser.

Tolkningen af data er et etisk ømtåleligt felt. ”Vi kigger kun i det, som vi er blevet bedt om, så vi ikke kommer til at se noget, vi ikke skal se. Analysen af hele patientens genom, ligger der jo”, siger molekylærbiolog Mette Gaustadnes. Foto: Helle Arensbak.

Tyngden i bioinformatikerens arbejde ligger i udviklingen og sammensætningen af programmerne. Nogle gange skal han selv designe programmerne helt fra bunden, andre gange findes standardsystemer, han kan anvende eller bygge videre på. Søren Vang er mangeårig bioinformatiker i MOMA. Når han skal forklare sit arbejde, henter han eksemplerne fra hverdagen.

”Man kan jo godt køre en bil til Gedser, men først skal der bygges en vej”, siger han og sammenligner sig selv med en bilmekaniker. Hvis noget ikke kører, skal han have indgående kendskab til, hvordan programmet fungerer for at lave de fornødne ændringer.

Aligner DNA-stumperne

Første step i Sørens arbejde med det sekventerede DNA er at sortere og aligne DNA-stumperne. Her er det en kæmpe hjælp, at længden af hver eneste sekventeret stump er bestemt fra bioanalytikerens arbejde.

”Det, programmerne gør, er at tage hver enkelt stump DNA og lede efter en plads til den på referencegenomet. Det kan være at 3’ enden matcher et sted på både kromosom 2, 5 og 17. Men hvad med 5’ enden? Den passer måske kun til kromosom 2 og 5.”

Søren tegner og forklarer, hvordan den kendte afstand målt i basepar mellem matchende 3’ og 5’ ender er nøglen til at få placeret sekvenserne i rigtig rækkefølge på de rette kromosomer. Lidt som at lægge brikkerne på et billede af det færdige puslespil.

Mapper op imod refererencegenom

Billedet, han mapper sekvensstumperne op imod, er det internationale referencegenom.
Nogle områder af genomet er ekstra svære at mappe korrekt. Det kan være, at der er mange repeterede sekvenser eller steder på genomet med stor lighed i basesammensætningen. Det tager år at udvikle serien af programmer til håndtering af data, også kaldet pipelinen. Når sådan en pipeline kører som den skal, er der egentlig ikke brug for bioinformatikeren. Men når programmerne kløjs i sekvenserne, og produktet ser underligt ud, må Søren agere fejlfinder og rode med programkoderne igen.

Tjekker kvalitet af data mange gange

Søren Vang bruger også lang tid på kvalitetstjek og vurdering af datakvaliteten.
På sin computerskærm viser han et eksempel. En lang rød linje ned over skærmen afmærker en potentiel genfejl.
”Men de fleste reads, altså gentagne aflæsninger af sekvensen, skal være enige om, at her er en ændring fra referencegenomet. Hvis det kun er en lille del, forkaster vi det fund.”

Søren Vangs slutprodukt er det færdigt alignede genom og en brutttoliste over mulige mutationer, som nu går videre til molekylærbiologen.
Inden da spørger fagbladet Søren Vang:
Vil bioanalytikerne kunne udføre dit arbejde?

”Alle kan naturligvis lære det, men det er ikke nok med et tre ugers kursus. Snarere tre år plus matematik og statistik. Men det handler jo også om, hvad man mener, når man siger bioinformatik. Nogle kalder det for bioinformatik, når man putter nogle hundreder data i et excel- ark. Det er blevet et meget udvandet begreb”, siger Søren Vang.

Hverken ledende bioanalytiker Mie Farsinsen eller afdelingsbioanalytiker Lone Andersen mener, at bioanalytikere vil kunne erstatte bioinformatikerne.

”Vi arbejder jo slet ikke med databaser og programmering, som de gør”, siger Lone Andersen.
Mie Farsinsen foreslår, at bioanalytikerne i stedet overvejer efteruddannelse i NGS.

Molekylærbiologen fortolker og giver svar

Når bioinformatikeren har udpeget de steder på genomet, hvor der kan være alvorlige afvigelser, skal molekylærbiologen på banen.

”Det første, jeg gør, er at sikre mig, at kvaliteten af data er i orden”, forklarer molekylærbiolog i MOMA Mette Gaustadnes.
Hun ser på, hvordan prøverne er kørt og tjekker flere forskellige parametre for at sikre, at kvaliteten er i orden. Hvis ikke, går hun tilbage i laboratoriet og ser på, hvad der kan være sket.

”Hvis ikke kvaliteten er i orden, kører vi oftest prøven helt om. Måske skyldes det dårligt prøvemateriale fra starten”, forklarer hun.
Hun laver en rapport over de områder, der skal gapfilles, det vil sige områder med mindre end 30 gange dækning, og hvor der er brug for at fylde ud ved hjælp af traditionel Sangersekventering.

Undersøger kvalitet af varianter

Er den overordnede kvalitet af datasættet er i orden, begynder Mette at undersøge kvaliteten af varianter, der er fundet i prøven.
Sekvenser med varianter skulle gerne være læst ca. lige mange gange forfra og bagfra – og heterozygote alleler skulle gerne fordele sig fifty-fifty.
Bioanalytikere har kvalitetssikring på rygmarven, og hele denne kvalitetssikringsdel kunne godt være en bioanalytikeropgave, mener både Mette Gaustadnes og Mie Farsinsen, men udviklingen går stærkt, og de forventer, at den del af processen snart vil være automatiseret.

”Der er et kæmpe kommercielt marked her”, konstaterer ledende bioanalytiker Mie Farsinsen.

Etik er vigtig i tolkningen

Efter kvalitetssikringen starter Mette Gaustadnes på selve tolkningen af data, som er et etisk ømtåleligt felt.

”Vi kigger kun i de gener, vi er blevet bedt om, så vi ikke kommer til at se noget, vi ikke skal se”, siger hun.
Nogle varianter er velkendte, andre skal molekylærbiologen på jagt i litteraturen for at finde, og her må hun vurdere, om beskrivelserne er til at stole på.

”I starten tager det lang tid, men efterhånden vil vi have set de fleste varianter før og skal kun tage stilling til ganske få varianter pr. patientprøve,” siger Mette Gaustadnes.

Inddeler resultater

Resultatet af tolkningen opdeles i fem klasser.
Klasse 5 er en sikker patogen mutation, mens klasse 4 er formodet patogen. Klasse 3 er en variant af ukendt betydning. Klasse 2 er formodet benign, og klasse 1 sikker benign.

Hvis genundersøgelsen påviser en ukendt mutation, tyr hun til litteraturen. Hvis mutationen forekommer hos mere end 1% af den danske befolkning, er den formodentlig ikke patogen. Mette Gaustadnes forklarer:

”Vi kigger også på, om den er fundet hyppigt i andre befolkningsgrupper. Hvis det f.eks. er en missensemutation, der medfører ændring af enkelt aminosyre, undersøges effekten af varianten også med forskellige in-silico prædiktionsprogrammer”.
”Hvis resultatet af den genetiske undersøgelse er klasse 4 eller 5 kan det bruges diagnostisk i familien. Medlemmer af familien kan undersøges for om, de har samme mutation og sættes i et relevant kontrolprogram”, siger Mette Gaustadnes.

Stikkord:

Bioinformatikk, Danmark, Genetikk, Gentest, Utdanning