FAG i praksis
Genomikk: Fra teknologisk utvikling - via forskning - til klinikk
Fagfeltet genomikk (genomics) har dratt nytte av den enorme utviklingen innen såkalte genomvide høykapasitetsanalyser som DNA mikromatriser og høykapasitetssekvensering.
Det er en utvikling som har skjedd det siste tiåret i kjølvannet av det humane genom-prosjektet. Mengden data generert i denne perioden har forandret vår måte å forstå sykdommer på.
I dag har vi en relativt god forståelse av genuttrykksmønstre i for eksempel kreft, og vi kan snart bruke genuttrykksprofiler til prediksjon av prognose og utfall av sykdom. Det er imidlertid fortsatt et stykke igjen til direkte identifikasjon av molekylære mål som kan brukes terapeutisk. De siste årenes utvikling av høykapasitetssekvenseringsteknologi (HTS-teknologi) og den reduserte kostnaden ved denne type analyser, har imidlertid økt interessen for å bruke HTS i skreddersydd medisin (personalized medicine; PM) og åpnet for at HTS nå kan tas i bruk for mer målrettede analyser i klinikken.
Hva er genomikk?
Genomikk er en disiplin av genetikken hvor man kartlegger hele (eller store deler av) genomet i en celle eller et vev, på DNA (genotype) eller mRNA (transkriptom)-nivå, i en og samme analyse. Dette er i kontrast til klassisk molekylærbiologi og genetikk der fokuset ligger på analyse av enkelt gener. Genomikk ble etablert av Fred Sanger da han først sekvenserte et komplett genom fra et virus (1) og et mitokondrium (2) ved hjelp av nyetablerte teknikker for sekvensering; genom-mapping og bioinformatikk på 70-80 tallet. Genomikk består i dag av en rekke forskningsfelter som for eksempel: Funksjonell genomforskning, strukturgenomikk, epigenomikk og metagenomikk.
Funksjonell genomikk omfatter forsøk på å utnytte den store mengden informasjon som er blitt produsert fra genomprosjekter (for eksempel det humane genom-prosjektet) hvor høykapasitetsteknologi som DNA mikromatriser og HTS er blitt benyttet for å beskrive geners (og proteiners) funksjon eller interaksjon ved en biologisk problemstilling. Dette betyr et fokus på dynamiske prosesser som genekspresjon/transkripsjon, translasjon og protein-protein interaksjoner, i motsetning til statiske analyser av for eksempel DNA sekvenser og struktur. Bruken og utviklingen av mikromatriser, HTS og nye bioinformatiske metoder for studier av hele genom/transkriptom, har vært grunnleggende for utviklingen av dette fagfeltet.
Strukturgenomikk ønsker å beskrive den tredimensjonale strukturen til ethvert protein kodet av et genom, basert på eksperimentelle og modelleringstilnærminger. Til forskjell fra tradisjonell strukturprediksjon, hvor man fokuserer på enkeltproteiner, forøker man i strukturgenomikk å bestemme strukturen til et hvert protein kodet av genomet. I dag er sekvensen til hele genomer kjent, og strukturprediksjon kan gjøres raskere enn tidligere siden mange genom er sekvensert og mange proteinstrukturer allerede er løst. Denne kunnskapen kan brukes til å lette modelleringen av liknende strukturer i mindre kjente genom.
Epigenomikk er studier av epigenetiske modifikasjoner av genetisk materiale. Epigenetiske modifikasjoner er reversible og har effekt på uttrykket av gener uten en forandring i selve DNA-sekvensen. Den meste kjente formen for epigenetisk modifisering er DNA-metylering. DNA-metylering er viktig ved uttrykk og regulering av transkripsjon (genuttrykk) i en mengde cellulære prosesser, som for eksempel differensiering/utvikling og tumorigenese. Studier av DNA-metylering på genomikknivå er nå mulig med en ny mikromatriseteknologi og HTS.
Metagenomikk er studier av metagenomer, det vil si genetisk materiale ekstrahert direkte fra mange forskjellige organismer samtidig, for eksempel alt genetisk materiale fra tarmbakteriene hos ett individ. Et annet eksempel er alle mikrober i en jordprøve. Det høye antallet sekvenser, som nå er mulig å generere fra for eksempel en miljøprøve ved hjelp av HTS, gjør det mulig å identifisere mikroorganismer som utgjør bare én prosent av totalen.
DNA mikromatriser
DNA mikromatriser (også kjent som mikromatriser, microarrays, DNA-chips, BeadChips etc.) er en samling av «DNA-spotter» festet til en overflate. Hver mikromatrise kan innholde fra tusenvis til millioner av slike spotter med DNA. Hver spot består av spesifikke DNA-sekvenser kalt prober, som kan binde seg til gensekvenser fra prøvematerialet som skal undersøkes. cDNA/cRNA eller DNA fra en biologisk prøve kan så bindes (hybridiseres) til disse probene under stringente betingelser. Binding til probene blir vanligvis kvantitert og detektert ved hjelp av et fluorescerende molekyl som er bundet til prøvematerialet.
Genekspresjonsanalyser: Mikromatriseteknologi er hovedsakelig blitt brukt til to formål: Genekspresjonsanalyser (mRNA) og analyser av genetisk variasjon på DNA-nivå. Spesielt har genekspresjonsanalyser av kreftmateriale generert tusenvis av publikasjoner de siste 10 årene, og gitt mye kunnskap om forskjeller i genuttrykksmønsteret mellom friskt og malignt vev. Dette har resultert i genekpresjonsprofiler som kan tenkes brukt i kreftdiagnostikk og klassifikasjon.
Roepman et al. (3) laget for eksempel en genekspresjonsklassifikator for hode/hals plateepitelcarcinomer bestående av 102 gener basert på et mikromatriseforsøk. Denne klassifikatoren kunne forutsi tilstedeværelse av lymfeknutemetastaser med en nøyaktighet på 86 prosent, sammenliknet med konvensjonell diagnostikk som ga en nøyaktighet på 68 prosent. Dette er et godt eksempel på at mikromatrisebaserte genuttrykksprofiler kan bli klinisk nyttige. Et annet eksempel fra Bittner et al. (4) viser hvordan man kan bruke mikromatrisebaserte genuttrykksdata til å identifisere tidligere ukjente subtyper av malignt melanom og at disse subtypene har avvikende prognose.
CGH og SNP: Samtidig med genekspresjonsmikromatriser ble det utviklet mikromatrisebaserte metoder for komparativ genomhybridisering (CGH) og analyse av enkeltnukleotidpolymorfismer (SNP). Dette har gitt forskere mulighet til å utforske kreftgenomet for kopitallvariasjoner, og biobanker har brukt SNP-analyser til å studere mekanismer for sykdom og helse. Kreftgenomet er preget av genetisk variasjon med kopitallendringer i alt fra mikrodelesjoner/amplifikasjoner på basenivå til megabaser av DNA og hele kromosomer. Mikromatriser har lenge blitt brukt til CNV-analyser, og i dag er oligonukleotidbaserte CGH (Agilenthttp://www.genomics.agilent.com) og SNP-baserte (Affymetrix og Illumina) de foretrukne metodene for høykapasitets genomisk profilering av kreft. Dagens SNP mikromatriseformater dekker fra 10 000 til 5 000 000 SNP-markører på en enkelt mikromatrise, og kan derfor erstatte eldre teknologier som mikrosatelittmarkøranalyser. SNP-mikromatriser har blitt spesielt viktige for genomvide assosiasjonsstudier (GWAS), der forskere prøver å identifisere gener involvert i sykdom. Metoden søker etter SNP-er som forekommer hyppigere i grupper av personer med en spesifikk sykdom, enn hos grupper uten sykdommen. Forskere kan så bruke disse SNP-ene til å peke på gener som bidrar til risiko for å utvikle en bestemt sykdom. GWAS-studier analyserer et høyt antall SNP-er fra store deler av genomet, derfor kan denne metoden avklare komplekse sykdommer hvor summen av endringer i mange forskjellige gener gir risiko for å utvikle en bestemt sykdom. GWAS-studier har allerede blitt brukt i mange store studier og har identifisert SNP-er relatert til flere komplekse sykdommer som for eksempel diabetes, Parkinson og Crohns sykdom (5). Forskere håper nå at nye GWAS-studer vil kunne identifisere SNP-er assosiert med enda flere sykdommer og variasjoner som påvirker et individs respons på medikamenter og miljøfaktorer.
Høykapasitetssekvensering
Høykapasitetssekvensering - HTS - også kalt «neste generasjons sekvenseringsteknologi» eller «dypsekvensering» har de siste fem årene revolusjonert mulighetene innen genomikk, i og med at vi nå har teknologi som kan bestemme gensekvenser flere tusen ganger raskere og billigere enn konvensjonell teknologi (Figur 1). Som et eksempel kan nevnes Det humane genom-prosjektet hvor det tok 13 år å sekvensere ett humant genom fullstendig (6) med konvensjonell teknologi. Kostnadene var cirka 1,8 milliarder kroner.
I 2008 ble de første humane fullgenom-HTS-sekvenseringsresultatene publisert (7), da var prisen kommet ned i cirka 9 millioner kroner og arbeidet tok noen uker. Med dagens teknologi kan en sekvensere 600Gb i en eneste sekvensreaksjon til en kostnad på omkring 100 000 kroner. Dette tilsvarer 200 ganger størrelsen til det human genom. I dag finnes det også teknologi som gjør det mulig å fullgenomsekvensere humane genom på under to dager. Et mål som kanskje blir nådd i løpet av 2013, er å få ned kostnaden til $1000 for et humant genom. Det er per i dag flere firmaer som hevder å kunne klare det. Den enorme utviklingen og alle de nye mulighetene som HTS gir, har ført til at teknologien er blitt attraktiv innen både medisinske og ikke-medisinske fagområder. For medisinske fagområder anvendes teknologien foreløpig hovedsakelig til forskning, men det er nå en dreining mot at HTS blir brukt aktivt for eksempel i klinisk medisin og mikrobiologi.
Amplifikasjon av fragmentert DNA
Felles for plattformene som per i dag er tilgjengelig for HTS-analyser, er at de baserer seg på amplifikasjon av fragmentert DNA (kloner). Hver klon blir så sekvensert parallelt, og man kan sekvensere opp til 3 milliarder DNA-fragmenter samtidig i en sekvensreaksjon. De mest brukte teknologiene tilgjengelig for HTS i dag er 454 (Life Sciences http://454.com) som baserer seg på pyrosekvensering, Illumina sekvensering (http://www.illumina.com/) som baserer seg på sekvensering ved syntese, mens Ion Torrent (Life Technologies http://www.iontorrent.com/) baserer seg på ion semikonduktor sekvensering (Figur 2). 454-teknologien tillater leselengder av hvert DNA-fragment på opp til cirka 1kb, mens Illumina og Ion Torrent leser 2-500 baser. Dette gjør at 454 er godt egnet til de novo sekvensering, mens Illumina og Ion Torrent som generer korte avlesninger, men mange flere, er best egnet for applikasjoner der hver base ønskes lest flest mulig ganger for å minimere feil. Dette er viktig hvis man for eksempel ønsker å lete etter somatiske mutasjoner i det humane genom.
Sanntidsanalyser
Den siste utviklingen innen HTS er metoder der enkeltmolekyler av DNA sekvenseres i sanntid uten direkte amplifikasjon. Dette betyr at nukleotidene blir detektert etter hvert som de blir inkorporert i sekvenseringsreaksjonen. PacBio (Pacific Biosciences http://www.pacificbiosciences.com) leverer allerede slik utstyr, men det er fortsatt litt usikkert hvor godt denne teknologien fungerer, sammenliknet med systemer som baserer seg på klonal amplifikasjon. Oxford Nanopore Technologies (www.nanoporetech.com) har også utviklet et system for sanntidsanalyse av enkeltmolekyler (DNA/RNA/proteiner) basert på nanoporer. Disse systemene for sanntidsanalyse av enkeltmolekyler vil kunne lese lengre sekvenser og potensielt gjøre analysene mye raskere og billigere enn dagens metoder, noe som vil gjøre veien til klinisk nytte kortere.
Resekvensering
Innen medisinsk forskning er det resekvenseringapplikasjoner som er mest brukt. Et eksempel er analyser der man trekker ut deler av genomet som er av spesiell interesse, for eksempel det proteinkodende exomet (exomsekvensering), som så sekvenseres i en slik dybde at man kan se etter mutasjoner. Man kan også ved hjelp av kryssbinding og immunopresipitering (Chip Seq) trekke ut sekvenser som er relatert til genreguleringsmekanismer og sekvensere disse. HTS gjør det også mulig å detektere epigenetiske modifikasjoner i hele genomet (for eksempel DNA-metylering). Transkriptomet (og små RNA) kan også sekvenseres for å kvantitere genuttrykk, men HTS i tillegg kan gi informasjon om for eksempel spleisevarianter og SNP-er som vi tidligere ikke har kunnet gjøre med standard mikromatriser.
Genomprosjekter
Disse applikasjonene har allerede blitt brukt i en rekke større genomprosjekter. For eksempel har ICGC (International Cancer Genome Consortium)(10) som mål å skaffe HTS sekvensinformasjon fra 50 forskjellige krefttyper som er viktige verden over. Intensjonen er å analysere mer enn 25 000 kreftgenomer for å lete etter kreftspesifikke forandringer på DNA-nivå (SNP og epigenetiske forandringer) og RNA-nivå (transkriptom). I Norge er det nettopp startet opp et tilsvarende prosjekt (Norwegian Cancer Genomics Consortium http://cancergenomics.no) (11,12). Prosjektet skal etablere felles teknologi, metodologi og tolkningsrutiner for å bruke kreftsvulstenes mutasjonsprofil til å veilede en individtilpasset kreftbehandling. To bevilginger fra Norges Forskningsråd på til sammen 75 millioner kroner gjør dette prosjektet gjennomførbart.
Bruk i klinikken
Disse genomprosjektene er per i dag alle på forskningsstadiet, men det finnes allerede eksempler hvor HTS har blitt brukt direkte i klinikken, som innen infeksjonsdiagnostikk og exomsekvensering av pasienter med sjeldne genetisk betingede sykdommer. For eksempel ble et nytt virus oppdaget og beskrevet hos en pasient med klinisk hemoragisk feber (13). RNA-ekstrakt fra pasientens serum og en vevsprøve ble sekvensert, og 72 timer etter at forskerne hadde mottatt de biologiske prøvene, var de i stand til å gi en full identifikasjon og fylogenetisk karakterisering av viruset. En fordel med HTS-teknologien i en slik sammenheng, er at den kan brukes til å identifisere virus og mikroorganismer uten å isolere og dyrke disse på forhånd.
Et annet eksempel fra klinikken hvor exomsekvensering ble brukt med hell, er et tilfelle hvor et barn med meget alvorlig, behandlingsrefraktær inflammatorisk tarmsykdom (IBD) viste seg å ha en inntil da ukjent årsak til sykdommen (14). Exomsekvensering identifiserte en ukjent mutasjon (SNP). Identifikasjonen av denne (og kunnskap om funksjonen til genet som var involvert), gjorde at det ble besluttet å gjøre beinmargstransplantasjon, noe som kurerte barnet.
Dette er eksempler som viser hvordan HTS kan nyttes i kliniske situasjoner. I tillegg er det sannsynlig at HTS-basert exomsekvensering vil bli en del av den kliniske rutineevalueringen av pasienter med mistenkt genetisk relaterte sykdommer.
Konklusjon
Høykapasitets genomikkmetoder har revolusjonert store deler av medisinsk-biologisk forskning. Metodene gir en innsikt i detaljer av genenes struktur og funksjon, som var utenkelig for noen få år siden. Det er sannsynlig at flere av disse metodene vil finne en plass i klinisk virksomhet innen overskuelig fremtid.