HISTORISK ARTIKKEL: Er analysesvarene fra norske klinisk-kjemiske laboratorier pålitelige? (1966)

FAG i praksis

HISTORISK ARTIKKEL: Er analysesvarene fra norske klinisk-kjemiske laboratorier pålitelige? (1966)

En landsundersøkelse av klinisk-kjemiske analysers nøyaktighet og presisjon.

Publisert

Endret

Bioingeniøren er 50 år i år, og vi markerer det ved å hente frem noen av bladets første fagartikler fra arkivskuffene. Denne artikkelen er fra Fysiokjemikeren, som Bioingeniøren da het, nr. 8, 1966.

Se pdf for tabeller, figurer og referanser som hører til denne artikkelen.

Er analysesvarene fra norske klinisk-kjemiske laboratorier pålitelige (1966).pdf (309 KB)

(Fra: Rikshospitalets Klinisk-Kjemiske Sentrallaboratorium. Sjef: Professor, dr. med. Lorentz Eldjarn.)

En klinisk-kjemisk metode som gir gjennomsnittsverdi nær den virkelige verdi når en og samme prøve analyseres flere ganger, har god nøyaktighet (accuracy). En metode som gir reproduserbare resultater, dvs. liten spredning ved gjentatte undersøkelser av samme prøve, arbeider med god presisjon (precision). Selv om en metode med god presisjon gir analysesvar med liten spredning, kan analysesvaret ligge langt fra den virkelige verdi. I så fall er metoden lite nøyaktig, enkeltresultatene ligger systematisk for høyt eller for lavt i forhold til den sanne verdi. En nøyaktig metode kan på den annen side ha dårlig presisjon, dvs. resultatene kan vise stor spredning rundt den sanne verdi, og det vil kunne forekomme hyppig ved enkeltanalyser at svaret blir villedende. Ved klinisk-kjemiske analyser er det viktig at nøyaktigheten er god, slik at analysemetoden gir resultater som er svar på det man spør om. Siden man i regelen har lite materiale til disposisjon, og tid og arbeidshjelp også begrenser mulighetene for flere analyser, er det dessuten nødvendig at de anvendte metoder har god presisjon.

I desember 1962 gjennomførte vi en enquête blant 84 norske sykehus for å bringe på det rene utbredelsen av de viktigere klinisk-kjemiske analyser (5). Det ble påvist at flere vesentlige analyser hadde liten utbredelse slik at pasienter i en rekke fylker var avskåret fra å bli ytet fullgod klinisk-kjemisk service i en rekke akutte situasjoner. Enquêten ga intet grunnlag for å vurdere hvorvidt de analyser som de facto ble utført, også ble utført med tilstrekkelig nøyaktighet og presisjon. Siden det imidlertid fra utlandet foreligger en rekke større undersøkelser som alle har påvist manglende nøyaktighet og presisjon hos et flertall av de deltagende sykehuslaboratorier (1,6,7,8), synes det a priori å være grunn til å se på analyseresultater også fra norske sykehus med atskillig skepsis.

For å avgjøre hvorvidt norske sykehuslaboratorier som gruppe arbeider med tilfredsstillende nøyaktighet og presisjon, har vi sendt kontrollsera til alle landets større sykehus. En sekundær hensikt med landsundersøkelsen var å hjelpe de individuelle laboratorier å evaluere sine prestasjoner og oppdage feil i sine analyseresultater. Etter avsluttet bearbeidelse av materialet ble derfor sykehusene gjort kjent med de korrekte verdier og plasseringen av sine resultater i forhold til resultatene fra de andre laboratorier. Sykehusene ble gjort oppmerksom på om deres feilaktige resultater skyldtes dårlig nøyaktighet, mangelfull presisjon eller eventuelt begge deler.

Materiale

I mars 1965 sendte vi til hvert av 57 større sykehus 2 sera merket X og Y. 40 av de tilskrevne sykehus stilte seg positivt til undersøke1sen og sendte oss sine analysesvar i retur.

De to sera var forskjellige fortynninger av Seronorm, Nyco, produksjonsnummer 5. Seronorm er et stabilisert, frysetørret hesteserum, hvis innhold av forskjellige serumkomponenter av medisinsk interesse er fastlagt i samarbeid mellom Nyco og fire nordiske spesiallaboratorier (Universitetets Institutt for Klinisk Biokjemi, Rikshospitalet, Oslo; Centrallaboratoriet, Rigshospitalet, København; Centrallaboratoriet, Karolinska Sjukhuset, Stockholm og Centrallaboratoriet, Centrallasarettet, Växjö). På basis av Senonorms «recommended value» for konsentrasjonen av de forskjellige serumkomponenter samt innveining av NaCl, KH3P04 og urea ble fremstilt 4 serumfortynninger (X1 X2, Y1 og Y2) med kjent konsentrasjon av de respektive komponenter.

Prøvene ble utsendt dypfrosne, idet man sikret seg rask postgang. Sykehusene ble bedt om å gjøre følgende 13 analyser: Totalprotein, SGOT, urea, kreatinin, fosfor, kalsium, natrium, kalium, klorid, bilirubin, kolesterol, glykose og serumjern. Serummengden var beregnet å skulle være tilstrekkelig til minst 3 analyser for hver ønsket konstituent i hvert av de to sera. Et svarskjema med plass til de enkelte analyseverdier samt gjennomsnittsverdiene ble medsendt prøvene. Sykehusene ble anmodet om å utføre analysene som rutineundersøkelser, men med den forskjell at hver analyse ble gjort in duplo eller eventuelt flere ganger så langt serummengden rakk. Under bearbeidelsen av materialet har vi ikke tatt hensyn til enkeltanalysene, men basert oss på deres respektive middelverdier. Mens spredningen av enkeltanalyser rundt deres middelverdi sier noe om den anvendte metodes presisjon, vil nemlig selve middelverdien i lavere grad være under innflytelse av eventuelt manglende presisjon og bedre registrere mulige systematiske feil. Manglende presisjon har vi kunnet påvise fordi alle analyser er gjort i 2 forskjellige sera, hvilket har muliggjort vurdering av presisjonen ved hjelp av scatterdiagrammer uten at enkeltanalysenes spredning er tatt i betraktning.

Etter mottagelsen av besvarelsene ble gjennomsnittsverdier, standardavvikeIser og variasjonskoeffisienter bestemt for det totale antall av de respektive analyser. For hvert sykehus ble middelverdien av analyseresultatene for den enkelte substans beregnet som prosentvis positiv eller negativ avvikelse fra den korrekte verdi. På grunnlag av disse sistnevnte verdier ble scatterdiagrammer utarbeidet for de forskjellige analyser. Figur 1-4 viser typiske scatterdiagrammer. Hvert punkt representerer et sykehus. Abscissen angir middelverdiens prosentvise avvikelse fra den korrekte konsentrasjon i serum X, og ordinaten den tilsvarende feil i prosent for serum Y's vedkommende. Såfremt et sykehus for en substans' vedkommende oppnår blinkskudd ved undersøkelsen i begge kontrollsera, vil plasseringen i diagrammet bli svarende til de sentrale kors som representerer de korrekte verdier (0 % feil i både serum X og serum Y). Hvert diagram er delt i 9 felter av to horisontale og to vertikaIe linjer som representerer de tillatelige feilgrenser. Det sentrale felt i diagrammene inneholder punkter plottet av verdier som begge er akseptable, og øvre, høyre felt punkter plottet av verdier som begge er for høye. Hvis en metodefeil bare skyldes dårlig nøyaktighet med bibeholdt presisjon, vil korresponderende verdier av både X og Y være enten for høye eller for lave, og punktene viI bli plassert utenfor det sentrale felt i enten øvre høyre (høy X, høy Y) eller nedre venstre felt (lav X, lav Y). Plassering i øvre venstre eller nedre høyre felt blir resultatet hvis analysene i det ene serum gir feilaktig for høye verdier, mens analysene i det andre serum feilaktig for lave verdier. En metode som gir slike resultater er hverken nøyaktig eller presis, den er uten enhver verdi, og kan muligvis i en gitt situasjon endog utløse disposisjoner som kan være direkte livsfarlige for pasienten. Plassering i de fire øvrige felter må også sies å være forkastelig. Analysene i det ene serum har da gitt et akseptabelt gjennomsnitt, i det andre ikke. Metodens presisjon er for dårlig, mens nøyaktigheten kanskje ikke ligger så langt tilbake.

Metoder med optimal nøyaktighet og presisjon er ikke utarbeidet for alle substanser av klinisk-kjemisk interesse, eller de er for kompliserte til klinisk rutinebruk. Under slike omstendigheter kan man være tvunget til å anvende en unøyaktig metode, men forutsetningen for å kunne gjøre dette er at man etablerer metodens normalområde. Når det gjeldet de konstituenter som vi har bedt om å få undersøkt i de to kontrolIsera, er det for alles vedkommende tilgjengelig både nøyaktige og presise metoder som er så enkle at de burde kunne utføres på alle sykehuslaboratorier. Vi synes derfor det er rimelig å kreve korrekte svar innenfor en viss feilmargin. Noen generelt aksepterte feilgrenser for klinisk-kjemiske analyser finnes ikke. For at en undersøkelsesmetode skal være til diagnostisk hjelp, er det imidlertid uten videre klart at den må kunne skille mellom normale og patologiske verdier. Kravet til metoden vil derfor i første rekke være avhengig av det normale variasjonsområde og i en viss utstrekning også av graden av deviasjon som opptrer fra det normale under patologiske tilstander. Er det liten spredning mellom normale og patologiske verdier, må kravet til metoden være strengere (serumkalsium ) enn når spillerommet er større (urinstoff i serum).

Vi har valgt å kalkulere de tillatelige feilgrenser etter en formel foreslått av Tonks (6):

Tillatelig feil i % =

± 1/4 av normalområdet
_______________________ X 100%
normale gjennomsnittsverdi

Et biologisk variasjonsområde vil vanligvis representere en normal fordeling, og det er vanlig å sette yttergrensene for «normalområdet» ved gjennomsnittsverdien ± 2 standardavvik, dvs. man angir det område som rommer ca. 95,5 % eller ca. 19 av 20 normale. Med disse yttergrensene ser man at den tillatelige feilgrense svarer til ± variasjonskoeffisienten for den biologiske variasjon. Det anvendte krav til de klinisk-kjemiske metoder er altså at gjennomsnittet av duplikate eller triplikate analyser oppnådd med metodene ikke skal avvike mer fra de korrekte verdier enn ± variasjonskoeffisienten for den biologiske normalfordeling. Et normalmateriale studert med en presis metode som systematisk ligger en tillatelig feilgrense for høyt eller for lavt, vil gi ca. 16 % patologiske verdier (utenfor det korrekte normale gjennomsnitt ± 2 S.D.), mens en nøyaktig og presis metode vil gi ca. 4,5 % av verdiene utenfor de samme grenser. Under denne synsvinkel synes vi formelen for beregning av tillatelig feilgrense er rimelig.

Tonks angir at feilgrensene maksimalt skal settes til ± 10 %, selv om utregning etter hans formel gir høyere verdi. For kreatinins vedkommende har vi til tross for dette satt grensen til ± 15 %, fordi denne verdi omtrent svarer til 2 x variasjonskoeffisienten for kreatininanalyser ved Rikshospitalets Sentrallaboratorium. På samme bakgrunn har vi satt den tillatelige feilgrense for natrium til ± 3 %, mens beregning etter Tonks formel gir ± 1,8 %. For alle de øvrige analysers vedkommende har utregning etter Tonks direktiver gitt tillatelige feilgrenser høyere enn ± 2 x variasjonskoeffisienten ved Rikshospitalets Sentrallaboratorium. De anvendte tillatelige feilgrenser kan finnes i tabell l.

Resultater

Analyseverdier ble mottatt fra 40 av de 57 sykehusene, dvs. oppslutningen var 70 %. Det viste seg at flere sykehus ikke hadde utført analysene umiddelbart etter mottagelsen av serum. Siden glykose- og transaminasebestemmelsene viste mange påfallende lave verdier, antok vi at forskjellig grad av glykose og denaturering av transaminase enzymproteinet hadde funnet sted under den varierende henstand, og av denne grunn fant vi det lite hensiktsmessig å inkludere disse analyser i materialet. Av de resterende 11 analyser var det ikke en eneste som ble utført ved alle sykehus. Kreatininbestemmelsene hadde størst utbredelse, idet analyser ble utført ved 39 av 40 sykehus, mens bestemmelse av serumjern på den annen side bare ble utført av 18 sykehus.

Resultatene er sammenstilt i tabell 1. Gjennomsnittsverdiene ligger nær den korrekte verdi, men for 2 analysers vedkommende ligger gjennomsnittsverdi utenfor korrekt verdi ± feilgrense. Dette gjelder bilirubin der gjennomsnittene både for X og Y ligger for høyt, og kalsium der gjennomsnittet av X-analysene er akseptabelt, mens gjennomsnittet av Y-verdiene ligger utenfor feiIgrensen. Både for bilirubin og kalsiums vedkommende kan dette tilbakeføres til at to sykehus har funnet ekstremt høye verdier.

Variasjonskoeffisientene for de respektive analyser varierte fra størrelsesorden 3,2-4,5 % for natrium til størrelsesorden 25,0-33,3 % for bilirubin, som var den konstituent der resultatene viste i særklasse størst spredning. Hele 72,9 % av bilirubinanalysene lå utenfor tillatelig feilgrense, mens for total· proteins vedkommende 16,2 % av analysene ikke var tilfredsstillende og av de øvrige analyser mellom 25,6 og 44,4 %.

I tabell 2, er analysene rubrisert enten etter den prosent som ligger innenfor akseptabel feilgrense eller utenfor henholdsvis 1, 1 ½, 2, 3 og 5 x denne grense. Det sees at 35,8 % av analysene avviker fra korrekt verdi med mer enn ± 1 feilgrense. 7,3 % av analysene er uten enhver kontakt med den korrekte verdi, idet feilene er større enn 3 x tillatelig feilgrense.

Figurene 1-4 viser scatterdiagrammer for 4 av de 11 undersøkte serumkonstituenter. For totalproteins vedkommende er resultatene som helhet betraktet ganske tilfredsstillende. Kolestrol-og bilirubinanalysene viser til dels store og overveiende systematiske variasjoner fra sykehus til sykehus (mangelfull standardisering?), mens kloridbestemmeIsene i første rekke synes å ha dårlig presisjon (sviktende teknikk i pipettering og titrering?).

På grunnlag av punktene l scatterdiagrammene kan man sette opp de 11 analyser i rangeringsorden etter avtagende nøyaktighet og presisjon. Dette er gjort i tabell 3. Det sees at totalprotein ble bestemt med tilfredsstillende nøyaktighet og presisjon ved 79,4 % av de deltagende sykehus, mens bilirubinbestemmelsene i den annen ende av spektret bare ble tilfredsstillende utført ved 20,8 % av laboratoriene.

Prestasjonene til de deltagende sykehus er vurdert ved å sammenlikne hvor ofte de oppnådde plassering i det sentrale felt på scatterdiagrammene for de analyser de utførte. Tabell 4 viser de deltagende sykehus gruppert etter hvor mange prosent av de analyser som de utførte, som viste tilfredsstillende nøyaktighet og presisjon. Spredningen er her maksimal og gir et forstemmende bilde av situasjonen. Selv halvparten av sykehusene greidde ikke en gang halvparten av analysene på en tilfredsstillende måte.

Materialet er undersøkt med henblikk på om noen type sykehus ytet mer pålitelige analysesvar enn andre. Seksten av de 40 sykehus hadde spesialist i i klinisk kjemi som sjef på laboratoriet, mens 24 hadde medisinsk overlege som ansvarlig for laboratoriedriften. Innen den førstnevnte gruppe varierte antall analyser med tilfredsstillende nøyaktighet og presisjon mellom 28,6 til 36,4 % score, de tretten øvrige 63,6 % eller bedre. Gjennomsnittsverdien var 70,4 %. Blant sykehusene som ikke hadde egen laboratorielege, var variasjonsområdet fra 0-100 %. De sykehus i denne gruppe som hadde 100 % tilfredsstillende analyser, hadde bare undersøkt 4 av de 11 konstituenter. Bare 4 av disse sykehus hadde bedre enn 63,6 % score, og gjennomsnittlig var ikke mer enn 33,8 % av analysene tilfredsstillende.

Diskusjon

Den primære hensikt med den gjennomførte kvalitetskontroll i landsmålestokk var å avgjøre hvorvidt det ved norske sykehuslaboratorier gjennomgående er påkrevd å forbedre nøyaktighet og presisjon av de klinisk-kjemiske analyser. Siden 70 % av de tilskrevne laboratorier deltok i undersøkelsen, er det grunn til å tro at de oppnådde resultater er representative for norske sykehuslaboratorier som helhet. Antagelig er resultatene bedre enn de som ville ha blitt registrert ved 100 % oppslutning, for det første fordi det er rimelig å anta at ytelsene er bedre i de laboratoriene som deltar i slike undersøkelser enn i dem som ikke deltar, og for det annet fordi resultatene i deltakergruppen sikkert er bedre enn de som oppnås under en vanlig arbeidsdag på samme sykehus. De to utsendte kontrollsera har sannsynligvis fått spesiell oppmerksomhet, og videre er alle analyser utført to eller flere ganger. Når vi derfor finner at selv ikke halvparten av sykehusene klarte å få halvparten av analysene innenfor en ikke alt for streng feilmargin, er det klart at det foreligger et sterkt behov for forbedring.

Hvis man, som andre har gjort, som et kriterium for et tilfredsstillende fungerende laboratorium, krever at minst 90 % av verdiene er akseptable med hensyn til både nøyaktighet og presisjon, vil bare 10 % av de deltakende laboratorier tilfredsstille disse krav. En viss trøst er å finne i det faktum at utenlandske undersøkelser ikke har gitt bedre resultater enn vi har funnet.

Denne undersøkelsen er lagt opp etter mønster av Tonk’s kanadiske undersøkelse (6), og sammenligning mellom hans og våre resultater faller derfor naturlig. Tonk’s materiale bestod av 170 større klinisk-kjemiske laboratorier som i to tilsendte sera bestemte innholdet av reduserende substanser, «true» glykose, forsfor, totalprotein, natrium, klorid, urea, rest-N og kolesterol. Over 40 % av analysene ble klassifisert som ikke akseptable, og hele 12,6 % avvek fra korrekt verdi med mer enn +/- 5 X tillatt feilgrense. De tilsvarende verdier i vår undersøkelse er henholdsvis 35 % og 3,1 %. Vi har imidlertid vært noe mer liberale i vår ansettelse av tillatte feilgrenser, og stort sett må man derfor si at resultatene i de to undersøkelser stemmer overens.

Den annen hensikt med vår undersøkelse var å få gjort de enkelte laboratorier oppmerksomme på kvaliteten av sine egne ytelser ved å gjøre dem i stand til å sammenligne sine resultater med resultater oppnådd ved andre laboratorier. Gjennom henvendelser til Rikshospitalets Sentrallaboratorium vet vi at flere sykehus som resultat av undersøkelsen, har tatt sine analysemetoder opp til revisjon. Naturlig nok er det hovedsakelig bilirubinanalysene som har vært et sjokk for mange deltagende laboratorier. På undersøkelsestidspunktet kan biIirubinanalyser ikke ha gitt god veiledning med henblikk på f. eks. nødvendigheten av utskiftningstransfusjon ved erytroblastose da analyseresultatene mellom sykehusene varierte fra 68 % til 225 % av den korrekte verdi. Så stor prosentvis variasjon mellom sykehus ble ikke påvist for andre av de 11 analyserte substanser, men for alle gjelder at spredningen synes å være større enn hva som kan ansees forenlig med forsvarlig sykehusdrift.

F. eks. er en pålitelig kalsiumbestemmelse nødvendig når diagnosen hyperparathyreoidisme skal stilles, og det er da forskrekkende å registrere at i ett og samme serum med en kalsiumkonsentrasjon på 6,1 mEkv/l viser gjennomsnittene av dobbelt- eller tredobbelte analyser foretatt på forskjellige sykehus en spredning fra 4,4 mEkv/l til 8,9 mEkv/l.

Det faller utenfor denne artikkels ramme å trekke opp retningslinjer for hva som kan gjøres på de enkelte sykehuslaboratorier for a bedre prestasjonene. Forholdsregler i så måte er tidligere utførlig diskutert i «Tidsskriftet» (2, 3, 4). Det er enighet om at bare med en løpende kontroll kan man ha håp om å knipe feilene når de oppstår, og derved unngå feildiagnoser eller unødvendig forlengelse av sykehusoppholdet. Det er opplagt at flertallet av norske sykehus tar for lett på den løpende kontroll av sine analyser. For vår del mener vi at det er medisinsk påkrevd at man ofrer både tid og penger for å oppnå større sikkerhet. Stilt opp mot de totale driftsutgifter for et sykehuslaboratorium vil utgifter til regelmessig bruk av et kontrollserum bli forsvinnende små. Vi må huske på at en gal analyse er verre enn ingen analyse i det hele tatt, fordi den kan villede klinikeren. Som vist i denne undersøkelse, er selv ikke et utbygd laboratorium med stort analyserepertoar og egen laboratorielege som sjef noen fullgod garanti for at nøyaktighet og presisjon er fullt tilfredsstillende. Det er nødvendig at de anvendte metoder holdes under regelmessig kontroll.

Professor, dr. med. L. Eldjarn takkes for stimulerende diskusjon under opplegget av undersøkelser og utarbeidelser av manuskriptet.

Se pdf for tabeller, figurer og referanser som hører til denne artikkelen.

Les også:

Analysekvalitet 1966 - 2016: Er analysesvarene mer pålitelige i dag enn for 50 år siden?

Stikkord:

Jubileum, Tidsskriftet Bioingeniøren