Indledning

Statistisk processtyring (eng.: Statistical Process Control, SPC) er en gren af den statistiske videnskab som bruges inden for kvalitetsforbedring til at forbedre produkter og tjenesteydelser. Centralt i SPC er forståelse for processers variation i tid og rum. Procesbegrebet skal i denne sammenhæng forstås bredt som noget, der modtager input og leverer et resultat. En proces kan fx være en operation og resultatet et udtryk for i hvor høj grad operationen hjælper patienterne. Af hensyn til den statistiske analyse er det nødvendigt, at resultatet kan udtrykkes i tal. Tal, som på denne måde udtrykker kvalitet, kalder vi for indikatorer. Som et tænkt eksempel kunne vi lade nogle patienter score deres eget behandlingsresultat på en visuel analog-skala fra -5 til 5, hvor værdier over 0 udtrykker en forbedring, og værdier under 0 udtrykker en forværring.

På grund af variation i utallige faktorer, som har betydning for resultatet, er indikatorværdien sjældent helt ens for to patienter. I nogle tilfælde kan forskelle i behandlingsresultater forklares ved særlige forhold, fx alternativ operationsteknik, konkurrerende sygdomme hos patienten eller defekt udstyr, som bevirkede at det gik særligt godt eller skidt for en patient. Men i de fleste tilfælde er det ikke muligt entydigt at forklare de forskelle, vi observerer, med andet end naturlig variation.

Ændring i funktionsniveau efter operation

Ændring i funktionsniveau efter operation

Figuren ovenfor viser operationsresultatet fra 24 fiktive operationer. Prikkerne på kurven er afsat i den rækkefølge, patienterne blev opereret. Den vandrette streg markerer den mediane funktionsforbedring, som er 2, og selv om resultatet varierer fra patient til patient, ligger de fleste i nærheden af midtpunktet. Men patient nr. 20 skiller sig ud med en score på -2. En samvittighedsfuld kirurg vil straks spørge “hvorfor?”. Der kan være mange forklaringer, og langt fra alle handler om dårlig operationsteknik. Det væsentlige er at finde årsagen og så vidt muligt forhindre, at det sker igen.

Kvalitetsindikatorer knyttes ofte til kvalitetsstandarder, som udtrykker det ønskede eller forventede niveau for kvaliteten. Standarder kan være enkeltværdier, som udtrykker det lavest eller højest acceptable niveau, eller dobbeltværdier, som udtrykker et ønsket interval for en given indikator.

Det er en vigtigt overvejelse, som ofte glemmes, om en standard gælder enkeltmålinger eller aggregerede målinger. Hvis standarden gælder enkeltmålinger, tilstræber vi, at alle målinger ligger på den rigtige side af standarden. Hvis standarden gælder aggregerede målinger, er det tilstrækkeligt, at gennemsnittet eller medianen af alle målingerne ligger rigtigt. Hvis fx standarden for operationsresultatet fastsættes til 1.5, skal vi vide, om den kun er opfyldt, hvis alle patienter scorer over 1,5, eller om det er tilstrækkeligt, at den gennemsnitlige forbedring er over 1,5.

Det er også værd at overveje, om man skal stille krav til variationsbredden – altså, hvor meget må enkeltmålingerne afvige fra hinanden og fra gennemsnittet? De fleste vil nok foretrække så lidt variation som muligt så fx en Big Mac eller en cola smager ens i Hangzhou og i Herning.

God kvalitet betyder derfor to ting: 1: at resultatet varierer mindst muligt og på en forudsigeligt måde, og 2: at resultatet lever op til de forventninger, der knyttes til det.

To slags variation

Hovedformålet med at analysere data over tid er at erkende væsentlige ændringer i de underliggende strukturer og processer, som skaber data, så vi kan handle fornuftigt.

Men selv om tallene ændrer sig, betyder det ikke nødvendigvis, at den underliggende proces har ændret sig. Og selv når processen ændrer sig, er det ikke altid, at tallene ændrer sig. I eksemplet vil de færreste være i tvivl om, at patient nr. 20 repræsenterer en afvigelse. Men ville vi også opfatte det som en afvigelse, hvis patient 20 havde scoret 0? Så hvordan skelner vi mellem tilfældige måleudsving og sikre forandringer?

Walther A. Shewhart, som grundlagde SPC, beskrev to slags variation: almindelig variation (common cause variation) og særlig variation (special cause variation).

Almindelig variation

  • kaldes også tilfældig variation eller støj,
  • findes i alle processer,
  • skyldes fænomener, som altid er til stede,
  • karakteriserer en stabil og dermed forudsigelig proces.

Særlig variation

  • kaldes også ikke-tilfældig variation eller signal,
  • findes i nogle men ikke alle processer,
  • skyldes fænomener, som ikke normalt er til stede i systemet,
  • karakteriserer en ustabil og dermed uforudsigelig proces.

Evnen til at skelne de to typer variation fra hinanden er afgørende for valget af forbedringsstrategi. Er processen ustabil (= særlig variation), bør man søge at finde årsagen eller årsagerne til ustabiliteten og eliminere eller implementere disse alt efter, om afvigelserne går den forkerte eller rigtige vej. Målet er at stabilisere processen på det ønskede niveau.

Er processen derimod stabil (= almindelig variation), skal man spørge sig selv, om den er tilfredsstillende – opfylder den “kundens” (patientens, ledelsens, borgerens, samfundets osv.) behov og forventninger? Hvis det er tilfældet, er det vigtigt at beholde hænderne i lommen og undgå at pille ved processen, selv om målingerne tilfældigt går op og ned. Dette kaldes tampering og medfører øget variation. Er processen stabil men utilfredsstillende, er det nødvendigt med gennemgribende forandringer i de underliggende strukturer og arbejdsgange, som driver processen, for at flytte den til det ønskede niveau.

Tabellen viser de fire tilstande en proces kan befinde sig i og de tilhørende passende handlinger:

Processens og kundens stemme: Kontrollér: Overvåg processen, minimér uønsket, tilfældig variation. Stabilisér: Eliminér uønsket eller implementér ønsket ikke-tilfældig variation. Revidér: Optimér strukturer, procedurer og arbejdsgange, så processen flytter sig og stabiliseres på et nyt og bedre niveau.
Stabil proces Ustabil proces
Tilfredsstillende resultat Alt i orden: kontrollér procesen Procesproblemer: stabilisér procesen
Utilfredsstillende resultat Produktproblemer: revidér procesen Kaos: stabilisér og revidér procesen

Shewharts kontroldiagram

Shewhart opfandt kontroldiagrammet i 1924 som et enkelt redskab til at skelne mellem almindelig og særlig variation i produktionsprocesser. Shewhart arbejdede på det tidspunkt i inspektionsafdelingen på Bell Labs, som producerede telefonapparater. Han beskrev i sin første bog fra 1931 en lineær og ineffektiv metode til kvalitetskontrol: specifikation \(\rightarrow\) produktion \(\rightarrow\) inspektion. Man inspicerede simpelthen alle færdige produkter og kasserede eller reparerede dem, der ikke overholdt specifikationerne. Shewhart fandt ud af, at man ved at indarbejde kvalitetsstyring i alle led af produktionskæden, kunne minimere eller ligefrem undgå, defekte produkter i sidste ende og dermed spare virksomheden for mange resurser. Det var til dette formål, han opfandt kontroldiagrammet, som gjorde det muligt for medarbejderne ved samlebåndet at vide, hvornår og hvordan (som i tabellen ovenfor) de skulle reagere på afvigelser i løbende kvalitetsmålinger i de forskellige led af produktionskæden.

Kontroldiagrammet er et xy-diagram med prikker forbundet med lige streger. X-aksen viser tiden eller rækkefølgen af målingerne, og y-aksen viser indikatorværdierne. En vandret linje markerer datas midtpunkt (som regel gennemsnittet), og grænserne for den almindelige variation vises som en øvre og nedre kontrolgrænse markeret med grå baggrund i figuren.

Hospitalserhvervet bakteriæmi

Hospitalserhvervet bakteriæmi

Kontrolgrænserne placeres normalt ved +/- 3 standardafvigelser (SD eller sigma) fra midtlinjen. I figuren er øvre og nedre kontrolgrænse hhv. 10 og 40. Bemærk, at standardafvigelsen, som indgår i beregningen, er den estimerede almindelige variation – ikke den puljede standardafvigelse af alle datapunkterne, som også omfatter eventuel særlig variation. For at undgå misforståelser bruger de fleste betegnelsen sigma om den standardafvigelse, som indgår i beregning af kontrolgrænser.

Udregning af kontrolgrænser forudsætter antagelser om datas teoretiske sandsynlighedsfordeling, og der findes mange forskellige typer kontroldiagrammer til forskellige typer data. Men fortolkningen er enkel og ens for dem alle: Hvis alle målepunkterne ligger mellem kontrolgrænserne, er der almindelig variation. Målepunkter uden for kontrolgrænserne indikerer særlig variation. Vi vender tilbage til beregning af kontrolgrænser i afsnittet om valg af kontroldiagram.

Figuren viser den månedlige forekomst af hospitalserhvervet bakteriæmi på Rigshospitalet i perioden 2015-2016. I gennemsnit er der 25 tilfælde om måneden. De fleste måneder er der mellem 20 og 30 tilfælde og enkelte måneder lidt flere eller færre. Kontrolgrænserne viser, at den almindelige variation spænder fra 10 til 40 tilfælde om måneden. Med andre ord: hvis intet forandrer sig, skal vi i fremtiden ikke undre os, hvis der en enkelt måned er så få som 10 eller så mange som 40 tilfælde.

Det er vigtigt at forstå, at kontrolgrænserne beregnes ud fra den naturlige variation, der findes i data og derfor taler med processens stemme – de fortæller, hvad processen er i stand til at levere, hvad enten vi bryder os om det eller ej. Kontrolgrænser er altså noget ganske andet end specifikationsgrænser og standarder, som taler med kundens stemme.

God kvalitet – som i øverste venstre kvadrant i tabellen ovenfor – er når processen og kunden taler med én stemme, dvs. når processen er stabil, og standarden ligger på den rigtige side af midtlinjen eller kontrolgrænserne afhængig af, om den vedrører enkeltmålinger eller aggregerede målinger. Hvis fx Rigshospitalet beslutter, at mere end 35 bakteriæmier på en måned er uacceptabelt, er målet at bringe øvre kontrolgrænse ned under 35 ved at rykke hele processen ned. Hvis standarden derimod gælder gennemsnitsniveauet over længere tid, er alt i orden, fordi gennemsnittet på 25 ligger bekvemt under standarden.

Statistiske test til påvisning af særlig variation

Almindelig variation er karakteriseret ved, at selv om vi ikke kan forudsige den præcise placering af det næste datapunkt, fordeler datapunkterne sig forudsigeligt omkring et givet centrum og inden for visse grænser. Særlig variation betyder, at processen ændrer sig, så vi ikke længere kender centrum og/eller grænser (før en ny, stabil proces er etableret).

Tag fx en almindelig sekssidet terning. Det er umuligt at forudsige det næste kast; men vi ved, at fremtidige kast vil antage værdier mellem 1 og 6, at sandsynligheden for hvert muligt udfald er 1/6, og at gennemsnittet ligger tæt på 3,5. Hvis en terning pludselig viser 7, vil vi undre os. Eller tilsvarende, hvis terningen pludselig viser samme værdi mange gange i træk, ved vi, at der er sket noget usædvanligt, og at det vil kunne betale sig at lede efter årsagen.

Test for særlig variation bygger på påvisning af mønstre i data, som ville være udsædvanlige i tilfældige og forudsigelige processer.

Shewharts 3 sigma-regel

Shewharts oprindelige 3 sigma-regel (et eller flere datapunkter uden for kontrolgrænserne) er effektiv til at opdage større, eventuelt forbigående skift i processen. Patient nr. 20 fra kirurgieksemplet falder tydeligt uden for nedre kontrolgrænse og repræsenterer derfor særlig variation.

Kontroldiagram med et datapunkt uden for kontrolgrænse

Kontroldiagram med et datapunkt uden for kontrolgrænse

Reglen er derimod ikke effektiv til at opdage mindre skift i processen som i næste figur, hvor der tydeligvis sker et skift efter patient nr. 12, selv om alle datapunkterne ligger mellem kontrolgrænserne.

Kontroldiagram med skift

Kontroldiagram med skift

Derfor er der i tidens løb udviklet mange supplerende test til at øge kontroldiagrammers følsomhed for andre former for skift end pludselige store udsving.

Western Electric-reglerne

De bedst kendte test for særlig variation er formentlig The Western Electric Rules (WE), som optræder første gang i Statistical Quality Control Handbook i 1956. WE-reglerne er fire enkle test, som kan appliceres på kontroldiagrammet alene ved visuel inspektion og baserer sig på identifikation af usædvanlige mønstre i datapunkternes placering i forhold til kontrolgrænserne og midtlinjen.

  1. Et eller flere datapunkter ligger uden for kontrolgrænserne (Shewharts oprindelige 3 sigma-regel).

  2. To ud af tre konsekutive datapunkter er mere end 2 sigma fra midtlinjen (to tredjedele af afstanden mellem midtlinje og kontrolgrænsen)

  3. Fire ud af fem konsekutive datapunkter er mere end 1 sigma fra midtlinjen.

  4. Otte konsekutive datapunkter ligger på samme side af midtlinjen.

I Figuren ovenfor signalerer både regel 2, 3 og 4.

WE-reglerne øger kontroldiagrammets følsomhed for mindre men vedvarende skift i data. Reglerne har vist deres værd gennem mere end et halvt århundrede og er standard i mange virksomheder verden over.

WE-reglerne fungerer bedst, når kontroldiagrammet har mellem 20 og 30 datapunkter. Med færre end 20 datapunkter, mister reglerne sensitivitet (flere falsk negative = type 2-fejl), og med flere end 30 datapunkter mister de specificitet (flere falsk positive = type 1-fejl).

I Western Electric-håndbogen findes i øvrigt mange flere regler til påvisning af særlige typer af særlig variation. Men det er vigtigt at være opmærksom på, at selv om det kan være fristende at bruge mange test for at øge følsomheden af sin analyse, stiger risikoen for falske signaler med antallet af test – jo flere regler, man applicerer, jo flere falske signaler skal man være villig til at forholde sig til. Det behøver ikke være et problem, hvis omkostningerne ved årsagsanalyse er beskedne. Men hvis et signal udløser fx produktionsstop eller dyre kerneårsagsanalyser, skal man nøje opveje omkostningerne ved at overse et skift mod omkostningerne ved falske signaler. Beslutningen om, hvor mange og hvilke test, der skal indgå i analysen er derfor kritisk og skal baseres på meget andet end statistiske overvejelser.

Test for lange serier og få kryds

To nyere regler for særlig variation baserer sig alene på datapunkternes placering i forhold til midtlinjen:

  • Skiftreglen: Usædvanligt lange serier. En serie (run) er et eller flere konsekutive datapunkter på samme side af midtlinjen. Datapunkter, som ligger direkte på midtlinjen hverken bryder eller bidrager til serien. Den øvre 95% prædiktionsgrænse for længste serie er omtrent \(log_2(n)+3\) afrundet til nærmeste heltal, hvor \(n\) er antallet af brugbare datapunkter (datapunkter som ikke ligger på midtlinjen). Med 24 datapunkter vil en serie på mere end 8 datapunkter indikere særlig variation.

  • Krydsreglen: Usædvanligt få kryds. Et kryds er når to nabopunkter ligger på hver sin side af midtlinjen. I en tilfældig proces vil antallet af kryds være binomialfordelt, \(b(n-1,0.5)\), hvor \(n\) er antallet af brugbare observationer og \(0.5\) er sandsynligheden for, at et datapunkt befinder sig hhv. over eller under midtlinjen. Den nedre 5% prædiktionsgrænse for antal kryds er den kumulative fordelingsfunktions nedre 5% grænse. Med 24 datapunkter vil færre end 8 kryds indikere særlig variation.

Grænseværdier for længste serie og antal kryds i tilfældige talrækker med 10-100 datapunkter findes i tabellen i slutningen af artiklen.

Skift- og krydsreglerne er bedre end 3 sigma-reglen og sammenlignelige med WE-regel 2-4 til at påvise moderate men vedvarende skift i data over tid. Derudover har de nogle ekstra fordele:

  • De er uafhængige af kontrolgrænser og kan derfor bruges alene i såkaldte seriediagrammer, som er enklere at konstruere og ikke forudsætter antagelser om datas teoretiske sandsynlighedsfordeling. Vi ser nærmere på seriediagrammet i næste afsnit.

  • Fordi grænseværdierne for længste serie og antal kryds afhænger af antallet af datapunkter, holder reglerne nogenlunde konstant sensitivitet og specificitet i diagrammer med så få som 10 og op til uendeligt mange datapunkter.

Serielængde og antal kryds er to sider af samme sag – lange serier giver færre kryds og omvendt – og begge regler, sammen eller hver for sig, indikerer særlig variation. Reglerne kan således opfattes som alternativer til WE-regel 2-4. De kan benyttes sammen med 3 sigma-reglen i kontroldiagrammer eller alene i seriediagrammer.

I den forrige figur, hvor alle datapunkterne ligger mellem kontrolgrænserne, finder vi særlig variation i form af en lang serie på 11 datapunkter (mod forventet højst 8) og kun 7 kryds (mod forventet mindst 8). Bemærk den røde, stiplede midtlinje, som indikerer ikke-tilfældig variation i form af enten for lange serier eller for få kryds.

Seriediagrammet

Skift- og krydsreglerne kan som sagt bruges alene i seriediagrammer, som ligner kontroldiagrammer men mangler kontrolgrænser, og hvor midtlinjen som regel er medianen. Med seriediagrammer behøver man derfor ikke besvære sig med komplicerede udregninger af kontrolgrænser; og med medianen som centrum behøver man ikke – som med kontroldiagrammer – bekymre sig om datas fordeling, som per definition altid vil være symmetrisk omkring medianen.

Seriediagram med skift

Seriediagram med skift

Seriediagrammet er i sagens natur uegnet til at opdage selv store men forbigående skift, som ellers ville blive fanget af kontrolgrænser. Men på grund af sin enkelthed og mere sikre påvisning af vedvarende skift, anbefaler jeg seriediagrammet som førstevalg. Kontroldiagrammet kan reserveres til de tilfælde, hvor seriediagrammet viser almindelig variation, og hvor det er vigtigt at udelukke større forbigående skift i processen. Hvis seriediagrammet finder særlig variation, er der ingen grund til at beregne kontrolgrænser. Ligesom der sjældent er grund til CT-scanning, hvis diagnosen kan stilles sikkert med konventionelt røntgen.

Serie- og/eller kontroldiagrammer

I kvalitetsforbedringslitteraturen får man let det indtryk, at kontroldiagrammer er bedre end seriediagrammer, hvis eneste fordel er, at de er enkle at konstruere. Det passer bare ikke. Serie- og kontroldiagrammer er forskellige diagnostiske metoder, som komplementerer hinanden. Derfor benytter jeg fællesbetegnelsen SPC-diagrammer. Beslutning om midtlinjen skal være medianen eller gennemsnittet, om man skal bruge kontrolgrænser eller ej, og hvilke test der skal udføres, afhænger ikke af hvilket diagram, der er lettest at konstruere men af analysens formål.

Til kvalitetsforbedring, når målet er at flytte en proces fra et niveau til et andet og bedre niveau, og hvor vi forventer særlig variation, kan man med fordel applicere skift og kryds-reglerne i forhold til medianen. Hvis skift og kryds-reglerne signalerer, kan vi med stor sikkerhed sige, at processen har flyttet sig mere end bare forbigående.

Til kvalitetskontrol, når målet er at fastholde en tilfredsstillende proces på et godt og stabilt niveau, og hvor vi forventer almindelig variation, kan man med fordel benytte gennemsnittet som midtlinje og supplere med kontrolgrænser, som er hurtigere til at opdage større udsving i data.

I praksis kan man vælge følgende strategi:

  1. Beslut målsætning og vælg indikatorer.

  2. Definer indikatorerne (mere om dette i næste afsnit).

  3. Indsaml data og begynd seriediagram.

  4. Efter mindst 12 datapunkter, test for særlig variation i form af usædvanligt lange serier eller udsædvanligt få kryds:

    • almindelig variation: fastholde eller forbedre?
    • særlig variation: eliminere eller implementere?
  5. Forbedring er opnået og fastholdt, når de seneste mindst 12 målepunkter varierer tilfældigt omkring et nyt og bedre centrum.

  6. Overvej kontroldiagram til at stabilisere og fastholde processen.

Case: Forebyggelse af Clostridium difficile-infektioner hos indlagte patienter

På Amager-Hvidovre Hospital besluttede man i efteråret 2014 på udvalgte afdelinger at afprøve profylaktisk anvendelse af gærsvampen Saccharomyces boulardii (fås i kapselform i helsekostbutikker) mod Clostridium difficile-infektion hos patienter i antibiotisk behandling. Interventionen er velbeskrevet, så formålet var ikke at bevise effekten men at implementere en ny praksis og reducere risikoen for hospitalserhvervet C. difficile-infektion (Carstensen et al. (2018)).

Figuren viser det månedlige antal C. difficile-infektioner på hele hospitalet 24 måneder inden iværksættelse af interventionen.

C. diff.-infektioner før intervention

C. diff.-infektioner før intervention

Der er 19 brugbare observationer, længste serie er på 3 datapunkter (øvre grænse = 7), og kurven krydser medianen 8 gange (nedre grænse = 6). Diagrammet viser tilfældig variation omkring 19 tilfælde om måneden.

Fordi der er tilfældig variation, kan vi låse medianen og forlænge den ud i fremtiden. Medianen repræsenterer det forventede fremtidige niveau, hvis intet ændrer sig.

Interventionen begyndte i oktober 2014, og det er tydeligt, at der efterfølgende sker et skift i processen mod færre infektioner. Skiftet signaleres af både en usædvanlig lang serie på 15 datapunkter (øvre grænse = 8) og usædvanligt få kryds på 8 (nedre grænse = 11).

C. diff.-infektioner før og under intervention

C. diff.-infektioner før og under intervention

Når processen skifter i den ønskede retning som resultat af en bevidst indsats kan det være meningsfuldt at opdele diagrammet i to perioder før og efter interventionen.

Seriediagram opdelt efter periode

Seriediagram opdelt efter periode

Fordi begger perioder kun indeholder almindelig variation, kan det være nyttigt at benytte et kontroldiagram til at vise den nye proces’ naturlige grænser.

Opdelt kontroldiagram

Opdelt kontroldiagram

Kontroldiagrammet viser, at infektionsraten er faldet fra i gennemsnit 19 til 7 tilfælde om måneden efter interventionen, at den nye proces er stabil og dermed forudsigelig, og at vi i fremtiden kan forvente mellem 0 og 15 tilfælde om måneden.

Selv om det er meget fristende at konkludere, at interventionen har medført en forbedring, skal man være yderst påpasselig med den slags påstande. Alt, vi ved, er, at forekomsten af C. difficile-infektioner er faldet efter, vi ændrede praksis. Hvis vi ønsker at bevise en kausal sammenhæng mellem en intervention og et resultat, må vi på anden vis føre bevis for sammenhængen, fx ved at lave et godt gammeldags kontrolleret, randomiseret forsøg eller ved at inddrage Bradford Hills kriterier i argumentationen.

Formålet med løbende kvalitetsforbedring er ikke at bevise årsagssammenhænge men at forbedre kvaliteten. Det gør vi i dette tilfælde ved at implementere kendt viden i form af S. boulardii til forebyggelse af C. difficile-infektioner.

Valg af kontroldiagram

Der er som nævnt udviklet mange forskellige typer kontroldiagrammer til forskellige datatyper. Forskellen ligger i måden kontrolgrænserne beregnes på og afhænger bl.a. af, om data er måle- eller tælledata. Tabellen viser de mest benyttede kontroldiagrammer til gængse datatyper; men der er mange flere til særlige formål, og vi anbefaler, at man konsulterer speciallitteraturen, hvis man for alvor skal have gavn af kontroldiagrammer.

Den generelle formel til beregning af kontrolgrænser er \(\bar{x}\pm3SD\), hvor \(\bar{x}\) er gennemsnittet af alle datapunkterne, og \(SD\) er den estimerede standardafvigelse for den almindelige variation.

Valg af kontroldiagram: \(\bar{x}=\) gennemsnit, \(\bar{\bar{x}}=\) vægtet gennemsnit, \(\overline{MR}=\) gennemsnitlige, absolutte forskel mellem nabomålinger, \(A_{3}=\) konstant som afhænger af stikprøvestørrelsen, \(\bar{s}=\) vægtet gennemsnitlige standardafvigelse, \(\bar{c}=\) gennemsnitlige antal defekter, \(n_{i}=\) udfaldsrummets/stikprøvens størrelse, \(\bar{p}=\) gennemsnitlige andel defekte enheder.
Diagram Data Antaget sandsynlighedsfordeling Kontrolgrænser
Måledata
I Individuelle målinger Gaussisk \(\bar{x}\pm2.66\overline{MR}\)
Xbar Gennemsnit af flere målinger Gaussisk \(\bar{\bar{x}}\pm A_{3}\bar{s}\)
Tælledata
C Antal defekter Poisson \(\bar{c}\pm3\sqrt{\bar{c}}\)
U Defektrater Poisson \(\bar{u}\pm3\sqrt{\frac{\bar{u}}{n_{i}}}\)
P Andel defekte enheder Binomial \(\bar{p}\pm3\sqrt{\frac{\bar{p}(1-\bar{p})}{n_{i}}}\)
G Enheder mellem defekte enheder Geometrisk \(\bar{x}\pm3\sqrt{\bar{x}(\bar{x}+1)}\)

Begreberne defekte og defekter er statistiker-jargon for det, man tæller. Man taler om defekte enheder, når man tæller genstande, individer, processer osv., som besidder eller ikke besidder en bestemt egenskab, der som oftest – men ikke nødvendigvis – er uønsket.

En defekt enhed kan fx være en patient med et eller flere tryksår, en operation som gik galt eller et lokale, som er utilfredsstillende rengjort. Defekte er altså et enten-eller-begreb og opfører sig i naturen ofte tilnærmelsesvist binomialfordelt.

Når man tæller defekter, tæller man fænomener, som er tilfældigt fordelt i tid og rum. En defekt kan fx være et tryksår, en hospitalsinfektion, en plet på gulvet eller et stjerneskud. Defekter opfører sig ofte tilnærmelsesvist poissonfordelt.

Det er vigtigt at vælge det rigtige kontroldiagram til sine data. SPC-software er ukritisk og vil fremstille det diagram, man beder om, uanset om det er passende eller ej. I nogle tilfælde får man nogenlunde samme resultat med forskellige kontroldiagrammer; men ofte får man misvisende kontrolgrænser, hvis ikke diagramtypen passer til data.

Er man i tvivl om valget af kontroldiagram, eller skal man bare have et par hurtige, “håndlavede” kontrolgrænser på sit seriediagram, kan man (næsten) altid benytte I-diagrammet, som er kontroldiagrammernes “schweizerkniv”. I-diagrammet baserer sine kontrolgrænser på den faktiske variation mellem nabomålepunkter og kan i praksis benyttes til de fleste typer data, hvis blot udfaldsrummet (nævneren) er nogenlunde konstant. Først beregner man gennemsnittet (= midtlinjen) af de individuelle datapunkter. Dernæst ganger man den gennemsnitlige absolutte forskel mellem nabomålinger med 2,66. Så beregner man kontrolgrænserne ved hhv. at lægge dette tal til og trække det fra gennemsnittet.

Bakteriæmitallene fra den første figur er: 29, 18, 32, 26, 21, 28, 30, 17, 27, 30, 26, 19, 19, 26, 27, 27, 26, 35, 24, 28, 27, 21, 17, 24. Gennemsnittet er 25.2, og gennemsnittet af de absolutte parvise forskelle er 5.78. I-diagrammets kontrolgrænser er derfor 25.2 \(\pm\) 2.66 x 5.78 = 9.8 – 40.6.

Mere om indikatorer og kontroldiagrammer

En indikator er som nævnt et tal, som er udtryk for kvaliteten af et produkt eller en tjenesteydelse, og som kan gøres til genstand for statistisk analyse. Traditionelt opdeler man indikatorer i struktur-, proces- og resultatindIkatorer.

Strukturindikatorer knytter sig til fysiske og organisatoriske rammer, fx: findes der en brandindstruks? (ja/nej), hvor mange kvadratmeter er der per sengeplads? (decimaltal), eller hvor mange håndvaske findes på afdelingen? (heltal). Strukturindikatorer er i sagens natur ofte relativt statiske og bliver derfor sjældent brugt direkte til løbende kvalitetsforbedring. Men strukturindikatorer kan være nyttige til at forstå rammerne og mulighederne for fremtidig kvalitetsforbedring.

Procesindikatorer knytter sig til rutiner og arbejdsgange, fx: ved hvor stor en andel af operationerne har vi gennemført sikker kirurgi-tjeklisten? (procent), eller hvad er den mediane tid fra udskrivelse til afsendelse af epikrise? (tid). Procesindikatorer er kvalitetsudviklerens vigtigste arbejdsredskab, fordi de siger noget om den adfærd, som i sidste ende har betydning for slutresultatet.

Resultatindikatorer knytter sig til kvaliteten set med kundens øjne, fx: hvor mange hospitalsinfektioner har vi? (heltal), hvad er overlevelsen efter operation? (procent), eller i hvilken grad hjælper behandlingen? (decimaltal på VAS-skala eller udsagn på Likert-skala). For kunden er resultatindikatorer naturligvis det mest interessante. Men for kvalitetsudvikleren er resultatet blot det naturlige produkt af strukturer og processer. Resultatet bliver ikke bedre af at blive målt men af grundlæggende forandringer i strukturer og processer.

Endelig er der ulempeindikatorer, som i sig selv kan være resultat- eller procesindikatorer. Man bruger ulempeindikatorer til at opdage eventuelle utilsigtede bivirkninger af de “forbedringer”, man indfører. Det kunne fx være genindlæggelser efter indførsel af accelererede forløb. Det hjælper jo ikke, at man reducerer indlæggelsestiden, hvis det medfører, at patienterne kommer igen med komplikationer på et senere tidspunkt.

Afhængig af formålet kan nogle indikatorer optræde som både den ene eller den anden type. I et projekt om forebyggelse af medicinrelaterede genindlæggelser, kan epikrisetider opfattes som en procesindikator. Men den vil kunne opfattes som en resultatindikator, hvis projektets formål er reduktion af epikrisetider.

Måletal og tælletal

Som det fremgår af eksemplerne ovenfor, findes indikatorer i mange former med det til fælles, at de kan udtrykkes i tal. Indikatorens talformat har betydning for, hvordan den skal opgøres og præsenteres i fx kontroldiagrammer. Grundlæggende skelner man mellem måle- og tælletal.

Måletal kendes ved at kunne udtrykkes på en kontinuert skala, som i princippet strækker sig fra \(-\infty\) til \(\infty\) , og hvor værdierne kan have uendeligt mange decimaler. I praksis har mange måletal dog naturlige grænser. Fx kan fysiologiske værdier som højde, vægt, puls, blodtryk osv. i sagens natur ikke være negative.

I produktionsindustrien benytter man i vid udstrækning måletal til kvalitetsforbedring og -kontrol. Fysiske produkter som skruer, bolte og bordplader forventes at leve op til præcise standarder for mål og vægt. Til disse formål vil man derfor bruge kontroldiagrammer til måletal, I-diagram hvis det enkelte målepunkt stammer fra en enkelt måling og Xbar-diagram, hvis et målepunkt er gennemsnittet af flere målinger taget på samme tid eller fra samme stikprøve.

I sundhedsvæsenet er måletal relativt sjældne i forbindelse med kvalitetsforbedring, fordi sundhedskvalitet oftest handler om antal og andele, som er tælletal. Undtagelserne er tid, fx tid til epikrise, og fysiologiske parametre hos enkeltpersoner, fx alder, vægt, blodtryk peak flow, blodsukker, INR osv.

Figuren viser gennemsnitsalderen hos patienter, som får foretaget koronar bypassoperation.

Xbar-diagram

Xbar-diagram

Kontrolgrænserne varierer fra måned til måned fordi, nævneren (antal operationer) varierer. På den måde tager diagrammet højde for naturlige udsving i den almindelige variation, når nævneren varierer. Det samme gælder P- og U-diagrammer.

Tælletal opstår, når man tæller enten individer med bestemte egenskaber (defekte) eller forekomsten af bestemte fænomener (defekter). Tryksår er et eksempel på et fænomen, der kan tælles på begge måder: antal patienter med tryksår eller antal tryksår. Tæller man antal patienter med tryksår, tæller en patient kun én gang uanset, hvor mange tryksår vedkommende har. Tæller man antal tryksår, tæller hvert tryksår for sig. I begge tilfælde kan man vælge at udtrykke tallet i relation til noget andet, udfaldsrummet, som indgår som nævner i brøken. Patienter med tryksår kan fx udtrykkes som andelen af patienter med tryksår, og tryksår kan fx udtrykkes som antallet af nyopståede tryksår per 1000 sengedage. Det første tal er en proportion (andel, procent), det andet tal er en rate. Man kender forskel på proportioner og rater ved, at proportioner altid har samme enhed i tæller og nævner (antal patienter med tryksår / antal patienter i alt), og at tælleren ikke kan være større end nævneren, mens rater har forskellige enheder i tæller og nævner (antal tryksår / antal sengedage).

Det er vigtig at kende forskel på proportioner og rater, når man skal vælge kontroldiagram. Proportioner analyseres med P-diagrammer (P for proportion eller procent). Figuren viser procentdelen af opererede patienter, som genindlægges inden for 30 dage efter operation.

P-diagram

P-diagram

Rater analyseres med U-diagrammer (U for unequal area of opportunity).

U-diagram

U-diagram

Hvis ratens udfaldsrum (area of opportunity) er nogenlunde konstant fra måling til måling, fx antal risikodøgn fra måned til måned som i ovenstående figur, kan man udelade nævneren og benytte et C-diagram (C for count). Fordi C-diagrammer viser et antal frem for en rate, kan de være lettere at forholde sig til end U-diagrammer. Således vil de fleste nok finde det lettere at forholde sig til 25 bakteriæmier om måneden end 8,8 bakteriæmier per 10.000 risikodøgn.

C-diagram

C-diagram

Bemærk i øvrigt, at C-diagrammet ovenfor har samme gennemsnit og kontrolgrænser (efter afrundning) som I-diagrammet med de samme data, vi tidligere beregnede “i hånden”.

STRAMme indikatorer

Kvalitetsudviklerens vigtigste råstof er gode indikatorer, som kommer af gode data og gode indikatordefinitioner.

Der kan siges og skrives meget om “gode data”, og “god” afhænger i virkeligheden af, hvad data skal bruges til. Ønsker vi bare at vide, om vi har elimineret tryksår eller ej, skal vi blot registrere det første tryksår, der opstår. Men hvis vi vil vide, om risikoen for tryksår på vores afdeling er signifikant højere eller lavere end på en tilsvarende afdeling i Langtbortistan, skal vi indsamle data for langt flere patienter med og uden tryksår over lang tid, og vi skal være helt sikre på, at vi tæller tryksår på samme måde hele tiden og på samme måde, som de gør i Langtbortistan.

Kort sagt: gode data er data, som er gode nok til formålet.

Gode indikatordefinitioner kan man derimod ikke snakke sig fra. En indikatordefinition er en klar og utvetydig opskrift på, hvordan man omsætter grunddata til en STRAM indikator:

  • Sensitiv: indikatoren er følsom for de forandringer, man ønsker at indføre eller undgå.

  • Troværdig: indikatoren giver et reelt billede af den kvalitet, man ønsker at måle.

  • Reproducerbar: man når frem til de samme tal og konklusioner, når man gentager analysen på de samme grunddata.

  • Aktuel: indikatoren viser, hvordan kvaliteten er her og nu – ikke sidste år eller på naboafdelingen.

  • Meningsfuld: indikatoren giver mening for brugerne.

De færreste indikatorer er det hele. Tag fx den nu hedengange nationale indikator for hospitalsstandardiseret mortalitetsrate, HSMR. HSMR udtrykker forholdet mellem den faktiske dødelighed og den forventede dødelighed på et hospital, hvor der er taget højde for patientsammensætningen (alder, køn, diagnoser, komorbiditet osv.). HSMR er både meningsfuld, aktuel og reproducerbar. Men den er også – viste det sig – meget lidt sensitiv for reelle kvalitetsforbedringer og -forværringer på hospitalerne. Til gengæld er den følsom for meget andet, fx ændringer i lokal registreringspraksis.

Et andet eksempel er overholdelse af udredningsretten. Indikatoren angiver, hvor stor en andel af patienterne, som har en diagnose eller en plan inden for en fastsat tidsramme. Den er sensitiv, aktuel, reproducerbar og troværdig. Men, fordi den stiller alle symptomer og fund lige, er den i mange tilfælde meningsløs for både klinikere og befolkning.

Et eksempel på indikatorer, som er mindre troværdige, fordi de ikke måler præcis det, man ønsker at måle, men alligevel er nyttige, er forekomsten af hospitalserhvervede infektioner. Hospitalsinfektioner er infektioner, som opstår efter hospitalskontakt (typisk mindst 48 timer efter indlæggelse). I opgørelsen af hospitalsinfektioner indgår oplysninger om patient, indlæggelsestidspunkt og tidspunkt for påvisning af infektion, fx fund af bakterier i urin eller blod. Det giver sig selv, at indikatoren ikke er særligt præcis. Nogle patienter indlægges med infektioner, som først påvises efter et par dage og derfor fejlagtigt tælles med (falsk positive); og andre patienter får en hospitalsinfektion allerede i løbet af de første indlæggelsesdøgn og tælles derfor ikke med (falsk negative). Indikatoren kan altså ikke bruges til at fortælle præcis, hvor mange hospitalsinfektioner der reelt forekommer. Men fordi unøjagtighederne er jævnt og tilfældigt fordelt, kan skift i indikatorniveauet over tid alligevel tages som udtryk for forandringer, som i det mindste bør undersøges nærmere.

Arbejdet med at udvikle gode indikatordefinitioner, som giver STRAMme indikatorer, kan erfaringsmæssigt være noget af det mest tidsskrævende og vanskelige inden for klinisk kvalitetsforbedring. Men det skal ikke afholde en fra at gå i gang. Og så skal man huske, at det inden for kvalitetsforbedring er tilladt – ja, endda ønskværdigt – at forbedre sine defintioner undervejs, efterhånden som man bliver klogere.

Indikatorbeskrivelse

Der er skrevet tykke bøger om indikatorer; men det væsentlige er, at man har en struktureret tilgang til indikatordefinition, så man når hele vejen rundt om indikatoren, inden man går i gang med at samle data. Her er et eksempel på definition af en procesindikator til overvågning af andelen af pneumonipatienter, som har modtaget første dosis antibiotika inden for fire timer efter ankomst.

  • Indikatornavn: Rettidig diagnostik og behandling af samfundserhvervet pneumoni.

  • Type: Procesindikator.

  • Formål: At reducere dødeligheden hos indlagte med samfundserhvervet pneumoni.

  • Tællerdefinition: Antal pneumonipatienter, som har modtaget første dosis antibiotika inden for fire timer efter ankomst.

  • Nævnerdefinition: Antal pneumopatienter.

  • Datakilde: Morgenkonference.

  • Dataindsamling og -behandling: Ved morgenkonferencen noteres for hver nyindlagt patient med samfundserhvervet pneumoni i det forudgående døgn dato og tidspunkt for indlæggelse og for første dosis antibiotika. Rådata noteres i et regneark, som automatisk udregner differencen i timer mellem ankomst og behandlingsstart og derefter udregner den ugentlige andel af patienter, hvor antibiotikabehandling er påbegyndt rettidigt.

  • Opgørelsesperiode: Ugentligt.

  • Analyse og præsentation: Seriediagram.

Særligt punktet om dataindsamling og -behandling kræver omhyggelighed, så arbejdet med at indsamle data ikke kommer til at overskygge selve forbedringsindsatsen. I praksis kan man med fordel angribe dataindsamlingsdelen som et selvstændigt forbedringsprojekt efter alle kunstens regler med formulering af målsætning og iterativ afprøvning af ideer efter PDSA-metoden.

Det er også vigtigt at være omhyggelig med formulering af tæller- og nævnerdefinitioner, så det er helt tydeligt, hvad der skal tælles med det ene og det andet sted, så Bente og Børge tæller på samme måde mandag morgen og lørdag nat.

Tip til praktisk dataindsamling og -behandling

I det foregående eksempel indsamler man data manuelt; men hvis data allerede er tilgængelige i fx den elektroniske journal, kan opgaven måske automatiseres. Bemærk, at data i dette tilfælde ikke behøver være personhenførbare. Det er i denne sammenhæng ikke patienten, som er i centrum. Det er processerne omkring diagnostik og behandling, der er interessante.

Når man samler data, skal man så vidt muligt undgå at bearbejde data allerede i indsamlingsøjeblikket. Man kunne i eksemplet have valgt blot at notere for hver patient, om behandlingen var rettidigt indledt (ja/nej). På den måde kunne dataindsamlingen måske gøres lidt enklere. Men samtidig ville man afskære sig selv for på et senere tidspunkt at opgøre data på andre måder.

Ved at dikotomisere grunddata, som det hedder, når man oversætter en kontinuert variabel (i dette tilfælde tid) til en logisk variabel (ja/nej), fjerner man information. Hvis man derimod indsamler grunddata så ubearbejdet som muligt, bliver det muligt sidenhen at opgøre data på mange forskellige måder. Det kan være, at ny evidens på et tidsspunkt gør det interessant at vide, hvilken andel af patienterne, som kommer i behandling inden for to, otte eller syvtrekvart timer. Det kan også være, man ønsker at se på tid til behandlingsstart for individuelle patienter eller den mediane eller gennemsnitlige tid for alle patienter per uge. Alle disse muligheder går tabt i det øjeblik, man allerede i dataindsamlingsøjeblikket reducerer data.

En beslægtet kunstfejl er at aggregere data allerede ved kilden. Dette sker ofte, når man samler data ved auditmetoden, hvor man gennemgår et antal patientforløb for en given tidsperiode. Det er fristende blot at notere tæller og nævner for hele perioden. Men ved at notere grunddata for det enkelte forløb, mangedobler man sine muligheder for at opgøre indikatoren på forskellige måder.

Særligt gælder det for tidsintervaller, at de kan være vanskelige eller umulige at ændre. Man kan ikke lave månedsopgørelser med ugedata og omvendt. Men hvis grunddata indeholder de eksakte datoer for det, man undersøger, kan man opgøre data i alle tænkelige tidsintervaller: dag, uge, to-, tre-, fireugersperiode, måned, kvartal osv.

Dette betyder dog ikke, at man aldrig skal reducere eller aggregere data allerede i indsamlingsøjeblikket. Der kan være særdeles gode grunde til at gøre det. Men man skal være bevidst om sin indsamlingsstrategi og nøje overveje fordele og ulemper ved den ene og den anden metode. En god grund til at aggregere data – ud over at lette dataindsamlingen – kan være at maskere personhenførbare data. På den måde slipper man for bøvl med tilladelser og krav til databasesystemer med logning osv. Særligt i tidsbegrænsede her og nu-projekter kan det betyde forskellen på succes og fiasko, om man skal vente på tilladelser til at gå i gang.

Sammenfattende kan man sige, at man skal tilstræbe så høj opløsning som muligt i sine grunddata under hensyntagen til dataindsamlingsresurser og behovet for maskering af personhenførbare oplysninger.

Case: Tid til grad 2-sectio

På fødeafdelingen på Hospitalsenhed Vest (Herning og Holstebro) arbejder man bl.a. med forløbstider ved akutte kejsersnit. Efter hvert kejsersnit noterer jordemoderen fødselstidspunkt, tidspunkt for ordination af kejsersnit samt i hvilken grad kejsersnittet var akut (grad 1-3). For hver akuthedsgrad er der en tidsgrænse, som man tilstræber overholdt for mindst 90% af kejsersnittene. For grad 2-kejsersnit er grænsen 30 minutter.

Data omfatter i alt 354 grad 2-kejsersnit fra perioden januar 2016 til august 2019. Tabellen viser data for de første 6 kejsersnit.

Kejsersnittider: datetime = fødselstidspunkt, month = fødselsmåned, sectio_delay = tid i minutter fra ordination af kejsersnit til forløsning.
datetime month sectio_delay
2016-01-06 03:55 2016-01-01 22
2016-01-06 20:52 2016-01-01 22
2016-01-07 02:50 2016-01-01 29
2016-01-07 22:32 2016-01-01 28
2016-01-09 14:56 2016-01-01 22
2016-01-09 21:21 2016-01-01 20

Fordi grunddata registreres for hvert enkelt kejsersnit, er det muligt at tilpasse sine opgørelser til forskellige målgrupper.

Hospitals- og regionsledelsen ønsker måske blot at vide, om standarden bliver overholdt, og om overholdelsen er stabil. P-diagrammet viser, at 90% af kejsersnittene sker inden for tidsrammen, og at processen er stabil.

P-diagram

P-diagram

Afdelingens læger og jordemødre ønsker måske at kende den gennemsnitlige tid fra ordination af kejsersnit til fødsel. Det viser Xbar-diagrammet, hvor hvert målepunkt angiver den gennemsnitlige tid til kejsersnit i hver måned. Alle målepunkter ligger inden for kontrolgrænserne og omkring en gennemsnitstid på 23 minutter.

Xbar-diagram

Xbar-diagram

Data til P- og Xbar-diagrammerne fås ved at aggregere grunddata per måned. Tabellen viser aggregerede data for de første seks måneder. Kontrolgrænserne i de to diagrammer udregnes ved at indsætte de relevante parametre i formlerne for hhv. P- og Xbar-diagrammet.

Aggregerede kejsersnittider: month = fødselsmåned, n_ontime = antal kejsersnit gennemført inden for tidsrammen, n_sectio = antal kejsersnint i alt, p_ontime = andel kejsersnit gennemført inden for tidsrammen, avg_delay = gennemsnitlig tid i minutter fra ordination til forløsning, sd_delay = standardafvigelsen i minutter fra ordination til forløsning.
month n_ontime n_sectio p_ontime avg_delay sd_delay
2016-01-01 7 7 1.00 23.86 3.39
2016-02-01 9 11 0.82 24.45 6.14
2016-03-01 10 11 0.91 22.45 6.64
2016-04-01 9 9 1.00 22.67 3.04
2016-05-01 8 8 1.00 22.50 3.89
2016-06-01 4 5 0.80 22.00 6.20

Forbedringsteamet, hvis opgave det er at skabe robuste processer og arbejdsgange som sikrer den enkelte fødende højst mulig kvalitet, har brug for flere detaljer. Dem finder de i et I-diagram over individuelle forløbstider, hvor hvert målepunkt er forløbstiden for ét enkelt kejsersnit. I-diagrammet har (naturligvis) det samme gennemsnit på 23 minutter som Xbar-diagrammer men viser tillige, at processen er ustabil på individniveau, idet enkelte kejsersnit tager usædvanligt lang eller kort tid. I-diagrammet viser også, at den nuværende proces ikke tillader 100%-gennemførsel inden for tidsgrænsen. Det fremgår ved, at øverste kontrolgrænse på 36 minutter er over tidsgrænsen på 30 minutter, som er angivet med den vandrette grønne streg.

I-diagram

I-diagram

Hvert diagram har sine styrker og svagheder, og de tre diagrammer viser tre sider af de samme data og besvarer i virkeligheden forskellige spørgsmål. Til administratorer og til offentligheden kan vi sige, at det går godt, vi overholder standarden og holder et stabilt niveau. Til os selv kan vi sige, at der er plads til forbedring i form af stabilisering af individualle forløbstider. Hvis vi kan identificere årsagerne til de kejsersnit, som befinder sig uden for kontrolgrænserne og dermed skiller sig ud på den gode eller den dårlige måde, kan vi udover at stabilisere processen måske endda reducere den gennemsnitlige forløbstid.

Endelig kunne vagtplanlæggeren af hensyn til planlægning af den fremtidige bemanding i vagterne måske ønske at vide, om antallet af kejsersnit er stabilt og forudsigeligt fra måned til måned. Dette spørgsmål kan besvares med et C-diagram over det månedlige antal kejsersnit.

C-diagram

C-diagram

Figuren viser særlig variation i form af et skift med en usædvanligt lang serie på 9 datapunkter mod forventet højst 8 til sidst på kurven. Noget kunne altså tyde på, at der er begyndt at komme færre kejsersnit. Dette bør undersøges nærmere. Der kan være mange forklaringer. En forklaring kunne være, at faldet skyldes bevidste tiltag for at reducere hyppigheden af kejsersnit. Dette ville formentlig være en positiv udvikling. Det kunne også være, at man af den ene eller anden grund var begyndt at foretage flere elektrive kejsersnit og dermed færre akutte, eller at fødselstallet simpelthen var faldet. Jeg vil overlade det til fagfolk med godt lokalkendskab at afgøre, om skiftet er ønsket, uønsket eller ligegyldigt. Uanset hvad, vil det være fornuftigt at lede efter en forklaring.

Case: Sjældne kirurgiske infektioner

Vi kalder det sjældne hændelser, når det, vi tæller, sker så sjældent, at vi ikke kan samle nok data til, at SPC-diagrammet giver mening. Det viser sig ved, at selv måneds- eller kvartalsopgørelser (for) ofte indeholder nul defekte(r).

“Sjælden” er et relativt begreb. På hospitalsniveau er hospitalsinfektioner sjældent sjældne – en om dagen på Rigshospitalet. Men den lille afdeling eller den enkelte læge oplever måske kun en enkelt eller slet ingen hospitalsinfektioner på et helt år.

I nedenstående figur er medianen nul fordi, mere end halvdelen af målepunkterne er nul. Derfor giver det ikke mening, at lede efter lange serier og få kryds – der er kun én serie og ingen kryds.

Seriediagram med mange 0-værdier

Seriediagram med mange 0-værdier

P-diagrammet er mere brugbart, men tallene er stadig så små og kontrolgrænserne derfor så brede, at det ville tage lang tid for os at opdage hvis infektionshyppigheden skulle ændre sig markant. Der skal ske en mangedobling af infektionsrisikoen, før kurven krydser den øvre kontrolgrænse. Og, fordi nedre kontrolgrænse er censureret ved nul, skal der gå mange måneder uden infektioner, før vi opdager en reduktion i infektionsrisikoen.

P-diagram med mange 0-værdier

P-diagram med mange 0-værdier

Når hændelser bliver så sjældne, at de ikke kan opgøres meningsfuldt i passende tidsintervaller på x-aksen, kan man i mange tilfælde slippe af sted med at omdefinere indikatoren – vende den om så at sige – så man i stedet for at tælle antal hændelser per tidsenhed tæller tiden mellem hændelser. På afdelingen kan man fx tælle antal dage mellem nyopståede infektioner eller andre uønskede hændelser. Kirurgen vil måske tælle antal operationer mellem postoperative komplikationer. Og medicineren kan tælle, hvor mange patienter, der overlever et AMI mellem hvert AMI-relateret dødsfald.

Til disse typer indikatorer findes såkaldte T- og G-diagrammer. T for tid mellem hændelser (fx dage mellem infektioner) og G for ikke-defekte enheder mellem defekte enheder (fx operationer mellem komplikationer).

G-diagrammet viser, at der mediant går 156 operationer mellem, der opstår en infektion, og at en forbedring (= færre infektioner) vil vise sig den dag, der går op mod 1000 operationer mellem infektioner.

G-diagram

G-diagram

Bemærk, at fordi G-diagrammet baserer sig på antagelser om, at data følger den geometriske sandsynlighedsfordeling, som er stærkt asymmetrisk, bruger man som regel medianen som midtlinje. På den måde kan man stadig applicere test for lange serier og få kryds, som i sagens natur forudsætter at data er nogenlunde symmetrisk fordelt om midtlinjen.

Man skal være opmærksom på, at G-diagrammet sjældent har nogen nedre kontrolgrænse og derfor er uegnet til at opdage forværringer, som viser sig ved, at kurven går nedad.

I virkeligheden supplerer P- og G-digrammet hinanden, og man kan med fordel vise dem sammen. Det er min erfaring, at det er hip som hap, hvilket af de to, som først signalerer, når processen skifter.

Eftertanker

SPC er på samme tid et håndværk og en videnskab – men først og fremmest er SPC en tankegang. Håndværket og videnskaben kan man træne og læse sig til. Det er vanskeligere, at tilegne sig tankegangen.

SPC-tankegangen er tydeligst udtrykt i tabellen med de fire tilstande og tilhørende handlinger. Den kan man jo hurtigt læse op på. Alligevel er det min erfaring, at det kræver tid og øvelse at internalisere den. Men udbyttet er besværet værd. For den kvalitetsbevidste organisation er SPC det sunde alternativ til skiftende bevidstløse og skadelige indgreb i stabile processer og blind tiltro til ustabile processer på afveje.

SPC har siden sin fødsel for snart 100 år siden revolutioneret produktionsindustrien verden over. I sundhedsvæsenet og andre servicebrancher er det gået noget langsommere, og det er min påstand, at SPC udnyttes alt for lidt i det danske sundhedsvæsen. Selv om mange klinikere og kvalitetsmedarbejdere har taget SPC til sig, kan det tælles på et par fingre de steder, hvor SPC er integreret fra top til bund i hele ledelses- og produktionssystemet.

Jeg håber, at denne artikel kan være med til at udruste fremtidens klinikere og ledere, så SPC får den plads i sundhedsvæsenet, patienterne (det’ osse os) fortjener.

Litteratur

  1. Jacob Anhøj, Anne-Marie Blok Hellesøe (2016.) The Problem with Red, Amber, Green: The Need to Avoid Distraction by Random Variation in Organisational Performance Measures. BMJ Quality & Safety 2017;26:81-84.

  2. Jacob Anhøj, Anne Vingaard Olesen (2014). Run Charts Revisited: A Simulation Study of Run Chart Rules for Detection of Non-Random Variation in Health Care Processes. PLoS ONE 9(11): e113825.

  3. Jacob Anhøj (2015). Diagnostic Value of Run Chart Analysis: Using Likelihood Ratios to Compare Run Chart Rules on Simulated Data Series. PLoS ONE 10(3): e0121349.

  4. Jacob Anhøj, Tore Wentzel-Larsen (2018). Sense and sensibility: on the diagnostic value of control chart rules for detection of shifts in time series data BMC Med Res Methodol. 2018 Oct 3;18(1):100.

  5. Donald J. Wheeler (2000). Understanding Variation – The Key to Managing Chaos, second edition. SPC Press.

  6. Donald J. Wheeler (2010). Understanding Statistical Process Control, third edition. SPC Press.

  7. Douglas C. Montgomery (2009). Statistical Quality Control – A Modern Introduction, sixth edition. John Wiley & Sons.

Appendix: Grænseværdier for længste serie og antal kryds i SPC-diagrammer

Sammenlign længste serie og antallet af kryds i SPC-diagrammet med grænseværdierne i tabellen svarende til antallet af brugbare datapunkter. Ikke-tilfældig variation findes, hvis den længste serie er over sin grænseværdi eller, hvis antallet af kryds er under sin grænsværdi.

Grænseværdier for usædvanligt lange serier og usædvanligt få kryds.
Antal brugbare observationer Øvre grænse for længste serie Nedre grænse for antal kryds
10 6 2
11 6 2
12 7 3
13 7 3
14 7 4
15 7 4
16 7 4
17 7 5
18 7 5
19 7 6
20 7 6
21 7 6
22 7 7
23 8 7
24 8 8
25 8 8
26 8 8
27 8 9
28 8 9
29 8 10
30 8 10
31 8 11
32 8 11
33 8 11
34 8 12
35 8 12
36 8 13
37 8 13
38 8 14
39 8 14
40 8 14
41 8 15
42 8 15
43 8 16
44 8 16
45 8 17
46 9 17
47 9 17
48 9 18
49 9 18
50 9 19
51 9 19
52 9 20
53 9 20
54 9 21
55 9 21
56 9 21
57 9 22
58 9 22
59 9 23
60 9 23
61 9 24
62 9 24
63 9 25
64 9 25
65 9 25
66 9 26
67 9 26
68 9 27
69 9 27
70 9 28
71 9 28
72 9 29
73 9 29
74 9 29
75 9 30
76 9 30
77 9 31
78 9 31
79 9 32
80 9 32
81 9 33
82 9 33
83 9 34
84 9 34
85 9 34
86 9 35
87 9 35
88 9 36
89 9 36
90 9 37
91 10 37
92 10 38
93 10 38
94 10 39
95 10 39
96 10 39
97 10 40
98 10 40
99 10 41
100 10 41

© Anhøj 2021