2 Dataindsamling

Data til kvalitetsudvikling kan indsamles, struktureres og opbevares på utallige måder. Det er min erfaring, at det ofte er her, det går galt, og at dygtige forskere og kvalitetsudviklere let kommer til at bruge alt for megen tid på at få alt for lidt ud af deres surt indsamlede data.

Det er en forudsætning for kvalitetsudvikling, at data kan indsamles løbende – helst mens patienterne så at sige ligger i sengene. I den ideelle verden kan man høste dugfriske data direkte fra den elektroniske patientjournal. Dette er dog mere undtagelsen end reglen, og ofte må man indsamle data manuelt ved ekstra registreringer, som foregår uden for patientjournalen.

For at undgå, at dataarbejdet kommer til at løbe med hele opmærksomheden kan det betale sig at være ekstra omhyggelig med at udvikle en dataindsamlingsproces, som er så enkel og effektiv som muligt.

Er man i den heldige situation, at data allerede foreligge i elektronisk form og kan indlæses direkte i ens analyseprogram, kan man springe dette og næste kapitel over.

2.1 Begræns dataindsamling til det absolut nødvendige

Som hovedregel skal man indsamle de og kun de dataelementer, som indgår i de valgte indikatorer. Hvis fx opgaven er at opgøre fødselslæsioner hos førstegangsfødende, bør man ikke besvære sig med at registrere læsioner hos flergangsfødende.

Det kan være vanskeligt ikke at forfalde til lige at indsamle lidt flere data, “bare såfremt ifald, når nu, vi er i gang …” Men prisen for indsamling af unødvendige data kan blive høj. Og skulle der senere opstå behov for flere data, kan man altid udvide sin dataopsamling.

2.2 Benyt stikprøver

Data til kvalitetsudvikling har til formål at beskrive processers niveau og variation over tid. Derfor skal man måle hyppigt – dagligt, ugentlig eller, i værste fald, månedligt. Og når man måler hyppigt, kan man tillade sig at måle småt.

Det er sjældent nødvendigt at tælle alle patienter hver dag, en lille stikprøve er ofte nok, hvis blot den er tilfældigt udtrukket. Tre til fem patienter hver dag bliver til mindst 21 om ugen, hvilket i mange tilfælde er mere end rigeligt til en meningsfuld analyse.

Som tommelfingerregel kan man til tælledata tilstræbe, at hver stikprøve indeholder mindst 5 af det, man tæller og 5 af det man ikke tæller. Ønsker man fx at opgøre andelen af patienter med tryksår, skal man altså planlægge sin dataindsamling sådan, at de fleste opgørelsesperioder (dag, uge etc.) indeholder mindst 5 patienter med tryksår og mindst 5 patienter uden tryksår. Og skulle der en gang imellem være færre end 5, går det nok alligevel.

Bemærk, at opgørelsesperioden ikke behøver at følge indsamlingsfrekvensen. Man kan sagten indsamle data dagligt op opgøre dem ugentligt – eller omvendt for den sags skyld.

Hvis forekomsten af det problem, man tæller, er så lav, at der sjældent er mindst 5 om måneden, bør man overveje, om problemet er stort nok til at retfærdiggøre en indsats; og hvis det er tilfældet, om det er muligt at kvantificere problemet på andre måder eller med andre indikatorer.

Disse tommelfingerregler gælder i øvrigt uanset, om man benytter stikprøver eller ej.

Hvis man vælger at benytte stikprøver i sin dataindsamling, skal man være omhyggelig med ikke at introducere systematiske skævheder i data. En stikprøve er nemlig ikke tilfældig, blot fordi man tager tre “tilfældige” journaler fra bunken. En korrekt tilfældig udvælgelse kræver en eller anden form for lodtrækning, fx opslag i en statistisk tabel med tilfældige tal eller brug af computer.

Til måledata behøver man blot 1-5 målinger til hvert datapunkt. Hvis man fx vil overvåge dagligt blodtryk hos en enkelt patient, kommer man langt med gennemsnittet af to-tre daglige blodtryksmålinger.

2.3 Kobl dataindsamling til eksisterende arbejdsgange

Det er en stor fordel, hvis dataindsamling kan kobles til allerede eksisterende arbejdsgange, fx tavlemødet eller rapportgivningen. På denne måde opnår man desuden, at dataindsamlingen i sig selv bidrager til forbedringerne. Opdager man fx på tavlemødet, at to patienter ikke er blevet tjekket for tryksår, kan det stadig nås, inden dagen er omme.

Arbejder man med flere forbedringsinitiativer på samme tid, kan man med fordel samle data til flere indikatorer i samme arbejdsgang på samme skema eller tjekliste.

2.4 Undgå at bearbejde data allerede ved indsamling

Mange besværligheder kan undgås, hvis man i dataindsamlingsfasen skelner mellem dataelementer og afledte variable og nøjes med at registrere de nødvendige dataelementer så ubearbejdet som muligt.

Patientalder er fx en afledt variabel, som man beregner ved at subtrahere patientens fødselsdato fra den aktuelle dato. Ved at registrere fødselsdatoen i stedet for den beregnede alder gør man det let fremover at beregne patientens alder på et hvilket som helst tidspunkt i for- og fremtid.

På samme måde med periodevariable som uge, måned, kvartal osv. Hvis man ved dataindsamling kun noterer fx ugenummeret fraskriver man sig muligheden for på et senere tidspunkt at opgøre data månedsvis. Man kan altid omregne en dato til en hvilken som helst tidsperiode. Det modsatte er aldrig tilfældet.

Tilsvarende gælder det for numeriske variable, som skal reduceres til kategoriske eller logiske variable, at man altid kan gå fra numerisk til kategorisk men aldrig den anden vej. Det er derfor langt smartere at registrere den præcise måleværdi, fx højde og vægt, end blot at registrere om patienten er under- eller overvægtig. Desuden sparer man kognitive resurser til udregningen.

Beregning af afledte variable og andre dataoperationer kan med fordel automatiseres og overlades til computere, som altid gør, hvad der bliver sagt, første gang, det bliver sagt, og indtil nogen siger noget andet.

2.5 Gør det let at indtaste rigtigt og svært at indtaste forkert

Dataopsamling og -behandling kan i princippet klares langt hen ad vejen med papir og blyant. Men meget bliver lettere, hvis data indtastes og opbevares elektronisk i en eller anden form for database og behandles og analyseres med dedikerede analyseprogrammer. En af fordelene ved elektronisk dataregistrering er, at det bliver muligt at lade computeren kontrollere datas gyldighed allerede i indtastningsfasen:

  • Datoer: Tjek, at værdien er en gyldig dato og at den befinder den sig i et lovligt datointerval, fx før dags dato og efter patientens fødselsdato.

  • Numeriske data: Som ved datoer, tjek for gyldig værdi i gyldigt interval.

  • Kategoriske data: Begræns intastningsmulighederne til de anvendte kategorier. Undgå fritekst. Set med en computers øjne er der fx himmelvid forskel på “ikke-ryger”, “ikke ryger” og “ej ryger”.

  • Manglende data: Angiv manglede data med en fast foruddefineret værdi, fx “NA” eller “.”. Benyt aldrig talværdier, fx 999, eller tomme felter til at markere manglende data.

  • Kvalitative data: Hvis der er behov for at registrere kommentarer eller forklaringer til poster eller enkeltværdier, bør disse henvises til separate fritekstfelter. Fritekst kan sjældent bruges direkte i den automatiske dataanalyse, men de kan være nyttige til at forklare fx afvigende enkeltmålinger eller eksklusion af fejlregistreringer fra analysen.

2.6 Dataindsamling kort sagt

Ved at indsamle de nødvendige data – og kun dem – så ubearbejdet som muligt og ved at indbygge smarte tjek af datas gyldighed allerede i indsamlingsfasen bliver det muligt siden hen at opgøre data på mange forskellige måder og til flere forskellige formål. Men før vi tager fat på det, der egentlig interesserer os, databehandling og -analyse, skal lige sikre os, at vi har helt styr på, hvor og hvordan data skal struktureres og opbevares. Det handler næste kapitel om.