Databehandling og -visualisering med R

Forfatter

Jacob Anhøj

Udgivet

24. marts 2023


Databehandling og -visualisering er en et-dages workshop, hvor du lærer at bearbejde, analysere og visualisere data med programmeringssproget R.

Workshoppen henvender sig til dig, som allerede har et grundlæggende kendskab til R – fx fra workshoppen R fra bunden – og som vil lære videregående databehandling og -visualisering.

Indhold

På workshoppen lærer du at indlæse, ordne, bearbejde, analysere og visualisere data med funktioner fra R-pakken tidyverse.

Du lærer at beherske de fem dataoperationer:

  • selektere
  • filtrere
  • transformere
  • aggregere
  • sortere

Efter workshoppen kan du indlæse og klargøre data fra tekstfiler og regneark til analyse og visualisering. Du kan opbygge avancerede grafer, som fremstiller mønstre og tendenser i data på måder, som fremmer forståelsen og gør samtalen meget mere interessant. Du kan automatisere dine arbejdsgange, så du kun skal “trykke på knappen” for at gentage dine analyser med friske data.

… og du kan skrive R-kode som denne:

Kode
# Indlæs data fra fil,
# udvælg personer som er ældre end 60 år gamle, og
# fjern poster med manglende værdier
d <- read_rds('data/mikrosundhed.rds') |> 
  filter(alder > 60) |> 
  drop_na()

# Vis de første 6 poster i data
head(d)
# A tibble: 6 × 7
     id alder hoejde vaegt helbred    koen   ryger
  <int> <dbl>  <dbl> <dbl> <ord>      <fct>  <lgl>
1    15    66    179    85 God        Mand   FALSE
2    22    84    168    62 Meget god  Mand   FALSE
3    34    61    160    72 God        Kvinde FALSE
4    38    81    166    76 Nogenlunde Mand   FALSE
5    46    67    159    78 Nogenlunde Kvinde FALSE
6    50    84    176    75 God        Mand   FALSE
Kode
# Plot vægt mod højde for hhv. mænd og kvinder og rygere og ikkerygere
ggplot(d, aes(hoejde, vaegt, colour = ryger, shape = ryger)) +
  geom_point() +
  geom_smooth(method = lm, se = FALSE) +
  facet_wrap(~koen)

Form

Workshoppen rummer en blanding af oplæg og drøftelser i plenum og øvelser på egen PC. Workshoppen er 100% PowerPoint-fri og forudsætter en høj grad af deltagerinvolvering.

Forberedelse

Du kan læse mere om databehandling og -visualisering i min nye bog Håndbog i kvalitetsudvikling med data.

Workshoppen forudsætter, at du har erfaring med R svarende til indholdet i R fra bunden.

Du skal medbringe en bærbar computer med en tidssvarende version af R (≥ 4.2.0) og RStudio (≥ 2022.02.0) samt R-pakken tidyverse installeret.

Hvis installationen volder problemer kan du måske finde hjælp i installationsvejledningen nederst på denne side.

Praktiske oplysninger

Datoer: …

Tid: 08:30-15:30

Sted: …

Forplejning: …

Tilmelding: …

Pris: …

Om …

… mig

Jeg er læge og har de seneste snart 20 år beskæftiget mig på fuld tid med patientsikkerhed og klinisk kvalitetsudvikling i almindelighed og brug af data til kvalitetsudvikling i særdeleshed. Jeg har benyttet R siden 1999 og har udviklet flere R-pakker til bl.a. statistisk kvalitetsudvikling.

Jacob Anhøj
Overlæge, DIT

🏡 anhoej.net

📧 jacob@anhoej.net

… R

R er et helstøbt og rigt programmeringssprog. Med R kan du bearbejde, analysere og visualisere data. Og hele processen kan automatiseres, så den kan gentages igen og igen med et enkelt “tryk på knappen”, når nye data bliver tilgængelige.

R kan ovenikøbet bruges til at skrive rapporter, bøger og hele hjemmesider, som samler data, analyser, grafer, tabeller og tekst i én arbejdsgang. Aldrig mere klippe-klistre, og aldrig mere bekymre sig om skrifttyper, indrykning, marginer osv. Hvis du sørger for indholdet, sørger R for alt det praktiske.

Inden træerne vokser helt ind i himlen, skal du være opmærksom på, at R er et programmeringssprog, der – ligesom alle andre sprog – kræver mere end almindelig interesse og vedholdenhed at lære. Men hvis du arbejder med data oftere end sjældent, er det besværet værd. Og hvem sagde “besvær”? At lære R er heldigvis ikke bare nyttigt, det er også sjovt.

… installation af R og RStudio

R kan hentes til Windows, macOS og Linux fra The Comprehensive R Archive Network (CRAN), https://cran.r-project.org/.

RStudio Desktop findes hos Posit, https://posit.co/download/rstudio-desktop/.

Installation af de to programmer forløber normalt problemfrit. Men hvis du benytter en arbejdscomputer med Windows og ikke har administratoradgang, skal du måske installere R og RStudio fra din arbejdsplads’ softwarebibliotek. Desværre er er det langtfra altid, at arbejdspladserne stiller tidssvarende versioner af programmerne til rådighed for sine medarbejdere. I så fald, kan du forsøge en lokal installation, som ikke kræver administratoradgang:

  1. Opret en undermappe til R i din hjemmemappe, fx “Dokumenter\programmer\”.

  2. Hent R-installationsfilen fra The Comprehensive R Archive Network (CRAN), https://cran.r-project.org/. Kør installationen som vanligt, men vælg den nye programmappe som installationssted.

  3. Opret en undermappe til RStudio, fx “Dokumenter\programmer\rstudio\”.

  4. Hent RStudio som zip-fil fra Posit, https://posit.co/download/rstudio-desktop/, og udpak filen i RStudio-mappen.

  5. Åbn RStudio ved at dobbeltklikke på filen rstudio.exe. Du kan lave en genvej til RStudio på skrivebordet eller proceslinjen.

Hvis du får brug for eventuelle ekstrapakker til R (og det gør du), kan du installere dem med kommandoen install.packages() fra kommandolinjen i R, fx install.packages("tidyverse").

… andre kurser

Denne workshop er en del af et kursusforløb: