Databehandling og -visualisering med R
Databehandling og -visualisering er en et-dages workshop, hvor du lærer at bearbejde, analysere og visualisere data med programmeringssproget R.
Workshoppen henvender sig til dig, som allerede har et grundlæggende kendskab til R – fx fra workshoppen R fra bunden – og som vil lære videregående databehandling og -visualisering.
Indhold
På workshoppen lærer du at indlæse, ordne, bearbejde, analysere og visualisere data med funktioner fra R-pakken tidyverse.
Du lærer at beherske de fem dataoperationer:
- selektere
- filtrere
- transformere
- aggregere
- sortere
Efter workshoppen kan du indlæse og klargøre data fra tekstfiler og regneark til analyse og visualisering. Du kan opbygge avancerede grafer, som fremstiller mønstre og tendenser i data på måder, som fremmer forståelsen og gør samtalen meget mere interessant. Du kan automatisere dine arbejdsgange, så du kun skal “trykke på knappen” for at gentage dine analyser med friske data.
… og du kan skrive R-kode som denne:
Kode
# Indlæs data fra fil,
# udvælg personer som er ældre end 60 år gamle, og
# fjern poster med manglende værdier
<- read_rds('data/mikrosundhed.rds') |>
d filter(alder > 60) |>
drop_na()
# Vis de første 6 poster i data
head(d)
# A tibble: 6 × 7
id alder hoejde vaegt helbred koen ryger
<int> <dbl> <dbl> <dbl> <ord> <fct> <lgl>
1 15 66 179 85 God Mand FALSE
2 22 84 168 62 Meget god Mand FALSE
3 34 61 160 72 God Kvinde FALSE
4 38 81 166 76 Nogenlunde Mand FALSE
5 46 67 159 78 Nogenlunde Kvinde FALSE
6 50 84 176 75 God Mand FALSE
Kode
# Plot vægt mod højde for hhv. mænd og kvinder og rygere og ikkerygere
ggplot(d, aes(hoejde, vaegt, colour = ryger, shape = ryger)) +
geom_point() +
geom_smooth(method = lm, se = FALSE) +
facet_wrap(~koen)
Form
Workshoppen rummer en blanding af oplæg og drøftelser i plenum og øvelser på egen PC. Workshoppen er 100% PowerPoint-fri og forudsætter en høj grad af deltagerinvolvering.
Forberedelse
Du kan læse mere om databehandling og -visualisering i min nye bog Håndbog i kvalitetsudvikling med data.
Workshoppen forudsætter, at du har erfaring med R svarende til indholdet i R fra bunden.
Du skal medbringe en bærbar computer med en tidssvarende version af R (≥ 4.2.0) og RStudio (≥ 2022.02.0) samt R-pakken tidyverse
installeret.
Hvis installationen volder problemer kan du måske finde hjælp i installationsvejledningen nederst på denne side.
Praktiske oplysninger
Datoer: …
Tid: 08:30-15:30
Sted: …
Forplejning: …
Tilmelding: …
Pris: …
Om …
… mig
Jeg er læge og har de seneste snart 20 år beskæftiget mig på fuld tid med patientsikkerhed og klinisk kvalitetsudvikling i almindelighed og brug af data til kvalitetsudvikling i særdeleshed. Jeg har benyttet R siden 1999 og har udviklet flere R-pakker til bl.a. statistisk kvalitetsudvikling.
Jacob Anhøj
Overlæge, DIT
… R
R er et helstøbt og rigt programmeringssprog. Med R kan du bearbejde, analysere og visualisere data. Og hele processen kan automatiseres, så den kan gentages igen og igen med et enkelt “tryk på knappen”, når nye data bliver tilgængelige.
R kan ovenikøbet bruges til at skrive rapporter, bøger og hele hjemmesider, som samler data, analyser, grafer, tabeller og tekst i én arbejdsgang. Aldrig mere klippe-klistre, og aldrig mere bekymre sig om skrifttyper, indrykning, marginer osv. Hvis du sørger for indholdet, sørger R for alt det praktiske.
Inden træerne vokser helt ind i himlen, skal du være opmærksom på, at R er et programmeringssprog, der – ligesom alle andre sprog – kræver mere end almindelig interesse og vedholdenhed at lære. Men hvis du arbejder med data oftere end sjældent, er det besværet værd. Og hvem sagde “besvær”? At lære R er heldigvis ikke bare nyttigt, det er også sjovt.
… installation af R og RStudio
R kan hentes til Windows, macOS og Linux fra The Comprehensive R Archive Network (CRAN), https://cran.r-project.org/.
RStudio Desktop findes hos Posit, https://posit.co/download/rstudio-desktop/.
Installation af de to programmer forløber normalt problemfrit. Men hvis du benytter en arbejdscomputer med Windows og ikke har administratoradgang, skal du måske installere R og RStudio fra din arbejdsplads’ softwarebibliotek. Desværre er er det langtfra altid, at arbejdspladserne stiller tidssvarende versioner af programmerne til rådighed for sine medarbejdere. I så fald, kan du forsøge en lokal installation, som ikke kræver administratoradgang:
Opret en undermappe til R i din hjemmemappe, fx “Dokumenter\programmer\”.
Hent R-installationsfilen fra The Comprehensive R Archive Network (CRAN), https://cran.r-project.org/. Kør installationen som vanligt, men vælg den nye programmappe som installationssted.
Opret en undermappe til RStudio, fx “Dokumenter\programmer\rstudio\”.
Hent RStudio som zip-fil fra Posit, https://posit.co/download/rstudio-desktop/, og udpak filen i RStudio-mappen.
Åbn RStudio ved at dobbeltklikke på filen rstudio.exe. Du kan lave en genvej til RStudio på skrivebordet eller proceslinjen.
Hvis du får brug for eventuelle ekstrapakker til R (og det gør du), kan du installere dem med kommandoen install.packages()
fra kommandolinjen i R, fx install.packages("tidyverse")
.
… andre kurser
Denne workshop er en del af et kursusforløb:
Rapportskrivning med R og Rmarkdown
Interaktive dashboards med R og Shiny