class: center, middle, inverse, title-slide # Basale statistiske begreber ## Parrede sammenligninger ### Susanne Rosthøj
Section of Biostatistics
.small[
sro@sund.ku.dk
] --- ## Indhold <br><br><br><br> * Deskriptiv statistik og illustration af data * Vurdering af normalfordeling * Normalområder (referenceområder) * Konfidensintervaller * Sammenligning af to målemetoder --- class: middle, center ## Vitamin D --- ## Problemstilling **Videnskabeligt spørgsmål** <div class="boxBorder"> <ul> <li>Har 'folk' et tilstrækkeligt højt niveau af vitamin D? </li> <li>Hvis ikke, kan vi så forstå hvorfor? <br> - og kan vi gøre noget ved det?</li> </ul> </div> Vi ser på et studie af ældre kvinder fra DK, EI, PL og SF **Udvælgelse af personer:** <div class="boxBorder"> <ul> <li>Hvem? Inklusionskriterier kontra repræsentativitet</li> <li>Hvor mange? Dimensionering</li> <li>Design?</li> </ul> </div> --- ## Planlægning af undersøgelse **Formulering af de(t) centrale spøgsmål** <div class="boxBorder"> <ul> <li>Er folk generelt oppe på det anbefalede niveau på 25 nmol/l?</li> <li>Er der forskel på landene?</li> <li>I givet fald, hvorfor?</li> </ul></div> **Hvilke oplysninger skal registreres?** <div class="boxBorder"> <ul> <li><b>Outcome:</b> serum Vitamin D</li> <li><b>Kovariater / forklarende variable:</b> land, spisevaner, soleksponering, fedme, rygning, alkohol, ...</li> </ul></div> --- ## Skriv en protokol! <br><br><br><br> * Man får tænkt sig om på forhånd * Det er en nødvendig del af dokumentation (etisk komite, ansøgning om midler, anmeldelse af trial, ...) * Det tjener som “ekstra hukommelse” * I forbindelse med den statistiske analyse dokumenterer det, hvad der var den oprindelige strategi og hvad der bør betegnes som tilfældige fund <!-- 3: - man glemmer en del hvis dataindsamling eller andet trækker ud Se Al-Jundi & Sakka (2016) [Protocol Writing in Clinical Research](https://pubmed.ncbi.nlm.nih.gov/28050522/) --> --- ## Data Studie af ældre kvinder fra DK, PO, FI og SF. .output[ ``` country vitd age bmi sunexp vitdintake 1 DK 28.5 73.005 26.177 Avoid sun 1.182 2 DK 32.9 72.929 25.155 Avoid sun 1.052 3 DK 60.3 72.597 23.081 Avoid sun 18.710 4 DK 50.5 71.512 25.200 Avoid sun 8.417 5 DK 15.0 71.847 25.310 Avoid sun 1.273 6 DK 47.8 73.764 23.904 Sometimes in sun 7.135 ``` ] Indlæsning af data: [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/index.html#vitamin-d) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/index.html#vitamin-d) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/index.html#vitamin-d) Rækkerne kaldes **observationer** (typisk 1 pr. person) Søjlerne kaldes **variable** --- ## Typer af variable .pull-left2[ * **Kvantitative** (numeriske) variable * Vitamin D koncentration (`vitd`, nmol/l) * Alder (`age`) * Body Mass Index (`bmi`) ] .pull-right2[ <img src="figurer/calculator.png" width="40%" style="display: block; margin: auto;" /> ] .pull-left2[ * **Kategoriske** (kvalitative) variable <br> (class, factor, nominal) * Personens hjemland (`country`) * Personens solvaner (`sunexp`, **ordinal**) ] .pull-right2[ <img src="figurer/boxes2.jpg" width="140%" style="display: block; margin: auto;" /> ] --- ## Anbefalet rækkefølge af aktiviteter <ol> <li>Tænk (forhåbentlig allerede på protokolstadiet)</li> <li>Tegn <ul> <li>Histogram</li> <li>Boxplot (typisk for at sammenligne grupper)</li> <li>Scatter plot</li> </ul> </li> <li>Regn <ul> <li>Tabeller</li> <li>Summary statistics</li> </ul> </li> <li>Lav analyser <ul> <li>Model</li> <li>Estimation</li> <li>Test</li> </ul> </li> </ol> --- class: middle, center # Tegn --- ## Tegn I: Histogram <img src="uge1_files/figure-html/hist1-1.png" width="720" style="display: block; margin: auto;" /> [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/illustrationer.html#histogram) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/illustrationer.html#histogram) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/illustrationer.html#histogram) --- ## Normalfordelingen `\({\cal N}(\mu, \sigma^2)\)` <!-- Hvorfor er vi så glade for den normalfordeling? --> Middelværdi `\(\mu\)`, spredning `\(\sigma\)` <img src="uge1_files/figure-html/normalfordelingen-1.png" width="720" style="display: block; margin: auto;" /> --- ## Tegn II: boxplot .pull-left2[ <img src="uge1_files/figure-html/boxplot-1.png" width="80%" style="display: block; margin: auto;" /> ] .pull-right2[ <br><br> God til sammenligninger <br> <br> [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/illustrationer.html#boxplot) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/illustrationer.html#boxplot) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/illustrationer.html#boxplot) [Mere om boxplots](https://towardsdatascience.com/understanding-boxplots-5e2df7bcbd51) ] <!-- Quiz? boxplot - par højre / venstre / ingen skæv med boxes, se fil i figures med efternavn webP --> --- ## Tegn III Stripchart og violinplot <!-- R / SAS / SPSS --> <img src="uge1_files/figure-html/pirate-1.png" width="720" style="display: block; margin: auto;" /> --- ## Er det tilstrækkeligt at tegne boxplot? <img src="figurer/boxplot_strip_violin.jpg" width="1908" /> Link til [animation](https://www.autodesk.com/research/publications/same-stats-different-graphs) --- class: middle, center # Regn --- ## Regn I: Location / centrum Observationer `\(Y_1,\ldots, Y_n\)`. * **Gennemsnit:** `\(\bar Y = \frac1n (Y_1 + · · · + Y_n)\)` * **Median:** midterste observation <br><br> I *symmetriske* fordelinger vil gennemsnit og median være ens (pånær tilfældigheder) <br> I *skæve* fordelinger vil de ikke være ens:<br> Typisk er der hale mod de høje værdier (og gennemsnittet er større end medianen). --- ## Gennemsnit = tyngdepunkt .pull-leftF[ <img src="figurer/tyngdepunkt.jpg" width="808" style="display: block; margin: auto auto auto 0;" /> <br> .boxBorder[ Eksempel: Indlæggelsestider. <br> 5, 5, 5, 7, 10, 16, <br> 106 dage ] ] .pull-rightF[ <br><br> * kan opfattes som ligevægtspunkt * påvirkes kraftigt af yderlige observationer <br><br> <br><br> <br><br> Median 7 dage. Gennemsnit 22 dage.<br><br> Repræsentativt for hvad? ] --- ## Regn II: Variation <!-- Observationer `\(y_1,\ldots, y_n\)`. --> * Varians: `\(s^2 = \frac1{n-1} \sum (Y_i-\bar Y)^2\)` * **Spredning** = Standardafvigelse = Standard Deviation <br> = `\(\sqrt{ }\)`varians = `\(s\)` = SD. <br><br> * Fraktiler: * **Interquartiles** Q1 (25%) og Q3 (75%) <br> (InterQuartile Range Q3-Q1 (IQR)) --- ## Summary statistics for Vitamin D <br><br> .output[ ``` mean median SD Q1 Q3 min max DK 47.16604 47.8 22.78292 27.600 61.8 11.4 93.6 SF 47.99074 46.6 18.72471 35.525 60.9 5.2 96.6 EI 48.00732 44.8 20.22212 34.400 62.7 17.0 110.4 PL 32.56154 32.5 12.46448 25.000 39.9 5.4 60.3 ``` ] <br> Median og gennemsnit er nogenlunde ens (~ symmetri i boxplot). *Det betyder **ikke** at der er tale om en normalfordeling* <br> <!--DK ligger lavere end de øvrige lande (undtagen måske for Q1). Bemærk også lavere spredningen for DK--> [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/deskriptiv-statistik.html#meanmm) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/descstat.html#meanmm) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/descstat.html#meanmm) --- class: middle, center # Referenceområder <!-- Hvis data er normalfordelt vil intervallet indeholde 95% - hvis ikke, tjah... --> --- ## Referenceområde baseret på fraktiler **Reference**- eller **normal** område: <p style="text-align:center"> De centrale 95% af observationerne </p> * Nedre grænse: 2.5% fraktil * Øvre grænse: 97.5% fraktil Irske kvinder (*n*=41): .output[ ``` [1] 17.0 18.0 18.5 24.3 24.5 26.2 26.9 28.3 30.5 33.2 34.4 34.6 [13] 35.2 37.6 40.4 40.9 41.1 43.3 43.6 43.7 44.8 45.0 47.1 47.1 [25] 50.2 51.7 53.0 56.9 57.7 57.7 62.7 63.2 66.0 66.7 67.2 67.4 [37] 72.0 74.5 75.7 89.1 110.4 ``` ] Normalområde fra 18 til 89.1 nmol/l. [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/deskriptiv-statistik.html#fraktiler) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/descstat.html#fraktiler) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/descstat.html#fraktiler) (NB andre fraktiler i SPSS (17.1-109.3)) --- ## Referenceområde i normalfordeling .pull-left[ <img src="uge1_files/figure-html/refomrnf-1.png" width="720" style="display: block; margin: auto;" /> ] .pull-right[ <br><br>Fraktiler: * 2.5% fraktil: `\(\mu-1.96\sigma\)` * 97.5% fraktil: `\(\mu+1.96\sigma\)` ] --- ## Referenceområde baseret på normalfordeling .pull-left[ <br> Normalområdet udregnes som $$ \bar y ± {\rm cirka \ } 2 × s $$ Cirka 2 er `\(\sqrt{1 + \frac1n}t_{97.5\%}(n − 1)\)` <br> - her `\(\sqrt{1 + \frac1{41}}\times2.02=2.07\)` For irske kvinder: <br> 48.0 `\(\pm\)` 2.07 `\(\times\)` 20.2 = (6.1, 89.9) [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/deskriptiv-statistik.html#bestemmelse-af-fraktiler-i-t-fordelingen) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/descstat.html#bestemmelse-af-fraktiler-i-t-fordelingen) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/descstat.html#tfraktiler) ] .pull-right[ <img src="uge1_files/figure-html/ill-t-ford1-1.png" width="720" style="display: block; margin: auto;" /> ] --- ## Er kvinderne oppe på det ønskede niveau på 25 nmol/l? .pull-left[ <img src="uge1_files/figure-html/hist2-1.png" width="432" style="display: block; margin: auto;" /> ] .pull-right[ Referenceområder * Normalfordelings: (7.6,88.4) * Fraktil: (18,89.1) Antal kvinder med vitamin D under 25: <br> 5 svarende til 12%. [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/deskriptiv-statistik.html#tabellering) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/descstat.html#tabellering) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/descstat.html#tabellering) ] --- ## Beregning af referenceområde **Store datasæt** * Brug fraktiler **Mellemstore datasæt:** * Brug en rimelig fordelingsantagelse, typisk normalfordelingen (evt. efter transformation) <br> *Her er normalfordelingsantagelsen vigtig* <!--Med 100 observationer er usikkerheden på grænserne ca. 20% --> **Små datasæt** * Lad være! --- class: center, middle # Vurdering af normalfordeling --- ## Histogram Test for normalfordeling - aldrig! <img src="uge1_files/figure-html/hist3-1.png" width="720" style="display: block; margin: auto;" /> --- ## Vurdering af normalfordeling I Hvordan ser normalfordelingen `\({\cal N}( \mu=\)` 48.01, `\(\sigma^2=\)` 20.22 `\(^2\)` ) ud? Med 5 (sorterede) observationer forventer vi observation ... * nr 1 mellem `\(-\infty\)` og 1/5-fraktilen * nr 2 mellem 1/5 og 2/5-fraktilen * ... * nr 5 mellem 4/5-fraktilen og `\(+\infty\)` (=5/5-fraktilen) --- ## Vurdering af normalfordeling II <img src="uge1_files/figure-html/sjovtplot2-1.png" width="720" style="display: block; margin: auto;" /> --- ## Vurdering af normalfordeling II <img src="uge1_files/figure-html/vurd2-1.png" width="720" style="display: block; margin: auto;" /> --- ## QQ-plot Quantile-Quantile plot (fraktildiagram): <img src="uge1_files/figure-html/qq-1.png" width="720" style="display: block; margin: auto;" /> --- ## QQ-plot <!-- målingerne skal følges ad --> Ret linje? Se eksempler [her](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/diverse/QQplots.pdf) <img src="uge1_files/figure-html/qq2-1.png" width="720" style="display: block; margin: auto;" /> --- ## QQ-plot Quantile-Quantile plot med normerede fraktiler: [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/illustrationer.html#qq-plot) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/illustrationer.html#qqplot) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/illustrationer.html#qq-plots) <img src="uge1_files/figure-html/qq3-1.png" width="720" style="display: block; margin: auto;" /> --- class: center, middle # Højreskæve fordelinger ## Logaritmen --- ## Nyt eksempel - immunoglobulin Data: [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/index.html#immunoglobulin) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/index.html#immunoglobulin) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/index.html#immunoglobulin) .output[ ``` mean median SD Q1 Q3 min max 0.8030201 0.7 0.4694982 0.5 1 0.1 4.5 ``` ] <img src="uge1_files/figure-html/img-1.png" width="720" style="display: block; margin: auto;" /> --- ## Højreskæv fordeling <img src="uge1_files/figure-html/hoejre-1.png" width="684" style="display: block; margin: auto;" /> I begge haler er observationerne for store - **hængekøjeform** i QQ-plot --- ## Højreskæv fordeling * Histogrammet er skævt, med en hale mod de høje værdier (*højreskævt*) * Gennemsnittet er en del større end medianen <h3>Løsning: </h3> Transformér med en logaritme * ligegyldig hvilken: naturlig, 10-tals, 2-tals, 1.1-tals, ... `\(\log_2(y) = z\)` : "Hvilket tal `\(z\)` skal jeg opløfte 2 i for at få `\(y\)`?" --- ## Logaritmen <img src="uge1_files/figure-html/log-1.png" width="684" style="display: block; margin: auto;" /> Store observationer 'trykkes sammen', små observationer 'spredes'. --- ## Logaritmetransformeret immunoglobin Beregn ny variabel log2img = `\(\log_2({\rm img})\)` i datasættet <img src="uge1_files/figure-html/logtrans-1.png" width="720" style="display: block; margin: auto;" /> --- ## Anti-log Når man har regnet "noget" færdigt på log-skala transformeres tilbage med den **samme anti-logaritme**, dvs. * `\(e^{\rm noget}\)` (eksponentialfunktionen, *e*=2.72=`exp(1)` Eulers konstant, ), * `\(10^{\rm noget}\)` * `\(2^{\rm noget}\)` Dvs med `\(\log_2(y) = z\)` er invers funktion (antilog) : `\(y=2^z\)`. --- ## Normalområde immunoglobulin | Data | gennemsnit | median | spredning | referenceområde | |------|--------|------|--------| |utransformeret | 0.803| | 0.469 | -0.135 til 1.741| |log2-transformeret | -0.524 || 0.789 |-2.102 til 1.054| |tilbagetransformeret || 0.695| - | 0.233 til 2.076| |empiriske fraktiler || 0.700| - | 0.2 til 2.0| Tilbagetransfomationen: Referenceområde på `\(\log_2\)`-skala: (-2.102, 1.054) Tilbagetransformeret: `\((2^{−2.102}, 2^{1.054})\)` =(0.23, 2.08) Lad være med at tilbagetransformere spredningerne! --- ## Nyt eksempel - længdespring 40 mandlige atleter, kvalifikation OL 2012, bedste spring af 3. Data: [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/index.html#long-jump) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/index.html#long-jump) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/index.html#long-jump) .output[ ``` mean median SD Q1 Q3 min max 7.6745 7.765 0.3700031 7.5 7.955 6.55 8.11 ``` ] <img src="uge1_files/figure-html/lj2-1.png" width="648" style="display: block; margin: auto;" /> --- ## Venstreskæv fordeling <img src="uge1_files/figure-html/lj4-1.png" width="936" style="display: block; margin: auto;" /> I begge haler er observationerne for små. Ingen "mirakel"-transformation ... --- class: middle, center # Fordeling af gennemsnit --- ## *Normalfordelte* data Vi observerer `\(n\)` observationer `\(Y_1,\ldots, Y_n\)` fra `\({\cal N}(\mu, \sigma^2)\)` Gennemsnittet `\(\bar Y\)` er normalfordelt med: $$ {\rm mean}( \bar Y) = \mu. $$ $$ {\rm SD}(\bar Y) = \frac{\sigma}{\sqrt n} $$ Denne SD kaldes også **standard error of the mean** (SE eller SEM). Gennemsnittet har altså en fordeling. --- ## Én normalfordeling Simulerede data, `\(n=100\)`. <img src="uge1_files/figure-html/sim2-1.png" width="720" style="display: block; margin: auto;" /> --- ## Fordelingen af mange gennemsnit 1000 simulerede datasæt, hver med `\(n=100\)`. <img src="uge1_files/figure-html/simmange-1.png" width="720" style="display: block; margin: auto;" /> --- ## *Ikke-normalfordelte* data Vi observerer `\(n\)` observationer `\(Y_1,\ldots, Y_n\)` fra samme fordeling med middelværdi `\(\mu\)` og spredning `\(\sigma\)` **Den centrale grænseværdisætning:** Gennemsnittet `\(\bar Y\)` er **approksimativt** normalfordelt med: $$ {\rm mean}( \bar Y) = \mu. $$ $$ {\rm SD}(\bar Y) = \frac{\sigma}{\sqrt n} $$ Eksempel: Gennemsnitligt antal øjne kast med 5 terninger har `\(\mu=3.5,\)` `\(\sigma/\sqrt 5=0.76.\)` --- ## Fordeling af 1 terningekast 1000 observationer (kast) `\(Y_1, \ldots, Y_n\)`: <img src="uge1_files/figure-html/terning1-1.png" width="720" style="display: block; margin: auto;" /> --- ## Fordeling af gennemsnit af terningekast 1000 gentagelser: <img src="uge1_files/figure-html/terning2-1.png" width="864" style="display: block; margin: auto;" /> --- class: middle, center # Konfidensintervaller --- ## Fordeling af gennemsnit Gennemsnittet er (approksimativt) normalfordelt med middelværdi `\(\mu\)` og spredning `\(\sigma/\sqrt n\)` <!-- Hvis `\(\sigma\)` var kendt (og `\(n\)` stor): `\(\displaystyle \bar Y \pm 1.96\times\frac{\sigma}{\sqrt n}\)` --> <img src="uge1_files/figure-html/ci1-1.png" width="720" style="display: block; margin: auto;" /> --- ## Konfidensinterval for middelværdien `\(\displaystyle \bar Y \pm q_{t,{0.975}}(n-1)\times\frac{\rm SD}{\sqrt n}\)` .pull-leftF[ <br> Her `\(q_{t,{0.975}}(n-1)\)` 97.5%-fraktilen i t-fordelingen med `\(n-1\)` frihedsgrader. F.eks. med `\(n=100:\)`<br> `\(q_{t,{0.975}}(99)\)` = 1.984 ] .pull-rightF[ <img src="uge1_files/figure-html/ill-t-ford-1.png" width="720" style="display: block; margin: auto;" /> ] --- ## Fortolkningen af konfidensintervaller <img src="uge1_files/figure-html/ci2-1.png" width="648" style="display: block; margin: auto;" /> ``` [[1]] NULL [[2]] NULL [[3]] NULL [[4]] NULL [[5]] NULL [[6]] NULL [[7]] NULL [[8]] NULL [[9]] NULL [[10]] NULL [[11]] NULL [[12]] NULL [[13]] NULL [[14]] NULL [[15]] NULL [[16]] NULL [[17]] NULL [[18]] NULL [[19]] NULL [[20]] NULL ``` --- ## Hvorfor er konfidensintervaller vigtige? Vi ønsker at bestemme en **parameter**, e.g. * gennemsnitligt vitamin D niveau * median niveau af immunoglubolin Baseret på en stikprøve kommer vi med et kvalificeret gæt (et *estimat*) * vi er ikke helt sikre på vores gæt og foreslår et interval af plausible værdier * vi ønsker at intervallet er smalt men ... * ... også at vi har en stor sandsynlighed (95%) for at gætte rigtigt. I må _**aldrig**_ angive et estimat uden konfidensinterval! --- ## Vigtigheden af normalfordelingen afhænger af formålet med undersøgelsen * **Vigtigt** * ved beskrivelser * i særdeleshed ved konstruktion af referenceområder * **Knap så vigtig** * ved sammenligninger (sammenligning af gennemsnit, lineær regression) hvor antallet af observationer er tilstrækkeligt højt * **Overhovedet ikke vigtigt** * for kovariater / forklarende variable (regressionsanalyse) Meget mere om dette senere ... --- class: middle, center # Parrede sammenligninger --- ## Parrede data: * Observationer fra en situation 'er parret med' observationer fra en anden <br> Eksempler: * Målinger på samme person **før** og **efter** en behandling * **To målemetoder** der benyttes på samme person/dyr/blodprøve * Sammenligning af to grupper/behandlinger, hvor individerne er **individuelt matchet** på f.eks. køn, alder, bopæl etc. <!-- ## Formålet med undersøgelsen * Vurdering af effekten af en behandling (dvs. man har målinger både **før** og **efter** behandling). Ofte har man en kontrolgruppe (5. uge) * Vurdering af, om to målemetoder/apparaturer måler det samme, eller rettere: kvantificering af, hvor stor diskrepans, der ses imellem dem * Sammenligning af to behandlinger, hvor man ved hjælp af matchning eller cross-over har sørget for parrede observationer for behandlingerne --> --- ## Sammenligning af målemetoder Eksempel: Ultralydsundersøgelse af hjertet. To metoder til bestemmelse af slagvolumen: * MF: bestemt ved Doppler ekkokardiografi * SV: bestemt ved cross-sectional ekkokardiografi Måler de to målemetoder 'det samme'? Data: [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/index.html#slagvol) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/index.html#slagvol) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/index.html#slagvol) ``` mf sv 1 47 43 2 66 70 3 68 72 ``` <!-- Ubrugelig tabel: \begin{tabular{|c|r|r| \hline person & MF & SV \hline 1 & 47 & 43 2 & 66 & 70 3 & 68 & 72 4 & 69 & 81 5 & 70 & 60 . & . & . . & . & . . & . & . . & . & . 17 & 104 & 94 18 & 105 & 98 19 & 112 & 108 20 & 120 & 131 21 & 132 & 131 \hline gennemsnit & 86.05 & 85.81 SD & 20.32 & 21.19 SEM & 4.43 & 4.62 --> --- ## Scatter plot af MF vs. SV Lineær sammenhæng mellem de to målemetoder? Er de rimeligt ens? [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/illustrationer.html#scatter-linje) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/illustrationer.html#scatter-linje) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/illustrationer.html#scatterplot-med-linje) <img src="uge1_files/figure-html/scatter1-1.png" width="720" style="display: block; margin: auto;" /> --- ## Yderligere illustration Man skal kunne se parringen! [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/illustrationer.html#spaghetti) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/illustrationer.html#spaghetti) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/illustrationer.html#spaghettiplot) .pull-left[ Forkert tegning <img src="uge1_files/figure-html/forkert-1.png" width="75%" /> ] .pull-right[ Rigtig tegning <img src="uge1_files/figure-html/rigtig-1.png" width="75%" /> ] <!-- (kræver omstrukturering af data til langt format), skal stå i app --> --- ## Analyse af parrede data * Personen er **sin egen kontrol** - giver stor styrke til at opdage forskelle. <br> * Se på individuelle differenser - men på hvilken skala? * Er differensernes størrelse nogenlunde uafhængig af niveauet? * Eller er der snarere tale om relative (procentuelle) forskelle `\(\rightarrow\)` se på differenserne på en logaritmisk skala. <br> * Undersøg om differenserne har middelværdi 0: * parret T-test (= one-sample T-test på differenserne) --- class: middle, center # Parret T-test / one-sample T-test --- ## Statistisk model for parrede data * `\(X_i\)`: MF for den i'te person * `\(Y_i\)`: SV for den i'te person Differenser `\(D_i=X_i-Y_i\)` er * uafhængige * normalfordelte `\({\cal N}(\delta,\sigma^2)\)` * med middelværdi `\(\delta\)` * samme spredning `\(\sigma\)` for alle personer Bemærk: * Kun antagelser om _differenserne_ <!-- * fordi det er et parret design * Intet krav om fordeling af selve flowmålingerne! * kun af differenserne. --> --- ## Statistisk analyse <!-- Inferens --> Med udgangspunkt i indsamlede data, hvad kan vi så sige om den sandsynligheds- mekanisme (model, herunder de ukendte parametre), der har frembragt disse data? <br> * Estimation: <br> - Hvad kan vi så sige om de to ukendte parametre `\(\delta\)` og `\(\sigma\)` ? * Bias: <br> - Ser der ud til at være systematisk forskel på de to metoder, dvs. er `\(\delta=0\)` ? * Prædiktion: <br> - Hvor store forskelle kan vi forvente i praksis? --- ## Antagelser for den parrede sammenligning **Differenserne** `\(D_i=X_i-Y_i, \quad i=1,\dots,21\)` * er **uafhængige** * har **samme spredning** (spaghettiplot / Bland-Altman plot af differenser mod gennemsnit) * er **normalfordelte** * histogram / QQ-plot (men umuligt at sige med kun 21 observationer) * test for normalfordeling (aldrig!) * nogle gange vigtig, andre gange ikke --- ## Differenser normalfordelt? <img src="uge1_files/figure-html/difnf-1.png" width="720" style="display: block; margin: auto;" /> --- ## Estimation Model: `\(D_i={\rm MF}_i-{\rm SV}_i \sim {\cal N}(\delta,\sigma^2)\)` Parametrene estimeres ved * `\(\hat{\delta}=\bar D=0.238\)` (gennemsnittet på differenserne) * `\(\hat \sigma={\rm SD}=\)` 6.96 (SD af differenserne) $$ {\rm CI} = 0.238 \pm 2.09\times \frac{6.96}{\sqrt{21}} = (-2.93, 3.41) $$ HUSK: * SD er spredningen på outcome (data / `\(D_i\)`'erne). * SE (eller SEM) er spredningen på estimatet / gennemsnittet `\(({\rm SE}=\frac{\rm SD}{\sqrt n})=1.52\)` --- ## Fortolkning af konfidensinterval Konfidensinterval for middelværdien af forskellen `\(\delta\)` mellem MF og SV blev estimeret til `$$(-2.93, 3.41)$$` Det betyder: * Der kan ikke påvises nogen systematisk forskel (bias) mellem de to typer målinger * Vi kan dog heller ikke afvise, at der kan være forskel * En evt. bias vil med stor sikkerhed (her 95%) være mindre end ca. `\(3-3.4\)` (til hver side) --- ## Test af 'ingen bias' mellem MF og SV Dvs. test af nulhypotesen `\(H_0: \delta=0\)` <br> Vi benytter et T-test på differenserne $$ \frac{\rm estimat - hypoteseværdi}{\rm standard\ error\ for\ estimat} $$ som under `\(H_0\)` er T-fordelt med `\(n-1\)` frihedsgrader. Dette er også et eksempel på et one-sample T-test ... --- ## T-test for MF vs. SV Her finder vi teststørrelsen: $$ t=\frac{\hat{\delta}-0}{\text{SEM}} = \frac{0.24-0}{6.96/\sqrt{21}} = 0.16 \sim t(20) $$ Vi bruger p-værdier til at vurdere teststørrelsen. <!-- Princippet i de følgende trin, er at lave nogle beregninger med udgangspunkt i en antagelse om at nul-hypotesen er sand. Hvis disse beregninger så fører til noget urimeligt, dvs. noget meget lidt sandsynligt, så må antagelsen være forkert. Eller med andre ord: Så må det være H1-hypotesen der er den rigtige.--> --- ## P-værdier Hvis hypotesen er sand og vi gentager forsøget mange gange: .center[ Hvor ofte vil vi få en T-teststørrelse, som er **mindst** lige så stor <br>som den observerede på 0.16? ] Vi beregner p-værdien som .center[ P(|T-test størrelse| > |observeret T-teststørrelse|) ] under *antagelsen om at hypotesen er sand*. Er p-værdien lille (<5%), svarende til at den observerede T-teststørrelse er "usandsynlig", konkluderer vi at det er **usandsynligt** at nul-hypotesen er sand og **afviser** `\(H_0\)` --- ## Fordeling af T-teststørrelsen Hvis `\(H_0\)` er _sand_, følger T-teststørrelsen en t-fordeling med `\(n-1\)` = 20 frihedsgrader (df). <img src="uge1_files/figure-html/ill-teststr-3-1.png" width="720" style="display: block; margin: auto;" /> --- ## Test vs. konfidensinterval Der er **ækvivalens** i den forstand, at: * Hvis konfidensintervallet (sikkerhedsintervallet) indeholder `\(H_0\)`, er testet ikke signifikant * Hvis konfidensintervallet (sikkerhedsintervallet) ikke indeholder `\(H_0\)`, er testet signifikant Her er CI (-2.93, 3.41) og `\(p=0.88\)` dvs vi **kan ikke afvise hypotesen om middelværdi 0 for differenserne**. Men var det alt, hvad vi gerne ville vide? <br> Nej, vi vil gerne vide, hvor store forskellene typisk er.... --- class: center, middle # Bland-Altman plot ## Limits Of Agreement --- ## Bland-Altman plot <!-- Læs: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4470095/--> Plot af differenser `dif=mf-sv` mod gennemsnit `gns=(mf+sv)/2`: .pull-left[ <img src="uge1_files/figure-html/xyplot-1.png" width="360" style="display: block; margin: auto;" /> ] .pull-right[ <img src="uge1_files/figure-html/ba1-1.png" width="360" style="display: block; margin: auto;" /> ] Ligger differenserne omkring 0? Er der ca. den samme fordeling for alle niveauer? [R](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/R/illustrationer.html#ba-plot) / [SAS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SAS/illustrationer.html#ba-plot) / [SPSS](https://publicifsv.sund.ku.dk/~sr/BasicStatistics/slides/appendix/SPSS/illustrationer.html#bland-altman-plot) --- ## Limits Of Agreement Hvor store afvigelser vil man typisk se mellem de to metoder for individuelle personer (enkeltindivider)? Limits Of Agreement (LOA) er **normalområdet for differenserne**: $$ \bar{D} \pm {\rm 'cirka\ 2'} \times SD = 0.24 \pm 2 \times 6.96 = (-13.68, 14.16) $$ Disse grænser er vigtige for at afgøre om to målemetoder kan erstatte hinanden. * Det er **ikke** nok, at der ikke er nogen systematisk forskel <br> NB: Cirka 2 er `\(\sqrt{1 + \frac1n}t_{97.5\%}(n − 1)\)` * her `\(\sqrt{1 + \frac1{21}}\times2.09=2.19\)` (dvs reelt er LOA=(-14.6,15.1)) --- ## Limits Of Agreement illustreret <img src="uge1_files/figure-html/ba2-1.png" width="720" style="display: block; margin: auto;" /> --- ## Eksempel: To slags termometre <!-- i daglig anvendelse --> * Måler de det samme? * Det er i hvert fald intentionen.... * Men er de ens? * Nej, vi kan se, at de ganske ofte afviger fra hinanden * Det kunne skyldes måleusikkerhed, men er der også en konsekvent=systematisk forskel? * Lav parret T-test på passende skala og kvantificér forskel * Vi fandt ingen signifikant forskel, er de så ens? * Måske ... <!-- 3. Altså i en bestemt retning 4. Måske, men vi kan ikke udelukke en forskel, vi kan bare ikke påvise den i dette sample - måske i et større.... --> --- ## Eksempel: To slags termometre II * Hvad kan vi så overhovedet sige? * Vi kan sige, at middelværdiforskellen næppe er større end det, som konfidensintervallet angiver. * Er det overhovedet interessant? Det udtaler sig jo om populationer... Hvad med Fru Hansen, kan der være systematiske forskelle for hende? * Det kan vi kun se, hvis vi måler mange gange på Fru Hansen * Men kan vi leve med de forskelle, vi ser hos Fru Hansen og alle de andre? * **Dette er ikke et statistisk spørgsmål!** <!-- 1. Og hvis det ikke indeholder noget, der er stort nok til at være betydningsfuldt, så har de for alle praktisk formål ens middelværdi. 2. F.eks. pga anatomiske forhold, håndtering af termometret etc. Det kan der godt, men det kan vi kun se ... men vi kan kvantificere disse forskelle ved hjælp af limits of agreement, som så kan vurderes klinisk. --> --- ## Summary Du har nu lært at * beskrive data grafisk og ved deskriptiv statistik * vurdere om data er normalfordelt * bestemme normalområder * gennemsnit er (approksimativt) normalfordelte * bestemme konfidensintervaller for gennemsnit * kende forskellen på normalområde og konfidensinterval * sammenligne to målemetoder ved CI, parret (one-sample) T-test og LOA <!-- # skrald ><ulnone> > <li>Coffee</li> > <li>Tea</li> > <li>Coca Cola</li> ></ulnone> .code-bg-red[ ``` [1] 5 ``` ] <ul class="demo"> <li>Coffee</li> <li>Tea</li> <li>Coca Cola</li> </ul> -->