7 Linære modeller

I litteraturen skelner man i analyse af et kvantitativt outcome (f.eks. vitamin D) mellem

  • ANOVA - de forklarende variable er kategoriske (kvalitative/faktorer)
    • one-way én forklarende variabel
    • two-way to forklarende variable
    • multi-way 3+ forklarende variable
  • regression - de forklarende variable er kvantitative
    • simpel (emne uge 4)
    • multipel
  • ANCOVA - én kvantitativ og én kategorisk (emne uge 5)
  • generel lineær model / multipel regression / multivariabel lineær model - blanding af kvantitative og kvalitative (emne uge 6)

I bund og grund er de alle specialtilfælde af den samme klasse af modeller - den generelle lineære model. I SPSS kan vi bruge menuen Analyze/General Linear Model/Univariate til alle disse analyser, så der bliver meget genbrug …

7.1 One-way ANOVA

Eksempel: Vitamin D (uge 2)

Her kan benyttes

  1. Analyze/Compare Means/One-Way ANOVA.
    • Fordele: kan lave Welch test i tilfælde af uens varianser
    • Ulemper: Giver kun overordnet test for association og ikke parameterestimater og er i praksis derfor ret ubrugelig.
    • Fremgangsmåde: Sæt responsvariablen (vitd) i Dependent List, den forklarende variabel (country) i Factor
  2. Analyze/General Linear Model/Univariate.
    • Fordele: er meget fleksibel, og kan klare generelle lineære modeller (til og med uge 7)
    • Ulemper: lidt mere indviklet opsætning
    • Fremgangsmåde: Sæt responsvariablen (vitd) i Dependent Variable og den forklarende variabel (country) i Fixed Factor(s). Under Options afkrydses Parameter estimates for at sikre, at der kommer parameterestimater i output.

Vi vil generelt benytte tilgang 2.

7.2 Two-way ANOVA

Eksempel: Vitamin D (uge 2)

Som one-way ANOVA, alle forklarende variable sættes i Fixed Factor(s). Derefter skal modellen ‘bygges.’ Det gøres via knappen Model, hvor de to variable (i feltet ‘Factors & Covariates’) markeres, under Build Terms skal der stå Main effects, klik på pilen for at overføre variablene til Model. Dermed får man en model, hvor de to variable indgår som forklarende variable.

Interaktion:

  • Til at teste om der er interaktion: Efter de forklarende variable er sat i Fixed Factor(s) benyttes knappen Model, vælg Build Terms, markér de to variable du ønsker i interaktionen. Klik dem over i Model-feltet mens Build Terms står på Main Effects, derefter klikkes de over mens Build Terms står på Interaction. I Model-feltet skulle du nu gerne have tre linjer hvor disse variable indgår - hver for sig og med en stjerne imellem (f.eks. country, sol, country*sol, jvf slides uge 2).
  • til at estimere effekten af country i en model med interaktion skal i Model-feltet kun være: sol og country*sol. Dette gøres ved at markere country i Model-feltet og klikke den væk med pilen under Build Terms (således at der nu kun står sol og country*sol i Model-feltet).
  • til at estimere effekten af sol i en model med interaktion skal i Model-feltet kun være: country og country*sol. Dette gøres ved at markere sol i Model-feltet og klikke den væk med pilen under Build Terms (således at der nu kun står country og country*sol i Model-feltet).

7.3 Korrektion for multipel testning

Dette kan gøres via Analyze/General Linear Model/Univariate som beskrevet i one-way ANOVA (kap 7.1). Benyt knappen Post Hoc og sæt flueben ved f.eks. Tukey eller Games-Howell.

7.4 Modelkontrol

Modelkontrol laves via prædikterede værdier og residualer. Når vi laver analysen via Analyze/General Linear Model/Univariate kan vi gemme disse som nye variable i vores datasæt. Benyt Save-knappen og vælg Unstandardized under Predicted Values og f.eks. Studentized under Residuals. Derved får man to nye variable i sit datasæt: PRE_1 (prædikterede værdier) og SRE_1 (residualer).

7.4.1 Normalfordeling

QQ-plot af residualerne SRE_1, se kap 2.3.

Histogram af residualerne med overlejret normalfordeling, se SPSS intro on histograms

7.4.2 Varianshomogenitet

Her skal vi plotte residualer mod de prædikterede (fittede værdier). Det gøres via Graphs/Chart Builder, vælg første plotmulighed i Scatter/Dot, sæt PRE_1 på x-aksen, SRE_1 på y-aksen.

7.4.3 Linearitet

Kun relevant for lineær regression. Hertil plottes residualerne SRE_1 mod kovariaten (som er kvantitativ) via Graphs/Chart Builder, Scatter/Dot.