3 Deskriptiv statistik

3.1 Mean, median, SD and quantiles

Eksempel: Vitamin D (uge 1)

Jvf SAS-intro om deskriptiv statistik. Vi analyserer vitd-variablen for hver værdi af country:

proc means data=vit n mean median stddev q1 q3 min max;
    var vitd;
    class country;
run;    

3.2 Fraktiler

Eksempel: Vitamin D (irske kvinder,uge 1)

Vi bestemmer empiriske fraktiler vha proc univariate. Her skal vi bede proceduren om at lave et nyt datasæt til os via en output-linje

  • out-argumentet angiver navnet på det nye datasæt
  • pctlpre (PREfix) angiver første del af variabelnavnet i det nye datasæt
  • pctlpts angiver de percentiler vi ønsker, adskilt af komma’er.

Tilføj option noprint i proc-linjen for at undgå alenlangt output, du alligevel ikke skal bruge nu. 2.5 og 97.5%-fraktiler:

proc univariate data=vitEI noprint;
    var vitd;
    output out=regn pctlpre=P_ pctlpts=2.5, 97.5;
run;
proc print data=regn;
run;

og vi får, når vi printer det bestilte datasæt med navn regn:

                     Obs    P_2_5    P_97_5 
                      1       18      89.1 

3.2.1 Bestemmelse af fraktiler i t-fordelingen

Dette kan gøres i et data-step hvor vi definerer en variabel qt som vi sætter lige øvre 97.5%-fraktil vha funktionen QUANTILE('T',x,df). Her skal vi sætte den ønskede fraktil ind (x, her 97.5%) og antal frihedsgrader (df, for irske kvinder 41-1):

data qt;
    qt=quantile('T', 0.975, 40);
run;
proc print data=qt;
run;

Vi får dermed følgende print af datasættet med navn qt:

                     Obs       qt
                      1     2.02108

3.3 Tabellering

Eksempel: Vitamin D (irske kvinder, uge 1)

Ønsker vi at vide hvor mange der har e.g. Vitamin D niveau under 25 skal vi først definere en ny variabel, som for hver kvinde angiver om vitamin D er over eller under 25. Vi kan lave en 0-1 variabel med syntaks:

data vitEI;
    set vitEI;
    lav = (vitd < 25); 
run;

Den nye variabel har værdien 1, hvis vitd < 25, 0 ellers (tag et kig på datasættet).

Vi kan derefter lave en simpel frekvenstabel af denne variabel

proc freq data=vitEI;
    tables lav;
run;    
                                   Cumulative    Cumulative
    lav    Frequency     Percent     Frequency      Percent
    --------------------------------------------------------
      0          36       87.80            36        87.80  
      1           5       12.20            41       100.00