Nedenfor finder du en kort beskrivelse af nogle af de hyppigst anvendte procedurer. Siden vil blive
opdateret løbende efterhånden som vi får brug for flere procedurer, men vil næppe blive udtømmende
(muligvis får I brug for kommandoer / options / procedurer som ikke bliver beskrevet her).
Flere detaljer om procedurerne og deres anvendelse kan findes på SAS' hjemmeside (klik på +'et ud for
'Procedures' for at få en komplet liste over alle procedurer; herfra kan klikkes ind på de enkelte procedurer).
Lene har en lille SAS-manual
som du med fordel kan bladre igennem og Janne Petersen (øvelseslærer) har også udarbejdet et sæt slides
(link endnu ikke aktivt) som det er værd at kigge igennem.
For hver procedure gives et eksempel med en anvendelse på datasættet Sundby95
benyttet i videoerne med introduktion til SAS. Datasættet indlæser du med
syntaksen (jvf video 1 på introduktionssiden)
hvor jeg i samme ombæring også har defineret den kvalitative version af alkoholvariablen (video 6).
Du kan efter at have indlæst disse data køre alle eksemplerne nedenfor.
Det tager tid at lære hvilke procedurer man benytter til hvilke formål.
På denne side gennemgås
Giver antal observationer og en liste over variablene i et datasæt.
Printer (dele af) et datasæt. Med ekstra option
Sorterer observationerne i et datasæt efter værdierne af en eller flere variable angivet i
Vi kan bede om at få observationerne sorteret i omvendt rækkefølge ved at tilføje et
Denne procedure kan benyttes på flere forskellige måder til at beskrive fordelingen af en kvantitativ variabel.
Hvis vi i en
Et histogram kan vi få lavet vha. en
Tilsvarende kan et QQ-plot laves med en
Benyttes til at beregne summer, gennemsnit, standardafvigelser, medianer mm.
Med en
Tilføjes en
Ekstra options kan tilføjes i
Hvordan disse options skal forstås og øvrige nyttige muligheder fremgår af nedenstående tabel.
|
Specificerer at vi ønsker resultaterne angivet med x decimaler. |
|
Antal observationer med oplyste værdier |
|
Antal observationer med manglende værdier |
|
Median |
|
Mindste værdi (minimum) |
|
Største værdi (maximum) |
|
Variationsbredde (maximum - minimum) |
|
Hhv. 1. og 3. kvartil (25% og 75%-fraktil) |
|
Hhv. 1%, 5%, 95% og 99%-fraktiler |
|
Sum |
|
Gennemsnit |
|
Spredning = standardafvigelse = standard deviation |
|
Varians |
|
Standard error (standard afvigelse på gennemsnittet) |
|
Konfidensinterval for middelværdien |
|
T-test størrelsen for test af hypotesen om at middelværdien er 0 |
|
P-værdien hørende til t-test størrelsen for test af hypotesen om at middelværdien er 0 |
Benyttes til at lave tabeller og diverse tests i en-, to- flervejstabeller. I video 5 gennemgik jeg
hvordan man benytter
Har man en variabel med to kategorier (feks ja/nej eller 0/1) kan man undersøge hypotesen om at sandsynligheden for succes (succes defineret som første niveau af variablen, dvs her ja eller 0) er lig en bestemt værdi. Ãnsker man feks at teste om sandsynligheden for at være mand er 0.5 (fjollet formuleret) svarende til at andelen af mænd og kvinder er