Katrín Arndís – r3

**Breyta nafni allra breyta:*

Skoða og breyta gildum breyta.

Skoða hvaða gildi breytur taka

levels(df\$variable)

Breyta hvaða gildi breytur taka í gagnasafni

levels(df\$variable) \<- c(“name”,“name”,“name”)

```

- röðun frá lægsta til hæsta, eða sömu röðun og levels eitt og sér segir. það verður að gefa ÖLLU nafn.

```

Snúa við gildum á breytu, t.d. ef það er likert kvarði

df\$variable \<- car::recode(df\$variable, “1=5; 2=4; 3=3; 4=2; 5=1”)

Sjá bara einstök gildi breytu:

unique(df\$variable)

Sjá hvað lægsta og hæsta gildi sé innan tiltekins gagnaramma eða hlutar:

range()

```

- Hér gæti ég t.d. beðið um range(vistaður_hlutur)

- Ég gæti líka skellt beint í console skipun um framkvæmd og gefa mér lægsta og hæsta gildi þar, þ.e. án þess að ég sé að búa til hlut sérstaklega fyrst.

○ range(residuals(jsi, type = ‘JSI’, fold=FALSE), na.rm=TRUE)

○ Hér er ég að biðja um lægsta og hæsta gildi fyrir “residuals” skipunina, jsi er hlutur sem er til sem ég er að biðja um residuals fyrir, na.rm=TRUE er til að ég fái ekki bara “na” í bæði hæsta og lægsta \[þetta var að gerast vegna þess að diagonal var sett þannig að ég fengi NA í stað þess að fá alltaf fullkomna fylgni diagonally\]

```

replace-a öll gildi með ákveðið value

df\$variable\[df\$variable == “INF”\] \<- 1

```

- þarna var öllum “INF” gildum skipt út fyrir 1

```

Velja bara ákveðnar tölur úr gildum breytu, t.d. fyrstu 4

df\$variable \<- substr(as.character(df\$variable),0,4)

df \<- mutate(df, variable=as.integer(str_sub(variable, start=1,end=4))

Skoða eiginleika allra breyta:

Psych::describe(df)

```

- Gefur fjölda, meðaltal, staðalfrávik, miðgildi osfrv fyrir allar breytur

```

Summary(df)

```

- Gefur upp svipað og describe

```

lapply(df, table)

```

- Gefur upp fjölda (instance, occurrence, frequency) á hverjum dálk

```

Fjöldi breyta:

Length(df)

```

- Gefur upp fjölda breyta

```

Breyta variable label á breytu

var_lab(df\$breyta) = “hún stendur fyrir þessa lýsingu”

Breyta lýsingu á gildum breytu:

val_lab(df\$breyta) = num_lab(”

1 Grunnskólastig

2 Framhaldsskólastig

3 Grunnnám á háskólastigi

4 Framhaldsnám á háskólastigi

```

“)

```

Búa til nýja breytu.

mutate: dplyr; sameinar og bætir við breytu, en heldur í gömlu breyturnar

transform: gerir svipað og mutate

transmute: dplyr; býr til breytu og hendir út gömlu breytunum.

Bæta við dálk sem inniheldur hlutfall milli tveggja annarra breyta í gagnasafninu

df \<- mutate(df, hlutfall=breyta/breyta)

mutate(): Computes and adds new variable(s). Preserves existing variables. It’s similar to the R base function transform().

transmute(): Computes new variable(s). Drops existing variables

Búa til nýja tvíkosta breytu eftir því hvort hún sé undir eða yfir median á annarri.

df\$nývariable \<- with(ifelse (variable \> median(variable), “1”,“0”), data=df)

```

- Hér tekur hún gildið 0 ef það er undir median, og 1 ef það er yfir.

```

df\$nývariable \<- ifelse(df\$variable \> median(df\$variable),1,0)

```

- tekur gildið 0 ef undir median, 1 ef það er yfir

```

df\$nývariable \<- as.numeric(df\$variable \> median(df\$variable))

```

- as.numeric breytur FALSE í 0 og TRUE í 1

```

Búa til flokkabreytu út frá gildum á annarri breytu:

df\$nývariable \<- cut(df\$variable, c(0, 60, 90,(max(df\$variable, na.rm=T) +1)), right=F)

```

- Bjó til breytu sem skiptist niður í undir 60, milli 60 og 90 og 90+

```

levels(df\$nývariable)

```

- skoða röðun

```

levels(df\$nývariable) \<- c(“lítil”, “mið”,“stór”)

```

- breyti nafni gilda.

```

Betri leið:

df\$nývariable \<- ifelse(df\$variable \< 60, “litil”, ifelse(df\$variable \<= 90 & df\$variable \>=60, “mið”,“stór”))