**Breyta nafni allra breyta:*
Skoða og breyta gildum breyta.
Skoða hvaða gildi breytur taka
levels(df\$variable)
Breyta hvaða gildi breytur taka í gagnasafni
levels(df\$variable) \<- c(“name”,“name”,“name”)
```
- röðun frá lægsta til hæsta, eða sömu röðun og levels eitt og sér segir. það verður að gefa ÖLLU nafn.
```
Snúa við gildum á breytu, t.d. ef það er likert kvarði
df\$variable \<- car::recode(df\$variable, “1=5; 2=4; 3=3; 4=2; 5=1”)
Sjá bara einstök gildi breytu:
unique(df\$variable)
Sjá hvað lægsta og hæsta gildi sé innan tiltekins gagnaramma eða hlutar:
range()
```
- Hér gæti ég t.d. beðið um range(vistaður_hlutur)
- Ég gæti líka skellt beint í console skipun um framkvæmd og gefa mér lægsta og hæsta gildi þar, þ.e. án þess að ég sé að búa til hlut sérstaklega fyrst.
○ range(residuals(jsi, type = ‘JSI’, fold=FALSE), na.rm=TRUE)
○ Hér er ég að biðja um lægsta og hæsta gildi fyrir “residuals” skipunina, jsi er hlutur sem er til sem ég er að biðja um residuals fyrir, na.rm=TRUE er til að ég fái ekki bara “na” í bæði hæsta og lægsta \[þetta var að gerast vegna þess að diagonal var sett þannig að ég fengi NA í stað þess að fá alltaf fullkomna fylgni diagonally\]
```
replace-a öll gildi með ákveðið value
df\$variable\[df\$variable == “INF”\] \<- 1
```
- þarna var öllum “INF” gildum skipt út fyrir 1
```
Velja bara ákveðnar tölur úr gildum breytu, t.d. fyrstu 4
df\$variable \<- substr(as.character(df\$variable),0,4)
df \<- mutate(df, variable=as.integer(str_sub(variable, start=1,end=4))
Skoða eiginleika allra breyta:
Psych::describe(df)
```
- Gefur fjölda, meðaltal, staðalfrávik, miðgildi osfrv fyrir allar breytur
```
Summary(df)
```
- Gefur upp svipað og describe
```
lapply(df, table)
```
- Gefur upp fjölda (instance, occurrence, frequency) á hverjum dálk
```
Fjöldi breyta:
Length(df)
```
- Gefur upp fjölda breyta
-
```
Breyta variable label á breytu
var_lab(df\$breyta) = “hún stendur fyrir þessa lýsingu”
Breyta lýsingu á gildum breytu:
val_lab(df\$breyta) = num_lab(”
1 Grunnskólastig
2 Framhaldsskólastig
3 Grunnnám á háskólastigi
4 Framhaldsnám á háskólastigi
```
“)
```
Búa til nýja breytu.
mutate: dplyr; sameinar og bætir við breytu, en heldur í gömlu breyturnar
transform: gerir svipað og mutate
transmute: dplyr; býr til breytu og hendir út gömlu breytunum.
Bæta við dálk sem inniheldur hlutfall milli tveggja annarra breyta í gagnasafninu
df \<- mutate(df, hlutfall=breyta/breyta)
mutate(): Computes and adds new variable(s). Preserves existing variables. It’s similar to the R base function transform().
transmute(): Computes new variable(s). Drops existing variables
Búa til nýja tvíkosta breytu eftir því hvort hún sé undir eða yfir median á annarri.
df\$nývariable \<- with(ifelse (variable \> median(variable), “1”,“0”), data=df)
```
- Hér tekur hún gildið 0 ef það er undir median, og 1 ef það er yfir.
```
df\$nývariable \<- ifelse(df\$variable \> median(df\$variable),1,0)
```
- tekur gildið 0 ef undir median, 1 ef það er yfir
```
df\$nývariable \<- as.numeric(df\$variable \> median(df\$variable))
```
- as.numeric breytur FALSE í 0 og TRUE í 1
```
Búa til flokkabreytu út frá gildum á annarri breytu:
df\$nývariable \<- cut(df\$variable, c(0, 60, 90,(max(df\$variable, na.rm=T) +1)), right=F)
```
- Bjó til breytu sem skiptist niður í undir 60, milli 60 og 90 og 90+
```
levels(df\$nývariable)
```
- skoða röðun
```
levels(df\$nývariable) \<- c(“lítil”, “mið”,“stór”)
```
- breyti nafni gilda.
```
Betri leið:
df\$nývariable \<- ifelse(df\$variable \< 60, “litil”, ifelse(df\$variable \<= 90 & df\$variable \>=60, “mið”,“stór”))