pengenalan r

20
Bab 1 Pengenalan Dasar Dari R 1.1 Pendahuluan Software R adalah suatu sistem untuk melakukan analisis statistik dan grafik yang pertama kali dibuat oleh Ross Ihaka dan Robert Gentleman dari Statisti- cs Department of the University of Auckland, New Zealand, pada tahun 1992. R merupakan suatu software sekaligus bahasa pemrograman, dan merupakan salah satu ?dialek? dari bahasa S. Secara umum, sintaks dari bahasa R ada- lah ekuivalen dengan paket statistik Splus, sehingga sebagian besar keperluan analisis statistika, dan pemrograman dengan R adalah hampir identik dengan perintah yang dikenal di Splus. R sampai saat ini merupakan hasil kolaborasi seluruh kontributor yang bera- sal dari seluruh dunia, karena sifatnya yang open source open source dan gratis. R diasuh dan dikembangkan oleh komunitas pengembang/developer. R bersifat multiplatform, tersedia dalam berbagai versi OS Windows, Unix, dan Mac OS. R sangat berguna dari masalah yang sederhana hingga paling kompleks, serta bisa digunakan dalam pekerjaan analisa data. 1.1.1 Instalasi R Untuk menginstal R pertama kali, diperlukan file instalasi binary sebagai base distribution yang bisa diunduh pada alamat berikut: http://cran.r-project.org/bin/windows/base/ Untuk sistem operasi Windows maka pilihlah file instalasi binary versi R untuk Windows, yaitu R-3.1.3-win.exe. 1.1.2 R Session Sebuah R session terdiri dari langkah memulai R, menggunakan R untuk beker- ja/analisa dan kemudian penutupan R (gunakan fungsi q()). Dalam pengguna- an R kita akan banyak menggunakan fungsi-fungsi yang terdapat di R. Fungsi (function) adalah sebuah program kecil yang dapat dijalankan untuk tujuan tertentu. 5

Upload: desticc

Post on 13-Feb-2016

53 views

Category:

Documents


2 download

DESCRIPTION

pengenalan program R

TRANSCRIPT

Page 1: Pengenalan R

Bab 1

Pengenalan Dasar Dari R

1.1 Pendahuluan

Software R adalah suatu sistem untuk melakukan analisis statistik dan grafikyang pertama kali dibuat oleh Ross Ihaka dan Robert Gentleman dari Statisti-cs Department of the University of Auckland, New Zealand, pada tahun 1992.R merupakan suatu software sekaligus bahasa pemrograman, dan merupakansalah satu ?dialek? dari bahasa S. Secara umum, sintaks dari bahasa R ada-lah ekuivalen dengan paket statistik Splus, sehingga sebagian besar keperluananalisis statistika, dan pemrograman dengan R adalah hampir identik denganperintah yang dikenal di Splus.

R sampai saat ini merupakan hasil kolaborasi seluruh kontributor yang bera-sal dari seluruh dunia, karena sifatnya yang open source open source dan gratis.R diasuh dan dikembangkan oleh komunitas pengembang/developer. R bersifatmultiplatform, tersedia dalam berbagai versi OS Windows, Unix, dan Mac OS.

R sangat berguna dari masalah yang sederhana hingga paling kompleks,serta bisa digunakan dalam pekerjaan analisa data.

1.1.1 Instalasi R

Untuk menginstal R pertama kali, diperlukan file instalasi binary sebagai basedistribution yang bisa diunduh pada alamat berikut:

http://cran.r-project.org/bin/windows/base/

Untuk sistem operasi Windows maka pilihlah file instalasi binary versi R untukWindows, yaitu R-3.1.3-win.exe.

1.1.2 R Session

Sebuah R session terdiri dari langkah memulai R, menggunakan R untuk beker-ja/analisa dan kemudian penutupan R (gunakan fungsi q()). Dalam pengguna-an R kita akan banyak menggunakan fungsi-fungsi yang terdapat di R. Fungsi(function) adalah sebuah program kecil yang dapat dijalankan untuk tujuantertentu.

5

Page 2: Pengenalan R

6 BAB 1. PENGENALAN DASAR DARI R

1.1.3 RStudio

RStudio merupakan suatu Integrated Development Environment (IDE) untuk R.Sebagaimana R, RStudio juga bersifat gratis dan open sorce. RStudio tersediadalam dua edisi, yaitu: RStudio Desktop dan RStudio Server.

RStudio Desktop berjalan secara lokal di komputer, sebagaimana aplikasidesktop biasa lainnya. Sedangkan RStudio Server berjalan pada remote Linuxserver dan bisa diakses dan dijalankan oleh komputer lainnya melalui jaringan.

Distribusi prepackaged RStudio tersedia untuk sistem operasi Microsoft Win-dows, Mac OS X, dan Linux. RStudio bisa diunduh di website berikut:

https://www.rstudio.com/products/RStudio/

Sebagai suatu IDE, tampilan RStudio tentu relatif lebih user friendly, seper-ti terlihat pada gambar berikut.

Gambar 1.1: Tampilan RStudio

1.2 Dasar-dasar R

1.2.1 R sebagai Calculator

Fungsi paling sederhana dari R adalah sebagai kalkulator. Silahkan input kodeberikut ini ke dalam R Console

> 5 - 1 + 10 # add and subtract

[1] 14

> 7 * 10 / 2 # multiply and divide

[1] 35

> pi # the constant pi

[1] 3.141593

> sqrt(2) # square root

Page 3: Pengenalan R

1.2. DASAR-DASAR R 7

[1] 1.414214

> exp(1) # e to the power of 1

[1] 2.718282

1.2.2 Assignments

Dalam R kita dapat memasukkan satu atau lebih nilai kepada sebuah object(ingat R adalah Object Oriented Programming). Berikut contoh untuk mem-berikan sebuah nilai kepada sebuah objek:

> x <- 5 # The object (variable) x holds the value 5

> x # print x

[1] 5

> 6 -> x # x now holds the value 6

> x

[1] 6

> (x <- pi) # assign the constant pi and print x

[1] 3.141593

>

1.2.3 Menjalankan Fungsi di R

R memiliki berbagai fungsi dan kita dapat mengeksekusi fungsi tersebut denganmemasukkan nama fungsi tersebut dengan diikuti oleh kurung buka/tutup.

> print(x) # print() is a function. It prints its argument, x

[1] 3.141593

> ls() # lists the objects in memory

[1] "x"

> rm(x) # remove x from memory

>

Perhatikan bahwa R memiliki banyak sekali fungsi. Sehingga ketika kitahendak membuat sebuah objek (misalkan x pada contoh sebelumnya) makahindari nama object yang sama denga nama fungsi yang telah ada. MisalkanR memiliki fungsi c() maka jangan gunakan nama objek c. Untuk mengetahuiapakah fungsi dengan nama objek yang diinginkan telah ada cukup masukannama objek dan kemudian enter. Contoh:

> t

function (x)

UseMethod("t")

<bytecode: 0x0000000007cb6c78>

<environment: namespace:base>

Dalam hal ini t adalah sebuah fungsi untuk mendapatkan transpose darisebuah matriks, sehingga jangan membuat object dengan nama t.

Page 4: Pengenalan R

8 BAB 1. PENGENALAN DASAR DARI R

1.2.4 Fungsi-fungsi Sederhana

Terdapat banyak sekali fungsi dalam R, sehingga tidak memungkinkan dimuatdisini semua. Namun yang utama adalah kita mengenal fungsi dasar matematika(log, exp,log10, log2, sin, cos, tan, asin, acos, atan, abs, sqrt, . . . ), dan fungsi-fungsi khusus statistik (rnorm, gamma, digamma, beta, besselI, . . . ).

Selain itu terdapat pula fungsi-fungsi sederhana lainnya, berikut ini adalahbeberapa di antaranya.

sum(x) sum of the elements of x

prod(x) product of the elements of x

max(x) maximum of the elements of x

min(x) minimum of the elements of x

which.max(x) returns the index of the greatest element of x

which.min(x) returns the index of the smallest element of x

range(x) id. than c(min(x), max(x))

length(x) number of elements in x

mean(x) mean of the elements of x

median(x) median of the elements of x

var(x) atau cov(x) variance of the elements of x (calculated on n-1);

if x is a matrix or a data frame, the variance-covariance matrix is calculated

cor(x) correlation matrix of x if it is a matrix or a data

frame (1 if x is a vector)

1.3 Objek

1.3.1 Tipe Objek di dalam R

R bekerja dengan objek, semua entitas R termasuk fungsi dan struktur data me-rupakan objek dalam R. Objek-objek tersebut mempunyai karakteristik nama,konten, serta atribut yang menspesifikasikan tipe data yang direpresentasikanoleh objek tersebut.

Semua objek dalam R memiliki dua atribut intrinsik, yaitu mode dan length.Mode menunjukkan tipe dasar dari elemen-elemen objek dan length menunjukk-an banyaknya elemen yang ada dalam objek.

Berikut ini adalah tabel yang menyajikan overview untuk tipe-tipe objekyang merepresentasikan data:

Page 5: Pengenalan R

1.3. OBJEK 9

Tabel 1.1: Overview Objek dalam R

Objek Mode Apakah satu objekbisa memiliki >1 mode

vector numeric, character, complex ataulogical Tidak

factor numeric atau character Tidakarray numeric, character, complex atau

logical Tidakmatrix numeric, character, complex atau

logical Tidakdata frame numeric, character, complex

atau logical Yatime series numeric, character, complex atau

logical Tidaklist numeric, character, complex, logical,

function, expression Ya

1.3.2 Operator Aritmatika dan Logika

Operator Aritmatika dalam R menggunakan operator berikut : +, -,* , /

dan .̂Sedangkan untuk operator logika, R menggunakan & dan | untuk merepre-

sentasikan ”and” dan ”or”. Selain itu untuk membandingkan nilai kita dapatmenggunakan tanda >,>=, <,<=,== (sama dengan) dan ! = (tidak samadengan).

Contoh:

> x <- 1 : 3

> x^2

[1] 1 4 9

> 5 == 4 & 5 == 5

[1] FALSE

> 5 != 4 & 5 == 5

[1] TRUE

> 5 > 6

[1] FALSE

> 5 == 3+2

[1] TRUE

>

Page 6: Pengenalan R

10 BAB 1. PENGENALAN DASAR DARI R

1.3.3 Vektor

Vektor merupakan suatu himpunan elemen (bilangan, character atau string,logical value) satu dimensi dan merupakan representasi dari satu variabel.

Membuat Vektor

Berikut ini adalah beberapa contoh untuk membuat objek vektor:

> ## vector ##

>

> v <- 1 : 10 # membuat vektor v dengan elemen 1 s/d 10

> v

[1] 1 2 3 4 5 6 7 8 9 10

> v <- c(1, 5, 3) # (fungsi c() menggabungkan elemen-elemen menjadi

> # vektor)

> v

[1] 1 5 3

> vc1 <- c(2,5,5,3,3,6,2,3,5,6)

> vc2 <- seq(from=1, to=100, by=10) # membuat vektor dengan interval

> vc1

[1] 2 5 5 3 3 6 2 3 5 6

> vc2

[1] 1 11 21 31 41 51 61 71 81 91

>

Selain itu, kita juga bisa membuat objek menggunakan fungsi assign. Se-hingga untuk membuat objek dengan tipe vektor adalah sebagai berikut:

> assign ("vc3",seq(from=1, to=100, by=10))

> vc3

[1] 1 11 21 31 41 51 61 71 81 91

Vektor juga bisa berisi data logikal (true false) ataupun berisi karakter(string). Seperti pada contoh berikut:

> logical_vector <- c(T, TRUE, F, FALSE) #membuat vektor logikal

> logical_vector

[1] TRUE TRUE FALSE FALSE

> s <- c("Malang",'Jawa Timur')> s

[1] "Malang" "Jawa Timur"

> paste(s[1], s[2], sep =", ")

[1] "Malang, Jawa Timur"

Pada tipe objek vektor berlaku mode tunggal, sehingga jika dua data ataulebih yang memiliki mode yang berbeda maka R akan mengubah data ke modeyang lebih umum.

Page 7: Pengenalan R

1.3. OBJEK 11

Operasi pada Vektor

length dan sumFungsi length digunakan untuk mengetahui panjang suatu vektor atau de-

ngan kata lain banyaknya elemen dalam suatu vektor. Sedangkan sum digunak-an untuk menjumlahkan elemen-elemen di dalam suatu vektor.

> length(vc2)

[1] 10

> sum (v)

[1] 9

Operasi AritmatikaBerikut ini contoh-contoh operasi aritmatika pada vektor menggunakan R :

> x <- 100 : 110

> x

[1] 100 101 102 103 104 105 106 107 108 109 110

> x * 2

[1] 200 202 204 206 208 210 212 214 216 218 220

> x / 2

[1] 50.0 50.5 51.0 51.5 52.0 52.5 53.0 53.5 54.0 54.5 55.0

> x - 1

[1] 99 100 101 102 103 104 105 106 107 108 109

> x <- seq(2, 10, by = 2)

> x

[1] 2 4 6 8 10

> y <- 1 : 5

> y

[1] 1 2 3 4 5

> x / y

[1] 2 2 2 2 2

> vc1*vc2

[1] 2 55 105 93 123 306 122 213 405 546

> vc1 %*% vc2

[,1]

[1,] 1970

Page 8: Pengenalan R

12 BAB 1. PENGENALAN DASAR DARI R

Subset dan indeks Vektor

Dari suatu vektor, kita bisa mengekstrak elemen-elemen vektor tersebut menjadisuatu subset. Indeks vektor menunjukkan posisi elemen di dalam vektor.

> x <- 15 : 30

> x

[1] 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

> ## Extract 2nd and 5th element of the vector: #

>

> c(x[2], x[5])

[1] 16 19

> # or we can use this code:

>

> x[c(2, 5)]

[1] 16 19

1.3.4 Faktor

Faktor merupakan representasi dari variabel kategorik. Dalam suatu factor tidakhanya mengandung nilai yang terkait variabel kategorinya, tapi juga kemung-kinan setiap level yang ada dalam variabel tersebut, meskipun level tersebuttidak muncul dalam data.

Untuk membuat suatu factor digunakan fungsi factor berikut:factor(x, levels = sort(unique(x), na.last = TRUE),

labels = levels, exclude = NA, ordered = is.ordered(x))Contoh:

> factor(1:3)

[1] 1 2 3

Levels: 1 2 3

> factor(1:3, levels=1:5)

[1] 1 2 3

Levels: 1 2 3 4 5

> factor(1:3, labels=c("A", "B", "C"))

[1] A B C

Levels: A B C

> type <- rep(c("High","Medium","Low"),times=10)

> type <-factor(type)

> type

Page 9: Pengenalan R

1.3. OBJEK 13

[1] High Medium Low High Medium Low High Medium Low High

[11] Medium Low High Medium Low High Medium Low High Medium

[21] Low High Medium Low High Medium Low High Medium Low

Levels: High Low Medium

> grade <- rep(c("Grade1","Grade2","Grade3", "Grade4"),each=5)

> grade <-factor(grade)

> grade

[1] Grade1 Grade1 Grade1 Grade1 Grade1 Grade2 Grade2 Grade2 Grade2 Grade2

[11] Grade3 Grade3 Grade3 Grade3 Grade3 Grade4 Grade4 Grade4 Grade4 Grade4

Levels: Grade1 Grade2 Grade3 Grade4

1.3.5 Matriks

Suatu tabel yang tersusun dari beberapa vektor dengan k dimensi disebut se-bagai suatu array. Sedangkan matriks adalah kasus khusus dari array dimanabanyaknya dimensi atau k = 2 (array 2 dimensi). Untuk membuat suatu matriksdigunakan fungsi matriks berikut:

matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,dimnames = NULL) Contoh:

> mat <- matrix(c(2,3,1,5,4,5,6,7,2,3,1,5,4,5,6,7),nrow=4,ncol=4)

> mat

[,1] [,2] [,3] [,4]

[1,] 2 4 2 4

[2,] 3 5 3 5

[3,] 1 6 1 6

[4,] 5 7 5 7

> mat2 <- matrix(1:20,nrow=4,ncol=5)

> mat2

[,1] [,2] [,3] [,4] [,5]

[1,] 1 5 9 13 17

[2,] 2 6 10 14 18

[3,] 3 7 11 15 19

[4,] 4 8 12 16 20

> dim(mat2)

[1] 4 5

Operasi Matriks

Terdapat beberapa operator yang biasa digunakan untuk operasi matriks (danvektor), antara lain perkalian, invers matriks, transpose matriks dan crosspro-duct. Berikut ini adalah ringkasan dari operator-operator tersebut:

Page 10: Pengenalan R

14 BAB 1. PENGENALAN DASAR DARI R

Operator Keterangan

* perkalian skalar%*% perkalian matriks (dot product)%o% outersolve inverse matriks

t transposecrossprod cross product suatu matriks yaitu t(x) %*% x

Berikut ini beberapa contoh operasi matriks:

BindingKita bisa menggabungkan (binding) suatu matriks ke dalam matriks lain

dengan menggunakan fungsi cbind dan rbindSebagai contoh kita lakukan binding matriks mat ke matriks mat2 meng-

gunakan cbind dan matriks vc1 ke matriks mat2 menggunakan rbind sebagaiberikut:

> ## coloumn binding##

> cbind(mat2,mat)

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]

[1,] 1 5 9 13 17 2 4 2 4

[2,] 2 6 10 14 18 3 5 3 5

[3,] 3 7 11 15 19 1 6 1 6

[4,] 4 8 12 16 20 5 7 5 7

> ## row binding ##

> rbind(mat2,vc1[1:5])

[,1] [,2] [,3] [,4] [,5]

[1,] 1 5 9 13 17

[2,] 2 6 10 14 18

[3,] 3 7 11 15 19

[4,] 4 8 12 16 20

[5,] 2 5 5 3 3

Perkalian Skalar

> A <- matrix(c(1,3,2,4,8,7),ncol=3)

> A

[,1] [,2] [,3]

[1,] 1 2 8

[2,] 3 4 7

> 8*A

[,1] [,2] [,3]

[1,] 8 16 64

[2,] 24 32 56

Page 11: Pengenalan R

1.3. OBJEK 15

TransposeTranspose matriks dalam R menggunakan fungsi t(nama-matriks).

> t(mat2)

[,1] [,2] [,3] [,4]

[1,] 1 2 3 4

[2,] 5 6 7 8

[3,] 9 10 11 12

[4,] 13 14 15 16

[5,] 17 18 19 20

Matriks Diagonal

> diag(c(1,4,7,9))

[,1] [,2] [,3] [,4]

[1,] 1 0 0 0

[2,] 0 4 0 0

[3,] 0 0 7 0

[4,] 0 0 0 9

> diag(mat)

[1] 2 5 1 7

Penjumlahan Matriks

> A

[,1] [,2] [,3]

[1,] 1 2 8

[2,] 3 4 7

> B <- matrix(c(5,8,3,4,2,7),ncol=3,byrow=T)

> A+B

[,1] [,2] [,3]

[1,] 6 10 11

[2,] 7 6 14

> rowMeans(A)

[1] 3.666667 4.666667

> colMeans(A)

[1] 2.0 3.0 7.5

Perkalian Matriks(Dot Product)

> A1 <- matrix(c(1,3,2,2,8,9),ncol=2)

> B1 <- matrix(c(5,8,4,2), ncol=2)

> A1

Page 12: Pengenalan R

16 BAB 1. PENGENALAN DASAR DARI R

[,1] [,2]

[1,] 1 2

[2,] 3 8

[3,] 2 9

> B1

[,1] [,2]

[1,] 5 4

[2,] 8 2

> A1 %*% B1

[,1] [,2]

[1,] 21 8

[2,] 79 28

[3,] 82 26

Determinant Matriks

> D <- matrix(c(5,8,4,2,5,6,7,8,9), ncol=3)

> det(D)

[1] 101

Inverse Matriks

> A <- matrix(c(1,3,2,4),ncol=2,byrow=T)

> A

[,1] [,2]

[1,] 1 3

[2,] 2 4

> #invers#

> B <- solve(A)

> B

[,1] [,2]

[1,] -2 1.5

[2,] 1 -0.5

1.3.6 Data Frame

Data frame adalah suatu tabel yang dibentuk dari satu atau lebih vektor dan/ataudengan length yang sama tapi dengan mode yang berbeda. Data frame bisadibuat secara implisit menggunakan fungsi read.table atau kita juga bisa meng-gunakan fungsi data.frame.

> Data1 <- data.frame( X=c( vc1, vc2), grade, sex=rep(c("male",

+ "female"),each=10))

> Data1

Page 13: Pengenalan R

1.3. OBJEK 17

X grade sex

1 2 Grade1 male

2 5 Grade1 male

3 5 Grade1 male

4 3 Grade1 male

5 3 Grade1 male

6 6 Grade2 male

7 2 Grade2 male

8 3 Grade2 male

9 5 Grade2 male

10 6 Grade2 male

11 1 Grade3 female

12 11 Grade3 female

13 21 Grade3 female

14 31 Grade3 female

15 41 Grade3 female

16 51 Grade4 female

17 61 Grade4 female

18 71 Grade4 female

19 81 Grade4 female

20 91 Grade4 female

> head(Data1)

X grade sex

1 2 Grade1 male

2 5 Grade1 male

3 5 Grade1 male

4 3 Grade1 male

5 3 Grade1 male

6 6 Grade2 male

> tail(Data1)

X grade sex

15 41 Grade3 female

16 51 Grade4 female

17 61 Grade4 female

18 71 Grade4 female

19 81 Grade4 female

20 91 Grade4 female

> class (Data1)

[1] "data.frame"

> dim(Data1)

[1] 20 3

> Data1[ Data1$sex=="male",]

Page 14: Pengenalan R

18 BAB 1. PENGENALAN DASAR DARI R

X grade sex

1 2 Grade1 male

2 5 Grade1 male

3 5 Grade1 male

4 3 Grade1 male

5 3 Grade1 male

6 6 Grade2 male

7 2 Grade2 male

8 3 Grade2 male

9 5 Grade2 male

10 6 Grade2 male

> Data1[ Data1$X > 80,]

X grade sex

19 81 Grade4 female

20 91 Grade4 female

>

1.3.7 List

List adalah suatu vektor terurut dari sekumpulan komponen. Setiap komponendapat berupa sembarang data objek, yaitu vektor, matriks, data frame, ataudata list sendiri. Tiap komponen pada data list dapat mempunyai length danmode yang berbeda. Untuk membentuk suatu list, bisa menggunakan cara yangsama dengan membuat data frame, hanya fungsi yang digunakan adalah list.

Contoh:

> ## List ##

>

> myList <- list(vc1, vc2, 5,6,"seven", mat,mat2)

> myList

[[1]]

[1] 2 5 5 3 3 6 2 3 5 6

[[2]]

[1] 1 11 21 31 41 51 61 71 81 91

[[3]]

[1] 5

[[4]]

[1] 6

[[5]]

[1] "seven"

[[6]]

Page 15: Pengenalan R

1.4. MANAJEMEN DATA 19

[,1] [,2] [,3] [,4]

[1,] 2 4 2 4

[2,] 3 5 3 5

[3,] 1 6 1 6

[4,] 5 7 5 7

[[7]]

[,1] [,2] [,3] [,4] [,5]

[1,] 1 5 9 13 17

[2,] 2 6 10 14 18

[3,] 3 7 11 15 19

[4,] 4 8 12 16 20

> class (myList)

[1] "list"

1.4 Manajemen Data

1.4.1 Input Data

Untuk menginput data secara manual. maka buatlah terlebih dahulu suatu da-ta frame kosong. Kemudian dengan fungsi edit(data-frame), maka akan munculjendela data editor, dan inputlah data secara manual.

> data1 <- data.frame(NULL)

> edit(data1)

Gambar 1.2: Jendela data editor

Page 16: Pengenalan R

20 BAB 1. PENGENALAN DASAR DARI R

1.4.2 Membaca Data dalam File

Dalam membaca dan menulis file, R menggunakan working directory. Untukmengetahui working directory yang sedang digunakan, gunakan perintah ge-twd(). Working directory ini bisa dirubah menggunakan perintah setwd(pathdirectory).

Contoh:

> setwd("D:/PKMKS/modul_R/Template")

R bisa membaca data yang disimpan sebagai file teks (ASCII) menggunakanfungsi read.table, scan, dan read.fwf. Fungsi read.table memiliki beberapa vari-asi yaitu: read.csv, dan read.delim.

Opsi penggunaan fungsi read.table diberikan sebagai berikut:

read.table(file, header = FALSE, sep = ””, quote = ”̈’”, dec = ”.”, row.names,col.names, as.is = FALSE, na.strings = ”NA”,colClasses = NA,nrows = -1, skip = 0,check.names = TRUE, fill = !blank.lines.skip,

strip.white = FALSE, blank.lines.skip = TRUE,comment.char = ””)

Contoh:

> ## txt file ##

>

>

> mydata <- read.table("C:/Users/Administrator/Documents/exampleData/data1.txt",

+ header=TRUE)

> mydata

Object JKel Weights

1 A 1 75

2 B 2 45

3 C 2 40

4 D 1 64

5 E 1 69

6 F 2 49

> ## Csv file ##

> chik <- read.csv("C:/Users/Administrator/Documents/exampleData/chickenData.csv")

> head(chik)

X weight feed

1 1 179 horsebean

2 2 160 horsebean

3 3 136 horsebean

4 4 227 horsebean

5 5 217 horsebean

6 6 168 horsebean

Jika file berada dalam working directory, maka tidak perlu menuliskan path-nya, cukup nama filenya saja. Sedangkan untuk membaca data secara langsungdari internet adalah sebagai berikut:

Page 17: Pengenalan R

1.4. MANAJEMEN DATA 21

> ## Data dari Internet ##

>

> bindata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")

> head(bindata)

Jika fungsi read.table akan menghasilkan suatu data frame, sehingga tujuanutamanya adalah untuk membaca data dalam bentuk tabular. Sedangkan fungsiscan lebih fleksibel, kita bisa menentukan mode dari variabel-variabel yang kitaimpor.

Opsi penggunaan fungsi scan diberikan sebagai berikut:

scan(file = ””, what = double(0), nmax = -1, n = -1, sep = ””,quote = if (sep==””) ”” else ”’”̈, dec = ”.”,skip = 0,nlines = 0, na.strings = ”NA”,flush = FALSE, fill = FALSE,strip.white = FALSE, quiet = FALSE,blank.lines.skip = TRUE,multi.line = TRUE, comment.char = ””,allowEscapes = TRUE)

Contoh:

> mydata2 <- scan("C:/Users/Administrator/Documents/exampleData/data2.txt",

+ what = list("", 0, 0))

> mydata2

[[1]]

[1] "A" "B" "C" "D" "E" "F"

[[2]]

[1] 1 2 2 1 1 2

[[3]]

[1] 75 45 40 64 69 49

Sementara itu fungsi read.fwf digunakan untuk membaca/mengimpor filedengan data yang memiliki format fixed width.

1.4.3 Menyimpan Data kedalam File

Untuk menyimpan data dari R ke dalam suatu file, kita bisa menggunakanfungsi write.table. Opsi dan argumen dari fungsi tersebut secara lengkap adalahsebagai berikut:

write.table(x, file = ””, append = FALSE, quote = TRUE, sep = ” ”, eol= ””, na = ”NA”, dec = ”.”, row.names = TRUE, col.names = TRUE, qme-thod = c(”escape”, ”double”))

Contoh berikut ini kita akan menyimpan data chickwts, yang sebelumnya ki-ta load terlebih dahulu, kemudian kita simpan ke dalam file. (Data chickwtsmerupakan data built-in).

> ## list available data in R #

> # data()

Page 18: Pengenalan R

22 BAB 1. PENGENALAN DASAR DARI R

>

> ### Working with available Data sets (built in)##

>

> # load data chicken (available from base)

> data(chickwts)

> ## view the first few rows of the data

>

> head(chickwts)

weight feed

1 179 horsebean

2 160 horsebean

3 136 horsebean

4 227 horsebean

5 217 horsebean

6 168 horsebean

> summary(chickwts)

weight feed

Min. :108.0 casein :12

1st Qu.:204.5 horsebean:10

Median :258.0 linseed :12

Mean :261.3 meatmeal :11

3rd Qu.:323.5 soybean :14

Max. :423.0 sunflower:12

> write.csv(chickwts,file="chickenData.csv")

> write.table(chickwts,file="chickenData.txt")

1.4.4 Import Data Eksternal

Dalam R kita juga bisa mengimport data dalam format paket statistika yanglain, antara lain Minitab, SPSS, SAS, S+, Stata, Systat, dan Epi In-fo. Untuk mengimport data dengan format tersebut, kita memerlukan packagetambahan, yaitu package foreign.

> ## Memerlukan tambahan package foreign ##

> require(foreign)

> # SPSS files

>

> dat.spss <- read.spss("hsb2.sav",to.data.frame=TRUE)

> head(dat.spss)

> # Stata files

> dat.dta <- read.dta("hsb2.dta")

> head(dat.dta)

1.5 Bantuan serta Dokumentasi

R memberikan bantuan yang sangat lengkap mengenai fungsi-fungsi yang terse-dia untuk setiap package yang sudah di-load. Kita bisa menampilkan halamanbantuan dengan menggunakan perintah berikut:

Page 19: Pengenalan R

1.5. BANTUAN SERTA DOKUMENTASI 23

> ## menampilkan bantuan tentang fungsi rnorm ##

>

> help (rnorm)

> ## menampilkan bantuan tentang fungsi cor ##

>

> ?cor

> ## menampilkan contoh penggunaan fungsi cor ##

> example (cor)

Dengan memanggil bantuan, maka akan terbuka jendela bantuan, yang berisiinformasi tentang package terkait beserta contohnya

Page 20: Pengenalan R

24 BAB 1. PENGENALAN DASAR DARI R