[suhartono] analisis data statistik dengan r

Upload: fathurohman-ocimh

Post on 14-Oct-2015

467 views

Category:

Documents


202 download

TRANSCRIPT

  • SUHARTONO

    2008 Lab. Statistik Komputasi, ITS, Surabaya

    ANALISISDATASTATISTIK

    DENGANR

  • sht90 Dedicatedto

    ii

    When the Lord created the world and people to live in it an enterprise which, according to modern science, took a very long time I could well imagine that He reasoned with Himself as follows: If I make everything predictable, these human beings, whom I have endowed with pretty good brains, will undoubtedly learn to predict everything, and they will thereupon have no motive to do anything at all, because they will recognize that the future is totally determined and cannot be influenced by any human action. On the other hand, if I make everything unpredictable, they will gradually discover that there is no rational basis for any decision whatsoever and, as in the first case, they will thereupon have no motive to do anything at all. Neither scheme would make sense. I must therefore create a mixture of the two. Let some things be predictable and let others be unpredictable. They will then, amongst many other things, have the very important task of finding out which is which.

    Small Is Beautiful E.F.SCHUMACHER

    Untuk Azizah, Alivia, Vanissa

  • sht90 KataPengantar

    iii

    KATAPENGANTAR

    R adalah suatu sistem untuk analisis data yang termasuk kelompok softwarestatistik open source yang tidakmemerlukan lisensi atau gratis, yang dikenal denganfreeware. Sampai saat ini,pengguna statistikadi Indonesiamasihbelumbanyak yangmenggunakan R untuk keperluan analisis data. Sebagian besar pengguna statistika diIndonesiamasihmenggunakan paketpaket statistik komersil, seperti SPSS,MINITAB,Splus,SAS,atauEviews.SalahsatufaktorpenyebabnyaadalahmasihterbatasnyabukutentangRyangditerbitkandalambahasaIndonesia.

    Buku ini bukanmerupakan suatu buku teks tentang teoriteori dalam analisisstatistik,tetapilebihmerupakanbukuterapantentangmetodemetodestatistikdenganpenggunaanR.Tujuanpenulisanbuku ini adalahuntukmenunjukkanbagaimana caramelakukan analisis data statistik dengan menggunakan R. Dalam hal ini, ditunjukkanbagaimanaRsebagaisuatupaketstatistikyangpowerfuldanmenyediakansistemgrafikyang baik untuk mendukung analisis. Jika proses perhitungan dalam analisis datamenjadimudah,makaenergidaripenggunastatistikadiharapkandapatlebihdifokuskanpadapemahamantentangdatayangdianalisis.

    Buku iniditujukanuntukpenggunaRsecaraumumsebagaipetunjukpengantarpemakaian R untuk analisis data statistik. Selain itu, buku ini juga diharapkan dapatdipakaidikelaskelaspadapengajaranstatistikabaikdi leveldasarataupun level lanjutdenganteknikteknikanalisisstatistiktertentu.SaatinibukuinidigunakansebagaisalahsatureferensipadamatakuliahAnalisisData Idan IIdiProgramSarjana(S1)danmatakuliah Analisis Data di Program Magister (S2) Jurusan Statistika, Institut TeknologiSepuluhNopember(ITS),Surabaya.

    PaketRmemilikifasilitasyangsangatbanyakuntukanalisisdatastatistik,mulaidarimetode yang klasik sampai dengan yangmodern. Pada Bab 1 diuraikan tentangpaketstatistikR,yaitutentangsejarahsingkat,caramemperolehdanmenginstal,sertafasilitasRGUI (GraphicalUser Interface) atauRCommanderdan caramenginstalnya.Bab2dan3membahastentangmanajemendatadiR,khususnyadenganmenggunakanfasilitasdiRCommanderdanperintahlangsungdiRConsole.

    AnalisisgrafikpadaRdijelaskanpadaBab4,khususnyapenggunaan fasilitasdiRCommander.PadaBab5dibahastentangpenggunaanfasilitasdiRCommanderuntukperhitungan fungsi distribusi peluang, yang mencakup perhitungan peluang padadistribusikontinudandiskrit.BahasantentanganalisisstatistikdeskriptifdijelaskanpadaBab 6. Pada Bab 7 dijelaskan tentang penggunaan fasilitas di RCommander untukanalisisstatistik inferensi,yangmencakupujihipotesistentangratarata,proporsi,danvarians.DalamBab8dibahastentanganalisisregresi linear.Padabagianakhirdaribabini diberikan ringkasan beberapa perintah dan library yang berkaitan dengan analisisregresi.

  • sht90 KataPengantar

    iv

    Bahasan tentang penggunaan fasilitas di RCommander untuk model lineartergeneralisir(GLM)dijelaskanpadaBab9.DalamBab10dibahastentanganalisisgrafikdengan menggunakan perintah langsung di RConsole atau command line. Bab 11membahastentangpenggunaanRuntukanalisisruntunwaktu.Dalambab iniadatigasubbabutama tentangmodelmodeldalamanalisis runtunwaktuyangdibahas,yaitumodel tren linear,modeleksponensial smoothing,danmodelARIMA.Diakhirbab inidiberikanpula ringkasanbeberapaperintahdan libraryyangberkaitandengananalisisruntunwaktu.

    PadaBab12dijelaskan tentangpenggunaanRuntuk analisismultivariat, yangmencakuptentangAnalisisFaktor,AnalisisDiskriminan,danAnalisisCluster.DalamBab13 dijelaskan tentang model regresi nonparametrik dan estimasi densitas. Fokuspembahasan adalah pada regresi dengan kernel dan spline. Di akhir bab ini jugadiberikanringkasanbeberapaperintahdanlibraryyangberkaitandenganaplikasikerneldanspline.

    Selanjutnya,padaBab14dibahastentangmodelnonlinear.Dalambab inijugadibahas tentang beberapa uji statistik untuk deteksi hubungan nonlinear, yaitu UjiRamseysRESET,UjiWhite,danUjiTerasvirta.Padaakhirnya,dalamBab15dijelaskantentangpengantarpemrogramandiR.

    Padakesempatan ini,penulismengucapkanterimakasihyangsebesarbesarnyakepadadosendosenpenulisyangtelahbanyakmenginspirasiperkembanganakademikpenulis, khususnyaDrs. Kresnayana Yahya,M.Sc. dan Ir.DwiatmonoA.W.,M.Ikom.selamapenulismenempuhS1diITSSurabaya,Prof.T.SubbaRaodanDr.JingsongYuandari Department ofMathematics, University ofManchester,United Kingdom, selamapenulismenempuhS2,danProf.Subanar,Ph.D.selamapenulismenempuhS3diUGMYogyakarta. Penulis juga mengucapkan banyak terima kasih kepada kolegakolegaakademik penulis yang telah banyak membantu dalam proses penulisan buku ini,khususnyaR.MohamadAtok, S.Si.,M.Si.danWahyuWibowo, S.Si.,M.Si.Akhirnya,penulisjugamengucapkanbanyakterimakasihkepadamahasiswa/ipenulis,khususnyamahasiswa/i S1 Statistika 2005 yang telah melakukan download paket dan library Rsecarabersamasamasehinggabanyaklibrary(hampir1000library)yangsekarangtelahtersediadandapatdiaktifkan.

    Masukandanumpanbalikdaripembacasangatdiharapkanuntukperbaikan isibuku ini.Pembacadapatmengirimkansarandankritikmelaluiemailkealamatpenulis,yaitu [email protected] atau [email protected]. Semoga buku inidapatmemberikanmanfaat,khususnyabagiperkembangan ilmustatistikadi Indonesiadansecaraumumbagiparapembaca.

    Surabaya,29September2008Penulis,

    Suhartono

  • sht90 DaftarIsi

    v

    DAFTARISI

    hal.KATAPENGANTAR iv

    DAFTARISI vi

    BAB1.PAKETSTATISTIKR 1

    1.1Pendahuluan 1 1.2 SejarahSingkatR 1 1.3CaraMemperolehR,PaketdanLibrary 1 1.4InstalasiRdalamSistemOperasiWindows 2 1.5GUIRCommanderdanInstalasinyadalamSistemOperasiWindows 4 1.6ManajemenDirektoriKerjadiR 6 1.7Fasilitashelp 10 1.7.1Mencarihelpdarisuatuperintah(command)tertentu 10 1.7.2Menggunakanhelpsearchengine 12 1.7.3OnlineSearchEngine 15

    BAB2.MANAJEMENDATADIPAKETR 16

    2.1DataEntrymenggunakanRGuidenganRCommander 16 2.2 MenampilkandatayangsedangaktifdiRCommander 19 2.3 EditingdatadiRCommander 20 2.4 ImportingdatadiRCommander 20 2.4.1ImportingdatafileExceldiRCommander 20 2.4.2ImportingdatafileSPSSdiRCommander 22 2.4.3ImportingdatafileMINITABdiRCommander 22

    2.5 Memilihdatasetyangaktif 24 2.6 Transformasidatasetataupengaturanvariabelpadadataset 25 2.6.1Recodeataukodeulangpeubah 25 2.6.2Computeatauhitungpeubahbaru 27

    BAB3.MANAJEMENDATADIRDENGANCOMMANDLINE 29

    3.1JenisjenisDataObjek 30 3.1.1DataArraySatuDimensiatauDataVektor 30 3.1.2DataMatriks 31 3.1.3DataFrame 34 3.1.4DataList 37

    3.2 ImportingDatapadaCommandLine 38 3.2.1MembacaFileASCII 38 3.2.2ImportingDataFileExcel 39 3.2.3ImportingDatadariPaketStatistik 41

  • sht90 DaftarIsi

    vi

    BAB4.GRAFIKMENGGUNAKANRCommander 43

    4.1GrafikdalamRGUI 45 4.2 GrafikHistogram 46 4.3 DiagramDahandanDaun(StemandLeaf) 48 4.4 GrafikBoxPlot 50 4.5 GrafikQQPlot 51 4.6 GrafikDiagramPencar(ScatterPlot) 53 4.7 GrafikPlotRatarata(Mean) 55 4.8 DiagramBatang(BarChart) 56 4.9 DiagramLingkaran(PieChart) 57 4.10PlotIndeks 58

    BAB5.FUNGSIDISTRIBUSIPELUANGDIRCommander 61

    5.1FungsiDistribusiKontinu 62 5.1.1MenghitungKuantildariDistribusiNormal 62 5.1.2MenghitungPeluangdariDistribusiNormal 64 5.1.3MembuatPlotdariDistribusiNormal 65 5.1.4MembangkitkanDatadariDistribusiNormal 67

    5.2FungsiDistribusiDiskrit 70 5.2.1MenghitungKuantildariDistribusiBinomial 71 5.2.2MenghitungPeluangdariDistribusiBinomial 72 5.2.3MembuatPlotdariDistribusiBinomial 74 5.2.4MembangkitkanDatadariDistribusiBinomial 76

    BAB6.STATISTIKDESKRIPTIFMENGGUNAKANRCommander 80

    6.1RingkasanNumerik(Summary) 81 6.1.1RingkasanNumerikdariSemuaVariabel 81 6.1.2RingkasanNumerikuntukSuatuVariabel 83

    6.2 DistribusiFrekuensi 85 6.3 TabelStatistika 86 6.4 MatriksKorelasi 88 6.5 UjiKorelasi 89 6.6 UjiKenormalanShapiroWilk 91 6.7 TabelKontingensiDuaArah 92 6.8 EntryLangsungDataFrekuensiuntukTabelKotingensiDuaArah 94

    BAB7.STATISTIKINFERENSIMENGGUNAKANRCommander 97

    7.1PengujianRatarata(Mean) 99 7.1.1PengujianRataratasampeltunggal 99 7.1.2PengujianPerbedaanRatarataDuasampelsalingbebas 102 7.1.3PengujianPerbedaanRatarataSampelBerpasangan 107

  • sht90 DaftarIsi

    vii

    7.1.4AnalisisVarianssatuarah(OnewayANOVA) 110 7.1.5AnalisisVariansduaarah(MultiwayANOVA) 115

    7.2PengujianKesamaanVariansi 118 7.2.1PengujianKesamaanDuaVariansi 118 7.2.2UjiBartlett 120 7.2.3UjiLevene 121

    7.3PengujianProporsi 122 7.3.1PengujianProporsiSampelTunggal 123 7.3.2PengujianProporsiDuaSampel 125

    BAB8.ANALISISREGRESIMENGGUNAKANRCommander 128

    8.1RegresiLinear 128 8.2ModelLinear 132 8.3CekDiagnosaKesesuaianModelRegresiLinear 137 8.4 Rangkumanperintahdanlibraryyangberkaitandengan AnalisisRegresi 144

    BAB9.GENERALIZEDLINEARMODELMENGGUNAKANRCommander 158

    9.1PengantarTeoriModelLinearTergeneralisir 158 9.2ContohKasusModelLinearTergeneralisirdenganRCommander 161

    BAB10.GRAFIKMENGGUNAKANRCLI 166

    10.1 FungsifungsiPlotUtama 168 10.1.1Perintahplot() 168 10.1.2 Perintahqqnorm(x),qqline(x),qqplot(x,y) 172 10.1.3 Perintahhist(x) 176 10.1.4 Perintahimage(x,y,z,),contour(x,y,z,),persp(x,y,z,) 177 10.1.5 Argumenargumenuntukfungsiplotutama 178

    10.2 FungsifungsiPlotTambahan 179 10.3 FungsifungsiPlotyangbersifatinteraktif 180 10.4 NotasiMatematikapadaPlot 180 10.5 Settingparametergrafik 182

    BAB11.ANALISISRUNTUNWAKTUDENGANR 184

    11.1 ModelTrendLinear 185 11.2.ModelExponentialSmoothing 187 11.2.1 ModelHoltWintersAditif 189 11.2.2 ModelHoltWintersMultiplikatif 193 11.2.3 ModelEksponensialGanda 195 11.2.4 ModelEksponensialSmoothingSederhana 196

    11.3 ModelARIMA 198 11.3.1 ContohKasusModelARIMANonmusimanyangStasioner 203

  • sht90 DaftarIsi

    viii

    11.3.2 ContohKasusModelNonmusimanyangTidakStasioner 211 11.3.3 ModelARIMAMusiman 216 11.3.4 ContohKasusModelARIMAMusiman 219 11.3.5 KriteriaPemilihanModel 225

    11.4 Rangkumanperintahdanlibraryyangberkaitandengan AnalisisRuntunWaktu 227

    BAB12.ANALISISMULTIVARIATDENGANR 230

    12.1 AnalisisFaktor 230

    12.2 AnalisisDiskriminan 232

    12.3 AnalisisCluster 234

    BAB13. REGRESINONPARAMETRIKDANESTIMASIDENSITAS 237

    13.1 EstimasiDensitasdenganKernel 237

    13.2 RegresiNonparametrikdenganKernel 241

    13.3 RegresiNonparametrikdenganSpline 243

    13.4 JenisjenisBasisSpline 249

    13.5 RangkumanlibraryuntukAplikasiKerneldanSpline 254

    BAB14.MODELNONLINEAR 256

    14.1 EstimasiModelRegresiNonlinear 256

    14.2 PerintahnlsdanSSasympOriguntukestimasimodelnonlinear 259

    14.3 UjiDeteksiHubunganNonlinear 263

    14.3.1 UjiRamsey'sRESET 263 14.3.2 UjiWhite 267 14.3.3 UjiTerasvirta 274

    BAB15. PENGENALANPEMROGRAMANDALAMR 277

    15.1 PenulisanFungsi 277

    15.2 TypeDatadanOperator 280

    15.3 ControlFlowdidalamR 281

    15.4 Beberapatopikyangberhubungandenganfungsi 284

    15.4.1 Argumendarisuatufungsi 284 15.4.2 Mengaturtampilandarioutput 286

    15.5 Contohcontohfungsi 289

    DAFTARPUSTAKA 292

    DAFTARINDEKS 295

    TENTANGPENULIS 298

  • sht90 PaketStatistikR

    1

    BAB1PAKETSTATISTIKR

    1.1. Pendahuluan

    Secara umum ada dua macam kelompok paket software statistik untukkeperluan analisis data, yaitu kelompok software komersil dan kelompok softwarestatistikopen sourceatau freeware.Beberapa contoh software statistikkomersilyangpopulardi IndonesiaadalahSPSS,MINITAB,Eviews,SAS,danSplus.Sedangkancontohdari freeware statistik antara lain R, Open Stats, SalStat, Vista, dan lainlain (lihathttp://www.statistics.com/content/freesoft/AZlisting.html).

    Softwarestatistikyangkomersilmensyaratkan lisensidenganhargayangrelatifsangatmahaluntukukuran sebagianbesarpenggunadi Indonesia.Dengandemikian,salah satu alternatif penyelesaian dari mahalnya lisensi tersebut adalah melaluipenggunaanfreewarestatistik,khususnyaR.

    1.2. SejarahSingkatRR dalam versi terakhirnya, yaitu versi 2.7.2 per 25 Agustus 2008,merupakan

    suatusistemanalisisdatastatistikyangkompletsebagaihasildarikolaborasipenelitianberbagaiahli statistik (statistisi)di seluruhdunia.VersiawaldariRdibuatpada tahun1992diUniversitasAuckland,NewZealandolehRossIhakadanRobertGentleman.Padasaat ini, source code kernel R dikembangkan terutama oleh R Core Team yangberanggotakan 17 orang statistisi dari berbagai penjuru dunia (lihat http://www.rproject.org/contributors.html).Selainitu,parastatistisilainpenggunaRdiseluruhduniajugamemberikankontribusiberupakode,melaporkanbug,danmembuatdokumentasiuntukR.

    Paket statistik R bersifat multiplatforms, dengan file instalasi binary/file tartersediauntuk sistemoperasiWindows,MacOS,MacOSX,Linux,FreeBSD,NetBSD,irix,Solaris,AIX,danHPUX.Secaraumum,sintaksdaribahasaRadalahekuivalendenganpaket statistik Splus, sehingga sebagian besar keperluan analisis statistika, danpemrogramandenganRadalahhampiridentikdenganperintahyangdikenaldiSplus.

    1.3. CaraMemperolehR,PaketdanLibraryR dapat diperoleh secara gratis di CRANarchive yaitu The Comprehensice R

    Archive Network di alamat http://cran.rproject.org. Pada server CRAN ini dapatdidownloadfileinstalasibinarydansourcecodedariRbasesystemdalamsistemoperasiWindows(semuaversi),beberapajenisdistrolinux,danMacintosh.

    FungsidankemampuandariR sebagianbesardapatdiperolehmelaluiAddonpackages/library.Suatulibraryadalahkumpulanperintahataufungsiyangdapatdi

  • sht90 PaketStatistikR

    2

    gunakan untukmelakukan analisis tertentu. Sebagai contoh, fungsi untukmelakukananalisis time seriesdapatdiperolehdi library ts. Instalasi standardariRakanmemuatberbagai librarydasar,antara lainbase,datasets,graphics,utils,danstats.Library lainhasilkontribusidaripenggunaR(diluaryangstandar)harusdiinstalsatupersatusesuaidenganyangdibutuhkanuntukanalisis.DaftarsemualibraryyangtersediadapatdiaksesdarilinkdownloadCRANdialamathttp://cran.rproject.org.

    1.4. InstalasiRdalamSistemOperasiWindowsTahapanutama sebelummelakukan instalasiRdalam sitemoperasiWindows

    adalah mendownload file R2.7.2win32.exe yang dapat diperoleh di http://cran.rproject.org.Setelahitu,langkahlangkahinstalasiRdapatdilakukansepertiberikut:

    Klikduakali(doubleclick)fileR2.7.2win32.exeyangterdapatpadadirektoriyangtelah disediakan, maka akan muncul jendela dialog seperti pada Gambar 1.1.berikutini.

    Gambar1.1.JendeladialogawalinstalasiRdalamsitemoperasiWindowsSetelah itu, lanjutkan jalannya proses instalasi dengan mengikuti Wizard danmenggunakanpilihanpilihandefaultinstalasi.

    Jika proses instalasi telah selesai, klik Finish untuk keluar dari proses instalasi.Apabilasemuaprosesberjalandengansukses,makapadaDesktopWindowsdanStartMenudariWindowsakanterdapatShortcutdariRsepertipadaGambar1.2.berikutini.

  • sht90 PaketStatistikR

    3

    Gambar1.2.ShortcutdariR

    Langkah terakhir jika instalasiR telah selesai adalahmelakukanpengecekanatau

    pengujianapakahprogramRdapatberjalandenganbaik.Lakukanklikduakalipadashortcut R di Desktop atau pada StartMenu. Jika instalasi berlangsung denganbaik,makajendelaprogramRakanterbukasepertiyangterlihatpadaGambar1.3.

    Gambar1.3.JendelaawalprogramR,jikainstalasiberjalansukses

    JikaselesaibekerjadenganR,makauntukkeluardariRdapatdilakukandengandua

    cara,yaitu:

    1. Ketikkanq()padacommandlinediRconsole,yaitu>q()

    2. PilihmenuFile,pilihExit,dankemudianklikYespadadialogSaveWorkspaceImage.

  • sht90 PaketStatistikR

    4

    1.5. GUIRCommanderdanInstalasinyadalamSistemOperasiWindowsPada awalnya, interaksi utama antara pengguna dengan R adalah bersifat

    Command Line Interface (CLI). Dengan demikian, untuk dapat menggunakan R diperlukanpenyesuaianpenyesuaianbagipenggunayang telah terbiasadengan fasilitasPointandClickGraphicalUser Interface (GUI).Untungnya,padasaat ini telah tersediabeberapaGUIsederhanauntukkeperluanbeberapaanalisisstatistikatertentu,khususnyayangberkaitandenganmanajemendatadiR.LibraryRcommanderyangterdiridariRcmdr, RcmdrPlugin.TechingDemos, RcmdrPlugin.epack, RcmdrPlugin.HH, danRcmdrPlugin.FactoMineR,merupakan librarytambahandariRuntukmemfasilitasiGUIyangdapatdigunakanuntukberbagaianalisisstatistikadasar.

    Instalasi libray Rcommander dapat dilakukan apabila filefile library di atassudah didownload dari server CRAN. Jika instalasi untuk R telah selesai dan berjalansukses,makalangkahlangkahuntukintalasiRcommanderadalahsebagaiberikut:

    1. Pertama, jalankan program R sampai jendela program R terbuka (seperti yangterlihatpadaGambar1.3diatas).

    2. UntukmenginstalRcommander,pilihmenuPackages,pilihInstallpackage(s)fromlocalzipfiles.KemudianarahkanlokasipadadialogLookinkedirektoridimanafile Rcmdr_1.310.zip, RcmdrPlugin.HH_1.15.zip, RcmdrPlugin.epack_1.01.zip,RcmdrPlugin.TechingDemos_1.310.zip, RcmdrPlugin.FactoMineR_1.00.zip. Pilihsemuafiletersebut,sepertiyangterlihatpadajendeladialogpadaGambar1.4.

    Gambar1.4.JendeladialoguntukinstalasiRcommander

  • sht90 PaketStatistikR

    5

    Kemudian klikOpen,makaR akanmenginstalpaketRcommander yangditandaidengandialogberikutpadajendelaRconsole.

    >utils:::menuInstallLocal()package 'RcmdrPlugin.TeachingDemos' successfully unpacked and MD5 sumscheckedpackage'Rcmdr'successfullyunpackedandMD5sumscheckedpackage'RcmdrPlugin.epack'successfullyunpackedandMD5sumscheckedpackage 'RcmdrPlugin.FactoMineR' successfully unpacked and MD5 sumscheckedpackage'RcmdrPlugin.HH'successfullyunpackedandMD5sumscheckedupdatingHTMLpackagedescriptions>

    3. PaketRcommanderdapatdijalankandenganduacarayangberbeda,yaitu:

    Dengan mengetikkan perintah library(Rcmdr) pada jendela Rconsole danmenekanEntersatukali.

    >library(Rcmdr)

    MemilihmenuPackages,pilihLoadpackagedankemudianmemilihRcmdrpada daftar paket library yang telah terinstal, seperti yang terlihat padaGambar1.5.

    Gambar1.5.JendeladialoguntukmenjalankanRcommander

  • sht90 PaketStatistikR

    6

    Apabilaproses instalasipaketRcommanderberjalandengan sukses,makapaketRcommandertersebutakandiloadingdanmunculsepertipadaGambar1.6berikutini.

    Gambar1.6.JendelaawaldaripaketlibraryRcommander

    Pada saat ini,bahasayangdigunakandalampaketRcommander sudahadayangdalam bahasa Indonesia sebagai hasil pengembangan dan kontribusi statistisi diIndonesia.

    4. Untuk keluar dari paket Rcommander dan sekaligus R dapat dilakukan denganmemilihmenuFile,pilihKeluar,danklikpadapilihanDariCommanderdanRyangtersediadijendelaRcommander.

    1.6. ManajemenDirektoriKerjadiRCarakerjadariRadalahsamadenganSplus,yaitubekerjadengansatudirektori

    untuksatuprojek.Rakanmenyimpan file imagedari semuaobyekatau internaldatadan history dari semua perintah yang pernah diketikkan di jendela Rconsole padadirektorikerjasecaraotomatisataudefaultdenganfileberekstensi.Rdata.Lokasi

  • sht90 PaketStatistikR

    7

    default dari direktori kerja R adalah direktori C:\Program Files\R\R2.7.2. Untukkeperluan pekerjaan seharihari yang menggunakan R akan lebih baik jika dilakukanpadadirektoritersendiri,misalnyadirektoridengannamayangsesuaidenganpekerjaanyangdijalankan.Dengandemikianakanmemudahkandalammelihathistorydanobyekyangberhubungandenganpekerjaantersebut.

    1.6.1. Mengubahlokasidirektorikerjaatauworkspace

    Berikut ini adalah langkahlangkah yang dapat digunakan untuk membuatdirektorikhususdarisuatupekerjaandenganmenggunakanR.

    Misalkan kita telahmempunyaidirektoriC:\Kerja_dg_R (buatlahdirektori ini jikabelum ada). Langkah pertama, buatlah satu direktori baru di C:\Kerja_dg_Rdengan nama direktori Nama_Pekerjaan, misalkan Kerja1. Dengan demikian,padatahapinidiperolehsuatudirektoribaruyaitu

    C:\Kerja_dg_R\Kerja1.

    BuatlahcopydarishortcutprogramRdidesktopwindow,danrenameshortcutinisebagai shortcut Kerja1. Sehingga di desktop window muncul shortcut Kerja1sepertiGambar1.7berikutini.

    Gambar1.7.ShortcutdidesktopwindowdengannamaKerja1

    Kemudianarahkanmousepada shortcut tersebutdanklikkanan.PilihPropertiesdanganti informasipadakolom Start in menjadi C:\Kerja_dg_R\Kerja1 sepertiyangterlihatpadaGambar1.8,setelahituklikOK.

    Untukmengetahui perubahan lokasi direktori kerja di R, lakukan klik dua kalipada icon shortcutKerja1untukmenjalankanR. Sebagai ilustrasi sederhana, ketikkanbeberapabarisperintahberikutinisetelahjendelaRterbuka.

    >x=1:15>y=x+5>x[1]123456789101112131415>y[1]67891011121314151617181920

  • sht90 PaketStatistikR

    8

    Gambar1.8.PerubahanlokasidirektorikerjakeC:\Kerja_dg_R\Kerja1

    Setelah mengetikkan beberapa baris perintah di atas, lakukan keluar dari R

    denganmemilihmenuFile/Exit. PadadialogpertanyaanSaveworkspace image?,klikpadapilihanYES. Sekarang, jikadilakukanbrowsingdidirektoriC:\Kerja_dg_R\Kerja1makaakanditemukansatufilebernama.Rdatayangmerupakannamadefaultfileimagedaridirektorikerja,danfileyang lainbernama.Rhistoryyangmerupakannamadefaultdarifileyangberisikanhistorydarisemuaperintahyangpernahdiketikkan.KeduafileinisecaradefaultakandiloadingolehRpada saatdijalankanuntuk suatu sesipekerjaan.Historydandatadari suatu sesi terakhir (yang telah tersimpan sebelumkeluar)dapatdiakses pada jendela Rconsole dengan menggunakan tanda panah ke atas dan kebawah.

    C:\Program Files\R\R-2.7.2\bin\Rgui.exe

  • sht90 PaketStatistikR

    9

    1.6.2. MenyimpanimagedirektorikerjaPada bagian sebelumnya telah dijelaskan bagaimana semua obyek yang

    digunakan dalam satu sesi pemakaian R, yaitu mulai dibukanya program R sampaiditutup kembali, akan disimpan secara default ke dalam file .Rdata. Supaya filefilepekerjaan lebih terorganisir,Rmemberikan fasilitas tambahanuntukmenyimpandataatauobyekyangdigunakandalamsetiapsesiRkedalam fileworkspacetertentuyangmemilikiekstensi .Rdata. Filefile ini selanjutnyadapatdiloadkembali jikadiperlukan.Sebagai contoh, jalankan program R dan ketikkan beberapa perintah berikut ini kedalamjendelaRconsole.

    >x=1:15>y=x+5>x[1]123456789101112131415>y[1]67891011121314151617181920

    Prosespenyimpanandataatauobyek,yaituxdanysepertiyangtertulisdiatas,kedalamdirektoriC:\Kerja_dg_R\Kerja1dengannamafilecoba1.Rdatadapatdilakukandengan menggunakanmenu File, dan pilih SaveWorkspace . Selanjutnya lakukankeluar dari R, dan pilihNo (yang berarti tidakmenyimpan imag dari file kerja) padadialogSaveWorkspaceImage? SekarangjalankankembaliprogramR,makadataatauobyekdifilecoba1.Rdatadapatdiloadkembalidenganmenggunakanduamacamcara,yaitu:

    PilihmenuFile,danpilihLoadWorkspace,dansetelahitupilihfiledidirektoriC:\Kerja_dg_R\Kerja1dengannamacoba1.Rdata

    GunakanperintahberikutpadajendelaRconsole

    >load("C:\\Kerja_dg_R\\Kerja1\\Coba1.RData")>objects()[1]"x""y">x[1]123456789101112131415>y[1]67891011121314151617181920

    Dari jendelakotakRconsolediatasdapatdilihatbahwasemuaobyekyangdikerjakanpada sesi sebelumnya telah berhasil diload kembali.Dengan cara yang sama, semuahistorydariperintahpadasuatusesidapatdisimpanmelaluimenuFile,danpilihSave

  • sht90 PaketStatistikR

    10

    History . Untuk melakukan load kembali history pada sesi sebelumnya yang sudahtersimpan ini, dapat dilakukan denganmelaluimenu File, dan pilih LoadHistory ,kemudianpilihnamafilehistoryyangakandipanggilkembalitersebut.HistorydarisesiRyang telahdiload inidapatdiaksesdenganmenggunakan tandapanahkeatasdankebawah.

    1.7. FasilitashelpSecara umum ada beberapa fasilitas help dari R yang dapat diakses dengan

    berbagaicara,antaralain:

    Mencarihelpdarisuatuperintah(command)tertentu Menggunakanhelpsearchengine OnlineSearchEngine

    1.7.1. Mencarihelpdarisuatuperintah(command)tertentuAdabeberapaperintahyangdapatdigunakanuntukmencarihelpataubantuan

    terhadap suatu fungsi atau perintah dari R yang telah diketahui namanya. Sebagaicontoh, jika ingin diketahui secara detail tentang suatu perintah atau fungsi R yangbernama plot, maka pada jendela Rconsole dapat diketikkan salah satu perintahberikutini,yaitu:

    >help(plot)>?plot

    Jendela help yang sama dapat juga diperoleh dengan menggunakan menu denganpilihanHelp,danpilihR function (text)dansetelah jendeladialogmuncul,ketikkankataplotsepertiyangterlihatpadaGambar1.9berikutini.

    Gambar1.9.Jendeladialoghelpuntuksuatufungsiatauperintah

  • sht90 PaketStatistikR

    11

    Setelah salah satu dari perintah di atas dijalankan, maka akan ditampilkanbagian dari jendela help dari perintah plot seperti yang terlihat pada Gambar 1.10berikutini.

    Gambar1.10.Hasilpencarianhelpuntuksuatufungsiplot

    Penjelasandarijendelahasilpencarianhelpuntukfungsiplotiniadalahsebagaiberikut:

    Adadua kolom jendela yangmuncul, yaitu kolom kiri tentang indexdari fungsiatau perintah yang dicari (misal plot), dan kolom kanan adalah hasil ataupenjelasandaripencarianfungsiyangingindiketahui.

    Padabagian kiri atas kolom jendelahasilhelp adalah tentang keterangannamadariperintah atau fungsi yang sedangditampilkandannamapaket atau libraryyangmemuatperintahtersebut.Dalamcontohdiatas,untukperintahplotdapatdilihatbahwaperintahplotinitersimpandalampaketataulibrarygraphics..

    Padasetiap jendelahelpdarisuatuperintahsecaraumumakanmemuatbagianbagianberikut:

    Description:uraiansingkattentangperintahtersebut Usage:uraiantentangsyntaxperintahuntukpenggunaanperintahtersebut. Arguments:uraiantentangargumenargumenyangdiperlukandarifungsi

    atauperintahtersebut. Details:uraianyanglebihlengkap(daripadayangdiberikanpadabagian

    description)tentangperintahtersebut.

  • sht90 PaketStatistikR

    12

    Values:uraiantentangoutputperintahtersebut. Author(s):uraiantentangauthordariperintahtersebut. References:uraiantentangreferensiyangdapatdigunakanuntuk

    memperolehketeranganlebihlanjutdariperintahtersebut. Seealso:bagianiniberisidaftarperintahataufungsiyangberkaitan

    eratdenganperintahtersebut. Example:bagianiniberisicontohcontohpenggunaanperintahtersebut.

    1.7.2. MenggunakanhelpsearchengineMetodepencarianhelp lainyangdapatdilakukanadalahdenganmenggunakan

    pencarianterhadapkatakunci.Beberapametodeyangdapatdilakukanuntuktujuaninidapatdijelaskansepertiberikutini.

    a.Menggunakanperintahapropos(katakunci)

    Perintah inidapatdigunakanuntukmemperolehdaftarperintahperintahdarisemuapaketatau libraryyangtelah terinstalpadasistemRyangmemuatsuatukatakunci.Berikutiniadalahcontohhasilperintahapropos(plot).

    >apropos("plot")[1]".__C__recordedplot" "assocplot" "barplot"[4]"barplot.default" "biplot" "boxplot"[7]"boxplot.default" "boxplot.stats" "cdplot"[10]"coplot" "fourfoldplot" "interaction.plot"[13]"lag.plot" "matplot" "monthplot"[16]"mosaicplot" "plot" "plot.default"[19]"plot.density" "plot.design" "plot.ecdf"[22]"plot.lm" "plot.mlm" "plot.new"[25]"plot.spec" "plot.spec.coherency" "plot.spec.phase"[28]"plot.stepfun" "plot.ts" "plot.TukeyHSD"[31]"plot.window" "plot.xy" "preplot"[34]"qqplot" "recordPlot" "replayPlot"[37]"savePlot" "screeplot" "spineplot"[40]"sunflowerplot" "termplot" "ts.plot">

    Darihasil jendeladiRconsole tersebutdapatdilihatoutput yangmemuat kata kunciplotdalamsuatunamaperintah.Outputyangdiperolehakanberbedadantergantungpadalibraryyangterinstalpadakomputer.

    Output yang sama dapat pula diperoleh dengan menggunakan menu utamapadapilihanHelp,kemudianpilihAproposdan selanjutnyaketikplotpada jendeladialogsepertiyangterlihatpadaGambar1.11berikutini.

  • sht90 PaketStatistikR

    13

    Gambar1.11.JendeladialogAproposuntukpencariansuatuperintah

    b.Menggunakanperintahhelp.search(katakunci)

    Perintah ini akanmelakukan pencarian terhadap sebuah string bernama katakuncidisemuapaketatau libraryyangtelahterinstalpadasistemR.Berikut iniadalahcontohperintahhelp.search(plot)padajendelaRconsole.

    >help.search("plot")

    HasildariperintahtersebutdapatdilihatpadaGambar1.12berikutini.

    Gambar1.12.Hasilpencarianhelpdenganperintahhelp.search(plot)

  • sht90 PaketStatistikR

    14

    Dari hasil untuk contoh di atas dapat dilihat keterangan nama perintah atau fungsibesertanamapaketataulibrary(katayangdidalamkurung)yangmemuatstringplot.Output yangdiperolehakanberbedadan tergantungpada library yang terinstalpadakomputer.

    Output yang sama dapat pula diperoleh dengan menggunakan menu utamapadapilihanHelp,kemudianpilihSearchhelpdanselanjutnyaketikplotpada jendeladialogsepertiyangterlihatpadaGambar1.13berikutini.

    Gambar1.13.JendeladialogSearchhelpuntukpencariansuatuperintah

    c.Menggunakanversihtmldarijendelahelp

    Tampilan dari help dalam versi html dapat diperoleh melalui fungsi atauperintah help.start() pada jendela Rconsole. Selain itu, jendela help dalam html inidapatpuladibukamenggunakanmenupadapilihanHelp,dankemudianpilihHtmlhelp.Berikutiniadalahcontohhelp.start()padajendelaRconsole.

    >help.start()

    HasildariperintahtersebutdapatdilihatpadaGambar1.14.Beberapaketeranganatauuraiandarihasiljendelahelpversihtmladalahsebagaiberikut:

    Pada bagianManuals, diperoleh daftar link dari semua filemanual dalam versihtmldariR.Versi filepdfdarifilemanual inidapatdiaksesmelaluimenuutamaHelp,danpilihaManuals(inPdf)dariR.

    PadabagianReference terdiridaridua informasiutama, yaitu tentangPackageyangberisidaftar semuapaketatau libraryyang telahdiinstalpada sistem,dantentangSearchEngine&Keywordsyangdapatdigunakanuntukpencariankatakunci(keywords)dalamsemuapaketataulibraryyangtelahdiinstaldalamsistemRyangadadikomputer.

  • sht90 PaketStatistikR

    15

    PadabagianMiscellaneousMaterialterdiridaribeberapalinkbeberapainformasitambahanyangpentinguntukdiketahuilebihlanjut.

    Gambar1.14.Hasilpencarianhelpdalamversihtmldenganperintahhelp.start()

    1.7.3. OnlineSearchEngineInformasi tentang R secara online dapat dicari dengan menggunakan search

    engine di alamat http:\\cran.rproject.org\search.html. Pada alamat tersebut dapatdiperolehsemuainformasitentangRyangadadalamsitusCRAN,informasisemuapaketatau libraryyangtersediauntukR,danditambah informasiyangtersediapadaarchivemailinglistrhelp@stat.math.ethz.ch.

  • sht90 ManajemendatadiPaketR

    16

    BAB2MANAJEMENDATADIPAKETR

    Manajemendatayangmeliputidataentry,edit, importdanexport,merupakan

    suatu langkahyangpentingdalamanalisisstatistika.AdabeberapamacamdanukurandatayangdapatdiolahmenggunakanR.Secaraumum,minimaladaduamacambentukdata yang dapat diolah, yaitu data yang dimasukkan langsung lewatR editormelaluikeyboard,dandatayangsudahditulismenggunakanProgramSheet lain,sepertiText,SPSS, MINITAB, Access ataupun dBase. R menyediakan dua cara untuk melakukanmanajemen data, yaitumenggunakanRGUI danmelalui command line diRconsole.Pada bab ini, pembahasan tentang manajemen data difokuskan yang melalui RGUI,khususnyapemakaianRCommander.

    2.1. DataEntrymenggunakanRGuidenganRCommanderPadatahapawal,aktifkankembaliprogramRdenganmengklikiconshortcutnya.

    KemudianloadlibraryRCommanderdenganmengetikkanperintahlibrary(Rcmdr)padajendela Rconsole, dan tunggu sampai RCommander selesai diloading. Jika prosesberjalansuksesmakaakannampakjendelaRCommandersepertipadaGambar2.1.

    Gambar2.1.JendelaawaldaripaketlibraryRcommanderyangsuksesdiloading

  • sht90 ManajemendatadiPaketR

    17

    PengisiandatasecaralangsungviaRdenganmenggunakanRcommanderdapatdilakukan melalui menu Data, dan pilih Dataset baru . Setelah itu, jendela dialogpengisiannamadatasetakanditampilkan,sepertiyangterlihatpadaGambar2.2.Padakotakdialognamadataset,tuliskanlatihan1sebagainamadatasetbarutersebut.

    Gambar2.2.Jendeladialogpengisiannamadataset

    KemudianklikOK,danjendelaRGuiDataEditorakanterbukasepertipadaGambar2.3berikutini.

    Gambar2.3.JendelaRGuiDataEditoruntukpengisiandata

    Pengisiannamavariabeldilakukandengancaraklikpadakolompalingatasdaridata editor. Sebagai contoh, untuk mengisikan nama variabel pertama, misalnyaresponden,klikpadavar1.KemudianpadajendelaVariableeditorsepertiyangterlihatpada Gambar 2.4, isikan responden sebagai variable name dan tipe data adalahcharacter(karenayangakandiisikanpadakolominiadalahnamanamaresponden).

  • sht90 ManajemendatadiPaketR

    18

    Gambar2.4.JendelaVariableeditoruntukpengisiannamavariabel

    Sebagailatihan,isikandatatentangnamamahasiswa,nilaiUANtigamatapelajaran,danIPKsemester1,berikutinikedalamRDataeditor.

    Responden Matematika BIndonesia BInggris IPK1

    AdiBudiDanyEkaFeryNuriRury

    8.07.66.98.99.57.36.5

    9.18.88.19.29.68.77.5

    8.48.57.29.09.57.98.2

    3.353.022.903.423.753.262.76

    Padadasarnya,prosespengisiandata iniadalahsamadenganpaketstatistikyang lain,yaitumulai isiannamakolomdan tipedatayangdiinputkan (numericataucharacter).Setelah semua data selesai diinputkan, maka akan diperoleh tampilan Data Editorsepertiberikutini.

    Gambar2.5.JendelaDataEditorsetelahsemuadataselesaidiisikan

  • sht90 ManajemendatadiPaketR

    19

    Setelah dilakukan data entry,maka tutup jendela RData Editor diatas untukmengakhiri proses data entry. Pada jendela RCommander terlihat Data set yangdengan nama latihan1 saat ini sedang aktif, seperti yang terlihat pada Gambar 2.6.Untukmenampilkan data yang sedang aktif di Jendela Keluaran RCommander, tulisnamadatasetyaitu latihan1diJendelaSkrip,kemudianklikKirim,makaakanterlihatdatasepertiberikutini.

    Gambar2.6.JendelaRCommandersetelahdilakukanprosesentrydata

    2.2.MenampilkandatayangsedangaktifdiRCommander

    Untukmenampilkandatayangsedangaktifdimemori,lakukandenganmengkliktombolLihatdataset.Setelahitujendeladataakandibukadanmenampilkandatayangsedangaktifdimemorikomputersaatini,yaitudatalatihan1berikutini.

    Gambar2.7.Jendeladatalatihan1yangsedangaktifdimemori

  • sht90 ManajemendatadiPaketR

    20

    2.3.EditingdatadiRCommander

    Untuk melakukan editing terhadap data latihan1, lakukan dengan mengkliktombolEditdataset.Setelah itu jendelaDataEditorakandibukakembali,danproseseditingdatadapatlangsungdilakukanpadadatadatayangsalahketik.Jikaeditingtelahselesai dilakukan, tutup jendelaData Editoruntuk kembali ke jendelaRcommander.HasileditingyangtelahdilakukandapatdilihatdenganklikpadatombolLihatdataset.

    2.4.ImportingdatadiRCommander

    Seperti yang telah dijelaskan pada bagian sebelumnya, secara umum prosesdataentrydiRCommanderdapatdilakukandenganduamacamcara,yaitudilakukanlangsungmelaluiDataEditordanmelalui importdatadari formatdatayangdiberikanolehprogram lain.Programyang formatdatanyadapatdibacaolehRadalahdatadarifileteksatauclipboard,datasetSPSS,datasetMINITAB,datasetSTATA,datadariExcel,Access,ataudBase,sepertiyangterlihatpadajendelamenuberikut.

    Gambar2.8.JendelaImpordatapadaRCommander

    Padabagianberikut ini akandijelaskanpenggunaan impordatadari Excel, SPSS,danMINITAB.Untuk filedariprogramyang lain,proses impordatamelaluiRCommanderdapatdilakukan secara samadengan caramengimpordatadariprogramExcel, SPSS,ataupunMINITAB.

    2.4.1.ImportingdatafileExceldiRCommander

    Misalkansajadata fileExcelbelumada,danakandibuatterlebihdahulu.BukaprogramExcel,setelahituisikandatatentangrespondendiatassehinggadiperolehdataExcelsepertiyangterlihatpadaGambar2.9.

  • sht90 ManajemendatadiPaketR

    21

    Gambar2.9.JendeladatapadaExcelyangakandiimporkeR

    Langkah selanjutnya, simpan file ini sebagai file text (yaitu tabdelimited txt),dengannama data1.txt di direktori C:\Kerja_R\. Untuk mengimpor data file ini kedalamRCommander,pilihlahpadaRCommandermenuData,pilihImpordata,dankemudianpilihdarifileteksatauclipboard.Padajendeladialogyangmuncul, isikaninformasinamauntukdataset,namavariabel,danlainlain,sepertiberikutini.

    Gambar2.10.JendeladialogImpordatadarifileteksatauclipboard

  • sht90 ManajemendatadiPaketR

    22

    Dalamhal ini,datahasil imporakandisimpankedalamRCommanderdengannama latihan2.Data ini diimpor dengan Pemisah Field/Medan adalah spasi. KlikOK,kemudian akanmuncul untukmelakukan browsing ke lokasi dari file teks yang akandiimpor.ArahkankedirektoriC:\Kerja_R\danpilihfiledata1.txt.KemudianklikOpen,maka sekarang data yang berada pada file data1.txt telah diimpor kedalam RCommanderdengannama latihan2.Sekarang,datasetyangaktifpadaRCommanderadalahlatihan2sepertiyangterlihatpadaGambar2.11.GunakantombolLihatdatasetuntukmelihathasilimpordataini.

    Gambar2.11.Jendeladialoghasilimpordatadanlatihan2sebagaidatasetaktif

    2.4.2.ImportingdatafileSPSSdiRCommander

    Proses impor data eksternal yang telah disimpan sebagai file SPSS, dapatdilakukan dengan memilih pada RCommander menu Data, pilih Impor data, dankemudianpilihdaridatasetSPSS .Pada jendeladialogyangmuncul, isikan informasinamauntukdataset(misallatihan3)sepertiberikutini.

    Gambar2.12.JendeladialogImporDatasetSPSS

  • sht90 ManajemendatadiPaketR

    23

    KlikOK,danselanjutnyaarahkankedirektoritempatpenyimpananfileSPSSyangakandiimpor, misalkan saja di C:\Kerja_R\ dengan nama data2.sav. Kemudian klik Open,maka data hasil impor dari file data2.sav akan disimpan kedalam file latihan3. PadajendelaRCommanderterlihatdatasetlatihan3sedangaktif,sepertipadaGambar2.13.KliktombolLihatdatasetuntukmelihathasilimpordataini.

    Gambar2.13.Jendeladialoghasilimpordatadanlatihan3sebagaidatasetaktif

    2.4.3.ImportingdatafileMINITABdiRCommander

    Proses impordata eksternal yang telahdisimpan sebagai fileMINITAB adalahekuivalendenganimpordatateksatauSPSSsebelumnya,yaitudapatdilakukandenganmemilih pada RCommander menu Data, pilih Impor data, dan kemudian pilih daridatasetMinitab.Padajendeladialogyangmuncul,isikaninformasinamauntukdataset(misallatihan4)sepertiberikutini.

    Gambar2.14.JendeladialogImporDatasetMINITAB

    KlikOK,dan selanjutnyaarahkankedirektori tempatpenyimpanan fileMINITAByangakandiimpor,misalkansajadiC:\Kerja_R\dengannamadata3.MTP(MinitabPortableWorksheet,lakukanpadasaatsaveasdiMinitab).KemudianklikOpen,makadatahasilimpor dari file data3.MTP akan disimpan kedalam file latihan4. Pada jendela RCommander terlihat data set latihan4 sedang aktif, seperti pada Gambar 2.15. KliktombolLihatdatasetuntukmelihathasilimpordataini.

  • sht90 ManajemendatadiPaketR

    24

    Gambar2.15.Jendeladialoghasilimpordatadanlatihan4sebagaidatasetaktif

    2.5.Memilihdatasetyangaktif

    Pemilihan dataset yang aktif pada RCommander dapat dilakukan denganmenggunakanmenuData, pilihDataset aktif,dan kemudian klik Pilih dataset aktifsepertiberikutini.

    Gambar2.16.Jendeladialoguntukmemilihmenudatasetyangsedangaktif

  • sht90 ManajemendatadiPaketR

    25

    Selanjutnya, pilihlah dataset yang ingin diaktifkan denganmelakukan klik pada namadatasetyangdipilih,kemudianklikOKsepertiberikutini.

    Gambar2.17.Jendeladialoguntukmemilihdatasetyangsedangaktif

    2.6.Transformasidatasetataupengaturanvariabelpadadataset

    AdabeberapamenuuntuktransformasidatasetpadaRCommander,antaralainrecode atau kode ulang peubah, compute atau hitung peubah baru, standarisasipeubah,dan lainnya.Secara lengkap,transformasidatasetyangdapatdilakukandapatdilihatpadaGambar2.18.

    Gambar2.18.Beberapamenuuntukmelakukantransformasidataset

    2.6.1.Recodeataukodeulangpeubah

    Kodeulangpeubahmerupakanpilihanmenupertamapadapengaturanvariabeldataset.Misalkan saja akan dilakukan recode atau kode ulang pada variabel IPK daridatasetlatihan4.

  • sht90 ManajemendatadiPaketR

    26

    RangenilaiIPK Nilaikodebaru

    3.50 3

    Langkahlangkahpengkodeandapatdilakukansebagaiberikut.

    BukamenurecodedenganmemilihmenuDatapadaRCommander,kemudianpilihAtur peubah pada dataset aktif, dan selanjutnya pilih Kode ulang peubah .Selanjutnyaakandiperolehtampilansepertiberikut.

    Gambar2.19.JendelapilihanKodeulangPeubah

    Kemudianarahkankevariabel ipk,dannamakanhasilrecodesebagai ipk_recode.Informasipengkodeandapatdijelaskandenganmenggunakaninformasiberikut:

    0.00:2.99 = 1 3.00:3.49 = 2 else = 3 KlikOK, dan sekarang jika dilihat pada dataset latihan4, akan diperoleh variabel

    baruyaituipk_recodeyangberisikandatahasilpengkodeanulangdariipk.LakukandenganklikLihatdataset,sehinggadiperolehtampilandatasepertiberikut.

  • sht90 ManajemendatadiPaketR

    27

    Gambar2.20.JendeladatahasilKodeulangPeubahipkmenjadiipk_recode

    2.6.2.Computeatauhitungpeubahbaru

    Pilihanmenuhitungpeubahbarudapatdigunakanuntukmembentukvariabelbaruyangmerupakanfungsidarivariabelyangsudahada.Misalkansajaakandilakukantransformasi terhadapvariabeltinggipadadataset latihan4menjadivariabel lainyangdengannamatinggi_compute,yaitutinggi:100.

    Langkahlangkahtransformasiiniadalahsebagaiberikut.

    Pertamatama,aktifkandataset yangakandilakukan transformasi compute, yaitulatihan4padaRCommander.

    BukamenuHitungpeubahbarudenganmemilihmenuData,kemudianpilihAturpeubahpadadatasetaktif,danselanjutnyapilihHitungpeubahbaru.SelanjutnyaakandiperolehtampilansepertipadaGambar2.21.

    Selanjutnya isikantinggi_computepadakolomNamapeubahbarudantinggi/100padakolomEkspresiuntukdihitungsepertiyangterlihatpadaGambar2.21.

    KlikOK, dan sekarang jika dilihat pada dataset latihan4, akan diperoleh variabelbaru yaitu tinggi_compute yang berisikan data hasil transformasi compute padavariabeltinggi.LakukandenganklikLihatdataset,sehinggadiperolehtampilandatabaru pada kolom terakhir yaitu tinggi_compute yang merupakan hasil bagi darivariabeltinggidengan100.

  • sht90 ManajemendatadiPaketR

    28

    Gambar2.21.JendelapilihanHitungpeubahbaru

    Pengaturanatautransformasi lainpadadatasetyangaktifdapatpuladilakukandenganmenjalankanmenuData, pilihAtur peubah pada dataset aktif, dan arahkanpadatransformasiyangakanditerapkan.Bagianinihanyamenjelaskanduatransformasiawal dari pilihan menu yang ada, yaitu recode dan compute. Transformasi lain yangdapatdilakukanpadaRCommanderadalah:

    Tambahkanbanyaknyapengamatankedataset Standarisasipeubah Konversipeubahnumerikkefaktor Binpeubahnumerik Aturulanglevelfaktor Definisikankontrasdanfaktor Namakanulangpeubah Hapuspeubahdaridataset

  • sht90 ManajemenDatadiRdenganCommandLine

    29

    BAB3MANAJEMENDATADIRDENGANCOMMANDLINE

    Pada R, data yang ada dipandang sebagai suatu objek yang memiliki suatu

    attributesatausifat.Sifatdataditentukanolehtypedatadanmodedata.AdaberbagaitypedatayangdikenalolehR,antaralainvektor,matriks,list,dataframe,array,factor,dan function (builtincommand).SedangkanmodedatayangdikenalRada4macamsepertiyangterlihatpadaTabel3.1berikutini.

    Tabel3.1.EmpatmacammodedatayangdikenalR

    Mode ContohperintahdiCommandLine

    Numeric >23>c(2.3,2,1.3,3.2)>data.bulan=c(1,2,3,4,5,6,7,8,9,10,11,12)

    Complex >1+5i>sqrt(as.complex(5))

    Logical >c(T,F,F,T,T,F,F,T,T,T)>data.tahun>1998

    Character >c(Budi,Wati,Rony,Naily)>c(F,T,2)

    NamaobjekdalamRharusdimulaidenganhuruf,ditambahdengankombinasidarihurufbesar,hurufkecil,angkadantitik.Penggunaantitikbiasanyadilakukanuntukmemudahkan pengorganisasian data. Berikut ini adalah beberapa contoh dari namaobjekyangvalid.

    databudidata.budidata.budi.1data.budi.5data.budi.no7.02.02.08

    Contohdarinamaobjekyangtidakvalid(invalid)adalahsebagaiberikut:

    1databudi :dimulaidariangkadatabudi :operatortidakdapatdigunakandatabudi=1 :operator=tidakdapatdigunakan

    Dalam R versi 2.7.2 ini, assignment dapat digunakan dengan operator

  • sht90 ManajemenDatadiRdenganCommandLine

    30

    3.1.JenisjenisDataObjek

    Padabagian ini akan dijelaskan beberapa jenis data objekpadaR, yaitu dataarraysatudimensiataudatavektor,datamatriks,dataframe,dandatalist.

    3.1.1.DataArraySatuDimensiatauDataVektor

    Vektormerupakan suatuarrayatauhimpunanbilangan,characteratau string,logicalvalue,danmerupakanobjekpalingdasaryangdikenaldalamR.Padadatavektorharusdigunakanmodetunggalpadadata,sehinggagabunganduadataatau lebihyangberbedamodetidakdapatdilakukankedalamsatuobjekvektor.Jikainidilakukan,makaRakanmengubahdatakemodeyanglebihumum,seperticontohberikutini.

    >c(T,1:10) [1]112345678910

    >c("A",F,T) [1]"A""FALSE""TRUE"

    >c("A",2,4,F,T) [1]"A""2""4""FALSE""TRUE"

    >x=c(1:10) >x [1]12345678910

    >mode(x) [1]"numeric"

    >length(x) [1]10

    Pada contoh pertama dapat dilihat bahwa pada command line menghasilkan vektoryang semua data diubahmenjadimodenumerik, sedangkan pada contoh keduadanketigamenghasilkanvektoryangsemuadatanyadiubahmenjadimodekarakter.Untukmengetahuimodesuatuobjekvektordapatdilakukandenganmenggunakancommandmodesepertipadacontohdiatas.Jumlahataupanjangdatayangbertipevektordapatdiketahuidenganmemanfaatkanfungsilength(perhatikancontohdiatas).

    Ekstraksi sebagian data vektor dapat dilakukan dengan berbagai cara ataulangkah. Dalam praktek analisis data statistik, ekstraksi ini biasanya dilakukan untukpembentukandatabaruberdasarkandatayangsudahada.Berikutiniadalahbeberapacontohhasilekstraksidarisuatudatavektoryangterdiridari10elemen,yaitu10,5,14,12,8,11,9,10,16,20.

  • sht90 ManajemenDatadiRdenganCommandLine

    31

    >x=c(10,5,14,12,8,11,9,10,16,20)>x#untukmelihatsemuaelemenobjekvektorx[1]10514128119101620

    >x[2]#menampilkanelemenkedua[1]5

    >x[c(1,3,7)]#menampilkanelemenke1,3,7[1]10149

    >x[c(2,8)]#menampilkansemuaelemenkecualielemenke2,8[1]10141281191620

    >x[x>10]#menampilkansemuaelemenyanglebihbesardari10[1]1412111620

    >y=x[x>10]#menyimpanvektorygelemennyalebihbesardari10dgnnamay>y[1]1412111620

    3.1.2.DataMatriks

    Matriks ataudata arrayduadimensi adalah salah satu tipedata yangbanyakdigunakandalampemrogramanstatistik.SebagianbesarfungsifungsistatistikdalamRdapatdianalisisdenganmenggunakanbentukmatriks.Bentukmatriks ini jugabanyakdigunakanpadaoperasifungsifungsibuiltinuntukaljabarlineardalamR,sepertiuntukpenyelesaiansuatupersamaanlinear.

    Proses entry data matriks dilakukan dengan menggunakan fungsi matrix.Argumen yangdiperlukan adalah elemenelemendarimatriks,dan argumenoptionalyaitubanyaknyabarisnrowdanbanyaknya kolomncolom. Sebagai contoh,gunakanperintahperintahberikutinipadaRconsole.

    >matriks.1=matrix(c(1,2,3,4,5,6),nrow=2,ncol=3)>matriks.2=matrix(1:6,nrow=2,ncol=3)>matriks.3=matrix(1:6,nrow=2)>matriks.4=matrix(1:6,2)>matriks.1[,1][,2][,3][1,]135[2,]246

    Keempatperintahdiatasakanmenghasilkanmatriksyangsama.Untukmengetahuinyaketikkan matriks.2, matriks.3, matriks.4, dan kemudian enter untuk masingmasingperintahtersebut.

  • sht90 ManajemenDatadiRdenganCommandLine

    32

    PadaR,datasecaradefaultakandiisikankolomperkolomsepertiyangterlihatpadacontohberikutini.

    >data=c(6.4,8.8,7.5,5.3,7.6,9.5)>data[1]6.48.87.55.37.69.5

    >matriks.a=matrix(data,nrow=3,ncol=2)>matriks.a[,1][,2][1,]6.45.3[2,]8.87.6[3,]7.59.5

    Pengisian matriks menurut baris perbaris dapat dilakukan dengan menggunakanargumenoptionalbyrow=Tpada commandmatrix.Berikut iniadalah contoh tentangpenggunaanargumentersebut.

    >matriks.b=matrix(data,nrow=3,ncol=2,byrow=T)>matriks.b[,1][,2][1,]6.48.8[2,]7.55.3[3,]7.69.5

    >dim(matriks.a)[1]32

    >length(matriks.a)[1]6

    >mode(matriks.a)[1]"numeric"

    Dimensi, length dan mode dari suatu matriks dapat dilihat dengan menggunakanperintahdim,length,danmodesepertipadacontohdiatas.Perludiingatbahwasemuaelemendarimatriksharusmemilikimodeyangsama.Jikahal initidakdipenuhi,makaelemenelemenakandiubahmenjadimodeyangpalingumum.

    Adabeberapaoperatoryangbiasadigunakanuntukoperasimatriksdanvektor,antara lain perkalian, invers matriks, transpose matriks dan crossproduct. RingkasandarioperatoroperatorinidapatdilihatpadaTabel2.2.

  • sht90 ManajemenDatadiRdenganCommandLine

    33

    Tabel3.2.Operatoruntukoperasimatriksdanvektor

    Operator Keterangan

    * Perkalianelemendemielemendarimatriks

    %*% Perkalianmatriks

    %o% Outer

    solve Inversdarisuatumatriks

    t Transposedarisuatumatriks

    crossprod Crossproductsuatumatriks,yaitut(x)%*%x

    Berikut iniadalahbeberapacontohhasilpenggunaanoperatorpadasuatumatriksdanvektor.

    >a=1:5>a[1]12345

    >a*a#perkalianelemendemielemendarimatriksa[1]1491625

    >crossprod(a)#crossproduckdarimatriksa,yaitut(a)%*%a[,1][1,]55

    >b=matrix(c(1:4),2)>b[,1][,2][1,]13[2,]24

    >b*b#perkalianelemendemielemendarimatriksb[,1][,2][1,]19[2,]416

    >b%*%b#perkalianmatriksbdenganmatriksb[,1][,2][1,]715[2,]1022

    >solve(b)#inversdarimatriksb[,1][,2][1,]21.5[2,]10.5

  • sht90 ManajemenDatadiRdenganCommandLine

    34

    Pada R, dapat pula dilakukan penggabungan satu kolom atau satu baris barukedalam matriks lain. Hal ini dapat dilakukan dengan menggunakan perintah rbind(untukmenambahkankebaris)dancbind(untukmenambahkankekolom).Perhatikancontohcontohberikutini.

    >a=matrix(c(3,4,5,6,7,8),2,3)>a[,1][,2][,3][1,]357[2,]468

    >a1=cbind(a,c(1,2))#menambahkankekolomke4daria>a1[,1][,2][,3][,4][1,]3571[2,]4682

    >a2=cbind(c(1,2),a)#menambahkankekolomke1daria>a2[,1][,2][,3][,4][1,]1357[2,]2468

    >a3=rbind(a,c(1,2,3))#menambahkankebariske3daria>a3[,1][,2][,3][1,]357[2,]468[3,]123

    >a4=rbind(c(1,2,3),a)#menambahkankebariske1daria>a4[,1][,2][,3][1,]123[2,]357[3,]468

    3.1.3.DataFrame

    Data framemerupakanobjek yangmempunyaibentuk samadenganmatriks,yaitu terdiriatasbarisdankolom.Perbedaannyaadalahdata framedapat terdiriatasmodedata yangberbedabedauntuk setiap kolomnya.Misalkan saja, kolompertamaadalahnumeric,kolomkeduaadalahstring/character,dankolomketigaadalahlogical.Objekdataframedapatdibuatdenganmenggunakanperintahdata.frame,sepertipadacontohcontohberikutini.

  • sht90 ManajemenDatadiRdenganCommandLine

    35

    >data.frame(c(1:4),c(T,T,F,F))c.1.4.c.T..T..F..F.11TRUE22TRUE33FALSE44FALSE

    >data.frame(nomer=c(1:4),jawaban=c(T,T,F,F))#adanamakolomnomerjawaban11TRUE22TRUE33FALSE44FALSE

    >cobaframe=data.frame(c(1:4),c(T,T,F,F))#simpanobjekdicobaframe>cobaframec.1.4.c.T..T..F..F.11TRUE22TRUE33FALSE44FALSE

    >names(cobaframe)[1]="nomer"#namakolomke1nomer>names(cobaframe)[2]="jawaban"#namakolomke2jawaban>cobaframenomerjawaban11TRUE22TRUE33FALSE44FALSE

    >cobaframe1=data.frame(c(1:4),c(T,T,F,F))>cobaframe1c.1.4.c.T..T..F..F.11TRUE22TRUE33FALSE44FALSE

    >names(cobaframe1)=c("nomer","jawaban")#berinamakolom>cobaframe1nomerjawaban11TRUE22TRUE33FALSE44FALSE

  • sht90 ManajemenDatadiRdenganCommandLine

    36

    Secaraumum,perintahperintahdiatasadalahekuivalendenganperintahberikutini.

    >cobaframe2=data.frame(nomer=c(1:4),jawaban=c(T,T,F,F))>cobaframe2nomerjawaban11TRUE22TRUE33FALSE44FALSE

    Sepertipadadatavektor,ekstraksisebagiandatapadamatriksdandata framedapatpuladilakukandenganberbagaicaraatau langkah.Berikut iniadalahbeberapacontohhasilekstraksidarisuatumatriksdandataframe.

    >matriks.1=matrix(1:9,3)>dataframe.1=data.frame(nomer=1:4,nama=c("Adi","Budi","Cika","Dony"),nilai=7:10)>matriks.1[,1][,2][,3][1,]147[2,]258[3,]369

    >matriks.1[2,2][1]5

    >dataframe.1nomernamanilai11Adi722Budi833Cika944Dony10

    >dataframe.1[2,2][1]BudiLevels:AdiBudiCikaDony

    >dataframe.1["nama"]nama1Adi2Budi3Cika4Dony

  • sht90 ManajemenDatadiRdenganCommandLine

    37

    3.1.4.DataList

    DatalistmerupakanobjekyangpalingumumataugeneraldanpalingfleksibeldidalamR.Listadalahsuatuvektorterurutdarisekumpulankomponen.Setiapkomponendapatberupa sembarangdataobjek,yaituvektor,matriks,data frame,ataudata listsendiri.Tiapkomponenpadadatalistdapatmempunyaimodeyangberbeda.Datalistdapatdibuatdenganmenggunakanperintahlist.Berikutiniadalahcontohpendefinisiandanpemakaianelemenlist.

    >list(c(1:3),c(T,F,T,T),data.frame(nama=c("Budi","Cika","Dony"),nilai=c(8:10)))[[1]][1]123[[2]][1]TRUEFALSETRUETRUE[[3]]namanilai1Budi82Cika93Dony10>datalist.1=list(nomer=c(1:3),jawaban=c(T,F,T,T),nilaiframe=data.frame(nama=c("Budi","Cika","Dony"),nilai=c(8:10)))>datalist.1$nomer[1]123$jawaban[1]TRUEFALSETRUETRUE$nilaiframenamanilai1Budi82Cika93Dony10

    Sepertipada jenisjenisdatasebelumnya,ekstraksisebagiandatapadadata listdapatpuladilakukandenganberbagaicaraatau langkah.Berikut iniadalahbeberapacontohhasilekstraksidarisuatudatalist.

  • sht90 ManajemenDatadiRdenganCommandLine

    38

    >datalist.1[1]#mengaksesnamadanelemenpertama$nomer[1]123>datalist.1[[1]]#mengakseselemenpertama[1]123>datalist.1$nomer#mengakseselemenpertamaberdasarkannamanya[1]123>datalist.1$jawaban#mengakseselemenkedua[1]TRUEFALSETRUETRUE>datalist.1$nilaiframe#mengakseselemendataframenamanilai1Budi82Cika93Dony10>datalist.1$nilaiframe$nama[1]BudiCikaDonyLevels:BudiCikaDony

    3.2.ImportingDatapadaCommandLine

    Secaraumum,proses importingdatapadaRdapatdilakukandenganduacara,yaitumenggunakanperintahperintahdicommand linedanmenggunakanfasilitasGUIRCmdr (lihat bagian 2.1 sebelumnya). Pada bagian ini akan dijelaskan penggunaanperintahpadacommandlineuntukimportingdata.

    3.2.1.MembacaFileASCII

    Suatu fileASCIIbiasanya terdiridaribilanganbilangan yangdipisahkanmenggunakanspasi, tab, tandaakhirbarisatau tandabarisbaru,sertapembatasyang lain.MisalkandatafileASCIIyangdibuatdiNOTEPADdengannama latihan5.txtberisidatasepertiberikutini.

    50 28 75 35 49 64 88 94 54 34 28 56 87 42 33 67 31 98 58 47 37 66 64 25 66 35 87 58 93 86 69 29 96 86 57 80

  • sht90 ManajemenDatadiRdenganCommandLine

    39

    Anggapbahwa fileASCIIdengannama latihan5.txt inisudah tersimpanpadadirektorikerja R. Proses impor data dapat dilakukan dengan perintah scan dan latihan5.txtsebagaiargumennya.Apabiladata tidakberadapadadirektorikerjaR,maka tulis jugadirektori tersebutpada argumennya.Berikut ini adalah contohproses impordata fileASCII.

    >scan("latihan5.txt")Read36items[1]50287535496488945434285687423367319858473766642566[26]3587589386692996865780

    >data5.scan=scan("latihan5.txt")Read36items

    >data5.scan[1]50287535496488945434285687423367319858473766642566[26]3587589386692996865780

    >matrix5.scan=matrix(scan("latihan5.txt"),6)Read36items

    >matrix5.scan[,1][,2][,3][,4][,5][,6][1,]508887586669[2,]289442473529[3,]755433378796[4,]353467665886[5,]492831649357[6,]645698258680

    >data6.scan=scan("c:\\Kerja_R\\latihan5.txt")Read36items

    >data6.scan[1]50287535496488945434285687423367319858473766642566[26]3587589386692996865780

    3.2.2.ImportingDataFileExcel

    Data file Excel dengan ekstensi .XLS dapat diimpor secara langsung menggunakanfasilitasGUIRCmdr(lihatbagiansebelumnya).UntukdapatdiimporkedalamR dengan fasilitas command line, maka data file Excel harus terlebih dulu diubahmenjadiformatTextTabDelimited(ekstensi.TXT)atauCSVcommadelimited(ekstensi.CSV). Setelah itu, data ini dapat diimpor menggunakan perintah read.table atauread.csv.

  • sht90 ManajemenDatadiRdenganCommandLine

    40

    Misalkan saja data file Excel yang akan diimpor adalah seperti pada gambarberikutinidantelahdisimpanmenjadifiledata1.txtataudata1.csv.

    Gambar3.1.Jendeladata1.txtpadaExcelyangakandiimporkeR

    Proses impordata1.txtdapatdilakukandenganperintahread.table,sedangkan, impordata1.csvdilakukandenganperintah read.csv.Argumenoptionalheader=Tdigunakandengan tujuanagarRmenggunakanbarispertamadari filesebagaiheaderataunamadarivariabel.Sepertipadabagiansebelumnya,apabiladatatidakberadapadadirektorikerjaR,makatulis jugadirektoritersebutpadaargumennya.Berikut iniadalahcontohprosesimpordatafiledenganekstensi.TXTdan.CSV.

    >latihan2latihan2latihan2latihan2

    Responden Matematika BIndonesia BInggris IPK1 1 Adi 8.0 9.1 8.4 3.35 2 Budi 7.6 8.8 8.5 3.02 3 Dany 6.9 8.1 7.2 2.90 4 Eka 8.9 9.2 9.0 3.42 5 Fery 9.5 9.6 9.5 3.75 6 Nuri 7.3 8.7 7.9 3.26 7 Rury 6.5 7.5 8.2 2.76

  • sht90 ManajemenDatadiRdenganCommandLine

    41

    >latihan3latihan3

    Responden.Matematika.BIndonesia.BInggris.IPK1 1 Adi;8;9.1;8.4;3.35 2 Budi;7.6;8.8;8.5;3.02 3 Dany;6.9;8.1;7.2;2.9 4 Eka;8.9;9.2;9;3.42 5 Fery;9.5;9.6;9.5;3.75 6 Nuri;7.3;8.7;7.9;3.26 7 Rury;6.5;7.5;8.2;2.76

    3.2.3.ImportingDatadariPaketStatistik

    Rmempunyaipaketatau library foreignuntukmelakukan importingdatadarifiledalamformatpaketstatistikayanglain.SampaisaatiniyangtersediapadaRadalahimportingdatafiledaripaketpaketstatistikaberikut:

    MINITAB : gunakanperintahread.mtpuntukmembacafileMinitabPortableWorksheetataudatadenganekstensi.MTP.FileinidapatdibuatdiMINITABdenganperintahSAVEASdanpilihan.MTP

    SPSS : gunakanperintahread.spssuntukmembacafile.SAV. SAS : gunakanperintahread.ssdatauread.xport. S+ : gunakanperintahread.S STATA : gunakanperintahread.dta Systat : gunakanperinahread.systat Epiinfo : gunakanperintahread.epiinfountukmembacafile.REC.

    Padabagian iniakandiberikan contohhanyauntukmengimpordata fileSPSSdanMINITAByangseringkalidigunakandalamanalisisdatastatistik.MisalkandatafileSPSS yang sudah dimiliki diberi namaWORLD95.SAV dan telah disimpan di direktorikerjaR.ProsesimpordatainikedalamRdenganmenggunakanperintahcommandlineadalahsebagaiberikut.

  • sht90 ManajemenDatadiRdenganCommandLine

    42

    >latihan4latihan4[,1:5]#hanyamenampilkan5kolompertamasaja COUNTRY POPULATN DENSITY URBAN RELIGION 1 Afghanistan 20500 25.0 18 Muslim 2 Argentina 33900 12.0 86 Catholic 3 Armenia 3700 126.0 68 Orthodox 4 Australia 17800 2.3 85 Protstnt 5 Austria 8000 94.0 58 Catholic 6 Azerbaijan 7400 86.0 54 Muslim

    Perintah use.value.labels=TRUE digunakan untuk mendapatkan variabel yang bertipeFACTORdenganvaluelabelsepertiyangadapadadatafilediSPSS.

    BerikutiniadalahprosesimpordatafileMINITABdalamekstensi.MTPkedalamRdenganmenggunakanperintahcommandline.MisalkandatafileMINITAByangsudahdimilikiadalahFA.MTWdantelahdisimpankedalamekstensi.MTPmenjadiFA.MTP.

    >latihan5latihan5$X[1]1081391114641275

    $Y1[1]8.046.957.588.818.339.967.244.2610.844.825.68

    $Y2[1]9.148.148.748.779.268.106.133.109.137.264.74

    $Y3[1]7.466.7712.747.117.818.846.085.398.156.425.73

    $X4[1]888888819888

    $Y4[1]6.585.767.718.848.477.045.2512.505.567.916.89

  • sht90 GrafikMenggunakanRCommander

    43

    BAB4GRAFIKMENGGUNAKANRCommander

    Pada bab ini akan dibahas penggunaan RCommander untuk membuat

    penyajianstatistikdeskriptifdarisuatukumpulandata.Fokusutamaadalahpembuatanbeberapamacambentukgrafikyangbanyakdigunakandalamanalisisdata.

    Sebagai langkahawal,bukakembaliprogramRdenganmengklik iconR2.7.2.Kemudian,ubahdirektoridimana fileworkspaceberada.Misalkan file latihan4.RData(hasil impor data SPSS dengan nama file WORLD95.SAV) ada di C:\Kerja_R, makadirektori diubah ke C:\Kerja_R. Load file workspace tersebut dengan menggunakanmenuFile,pilihLoadWorkspacesepertipadagambarberikutini.

    Gambar4.1.JendeladialoguntukLoadWorkspace

    SetelahdiklikLoadWorkspacemakajendelaRakanmemberikanpilihandirektoridanfile workspace mana yang akan ditampilkan, seperti yang terlihat pada Gambar 4.2.Pilihlahfileworkspacelatihan4.RDatayangadadidirektoriC:\Kerja_R.

  • sht90 GrafikMenggunakanRCommander

    44

    Gambar4.2.Jendeladialoguntukpilihanfileworkspaceyangakandiaktifkan

    LangkahselanjutnyaadalahmengaktifkanRcommanderdenganmenggunakanperintahlibrary(Rcmdr).Setelahitu,aktifkandatasetdenganmenggunakanmenuData,klikDatasetaktif,danPilihdatasetaktifsepertiyangditampilkanpadaGambar4.3.

    Gambar4.3.Jendeladialoguntukmemilihdatasetyangakandiaktifkan

  • sht90 GrafikMenggunakanRCommander

    45

    DaribeberapapilihanDatasetsyangada,kliklatihan4sebagaifileworkspaceyangakandiaktifkan,sepertipadaGambar4.4.Dengandemikian,prosespengaktifankembalidatalatihan4 sudahdilakukan,danproses analisisdatabaik secara statistikdeskriptif atauinferensdapatdilakukan.

    Gambar4.4.Jendeladialoguntukpilihandatasetyangakandiaktifkan

    4.1.GrafikdalamRGUI

    R menyediakan banyak menu pilihan grafik pada RCommander, antara lainHistogram,Diagram Batang danDaun, Boxplot, dan lainlain. Secara lengkap pilihangrafikyangtersediadapatdilihatpadagambarberikutini.

    Gambar4.5.JendeladialoguntukpilihanGrafikpadaRCommander

  • sht90 GrafikMenggunakanRCommander

    46

    4.2.GrafikHistogram

    Menu yang digunakan untuk membuat grafik histogram adalah Grafik, pilihHistogram .Misalkan akan dibuat histogram untuk variabel LIFEEXPF (usia harapanhidupwanitadi suatunegara),makapada jendeladialogyangmuncul,pilih LIFEEXPFsepertipadaGambar4.5.IsikanjumlahintervalyangdiinginkanpadakolomBanyaknyabin,danklikOKuntukmenampilkanoutputhistogramnya.

    Gambar4.5.Jendeladialogpilihanvariabeluntukpembuatanhistogram

    OutputhistogramuntukdataLIFEEXPFyangdiperolehdariperintahdiatasdapatdilihatpadaGambar4.6.Dalam contoh ini,digunakanmetodeautountukpemilihan jumlahinterval,yaitumetodeSturgesdanCacahanFrekuensiyangdigunakanuntuknilai(SkalaSumbu)yangdiplotkanpadahistogram.Selain itudapatdigunakanpilihanPersentaseatauKepadatanpadaSkalaSumbu.

    OutputhistograminidapatdisimpandenganmenggunakanmenuFile,danpilihSaveasdarijendelagrafik.Pilihlahoutputyangsesuai,misalkansajadalamformatPDF.Maka pilih format PDF dalam daftar format file output. Selanjutnya, beri nama fileoutput dengan histogramLIFEEXPF.PDF. Selain itu, output histogram ini dapat puladisimpandalamformatMetafile,Postcript,Png,Bmp,danJpeg.

    Jikafilehistograminiingindikopiuntukdiinsertkedalamprogramlain,misalkankedalamMicrosoftWord,makadapatdigunakanmenuFile,pilihCopytotheclipboard,danpilihasaBitmapatauCtrlC.Kemudian,bukaprogramMicrosoftWord,maka filegrafikdapatdipastekanmenggunakanperintahCtrlV.

  • sht90 GrafikMenggunakanRCommander

    47

    Gambar4.6.OutputhistogrampadavariabelLIFESXPF

    SelainmenggunakanmenudiRCommander,pembuatanhistogramdapat jugadilakukan dengan command line di RConsole, yaitu dengan command hist diikutiargumenoptionalyangdiinginkan.BerikutadalahcontohpembuatanhistogramdengancommandlineuntukvariabelLIFEEXPFdanLIFEEXPM(usiaharapanhiduppriadisuatunegara).

    >Hist(latihan4$LIFEEXPF,scale="frequency",breaks="Sturges",col="darkgray")>Hist(latihan4$LIFEEXPF,scale="frequency",breaks=10,col="darkgray")>hist(latihan4$LIFEEXPF)>#lihatperbedaanoutputhistogramyangdihasilkan>Hist(latihan4$LIFEEXPM,scale="frequency",breaks="Sturges",col="darkgray")>Hist(latihan4$LIFEEXPM,scale="frequency",breaks=10,col="darkgray")>hist(latihan4$LIFEEXPM)

  • sht90 GrafikMenggunakanRCommander

    48

    4.3.DiagramBatangdanDaun(StemandLeaf)

    MenuyangdigunakanuntukmembuatdiagrambatangdandaunadalahGrafik,pilihSajianBatangdanDaun .MisalkanakandibuatdiagrambatangdandaununtukvariabelLIFEEXPF,makapada jendeladialogyangmuncul,pilihLIFEEXPF sepertipadaGambar4.7.

    Gambar4.7.Jendeladialoguntukpembuatandiagrambatangdandaun

    Isikanargumenoptionalyangdiinginkanpadakolomkolomyang tersedia,danklikOKuntuk menampilkan output diagram batang dan daun. Output dari diagram ini akanditampilkandiJendelaKeluaranpadaRCommandersepertipadaGambar4.8.

    Outputtersebutmenjelaskanbahwabilanganpadadaunmenunjukkannilainilaisatuan. Sehingga dapat diinterpretasikan bahwa usia harapan hidup wanita yangterendah adalah 43 tahun dan yang tertinggi adalah 82 tahun. Ada 3 (tiga) negaradengan usia harapan hidup wanitanya sebesar 82 tahun. Dalam contoh ini, pilihanAutomatikmenghasilkandiagrambatangdandaundengan jumlahkelasdalam setiapbatangadalah5kelasinterval.

  • sht90 GrafikMenggunakanRCommander

    49

    >stem.leaf(latihan4$LIFEEXPF) 1 | 2: represents 12 leaf unit: 1 n: 109 LO: 43 44 44 45 45 46 47 9 5* | 00 12 t | 223 15 f | 455 17 s | 77 22 5. | 88889 6* | 23 t | 3 26 f | 455 32 s | 677777 39 6. | 8888899 45 7* | 000001 51 t | 222333 (14) f | 44444555555555 44 s | 66666777777888888888 24 7. | 9999999 17 8* | 00000001111111 3 t | 222

    Gambar4.8.OutputdiagrambatangdandaunpadavariabelLIFESXPF

    Pembuatandiagrambatangdandauninidapatjugadilakukandengancommandline di RConsole, yaitu dengan command stem.leaf diikuti argumen optional yangdiinginkan. Berikut adalah contoh pembuatan diagram batang dan daun dengancommandlineuntukvariabelLIFEEXPFdanLIFEEXPM.

    >stem.leaf(latihan4$LIFEEXPF)>stem.leaf(latihan4$LIFEEXPF,m=2)>stem.leaf(latihan4$LIFEEXPF,style="bare",unit=1)>#lihatperbedaanoutputdiagrambatangdandaunyangdihasilkan>stem.leaf(latihan4$LIFEEXPM)>stem.leaf(latihan4$LIFEEXPM,m=3)>stem.leaf(latihan4$LIFEEXPF,style="bare",unit=1)

  • sht90 GrafikMenggunakanRCommander

    50

    4.4.GrafikBoxPlot

    RmenyediakanpilihanBoxplotpadamenuGrafikuntukmembuat tampilanBoxPlot dari suatu data. Misalkan akan dibuat BoxPlot untuk variabel LIFEEXPFberdasarkan RELIGION (kelompok agama mayoritas di negara tersebut), maka padajendeladialogyangmuncul,pilihLIFEEXPFsepertipadaGambar4.9.

    Gambar4.9.JendeladialoguntukpilihanvariabeldalampembuatanBoxplot

    Setelah itu,pilihPlotdengankelompok sehinggadiperoleh tampilan jendela sepertipadaGambar4.10.KlikRELIGIONsebagaivariabelkelompok,dankemudianklikOK.

    Gambar4.10.JendeladialoguntukpilihanvariabelkelompokdalamBoxplot

    OutputdariBoxPlotyangdiperolehakanditampilkandiJendelaKeluaranpadaRCommander seperti pada Gambar 4.11. Output tersebut menjelaskan bahwa usiaharapan hidup wanita di negara dengan mayoritas penduduknya beragama Jewish(Yahudi)danProtestansecararatarataadalahpalingtinggidibandinglainnya.

  • sht90 GrafikMenggunakanRCommander

    51

    Gambar4.11.OutputBoxPlotpadavariabelLIFESXPFberdasarkanRELIGION

    Command linedi RConsole dapat juga digunakan untuk pembuatanBoxPlot,yaitu dengan command boxplot diikuti argumen optional yang diinginkan. BerikutadalahcontohpembuatanBoxPlotdengancommand lineuntukvariabelLIFEEXPFdanLIFEEXPMsendirisendiridanberdasarkanvariabelRELIGION.

    >boxplot(latihan4$LIFEEXPF)>boxplot(latihan4$LIFEEXPM)>boxplot(LIFEEXPF~RELIGION,ylab="LIFEEXPF",xlab="RELIGION",data=latihan4)>boxplot(latihan4$LIFEEXPF~latihan4$RELIGION)>#lihatperbedaanoutputBoxPlotyangdihasilkan

    4.5.GrafikQQPlot

    QQPlot merupakan salah satu metode eksplorasi secara grafik yang dapatdigunakan untuk menguji apakah suatu data berdistribusi normal. Untuk membuatgrafik QQPlot, R menyediakan pilihan QQPlot pada menu Grafik. Misalkan akandibuatQQPlotuntukvariabel LIFEEXPF,makapada jendeladialogyangmuncul,pilihLIFEEXPFsepertipadaGambar4.12.

  • sht90 GrafikMenggunakanRCommander

    52

    Gambar4.12.JendeladialoguntukpilihanvariabeldalampembuatanQQPlot

    Kemudian pilih LIFEEXPF dari daftar variabel dan gunakan distribusi normal sebagaidistribusidefaultpadaQQPlot.KlikOK,makaakandiperolehgrafiksepertiberikut.

    Gambar4.13.OutputQQPlotpadavariabelLIFESXPF

  • sht90 GrafikMenggunakanRCommander

    53

    BerdasarkanoutputpadaGambar4.13dapatdijelaskanbahwavariabelLIFEEXPFtidakberdistribusi normal dan data cenderung menceng ke kanan (ekor lebih panjang dibagiankiri).Haliniterlihatjelasjugadarigrafikhistogramnya(lihatGambar4.6).

    Command linediRConsoledapat jugadigunakanuntukpembuatanQQPlot,yaitu dengan command boxplot diikuti argumen optional yang diinginkan. BerikutadalahcontohpembuatanBoxPlotdengancommand lineuntukvariabelLIFEEXPFdanLIFEEXPMsendirisendiridanberdasarkanvariabelRELIGION.

    >qq.plot(latihan4$LIFEEXPF,dist="norm",labels=FALSE)>qq.plot(latihan4$LIFEEXPM,dist="norm",labels=FALSE)

    4.6.GrafikDiagramPencar(ScatterPlot)

    R menyediakan pilihan Diagram pencar pada menu Grafik untuk membuattampilanScatterPlotdari suatudata.MisalkanakandibuatScatterPlotuntukvariabelLIFEEXPF sebagai sumbu Y dan variabel LOGGDP sebagai sumbu X. Gunakan defaultuntukpilihanyanglain,sepertipadaGambar4.14.

    Gambar4.14.JendeladialogpilihanvariabeldalampembuatanDiagramPencar

  • sht90 GrafikMenggunakanRCommander

    54

    Kemudianpilih LOG_GDPpada variabelXdan LIFEEXPFuntuk variabelY,dan klikOKsehinggadiperolehoutputgrafiksepertiberikutini.

    Gambar4.15.OutputDiagramPencarantaravariabelLOG_GDPdanLIFESXPF

    Pada output Diagram Pencar, diperoleh juga grafik BoxPlot dari setiap marginalvariabel, dan garis regresi linear dan nonparametrik terbaik untuk menggambarkanhubunganantarakeduavariabelini.

    Command linediRConsoledapat jugadigunakanuntukpembuatanDiagramPencar di atas, yaitu dengan command scatterplot diikuti argumen optional yangdiinginkan.Berikut adalah contoh pembuatanDiagramPencardengan command lineuntuk variabel LIFEEXPF sebagai sumbu Y, dan LOG_GDP sebagai sumbu X, sepertiperintahdiRCommanderdiatas.

    >scatterplot(LIFEEXPF~LOG_GDP,reg.line=lm,smooth=TRUE,labels=FALSE,boxplots='xy',span=0.5,data=latihan4)

  • sht90 GrafikMenggunakanRCommander

    55

    4.7.GrafikPlotRatarata(Mean)

    R menyediakan pilihan Plot Rerata pada menu Grafik untuk membuattampilan Plot Ratarata dari suatu data. Misalkan akan dibuat Plot Ratarata untukvariabelLIFEEXPFberdasarkanREGION(kelompokwilayahnegara),makapada jendeladialog yang muncul, pilih REGION dan LIFEEXPF seperti pada Gambar 4.16. Klik OK,sehinggadiperolehoutputsepertipadaGambar4.17.

    Gambar4.16.JendeladialogpilihanvariabeldalampembuatanPlotRatarata

    Gambar4.17.OutputPlotRataratavariabelREGIONdanLIFESXPF

  • sht90 GrafikMenggunakanRCommander

    56

    Padaoutput PlotRataratadi atasdapatdilihatbahwa LIFEEXPF (usiaharapan hidupwanita)yangterendahrataratanyaadalahpadanegaranegaradiAfrika.

    Command linediRConsoleuntukpembuatanPlotRatarataadalahcommandplotMeansdiikutiargumenoptionalyangdiinginkan.BerikutadalahcontohpembuatanPlotRataratadengancommandlineuntukvariabelLIFEEXPFdanREGION.

    >plotMeans(latihan4$LIFEEXPF,latihan4$REGION,error.bars="se")>plotMeans(latihan4$LIFEEXPF,latihan4$REGION,error.bars="conf.int",level=0.95)

    4.8.DiagramBatang(BarChart)

    R menyediakan pilihan Diagram batang padamenu Grafik untuk membuattampilanDiagramBatangdarisuatudata.MisalkanakandibuatDiagramBatanguntukvariabel REGION,maka pada jendela dialog yangmuncul, pilih REGION seperti padaGambar4.18berikutini.

    Gambar4.18.JendeladialogpilihanvariabeldalampembuatanDiagramBatang

    Setelah itu klikOK,dan akandiperolehoutputDiagramBatang sepertipadaGambar4.19. Padaoutput tersebutdapatdilihatbahwa ada dua kelompokREGION terbesar,yaitunegaranegarayangtermasukdiregionalOECPdanAmerikaLatin.

    Command linediRConsoledapat jugadigunakanuntukpembuatanDiagramBatang, yaitu dengan command barplot diikuti argumen optional yang diinginkan.BerikutadalahcontohpembuatanDiagramBatangdengancommandlineuntukvariabelREGION,sepertiperintahdiRCommanderdiatas.

    >barplot(table(latihan4$REGION),xlab="REGION",ylab="Frequency")

  • sht90 GrafikMenggunakanRCommander

    57

    Gambar4.19.OutputDiagramBatangdarivariabelREGION

    4.9.DiagramLingkaran(PieChart)

    TampilanDiagramLingkaranpadapaketRdisediakanmelaluipilihanDiagramlingkaranpadamenuGrafik.MisalkanakandibuatDiagramLingkaranuntukvariabelREGION,makapadajendeladialogyangmuncul,pilihREGIONsepertipadaGambar4.20berikutini.

    Gambar4.20.JendeladialogpilihanvariabeldalampembuatanDiagramLingkaran

    KemudianklikOK,danakandiperolehoutputDiagramLingkaransepertiyang terlihatpadaGambar4.21.

  • sht90 GrafikMenggunakanRCommander

    58

    Gambar4.21.OutputDiagramLingkarandarivariabelREGION

    Command linediRConsoleyangdapatdigunakanuntukpembuatanDiagramLingkaran adalahpiediikutiargumenoptionalyangdiinginkan.Berikutadalah contohpembuatanDiagram Lingkarandengan command lineuntuk variabelREGION, sepertiperintahdiRCommanderdiatas.

    >pie(table(latihan4$REGION),labels=levels(latihan4$REGION),main="REGION",col=rainbow(length(levels(latihan4$REGION))))

    4.10.PlotIndeks

    Plot Indeks adalah suatu plot dari variabelmenurut indeks atau urutan data.Plot ini dalam analisis data statistik lebih dikenal dengan Time Series Plot. Rmenyediakan pilihan Plot Indeks pada menu Grafik untuk membuat tampilan PlotIndeksdarisuatudata.PadaRCommanderinihanyatersediaduapilihantipedariplot,yaituPakudanPoin.MisalkanakandibuatPlot IndeksuntukvariabelLIFEEXPF,makapada jendeladialogyangmuncul,pilihLIFEEXPFsepertipadaGambar4.22.Dalamhalini,pilih tipeplotPaku,dankemudianklikOK, sehinggadiperolehoutputPlot IndekssepertiyangterlihatpadaGambar4.23.

  • sht90 GrafikMenggunakanRCommander

    59

    Gambar4.22.JendeladialogpilihanvariabeldalampembuatanPlotIndeks

    Gambar4.23.OutputPlotIndeksdarivariabelLIFEEXPF

    CommandlinediRConsoleyangdapatdigunakanuntukpembuatanPlotIndeks

    adalah plot diikuti argumen optional yang diinginkan. Jika akan menampilkan plotberupa garis, maka dapat digunakan pilihan type=l, yang berarti line atau garis.Berikut adalah contoh pembuatan Plot Indeks dengan command line untuk variabelLIFEEXPF.

  • sht90 GrafikMenggunakanRCommander

    60

    >plot(latihan4$LIFEEXPF,type="h")>plot(latihan4$LIFEEXPF,type="p")>plot(latihan4$LIFEEXPF,type="l",main="TimeSeriesPlotDataLIFEEXPF")

    Berikut iniadalahoutputPlot IndekspadavariabelLIFEEXPFdenganpilihan tipegaris(line)yangdinotasikandenganl.

    Gambar4.24.OutputPlotIndeksdarivariabelLIFEEXPFdengantype=l

  • sht90 FungsiDistribusiPeluangdiRCommander

    61

    BAB5FUNGSIDISTRIBUSIPELUANGDIRCommander

    PadababiniakandijelaskanpenggunaanRCommanderuntukperhitunganyang

    berkaitan dengan fungsi distribusi peluang. RCommandermenyediakan menu untukmelakukanbeberapaoperasi standaryangberkaitandengan fungsidistribusipeluang,yaitu:

    Perhitungannilaikuantil Perhitungannilaipeluang Pembuatanplotdistribusiataugrafikdensitas Pembuatanplotdistribusikumulatif Pembangkitandataataurandomdata

    Secara umum ada dua macam distribusi yang disediakan paket R, yaitu DistribusiKontinudanDiskrit.Untukmengetahuidistribusikontinuataudiskritapasajayangadadi R, dapat dilakukan dengan memilih menu Distribusi, kemudian pilih DistribusiKontinu, sehinggaakanmunculpilihandariberbagaidistribusikontinuyangadadiR,sepertiyangterlihatpadaGambar5.1.

    Gambar5.1.JendeladialoguntukpilihanDistribusiKontinu

    DariGambar5.1dapatdilihatmacammacamdistribusikontinuyangadadiR,yaitu Distribusi Normal, t, Chikuadrat, F, Eksponensial, Seragam, Beta, Cauchy,Logistik,LogNormal,Gamma,Weibull,danGumbel.Secaraumum,prosesperhitunganyang berkaitan dengan distribusi peluang untuk macammacam distribusi kontinutersebutadalahrelatifsama.Untukitu,padababinifokuspembahasanhanyadiberikanpadadistribusiyangbanyakdipakaidianalisisstatistikadasar,yaituDistribusiNormal.

  • sht90 FungsiDistribusiPeluangdiRCommander

    62

    Distribusi Diskrit yang disediakan di R dapat dilihat dengan memilih menuDistribusi,kemudianpilihDistribusiDiskrit,sehinggaakanmunculpilihandariberbagaidistribusidiskrityangadadiR,sepertiyang terlihatpadaGambar5.2.Darigambar inidapatdilihatbahwadistribusidiskrityangadadiRadalahDistribusiBinomial,Poisson,Geometrik,Hipergeometrik,danBinomialNegatif.

    Gambar5.2.JendeladialoguntukpilihanDistribusiDiskrit

    5.1.FungsiDistribusiKontinu

    Pada bagian ini akan dijelaskan cara perhitungan berkaitan dengan fungsidistribusipeluang,yaituperhitungannilaikuantil,pembuatanplotataugrafikdensitas,pembuatan plot distribusi kumulatif, dan pembangkitan data dari distribusi kontinu,khususnya Distribusi Normal yang banyak digunakan dalam analisis statistika dasar.Secara umum, fungsi kepadatan probabilitas dari Distribusi Normal adalah sebagaiberikut

    2

    21

    21)(

    =

    x

    exf ,untuk

  • sht90 FungsiDistribusiPeluangdiRCommander

    63

    Gambar5.3.JendeladialoguntukperhitunganKuantilNormal

    Misalkanakandihitungnilaikuantil=0,05(5%)dariDistribusiNormalStandar,yaituingindicarinilai Z sedemikianhingga

    05,0)( = ZZP (luasanlowertailatauekorbawah),makapada jendela isianPeluang tulisnilai0.05.Dalamhal ini ratarata adalah0dandeviasistandar1.KemudianklikOK,sehinggaakandiperolehnilaipadajendelakeluaranRCommanderyaitu 644854.105,0 =Z .Pilihanekoratasatauupper taildigunakan jikaingindicarinilai 1Z sedemikianhingga

    = 1)( 1ZZP (luasanuppertailatauekoratas).Jikapilihanekoratasyangdigunakan,makakeluaranRCommandermemberikannilai1.644854padajendelakeluarannya.

    SelainmenggunakanmenudiRCommander,perhitungankuantilnormaldapatjuga dilakukan dengan command line di RConsole, yaitu dengan command qnormdiikuti argumen optional yang diinginkan. Berikut adalah contoh perhitungan kuantilnormaldengancommandlineuntuk=0,05.

    >qnorm(c(0.05),mean=0,sd=1,lower.tail=TRUE)[1]1.644854

    >qnorm(c(0.05),mean=10,sd=2,lower.tail=TRUE)[1]6.710293

    >qnorm(c(0.05),mean=0,sd=1,lower.tail=FALSE)[1]1.644854

    >qnorm(c(0.05),mean=10,sd=2,lower.tail=FALSE)[1]13.28971

  • sht90 FungsiDistribusiPeluangdiRCommander

    64

    5.1.2.MenghitungPeluangdariDistribusiNormal

    Perhitungan peluang dari suatu nilai tertentu dari Distribusi Normal dapatdilakukan dengan RCommander, yaitu gunakan menu Distribusi, pilih DistribusiKontinu,pilihDistribusiNormal,dankemudianklikPeluangNormal.SetelahituakanterlihatjendelapilihanuntukmemperolehpeluangyangdicarisepertipadaGambar5.4berikutini.

    Gambar5.4.JendeladialoguntukperhitunganPeluangNormal

    Ada empat isian utama dari jendela dialog untuk perhitungan PeluangNormal, yaituNilai peubah,mu, sigma, dan pilihan Ekor bawah atau Ekor atas. Secaramatematis,fasilitasinidapatdigunakanuntukmenghitung

    )( cXP =?(luasanlowertailatauekorbawah),dan

    )( cXP =?(luasanuppertailatauekoratas),darisuatupeubah(variabel)random X yangberdistribusiNormal,atau ),(~ NX .

    MisalkanakandihitungnilaipeluangdariDistribusiNormalStandar,yaituingindicarinilai

    )3( ZP =?(luasanlowertailatauekorbawah),makapadajendela isianNilaipeubahtulisnilai3.Dalamhal iniratarataadalah0dandeviasi standar 1. Klik OK, sehingga akan diperoleh nilai 0.001349898 pada jendelakeluaranRCommander.Pilihanekoratasatauuppertaildigunakanjikaingindicarinilai

    )( cZP =?(luasanuppertailatauekoratas).Jikapilihanekoratasyangdigunakandan 3=c ,makakeluaranRCommanderjugaakanmemberikannilai0.001349898padajendelakeluarannya.

  • sht90 FungsiDistribusiPeluangdiRCommander

    65

    Perhitunganpeluangnormaldapat jugadilakukandengan command linediR

    Console, yaitu dengan command pnorm diikuti argumen optional yang diinginkan.Berikut adalah contoh perhitungan peluang normal dengan command line untukberbagainilaipeubah.

    >pnorm(c(3),mean=0,sd=1,lower.tail=TRUE)[1]0.001349898

    >pnorm(c(6.710293),mean=10,sd=2,lower.tail=TRUE)[1]0.05000001

    >pnorm(c(3),mean=0,sd=1,lower.tail=FALSE)[1]0.001349898

    >pnorm(c(13.28971),mean=10,sd=2,lower.tail=FALSE)[1]0.04999986

    5.1.3.MembuatPlotdariDistribusiNormal

    PlotdariDistribusiNormalteoritisdenganrataratadandeviasistandartertentudapatdilakukandenganRCommander,yaitugunakanmenuDistribusi,pilihDistribusiKontinu,pilihDistribusiNormal,dankemudianklikPlotDistribusiNormal.Setelahituakan terlihat jendela pilihan untuk mendapatkan plot distribusi normal teoritis yangingindicarisepertipadaGambar5.5dibawahini.

    Gambar5.5.JendeladialoguntukpembuatanPlotDistribusiNormal

    Misalkan akan dibuat plot fungsi kepadatan peluang dari Distribusi NormalStandar,makapadajendelaisianmu(rerata)tulisnilai0dansigma(simpanganbaku)1.KlikpilihanPlotfungsikepadatan,dankemudianklikOK,sehinggaakandiperolehplotfungsikepadatandariDistribusiNormalStandarsepertipadaGambar5.6berikutini.

  • sht90 FungsiDistribusiPeluangdiRCommander

    66

    Gambar5.6.OutputplotfungsikepadatanDistribusiNormalStandar

    JikapilihanPlot fungsidistribusi (kumulatif)yangdipilih,makaakandiperolehoutputplot fungsi distribusi kumulatif dari Distribusi Normal Standar seperti terlihat padaGambar5.7.

    Gambar5.7.OutputplotfungsidistribusikumulatifdariDistribusiNormalStandar

  • sht90 FungsiDistribusiPeluangdiRCommander

    67

    Pembuatan plot fungsi kepadatan dan fungsi distribusi kumulatif dapat juga

    dilakukan dengan command line diRConsole, yaitu dengan command dnorm (untukplot fungsi kepadatan) dan command pnorm (untuk plot fungsi distribusi kumulatif)diikutiargumenoptionalyangdiinginkan.Berikutadalahcontohpembuatanplotfungsikepadatandengancommandlineuntuksuatunilaipeubah.

    >.xplot(.x,dnorm(.x,mean=0,sd=1),xlab="x",ylab="Density",main=expression(paste("NormalDistribution:",mu,"=0,",sigma,"=1")),type="l")>abline(h=0,col="gray")

    Sedangkan contoh pembuatan plot fungsi distribusi kumulatif dengan command lineuntuksuatunilaipeubahadalahsepertiberikut.

    >.xplot(.x,pnorm(.x,mean=0,sd=1),xlab="x",ylab="CumulativeProbability",main=expression(paste("NormalDistribution:",mu,"=0,",sigma,"=1")),type="l")>abline(h=0,col="gray")>#perhatikanperbedaanoutputyangdihasilkan

    5.1.4.MembangkitkanDatadariDistribusiNormal

    Rmenyediakan fasilitas untukmembangkitkan data yangmengikuti distribusistatistika tertentu.Misalkanakandibangkitkandatayangmengikutidistribusinormal,makadapatdigunakanmenuDistribusi,pilihDistribusiKontinu,pilihDistribusiNormal,dan kemudian klik SampeldariDistribusiNormal . Setelah ituakan terlihat jendelapilihanuntukpembangkitandatadaridistribusinormalsepertipadaGambar5.8.

    Sebagaicontoh,akandibangkitkandata sebanyak15barisdan10kolomyangmengikutiDistribusiNormalStandar,makatulisnamadatasethasildaridatabangkitanpada isian Masukkan nama untuk data set (misalkan dengan nama latihan5). Padajendelaisianmu(rerata)tulisnilai0,sigma(simpanganbaku)1,Ukuransampel(baris)15, dan Banyaknya pengamatan (kolom) 10. Jika ratarata sampel juga inginditambahkan, maka klik pada pilihan Rerata sampel, dan kemudian klik OK. Pilihanpilihanyanglain,yaituJumlahsampeldanDeviasibakusampeljugadapatditampilkanjikadiinginkan.

  • sht90 FungsiDistribusiPeluangdiRCommander

    68

    Gambar5.8.JendeladialoguntukmembangkitkandatadariDistribusiNormal

    Untukmengetahuihasildatayangdibangkitkan,klikpilihanLihatdatasetpadaRCommander, sehingga akan terlihatdatadatahasilbangkitan sepertipadaGambar5.9.Secaraumumakandiperoleh15barissampeldan11kolomdata,yaitu10kolomdatahasilbangkitandan1kolomterakhiryangberisirataratadarisetiapsampelyangdibangkitkan.

    Gambar5.9.OutputdatahasilbangkitandariDistribusiNormalStandar

  • sht90 FungsiDistribusiPeluangdiRCommander

    69

    Pembangkitan data dari suatu distribusi statistika tertentu ini juga dapat

    dilakukan dengan command line di RConsole, yaitu dengan command rnorm (untukDistribusi Normal) diikuti argumen optional yang diinginkan. Berikut adalah contohpembangkitandatadengancommandlineuntukDistribusiNormaldenganrataratadandeviasistandartertentu.

    >rnorm(15,mean=0,sd=1)[1]0.660257510.207162941.037686241.599514440.090306041.90549079[7]1.687788430.083684230.964726230.103008760.272611010.16491906[13]0.526977990.574489610.45865682

    >latihan5rownames(latihan5)colnames(latihan5)latihan5$meanshowData(latihan5,placement='20+200',font=getRcmdr('logFont'),maxwidth=80,maxheight=30)>#Bangkitkandatadansimpanhasilnyadalambentuksepertimatriks>as.data.frame(matrix(rnorm(15*5,mean=100,sd=10),ncol=5))

    V1 V2 V3 V4 V51 84.46823 108.53078 104.05075 77.02379 91.559032 98.15929 93.74033 124.44052 80.38603 102.476903 95.00374 106.84794 104.09301 106.48609 97.346084 101.29297 118.54484 81.04212 98.63245 102.882335 98.92599 86.56266 86.52845 66.00474 90.274466 95.15418 102.50113 105.34845 79.55246 97.738247 106.38983 89.38471 85.31907 100.10805 91.511238 86.04483 104.22601 80.81650 101.08752 120.838869 84.41069 105.68604 91.14394 99.07307 99.3754310 112.78286 104.58306 108.08592 109.01078 110.8705311 109.17854 99.67204 97.54832 91.57182 104.0240512 100.85442 98.14412 100.82436 97.54563 88.3249213 111.41381 100.48431 103.03010 100.38959 101.0026614 124.13427 101.54886 98.13771 102.57961 114.7624615 93.99127 108.28097 107.97942 94.53939 86.2012316 90.35201 123.02141 103.70384 95.25282 100.77538

    SecaraumumRmenyediakanfasilitasuntukmembangkitkandatadariberbagai

    distribusi statistikayangkontinu.Daftar lengkapberkaitandengan command linediRuntukmembangkitkan data dari distribusi kontinu beserta argumen dan library yangdiperlukandapatdilihatpadaTabel5.1.

  • sht90 FungsiDistribusiPeluangdiRCommander

    70

    Tabel5.1.DaftarfungsiR(commandline)untukmembangkitkandatayang mengikutisuatudistribusikontinutertentu

    DistribusiKontinu FungsiR Argumenyangdiperlukan library

    Beta rbeta n,shape1,shape2 stats

    Cauchy rcauchy n,location=0,scale=1 stats

    Chisquared rchisq n,df stats

    Eksponensial rexp n,rate stats

    F rf n,df1,df2 stats

    Gamma rgamma n,shape,rate=1 stats

    Lognormal rlnorm n,mean,sd stats

    Logistic rlogis n,location=0,scale=1 stats

    Normal rnorm n,mean,sd stats

    Studentt rt n,df stats

    Seragam(Uniform) runif n,min,max stats

    Weibull rweibull n,shape,scale=1 stats

    MultivariateNormal mvrnorm n=1,mu,Sigma MASS

    5.2.FungsiDistribusiDiskrit

    SepertipadabagianDistribusiKontinu,padabagianFungsiDistribusiDiskrit iniakan dijelaskan cara perhitungan berkaitan dengan fungsi distribusi peluang, yaituperhitungannilaikuantil,pembuatanplotataugrafikdensitas,pembuatanplotdistribusikumulatif, dan pembangkitan data dari suatu distribusi diskrit. Dalam hal ini, fokuspembahasan hanya diberikan pada Distribusi Binomial, sedangkan untuk distribusidiskrityanglaindapatdilakukandengancarayangrelatifsama.

    Secara umum, fungsi kepadatan probabilitas dari Distribusi Binomial adalahsebagaiberikut

    xnx ppxn

    xf

    = )1()( ,untuk ),,2,1,0{ nx K=

    dengan n adalahbanyaknyapengamatanataupercobaanbinomial, p adalahpeluangsukses untuk suatu percobaan binomial, dan )1( p adalah peluang gagal atau tidaksuksesnya.Notasiuntukpeubahdandistribusinyaadalah ),(~ pnBX .

  • sht90 FungsiDistribusiPeluangdiRCommander

    71

    5.2.1.MenghitungKuantildariDistribusiBinomial

    Perhitungan nilai kuantil tertentu dari Distribusi Binomial dapat dilakukandengan RCommander, yaitu gunakan menu Distribusi, pilih Distribusi Diskrit, pilihDistribusi Binomial, dan kemudian klik Kuantil Binomial . Setelah itu akan terlihatjendelapilihanuntukmendapatkankuantilyangakandicarisepertipadaGambar5.10.

    Gambar5.10.JendeladialoguntukmenghitungKuantilBinomial

    Misalkanakandihitungnilaikuantil=0,25(25%)dariDistribusiBinomialdengann=20danp=0.5atau )5.0,20(~ BX ,yaituingindicarinilai X sedemikianhingga

    25,0)( = XXP (luasanlowertailatauekorbawah).Untukmendapatkan kuantil di atas,maka pada jendela isian Peluang tulis nilai 0.25,TrialBinomial20,danPeluangSukses0.5.KemudianklikOK,sehinggaakandiperolehnilaipadajendelakeluaranRCommanderyaitu 825,0 =X ,yangberarti

    25,0)8( =XP .

    Pilihanekoratas (upper tail)digunakan jikaakandicarinilai 1X sedemikianhingga

    = 1)( 1XXP (luasanuppertailatauekoratas).Jikapilihanekoratasyangdigunakan,makakeluaranRCommandermemberikannilai12padajendelakeluarannya,yangberarti

    75,0)12( =XP .

    Perhitungankuantilbinomialdapat jugadilakukandengancommand linediRConsole, yaitu dengan command qbinom diikuti argumen optional yang diinginkan.Berikutadalahcontohperhitungankuantilbinomialdengancommandlineuntuk=0,25danyanglain.

  • sht90 FungsiDistribusiPeluangdiRCommander

    72

    >qbinom(c(0.25),size=20,prob=0.5,lower.tail=TRUE)[1]8

    >qbinom(c(0.25),size=20,prob=0.5,lower.tail=FALSE)[1]12

    >qbinom(c(0.75),size=20,prob=0.5,lower.tail=TRUE)[1]12

    5.2.2.MenghitungPeluangdariDistribusiBinomial

    Perhitungan pe