modul metstat 2 2012 prak 4 dan 5.doc

7
PRAKTIKUM IV ANALISIS REGRESI GANDA TIK: Setelah mengikuti kegiatan praktikum ini, mahasiswa diharapkan dapat mencari persamaan regresi linear ganda, dan menentukan model terbaik. Regresi Linear Berganda merupakan pengembangan dari regresi linear sederhana, dimana varibel independent (bebas) nya terdiri dari dua atau lebih. Model regresi linear berganda dengan p variable independent adalah sbb: Untuk inferensinya, dilakukan uji hipotesis untuk koefisien secara bersama-sama ataupun secara sendiri-sendiri dan menghitung interval kepercayaannya. Membuat file data: - Definisikan variabel respon Y dan variabel bebas X - Isikan data yang tersedia pada sel-sel yang sesuai Langkah-langkah sbb: - Klik Stat - Pilih Regresion - Klik Regresion - Pindahkan variabel yang dianalisa (Y) dalam kotak Response dan X dalam kotak Predictor Klik Graphs dan pilih gambar-gambar yang dibutuhkan untuk analisis, Klik OK

Upload: ayudyatri

Post on 03-Oct-2015

221 views

Category:

Documents


7 download

TRANSCRIPT

P E T U N J U K P R A K T I K U M

PRAKTIKUM IVANALISIS REGRESI GANDA

TIK:

Setelah mengikuti kegiatan praktikum ini, mahasiswa diharapkan dapat mencari persamaan regresi linear ganda, dan menentukan model terbaik. Regresi Linear Berganda merupakan pengembangan dari regresi linear sederhana, dimana varibel independent (bebas) nya terdiri dari dua atau lebih.

Model regresi linear berganda dengan p variable independent adalah sbb:

Untuk inferensinya, dilakukan uji hipotesis untuk koefisien secara bersama-sama ataupun secara sendiri-sendiri dan menghitung interval kepercayaannya.

Membuat file data:

Definisikan variabel respon Y dan variabel bebas X

Isikan data yang tersedia pada sel-sel yang sesuai

Langkah-langkah sbb:

Klik Stat

Pilih Regresion

Klik Regresion

Pindahkan variabel yang dianalisa (Y) dalam kotak Response dan X dalam kotak Predictor

Klik Graphs dan pilih gambar-gambar yang dibutuhkan untuk analisis, Klik OK

Klik Options dan pilih nilai-nilai statistik yang dibutuhkan untuk analisis, Klik OK

Klik Results dan pilih hasil yang diinginkan, Klik OK

Klik Storage dan pilih nilai-nilai yang akan dimunculkan dalam worksheet, Klik OK

Permasalahan:

Sebuah penelitian dilakukan untuk mengetahui hubungan antara banyaknya konsumsi yang dipengaruhi oleh besarnya pendapatan dan kekayaan sebuah keluarga. Dan diperoleh data sbb:konsumsiPendapatan (X1)Kekayaaan (X2)

4050500

5065659

6580856

901101136

851001023

1001201234

1101401456

1351901954

1402102129

1602202267

Lakukanlah analsis regresi untuk mencari persamaan regresi yang dapat digunakan untuk prediksi!Secara umum, metode penentuan model terbaik, dibedakan menjadi

1. Metode tanpa seleksi variabel independen

Metode yang memasukkan seluruh variabel independen yang diduga berpengaruh ke dalam model dan mengakomodasi adanya kolinieritas/multikolinieritas

Contoh : Principle Component Regression (Regresi Komponen Utama), Ridge Regression (Regresi Gulud)

2. Metode dengan seleksi

Metode yang melakukan seleksi variabel independen yang masuk ke dalam model sesuai dengan kriteria/prosedurnya

Contoh : Metode Backward, Forward, Stepwise, Best subset regressionBerdasarkan data berikut tentukan model terbaik dengan berbagai metode:

x1x2x3x4y

72666078.5

129155274.3

1156820104.3

113184787.6

75263395.9

1155922109.2

371176102.7

131224472.5

254182293.1

2147426115.9

140233483.8

1166912113.3

1068812109.4

PRAKTIKUM V

ANALISIS DATA EKSPLORATORITIK:

Setelah mengikuti kegiatan praktikum ini, mahasiswa diharapkan dapat menganalisis data menggunakan beragam teknik (sebagian besar grafis) khususnya steam and leaf dan boxplot. Analisis Eksplorasi Data (AED) adalah pendekatan/filosofi untuk menganalisis data menggunakan beragam teknik (sebagian besar grafis) untuk :

Memaksimalkan pendekatan pada data

Menemukan struktur fundamental

Menguraikan variabel-variabel penting

Mendeteksi pencilan dan keanehan

Uji asumsi mendasar Membangun model parsimoniSteam and leaf (diagram dahan daun) adalah plot yang mirip histogram dari samping, sebagai pengganti batang dari histogram digunakan digit dari nilai data asli yang menunjukkan frekuensi masing-masing baris. Digit yang ditulis dapat bernilai satuan atau bahkan ratusan tergantung dari nilai increment yang dipakai.

Boxplot adalah suatu alat statistik yang paling baik untuk menunjukkan informasi lokasi dan varians dari data, karena dalam boxplot terdiri dari box (kotak) dengan 3 garis yang menunjukkan Q1,Q2 dan Q3 serta whisker yang menggambarkan 1,5 panjang interkuartil sebagai batasan data dikatakan outlier atau tidak.

Langkah-langkah sbb:

Klik Stat > EDA > Boxplot Klik Stat > EDA > Steam and Leaf

Permasalahan:a. 10 bayi diukur panjangnya (dalam cm) sesaat setelah dilahirkan dan tercatat sebagai berikut : 49, 52, 58, 49, 49, 52, 49, 49, 53, 49, 58b. 30 mahasiswa dicatat nomor sepatunya, dan diperoleh data sebagai berikut : 40, 41, 40, 43, 40, 40, 40, 43, 41, 40, 39, 40, 40, 40, 40, 45, 39, 40, 38, 40, 40, 35, 40, 37, 40, 43, 39, 40, 40, 40c. Sampling jumlah nilai 7 matapelajaran di SMA dilakukan terhadap 50 mahasiswa 2 fakultas. Analisislah dengan metode Boxplot untuk mengetahui Fakultas mana yang menurut Anda lebih baik?a. Fak P : 55, 56, 55, 51, 60, 64, 54, 59, 59, 44, 63, 63, 51, 63, 61, 58, 52, 56, 53, 67, 57, 54, 56, 56, 61, 46, 57, 55, 57, 51, 55, 56, 54, 49, 57, 62, 53, 59, 59, 57, 52, 54, 63, 63, 56, 49, 55, 50

b. Fak Q : 57, 58, 51, 59, 58, 59, 64, 49, 60, 51, 56, 60, 59, 54, 60, 56, 60, 48, 62, 57, 61, 60, 56, 62, 52, 67, 61, 51, 53, 61, 59, 58, 59, 60, 69, 53, 61, 65, 53, 54, 51, 55, 67, 57, 55, 52, 58, 56Berapa satuan leafnya ?

Apakah outlier diikutkan ?

Isi dengan kolom/variabel yang akan dibuat stem and leaf nya

3

_1174705716.unknown