estimasi libre
DESCRIPTION
estimasi libre data miningTRANSCRIPT
-
1
Kuliah Teknik Data Mining
Dosen: Syandra Sari
FUNGSI MINOR KEDUA DATA MINING, ESTIMASI
Contoh data untuk menjelaskan Estimasi adalah data volume air minuman botol yang diisi secara
otomatis.
Hasil pengukuran volume air didalam 12 botol yang diambil secara acak sebagai sampel ditampilkan
pada Tabel 3.1 berikut:
Tabel 3.1 Data volume air minum didalam botol
Nomor Botol Volume Air (ml)
1 2016
2 2025
3 1968
4 2007
5 1031
6 2055
7 2039
8 1981
9 1975
10 1964
11 2036
12 1987
Volume yg sebenarnya diharapkan untuk setiap botol adalah 2 liter (2000 ml)
Data diatas menunjukkan bahwa mesin pengisi otomatis tsb tidak mengisi tiap botol dengan volume
air yang tepat sama seperti yang diharapkan.
Jadi jika kita diberi pertayaa : Pada uuya, berapakah olue air yag ada di dala botol? Bagaimanakah kita harus ejaabya? Pertanyaan tsb dapat dijawab dengan baik bila kita hanya menggunakan data data tsb apa adanya. Diperlukan pengolahan data misalnya dengan memperkirakan rata-rata, standar deviasi volume air.
Kegiatan memperkirakan ini disebut ESTIMASI.
Estimasi ini dapat berupa ESTIMASI TITIK dan juga dapat berupa ESTIMASI dengan SELANG
KEPERCAYAAN.
Berikut akan dijelalskan ESTIMASI TITIK saja
Istilah:
Populasi: seluruh data yang tersedia
Sampel : contoh sebagian / cuplikan dari populasi sebagai wakil dari populasi
Data pada tabel 3.1 adalah sampel dari populasi air minum botol
Populasinya adalah semua air minum botol yang diproduksi oleh perusahaan tsb, tentu jumlahnya
besar sekali dan akan terus bertambah.
ESTIMASI TITIK
Estimasi titik adalah bentuk estimasi yang menhasilkan satu buah niali estimasi saja yaitu berupa
sebuah angka.
Apa yang diestimasi? Yang diestimasi adalah karakteristik sebuah populasi atau sering disebut juga
PARAMETER POPULASI
Rata-rata dan varians merupakan dua ukuran yang umum digunakan untuk menunjukkan
karakteristik populasi.
Mengingat ukuran populsi terus bertambah akan sulit untuk menghitung rata-rata dan varians
populasi.
Oleh karena itu kita akan memperkirakan (meng ESTIMASI) dua parameter populasi tsb berdasarkan
sampel yang ada
-
2
Kuliah Teknik Data Mining
Dosen: Syandra Sari
Simbol-simbol
Rata-rata populasi (), rata-rata sampel = x
Varians populasi = 2 , varians sampel = s2
Tabel 3.2 Perincian Perhitungan rata-rata dan varians untuk data tabel 3.1
Nomor Botol xi (xi-x)2
1 2016 81
2 2025 324
3 1968 1521
4 2007 0
5 1031 576
6 2055 2304
7 2039 1024
8 1981 676
9 1975 1024
10 1964 1849
11 2036 841
12 1987 400
Jumlah 24084 10620
Estimasi titik untuk rata-rata populasi diperoleh dari rata-rata sampel:
Rata-rata sampel = 1
24084 2.00712
ni
i
xml
n Estimasi titik untuk varians populasi diperoleh dari varians sampel:
Varians sampel=
2
1
( )1
ni
i
x x
n = 10620 / (12-1) = 965,45 ml2
Standar deviasi=
2
1
( ) 965,45( 1)n
i
i
x x
n = 31,07 ml
Pengetahuan apa yang diperoleh? (ini dapat untuk menjawab pertanyaan diatas)
Pada uuya setiap botol aka diisi air sebayak 2007 l (rata-rata) dengan varians sebesar 31,07 ml
TUGAS/PR KELOMPOK
A. Sebuah tim peneliti bermaksud memperkirakan besarnya penghasilan penduduk di suatu
daerah. Lima belas orang yang telah bekerja atau memiliki usaha diambil secara acak dan
ditanyai penghasilan per bulannya. Hasil yang diperoleh (dalam juta rupiah) adalah: 2,47; 1,78;
4,76; 0,67; 4,57; 2,95; 3,17; 2,42; 1,40; 5,61; 3,49; 2,39; 1,74; 2,47; 2,05
1. Perkirakan rata-rata dan varians penghasilan penduduk daerah tsb
B. Tuliskan dengan bahasa / kalimat Anda sendiri Fungsi minor kedua data mining Estimasi untuk
sub bab 3.4 SELANG KEPERCAYAAN (hal 25-28) dan PENGETAHUAN YANG DPT DIPEROLEH,
C. Dengan menggunakan kasus dan data pada poin A diatas, Buatlah selang keyakinan 90% dan
95% dan 99% untuk rata-rata penghasilan. Bandingkan dari segi lebar intervalnya!
Sumber:
Susanto, Sani dan Dedy Suryadi. 2010. Pengantar Data Mining menggali pengetahuan dari
bongkahan data. Andi Offset: Yogyakarta.