estimasi libre

2
 1 Kuliah Teknik Data Mining Dosen: Syandra Sari FUNGSI MINOR KEDUA DATA MINING, ESTIMASI Contoh data untuk menjelaskan Estimasi adalah data volume air minuman botol yang diisi secara otomatis. Hasil pengukuran volume air didalam 12 botol yang diambil secara acak sebagai sampel ditampilkan pada Tabel 3.1 berikut: Tabel 3.1 Data volume air minum didalam botol Nomor Botol Volume Air (ml) 1 2016 2 2025 3 1968 4 2007 5 1031 6 2055 7 2039 8 1981 9 1975 10 1964 11 2036 12 1987 Volume yg sebenarnya diharapkan untuk setiap botol adalah 2 liter (2000 ml) Data diatas menunjukkan bahwa mesin pengisi otomatis tsb tidak mengisi tiap botol dengan volume air yang tepat sama seperti yang diharapkan. Jadi jika kita diberi pertayaa : Pada uuya, berapakah olue air yag ada di dala botol? Bagaimanakah kita harus ejaabya? Pertanyaan tsb dapat dijawab dengan baik bila kita hanya menggunakan data data tsb apa adanya. Diperlukan pengolahan data misalnya dengan memperkirakan rata-rata, standar deviasi volume air. Kegiatan memperkirakan ini disebut ESTIMASI. Estimasi ini dapat berupa ESTIMASI TITIK dan juga dapat berupa ESTIMASI dengan SELANG KEPERCAYAAN. Berikut akan dijelalskan ESTIMASI TITIK saja Istilah: Populasi: seluruh data yang tersedia Sampel : contoh sebagian / cuplikan dari populasi sebagai wakil dari populasi Data pada tabel 3.1 adalah sampel dari populasi air minum botol Populasinya adalah semua air minum botol yang dip roduksi oleh perusahaan tsb, tentu j umlahnya besar sekali dan akan terus bertambah. ESTIMASI TITIK Estimasi titik adalah bentuk estimasi yang menhasilkan satu buah niali estimasi saja yaitu berupa sebuah angka. Apa yang diestimasi? Yang diestimasi adalah karakteristik sebuah populasi atau sering disebut juga PARAMETER POPULASI Rata-rata dan varians  merupakan dua ukuran yang umum digunakan untuk menunjukkan karakteristik populasi. Mengingat ukuran populsi terus bertambah akan sulit untuk menghitung rata-rata dan varians populasi. Oleh karena itu kita akan memperkirakan (meng ESTIMASI) dua parameter populasi tsb berdasarkan sampel yang ada

Upload: hafiznugraha

Post on 04-Oct-2015

224 views

Category:

Documents


0 download

DESCRIPTION

estimasi libre data mining

TRANSCRIPT

  • 1

    Kuliah Teknik Data Mining

    Dosen: Syandra Sari

    FUNGSI MINOR KEDUA DATA MINING, ESTIMASI

    Contoh data untuk menjelaskan Estimasi adalah data volume air minuman botol yang diisi secara

    otomatis.

    Hasil pengukuran volume air didalam 12 botol yang diambil secara acak sebagai sampel ditampilkan

    pada Tabel 3.1 berikut:

    Tabel 3.1 Data volume air minum didalam botol

    Nomor Botol Volume Air (ml)

    1 2016

    2 2025

    3 1968

    4 2007

    5 1031

    6 2055

    7 2039

    8 1981

    9 1975

    10 1964

    11 2036

    12 1987

    Volume yg sebenarnya diharapkan untuk setiap botol adalah 2 liter (2000 ml)

    Data diatas menunjukkan bahwa mesin pengisi otomatis tsb tidak mengisi tiap botol dengan volume

    air yang tepat sama seperti yang diharapkan.

    Jadi jika kita diberi pertayaa : Pada uuya, berapakah olue air yag ada di dala botol? Bagaimanakah kita harus ejaabya? Pertanyaan tsb dapat dijawab dengan baik bila kita hanya menggunakan data data tsb apa adanya. Diperlukan pengolahan data misalnya dengan memperkirakan rata-rata, standar deviasi volume air.

    Kegiatan memperkirakan ini disebut ESTIMASI.

    Estimasi ini dapat berupa ESTIMASI TITIK dan juga dapat berupa ESTIMASI dengan SELANG

    KEPERCAYAAN.

    Berikut akan dijelalskan ESTIMASI TITIK saja

    Istilah:

    Populasi: seluruh data yang tersedia

    Sampel : contoh sebagian / cuplikan dari populasi sebagai wakil dari populasi

    Data pada tabel 3.1 adalah sampel dari populasi air minum botol

    Populasinya adalah semua air minum botol yang diproduksi oleh perusahaan tsb, tentu jumlahnya

    besar sekali dan akan terus bertambah.

    ESTIMASI TITIK

    Estimasi titik adalah bentuk estimasi yang menhasilkan satu buah niali estimasi saja yaitu berupa

    sebuah angka.

    Apa yang diestimasi? Yang diestimasi adalah karakteristik sebuah populasi atau sering disebut juga

    PARAMETER POPULASI

    Rata-rata dan varians merupakan dua ukuran yang umum digunakan untuk menunjukkan

    karakteristik populasi.

    Mengingat ukuran populsi terus bertambah akan sulit untuk menghitung rata-rata dan varians

    populasi.

    Oleh karena itu kita akan memperkirakan (meng ESTIMASI) dua parameter populasi tsb berdasarkan

    sampel yang ada

  • 2

    Kuliah Teknik Data Mining

    Dosen: Syandra Sari

    Simbol-simbol

    Rata-rata populasi (), rata-rata sampel = x

    Varians populasi = 2 , varians sampel = s2

    Tabel 3.2 Perincian Perhitungan rata-rata dan varians untuk data tabel 3.1

    Nomor Botol xi (xi-x)2

    1 2016 81

    2 2025 324

    3 1968 1521

    4 2007 0

    5 1031 576

    6 2055 2304

    7 2039 1024

    8 1981 676

    9 1975 1024

    10 1964 1849

    11 2036 841

    12 1987 400

    Jumlah 24084 10620

    Estimasi titik untuk rata-rata populasi diperoleh dari rata-rata sampel:

    Rata-rata sampel = 1

    24084 2.00712

    ni

    i

    xml

    n Estimasi titik untuk varians populasi diperoleh dari varians sampel:

    Varians sampel=

    2

    1

    ( )1

    ni

    i

    x x

    n = 10620 / (12-1) = 965,45 ml2

    Standar deviasi=

    2

    1

    ( ) 965,45( 1)n

    i

    i

    x x

    n = 31,07 ml

    Pengetahuan apa yang diperoleh? (ini dapat untuk menjawab pertanyaan diatas)

    Pada uuya setiap botol aka diisi air sebayak 2007 l (rata-rata) dengan varians sebesar 31,07 ml

    TUGAS/PR KELOMPOK

    A. Sebuah tim peneliti bermaksud memperkirakan besarnya penghasilan penduduk di suatu

    daerah. Lima belas orang yang telah bekerja atau memiliki usaha diambil secara acak dan

    ditanyai penghasilan per bulannya. Hasil yang diperoleh (dalam juta rupiah) adalah: 2,47; 1,78;

    4,76; 0,67; 4,57; 2,95; 3,17; 2,42; 1,40; 5,61; 3,49; 2,39; 1,74; 2,47; 2,05

    1. Perkirakan rata-rata dan varians penghasilan penduduk daerah tsb

    B. Tuliskan dengan bahasa / kalimat Anda sendiri Fungsi minor kedua data mining Estimasi untuk

    sub bab 3.4 SELANG KEPERCAYAAN (hal 25-28) dan PENGETAHUAN YANG DPT DIPEROLEH,

    C. Dengan menggunakan kasus dan data pada poin A diatas, Buatlah selang keyakinan 90% dan

    95% dan 99% untuk rata-rata penghasilan. Bandingkan dari segi lebar intervalnya!

    Sumber:

    Susanto, Sani dan Dedy Suryadi. 2010. Pengantar Data Mining menggali pengetahuan dari

    bongkahan data. Andi Offset: Yogyakarta.