statistika dan analisa data dalam dunia pertambangan

Upload: ayubpasomba

Post on 12-Oct-2015

79 views

Category:

Documents


6 download

DESCRIPTION

handbook

TRANSCRIPT

STATISTIKA DAN ANALISA DATA DALAM DUNIA PERTAMBANGAN

STATISTIK DAN ANALISA DATABAB IPENDAHULUAN

Untuk mempelajari alam dapat didekati dgn dua sifat, pertama sifat alam yang sistematik, deterministic dan yang kedua adalah sifat alam yang berpola acak atau random. Pola sifat sistematik dapat dirumuskan dg formula matematik yang memperlihatkan keterkaitan antar parameter atau kejadian. Tetapi sifat random hanya dapat dirumuskan dengan pendekatan konsep statistik dimana sifat parameteralam tersebut dinyatakan dalam besaran prediksi pada suatu tingkat kepercayaan.Sifat fisis dari batuan adalah deterministic karena sifat tersebut mengikuti hukum-hukum fisika, kimia, biologi dan umumnya dapat dinyatakan dengan formula matematik. Dalam kasus pendekatan matematik sifat alam dapat didekati dengan besaran parameter yg sederhana misalnya densitas batuan yg homogen, resivitas batuan yg homogen, kecepatan gelombang homogen pada satu lapisan batuan sehingga model parameternya dapat dirumuskan.Tetapi berlainan dengan sifat fisis, keberadaan dari materi batuanatau mineral dalam bumi dapat besifat random, ataupun berpola fractal karena banyaknya parameter lingkungan yang mempengaruhi keberadaan batuan tersebut. Hanya beberapa saja parameter yang dapat diperkirakan bagaimana dan berapa besar peranannya terhadap pembentuk batuan.sebagai contoh parameter tekanan, temperatur, reaksi kimia, unsur mineral dan sebagainya. Namun dapat dikemukakan masih banyak lagi parameter lingkungan yg belum atau tidak diketahui mempengaruhi proses terbentuknya suatu batuan.Pada suatu formasi batuan sering ditemukan keberadaan materi dan berbagai berbagai macam mineral ditemukan dalam keadaan yang tidak teratur atau acak. Dalam hal ini pendekatan analisa yang dilakukan adalah dengan metode statistik. Penggabungan kedua sifat alam deterministic dan acak ini dapat dilakukan dengan optimal berdasarkan pada pendekatan statistik. Ilmu statistik dalam ilmu dan teknologi kebumian sisebut juga geostatistik.Statistik dalam geologi akan dapat dilihat peranannya dengan lebih mudah, terutama dalam menganalisa data dalam data dalam beberapa contoh kasus seperti pengolahan data kekar, uratan stratigrafi, estimasi mineral, klasifikasi data fosil, dan sebagainya :Optimasi modelfilter noiseregresi data geofisikaanomali regionalatribut seismicanalisa data logging, autokorelasi, cross-correlasianalisa peta, perbandingan peta, konturanalisa sequence untuk gempa dan letusan gunung apianalisa diskriminan untuk menentukan jenis litologi

BAB II

2.1. Karakteristik Populasi Data

UniverseUniverse (semesta) adalah ruang total materi yang dianalisa. Dengan demikian semua data yang dapat diambil disebut sebagai ruang sampel atau universe. Karakter suatu universe adalah dapat dianalisa dari satu macam atau lebih parameter (unit atau multi demiensi) tergantung pada jumlah parameter yang diukur pada masing-masing sampel.Sebagai contoh pada teknologi pertambangan dalam proses evaluasi cadangan, universe adalah deposit mineral yang terdapat pada daerah yang sedang dipelajari. Dengan demikian dalam kasus ini universe adalah deposit mineral misalnya untuk tambang tembaga, nikel, emas, timah atau mineral lainnya.Pada servey geofisika semua data yang mungkin diperoleh dalam daerah penelitian disebut universe. Sebagai contoh pengukuran gaya berat, magnetic, geolistrik, elektromagnetik akan merupakan ruang sampel atau universe pada daerah yang diselidiki.Universe harus terdifinisi dengan limit (batas) area. Batas universe dapat terbentuk struktur geologi atau didefinisikan dalam batas posisi koordinat dan atau kedalaman misalnya ditentukan sampai Lintang dan Bujur serta dengan interval kedalaman tertentu ( 50 m 100 m, permukaan sampai 250 m dsb).

Unit sampelBagian dari universe dimana pengukuran dilakukan disebut unit sampel atau titik sampel. Dengan unit sampel tersebut, karakter suatu universe nantinya diharapkan dapat dianalisa dan dijelaskan. Pemilihan unit sampel dapat ditentukan berdasarkan pada tiga hal pokok yaitu :1.Ketersediaan data2.Metode statistik yang digunakan3.Hasil target yang diharapkanKetiga hal tersebut saling tergantung misalnya hasil target yang diharapkan sangat tergantung pada ketersediaan data dan metode yang dipunyai. Demikian juga metode yang dipilih tersebut dapat tergantung pada data dan target yang dicapai.Ukuran unit sampel sangat penting karena populasi sampel jarak 10 feet dapat berbeda dengan populasi sampel jarak 50 ft. karena itu ukuran unit sampel perlu ditentukan agar karakterisasi daerah penelitian nantinya dapat mememenuhi tujuan dengan efektif. Pada kasus lapangan ukuran unit sampel ini tergantungpada ukuran target geologi, keadaan lingkungan, teknologi yang digunakan, dana dan sebagainya.Penampilan populasi data yang sangat sederhana adalah dengan menggunakan histrogram. Caranya adalah dengan mem-plot distribusi frekuensi pada sumbu ordinat dan nilai data pada sumbu absisi dan hasilnya disebut grafik histogram, dapat dilihat pada gambar berikut ;

Buat grafik histogram seperti model tersebut :Data lapangan dari mining nickel eksploitation dengan data produksi Sbb :1.Tahun 2005 produksi 1 juta ton bijih nikeldengan komposisi Nikel (Ni) 20 %; Cobalt (Co) 15 %; Molibdat (Mo) 10 % dan Besi sebagai besi oksida (FeO) 55 %2.Tahun 2006 Produksi 1,5 juta ton dengan komposisi seperti pada tahun pertama.3.Tahun 2007 produksi 2 juta ton dengan komposisi seperti pada tahun pertama4.Tahun 2008 produksi 1,5 juta ton dengan komposisi Ni 25 %; Co 20 %; Mo 15 % dan sisanya adalah besi.

Variabel Random (V.R)Variabel random adalah variabel dimana dapat diambil suatu kejadian dari beberapa kemungkinan. Misalnya kemungkinan untuk mendapatkan V.R. x adalah jumlah kemunculan x dibagi jumlah total semua sampel.

Distribusi Kemungkinan (Probabilitas)Kemungkinan muncul satu sampel dari seleksi acak digambarkan dengan distribusi probabilitas V.R. Misalnya kemungkinan untuk mendapatkan satu grade dalam interval 2 4 % pada suatu endapan mineral atau berapa kemungkinan kita mendapat batu pasir dalam reservoir dengan analisa seismic.Dalam kenyataan distribusi probabilitas tidak pernah diketahui, tapi dapat dihitung dari ekperimen dan kemudian dicoba untuk menentukan distribusi teoritik yang dihasilkannya. Pada data diskrit (ciri-ciri tersendiri) dengan nilai integer, distribusi kemungkinan akanberhubungan dengan setiap kemungkinan harga xyang dinyatakan dengan probabilitas p(x).Probabilitas p(x) selalu positif sehingga p(x) >0 dan jumlah total semua p(x) = 1 untuk harga x dalam universe.Pada distribusi kontiniu, berlaku untuk setiap x, distribusi probability dinyatakan dengan suatu fungsi densitas probabilitas f(x).Probabilitas p(x) selalu positif sehingga p(x) >0 dan jumlah total semua p(x) = 1 untuk semua harga x dalam universe.Pada distribusi kontiniu, berlaku untuk setiap x, distribusi probability dinyatakan dengan suatu fungsi densitas probabilitas f(x). Sehingga probabilitas satu harga yang terletak antara x dan(x + dx) menjadi f(x)dx dimana dx =0. Untuk probabilitas pada x kecil dari x0p(x 20%, maka dihitung lebih dulu : Z == 1.2. Dengan menggunakan tabel probabilitas komulatif z diperoleh : P(Z > 1,2) = 1,0 P(1,2)= 1,0 0,8849 = 0,1151Dengan demikian kemungkinan ditemukannya kandungan Ni > 20% adalah 1 dalam 10

Latihan :Tentukan probabilitas ditemukan 10 % 1,9 maka dapat dinyatakan bahwa kedua populasi tersebut tidak sama dengan demikian hipotesa ditolak.

2.5. Tes tPada distribusi student t dibutuhkan derajat kebebasan = n adalah jumlah parameterPada distribusi t harga t dihitung dengan rumus :

t ==X= mean sampel0= Mean populasi (18%)n = jumlah populasiS = standar deviasi observasiSe = standar error observasiContoh : tabel 6No(%) X

113

217

315

423

527

629

718

827

920

1024

Sehingga diperoleh :X=21,3S2= 30,46S= 5,52Se= 0,57Testini mempunyai satu ekor maka disebut one line test= 5 % dilihat dalam tabel, nilai kritis harha t untuk derajad kebebasan 10 &= 0,05. Harga t = 1,83H0: 118%H1: 1> 18%

Harga t hitungt == 1.89Dengan derajat kebebasan = 9 maka t = 1.83, dengan demikian data t jatuh dalam daerah kristis sehingga H0ditolak. Dengan demikian kandungan persentasi Cu lebih besar dari 18 %

2.6. Tes FUntuk membandingkan distribusi dua popilasi yang berbeda dapat dilihat dari kesamaan atau perbedaan variansi kedua populasi tersebut. Perbandingan tersebut akan dilihat berdasarkan tingkat kesamaan variansi distribusi populasi dengan tes F adalah sebagai berikut.F = S12/S22Dengan dua macam derajat kebebasan dari masing-masing populasi yaitu1= n1-12= n2-1tes statistik dilakukan dengan menguji hipotesaHipotesaH0: 12= 22H1:1222Misal nilai kritis F untuk 1= 9 dan 2= 9 dan level significance = 0.05 maka dalam tabel F diperoleh harga:F = 3.18Contoh :Kandungan (%) x pada tabel 6 sebelumnya dibandingkan dengan populasi kandungan (%) X pada tabel 7 berikut ini :Tabel 7Sampel NamberX(%)

1115

1210

1315

1423

1518

1626

1724

1818

1919

2021

Tatal = 189

Mean = 18,9

S2= 23.21S = 4.82

X= 18.9S2= 23.21S= 4.82F = S12/S22= 30.46/23.21 = 1.3Dengan demikian harga F data lebih kecil dari harga F yang diperoleh dari tabel yaitu 1.3 < 3.18 sehingga hipotesaH0diterima

ANALISIS REGRESIDAN KORELASI LINIER

Persamaan regresi linier sederhana memiliki dua variabel, misalnya x dan yY = a+b X2.34a =

b =dengan :b = koefisien arah garis regresia = intersepn = banyaknya pasangan datasemua jumlahan dihitung nilai b dan a untuk data populasi dan produk

Contoh Tabel 2.9BlokJumlah pekerja

XJumlah produkBatu bara (ton)y

XY

X2

12345678910

2

KESALAHAN STANDAR SAMPEL ESTIMASIDiperlukan nilai kesalahan standar populasisuntuk memproleh kesimpulan regresi. Nilai kesalahan standar populasi ini merupakan nilai simpangan baku (standard deviation) yang mengukur variasi titik-titik diatas dan dibawah garis regresi populasi. Jika kita tidak mengetahui nilaiS, kita mengestimasi denganSeyaitu kesalahan standard estimasi sampel. Nilai S merupakan suatu simpangan baku secara matematis sbb:Se=2.35

SOAL.Dalam penelitian mengenai banyaknya curah hujan dan jumlah kotoran udara yang terbawa hujan, terkumpul data berikut :Curah hujan, x(0,01 cm)Zarah terbawa, y(microgram per m3)

4,34,55,95,66,15,23,82,17,5126121116118114118132141108

a.Cari persamaan garis regresi untuk memprediksikan zarah yang terbawa hujan dari banyaknya curah hujan harianb.Taksir banyaknya sarah yang terbawa hujan bila curah hujan harian x = 4,8 satuan.c.Hitung kesalahan standar deviasi dari sampel tersebut dengan rumus sbb Se=

B. REGRESI GANDAAnalisis regresi ganda digunakan oleh peneliti, bila peneliti bermaksud meramalkan bagaimana keadaan (naik turunya) variabel depeneden (kriterium), bila dua atau lebih variabelindependen sebagai factor predictor dimanipulasi (dinaik turunkan nilainya). Analisis regresi ganda akan dilakukan bila jumlah variabel independennya minimal 2.Persamaan regresi untuk dua predictor adalah ;Y = a + b1X1+b2X2Regresi ganda dua predictor

NoX1X2YX1YX2YX1X2X12X22

123456789101024687467673246533432371517232210142019

jumlah

Y = produktivitas;X1= kemampuan kerja pegawaiX2= kepemimpinan direktifUntuk menghitung harga-harga a, b1; b2dapat menggunakan persamaan berikut ;

=an+b1+b2= a+ b1+= a+ b2

RUMUS KORELASI GANDARy (1,2)=Koefisien determinasi (R2)= Ry(1,2)Uji signifikasi korelasi ganda

F=Harga ini selanjutnya dikonsultasikan dengan F tabel, dengan didasarkan pada dk pembilang = 2dan dk penyebut (10-2-1) = 7 untuk kesalahan 5 % dan 1 %Kesimpulan jika F hitung lebih besar F tabel koefisien korelasi yang diuji adalah signifikan sehingga dapat diberlakukan untuk populasi yang diteliti dengan taraf kesalahan 5 % dan 1 %

BAB III.ANALISA SEQUENCEPada bab ini dibahas data dari fenomena alam yg berdimensi satu. Oleh karena itu metode untuk membahasnya disebut analisa sekuensi (sequence Analysis).Datanya berupa deret atau seri dalam waktu, jarak atau berupa satu variabel tertentu. VariabelTersebut dapat berupa temperatur, besar butir, berat, lintasan survey dan sebagainya. Dalam geofisika banyak ditemukan data profil, data bor , data pengamatan dalam waktu. Misalnya data letusan gunung api dicatat dalam skala waktu dengan demikian variabel bebasnya adalah waktu. Data anomaly gaya berat pada profil yang menjadi variabel adarah jarak sepanjang profil. Perubahan densitas terhadap temperatur berarti variabel adalah temperatur.Data pengamatan dapat diperoleh dengan jarak yang sama. Pada proses tertentu misalnya untuk filter, korelasi, konvulsi dibutuhkan data dengan interval sama, oleh karena itu dibawah ini dibahas terlebih dahulu bagaimana merobah data menjadi berinterval sama.1.1.Membuat Interval data samaInterpolasi LinierPosisi dan harga jarak yang sama dihitung dengan cara interpolasi linier dari dua titik terdekat. Harga Y pada Xyang dihitung dengan rumus sbb :Y=

XY

4205

424? (Y) = 7

43010

Y=Y = (5)(4) /10+ 5 = 2 + 5 = 7

1.2.Runs TestRuns test adalah metoda yang digunakan untuk data dikotomi yaitu mempunyai dua pilihan misalnya muncul tidak muncul. Urutan kemunculan data tersebut dapat diselidiki apakah pergantian kemunculan kedua bentuk tersebut bersifat acak atau tidak. Untuk melihat acak atau tidak digunakan Runs Test dimana satu run adalah urutan yang datanya sama. Sebagai contoh deret data berikut 13 runs (selang tanpa terjadi pergantian kemunculan), Jumlah data H(n1) = 11 dan jumlah data T(n2) = 9H T HH T H TTT H T H T HH TT HHH13 runsn1 = 11n2= 9Jumlah rata-rata runs estimasi bersifat acak adalah :=Variansi harapannya (expected variance-nya) adalah ,

2u=

Z testZ =dimana u = jumlah runsHIPOTESAH0:uatauH0: uH1:> uatauH1 : < uBanyak runssedikit runsH0di tolakH0di tolakTes seperti ini disebut one-tailed karena daerah penolakannya hanya terdapat pada satu ujung

H0:=uH1:u

ANALISA VARIANSI SATU ARAHMENGGUNAKAN TES FModelanova satu arah (one-way analysis of variance) digunakan untuk pengujian perbedaan antara k rata-rata sampel apabila subyek-subyek observasi atau penelitian ditentukan secara random pada setiap grup atau kelompok perlakuan yang ditentukan.Persamaan linier yang menggambarkan model uji satu arah :Xik=+k+eikDengan : = rata-rta keseluruhan dari semua k populasi klasifikasi.k= efek klasifikasi dalam k kelompok tertentu darimana nilai data dijadikan sampel.eik= kesalahan random yang tergabung dengan proses samplingRingkasan anova satu arah dapat dilihat pada tabel 2.8 berikut ini.TABEL 2.8PROGRAM ANALYSIS OF VARIANCE (ANOVA)Sumber VariansiJumlah kuadrat(SS)(d.f)Kuadrat rata-rataF test

Di antara criteria kelompok-kelompok ASSA=-K - 1MSA =F=

Diantara dalam samplesSSE= SST-SSAN-KMSE =

Total variationSST=N-1

Hipotesis nol dan hipotesis alternative untuk anova satu arah :H0:k= 0Ha:k10Jika hipotesis nol benar, berarti :1=2=3= ---=kCONTOH 2.8Ada tiga sampel random dari 3 group tenaga kerja berhubungan dengan penurunan produktivitas sbb ;Kelompok AKelompok BKelompok C

7879911998124658586

Total Besar sampelT1= 40n1= 5T2=60n2=6T3= 42N3= 7

JawabBanyak sampel k =3Jumlah data ketiga sampel N = n1+ n2+ n3= 5 + 6 +7= 18Perhitungan1.Jumlah nilai masing-masing sampel : T1= 40; T2= 60; T3= 422.= 40 + 60 + 42 = 1423.()2= 201644.Jumlah kuadrat masing-masing kelompok :=++++= 11725.=72+ 82+ 72+ ..+52+82+62= 12026.Jumlah kuadrat di antara kelompok-kelompok : SSB =-=1172 20164/18 = 51,7787.Jumlah kuadrat di dalam kelompok-kelompok : SSW =-= 1202 1172 = 308.Kuadrat rata-rata di antara kelompok-kelompok ; MSB === 25,889 Dengan d.f = K-1 = 3-1 = 29.Kuadrat rata-rata di dalam kelompok-kelompok : MSW === 2 Dengan ; d.f = N- K = 1510.Nilai rasio F didapat dengan :F === 12,94

Analisis:1.Hipotesis H0= penurunanrata-rata pada setiap populasi sama Ha= penurunan rata-rata pada setiap populasi ada yang tidak sama2.Nilai kritis d.f diantara kriteria kelompok-kelompok (numerator) = K -1 = 3-1 =2 d.f kesalahan sampling (denumerator) = N- K = 18-3 = 15; = 0,01 F(2;15;0,01)= 6,363.Nilai hitung ;F=12,944.Simpulan Karena nilai Fhitung= 12,94 lebih besar dari nilaiF(2;15;0,01)= 6,36 berarti nilai Fhitungberada di daerah penolakan H0. Dengan demikian kita H0kita tolak dan menerima Ha. ini berarti bahwa ada penurunan pada setiap populasi terhadap tiga kelompok yang tidak samaContoh :

Kandungan Karbonat dalam Batuan (%)ReplikatSAMPEL

12345

119,218,712,520,319,9

218,714,314,322,524,3

321,320,28,717,617,6

416,517,611,418,420,2

517,319,39,515,918,4

622,416,116,519,019,1

Tt1=115,4n1= 6Tt2=106,2n2= 6Tt3=72,9n3= 6Tt4=113,7n4= 6Tt5=119,5n5= 6

Jawab :Banyak sampelk = 5Jumlah data ke lima sampel : N = n1+ n2+n3+ n4+ n5= 30Perhitungan :1.Jumlah nilai masing-masing sampel Tt1= 114,4 , Tt2= 106,2 , Tt3= 72,9, Tt4= 113,7Tt5= 119,52.ST = 526,73.(ST)2=277412,894.Jumlah kuadrat rata-rata masing-masing kelompok : 13087,36/6 + 11278,44/6 + 5314,41/6 + 12927,69/6+14280,25/6 = 2181,227+ 1879,74 + 885,74 + 2154,62 + 2380,04 = 9481,37 = 9481,315.S(X)2= (19,2)2+ (18,7)2+(21,3)2+ (16,5)2+ (17,3)2+ (22,4)2+(18,7)2+(14,3)2+(20,2)2+(17,6)2+(19,3)2+(16,1)2+(12,5)2+(14,3)2+(8,7)2+(11,4)2+(9,5)2+(16,5)2+ (20,3)2+(22,5)2+(17,6)2+(18,4)2+(15,9)2+ (19,0)2+ (19,9)2+(24,3)2+(17,6)2+ (20,2)2+ (18,4)2+(19,1)2 = 368,6 + 349,69 + 453,69 + 272,25 + 299,29 + 501,76 + 349,69 + 204,49 + 408,04 + 309,76 + 372,49 + 259,21 + 156,25 + 204,49 + 75,69 + 129,96 + 90,25 + 272,25 + 412,09 + 506,25 + 309.76 + 338.56 + 252,81 + 361 + 396,01 + 590,49 + 309.76 + 408,04 + 338,56 + 364,81 = 9975,756.Jumlah kuadrat diantara kelompok-kelompok SSB=-(ST)2/N =9481,31-277412,89/30 =9481,31 9247,09= 234,217.Jumlah kuadrat di dalam kelompok-kelompok : SSW = S(X)2-=9975 - 9481,31=493,698.Kuadrat rata-rata diantara kelompok-kelompok : MSB ==== 58,55 Dengan d.f. = K -1 = 5-1 =49.Kuadrat rata-rata di dalam kelompok-kelompok : MSW ===== 19,75 Dengan : d.f. = N-K = 30 -5 = 2510.Nilai rasio F didapat dengan : F=== 2,96Analisis :Hipotesis1.H0=pengurangan berat rata-rta pada setiap populasi sama Ha= pengurangan berat rata-rata pada setiap populasi ada yang tidak sama2.Nilai kritis d.f. di antara kriteria kelompok-kelompok (numerator)= K-1 = 5-1 =4 d.f. kesalahan sampling (denumerator) = N- K = 30 -5 = 25 = 0,05 F(4;25;0,05)= 2,763.Nilai hitung . F hitung = 2,964.Kesimpulan Karena nilai hitung Fhitung= 2,96 lebih besar dari nilai F(4;25;0,05)= 2,76 maka nilai Fhitungberada didaerah penolakan H0. Dengan demikian kita menolak H0dan menerima Ha

23