6. fitting data
TRANSCRIPT
101
6
FITTING DATA
Sering kita jumpai bahwa hasil suatu eksperimen harus dianalisis dengan
membandingkannya terhadap kurva teoritis. Dalam banyak kasus kurva ini berbentuk garis
lurus. Maka reduksi terhadap data yang diperoleh adalah berasal dari penentuan slope kurva
serta titik potong dengan sumbu-x dan sumbu-y.
Jika semua data berbobot sama, penentuan parameter-parameter secara umum tidak
menemui kesulitan besar. Namun demikian, pada banyak kasus masih terjadi bahwa
ketidakpastian pada tiap-tiap data tidaklah sama. Dari sinilah biasanya kesulitan itu mulai
lahir. Untuk data yang mempunyai bobot ketidakpastian berbeda. Analisis data eksperimen
tidaklah lengkap tanpa mengikutsertakan estimasi ralat yang baik terhadap besaran yang
dihitung. Ketidakpatian data (uncertainties) jarang diperhitungkan dan pada banyak kasus
estimasi ralat untuk titik-titik data yang diintrapolasikan atau diekstrapolasikan (seperti halnya
titik potong dengan sumbu-x) sering tidak diberikan sama sekali, atau hanya diestimasikan
secara ridak benar.
Tujuan ditulisnya bab ini adalah untuk menunjukkan kepada pembaca secara umum
bagaimana menghitung koefisien ketidakpastian di dalam intrapolasi atau ekstrapolasi yang
menentukan sebuah garis lurus, dengan ketidakpatian pada tiap data bisa berlaianan. Bab ini
juga akan memperlihatkan kebaikan dari suatu fit dapat dievaluasi, baik untuk polinomial
orde satu ataupun orde dua. Polynomial dengan orde lebih dari dua jarang sekali dilakukan
fittng, tetapi metoda-metoda yang diterangkan di dalam bab ini dapat pula secara langsung
digunakan dengan penyesuaian untuk kasus-kasus tertentu.
6.1. METODE KUADRAT TERKECIL
Data yang kita dapatkan merupakan pasangan data yang terdiri dari variabel bebas (x)
dan variabel tergantung (y). Bila tiap titik data dianggap sebagai sebuah sample dari suatu
distribusi normal dengan standar deviasi i, maka kementakan (probabilitas) dari pengukuran
(xi, yi) adalah sesuai dengan persamaan (2.17)
P(yi, i, i) =
2
2
1 2
)(exp
2
1
i
iiy
(6.1)
102
dengan i adalah harga rata-rata dari y (yang belum diketahui) dari distribusi, sedangkan yi
adalah sebuah sampel. Probabilitas dari keseluruhan himpuanan data yang diperoleh adalah
hasil kali dari masing-masing probabilitas, dengan catatan tidak ada ketergantungan lain di
antara titik-titik data daripada yang diketahui polynomial. Sehingga diperoleh
Ptotal =
2
2
2 2
)(exp
...)2(
1
i
ii
ni
n
y
(6.2)
Penjumlahan di sini dan untuk selanjutnya pada bab ini berlaku untuk penjumlahan semua
titik-titik data i = 1, 2, …, n. Estimasi terbaik yang dapat kita buat untuk i adalah harga fit
terbaik yang diambil pada x = xi. Harganya adalah a + bxi (untuk garis lurus). Yang dimaksud
dengan fit terbaik adalah suatu harga yang membuat probabilitas memperoleh himpunan data
lengkap sebesar mungkin. Probabilitas maksimum ini terjadi apabila argumen dari eksponen
mempunyai harga minimum
2
2
22 )(
)(iii
i
ii bxaywy
= minimum (6.3)
dengan wi 2
1
i dan i adalah harga estimasi terbaik = a + bxi
. Karena argumen dari eksponen adalah 2
2
1 , kita harus mencari probabilitas maksimum
dari harga-harga a dan b sehingga 2 minimal. Metoda ini disebut sebagai metoda kwadrat
terkecil (method of least squares). Pada tahap ini sangatlah tepat untuk mengingat kembali
bahwa metoda ini diturunkan dari prinsip kesamaaan maksimum dari perolehan himpunan
data dan yang kita asumsikan bahwa titik-titik data tersebut terdistribusi normal (Gaussian)
serta masing-masing tidak saling tergantung.
Dengan meminimasikan harga 2 terhadap a dan b berarti mencari harga-harga a dan
b dengan derivatif parsial 2 terhadap a dan b sama dengan nol:
0212
2
2
2
iiii bxaybxay
aa
(6.4)
0212
2
2
2
iiiii bxayxbxay
bb
(6.5)
Dalam hal ini kita menganggap bahwa semua standar deviasi adalah sama i . Dan
dengan mengingat persamaan
103
iii xbaNbxay
22
iiiiii xbxabxaxyx (6.6)
Untuk menentukan harga a dan b, kita harus menentukan solusi dari persamaan (6.6), adapun
solusi dari persamaan (6.6) adalah
iiiii
iii
iiyxxyx
xyx
xya
2
2
11 (6.7)
iiii
iii
iyxyxN
yxx
yNb
11 (6.8)
Dan
22
2 ii
ii
ixxN
xx
xN (6.9)
Berarti garis lurus tersebut memotong sumbu y di
22
2
ii
iiiii
xxN
yxxyxa (6.10)
dengan koefisien sudut arah sama dengan
22
ii
iiii
xxN
yxyxNb (6.11)
Perhitungan ketidakpastian pada a dan b dapat diperoleh langsung. Di sini kita
menggunakan prinsip umum yang menunjukkan bahwa ketidakpastian z dari suatu kuantitas
z, yang dapat diekspresikan pada besaran independen y1, y2, …, yn yang dapat diukur, dapat
dihitung dari yi dan ketidakpastian i dengan
2
22
i
izy
z (6.12)
pada persoalan kita, koefisien a dan b merupakan fungsi dari xi, wi dan yi. Apabila kita
mengasumsikan bahwa hanya yi saja yang mempunyai ketidakpastian (i) maka kita dapat
menuliskan dengan analogi rumus
2
22
i
iay
a (6.13)
dan
2
22
i
iby
b (6.14)
104
Dari derivatif persamaan (6.10)dan (6.11)kita mendapatkan
iji
i
xxxy
a 21 (6.15)
ii
i
xNxy
b 1 (6.16)
Dengan mengkombinasikan persamaan (6.12), (6.15) dan (4.16), akan kita peroleh
ketidakpastian dari a dan b
N
j
ijiijia xxxxxx1
22222
2
22
2
222222
2
2
2 iiiii xxxxxN
2
2222
2
2
iiii xxxNx
(6.17)
N
j
iijjb xxNxxN1
222
2
22
2
2222
2
2
2 iii xNxNxN
2
22
2
2 NxxN
Nii (6.18)
Sedangkan diberikan dengan persamaan
222
2
1ii bxay
NS (6.19)
6.2. POLINOMIAL ORDE SATU (garis lurus)
Misal seorang mahasiswa mengadakan penyelidikan tentang hubungan antara posisi
titik pada kawat berarus dengan beda potensial. Dia menggunakan 1 meter kawat perak-nikel
yang dibentangkan di atas papan, batu batterey dan voltmeter analog. Dia menghubungkan
sel-sel batterey dengan kawat dan mengukur beda potensial antara ujung negatif dengan posisi
yang bervariasi sepanjang kawat. Dari pengukuran mengestimasikan ketidakpastian setiap
pengukuran beda potensial adalah 0,05 V. Ketidakpastian posisi adalah kurang dari 1 mm
sehingga dapat diabaikan.
105
Tabel 6.1 Beda potensial merupakan fungsi dari posisi kawat penghantar perak-nikel
Nomer
titik
Posisi
xi (cm)
Beda potensial
Vi (V)
xi 2
xi Vi Harga fit
a+ bx
1 10,0 0,37 100 3,70 0,33
2 20,0 0,58 400 11,60 0,60
3 30,0 0,83 900 24,90 0,86
4 40,0 1,15 1600 4600 1,12
5 50,0 1,36 2500 6800 1,38
6 60,0 1,62 3600 9720 1,64
7 70,0 1,90 4900 13300 1,91
8 80,0 2,18 6400 17440 2,17
9 90,0 2,45 8100 22050 2,43
Jumlah 450,0 12,44 28500 77930
Jika data pada Tabel 6.1 dilukiskan dalam grafik, dengan sumbu horisontal adalah
posisi (x) dan sumbu vertikal adalah beda potensial (V), maka akan tampak seperti pada
Gambar 6.1
0
0.5
1
1.5
2
2.5
3
0 10 20 30 40 50 60 70 80 90 100
x (cm)
be
da
po
ten
sia
l (V
)
Gambar 6.1. Grafik hubungan antara posisi kawat penghantar (x)
dengan beda potensial (V)
106
Dari Gambar 6.1 tampak bahwa hubungan antara variabel bebas (x) dan variabel
tergantung (V) dapat didekati dengan garis lurus yang mempunyai bentuk persamaan
bxaxy
Dari data dapat kita hitung
54000)450()28500(9 222 ii xxN
0714,0
54000
30,77945044,122850022
2
ii
iiiii
xxN
VxxVxa
0262.0
54000
44,1245030,779922
ii
iiii
xxN
VxVxNb
001319,054000
2850005,0 22
22
iV
a x
; 036,0a
622
210417,0
54000
05,09
V
b N
; 00063,0b
Dengan asumsi ketidakpastian V adalah 0,05 V , fitting data dengan menggunakan
metode kuadrat terkecil menghasilkan a = 0,07 0,04 V dan b = 0,0262 0,0006 V/cm.
Dengan menggunakan persamaan (6.3) diperoleh 95,12 . Derajat derajat kebebasan 7 (N-2
= 9-2), maka kebolehjadian fit mendekati 96 %.
6.3. POLINOMIAL ORDE DUA (parabola)
Suatu polynomial orde dua lebih jarang dipergunakan untuk tujuan fitting daripada
polynomial orde satu. Tetapi dalam fatsal ini akan kita bahas juga metode untuk mendapatkan
koefisien dan ketidakpastian yang melukiskan sebuah parabola sebagai satu fit terbaik
terhadap satu himpunan titik data. Perluasan ke polynomial berorde lebih tinggi dapat
dilakukan secara langsung tetapu perhitungan yang diperlukan semakin panjang. Pada situasi
biasa pembaca dianjurkan menggunakan komputer untuk memecahkan masalah ini.
Persamaan umum untuk parabola adalah y = A + Bx + Cx2. bila kita punya satu himpunan
titik-titik data dan kita ingin melakukan fit terhadap parabola, kita dapat melakukan proses
107
yang mirip dengan yang telah kita lakukan pada kasus garis lurus. Metoda kwadrat terkecil
memberikan tiga persamaan dengan tiga bilangan anu A, B dan C.
Hal ini dapat kita lihat pada persamaan di bawah ini :
42
32
2
1
iiiiiii
iiiiiii
iiiiii
xwxwyxw
xwxwyxw
xwxwyw
DA
42
32
2
1
iiiiiii
iiiiiii
iiiiii
xwxwyxw
xwxwyxw
xwxwyw
DB
42
32
2
1
iiiiiii
iiiiiii
iiiiii
xwxwyxw
xwxwyxw
xwxwyw
DC
42
32
2
1
iiiiiii
iiiiiii
iiiiii
xwxwyxw
xwxwyxw
xwxwyw
DD
Contoh
Suatu hasil eksperimen dituliskan pada Tabel 6.2
Table 6.2
X (detik) Y (cm)
0
1
2
3
4
5
1,5 0,2
1,9 0,3
3,2 0,3
5,4 0,4
6,6 0,4
9.8 0,5
Dari pengamatan visual langsung kita dapat menyimpulkan bahwa garis lurus yang dihasilkan
tidak fit betul dengan data. Oleh karena itu kita mencoba dengan suatu parabola. Koefisien
dan koefisien silang menunjukkan bahwa fit :
A = 1,46 0,19 cm B = 0,38 0,24 cm/s C = 0,25 0,05 cm/s2
6.4. FITTING UNTUK FUNGSI SEMBARANG
Metode least square dan analisis regresi yang telah kita bahas di depan baru
membahas fitting untuk fungsi-fungsi linier.
n
j
jj xXaaxy1
0 (6.20)
Metode ini juga dapat diperluas untuk mendapatkan suatu teknik fitting data yi dengan suatu
fungsi yang parameter-parameternya tidak linier, yang disebut least square non linier.
108
Misal fungsi y(x) dengan parameter-parameter aj yang berberntuk
xaaxy 21 sin
2
654
2
3
21
2
1exp xaxaa
a
axaxy
Untuk fungsi-fungsi sembarang tersebut kita dapat menentukan ukuran kebaikan fit dengan
meminimalkan 2 .
2
2
2 1ii
i
xyy
(6.21)
dengan i adalah ketidak pastian dari titik data yi . Dalam hal ini terdapat tiga sumber
kesalahan yang memberikan kontribusi terhadap harga 2
- Data yi adalah sampel yang diambil secara acak dari populasi induk, dengan nilai
harapan iy yang diberikan oleh distribusi induk. Perubahan harga yi di sekitar
nilai harap iy lebih besar atau lebih kecil dari pada ketidak pastian yang
diharapkan i
- 2 adalah fungsi kontinu untuk semua parameter aj.
- Pilihan salah satu perilaku fungsional dari fungsi analitik y(x) sebagai pendekatan
fungsi yang benar xy akan mempengaruhi range nilai yang memungkinkan
untuk 2
Untuk memperbaiki (1) tidak ada yang dapat dilakukan kecuali mengulang-ulang
percobaan. Nilai optimum untuk parameter-parameter aj dapat diestimasi dengan metode
least square dengan meminimalkan 2 (permasalahan 2). Untuk persoalan (3) harga resultan
2 untuk beberapa fungsi y(x) yang berbeda perlu dibandingkan untuk menentukan
kebolehjadian yang terbaik untuk suatu bentuk fungsi y(x).
Menurut metode least square harga optimum dari parameter aj ditentukan dengan
meminimalkan 2 , dengan memperhatikan tiap parameter.
01 2
2
2
ii
ij
xyyaa
(6.22)
109
Memang tidak mudah untuk menurunkan penyelesaian analitis untuk menentukan parameter-
parameter dari fungsi non linier, untuk itu ssudah tersedia program-program komputasi yang
dapat membantu menyelesaikannya.
SOAL-SOAL
1. Misal suatu batang logam digantung diantara dua temperatur yang konstan. Satu ujung
pada temperatur 0oC dan ujung yang lain pada temperatur 100
oC. Kita ingin
menentukan bentuk hubungan anatara temperatur sepanjang batang sebagai fungsi dari
posisi x. Untuk itu kita mengadakan pengukuran temperatur pada berbagai posisi x,
dan hasil pengukuran dinyatakan seperti pada Tabel 6.3.
Tabel 6.3. Hasil pengukuran temperatur pada beberapa posisi x
No Posisi
Xi (cm)
Temperatur
Ti (oC)
Xi2
Xi Ti Ti 2
a+bxi
1
2
3
4
5
6
7
8
9
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
15.6
17.5
36.6
43.8
58,2
61.6
64.2
70.4
98.8
1.0
4.0
9.0
16.0
25.0
36.0
49.0
64.4
81.0
15.6
35.0
109.8
175.2
291.0
369.6
449.4
563.2
889.2
243.36
306.25
1339,56
1918.44
3387.24
3794.56
4121.64
4956.16
9761.44
14.2
23.6
33.0
42.4
51.8
61.2
70.6
80.0
89.4
45.0 466.7 285.0 2898.0 29828.65
Tentukan persamaan yang menyatakan T sebagai fungsi X dan hitunglah
kebolehjadian kebenaran fitting data tersebut
2. Seorang mahasiswa mencacah radiasi dari suatu sumber radiasi dengan Geiger
Counter. Dia mencatat hasil pencacahan setiap 15 detik. Hsil pencacahan yang
diperoleh adalah sebagai berikut (Tabel 6.4)
110
Tabel 6.4. Geiger Counter data from an irradiated silver piece, record in 15-s intervals
No Waktu Cacah No Waktu Cacah
1 15 775 31 465 24
2 30 479 32 480 30
3 45 380 33 495 26
4 60 302 34 510 28
5 75 185 35 525 21
6 90 157 36 540 18
7 105 137 37 555 20
8 120 119 38 570 27
9 135 110 39 585 17
10 150 89 40 600 17
11 165 74 41 615 14
12 180 61 42 630 17
13 195 66 43 645 24
14 210 68 44 660 11
15 225 48 45 675 22
16 240 54 46 690 17
17 255 51 47 705 12
18 270 46 48 720 10
19 285 55 49 735 13
20 300 29 50 750 16
21 315 28 51 765 9
22 330 37 52 780 9
23 345 49 53 795 14
24 360 26 54 810 21
25 375 35 55 825 17
26 390 29 56 840 13
27 405 31 57 855 12
28 420 24 58 870 18
29 435 25 59 885 10
30 450 35
Tentukan persamaan yang menyatakan bahwa Cacah adalah fungsi waktu dan
tentukan berapakah kebolehjadian kebenaran fitting data teresebut.
DAFTAR PUSTAKA
Bevington, Philip R, 1992. Data Reduction And Error Analysis for the Physical Sciences.
New York : Mc Graw – Hill.
Kusminarto, Dr. 1993. Metode Fisika Eksperimen. Yogyakarta : Fakultas Matematika Dan
Ilmu Pengetahuan Alam Universitas Gadjah Mada