telaah kritis artikel diagnosis - mahasiswa

18
Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi 1 Telaah Kritis Artikel Diagnosis Diterjemahkan oleh: dr. Andaru Dahesihdwi, M.Kes, Sp.PK Skenario Klinik Anda adalah seorang dokter konsultan yang diminta sejawat ahli bedah memeriksa seorang wanita berusia 78 tahun, saat ini 10 hari pasca operasi abdominal dan lebih dari 24 jam terakhir mengalami peningkatan sesak nafas. Wanita tersebut juga telah mengalami apa yang dideskripsikannya sebagai rasa tidak enak di daerah dada yang terkadang bertambah berat saat mengambil nafas dalam (tetapi terkadang tidak). Tanda klinis abnormal saat pemeriksaan fisik adalah restriksi sampai dengan residual tenderness di abdomen dan crackles tersebar pada kedua basal paru. Foto rontgen torak menunjukkan adanya sedikit efusi pleura kanan, tetapi ini baru foto rontgen pertama pasca operasi. Analisa gas darah menunjukkan hasil PO2 70, saturasi 92%. Hasil elektrokardiogram menunjukkan perubahan non-spesifik. Anda menduga pada pasien ini, walaupun telah mendapatkan 5000 U heparin 2 kali sehari, telah menderita emboli paru (pulmonary embolus-PE). Anda meminta scanning ventilasi-perfusi (V/Q scan) dengan hasil yang dilaporkan melalui telepon kepada perawat adalah ”intermediate probability”PE. Walaupun masih terdapat sesuatu ketidakpastian diagnosis, anda memberikan antikoagulan dosis penuh. Meski anda telah seringkali menggunakan tes tersebut dan berpikir bahwa telah cukup baik memahami interpretasi hasilnya, anda menyadari bahwa pemahaman tersebut lebih didasarkan pada intuisi dan pengalaman praktis dibandingkan pengetahuan tentang sifat-sifat uji diagnostik V/Q Scanning yang diperoleh dari literatur asli. Karena itu, pada perjalanan anda ke Bagian Kedokteran Nuklir untuk mereview scan tersebut, anda singgah di perpustakaan. The Search Rencana anda adalah menemukan suatu penelitian tentang sifat V/Q scanning yang dapat diaplikasikan pada praktek klinik anda secara umum, dan khususnya pada pasien ini. Anda telah terbiasa menggunakan perangkat lunak program ”Grateful Med” dan menggunakannya dalam searching anda. Program ini menawarkan suatu daftar Medical Subject (MeSH) headings, dan yang pertama anda pilih adalah ”pulmonary embolism”. Karena didapatkan 1749 artikel dengan judul subyek tersebut yang dipublikasikan antara tahun 1989-1992 (rentang waktu dalam pencarian anda), selanjutnya anda harus mempersempit searching anda. Anda memilih 2 strategi: dipilih artikel dengan subjudul ”radionuclide imaging”, dan juga yang berhubungan dengan MeSH heading ”comparative study” (karena anda menginginkan penelitian yang membandingkan V/Q scanning dengan berbagai standar rujukan). Pencarian ini menghasilkan 31 artikel, 11 artikel diantaranya dieksklusi karena mengevaluasi teknik diagnosis baru, 9 artikel dieksklusi karena berkaitan dengan diagnosis dan terapi trombosis vena profunda, dan 1 artikel dieksklusi karena meneliti riwayat alamiah PE. Artikel tersisa membahas V/Q scanning pada PE. Satu artikel merupakan editorial, 4 artikel terbatas lingkupnya (berkaitan dengan scan hanya pada perfusi, dengan situasi dimana diagnosis ditegakkan berdasarkan angiografi pulmonar, atau dengan defek perfusi tunggal). Dari artikel yang tersisa, ”PIOPED STUDY” menarik perhatian anda karena merupakan jurnal yang banyak dibaca dan familiar bagi anda, juga karena merujuk pada judul-judul semacam dari beberapa artikel lain (1). Anda mencetak abstrak artikel ini dan menemukan sebagai kesimpulan informasi berikut: diantara

Upload: nia-anestya

Post on 28-Oct-2015

155 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

1

Telaah Kritis Artikel Diagnosis

Diterjemahkan oleh: dr. Andaru Dahesihdwi, M.Kes, Sp.PK

Skenario Klinik

Anda adalah seorang dokter konsultan yang diminta sejawat ahli bedah memeriksa seorang wanita berusia 78 tahun, saat ini 10 hari pasca operasi abdominal dan lebih dari 24 jam terakhir mengalami peningkatan sesak nafas. Wanita tersebut juga telah mengalami apa yang dideskripsikannya sebagai rasa tidak enak di daerah dada yang terkadang bertambah berat saat mengambil nafas dalam (tetapi terkadang tidak). Tanda klinis abnormal saat pemeriksaan fisik adalah restriksi sampai dengan residual tenderness di abdomen dan crackles tersebar pada kedua basal paru. Foto rontgen torak menunjukkan adanya sedikit efusi pleura kanan, tetapi ini baru foto rontgen pertama pasca operasi. Analisa gas darah menunjukkan hasil PO2 70, saturasi 92%. Hasil elektrokardiogram menunjukkan perubahan non-spesifik.

Anda menduga pada pasien ini, walaupun telah mendapatkan 5000 U heparin 2 kali sehari, telah menderita emboli paru (pulmonary embolus-PE). Anda meminta scanning ventilasi-perfusi (V/Q scan) dengan hasil yang dilaporkan melalui telepon kepada perawat adalah ”intermediate probability”PE. Walaupun masih terdapat sesuatu ketidakpastian diagnosis, anda memberikan antikoagulan dosis penuh. Meski anda telah seringkali menggunakan tes tersebut dan berpikir bahwa telah cukup baik memahami interpretasi hasilnya, anda menyadari bahwa pemahaman tersebut lebih didasarkan pada intuisi dan pengalaman praktis dibandingkan pengetahuan tentang sifat-sifat uji diagnostik V/Q Scanning yang diperoleh dari literatur asli. Karena itu, pada perjalanan anda ke Bagian Kedokteran Nuklir untuk mereview scan tersebut, anda singgah di perpustakaan. The Search

Rencana anda adalah menemukan suatu penelitian tentang sifat V/Q scanning yang dapat diaplikasikan pada praktek klinik anda secara umum, dan khususnya pada pasien ini. Anda telah terbiasa menggunakan perangkat lunak program ”Grateful Med” dan menggunakannya dalam searching anda. Program ini menawarkan suatu daftar Medical Subject (MeSH) headings, dan yang pertama anda pilih adalah ”pulmonary embolism”. Karena didapatkan 1749 artikel dengan judul subyek tersebut yang dipublikasikan antara tahun 1989-1992 (rentang waktu dalam pencarian anda), selanjutnya anda harus mempersempit searching anda. Anda memilih 2 strategi: dipilih artikel dengan subjudul ”radionuclide imaging”, dan juga yang berhubungan dengan MeSH heading ”comparative study” (karena anda menginginkan penelitian yang membandingkan V/Q scanning dengan berbagai standar rujukan). Pencarian ini menghasilkan 31 artikel, 11 artikel diantaranya dieksklusi karena mengevaluasi teknik diagnosis baru, 9 artikel dieksklusi karena berkaitan dengan diagnosis dan terapi trombosis vena profunda, dan 1 artikel dieksklusi karena meneliti riwayat alamiah PE. Artikel tersisa membahas V/Q scanning pada PE. Satu artikel merupakan editorial, 4 artikel terbatas lingkupnya (berkaitan dengan scan hanya pada perfusi, dengan situasi dimana diagnosis ditegakkan berdasarkan angiografi pulmonar, atau dengan defek perfusi tunggal). Dari artikel yang tersisa, ”PIOPED STUDY” menarik perhatian anda karena merupakan jurnal yang banyak dibaca dan familiar bagi anda, juga karena merujuk pada judul-judul semacam dari beberapa artikel lain (1). Anda mencetak abstrak artikel ini dan menemukan sebagai kesimpulan informasi berikut: diantara

Page 2: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

2

pasien dengan hasil V/Q scan ”intermediate”, 33% merupakan penderita PE. Anda menyimpulkan bahwa anda telah membuat pilihan yang baik, dan mengambil artikel tersebut dari rak perpustakaan. Pendahuluan

Klinisi biasanya menghadapi dilema jika menuliskan permintaan uji diagnostik dan menginterpretasikannya. Perkembangan teknologi kedokteran yang terus-menerus dan berkesinambungan membuat kemampuan klinisi untuk menilai artikel uji diagnostik semakin penting. Untuk itu, tulisan ini akan membahas prinsip-prinsip penilaian artikel uji diagnostik secara efisien dan aplikasinya secara optimal. Sekali anda membuat keputusan, seperti yang telah diilustrasikan dalam skenario klinik dengan artikel PIOPED, yaitu suatu artikel yang berpotensi relevan (judul dan abstrak memberikan petunjuk bahwa informasi yang diberikan secara langsung relevan dengan problem pasien yang anda hadapi) anda dapat mengajukan 3 pertanyaan yang sama yang diperkenalkan dalam pendahuluan dan petunjuk tentang terapi (tabel 1). Tabel 1. Evaluasi dan aplikasi hasil penelitian uji diagnostik

I. Apakah hasil penelitian valid?

• Petunjuk Primer o Apakah terdapat perbandingan yang independen dan blind terhadap

suatu standar rujukan? o Apakah sampel pasien mencakup spektrum penderita yang sesuai

dengan setting praktek klinis dimana uji diagnostik tersebut akan diaplikasikan?

� Petunjuk Sekunder o Apakah hasil tes yang sedang dievaluasi mempengaruhi keputusan

untuk menjalankan standar rujukan? o Apakah metoda untuk melaksanakan tes tersebut dideskripsikan

cukup rinci untuk dapat dilakukan replikasi?

II. Apakah hasilnya? � Apakah likelihood rasio hasil tes atau data yang dibutuhkan untuk

penghitungannya ditampilkan?

III. Apakah hasil penelitian tersebut membantu dalam tatalaksana pasien saya? � Apakah reprodusibilitas hasil tes dan interpretasinya sesuai pada setting

saya? � Apakah hasilnya dapat diaplikasikan untuk pasien saya? � Apakah hasil tersebut akan mengubah tatalaksana saya? � Akankah pasien menjadi lebih baik dengan aplikasi hasil tes tersebut?

• Apakah hasil penelitian valid?

Kepercayaan seseorang terhadap hasil suatu penelitian ditentukan berdasarkan metodologi penelitian yang dijalankan. Untuk menyatakan hasil valid harus terdapat akurasi uji diagnostik, seperti dilaporkan, adalah kedekatan keadaan yang sesungguhnya dibandingkan hasil dari pemeriksaan yang diteliti. Pertama kali, anda harus menentukan apakah anda dapat mempercayai hasil suatu penelitian dengan mempertimbangkan bagaimana peneliti mengambil pasien-pasiennya dan bagaimana mereka menjalankan tes yang diteliti dan suatu standar rujukan (atau ”emas” atau ”kriteria”) pada pasien-pasien tersebut.

Page 3: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

3

• Apakah hasil penelitian tesebut?

Jika anda memutuskan hasil penelitian valid, langkah berikut adalah menentukan akurasi tes diagnostik. Hal ini dilakukan dengan mencermati (atau menghitung sendiri) likelihood rasio tes tersebut (seringkali merujuk pada sifat-sifat tes diagnostik tersebut).

• Akankah hasil tersebut membantu saya dalam tatalaksana pasien-pasien saya? Langkah ketiga adalah memutuskan bagimana menggunakan tes tersebut, baik untuk pasien secara perorangan maupun untuk pasien secara umum. Apakah hasil penelitian tersebut dapat digeneralisasi, contoh dapatkah anda mengaplikasikannya pada pasien ini secara khusus dan pasien semacam lain yang seringkali dijumpai? Seberapa sering hasil tes tersebut dapat menghasilkan informasi yang bernilai? Apakah hasil tes memberikan informasi tambahan melebihi yang diperoleh dari anamnesis dan pemeriksaan fisik? Apakah tes tersebut lebih murah atau lebih mudah daripada uji diagnostik lain untuk target gangguan yang sama? Yang terpenting adalah apakah pasien menjadi lebih baik dengan penggunaan tes diagnostik tesebut?

Dalam artikel ini dibahas pertanyaan pertama secara rinci, sementara dalam

artikel berikut secara serial akan dibahas pertanyaan kedua dan ketiga. Kami menggunakan artikel PIOPED untuk mengilustrasikan prosesnya.

Dalam penelitian PIOPED, 731 pasien dengan suspek PE yang dipilih secara konsekutif menjalani pemeriksaan V/Q Scanning dan angiografi pulmonar. Angiogram pulmonar dianggap metoda terbaik untuk menentukan seorang pasien benar menderita PE, sehingga ditetapkan sebagai standar rujukan. Setiap angiogram diinterpretasikan sebagai satu dari tiga kemungkinan hasil yaitu: ”terdapat PE”, ”PE tidak dapat ditentukan”, dan”tidak ada PE”. Akurasi V/Q Scan dibandingkan terhadap angiogram, hasilnya dilaporkan dalam 4 kategori: ”high probability”(PE), “intermediate probability”, “low probability”, atau “mendekati normal atau normal”. Perbandingan antara V/Q scan dan angiogram ditunjukkan dalam tabel 2A dan 2B. Kita akan mendapatkan perbedaan antara tabel-tabel ini nantinya, untuk saat ini, marilah menerapkan pertanyaan pertama dari tiga pertanyaan untuk laporan ini. Apakah hasil dalam artikel ini valid? A. Petunjuk Primer 1. Adakah perbandingan secara independen dan blind terhadap standar rujukan?

Cara terbaik menentukan akurasi uji diagnostik adalah dengan membandingkannya terhadap „nilai sesungguhnya“. Untuk itu, pembaca harus meyakini bahwa standar rujukan yang sesuai (biopsi, operasi, otopsi, atau pemamtauan jangka panjang) telah dilakukan pada setiap pasien, seperti juga pemeriksaan dengan metoda yang diteliti (2). Dalam penelitian PIOPED, angiogram pulmonar ditempatkan sebagai standar rujukan yang merupakan baku emas yang dapat dilaksanakan tanpa mengorbankan pasien. Dalam membaca artikel uji diagnostik, jika standar rujukan tidak dapat diterima (dalam pemikiran bahwa tidak ada metoda yang sempurna), artikel tersebut sulit diharapkan memberikan hasil yang valid.

Page 4: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

4

Jika standar rujukan dapat diterima, pertanyaan berikut adalah apakah hasil tes dan standar rujukan diteliti secara independen (orang yang menginterpretasikan hasil tes tidak mengetahui hasil standar rujukan dan sebaliknya). Pengalaman klinis menunjukkan pentingnya hal ini. Bila kita telah melihat nodul pulmonar pada CT-Scan, kita akan menemukan lesi pada radiograf torak yang sebelumnya tidak terdeteksi, bila kita telah mempelajari hasil ekokardiogram, kita akan menemukan bising jantung yang sebelumnya tidak terdengar. Dengan kata lain, interpretasi hasil tes dapat dipengaruhi oleh pengetahuan kita tentang hasil standar rujukan (atau sebaliknya), membuat semakin besar kepentingan interpretasi pada hasil kedua tes dilakukan secara independen. Peneliti PIOPED tidak menyebutkan secara eksplisit dalam artikelnya tentang blindly pada interpretasi hasil. Namun hal tersebut dapat disimpulkan dari usaha peneliti menjamin reprodusibilitas, pembacaan secara independen yang berarti interpretasi hasil telah dilakukan secara blind, dan dapat dikonfirmasi melalui korespondensi dengan salah satu penelitinya. Jika hal tersebut masih diragukan, kebanyakan peneliti akan dengan senang hati menjelaskan apabila dihubungi secara langsung. 2. Apakah sampel pasien mencakup seluruh spektrum yang sesuai dengan setting

praktek klinis dimana uji diagnostik tersebut akan diaplikasikan? Suatu uji diagnostik sesungguhnya hanya sangat bermanfaat untuk

membedakan suatu keadaan sakit atau keadaan yang mungkin masih membingungkan. Sangat banyak tes yang dapat membedakan kondisi sehat dengan sakit parah; hal ini tidak memberikan manfaat apapun dalam penggunaan klinik. Dalam kenyataannya, nilai pragmatis dari suatu tes adalah hanya jika penelitian dilakukan sedekat mungkin dengan setting praktek klinis.

Sebagai contoh nyata adalah bagaimana harapan melambung dengan penemuan uji diagnostik CEA untuk keganasan kolorektal namun kemudian dimentahkan oleh hasil-hasil penelitian berikutnya. CEA, bila diperiksa pada 36 pasien yang telah diketahui menderita keganasan kolon atau rektum stadium lanjut, akan meningkat pada 35 pasien. Saat yang sama, kadar yang jauh lebih rendah ditemukan pada populasi normal dan berbagai kondisi lain. Hasil ini memberikan petunjuk bahwa CEA dapat bermanfaat untuk diagnosis keganasan kolorektal, atau bahkan untuk skrining. Pada penelitian-penelitian berikutnya, pasien dengan keganasan kolorektal stadium lebih dini (dengan tingkat keparahan penyakit lebih rendah) dan pasien-pasien dengan jenis keganasan lain atau gangguan gastrointestinal yang lain (berbeda namun berpotensi menimbulkan keraguan), akurasi CEA menurun drastis. Saat ini CEA untuk diagnosis dan skrining keganasan sudah ditolak, hanya direkomendasikan sebagai salah satu unsur dalam pemantauan pasien yang telah diketahui menderita keganasan kolorektal (4).

Pada penelitian PIOPED, seluruh spektrum pasien yang diduga menderita PE terpilih dan dimasukkan, baik stadium klinis tinggi, menengah atau rendah. Dapat disimpulkan bahwa penelitian ini telah memilih pasien yang sesuai.

B. Petunjuk Sekunder

Bila artikel telah menggambarkan suatu spektrum pasien yang sesuai yang dikenai perlakuan dan perbandingan antara uji diagnostik yang diteliti dengan standar rujukan secara independen dan blind, sangat mungkin hasil penelitian ini tidak bias dan menyimpang dari kebenaran (dapat diestimasi bahwa tidak ada kesalahan sistematik). Namun demikian, kemungkinan kesalahan masih dapat dikurangi dengan mempertimbangkan beberapa hal lain.

Page 5: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

5

1. Apakah hasil tes yang sedang dievaluasi mempengaruhi keputusan untuk

menjalankan standar rujukan? Sifat-sifat suatu uji diagnostik akan terdistorsi bila hasilnya mempengaruhi

apakah pasien-pasien tersebut harus menjalani pemeriksaan dengan standar rujukan. Keadaan ini, seringkali disebut sebagai ”bias verifikasi”(5)(6) atau ”work-up bias”(7)(8), sebagai contoh, bila pasien-pasien dengan suspek penyakit arteri koroner dan tes aktivitas fisik positif lebih dipilih untuk menjalani angiografi koroner (standar rujukan) dibandingkan yang dengan hasil tes aktivitas fisik negatif.

Bias verifikasi menjadi masalah dalam penelitian PIOPED; pasien-pasien dengan interpretasi hasil V/Q scan ”normal/mendekati normal” dan ”low probability” lebih sedikit yang menjalani angiografi pulmonar (69%) dibandingkan pasien dengan hasil V/Q scan positif (92%). Hal ini tidak mengejutkan, karena klinisi mungkin enggan menghadapkan subyek pasien dengan kemungkinan kecil PE terhadap risiko angiografi. Hasil penelitian PIOPED terhadap pasien-pasien yang menjalani angiografi ditampilkan pada tabel 2A.

Tabel 2A. Hubungan antara hasil angiogram pulmonar dan V/Q Scan (hanya pada pasien dengan angiogram yang berhasil)

ANGIOGRAM KATEGORI SCAN

PE POSITIF PE NEGATIF

HIGH PROBABILITY 102 14

INTERMEDIATE PROBABILITY 105 217

LOW PROBABILITY 39 199

MENDEKATI NORMAL/NORMAL

5 50

Kebanyakan artikel berhenti sampai di sini, dan pembaca akan menyimpulkan bahwa bias yang dihasilkan karena perbedaan proporsi pasien yang menjalani angiografi secara adekuat tidak dapat ditentukan tetapi sangat mungkin bias tersebut besar. Namun demikian, para peneliti PIOPED menjalankan standar rujukan kedua pada 150 pasien dengan hasil scanning ”low probability” atau ”normal/mendekati normal” yang gagal menjalani angiografi (136 pasien) atau yang interpretasi angiogramnya tidak dapat ditentukan (14 pasien). Mereka diputuskan tidak menderita PE apabila selama pemantauan keadaan baik tanpa terapi. Konsekuensinya, harus dilakukan pemantauan pada pasien-pasien tersebut selama 1 tahun tanpa terapi antikoagulan. Tidak ada seorang pun dari kelompok ini yang menunjukkan bukti klinis PE selama periode pemantauan, sehingga dapat disimpulkan bahwa kepentingan klinis PE (bila definisi kepentingan klinis PE adalah kebutuhan antikoagulan untuk mencegah kejadian yang tidak diharapkan) tidak ditemukan pada saat dilakukan V/Q Scanning. Bila 150 pasien ini, yang ditetapkan tidak menderita PE berdasarkan standar rujukan kedua yaitu dengan prognosis yang baik tanpa terapi antikoagulansia, ditambahkan pada 480 pasien dengan hasil angiogram negatif pada tabel 2A, hasilnya ditampilkan pada tabel 2B. Kami berharap anda setuju bahwa estimasi akurasi V/Q scan yang lebih baik didapat dari tabel 2B, dimana 150 pasien disimpulkan klinis tidak menderita PE berdasarkan pemantauan. Selanjutnya, digunakan data ini untuk perhitungan.

Page 6: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

6

Tabel 2B. Hubungan antara hasil angiogram pulmonar dan V/Q Scan (termasuk 150 pasien dengan hasil scanning ”low probability” atau ”normal/mendekati normal”-136 orang- atau yang interpretasi angiogramnya tidak dapat ditentukan -14 orang- dan pada pemantauannya tidak terdapat klinis tromboemboli)

ANGIOGRAM KATEGORI SCAN

PE POSITIF PE NEGATIF

HIGH PROBABILITY 102 14

INTERMEDIATE PROBABILITY 105 217

LOW PROBABILITY 39 273

MENDEKATI NORMAL/NORMAL

5 126

Total 251 630

Masih terdapat 50 pasien lainnya dengan hasil scanning ”high” atau “intermediate probability”yang tidak menjalani angiografi atau hasil angiogram tidak dapat diinterpretasikan. Hal ini sangat mungkin menyebabkan hasil bias. Namun demikian, karena proporsinya relatif kecil dalam populasi, dan bila karakteristik klinis tidak sungguh berbeda dengan pasien yang menjalani angiografi, diasumsikan tidak terdapat penyimpangan secara sistematik hasil tes pada kelompok ini. Oleh karena itu, kita dapat melanjutkan mencermati hasil penelitian PIOPED dengan relatif yakin. 2. Apakah metoda untuk melaksanakan tes tersebut dideskripsikan cukup rinci

untuk dapat dilakukan replikasi? Jika peneliti menyimpulkan bahwa uji diagnostik dapat digunakan, harus

diterangkan bagaimana menggunakannya. Deskripsi harus mencakup seluruh hal penting dalam persiapan pasien (diet, obat yang harus dihindari, tindakan pencegahan pasca-tes), pelaksanaan tes (teknik, kemungkinan rasa sakit), dan analisis serta intrpretasi hasil.

Jika pembaca telah meyakini bahwa hasil penelitian tersebut merupakan estimasi sifat uji diagnostik yang tidak bias, selanjutnya dapat ditentukan apa dan seberapa besar manfaatnya. Walaupun tidak sesuai dengan keadaan aslinya (hampir tidak pernah ada pada kebanyakan penelitian), dapat disimpulkan bahwa hasil tersebut merupakan estimasi valid dari sifat V/Q Scan. Deskripsi tentang interpretasi dan aplikasi hasil diberikan pada artikel selanjutnya dari seri ini. Apakah Hasil Penelitian?

Skenario Klinik Anda kembali dimana kami menemukan anda: di perpustakaan mempelajari

suatu artikel yang dapat memberi petunjuk tentang interpretasi hasil scanning Ventilasi/Perfusi (V/Q) paru. Menggunakan kriteria dalam tabel 1, anda memutuskan bahwa penelitian PIOPED (1) memberikan informasi yang valid. Selanjutnya, seorang dokter lain datang mencari sebuah artikel untuk membantu interpretasi V/Q Scanning. Pasiennya adalah seorang laki-laki 28 tahun yang mengalami serangan akut sesak nafas dan nyeri dada tersamar sesaat setelah melakukan perjalanan sendiri selama 10

Page 7: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

7

jam. Dia mempunyai riwayat mengalami hal yang sama beberapa kali namun tidak seberat saat ini dan sangat mencemaskan gejala ini. Setelah dalam pemeriksaan fisik, alektrokardiogram dan rontgen torak normal, hasil analisa gas darah menunjukkan PCO2 32 dan PO2 82 mmHg, sejawat anda meminta V/Q scan. Hasilnya adalah „intermediate probability“scan.

Anda memberitahu sejawat anda bagaimana menggunakan Grateful Med untuk menemukan artikel yang baik tentang akurasi V/Q Scanning. Teman anda senang karena anda telah menemukan artikel yang valid, dan anda setuju untuk bergabung dalam mengaplikasikannya kepada kedua pasien tersebut.

Dalam artikel uji diagnostik sebelumnya, telah dibicarakan pendekatan untuk menentukan apakah penelitian valid, dan mempertimbangkan apakah hasilnya cukup bernilai. Lebih lanjut akan dibicarakan langkah berikutnya untuk memahami dan menggunakan hasil-hasil uji diagnostik yang valid. Apakah likelihood rasio hasil tes atau data yang dibutuhkan untuk penghitungannya ditampilkan?

• Probabilitas pre-tes Titik awal proses diagnostik adalah pada pasien dengan gejala dan tandanya.

Pada 2 pasien yang terdapat di latihan ini, pertama adalah wanita berusia 78 tahun 10 hari pasca operasi dan kedua adalah laki-laki berusia 28 tahun dengan kecemasan, keduanya dengan sesak nafas tanpa nyeri dada spesifik. Dugaan klinis adanya emboli pulmonar (PE) sesuai keluhan yang disampaikan kedua pasien tersebut, disebut probabilitas pre-tes, akan sangat berbeda: probabilitas pada wanita lanjut usia adalah tinggi sedangkan pada laki-laki dewasa muda adalah rendah. Akibatnya, walaupun hasil V/Q scan keduanya adalah „intermediate probability“, tatalaksana selanjutnya mungkin berbeda. Dokter mungkin akan mengobati pasien yang wanita lanjut usia sementara untuk pasien yang laki-laki muda akan dilakukan pelacakan lebih lanjut.

Dua kesimpulan terjadi dari pola pikir sebagai berikut. Pertama, apa pun hasil V/Q scan, tidak memberikan kepastian informasi adanya PE. Sesuatu dapat dilakukan untuk memodifikasi probabilitas pre-tes PE menjadi probabilitas post-tes. Arah dan besarnya perubahan kedua probabilitas ini ditentukan dari sifat uji diagnostik, khususnya adalah fokus pembahasan pada bagian ini yaitu likelihood ratio.

Kesimpulan kedua, perbedaan kedua pasien ini yaitu probabilitas pre-tes akan sangat mempengaruhi proses diagnosis. Setiap langkah baik anamnesis maupun pemeriksaan fisik merupakan langkah diagnosis yang meningkatkan atau menurunkan probabilitas penyakit tertentu. Berpikir tentang laki-laki muda yang diceitakan sejawat, fakta bahwa adanya sesak nafas meningkatkan kemungkinan PE, demikian juga riwayat immobilisasi selama 10 jam, tetapi dari segi usia, riwayat penyakit sebelumnya, hasil pemeriksaan fisik dan rontgen torak serta analisa gas darah normal, seluruhnya menurunkan probabilitas. Jika diketahui sifat tiap pemeriksaan/informasi (dan untuk hal tersebut, kami melakukan (9) (10)) dapat diubah urutan pemeriksaan tersebut, menggabungkan setiap informasi dari setiap pemeriksaan yang dilakukan dan melanjutkannya dengan menghitung ulang probabilitas penyakit yang dipikirkan. Klinisi telah menjalankan hal ini, tetapi karena sifat dari anamnesis dan pemeriksaan fisik secara individual biasanya tidak didapatkan, seringkali harus digunakan pengalaman dan intuisi untuk mencapai probabilitas pre-tes yang mendahului permintaan suatu uji diagnostik. Untuk beberapa problem klinis, termasuk diagnosis PE, intuisi tersebut telah terbukti akurat.

Page 8: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

8

Meski demikian, informasi terbatas tentang sifat tiap anamnesis dan pemeriksaan fisik sering menghasilkan variasi estimasi probabilitas pre-tes yang cukup lebar dari para klinisi. Terdapat sejumlah solusi untuk masalah ini. Pertama, peneliti klinis harus melakukan penelitian tentang riwayat penyakit dan pemeriksaan fisik untuk mempelajari lebih banyak tentang sifat langkah diagnostik ini. Beruntung, penelitian-penelitian semacam ini sudah sangat umum. Panzer dkk. menyimpulkan bahwa banyak informasi yang diperoleh dalam form teks kedokteran (11) dan overview tentang akurasi dan presisi riwayat penyakit dan pemeriksaan fisik. Informasi-informasi tersebut telah dipublikasikan secara bersamaan dengan Users’ Guides dalam JAMA secara berseri tentang The Rational Clinical Examination (12). Dalam tambahannya, untuk beberapa penyakit seperti iskemi miokard, analisis multivariabel menuntun klinisi bagaimana cara menggabungkan informasi untuk membuat probabilitas pre-tes yang teliti (13). Kedua, bila tidak diketahui sifat dari riwayat penyakit dan pemeriksaan fisiknya, dapat dilakukan konsultasi antar sejawat tentang estimasi probabilitasnya; pandangan yang berupa konsensus akan memiliki akurasi lebih baik dibandingkan intuisi individual. Terakhir, bila tetap tidak ada kepastian tentang probabilitas pre-tes, kita dapat mengasumsikan kemungkinan tertingginya, kemungkinan terendahnya, dan mencermati jika mengubah tatalaksana klinis. Diskusi berikut akaan memberikan ilustrasi bagaimana hal tersebut dilakukan. • Likelihood Ratio

Manfaat klinis suatu uji diagostik sangat ditentukan oleh akurasinya saat mengidentifikasi suatu penyakit, dan akurasi pengukuran akan difokuskan pada likelihood ratio. Mari kita perhatikan tabel 3, disusun berdasarkan hasil penelitian PIOPED. Terdapat 251 pasien dengan hasil angiografi terbukti menderita PE dan 630 pasien dengan hasil angiogram atau pemantauannya bukan PE. Untuk keseluruhan pasien, V/Q scan diklasifikasikan dalam 4 tingkatan, dari ”high probability” sampai dengan normal atau mendekati normal. Seberapa besar kemungkinan hasil scan”high probability” di antara pasien yang menderita PE? Tabel 3 memperlihatkan bahwa sejumlah 102 dari 251 pasien penderita PE (atau 0,406) mempunyai hasil scan “high probability”. Seberapa sering hasil tes yang sama ditemukan pada pasien yang walaupun suspek menderita PE, tidak terbukti menderita PE? Jawabannya adalah 14 dari 630 atau 0,022. Rasio dari kedua nilai proporsi ini disebut likelihood ratio (LR) dan untuk hasil scan “high probability” adalah 0,406/0,022 atau 18,3. Dengan kata lain, hasil scan paru “high probability” 18,3 kali lebih sering ditemukan pada pasien dengan PE dibandingkan pada pasien tanpa PE.Dengan cara yang sama, LR dapat dihitung untuk tiap tingkat hasil uji diagnostik. Tiap perhitungan mengandung jawaban dari 2 pertanyaan: pertama, berapa besar kemungkinan untuk memperoleh suatu hasil uji diagnostik (contoh “low probability”V/Q scan) pada pasien dengan penyakit tertentu (contoh PE) dan kedua, berapa besar kemungkinan memperoleh hasil uji diagnostik yang serupa (“low probability”V/Q scan) pada pasien tanpa penyakit tertentu tersebut (tidak menderita PE). Untuk hasil “low probability”V/Q scan kemungkinannya adalah 39/251 (0,16) dan 273?630 (0,43) dan rasio keduanya menjadi (LR hasil pemeriksaan “low probability”V/Q scan) 0,36. Seperti ditampilkan pada tabel 3, kita dapat mengulang perhitungan ini.

Page 9: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

9

Tabel 3. Sifat-sifat tes Ventilation/Perfusion (V/Q) Scanning

Pulmonary Embolism

Positif Negatif

Jumlah Proporsi Jumlah Proporsi Likelihood

Ratio High Probability

102 102/251=

0.406 14

14/630= 0.022

18.3

Intermediate Probability

105 105/251=

0.418 217

217/630= 0.344

1.2

Low Probability

39 39/251=

0.155 273

273/630= 0.433

0.36

Hasil V/Q

Scan

Normal/ Mendekati Normal

5 5/251= 0.020 126 126/630=

0.200 0.10

Total 251 630

Apakah arti angka-angka tersebut? LR memberikan petunjuk tentang seberapa besar hasil suatu uji diagnostik akan meningkatkan atau menurunkan probabilitas pre-tes suatu penyakit tertentu. LR 1 berarti probabilitas post-tes tepat sama dengan probabilitas pre-tes. LR lebih besar dari 1 meningkatkan probabilitas terdapatnya suatu penyakit tertentu, dan makin tinggi LR makin besar peningkatan tersebut. Sebaliknya, LR kurang dari 1 akan menurunkan probabilitas penyakit tersebut, dan semakin kecil nilai LR, makin besar penurunan tersebut dan makin kecil nilai tes tersebut. • Seberapa besar nilai LR yang besar dan seberapa kecil nilai LR yang kecil?

Menggunakan LR dalam praktek sehari-hari akan memberikan kepekaan terhadap interpretasinya, namun secara kasar terdapat pedoman:

o LR >10 atau <0,1 membuat perubahan besar dan seringkali konklusif dari probabilitas pre-tes ke probabilitas post-tes

o LR 5-10 dan 0,1-0,2 membuat pergeseran moderat dari probabilitas pre-tes ke probabilitas post-tes

o LR 2-5 dan 0,5-0,2 membuat sedikit perubahan (tetapi terkadang penting) dalam probabilitas; dan

o LR 1-2 dan 0,5-1 sangat sedikit mengubah probabilitas (dan jarang penting).

Setelah menentukan besar dan signifikansi nilai LR, bagaimana kita menggunakannya dari probabilitas pre-tes menjadi probabilitas post-tes? Kita tidak dapat menggabungkan secara langsung nilai-nilai likelihood, yang dapat dilakukan adalah menggabungkan nilai-nilai probabilitas atau prosentase; yang secara formal menggunakan konversi probabilitas pre-tes menjadi nilai odds, mengalikan hasilnya dengan nilai LR, dan mengkonversikan hasil post-tes odds ke probabilitas post-tes. Walaupun tidak sulit (F1), perhitungan ini membosankan dan dihindari; beruntung terdapat cara yang lebih mudah.

Sebuah nomogram yang dikemukakan Fagan (14)(gambar 1) melakukan seluruh konversi dan menyederhanakannya. Kolom pertama menampilkan nilai-nilai probabilitas pre-tes, kolom kedua menampilkan nilai LR, dan kolom ketiga menampilkan nilai probabilitas post-tes. Probabilitas post-tes diperoleh dengan cara menarik garis lurus berawal dari nilai probabilitas pre-tes melalui nilai LR.

Page 10: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

10

Pasien dengan suspek PE sesudah operasi abdominal. Hampir seluruh klinis setuju bahwa probabilitas pasien semacam ini untuk menderita PE tinggi, lebih kurang 70%. Nilai ini dimasukkan sebagai probabilitas pre-tes. Hasil V/Q scan dilaporkan ‘high probability”. Ditarik garis berawal dari probabilitas pre-tes 70% melalui nilai LR 18,3 berkaitan hasil scanning “high probability”, probabilitas post-tes menjadi 97%. Bagaimana jika hasil V/Q scan berbeda? Jika hasil V/Q scan”ïntermediate” (LR 1,2) probabilitas PE berubah menjadi 74%, sementara bila hasil mendekati normal, probabilitas post-tes menjadi 19%.

Gambar 1. Likelihood ratio nomogram

Telah dijelaskan bahwa probabilitas pre-tes adalah suatu estimasi, dan salah

satu cara memperlakukan ketidakpastiannya adalah dengan mencermati implikasi rentang probabilitas pre-tes yang dimungkinkan. Marilah membuat asumsi bahwa

Page 11: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

11

probabilitas pre-tes dalam kasus ini adalah sekitar 60% atau juga sekitar 80%. Probabilitas post-tes akan mengikuti perbedaan probabilitas pre-tes seperti ditampilkan pada tabel 4. Tabel 4. Probabilitas pre-tes, likelihood ratio hasil ventilation/perfusion scan, dan probabilitas post-test pada 2 pasien dengan pulmonary embolus

Probabilitas pre-tes, % (Rentang)*

Hasil Scan dan likelihood ratio Probabilitas post-tes, %

(Rentang)*

Wanita usia 78 th dgn onset serangan dyspne pasca operasi abdominal

(60)* 70% (80) High probability: LR = 18.3 (96%) 97% (99%)

(60) 70% (80) Intermediate probability: LR = 1.2 (64%) 74% (83%)

(60) 70% (80) Low probability: LR = 0.36 (35%) 46% (59%)

(60) 70% (80) Normal/near normal: LR = 0.1 (13%) 19% (29%)

Laki-laki 28 th dengan dyspnea dan nyeri dada atipik

(10) 20% (30) High probability: LR = 18.3 (67%) 82% (89%)

(10) 20% (30) Intermediate probability: LR = 1.2 (12%) 23% (34%)

(10) 20% (30) Low probability: LR = 0.36 (4%) 8% (6%)

(10) 20% (30) Normal/near normal: LR = 0.1 (1%) 2% (4%)

* Nilai dalam kurung menampilkan suatu plausible range probabilitas pre-tes. Artinya, bila kemungkinan terdekatnya sebagai probabilitas pre-tes adalah 70%, nilai rentang 60 - 80% juga menjadi estimasi yang rasional

Latihan serupa dapat diulang untuk pasien kedua, laki-laki muda dengan nyeri dada non-spesifik dan hiperventilasi. Jika dipertimbangkan probabilitas pre-tes yang mungkin untuk PE adalah 20%, menggunakan nomogram, probabilitas post-tesnya dengan hasil scan “high probability’ meningkat menjadi 82%, hasil ‘intermediate probability” menjadi 23% dan hasil mendekati normal menjadi 2%. Probabilitas pre-tes (dengan rentang kemungkinan 10-30%), LR dan probabilitas post-tes berhubungan dengan tiap hasil dari 4 kemungkinan hasil seperti ditampilkan pada tabel 4.

Pembaca yang mengikuti diskusi ini akan memahami esensi dari interpretasi suatu uji diagnostik, dan jangan berhenti di sini! Harus dipertimbangkan seksi berikut yang akan membicarakan opsi sensitivitas dan spesifisitas. Kami memasukkannya karena klinisi masih tetap akan menemukan hasil setiap penelitian dalam terminologi sensitivitas dan spesifisitas, dan berharap dapat memahami framework alternatif ini untuk menyimpulkan sifat-sifat suatu uji diagnostik. • Sensitivitas dan Spesifisitas

Anda mungkin telah memperhatikan bahwa pembahasan tentang lkelihood ratio mengabaikan topik lain tentang hasil tes yang normal dan abnormal. Termasuk ketika ditampilkan 4 interpretasi V/Q scan yang berbeda, masing-masing dengan LRnya. Peneliti PIOPED menampilkan hasil penelitian mereka dengan cara yang berbeda. Mereka mundur pada konsep terdahulu (tapi kurang bermanfaat) yaitu sensitivitas dan spesifisitas.

Sensitivitas adalah proporsi pasien yang sesungguhnya sakit dari mereka yang memiliki hasil tes positif dan spesifisitas adalah proporsi orang yang tidak sakit dari

Page 12: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

12

mereka yang memiliki hasil tes negatif. Untuk menggunakan konsep ini, hasil tes harus dibedakan menjadi normal dan abnormal; dengan kata lain, menyusun suatu tabel 2x2. Bentuk umum tabel 2x2 yang digunakan untuk memahami sensitivitas dan spesifisitas ditampilkan pada tabel 5A. Perhatikan kembali tabel 3 dan cermati bahwa kita dapat mentransformasikannya menjadi setidaknya 3 tabel 2x2, berdasarkan apa yang disebut normal dan abnormal (atau hasil tes yang dikatakan positif dan negatif). Marilah kita asumsikan bahwa hanya hasil pemeriksaan scan ”high probability” sebagai hasil tes abnormal (positif). Hasil tabel 2x2 ditampilkan pada tabel 5B. Tabel 5A. Perbandingan hasil uji diagnostik dengan hasil pemeriksaan standar rujukan

Standar Rujukan {PRIVATE}Hasil tes

Penyakit positif Penyakit negatif

Abnormal (+) True

positive (a) False

positive (b)

Normal (-) False

negative (c) True

negative (d)

Sensitivitas = a/(a+c) Spesifisitas = d/(b+d) LR hasil tes positif = (a/(a+c)) / (b/(b+d)) LR hasil tes negatif = (c/(a+c)) / (d/(b+d))

{PRIVATE}Tabel 5B. Perbandingan hasil uji diagnostik (V/Q scan) dengan hasil standar rujukan (pulmonary angiogram) berdasarkan asumsi hanya hasil ‘high probability” scan sebagai hasil positif (abnormal).

Angiogram Kategori {PRIVATE}Scan Pulmonary Embolus positif Pulmonary Embolus negatif

High Probability 102 14

Yang lain 149 616

Total 251 630

Sensitivitas: 41% Spesifisitas: 98% Likelihood ratio hasil tes ‘high probability “: 18.3 Likelihood ratio hasil tes yang lain: 0.61

Untuk menghitung sensiivitas dari data pada tabel 3 diperhatikan jumlah pasin dengan PE (251) yang memiliki hasil pemeriksaan V/Q scan positif (102) – sensitivitas adalah 102/251 atau lebih kurang 41% (a/a+c). Untuk menghitung spesifisitas diperhatikan jumlah pasien tanpa PE (630) yang memiliki klasifikasi hasil pemeriksaan V/Q scan normal (616) – spesifisitas adalah 616/630 atau 98% (d/b+d). Dapat juga dihitung likelihood ratio untuk hasil tes positif dan negatif menggunakan titik potong ini, yaitu berturut-turut adalah 18,3 dan 0,6.

Marilah kita lihat penampilan uji diagnostik tersebut jika keputusan nilai batas ”positif” dan ”negatif” digeser pada tabel 3. Sebagai contoh, hanya kategori hasil V/Q scan “normal/mendekati normal” yang dimasukkan sebagai hasil tes negatif. Tabel 2x2 (tabel 5C) menunjukkan sensitivitas sekarang adalah 246/251, atau 98% (dari 251 pasien dengan PE, 246 mendapatkan hasil V/Q scan positif), tetapi apa yang terjadi dengan spesifisitasnya? Dari 630 orang tanpa PE, hanya 126 yang memiliki hasil tes negatif (spesifisitas 20%). Likelihood ratio pada hasil ini berturut-turut adalah 1,23 dan 0,1. Perhatikan bahwa dengan titik potong ini, kita tidak hanya kehilangan informasi

Page 13: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

13

terkait hasil scan “high probability”, tetapi juga interpretasi “intermediate” dan “low probability” yang seakan-akan meningkatkan kemungkinan terdapatnya PE, sedangkan faktanya kemungkinan tersebut turun. Anda dapat menyusun tabel 2x2 ketiga dengan menset titik potong di tengah – jika sensitivitas dan spesifisitas berturut-turut adalah 82 dan 63%, dan LR yang berhubungan dengan hasil tes “positif”dan “negatif” adalah 2,25 dan 0,28, berarti anda benar (F2) {PRIVATE}Table 5C. Perbandingan hasil uji diagnostik (V/Q scan) dengan hasil standar rujukan (pulmonary angiogram) berdasarkan asumsi hanya hasil scan normal/mendekati normal sebagai hasil negatif (normal).

Angiogram Kategori {PRIVATE}Scan Pulmonary Embolus

positif Pulmonary Embolus

negatif

High, intermidiate, and low probability

246 504

Normal/mendekati normal 5 126

Total 251 630

Anda dapat memperhatikan bahwa dalam menggunakan sensitivitas dan

spesifisitas anda harus membuang informasi yang penting, atau berulang menghitung untuk setiap titik potong. Kami merekomndasikan pendekatan dengan LR karena lebih sederhana dan efisien.

Sejauh ini, kita telah mengakui bahwa hasil penelitian PIOPED mendekati kebenaran untuk pasien yang masuk dalam penelitian ini, dan memastikan nilai-nilai LR untuk berbagai hasi tes yang berbeda. Seberapa bermanfaatkah tes serupa pada praktek klinik kita? Apakah hasil penelitian akan membantu tatalaksana pasien saya? 1. Apakah reprodusibilitas dan interpretasi hasil tes memuaskan untuk setting

saya? Nilai uji diagnostik tergantung pada kemampuannya memberikan hasil yang

sama apabila dikerjakan berulang pada pasien yang sama dalam keadaan stabil. Reprodusibilitas yang buruk dapat berasal dari masalah pada tes itu sendiri (contoh, variasi pada reagensia kit radioimunoasai untuk pengukuran kadar hormon). Penyebab kedua perbedaan hasil tes tersebut adalah apabila tes membutuhkan interpretasi (contoh, luasnya elevasi segmen ST pada EKG). Idealnya, sebuah artikel uji diagnostik menyatakan perkiraan tentang reprodusibilitas hasil tes. Hal ini terutama penting apabila keahlian dibutuhkan dalam penampilan atau interpretasi hasil tes (anda dapat memastikannya dengan melihat kesepakatan/ketidaksepakatan klinik pada pembacaan EKG, USG atau CT scan, oleh 2 orang atau kebih bahkan bila semuanya adalah para ahli).

Apabila reprodusibilitas tes pada setting penelitian sedang, dan ketidaksepakatan klinik umum terjadi, dan tes tersebut masih membedakan secara baik antara kondisi sakit dan tidak sakit, tes tersebut sangat bermanfaat. Pada keadaan demikian, tes tersebut akan dapat diaplikasikan pada setting klinis anda. Bila reprodusibilitas suatu tes diagnostik sangat tinggi, dan variasi antar observer rendah, kemungkinannya adalah tes itu sederhana dan tidak menimbulkan interpretasi ganda atau interpretasinya membutuhkan ketrampilan tinggi. Bila yang terakhir ini

Page 14: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

14

diaplikasikan, keterbatasan tenaga dengan ketrampilan tinggi di setting klinik anda mungkin menyebabkan tes tidak dapat dikerjakan dengan baik.

Pada penelitian PIOPED , peneliti tidak hanya menampilkan secara rinci dekripsi kriteria diagnostik interpretasi V/Q scan, namun juga dilaporkan kesepakatan antara 2 orang yang secara independen membaca hasil scan. Ketidaksepakatan klinik pada hasil ”intermediate” dan ”low probability” umum terjadi (berturut-turut adalah 25% dan 30%), dan hasil hasil demikian dikumpulkan untuk dilakukan konfirmasi melalui pertemuan panel para ahli. 2. Apakah hasilnya dapat diaplikasikan pada pasien saya?

Isu yang diperhatikan di sini adalah apakah tes tersebut akan menghasilkan akurasi yang serupa dengan hasil penelitian bila diterapkan pada pasien anda. Sifat-sifat suatu uji diagnostik dapat berubah dengan adanya variasi beratnya penyakit yang berbeda atau distribusi kondisi yang mempengaruhinya. Apabila pasien-pasien yang diperiksa seluruhnya dengan kondisi sakit berat, likelihood ratio akan bergeser menjauhi nilai 1 (sensitivitas meningkat). Bila pasien seluruhnya dengan kondisi sakit ringan, likelihood ratio bergeser ke arah nilai 1 (sensitivitas turun). Bila pasien yang tidak sakit dipengaruhi kondisi yang membuat hasil tes dapat menyerupai hasil dimana pasien yang diperiksa adalah sakit, likelihood ratio akan bergeser sangat dekat dengan nilai 1 dan tes tesebut kurang bermanfaat. Pada setting klinik yang berbeda dimana lebih sedikit orang tidak sakit dipengaruhi kondisi semacam itu, likelihood ratio bergeser menjauhi nilai 1 dan tes tersebut akan tampak lebih berguna.

Fenomena perbedaan sifat uji diagnostik pada perbedaan subpopulasi ditunjukkan secara jelas pada pemeriksaan EKG untuk diagnosis penyakit arteri koroner. Intinya, makin berat penyakit, makin besar likelihood ratio hasil pemeriksaan EKG yang abnormal berupa angiografik penyempitan arteri koroner (15). Contoh lain adalah pada diagnosis tromboemboli vena dimana compression ultrasound untuk trombosis vena proksimal tampak akurat pada pasien rawat jalan yang simtomatik dibandingkan pada pasien pasca operatif yang asimtomatik (16). Terkadang, suatu tes gagal pada pasien yang sangat membutuhkan. Likelihood ratio hasil pemeriksaan negatif pada tes dipstik untuk diagnosis cepat infeksi saluran kemih (ISK) lebih kurang 0,2 pada pasien yang jelas bergejala dan berarti sangat besar kemungkinannya menderitaISK, tetapi menjadi di atas 0,5 pada pasien dengan kemungkinan kecil ISK (17). Hal ini berarti tes tersebut kurang membantu dalam menyingkirkan infeksi pada kasus yang probabilitasnya rendah.

Apabila setting praktek anda serupa dengan penelitian dan pasien-pasien anda seluruhnya ditemukan pada kriteria inklusi sedangkan tidak ada yang termasuk pada kriteria eksklusi, anda dapat meyakini bahwa hasil penelitian dapat anda terapkan. Apabila tidak, dibutuhkan penilaian cermat. Seperti pada intervensi terapi, anda harus mencermati terdapatnya penyebab dari tidak dapat diterapkannya tes tersebut pada pasien anda. Apakah karena tingkat beratnya penyakit, atau kombinasi kondisi yang berpengaruh pada tes, pada pasien anda sedemikian berbeda sehingga hasil tes tidak dapat digeneralisasi. Isu generalisasi ini dapat dipecahkan jika ditemukan overview yang mengumpulkan hasil-hasil sejumlah penelitian (18).

Pasien-pasien pada penelitian PIOPED merupakan sampel yang mewakili pasien dengan suspek PE dari sejumlah RS besar. Hasilnya, dengan demikian, dapat diaplikasikan pada sebagian besar praktek klinik di Amerika Utara. Terdapat kelompok yang tidak dapat digeneralisasikan dari hasil penelitian tersebut, seperti pasien kritis (yang dieksklusikan dari penelitian, dan yang mempunyai spektrum pengaruh kondisi berbeda dibandingkan pasien umumnya).

Page 15: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

15

3. Apakah hasil tersebut akan mengubah tatalaksana saya? Sangat bermanfaat membuat, mempelajari, mengajarkan, dan

mengkomunikasikan keputusan tatalaksana, untuk menghubungkannya secara terbuka dengan probabilitas suatu penyakit. Terdapat beberapa penyakit yang probabilitasnya rendah dimana klinisi dapat mengabaikan diagnosis dan tidak membutuhkan tes lebih lanjut (batas suatu ”tes”). Serupa, terdapat probabilitas yang tinggi dimana klinisi perlu mempertimbangkan konfirmasi diagnosis, dan akan berhenti melakukan tes dan memulai terapi (batas suatu ”terapi”). Apabila probabilitas penyakit terletak di antara keduanya, tes lebih lanjut diperlukan (2).

Sekali kita memutuskan batas ”tes”dan ”terapi”, probabilitas post-tes memiliki implikasi langsung pada terapi. Mari kita umpamakan kita akan memberikan terapi pada pasien dengan probabilitas PE 80% atau lebih (diketahui bahwa mengobati 20% pasien ternyata tidak diperlukan). Selanjutnya, marilah diumpamakan kita akan mengabaikan diagnosis PE pada pasien dengan probabilitas 10% atau kurang. Anda mungkin diharapkan menerapkan sejumlah hal yang berbeda di sini; batas ”terapi”dan ”tes” adalah suatu hasil penilaian, dan berbeda untuk situasi yang berbeda tergantung pada risiko terapi (bila berisiko, anda butuh diagnosis lebih pasti) dan bahaya penyakit tersebut bila tidak diterapi (bila bahaya dari kasus yang terlepas tinggi – seperti PE – anda membutuhkan probabilitas post-tes yang sangat rendah untuk membuang diagnosis). Pada pasien laki-laki muda, hasil scan ”high probability” menghasilkan probabilitas post-tes 82% dan mengindikasikan terapi (atau minimal adalah pelacakan lebih lanjut), hasil scan ”intermediate” (probabilitas post-tes 23%) mengindikasikan tes lebih lanjut (mungkin venografi kaki bilateral, pletismografi impedans atau USG serial, atau angiografi pulmonar), sementara hasil scan ”low probability” atau ”normal” (probabilitas post-tes kurang dari 10%) akan memperbolehkan kita mengeksklusikan diagnosis PE. Pada wanita usia lanjut, hasil scan ”high probability” mengindikasikan terapi (probabilitas post-tes PE 97%), hasil “intermediate” (probabilitas post-tes 74%) mungkin seimbang antara apakah harus diterapi atau dilakukan tes lebih lanjut (seperti angiogram pulmonar), sementara hasil lain mengindikasikan pelaksanaan tes lebih lanjut.

Apabila hasil pemeriksaan sebagian besar pasien mempunyai nilai LR mendekati 1, berarti tes tersebut kurang berguna. Manfaat suatu uji diagnostik sangat dipengaruhi oleh proporsi pasien dengan suspek penyakit tertentu dimana hasil pemeriksaannya memiliki nilai LR sangat tinggi atau sangat rendah sedemikian sehingga hasil tes tersebut akan mengubah probabilitas penyakit melewati nilai batas ”tes” atau ”terapi”. Pada pasien-pasien suspek PE dengan hasil V/Q scan, sebagai contoh, tabel 3 memungkinkan kita menentukan proporsi pasien dengan hasil ekstrem (”high probability”scan dengan nilai LR lebih dari 10, atau ”normal/mendekati normal” dengan nilai LR 0,1). Proporsinya dapat dihitung sebagai berikut: (102+14+5+126)/881 atau 247/881=28%. Klinisi yang telah frustrasi dengan seringnya hasil ”ïntermediate” dan ”low probability”pada pasien suspek PE akan mengetahui bahwa proporsi 28% tersebut jauh dari optimal. Jadi, selain hasil ”high probability”scan dengan nilai LR tinggi dan hasil ”normal/mendekati normal” dengan nilai LR rendah, V/Q scan terbatas manfaatnya pada pasien suspek PE.

Komentar terakhir harus dibuat untuk penggunaan uji diagnostik secara berurutan. Telah ditunjukkan bahwa anamnesis riwayat penyakit atau pemeriksaan fisik merupakan uji diagnostik. Kita menyusun probabilitas pretes yang dapat berubah sesuai tiap temuan baru. Secara umum, dapat juga digunakan tes laboratorium atau prosedur imaging dengan cara yang sama. Apabila 2 macam tes berkaitan sangat erat, aplikasi tes kedua mungkin hanya akan memberikan sedikit informasi, dan nilai LR aplikasi tes secara berurutan akan memberikan hasil misleading. Intinya, sekali seseorang

Page 16: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

16

mempunyai hasil tes laboratorium yang sangat bagus untuk defisiensi besi, serum ferritin, tes-tes tambahan seperti serum Fe atau saturasi transferin tidak akan memberikan tambahan informasi. 4. Apakah pasien menjadi lebih baik bila menggunakan hasil tes?

Kriteria utama manfaat suatu uji diagnostik adalah apabila tes tersebut memberikan tambahan informasi yang membimbing perubahan tatalaksana yang bermanfaat untuk pasien (20). Akurasi tes tidak perlu diperdebatkan apabila suatu penyakit berbahaya bila tidak terdiagnosis, risiko tes tersebut dapat diterima, dan tersedia terapi yang efektif. Hasil scanning ”high probability”atau ”normal/ mendekati normal” dapat membatasi kebutuhan investigasi lebih lanjut sehingga antikoagulansia dapat diberikan secara tepat (berpengaruh besar tehadap outcome pasien).

Pada situasi klinis yang lain, tes mungkin akurat, dan tatalaksana mungkin berubah sesuai hasil tes, tetapi dampak pada outcome pasien mungkin kurang jelas. Sebagai contoh adalah kateterisasi jantung kanan untuk banyak pasien kritis, atau hasil MRI yang lebih bernilai dibandingkan CT-scan untuk banyak variasi masalah. Bagaimana anda menggunakan petunjuk ini untuk praktek klinik dan untuk membaca

Dengan menerapkan prinsip-prinsip yang dideskripsikan dalam makalah ini maupun makalah sebelumnya anda diharapkan dapat melakukan asesmen dan menggunakan informasi dari artikel uji diagnostik. Anda sekarang dapat memutuskan apakah sebuah artikel uji diagnostik memberikan hasil yang benar yang dapat dipercaya, apa sifat-sifat tes tersebut, dan segala sesuatu yang terkait aplikasinya pada pasien anda. Disebabkan nilai LR sekarang telah dipublikasikan untuk banyak tes (11), pendekatan yang dilakukan dalam artikel ini dapat secara langsung diterapkan pada praktek kedokteran sehari-hari. Catatan kaki F1. Persamaan untuk konversi probabilitas ke nilai odds adalah (probabilitas/(1-probabilitas)- ekuivalen dengan probabilitas terkena suatu penyakit/probabilitas tidak terkena suatu penyakit tersebut). Nilai probabilitas 0,5 berarti odds 0,5/0,5, atau 1/1; nilai probabilitas 0,8 berarti odds 0,8/0,2 atau 4/1; nilai probabilitas 0,25 berarti odds 0,25/0,75 atau 1/3, atau 0,33. Jika pretes odds sudah diperoleh, post-tes odds dapat dihitung dengan cara mengalikan pretes odds x LR. Post-tes odds dikonversi kembali menjadi probabilitas menggunakan formula probabilitas= odds/(odds+1). F2. Apabila dibuat grafik dimana sumbu vertikal menunjukkan sensitivitas (angka positif benar) untuk titik potong yang berbeda dan sumbu horisontal menunjukkan (1-spesifisitas) (atau angka positif palsu) untuk titik potong yang sama, dan anda menghubungkan titik-titik yang terbentuk untuk tiap titik potong yang digunakan, anda memperoleh grafik Receiver Operating Characteristic (ROC curve). Kurva ROC digunakan secara resmi untuk membandingkan nilai dari tes-tes yang berbeda dengan cara menghitung area di bawah tiap kurva, tetapi sekali diputuskan kebutuhan titik potong tunggal maka tidak memiliki penerapan klinis yang lain secara langsung

Page 17: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

17

Rujukan 1. The PIOPED Investigators, Anonymous. Value of the ventilation/perfusion scan in

acute pulmonary embolism. Results of the prospective investigation of pulmonary embolism diagnosis (PIOPED). The PIOPED Investigators. J A M A 263. 2753-9 (1990).

2. Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Second Edition. Clinical epidemiology, a basic science for clinical medicine.(1991) Second Edition.Boston/Toronto: Little, Brown and Company.

3. Thomson DMP, Krupey J, Freedman SO, Gold P. The radioimmunoassay of circulating carcinoembryonic antigen of the human digestive system. Proceedings of the National Academy of Sciences of the United States of America 64. 161-7 (1969).

4. Bates SE. Clinical applications of serum tumor markers. Ann Intern Med 115. 623-38 (1991).

5. Begg CB, Greenes RA. Assessment of diagnostic tests when disease verification is subject to selection bias Assessment of diagnostic tests when disease verification is subject to selection bias. Biometrics 39. 207-15 (1983).

6. Gray R, Begg CB, Greenes RA. Construction of receiver operating characteristic curves when disease verification is subject to selection bias. Med Decis Making 4. 151-64 (1984).

7. Ransohoff DF, Feinstein AR. Problems of spectrum and bias in evaluating the efficacy of diagnostic tests. N Engl J Med 299. 926-30 (1978).

8. Choi BC. Sensitivity and specificity of a single diagnostic test in the presence of work-up bias. J Clin Epidemiol 45. 581-6 (1992).

9. Mayeski RJ.Panzer RJ, Black ER, Griner PF, Eds. Pulmonary Embolism.(1991) Diagnostic strategies for common medical problems. American College of Physicians.

10. Stein PD, Terrin NL, Hales CA, et al, Terrin ML, Palevsky HI, Saltzman HA, Thompson BT, Weg JG. Clinical, laboratory, roentgenographic, and electrocardiographic findings in patients with acute pulmonary embolism and no pre-existing cardiac or pulmonary disease. Chest 100. 598-603 (1991).

11. Panzer RJ, Black ER, Griner PF. Diagnostic strategies for common medical problems.(1991) 1.Philadelphia: American College of Physicians.

12. Sackett DL, Rennie D. The science and art of the clinical examination. J A M A 267. 2650-2 (1992).

13. Pozen MW, D'Agostino RB, Selker HP, et al, Sytkowski PA, Hood WB, Jr. A predictive instrument to improve coronary-care-unit admission practices in acute ischemic heart disease. A prospective multicenter clinical trial. N Engl J Med 310. 1273-8 (1984).

14. Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med 293. 257(1975). 15. Hlatky MA, Pryor DB, Harrell FE, Harrell FE, Jr., Califf RM, Mark DB, Rosati RA.

Factors affecting sensitivity and specificity of exercise electrocardiography. Multivariable analysis. Am J Med 77. 64-71 (1984).

16. Ginsberg JS, Caco CC, Brill-Edwards PA et al. Venous thrombosis in patients who have undergone major hip or knee surgery: detection with compression US and impedance plethysmography. Radiology 181. 651-4 (1991).

17. Lachs MS, Nachamkin I, Edelstein PH, et al. Spectrum bias in the evaluation of diagnostic tests: lessons from the repid dipstick test for urinary tract infection. Ann Intern Med 117. 135-40 (1992).

18. Irwig L, Tosteson A, Gatsonis C, et.al. Guidelines for meta-analyses evaluating diagnostic tests. (1995). Unpublished.

Page 18: Telaah Kritis Artikel Diagnosis - Mahasiswa

Telaah Kritis Artikel Harm – terjemahan andharu dahesihdewi

18

19. Guyatt GH, Oxman A, Ali M. Diagnosis of iron deficiency. J Gen Intern Med 7. 145-53 (1992).

20. Guyatt GH, Tugwell PX, Feeny DH, Haynes RB, Drummond M. A framework for clinical evaluation of diagnostic technologies A framework for clinical evaluation of diagnostic technologies. Can Med Assoc J 134. 587-94 (1986).