Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore Bab 21. Kesalahan Metodologis dalam penelitian kedokteran

Bab 21. Kesalahan Metodologis dalam penelitian kedokteran

Published by haryahutamas, 2016-04-02 01:05:01

Description: Bab 21. Kesalahan Metodologis dalam penelitian kedokteran

Search

Read the Text Version

Bab 2L - Kesaliahan metodologis dalam penelitian kedokteran Sudigdo Sastroasmoro alam publikasi kedokteran, termasuk yang diterbitkan dalam jurnal terkemuka, masih ditemukan cukup banyak kesalahan metodologis. Sebagian besar memang kesalahannya bersifat 'minor', namun tidak jarang terdapat pula kesalahan metodologis yang serius sehingga dapat memengaruhi hasil. Berikut diajukan contoh-contoh kesalahan metodologis dan statistika yang merupakan ilustrasi hipotetis, agar dapat dibuat sederhana dan tidak merujuk pada artikel tertentu. 1 UI x'TINTUK DATA BERPASANGAN Ingin diufi efektivitas obat A untuk mengurangi asma nokfurnal (serangan asma malam hari) pada pasien asma. Dilakukan uii klinis pada 40 pasien dengan desain the one group pretest - posttest design (before anil after), yakni membandingkan jumlah pasien yang mengalami asma nokturnal sebelum dan setelah pemberian obat A selama 4 minggu. Dari 40 pasien penelitian, sebelum pemberian obat A 1.3 pasien mengalami asma nokturnal, setelah pemberian obat A, hanya 7 masih mengalami asna nokturnal. Peneliti kemudian menganalisis hasil dalam tabeL2x2 (Thbel 2L-L). *.rr

Sudigdo Sastroasmoro 433Tobel 2l-1. Jumloh posien yong mengolomi osmq nokturnol sebelum dqn seleloh teropi dengan obql A Asmo noklurnol Jumloh Sebelum r3 27 40 Sesudoh 33 40 Jumloh 20 60 80 x2 =2,4O; df=l; p=0,121KomentarTabel di atas adalah tabel analisis untuk uji x2 independerL sedangdesain before and after atau the one group pretest-posttest design memberidata berpasangan. Untuk ini, uji yang sesuai adalah uji McNemar,dan tabel disusun dengan memperhatikan bahwa data yang adaadalah data berpasangan (lihatlah Tabel 2l-2 dan2l-3): r pasienyang sebelumpengobatanmenderitaAN dan setelah terapi mengalami AN dimasukkan dalam sel a o pasien yang sebelum pengobatan menderita AN dan setelah terapi tidak menderita AN dimasukkan ke dalam sel b o pasien yang sebelum pengobatan tidak menderita AN dan setelahnya menderita AN dimasukkan ke dalam sel c r pasien yang sebelum pengobatan tidak mengalami AN dan setelahnya tidak mengalami AN dimasukkan ke dalam sel d Tabel 2\-2 memperlihatkan tabulasi hasil penelitian sebelumdan setelah dilakukan intervensi.terapi. Jadi total subyek menjadi40, bukan 80 seperti pada Tabel2l-1. Tabel 21-3 merupakan tabel *,.

434 Kesalahan meto dolo gis dal am p enelitinn2x2 yarrg benar untuk uji x2 untuk data berpasangan (uji McNemar);tampak bahwa uji hipotesis menghasilkan perbedaan yang secarastatistika bermakna. Jadi penggunaan uji statistika untuk dataindependen padahal datanya adalah berpasangan merupakan 'kerugran'bagi peneliti karena lebih sulit memperoleh ^ilri p yang kecil. TABEL 2l-2. Tobvlqsi hqsil penelition efektivitqs obqt A untuk dsmq noklurnol, doto berposqngdn Sebelum Setelqh lsikon leropi teropi dolqm sel I AN+ AN+ o 2 AN+ AN. b 3 AN- AN- d 4 AN- AN+ c 5 AN- AN- d dst.TABEL 2l-3. Jumloh posien ydng mengqlomi qsmd noklurnql (AN) sebelum dqn seteloh terapi dengon obqt A Seteloh teropi AN+ AN. JumlohSebelum AN+ r3teropi AN. 24 27 Jumloh 40 x2(McNemor),|=0,048 il -,i#,

Sudigdo Sastroasmoro 435 2 Utl-T INDEPENDEN DAN I.III-T BERPASANGAN Contoh Peneliti menguji efek obat antihipertensi B kepada 30 pasien dengan hipertensi esensial. Sebagai kontrol, untuk setiap pasien dicari pasien lain dengan umur, jenis kelamin, serta derajat hipertensi yang sama (matchlzg individual). Sebelum intervensi rerata tekanan diastolik pada kedua kelompok sebanding (108 mmHg pada kelompok terapi, L10 mmHg pada kelompok kontrol). Setelah intervensi, pada kelompok terapi terjadi penurunan rerata tekanan darah dari L08 menJadi 98 mmHg, sedang pada kelompok kontrol tekanan rerata diastolik turun dari 110 menjadi 102 mmHg. Uji-t independen memberi nilai p sebesar 0,0743, artinya secara statistika tidak bermakna.KomentarKarena kelompok kontrol dipilih dengan caramatching individual,maka untuk data numerik uji yang sesuai adalah uji-t untuk 2kelompok berpasangan. Uji-t untuk kelompok berpasangan lebihmudah memberikan hasil yang bermakna dibanding uji-t untuk2 kelompok independen. Dengan uji berpasangan, diperoleh nilaip = 0.048, jadi secara statistika bermakna. 3 Up-r DAN ANALrsrs vARTANS Contoh Suatu studi cross-sectional ingin menguji hipotesis bahwa terdapat perbedaan tekanan darah pasien obes yang tidak berolah raga, yang berolah raga angkat berat, dan yang berolah raga aerobik. Diperiksa tekanan darah diastolik ketiga kelompok subyek tersebut, jumlah tiap kelompok adalah 30 orang. Hasil pemeriksaan ini dipaparkan dalam Tabel20-4. Kemudian dilakukan uji antara kelompok A dan B (p = 0,04+), antara kelompok A dan C (p = 9,946', dan antara {;..1

436 Kesalahan meto dolo gis dalam p enelitian kelompok B dan C (p = 0,096). Disimpulkan oleh peneliti bahwa terdapat perbedaan yang bermakna pada tekanan darah antara pasien obes yang tidak berolah raga dengan yang berolah raga angkat berat maupun aerobik, dan tidak ada perbedaan yang bermakna antara pasien yang berolah raga angkat berat dengan yang berolah raga aerobik.KomentarUji-t baik yang dependen maupun yang independen, hanya sahihuntuk digunakan dalam pengujian perbedaan rerata antara duakelompok. Bila jumlah kelompok lebih dari dua, maka uji hipotesisyang sesuai adalah anova (analisis varians), dengan cara sekaligusmembandingkan rerata antara semua kelompok. Bila anova tidakmenunjukkan adanya perbedaan yang bermakna, maka pengujianselanjutnya tidak diperlukan. Sebaliknya, apabila anova memberikanhasil yang bermakna, maka perlu dilakukan pengujian selanjutnya,dengan maksud untuk menentukan di mana letak perbedaantersebut. Untuk uraian yang lebih lengkap lihatlah kembali Bab L5.Tobel 214. Rerqto lekonon dqroh 3 kelompok posien obes Reroto tekonon doroh diostolik posien obes (mmHg) Tidok beroloh rogo Angkot beror Aerobik (n = 30) (n = 30) (n = 30) 94,5 (SD 9,21 87,3 (SD 9,71 85,8 (SD I 1,2)4 KnrvrarNaaN KLIMS DAN KEMAKNAAN srAnsrIKA Contoh I Regimen C dicoba pada 8 pasienieukemia jenis tertentu, dengan pembanding regimen standar pada 8 pasien lainnya. il.a

Sudigdo Sastroasmaro 437 Karakteristik klinis dan laboratoris kedua kelompok sebelum pengobatan sebanding. Setelah 5 bulan, hanya 1 pasien pada. kelomBok regimen standar yang masih hidup, sedang pada kelompok regimen C,5 orang pasien hidup. Uii Fischer memberi nilai p = 9,119. Disimpulkan bahwa regimen C tidak lebih baik daripada regimen standar dalam pengobatan pasien LLA. Contoh II Suatu survei menunjukkan bahwa sebagian besar siswa di S menderita askariasis. Untuk menguji efek obat D dalam memberantas penyakit cacing ini, terhadap 20.000 murid yang didiagnosis askariasis dilakukan randomisasi untuk diberi obat D, atau obat standar. Pada akhir penelitian di antara 10.000 murid yang diberi obat standar 7750 murid (77,5o/\") dinyatakan sembuh, sedang dari 10.000 murid yang diberi obat D, 7950 (79,5\"/0) sembuh. Uji x2 untuk 2 kelompok independen memberikan nilai p = 0,0006 (sangat bermakna). Disimpulkanbahwa obat D lebihbaik daripada obat standar dalam memberantas askariasis.KomentarPada Contoh I, jumlah subyek yang terlalu sedikit menyebabkanuji mutlak Fischer tidak memberi kemaknaan statistika. Namurykita tidak dapat menyimpulkan bahwa obat C tidak bermanfaathanya karena uji statistika tidak bermakna. Meski hasil uji statistikatidak bermakna, namun melihat perbedaan hasil yang mencolok,sambil menunggu hasil yang lebih definitif, tentulah lebih rasionalbagi klinikus untuk memilih obat C untuk pasien leukemia tersebutdibanding obat standar. Pada Contoh II, perbedaan kesembuhan antara kedua kelompok(77,5% vs 79,5o/\") secara klinis tidak penting namun secara statistikasangat bermakna karena jumlah subyek yang amat banyak. Jadiberapa pun nilaip yang diperolehpada uji hipotesis tidak mengubahpenerapan pengobatan sehari-hari. Dalam hal ini keputusan untukmemilih obat tidak didasarkan pada efektivitas melainkan pada hal-hal lain (harga, rasa, mudahnya diperole[ keamanan, dan lain-lain). ilt

438 Kesalahan met o dolo gis d alam p enelitian Dua contoh tersebut menunjuk perlunya pemahaman konsep'bermakna secara statistika' (statistically significant) dan'pentingsecara klinis' (clinically imp ort ant), dan menggarisbawahi perlunyaperkiraan besar sampel pada tiap penelitian. (Ingat kembali: Toofew subjects proae nothing, too many subject prore eaerything!). 5 KorEnasr ANIAR 2 pENcurunaN vARTABEL YANG SAMA Contoh Suatu alat diiklankan dapat mengukur secara non-invasif .saturasi O, dengan akurat, sehingga dapat menggantikan pemeriksaan saturasi oksigen konvensional. Dilakukan pemeriksaan safurasi O, terhadap 40 sampel darah, masing- masing dengan alat baru dan alat konvensional. Hasilnya digambarkan sebagai diagram baar (scatter diagram). Perhitungan koefisien korelasi memberi angka r= 0.98 (kolerasi sangat kuat) dengan p = O03 (kemungkinan bahwa hasil semata- mata karena faktor peluang sangat kecil yakni 3%). Disimpulkan bahwa alat baru tersebut dapat menggantikan cara konvensional unfuk mengukur saturasi Or.KomentarKoefisien kolerasi (Pearson) digunakan untuk menunjukkan hubunganantara 2 variabel berskala numerik (misalnya hubungan antarakadar Hb dan feritin, atau antara berat dan tinggi badan), dan tidakdigunakan untuk menyatakan kesesuaian antara 2 carapengukuranterhadap satu variabel numerik. Bahwa koefisien kolerasi tidaklayak digunakan untuk memperlihatkan kesesuaian antara duapengukuran terhadap variabel numerik yang sama dapat dijelaskandengan contoh ekstrem berikut. Misalnya ada alat baru yang menghasilkan data numerik,namun hasil pengukurannya memberi nilai lebih kurang s/q darinilai yang diperoleh dengan cara standar. Apabila pengukuran il -4't

Sudigda Sastroasmoro 439dilakukan secara berpasangan pada banyak subyek, maka dapatdibuat diagram baur dan dihitung koefisien korelasinya. Karenanilai cara baru lebih-kurang 3A nllai standar, maka diagram baurakan memberi kesan hubungan linear yang baik, dan koefisienkolerasiny a juga sangat baik, misalnya r = 0,94. Dengan .demikianmaka jelaslah bahwa koefisien korelasi (r) bukan indikator untukmenyatakan adanya agreement (kesesuaian) antara dua pengukurannumerik pada variabel yang sama. Untuk menyatakan kesesuaiansebenamya cukup dilihat apakah setiap nilai secara individual padakedua kelompok sama ataupun hampir sama. Kesesuaian dapatdinyatakan dalam koefisien kesesuaiary yakni dengan menghitungIimits of agrsement, yang tidak dibahas di sini. 6 Up ruNrs NEGATTF Contoh Peneliti ingin membuktikan bahwa pemberian digoksin 0,01 mg/kglhari dosis tunggal memberi kadar digoksin serum yang sama dengan dosis 0,01 mg/kg/hari yang diberikan 2 kali sehari. Ia merancang penelitian; jumlah subyek yang diperlukan adalah 100 pasien per kelompok. Pada waktu penelitian selesai dilakukan, peneliti hanya memperoleh masing-masing 60 pasien per kelompok. Pengukuran kadar digoksin menunjukkan bahwa pada kelompok 2 kali sehari, kadarnya adalah 0.L6 (SD 0,5) ng/dl, sedang pada kelompok digoksin dosis tunggal kadarnya adalah 12 (SD 0,72) ngldL. Uji-t untuk kelompok independen menunjukkan bahwa kadar digoksin kedua kelompok tidak berbeda bermakna (p=0,09), dan disimpulkan bahwa kedua cara tersebut sama baiknya, sehingga pemberian L x perhari dianjurkary karena lebih mudah dan lebih menyenangkan pasien.KomentarSuatu uji klinis biasanya ingin membuktikan adanya perbedaanvariabel efek antara kelompok yang diobati dan kelompok kontrol. * ;*o.rl

440 Kesnlahan me t o dolo gis dalam p enelitianNamun, uji klinis dapat pula dipakai untuk menyelidiki bahwa diantara 2 cara pengobatan tidak terdapat perbedaan, sehinggapengobatan yang lebih murah, sederhana, atau mudah, dipilihsebagai pengganti obat yang lama. Seperti diuraikan padaBab 17,untuk semua penelitian diperlukan perkiraan besar sampel. Padapenelitian yang mencari perbedaan antara dua cara pengobatary besarsampel yang kurang akan menghasilkan perbedaan yang tidakbermakna, meski mungkin sebenarnya bermakna (kesalahan tipeII atau B menjadi besar bila jumlah subyek sedikit). Konsekuensikeadaan ini adalah peneliti akan gagal membuktikan bahwa obatyang satu lebih baik daripada yang lain. Pada studi yang bertujudn memperlihatkan tidak ada perbedaan,(disebut uji klinis negatif atau non-inferiority study), besar sampelyang kurang akan memberi nilap p yar.g tidak bermakna, yangmembawa peneliti untuk menyimpulkan bahwa ledua obat tidakberbeda. Jalan pikiran seperti ini sangat berbahaya, karena makinsedikit subyek, makin mudah untuk memperoleh hasil uji statistikayang tidak bermakna. Dengan kata lairy pada studi yang bertujuanuntuk membuktikan tidak ada perbedaan antara 2 obat, besarsampel yang diperlukan harus dipenuhi, sebelum dikatakan bahwakedua obat tidak berbeda. (Perhitungan besar sampelnya pun harusmempergunakan nilai B yang kecil dan effect size yang kecil pula,sehingga jumlah subyek yang diperlukan jauh lebih banyakdaripada uji klinis positif terhadap obat yang sama). 7 Hporssrs A pRroRr vs HrporEsrs posr rroc Contoh Rekam medis suatu ruang rawat sehari (RSS) menunjukkan bahwa dari 80 neonatus dengan diaie akut, terdapat 48 neonatus memperoleh ASI eksklusif, dan 32 mendapat ASI + formula. Atas dasar data tersebut dan didukung oleh pustaka, peneliti kemudian merumuskan hipotesis bahwa pemberian susu formula merupakan faktor risiko untuk terjadinya diare akut pada neonatus, dan menguji hipotesis tersebut pada data yang ada. il ;*oi

Sudigdo Sasfuoastnoro 441KomentarHipotesis, telah sering disebut, merupakan jawaban sementara ataspertanyaan penelitian, yang harus diuji kesahihannya secara empiris.Hipotesis tersebut harus dirumuskan sebelum penelitian dimulai.Pada penelitian analitik retrospektif sekali pun, hipotesis harusdirumuskan sebelum peneliti melihat data yang ada. Syarat-syaratlain untuk hipotesis yang baik dapat dilihat kembali dalam Bab 3. Tidak jarang peneliti melihat data retrospektif dan mencobamencari-cari hubungan antar-variabel. Setelah peneliti melihat datadan melihat ada asosiasi antara 2 variabel maka ia merumuskanhipotesis, dan mengujinya dengan data tersebut. Tindakan inisecara metodologis salah. Dipandang dari sudut hipotesis, penelitiandalam ilmu alamiah dapat dikelompokkan menjadi dua, yaknihyp otesis testing res earch (penelitian untuk menguji suatu hipotesis),dan hypotesis generating researck (penelitian untuk membangunhipotesis). Pada jenis pertama, hipotesis harus dikemukakan sebelumstudi dimulai(apriori) atas dasar pustaka dan penalaran logis ilmiatudan pengumpulan data dimaksudkan untuk menguji hipotesis itusecara empiris. Pada jenis kedua termasuk surval penelitian deskriptif,atau data sekunder seperti rekam medi+ pengumpulan data merupakanupaya untuk menyusun hipotesis. Hipotesis yang dirumuskan berdasarset data tertentu tidak boleh diuji dengan data tersebut karena terjadirasionalisasi sirkular, yang tidak reprodusibel. Hipotesis yang dibangunberdasar data tertentu harus diuji dengan set data yang lain. Pada contoh di atas, untuk menguji validitas hipotesisnya makapeneliti tidak dapat menggunakan data RSS, melainkan harusmendesain studi baru, dengan subyek yang sama sekali lain. Ujihipotesis yang dilakukan terhadap data RSS hanya berlaku untukkelompok pasien tersebut, tidak berlaku untuk pasien berikutnya. Tindakan peneliti untuk melakukan pengujian hipotesis setelahia melihat data, dan mengujinya dengan data tersebut, seringkalidisebut dengan beberapa julukan, seperti fishing expedition, datadredging, atau \"ekploitasi dan bukan eksplorasi data\" . Hal tersebutmi:mbawa konsekuensi yang serius, karena dapat membawapeneliti pada simpulan yang salah. fi.r

442 Kesalahan metodologis dalam penelitian Contoh terkenal adalah laporan yang menunjukkan hubunganantara kebiasaan minum kopi dengan kejadian kanker pankreas. Padapengumpulan data untuk tujuan lairy sekelompok peneliti melihatadanya hubungan antara kebiasaan minum kopi dengan kankerpankreas; penggemar kopi lebih banyak menderita kanker tersebutketimbang bukan penggemar kopi (misalnya dari 1000 peminumkopi 2 orang menderita kanker pankreag sedang pada 10.000 bukanpenggemar kopi hanya 3 menderita kanker. Peneliti membangunhipotesis, dan diuji dengan data tersebut; terbukti bermakna secarastatistika bahwa peminum kopi lebih banyak menderita kankerpankreas daripada bukan peminum kopi. Setelah hasil diumumkan,peneliti lain membuat studi yang sama dengan desain yang samamaupun berbeda. Tidak satu pun penelitian memberi hasil yangmendukung laporan tadi. Kelompok peneliti semula pun melaporkanhasil negatif setelah melakukan studi khusus untuk hal tersebut. Dengan tersedianya fasilitas komputer sebagai databsse saat ini,bahaya data dredging tersebut makin mengancam. Misalnya satusalinan rekam medis menghimpun 3000 pasien penyakit jantungbawaary tiap pasien dengan 100 variabel. Kemudian peneliti mencari,mengeksploitasi data melihat apakah ada asosiasi antar-variabel.Apabila tampaknya ada, ia membuat hipotesis (hipotesis post hoc)danmengujinya dengan data semula, yangmudah dilakukan denganprogram statistika. Uji hipotesis tersebut tidak dapat dibenarkan. I Hpomsrsr BryARTAT MUrrrpEL Contoh Pada 200 pasien difteria dengan miokarditis dicari hubungan pelbagai variabel, apakah ada hubungan dengan terjadinya miokarditis. Faktor yang dinilai adalah umuq, jenis kelamin, lama sakit, bullneck, status imunisasi, status gizi, dan tingkat ekonomi. Dilakukan analisis bivariat (antar2 variabel) yakni antara masing-masing risiko dengan kejadian miokarditis. Dari penguiian diperoleh nilai p untuk masing-masing faktor risiko, untuk kemudian disimpulkan ada atau tidaknya hubungan tiap faktor tersebut dengan miokarditis. ilt.i

Sudigdo Sqstroasmoro 443KomentarIni adalah contoh hipotesis multipel, yakni uji yang dilakukanberulang kali pada L set data. Bila ditetapkan batas kemaknaanuntuk satu hipotesis (cx), secara matematis dapat dibuktikan bahwadengan bertambahnya uji hipotbsis, makin besar nilai cx (kesalahantipe I), atau kesalahan untuk menyatakan ada hubungan padahalsebenarnya tidak ada. Apabila untuk satu hipotesis ditetapkan bataskemaknaan sebesar ct, maka untuk n hipotesis nilai cr bertambahbesar, sehingga peluang untuk memperoleh hasil yang bermaknasemata-mata karena peluang makin besar. Salah satu cara untuk me4gatasi hal ini adalah membagi odenganjumlah uji yang dilakukan. Bila semula ditetapkanbatas kemaknaancr = 0,05, dan dilakukan 10 uji hipotesis, maka nilai cr diturunkanmenjadi a/10 :0,005. Koreksi ini disebut penyesuaian Bonferonniyang dianggap berlebihan sehingga mengurangi pozuer penelitian.Sebagai kompromi, nilai crhanya diturunkan menjadi 0,02 atau 0,01. Kedua, pelbagai faktor risiko tersebut mungkin merupakanperancu. Status gizi (yang berkaitan dengan tingkat sosial ekonomi)akan menyebabkan anak tidak diimunisasi lengkap, jadi status gizimerupakan faktor perancu dalam asosiasi antara imunisasi danmiokarditis. Variabel lain mungkin menjadi perancu dalam asosiasiantara 2 variabel. Makin banyak dilakukan uji hipotesis pada satu setdata, makin besar pula kemungkinan jalinan pelbagai perancu. Untukmengatasinya dapat dilakukan analisis multivaria| dalam hal ini regresilogistik. Cara lain adalah membatasi uji hipotesis hanya yang utamahingga dapat dibuat desain yang dapat mengurangi perancu. 9 UJI oIaCNOSTIK DENGAN PENGAMATAN TIDAK INDEPENDEN - Contoh Untuk menyederhanakan penilaian status bayi pascalahir, dilakukan uji diagnostik guna menilai validitas pemberian skor dengan menggunakan 3 dari 5 komponen nilai Apg\"\", il.r|

444 Kesqlahan metodologis dalam penelitian yaitu denyut jantung, warna kulit, dan usaha napas. Sebagai baku emas adalah penilaian menurut Apga1, yang terdiri atas 5 komponen. Peneliti melakukan penilaian nilai Apgar modifikasi (3 komponen) dan nilai Apgar konvensional (5 komponen) pada tiap bayiyangbaru lahir. Hasil pengamatan disajikan dalam tabel2 x 2 untuk uji diagnostik.KomentarSalah satu syarat yang harus dipenuhi dalam uji diagnostik adalahpengamatan harus dilakukan secara independen (pengamatan yangdiuji tidak bergantung kepada pengamatan baku emas). Bila initidak dipenuhi, maka pengertiannya menjadi sirkular. Pada contohdi atas, akhirnya yang dibandingkan adalah 3 komponen dengan3 komponen Apgar, bukan antara 3 dengan 5 komponen. Dapatdiduga bahwa sensitivitas dan spesifisitas nilai Apgar Modifikasiadalah'sangat baik' (namun tidak sahih). 10 PENculeN VARIABEL NUMERIK BERULANG MENURUT WAKTU Contoh I Ingin diketahui apakah bayi yang mendapat ASI eksklusif (hanya minum ASI saja sampai 6 bulan) berbeda beratnya dibanding dengan bayi yang tidak mendapat ASI eksklusif. Untuk ini dilakukan studi kohort selama l tahun terhadap 300 bayi yang lahir cukup bulan. Dari 300 bayi, 100 oleh orangtuanya diberi ASI eksklusif, sedang 200 tidak. Peneliti menimbang bayi tiap bulan, dan menghitung rerata berat badan bayi baik pada kelompok ASI eksklusif dan yang tidak. Dari data yang ada ia melakukan uji't untuk kelompok tidak berpasangan pada saat bayi berusia 't,3,6,9, dan 12 bulan. Contoh II Seorang dokterparu inginmeneliti apakah obatA lebih baik daripada obat B untukpengobatanmaintenance asma kronik. Ia melakukan alokasi random sekelompok pasien asma *.r)

Sudigdo Sastroasmoro 445 kronik; satu kelompok diberi obat A dan kelompok lainnya obat B. Sebagai tolok ukur dilakukan pemeriksaan faal paru, yakni lEV (dalam ml/menit). Agar memperoleh hasil yang meyakinkan, peneliti melakukan uji faal paru sebelum penelitian, dan setiap minggu setelah awal terapi sampai L bulan. Dilakukan uji-t untuk dua kelompok independen terhadap nilai rerata FEV, pada akhir minggu I,II,III dan IV, saat penelitian dihentikan.KomentarSemangat tinggi peneliti ini tidak diimbangi dengan pemahamanmetodologi dan statistika yang cukup. Pengukuran berulangterhadap nilai numerik subyek menurut perjalanan waktu danmembandingkan berulang nilai reratanya di antara 2 kelompokadalah keliru. Tindakan ini menyalahi salah satu syarat uji numerik,yakni bahwa pengukuran harus dilakukan kepada kelompok subyekyang independen. Istilah independen di sini bukan berarti bahwakedua kelompok dipilih tidak dengan matching, tetapi berarti nilaipengukuran subyek pada satu kelompok tidak bergantung pada nilaisubyek kelompok lainnya. Dalam Contoh I, pada perbandingan rerataberat bayi kedua kelompok pada akhir bulary kedua nilai adalahindependen. Namun pada perbandingan kedua dan seterusnya,pengukuran pada tiap kelompok tidak lagi independery sebab beratbayi waktu berumur 3 bulan bergantung pada beratnya waktu 1bulan, dan waktu L bulan sudah dilakukan uji hipotesis. Untuk dataseperti ini tersedia analisis statistika yakni time-series analysis. Hal yang sama terjadi pada Contoh II. Pengukuran FEV L minggusetelah awal pengobatan adalah sahih, karena nilai pada keduakelompok adalah independen. Akan tetapi untuk minggu-mingguberikutnya nilai-nilai rerata pengukuran tidak independen, sebabbergantung pada nilai sebelumnya, y ang no t a b en e sudah dianalisis.Secara statistika hal ini sama saja dengan melakukan uji hipotesismultipel, sehingga harus dihindari. Selain kesalahan prinsip tersebut, peneliti dapat dihadapkanpada data yang mungkin membingungkan. Pada Contoh II tidaktertutup kemungkinan bahwa pada akhir minggu pertama pasien {;..1

446 Kesalahan meto dolo gis dalam penelitianyang diberi obatAmempunyai FEV lebih baik daripada yang diberiobat B, pada minggu kedua hal sebaliknya terjadi. Pada mingguketiga kembali obat A lebih baik, sedangkan pada akhir penelitianobat B lebih unggul. Faktor peluang serta kemungkinan drop outmemungkinkan hasil tersebut. Bagaimana menyimpulkan hasiltersebut? Sulit dimengerti bagaimana suatu obat memberi hasilyang berubah-ubah dengan berubahnya waktu. Untuk mengatasimasalah ini peneliti dapat memilih salah satu dari dua cara, yakni: . melakukan analisis dengan teknik tertentu (time-series analysis) untuk melihat perbandingan secara keseluruhary atau . membandingkan rerata berat bayi (pada Contoh L), atau rerata FEV (Contoh 2) hanya pada akhir penelitian. Penentuan saat analisis harus dilakukan oleh peneliti, tentunya bergantung kepada substansi penelitian serta teori yang ada. L't MesaraH pADA coNyEMENCE IAMaLTNG Contoh Dokter Z meneliti kaitan antara kadar HGH(human growth h ormon e) dengan status gizi anak, dengan desain studi cr o s s - sectional. Awalnya ia sangat bersemangat, setiap hari mencari pasien dengan gizi kurang atauburuk, kemudian mengukur kadar HGH-nya. Lama kelamaan ia mulai jemu, datang 2 kali seminggu. Itupun ia memilih pasiennya, yang kira-kira orangtuanya koperatif. Bulan berikutnya ia pergi kongres ke Hongkong terus ke Prancis menengok anaknya. Pulang dari luarnegeri ia kembali mengambil sampel, kali ini dengan semangat dipaksakan karena waktu penelitian sudah hampir selesai. Setelah jumlah subyek terpenuhi, ia menganalisis datanya.KomentarDalam Bab 5 telah ditegaskan bahwa dalam penelitiary sampel harusdapat mewakili populasinya. Baku emas untuk cara pemilihan drll

Sudigdo Sastroasmoro 447sampel ini adalah probability sampling, dalam hal ini simple randomsampling. Mengapa? Karena semua perhitungan matematika Istatistika didasarkan pada asumsi bahwa subyek dipilih dengancara random sampling. Dalam penelitian klinis sering cara tersebutsulit dilaksanakan, karena jumlah subyek yang terbatas. Untukitu tersedia cara consecutiae sampling, yakni semua subyek yangmemenuhi kriteria pemilihan dalam kurun waktu tertentu dipilihmenjadi sampel. Bila waktu penelitian cukup lama, 6 bulan atau 1tahun, maka pasien yang terpilih dapat mewakili pasien yangberobat. Namun bila peneliti seringkali pergi dan tidak mintasejawatnya untuk mengumpulkan data, ia kehilangan banyaksubyek yang seharusnya terpilih. Tidak ada cara untuk menjaminbahwa karakteristik subyek terpilih yang gagal direkrut sama dengansubyek yang direkrut. Akibatnya, sampel tidak mewakili populasisehingga hasil apa pun yang diperoleh pasti tidak dapat digeneralisasike populasi terjangkau, apa lagi ke populasi yang lebih luas. 12 INTSRPNTTASI YANG KELIRU TENIANG NILAI RNilai r (koefisien korelasi linear Pearson antar 2 variabel numerik)berkisar antara 0 sampai 1. Nilai r ini dalam output program komputerselalu disertai dengan rulai p yakni besamya kemungkinan bahwahasil yang diperoleh semata-mata disebabkan oleh peluang. Tidakjarang penulis yang mencari hubungan antara 2 variabel numerik(misalnya lingkar perut dengan kadar kolesterol) memperoleh hasilr = 0,'1.6 danp = 0,002 menyimpulkannya dengan kalimat \"terdapatkorelasi yang sangat bermakna antara lingkar perut dengan kadarkolesterol\". Interpretasi tersebut sangat keliru oleh karena justruhal sebaliknya yang sebenamya terjadi, yakni: \"tidak ada korelasi antaralingkar perut dengan kadar kolesterol, dan hasil tersebut sangat kecilkemungkinannya disebabkan semata-mata karena peluang\". Jadiyang harus dilihatlebih dahulu adalah angka klinisnya (r) bukannilair:p-nya. Kita tahu bahwa nilai r yang terbaik adalah 1, 0.8 sampaiL berarti sangat baik, dan seterusnya, dan r <0,2 menunjukkankorelasi yang amat sangat lemah atau bahkan dapat dikatakan tidakada korelasi sama sekali. {tI

448 Kesalahan meto dolo gis dalam p enelitian PEnnN AHLI STATISTIKAMengingat besamya peluang untuk membuat kesalahan metodologisdalam studi klinis, adalah bijaksana bila sejak awaf saat penelitiandirancang, kita melakukan konsultasi dengan ahli statistika yangbiasa mendampingi penelitian klinis, atau klinikus yang mendalamiprinsip-prinsip metodologi dan statistika. Konsultasi awal menjaminrancangan yang lebih baik dan memperoleh saran ahli statistika.Pemilihan substansi penelitian klinis memang merupakan hakklinikus, narnun merumuskan masalah, menl.usun hipotesis, memilihdesairy menghitung besar sampel, memilih uji hipotesis, mengeloladat4 dan banyak hal berada di luar kemampuan kebanyakan klinikus. Saran tersebut bukan berarti para klinikus-peneliti menyerahkansegalanya kepada ahli statistika. Sering terjadi peneliti menyerahkanonggokan data kepada ahli statistika untuk dianalisis. Praktek tersebutsalah. Ahli statistika bukanlah teknisi yang harus menentukan apayang harus dilakukan terhadap onggokan data; ia juga bukansuperman yang menguasai semuahal, termasuk ranah klinis. Duahal dapat terjadi; di satu sisi peneliti tidak memahami proseduryang digunakan dalam analisis data. Di lain sisi, ahli statistika tidakdapat dituntut untuk memahami pelbagai masalah klinis. Hasilakhimya dapat diramal: peneliti, yang harus mempertanggungjawabkanhasil kerjanya, tidak menjiwai hasil kerjanya. Hal ini nyata pada ujiantesis para peserta program spesialis; banyak masalah metodologisyang dipertanyakan tidak dijawab denganbaik. lri sangat disayangkan;peneliti tidak menikmati proses dan hasil jerih-payahnya sendiri! SrupurexContoh-contoh di atas menunjukkan betapa kesalahan metodologisdapat terjadi akibat kurangnya pemahaman metodologi danbiostatistika. Hal tersebut juga menunjukkan bahwa kesalahanmetodologis, baik dalam desairy pemilihan subyek, pengukurarydan analisis serta interpretasi hasil dapat membawa peneliti kepadasimpulan yang keliru. Dengan kata lain ke.salahan metodologis dapat *..f

Sudigdo Sastroasmoro 449membuat upaya panjang penelitian menjadi tidak berarti samasekali. Kesalahan dalam analisis masih mungkin dapat dikoreksi,namun kesalahan dalam desairu pemilihan subyek, dan pengukuranadalah ireversibel. Pemeo lama GIGO yakni garbage in, garbage out,masih tetap relevan. Bila data mempunyai keandalan dan kesahihanyang buruk, maka simpulan penelitian pun menjadi tidak sahih. Untuk peneliti pemula, desain dan substansi penelitian yangsederhana, bila dirancang secara cermat dan dilaksanakan denganmemperhatikan kaidah-kaidah metodologi akan membuahkanhasil, yang meski sederhana, namun dapat menambah informasiilmiah yang akurat. Sebaliknya desain yang rumit dengan banyakpertanyaan penelitiary meski substansi dan analisisnya canggitr,tidakberarti sama sekali apabila dilaksanakan secara serampangan.Penelitian sederhana tentang rerata kadar bilirubin serum neonatuspada pelbagai masa gestasi yang dikerjakan secara benar lebihinformatif dan bermanfaat ketimbang studi biologi molekulardengan alat canggikr\" atau studi tentang faktor risiko terjadinya bayiberat lahir rendah dengan model statistika yang rumit, bila dirancangdan dikerjakan dengan menafikan prinsip penelitian. Menyia-nyiakan sumber daya baikwaktu, uang keahlian,lebih-lebih subyekpenelitian dengan cara melaksanakan penelitian yang tidak dapatdibuat kesimpulan definitif, adalah bertentangan dengan etika,bahkan merupakan dosa. Dnrrnn PUsTAKAI Afifi AA, Clark V. Computer-aided multivariate analysis. Edisi ke-2 New York: VNB, 1986.2 Andersen B. Methodological errors in medical research. Oxford: Blackwell, 1990.3 Altman DG. Practical statistics for medical research. London: Chapman and hall,1991.4 Altman DG, Machini D, Bryant TN, Gardnet Mj. Statistics with confidence. Edisi ke-2. London: BMI;2000.5 Norman G& Streiner DL. PDQ statistics. Toronto:Decker, 1989.6 Dawson B, Trapp RG. Basic and clinical biostatistics. Edisi ke-3. Boston: Lange Medical Books/McGraw G Hill, 2001. ili

450 Kesalahanmetodologis dalampenelitian - T, Elwood fM. Critical appraisal of epidemioologicalstudies and clinical trials. Edisi ke-2. Oxford: Oxford University Press, 1998. 8. Hulley SB, Cummings S& Browner WS, Grady D, Hearst N, Newman TB, penyunting. Designing clinical research - an epidemiologic approach. Edisi ke-2. philadelpia: wilkins, 2001. Ia{t . . at

Sudigdo Ssstroqsmoro 451 Dolom jurnol ilmioh sering ditemukon kesolohon; sebogion besor berupo kesolohon'minor', nomun sebogion loinnyc merupokon kesolohon metodologis yong berdompok longsung terhodop hosil penelition. Kesolohon metodologis yong terjodi dopot dolom desoin, dolom pelaksonoon, dolam onolisis hosil, moupun dolom menorik simpulan. Kesalohon metodolog is yang sering dij umpoi odoloh pami I ihon uji hipotesis yong tidok tepot. Fokto tersebut menghoruskon kito untuk melokukon telooh kritis terhodop semuo mokoloh yang diferbitkon oleh jurnol mano Pun. Untuk menghindorkon kesqlohon tersebut peneliti horus berkonsultosi dengon ohli metodologi / stotistika yong horus dimulai sejak peranconoon penelition.S Dolom jurnol ilmioh sering ditemukon kesolohon; sebogion besor berupo kesolohon'minor', namun sebagion loinnyo merupokon kesalohon metodologis yong berdompok longsung terhodop hasil penelition. Kesolahon metodologis yang terjodi dopot dolam desoin, dolom peloksanoon, dolom onolisis hosil, moupun dolom menorik simpulon. Fokta fersebut menghoruskon kito untuk melokukon teloah kritis tarhodop semuo mokoloh yong diterbitkon oleh jurnol mono Pun. #rttl


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook