Pengujian hipotesis adalah prosedur penting dalam statistik. Uji hipotesis mengevaluasi dua pernyataan yang saling eksklusif untuk menentukan pernyataan mana yang paling didukung oleh data sampel. Ketika suatu temuan dikatakan signifikan secara statistik, hal itu disebabkan oleh uji hipotesis.
Metode verifikasi
Metode pengujian hipotesis statistik adalah metode analisis statistik. Biasanya, dua kumpulan statistik dibandingkan, atau kumpulan data sampel dibandingkan dengan kumpulan data sintetis dari model ideal. Data tersebut harus ditafsirkan sedemikian rupa untuk menambah makna baru. Anda dapat menafsirkannya dengan mengasumsikan struktur tertentu dari hasil akhir dan menggunakan metode statistik untuk mengkonfirmasi atau menolak asumsi tersebut. Asumsi tersebut disebut hipotesis, dan uji statistik yang digunakan untuk tujuan ini disebut hipotesis statistik.
H0 dan H1 hipotesis
Ada dua utamakonsep pengujian statistik hipotesis - yang disebut "hipotesis utama, atau nol" dan "hipotesis alternatif". Mereka juga disebut hipotesis Neyman-Pearson. Asumsi uji statistik disebut hipotesis nol, hipotesis utama, atau singkatnya H0. Ini sering disebut sebagai asumsi default atau asumsi bahwa tidak ada yang berubah. Pelanggaran uji asumsi sering disebut sebagai hipotesis pertama, hipotesis alternatif, atau H1. H1 adalah singkatan untuk beberapa hipotesis lain, karena yang kita ketahui hanyalah bahwa data H0 dapat dibuang.
Sebelum menolak atau tidak menolak hipotesis nol, hasil pengujian harus diinterpretasikan. Sebuah perbandingan dianggap signifikan secara statistik jika hubungan antara kumpulan data tidak mungkin menjadi implementasi hipotesis nol menurut probabilitas ambang batas - tingkat signifikansi. Ada juga kriteria kesesuaian untuk pengujian hipotesis statistik. Ini adalah nama kriteria uji hipotesis, yang dikaitkan dengan hukum yang seharusnya dari distribusi yang tidak diketahui. Ini adalah ukuran numerik dari perbedaan antara distribusi empiris dan teoritis.
Prosedur dan kriteria pengujian hipotesis statistik
Metode pemilihan hipotesis yang paling umum didasarkan pada kriteria informasi Akaike atau koefisien Bayesian. Pengujian hipotesis statistik adalah teknik kunci dalam inferensi dan inferensi Bayesian, meskipun kedua jenis ini memiliki perbedaan yang mencolok. Uji Hipotesis Statistikmendefinisikan prosedur yang mengontrol kemungkinan salah dalam memutuskan default yang salah atau hipotesis nol. Prosedur ini didasarkan pada seberapa besar kemungkinannya untuk berhasil. Probabilitas membuat keputusan yang salah ini adalah kemustahilan bahwa hipotesis nol itu benar dan tidak ada hipotesis alternatif tertentu. Tes tidak dapat menunjukkan apakah itu benar atau salah.
Metode alternatif teori keputusan
Metode alternatif dari teori keputusan ada, di mana hipotesis nol dan pertama dianggap pada pijakan yang lebih setara. Pendekatan pengambilan keputusan lainnya, seperti teori Bayesian, berusaha untuk menyeimbangkan konsekuensi dari keputusan yang buruk di semua kemungkinan daripada berfokus pada satu hipotesis nol. Sejumlah pendekatan lain untuk memutuskan hipotesis mana yang benar didasarkan pada data, mana di antara mereka yang memiliki sifat yang diinginkan. Tetapi pengujian hipotesis adalah pendekatan yang dominan untuk analisis data di banyak bidang ilmu pengetahuan.
Menguji hipotesis statistik
Setiap kali satu set hasil berbeda dari set lain, seseorang harus mengandalkan pengujian hipotesis statistik atau pengujian hipotesis statistik. Interpretasi mereka membutuhkan pemahaman yang tepat tentang nilai-p dan nilai-nilai kritis. Penting juga untuk dipahami bahwa, terlepas dari tingkat signifikansinya, pengujian mungkin masih mengandung kesalahan. Oleh karena itu, kesimpulannya mungkin tidak benar.
Proses pengujian terdiri daribeberapa langkah:
- Sebuah hipotesis awal sedang dibuat untuk penelitian.
- Hipotesis nol dan alternatif yang relevan ditunjukkan.
- Menjelaskan asumsi statistik tentang sampel dalam pengujian.
- Menentukan tes mana yang sesuai.
- Pilih tingkat signifikansi dan ambang probabilitas di bawah mana hipotesis nol akan ditolak.
- Distribusi statistik uji hipotesis nol menunjukkan kemungkinan nilai di mana hipotesis nol ditolak.
- Perhitungan sedang berlangsung.
- Sebuah keputusan dibuat untuk menolak atau menerima hipotesis nol demi alternatif.
Ada alternatif yang menggunakan nilai-p.
Uji signifikansi
Data murni tidak berguna tanpa interpretasi. Dalam statistik, ketika mengajukan pertanyaan tentang data dan menafsirkan hasil, metode statistik digunakan untuk memastikan keakuratan atau kemungkinan jawaban. Saat menguji hipotesis statistik, kelas metode ini disebut pengujian statistik, atau uji signifikansi. Istilah "hipotesis" mengingatkan pada metode ilmiah, di mana hipotesis dan teori diselidiki. Dalam statistik, hasil uji hipotesis dalam jumlah yang diberikan asumsi tertentu. Ini memungkinkan Anda untuk menafsirkan apakah asumsi itu benar atau telah terjadi pelanggaran.
Penafsiran statistik tes
Uji hipotesisdigunakan untuk menentukan hasil penelitian mana yang akan mengarah pada penolakan hipotesis nol untuk tingkat signifikansi yang telah ditentukan. Hasil uji hipotesis statistik harus ditafsirkan agar pekerjaan dapat dilanjutkan. Ada dua bentuk umum kriteria pengujian hipotesis statistik. Ini adalah nilai p dan nilai kritis. Tergantung pada kriteria yang dipilih, hasil yang diperoleh harus ditafsirkan secara berbeda.
Apa itu nilai-p
Output digambarkan sebagai signifikan secara statistik ketika menginterpretasikan nilai-p. Padahal, indikator ini berarti probabilitas kesalahan jika hipotesis nol ditolak. Dengan kata lain, ini dapat digunakan untuk menyebutkan nilai yang dapat digunakan untuk menafsirkan atau mengukur hasil pengujian, dan untuk menentukan kemungkinan kesalahan dalam menolak hipotesis nol. Misalnya, Anda dapat melakukan uji normalitas pada sampel data dan menemukan bahwa ada kemungkinan kecil untuk terjadi outlier. Namun, hipotesis nol tidak harus ditolak. Uji hipotesis statistik dapat mengembalikan nilai-p. Hal ini dilakukan dengan membandingkan nilai p terhadap nilai ambang batas yang telah ditentukan yang disebut tingkat signifikansi.
Tingkat Signifikansi
Tingkat signifikansi sering ditulis dengan huruf kecil Yunani "alpha". Nilai umum yang digunakan untuk alfa adalah 5%, atau 0,05. Nilai alfa yang lebih kecil menunjukkan interpretasi hipotesis nol yang lebih andal. Nilai p dibandingkan dengannilai alfa yang dipilih sebelumnya. Hasilnya signifikan secara statistik jika p-value lebih kecil dari alpha. Tingkat signifikansi dapat dibalik dengan mengurangkannya dari satu. Hal ini dilakukan untuk mengetahui tingkat kepercayaan hipotesis yang diberikan terhadap sampel data yang diamati. Saat menggunakan metode pengujian hipotesis statistik ini, nilai P adalah probabilistik. Artinya dalam proses penafsiran hasil suatu uji statistik, seseorang tidak mengetahui mana yang benar atau salah.
Teori pengujian hipotesis statistik
Penolakan hipotesis nol berarti ada cukup bukti statistik yang tampaknya memungkinkan. Jika tidak, itu berarti tidak ada cukup statistik untuk menolaknya. Seseorang dapat memikirkan tes statistik dalam hal dikotomi menolak dan menerima hipotesis nol. Bahaya pengujian statistik hipotesis nol adalah, jika diterima, hipotesis itu mungkin tampak benar. Sebaliknya, akan lebih tepat untuk mengatakan bahwa hipotesis nol tidak ditolak karena tidak ada cukup bukti statistik untuk menolaknya.
Momen ini sering membingungkan figuran pemula. Dalam kasus seperti itu, penting untuk mengingatkan diri Anda sendiri bahwa hasilnya adalah probabilistik dan bahkan menerima hipotesis nol masih memiliki kemungkinan kesalahan yang kecil.
Hipotesis nol benar atau salah
Interpretasi nilai p tidak berarti nolhipotesis itu benar atau salah. Artinya telah dibuat pilihan untuk menolak atau tidak menolak hipotesis nol pada tingkat signifikansi statistik tertentu berdasarkan data empiris dan uji statistik yang dipilih. Oleh karena itu, nilai-p dapat dianggap sebagai probabilitas data yang diberikan di bawah asumsi yang telah ditentukan yang tertanam dalam uji statistik. Nilai p adalah ukuran seberapa besar kemungkinan sampel data akan diamati jika hipotesis nol benar.
Interpretasi nilai kritis
Beberapa tes tidak mengembalikan hal. Sebagai gantinya, mereka dapat mengembalikan daftar nilai kritis. Hasil penelitian semacam itu ditafsirkan dengan cara yang sama. Alih-alih membandingkan nilai p tunggal dengan tingkat signifikansi yang telah ditentukan, statistik uji dibandingkan dengan nilai kritis. Jika ternyata kurang, berarti tidak mungkin untuk menolak hipotesis nol. Jika lebih besar dari atau sama, hipotesis nol harus ditolak. Arti dari algoritma pengujian hipotesis statistik dan interpretasi hasilnya mirip dengan nilai-p. Tingkat signifikansi yang dipilih merupakan keputusan probabilistik untuk menolak atau tidak menolak asumsi uji dasar yang diberikan data.
Kesalahan dalam uji statistik
Interpretasi uji hipotesis statistik bersifat probabilistik. Tugas menguji hipotesis statistik bukanlah untuk menemukan pernyataan yang benar atau salah. Bukti pengujian mungkin salah. Misalnya, jika alfa adalah 5%, ini berarti sebagian besar 1 dari 20hipotesis nol akan ditolak karena kesalahan. Atau tidak karena gangguan statistik dalam sampel data. Mengingat titik ini, nilai p kecil di mana untuk menolak hipotesis nol dapat berarti bahwa itu salah atau telah dibuat kesalahan. Jika jenis kesalahan ini dibuat, hasilnya disebut positif palsu. Dan kesalahan seperti itu adalah kesalahan jenis pertama saat menguji hipotesis statistik. Di sisi lain, jika nilai p cukup besar untuk berarti penolakan hipotesis nol, itu mungkin berarti bahwa itu benar. Atau tidak benar, dan beberapa peristiwa yang tidak mungkin terjadi karena kesalahan itu dibuat. Jenis kesalahan ini disebut negatif palsu.
Probabilitas kesalahan
Saat menguji hipotesis statistik, masih ada kemungkinan untuk membuat salah satu jenis kesalahan ini. Data yang salah atau kesimpulan yang salah sangat mungkin terjadi. Idealnya, tingkat signifikansi harus dipilih yang meminimalkan kemungkinan salah satu kesalahan ini. Misalnya, pengujian statistik hipotesis nol mungkin memiliki tingkat signifikansi yang sangat rendah. Meskipun tingkat signifikansi seperti 0,05 dan 0,01 umum di banyak bidang ilmu pengetahuan, tingkat signifikansi yang paling umum digunakan adalah 310^-7, atau 0,0000003. Hal ini sering disebut sebagai “5-sigma”. Ini berarti bahwa kesimpulannya acak dengan probabilitas 1 dalam 3,5 juta pengulangan independen percobaan. Contoh pengujian hipotesis statistik sering membawa kesalahan seperti itu. Ini juga alasan mengapa penting untuk memiliki hasil yang independen.verifikasi.
Contoh penggunaan verifikasi statistik
Ada beberapa contoh umum pengujian hipotesis dalam praktik. Salah satu yang paling populer dikenal sebagai "Tea Tasting". Dr Muriel Bristol, rekan pendiri biometrik Robert Fisher, mengaku dapat memastikan apakah itu ditambahkan terlebih dahulu ke secangkir teh atau susu. Fisher menawarkan untuk memberinya delapan cangkir (empat dari masing-masing varietas) secara acak. Statistik uji sederhana: menghitung jumlah keberhasilan dalam memilih cangkir. Daerah kritis adalah satu-satunya keberhasilan dari 4, mungkin berdasarkan kriteria probabilitas biasa (< 5%; 1 dalam 70 1,4%). Fisher berpendapat bahwa hipotesis alternatif tidak diperlukan. Wanita itu dengan benar mengidentifikasi setiap cangkir, yang dianggap sebagai hasil yang signifikan secara statistik. Pengalaman ini menyebabkan buku Fisher Metode Statistik untuk Peneliti.
Contoh Terdakwa
Prosedur persidangan statistik sebanding dengan pengadilan pidana di mana terdakwa dianggap tidak bersalah sampai terbukti bersalah. Penuntut berusaha membuktikan kesalahan terdakwa. Hanya jika ada bukti yang cukup untuk suatu dakwaan, terdakwa dapat dinyatakan bersalah. Pada awal prosedur, ada dua hipotesis: "Terdakwa tidak bersalah" dan "Terdakwa bersalah." Hipotesis tidak bersalah hanya dapat ditolak ketika kesalahan sangat kecil kemungkinannya karena seseorang tidak ingin menghukum terdakwa yang tidak bersalah. Kesalahan seperti itu disebut kesalahan Tipe I, dan kemunculannyajarang dikendalikan. Akibat perilaku asimetris ini, kesalahan Tipe II, yakni pembebasan pelaku, lebih sering terjadi.
Statistik berguna saat menganalisis data dalam jumlah besar. Ini berlaku sama untuk pengujian hipotesis, yang dapat membenarkan kesimpulan bahkan jika tidak ada teori ilmiah. Dalam contoh mencicipi teh, "jelas" bahwa tidak ada perbedaan antara menuangkan susu ke dalam teh atau menuangkan teh ke dalam susu.
Aplikasi nyata dari pengujian hipotesis meliputi:
- menguji apakah pria memiliki lebih banyak mimpi buruk daripada wanita;
- atribusi dokumen;
- Menilai pengaruh bulan purnama terhadap perilaku;
- menentukan kisaran di mana kelelawar dapat mendeteksi serangga menggunakan gema;
- memilih cara terbaik untuk berhenti merokok;
- Memeriksa apakah stiker bemper mencerminkan perilaku pemilik mobil.
Pengujian hipotesis statistik memainkan peran penting dalam statistik secara umum dan dalam inferensi statistik. Pengujian nilai digunakan sebagai pengganti perbandingan tradisional antara nilai prediksi dan hasil eksperimen pada inti metode ilmiah. Ketika sebuah teori hanya mampu memprediksi tanda dari suatu hubungan, uji hipotesis terarah dapat dikonfigurasi sedemikian rupa sehingga hanya hasil yang signifikan secara statistik yang mendukung teori tersebut. Bentuk teori evaluasi ini adalah yang paling kakukritik terhadap penggunaan pengujian hipotesis.