Jaringan Bayesian: definisi, contoh, dan cara kerjanya

2025 Pengarang: Angel Austin | [email protected]. Terakhir diubah: 2025-01-23 12:25

Sebuah keyakinan, jaringan keputusan, model Bayesian (ian) atau model graf asiklik yang digerakkan secara probabilistik adalah skema varian (sejenis model statistik) yang mewakili sekumpulan variabel dan dependensi bersyaratnya melalui graf asiklik terarah (DAG).

Misalnya, jaringan Bayesian dapat mewakili hubungan probabilistik antara penyakit dan gejala. Mengingat yang terakhir, jaringan dapat digunakan untuk menghitung kemungkinan memiliki berbagai penyakit. Dalam video di bawah ini Anda dapat melihat contoh jaringan kepercayaan Bayesian dengan perhitungan.

Efisiensi

Algoritme yang efisien dapat melakukan inferensi dan pembelajaran pada jaringan Bayesian. Jaringan yang memodelkan variabel (seperti sinyal suara atau urutan protein) disebut jaringan dinamis. Generalisasi jaringan Bayesian yang dapat mewakili dan memecahkan masalah di bawah ketidakpastian disebut diagram pengaruh.

Esensi

FormalJaringan Bayesian adalah DAG yang simpulnya mewakili variabel dalam pengertian Bayesian: mereka dapat diamati nilai, variabel tersembunyi, parameter yang tidak diketahui, atau hipotesis. Karena sangat menarik.

Contoh jaringan Bayesian

Dua kejadian dapat menyebabkan rumput basah: penyiram aktif atau hujan. Hujan berpengaruh langsung terhadap penggunaan sprinkler (yaitu, saat hujan, sprinkler biasanya tidak aktif). Situasi ini dapat dimodelkan menggunakan jaringan Bayesian.

Simulasi

Karena jaringan Bayesian adalah model lengkap untuk variabel dan hubungannya, maka dapat digunakan untuk menjawab pertanyaan probabilistik tentang variabel tersebut. Misalnya, dapat digunakan untuk memperbarui pengetahuan tentang keadaan subset variabel ketika data lain (variabel bukti) diamati. Proses menarik ini disebut inferensi probabilistik.

A posteriori memberikan statistik yang cukup universal untuk aplikasi penemuan saat memilih nilai untuk subset variabel. Dengan demikian, algoritma ini dapat dianggap sebagai mekanisme untuk menerapkan teorema Bayes secara otomatis ke masalah yang kompleks. Pada gambar di artikel Anda dapat melihat contoh jaringan kepercayaan Bayesian.

Metode Keluaran

Metode inferensi eksak yang paling umum adalah: eliminasi variabel, yang menghilangkan (dengan integrasi atau penjumlahan) yang tak teramatiparameter non-query satu per satu dengan mengalokasikan jumlah ke produk.

Klik propagasi "pohon" yang menyimpan perhitungan sehingga banyak variabel dapat ditanyakan sekaligus dan bukti baru dapat disebarkan dengan cepat; dan pencocokan dan/atau pencarian rekursif, yang memungkinkan pertukaran antara ruang dan waktu dan mencocokkan efisiensi eliminasi variabel ketika ruang yang cukup digunakan.

Semua metode ini memiliki kompleksitas khusus yang bergantung secara eksponensial pada panjang jaringan. Algoritma inferensi perkiraan yang paling umum adalah eliminasi segmen mini, propagasi keyakinan siklis, propagasi keyakinan umum, dan metode variasi.

Jaringan

Untuk sepenuhnya menentukan jaringan Bayesian dan dengan demikian sepenuhnya mewakili distribusi probabilitas gabungan, perlu untuk menentukan untuk setiap node X distribusi probabilitas untuk X karena orang tua dari X.

Distribusi X secara kondisional oleh orang tuanya dapat memiliki bentuk apa pun. Adalah umum untuk bekerja dengan distribusi diskrit atau Gaussian karena menyederhanakan perhitungan. Terkadang hanya batasan distribusi yang diketahui. Anda kemudian dapat menggunakan entropi untuk menentukan distribusi tunggal yang memiliki entropi tertinggi dengan batasannya.

Demikian pula, dalam konteks spesifik jaringan Bayesian yang dinamis, distribusi bersyarat untuk evolusi temporal latenkeadaan biasanya diatur untuk memaksimalkan laju entropi dari proses acak tersirat.

Memaksimalkan probabilitas secara langsung (atau probabilitas posterior) seringkali rumit mengingat adanya variabel yang tidak teramati. Hal ini terutama berlaku untuk jaringan keputusan Bayesian.

Pendekatan klasik

Pendekatan klasik untuk masalah ini adalah algoritma maksimalisasi ekspektasi, yang bergantian menghitung nilai yang diharapkan dari variabel yang tidak teramati tergantung pada data yang diamati dengan memaksimalkan probabilitas total (atau nilai posterior), dengan asumsi bahwa yang diharapkan sebelumnya dihitung nilai-nilainya benar. Dalam kondisi keteraturan sedang, proses ini konvergen dalam nilai parameter maksimum (atau maksimum a posteriori).

Pendekatan Bayesian yang lebih lengkap untuk parameter adalah memperlakukannya sebagai variabel tambahan yang tidak teramati dan menghitung distribusi posterior penuh atas semua node yang diberikan data yang diamati, dan kemudian mengintegrasikan parameternya. Pendekatan ini bisa mahal dan menghasilkan model yang besar, membuat pendekatan penyetelan parameter klasik lebih mudah diakses.

Dalam kasus yang paling sederhana, jaringan Bayesian didefinisikan oleh seorang ahli dan kemudian digunakan untuk melakukan inferensi. Dalam aplikasi lain, tugas menentukan terlalu sulit bagi manusia. Dalam hal ini, struktur jaringan saraf Bayesian dan parameter distribusi lokal harus dipelajari di antara data.

Metode alternatif

Metode alternatif pembelajaran terstruktur menggunakan pencarian optimasi. Ini membutuhkan penerapan fungsi evaluasi dan strategi pencarian. Algoritma penilaian yang umum adalah probabilitas posterior dari suatu struktur yang diberikan data pelatihan seperti BIC atau BDeu.

Waktu yang diperlukan untuk pencarian lengkap yang mengembalikan struktur yang memaksimalkan skor adalah supereksponensial dalam jumlah variabel. Strategi pencarian lokal membuat perubahan tambahan untuk meningkatkan estimasi struktur. Friedman dan rekan-rekannya mempertimbangkan untuk menggunakan informasi timbal balik antar variabel untuk menemukan struktur yang diinginkan. Mereka membatasi set kandidat induk ke k node dan mencarinya secara menyeluruh.

Metode yang sangat cepat untuk mempelajari BN secara tepat adalah dengan membayangkan masalah sebagai masalah optimasi dan menyelesaikannya menggunakan pemrograman integer. Kendala asiklikitas ditambahkan ke program integer (IP) selama solusi dalam bentuk pemotongan pesawat. Metode tersebut dapat menangani masalah hingga 100 variabel.

Pemecahan Masalah

Untuk memecahkan masalah dengan ribuan variabel, diperlukan pendekatan yang berbeda. Pertama adalah memilih satu urutan dan kemudian menemukan struktur BN yang optimal sehubungan dengan urutan itu. Ini menyiratkan bekerja di ruang pencarian kemungkinan pemesanan, yang nyaman karena lebih kecil dari ruang struktur jaringan. Beberapa pesanan kemudian dipilih dan dievaluasi. Metode ini ternyataterbaik tersedia dalam literatur ketika jumlah variabel sangat banyak.

Metode lain adalah fokus pada subkelas dari model yang dapat didekomposisi yang MLE-nya ditutup. Kemudian Anda dapat menemukan struktur yang konsisten untuk ratusan variabel.

Mempelajari jaringan Bayesian dengan lebar terbatas tiga baris diperlukan untuk memberikan inferensi yang akurat dan dapat diinterpretasikan, karena kompleksitas kasus terburuk dari yang terakhir adalah eksponensial dalam panjang pohon k (menurut hipotesis waktu eksponensial). Namun, sebagai properti global dari grafik, itu sangat meningkatkan kompleksitas proses pembelajaran. Dalam konteks ini, K-tree dapat digunakan untuk pembelajaran yang efektif.

Pengembangan

Pengembangan Bayesian Web of Trust sering dimulai dengan pembuatan DAG G sedemikian rupa sehingga X memenuhi properti Markov lokal sehubungan dengan G. Terkadang ini adalah DAG kausal. Distribusi probabilitas bersyarat dari setiap variabel atas orang tuanya di G diperkirakan. Dalam banyak kasus, khususnya ketika variabel diskrit, jika distribusi bersama X adalah produk dari distribusi bersyarat ini, maka X menjadi jaringan Bayesian sehubungan dengan G.

"Knot blanket" Markov adalah satu set simpul. Selimut Markov membuat simpul independen dari sisa simpul kosong dengan nama yang sama dan pengetahuan yang cukup untuk menghitung distribusinya. X adalah jaringan Bayesian terhadap G jika setiap node independen bersyarat dari semua node lainnya, mengingat Markovian-nyaselimut.