Statistik matematika adalah metodologi yang memungkinkan Anda membuat keputusan yang tepat dalam menghadapi kondisi yang tidak pasti. Studi tentang metode untuk mengumpulkan dan mensistematisasikan data, memproses hasil akhir eksperimen dan eksperimen dengan keacakan massal, dan menemukan pola apa pun adalah apa yang dilakukan cabang matematika ini. Perhatikan konsep dasar statistik matematika.
Perbedaan dengan teori probabilitas
Metode statistik matematika bersinggungan erat dengan teori probabilitas. Kedua cabang matematika berurusan dengan studi berbagai fenomena acak. Kedua disiplin tersebut dihubungkan oleh teorema limit. Namun, ada perbedaan besar antara ilmu-ilmu ini. Jika teori probabilitas menentukan karakteristik suatu proses di dunia nyata berdasarkan model matematika, maka statistik matematika melakukan yang sebaliknya - ia menetapkan sifat-sifat model menjadiberdasarkan informasi yang diamati.
Langkah
Penerapan statistik matematika hanya dapat dilakukan dalam kaitannya dengan peristiwa atau proses acak, atau lebih tepatnya, data yang diperoleh dari mengamatinya. Dan ini terjadi dalam beberapa tahap. Pertama, data eksperimen dan eksperimen mengalami pengolahan tertentu. Mereka diperintahkan untuk kejelasan dan kemudahan analisis. Kemudian dibuat perkiraan yang tepat atau perkiraan dari parameter yang diperlukan dari proses acak yang diamati. Bisa berupa:
- penilaian probabilitas suatu kejadian (probabilitasnya awalnya tidak diketahui);
- mempelajari perilaku fungsi distribusi tak tentu;
- perkiraan ekspektasi;
- estimasi varians
- dll.
Tahap ketiga adalah verifikasi hipotesis apa pun yang ditetapkan sebelum analisis, yaitu memperoleh jawaban atas pertanyaan tentang bagaimana hasil eksperimen sesuai dengan perhitungan teoretis. Sebenarnya, ini adalah tahap utama statistik matematika. Contohnya adalah untuk mempertimbangkan apakah perilaku proses acak yang diamati berada dalam distribusi normal.
Populasi
Konsep dasar statistik matematika meliputi populasi umum dan sampel. Disiplin ini berkaitan dengan studi tentang satu set objek tertentu sehubungan dengan beberapa properti. Contohnya adalah pekerjaan seorang sopir taksi. Pertimbangkan variabel acak ini:
- muatan atau jumlah pelanggan: per hari, sebelum makan siang, setelah makan siang, …;
- waktu perjalanan rata-rata;
- jumlah aplikasi yang masuk atau lampirannya ke distrik kota dan banyak lagi.
Perlu dicatat juga bahwa adalah mungkin untuk mempelajari sekumpulan proses acak yang serupa, yang juga akan menjadi variabel acak yang dapat diamati.
Jadi, dalam metode statistik matematika, seluruh himpunan objek yang diteliti atau hasil berbagai pengamatan yang dilakukan dalam kondisi yang sama pada objek tertentu disebut populasi umum. Dengan kata lain, secara matematis lebih ketat, ini adalah variabel acak yang didefinisikan dalam ruang peristiwa dasar, dengan kelas himpunan bagian yang ditunjuk di dalamnya, elemen-elemennya memiliki probabilitas yang diketahui.
Populasi sampel
Ada kasus di mana tidak mungkin atau tidak praktis karena alasan tertentu (biaya, waktu) untuk melakukan studi berkelanjutan untuk mempelajari setiap objek. Misalnya, membuka setiap stoples selai yang disegel untuk memeriksa kualitasnya adalah keputusan yang meragukan, dan mencoba memperkirakan lintasan setiap molekul udara dalam satu meter kubik adalah mustahil. Dalam kasus seperti itu, metode pengamatan selektif digunakan: sejumlah objek tertentu dipilih (biasanya secara acak) dari populasi umum, dan objek tersebut dijadikan sasaran analisis.
Konsep ini mungkin tampak rumit pada awalnya. Oleh karena itu, untuk memahami topik sepenuhnya, Anda perlu mempelajari buku teks karya V. E. Gmurman "Teori Probabilitas dan Statistik Matematika". Jadi, himpunan sampel atau sampel adalah serangkaian objek yang dipilih secara acak dari himpunan umum. Dalam istilah matematika yang ketat, ini adalah urutan variabel acak independen, terdistribusi seragam, untuk masing-masing distribusi bertepatan dengan yang ditunjukkan untuk variabel acak umum.
Konsep dasar
Mari kita pertimbangkan secara singkat sejumlah konsep dasar statistik matematika lainnya. Banyaknya benda dalam populasi umum atau sampel disebut volume. Nilai sampel yang diperoleh selama percobaan disebut realisasi sampel. Agar perkiraan populasi umum berdasarkan sampel dapat diandalkan, penting untuk memiliki apa yang disebut sampel representatif atau representatif. Artinya sampel harus sepenuhnya mewakili populasi. Ini hanya dapat dicapai jika semua elemen populasi memiliki peluang yang sama untuk menjadi sampel.
Sampel membedakan antara kembali dan tidak kembali. Dalam kasus pertama, dalam isi sampel, elemen berulang dikembalikan ke himpunan umum, dalam kasus kedua tidak. Biasanya dalam prakteknya digunakan sampling tanpa penggantian. Perlu juga dicatat bahwa ukuran populasi umum selalu secara signifikan melebihi ukuran sampel. Adabanyak pilihan untuk proses sampling:
- simple - item dipilih secara acak satu per satu;
- typed - populasi umum dibagi menjadi beberapa tipe, dan pilihan dibuat dari masing-masing tipe; contohnya adalah survei penduduk: laki-laki dan perempuan secara terpisah;
- mechanical - misalnya, pilih setiap elemen ke-10;
- serial - pemilihan dibuat dalam rangkaian elemen.
Distribusi statistik
Menurut Gmurman, teori probabilitas dan statistik matematika adalah disiplin ilmu yang sangat penting dalam dunia ilmiah, terutama dalam bagian praktisnya. Pertimbangkan distribusi statistik sampel.
Misalkan kita memiliki sekelompok siswa yang diuji dalam matematika. Akibatnya, kami memiliki serangkaian perkiraan: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - ini adalah bahan statistik utama kami.
Pertama-tama, kita perlu mengurutkannya, atau melakukan operasi peringkat: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - dan dengan demikian mendapatkan deret variasi. Jumlah pengulangan dari setiap penilaian disebut frekuensi penilaian, dan rasionya terhadap ukuran sampel disebut frekuensi relatif. Mari kita buat tabel distribusi statistik sampel, atau hanya deret statistik:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
atau
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Mari kita memiliki variabel acak di mana kita akan melakukan serangkaian eksperimen dan melihat berapa nilai variabel ini. Misalkan dia mengambil nilai a1 - m1 kali; a2 - m2 kali, dll. Ukuran sampel ini adalah m1 + … + mk=m. Himpunan ai, di mana i bervariasi dari 1 hingga k, adalah deret statistik.
Distribusi interval
Dalam buku VE Gmurman "Teori Probabilitas dan Statistik Matematika" juga disajikan seri statistik interval. Penyusunannya dimungkinkan ketika nilai fitur yang diteliti terus menerus dalam interval tertentu, dan jumlah nilainya besar. Pertimbangkan sekelompok siswa, atau lebih tepatnya, tinggi mereka: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 siswa secara total. Jelas, tinggi badan seseorang adalah nilai yang berkelanjutan. Kita perlu mendefinisikan langkah interval. Untuk ini, rumus Sturges digunakan.
h= | maks - min | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2m | 1+log230 | 5, 9 |
Dengan demikian, nilai 6 dapat diambil sebagai ukuran interval, juga harus dikatakan bahwa nilai 1+log2m adalah rumus untukmenentukan jumlah interval (tentu saja, dengan pembulatan). Jadi, menurut rumus, diperoleh 6 interval, yang masing-masing memiliki ukuran 6. Dan nilai pertama dari interval awal adalah angka yang ditentukan oleh rumus: min - h / 2=156 - 6/2=153. Mari kita buat tabel yang berisi interval dan jumlah siswa yang pertumbuhannya turun dalam interval tertentu.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
Tentu saja, ini belum semuanya, karena ada lebih banyak rumus dalam statistik matematika. Kami hanya mempertimbangkan beberapa konsep dasar.
Jadwal Distribusi
Konsep dasar statistik matematika juga mencakup representasi grafis dari distribusi, yang dibedakan dengan kejelasan. Ada dua jenis grafik: poligon dan histogram. Yang pertama digunakan untuk deret statistik diskrit. Dan untuk distribusi kontinu, masing-masing, yang kedua.