🏞️ 🍊 🤱🏼 Cara membandingkan: "mobil luar biasa" dan "gubuk jelek", dalam survei pemasaran dan dalam data besar 👚 🤲 🤟🏻

Kita semua berpartisipasi dalam survei, online atau dalam kehidupan nyata. Dan ketika kami memulai proyek baru, kami tidak dapat melakukannya tanpa survei. Tetapi kadang-kadang ada hasil survei yang tidak jelas apa yang harus dilakukan kecuali tersenyum , pada gambar di bawah, hasil survei dari Pusat Penelitian Opini Publik Rusia (VTsIOM).

Saya ingin tahu bagaimana pertanyaan dengan penilaian kualitatif sedang digunakan sekarang dan menemukan bahwa VTsIOM, POF , Levada Center terutama menggunakan skala tri-band (buruk / normal / baik). Dalam kasus pertanyaan yang lebih terperinci, skalanya meningkat menjadi 5-6 unit , tetapi jarang.

Kemudian, hari ini, ada situasi di mana sosiolog menjauh dari skala multi-level penilaian kualitatif dan mencoba menggunakan tiga level. Dan jika sosiologi mampu keluar dari ini, maka ketika menganalisis jumlah data yang layak, kebutuhan untuk menggunakan estimasi kualitatif menjadi faktor yang menyulitkan dan mengurangi keandalan hasil. Karena, misalnya, secara praktis tidak mungkin untuk membedakan antara konsep: "apartemen yang indah" dan "perumahan yang sangat baik", dan dengan mempertimbangkan jawaban salah satu karakter dari "Dua Belas Kursi": "Kepada siapa pengantin dan kuda", multi-persimpangan kualitas melampaui batas wajar.

Ada mekanisme gradasi dan digunakan dengan baik oleh bank dalam menentukan pemalsuan dalam dokumen keuangan. Ini adalah hukum distribusi Benford , yang, pada tahun 1984, dibuktikan oleh Ted Hill .
Perhitungan teoritis dari alat yang diusulkan disajikan dalam materi ini: " Hukum Benford dan distribusi berada di bawahnya ."

Di Wikipedia, undang-undang ini dirumuskan sebagai berikut: jika kita memiliki basis sistem bilangan b (b> 2), maka untuk digit d (d ∈ {1, ..., b - 1}) probabilitas menjadi digit signifikan pertama adalah:

Berdasarkan hal tersebut di atas, kami memperoleh mekanisme gradasi untuk fitur kualitatif, sebagai berikut.

Pilih jumlah interval, katakanlah 5, yaitu, empat gradasi dan satu interval tengah. Jadi b = 6, kami mendapatkan probabilitas untuk interval:

Interval 1 - 0,386853;
Interval 2 - 0,226294;
Interval ke-3 - 0,160558;
Interval ke-4 - 0,124539;
Interval 5 - 0.101756.

Dari statistik frekuensi, kata-kata yang mengevaluasi tanda-tanda kualitatif, kami membuat seri dalam urutan naik dan meletakkan indeks. Kami melakukan konversi frekuensi ke probabilitas ucapan. Selanjutnya, kami mengakumulasikan probabilitas dari ekor, sampai kami mendapatkan nilai yang sama dengan baris ekstrim (ke-5), dalam kasus kami - 0,101756 dan kata-kata (definisi kualitatif), probabilitas yang termasuk dalam jumlah ini, kami terkait dengan kisaran ke-5. Selanjutnya, dengan penurunan indeks, kami melakukan penjumlahan lebih lanjut sampai kami mendekati nilai probabilitas rentang 4 dan, lebih jauh, sama dengan nilai interval pertama.

Sebagai hasilnya, kami mendapatkan himpunan bagian yang jelas dengan estimasi numerik nyata.

Saya tidak akan meyakinkan bahwa pemilihan sinonim itu mudah. Karena masing-masing untuk dirinya sendiri menentukan rasio hasil / usaha yang mudah.

Cara membandingkan: "mobil luar biasa" dan "gubuk jelek", dalam survei pemasaran dan dalam data besar

More articles: