Tepat 3 tahun telah berlalu sejak peluncuran layanan Yandex.Meteum, yang, menurut pengembang, memberikan perkiraan kualitas tertinggi di antara semua situs perkiraan. Saatnya mengambil persediaan. Apakah produk Yandex yang baru benar-benar revolusioner atau hanya zilch pemasaran? Dan sebagai tim ilmuwan dari Pusat Hydrometeorological Rusia berhasil menyiasati Yandex dan membuat ramalan yang benar-benar berkualitas tinggi.

Pertama, perkenalkan diri saya. Nama saya Ilya Vinstein, saya seorang peramal cuaca amatir dari Kurgan. Saya telah melakukan meteorologi selama 14 tahun. Saya mengelola proyek regional saya
"Cuaca 45" , memberikan beberapa kuliah untuk proyek pendidikan-ilmiah "Ruang Merokok Gutenberg".
Meteum. MulaiMasalah kualitas perkiraan Yandex. Meteum ”Saya ditunjuk pada
awal 2016 , tetapi pada saat itu saya memiliki sejumlah kecil data untuk menarik kesimpulan yang tidak ambigu. Sebagian besar saya mengkritik kampanye informasi yang diluncurkan Yandex. Jika pada awalnya mereka menggunakan slogan "Prakiraan akurat untuk rumah," maka mereka mengubahnya menjadi "Prakiraan akurat ke kabupaten".
Dalam bentuk media apa kelahiran Meteum? Ada banyak publikasi di media, beberapa publikasi tentang Habré, kemudian ada video ilmiah pendek yang menjelaskan penciptaan layanan peramalan pertama berdasarkan jaringan saraf. Penciptaan Meteum terjadi pada saat jaringan saraf sangat populer, dan media menghadirkannya sebagai obat mujarab yang dapat memecahkan banyak masalah umat manusia.
Segera setelah geotagging umum, Yandex memutuskan untuk memperbarui bagian meteorologis utamanya. Pembaruan desain yang biasa dan penambahan fitur baru bukanlah suatu pilihan, tetapi tujuan utama pembaruan adalah untuk menarik audiens baru dari pesaing. Satu-satunya cara adalah mengubah paradigma persepsi layanan. Bukan hanya bagian cuaca, tetapi layanan yang sama sekali baru yang mampu memprediksi cuaca dengan lebih baik daripada semua pesaing lainnya. Bukan hanya Yandex. Cuaca ”, dan“ Yandex. Meteum ”- sistem yang mampu menghasilkan perkiraan yang akurat untuk rumah atau area.
Masalahnya adalah bahwa produk akhir itu kompleks dalam hal mengevaluasi dan menerima umpan balik. Siapa yang akan memeriksa kualitas perkiraan? Bagaimana umpan balik akan dievaluasi dari pengguna? Dalam kasus kami, konsumen tidak dapat mengevaluasi kualitas produk akhir, oleh karena itu, ia dapat "berkeringat", apa pun dapat dilakukan. Pengguna semua situs prognostik mematuk trik ini.
Oleh karena itu, seluruh kampanye informasi untuk meluncurkan Meteum terlihat seperti lelucon anti-ilmiah. Selama 3 tahun, Yandex belum memberi kami angka objektif. Kami belum melihat satu laporan pun tentang pembenaran.
Semua angka turun ke ini:
“Menurut perkiraan kami sendiri (sayangnya, belum ada meter independen di daerah ini), hari ini perkiraan cuaca kami lebih akurat daripada semua pesaing yang kami kenal. Misalnya, perkiraan suhu 24 jam kami 35% lebih rendah dari pesaing terdekat kami. "
Ini adalah kebohongan mutlak. Saya akan menjelaskan alasannya. Jika tahun 1960, maka pernyataan ini benar-benar adil, tetapi sekarang ramalan jangka pendek telah mencapai batas tertentu. Perjuangan itu untuk kepentingan dan bahkan sepersepuluh persen. Misalnya,
menurut Pusat Hidrometeorologi Rusia, keakuratan perkiraan suhu udara di Rusia pada 2017 per hari adalah sebesar 93%. Kita berbicara tentang ramalan yang dikeluarkan oleh peramal cuaca dari pusat hidrometeorologi lokal. Untuk situs prediktif dan model komputer, akurasi berkisar dari 85% hingga 95%. Tidak ada 35% di sini dan tidak mungkin!
Bagaimana ini terjadi di dunia sains?Katakanlah Yandex mampu menciptakan produk revolusioner yang benar-benar mengungguli semua pesaing. Perkenalkan dunia pada teknologi ini. Biarkan tim Yandex menunjukkan kepada seluruh dunia apa yang berhasil mereka ciptakan. Mengapa tidak memulai dengan artikel di jurnal sains? Saya mengerti bahwa mungkin tidak layak mengungkapkan semua kartu, karena produk, pada kenyataannya, memiliki komponen komersial, tidak ada yang salah dengan itu, tetapi hanya jika produk ini benar-benar berfungsi.
Setiap teknik peramalan ilmiah melewati tahap pengujian. Biasanya, kelinci percobaan adalah data arsip. Dalam beberapa kasus, perlu untuk mengumpulkan data selama setahun atau beberapa tahun, dan baru kemudian menerbitkan sebuah artikel. Setelah itu, ramalan tersebut dibandingkan dengan laporan stasiun cuaca yang sebenarnya. Bidang prediksi sesuai dengan bidang aktual. Massa parameter dihitung: kesalahan suhu rata-rata aritmatika, kesalahan suhu absolut rata-rata, kesalahan relatif dan justifikasi dalam persen. Kemudian, berdasarkan hasil tes operasional, komisi metodologis khusus membuat keputusan - merekomendasikan penggunaan metode ramalan ini atau menolak.
Dan sekarang pertanyaan untuk pengembang Yandex. Di mana data ini? Di mana artikel dan studi ini? "Kami memiliki perkiraan yang paling akurat, percayalah," kata mereka di Yandex. Tidak ada yang ditampilkan. Tidak ada yang perlu dibanggakan.
Kami memiliki angka, tetapi kami tidak akan menunjukkannya kepada Anda. Anda tidak punya dokumen.Perkiraan ansambel dan multimodelBaru-baru ini, di antara ansambel peramal cuaca, multimodel dan prakiraan kompleks telah mendapatkan popularitas besar. Apa artinya ini? Pertama, sedikit teori. Sumber utama dari semua perkiraan adalah model komputer. Program yang mensimulasikan seluruh atmosfer bumi dari tanah hingga lapisan atas stratosfer. Makanan utama untuk model adalah
data satelit di semua rentang spektral yang terlihat dan tidak terlihat. Data dari stasiun bumi tidak lagi memiliki pengaruh yang kuat pada kualitas perkiraan. Jika lapisan stasiun cuaca dikecualikan dari model, maka kualitasnya akan turun 7%, dan jika data satelit dikeluarkan, maka sebesar 35-40%. Di dunia ada 11 model global dan selusin lagi regional.
Model komputer sangat, sangat kompleks! Tidak setiap negara mampu membuat model kualitatif sendiri. Sebagai contoh, model PLAV domestik menempati posisi ke 8 dalam peringkat model dunia. Itu ada, tetapi secara praktis tidak pernah digunakan.
Karena alasan ini, sebagian besar situs dan aplikasi hanya menggunakan 2-3 model. Yang lainnya adalah masalah pemrosesan dan interpretasi data internal. Sebagai contoh, sekarang model terbaik adalah Model Peramalan Cuaca Jangka Menengah Eropa (ECMWF). Model ini menggunakan Foreca, intellicast dan Gismeteo. TAPI! Seperti yang saya katakan, pemrosesan perkiraan datang ke pola internal yang "memoles" file model mentah. Gismeteo melakukan yang terburuk, dan Intelicast melakukannya dengan lebih baik. Berikutnya adalah angka yang mengkonfirmasi hal ini.
Oke, bereskan. Satu menjalankan model komputer adalah ramalan murni deterministik berdasarkan prinsip "sebagaimana adanya". Masalah utama perkiraan deterministik adalah kesalahan pada data awal, yang mengarah pada efek kupu-kupu. Gangguan awal terkecil menyebabkan kesalahan besar dalam jangka menengah. Untuk mengatasi masalah ini, para ilmuwan mengembangkan
ramalan ensemble . Bayangkan ramalan deterministik normal. Kesalahan artifisial dimasukkan ke dalam prediksi ini menggunakan generator angka pseudo-acak.
Perkiraan ensemble. GFS model Amerika. 20 anggota.Dan itu dilakukan 20 atau 50 kali lagi. Kemudian grafik dibuat di mana Anda dapat melihat seberapa sensitif perkiraan terhadap kesalahan dalam data awal. Jika ramalan deterministik memberikan pemanasan setelah 10 hari, dan 20 anggota ansambel turun, yaitu, mereka memberikan pendinginan, maka ramalan deterministik untuk periode ini keliru.
Tetapi para ilmuwan bahkan melangkah lebih jauh. Mereka mulai menyinkronkan ramalan deterministik dan membuat
ramalan multimodel , ketika ramalan dibangun bukan atas dasar satu model, tetapi segera belasan.
Perkiraan multi-model untuk Moskow di situs web meteoblue. 11 modelMisalnya, 7 model menghasilkan curah hujan setelah 5 hari, dan 3 memprediksi cuaca kering. Oleh karena itu, probabilitas presipitasi adalah 70%. Bersama-sama, disarankan untuk menonton juga ramalan ensemble.
Dan sekarang kita sampai pada esensi. Bagaimana Pusat Hydrometeorological berkeliling Yandex?
Prakiraan LengkapPada tahun 2014, kepala departemen prakiraan jangka pendek hidrodinamik dari Pusat Hidrometeorologi Rusia dan ahli meteorologi terhormat Alexei Bagrov, bersama dengan timnya, mengembangkan
skema statistik baru yang sederhana namun secara fundamental
untuk memproses data perkiraan mentah . Itu diterbitkan dalam jurnal Meteorologi dan Hidrologi dalam sebuah artikel berjudul "Prakiraan Komprehensif Nilai Meteorologi Permukaan".
Inti dari teknik ini sederhana, tetapi inilah keunggulannya. Perkiraan yang komprehensif diperoleh dengan pemrosesan statistik dari hasil model yang disertakan. Pada saat yang sama, untuk suhu udara, angin dan titik embun, arsip perkiraan untuk 20 hari sebelumnya untuk model yang sesuai dan data aktual di stasiun digunakan, dan untuk curah hujan arsip serupa untuk satu tahun. Perhitungan dilakukan secara terpisah untuk setiap stasiun dan untuk setiap perkiraan waktu tunggu.
Untuk membuatnya lebih sederhana, Bagrov mengusulkan untuk melakukan penyesuaian statistik dari perkiraan model terbaik berdasarkan data aktual stasiun cuaca lokal.
Teknik ini dijelaskan secara rinci dalam artikel itu sendiri . Di sini saya akan fokus pada beberapa poin penting. Perhitungan suhu maksimum dan minimum dilakukan dengan memperhitungkan kesalahan selama 5 atau 3 hari terakhir. Misalnya, selama 5 hari terakhir, model kami telah meremehkan suhu rata-rata 2 derajat, jadi kami harus memasukkan kesalahan ini dalam perkiraan terakhir dan menstabilkan perkiraan ke nilai yang paling memungkinkan. Dengan demikian, ramalan secara otomatis mengoreksi dirinya sendiri, berdasarkan penyimpangan sebelumnya ke arah pernyataan yang berlebihan atau meremehkan.
Selama 4 tahun, perkiraan tersebut berada dalam fase pengujian. Pada bulan September 2018, hasil tes diterbitkan dalam jurnal
Russian Meteorology and Hydrology . Secara singkat, hasil penelitian
diumumkan di sini . Saya perhatikan bahwa semua 4 tahun ramalan ini dipublikasikan di situs web kantor metodologis Pusat Hydrometeorological Rusia. Itu dihitung untuk 224 kota di Rusia. Setiap bulan laporan pembenaran diterbitkan. Mereka terus pergi ke hari ini.
Sederhana dan tenang - menciptakan perkiraan yang lebih baikPusat Hidrometeorologi Rusia melakukan apa yang tidak bisa dilakukan orang lain. Mereka secara otomatis mengumpulkan perkiraan 7 situs perkiraan berbeda dan menganalisis keakuratannya. Berikut adalah data selama 1,5 tahun - mulai Januari 2016 hingga Juni 2017 untuk Moskow, St. Petersburg, dan Yakutsk.
Kesalahan absolut rata-rata dari prakiraan suhu minimum (a) dan maksimum (b) menurut kota: Moscow, St. Petersburg, Yakutsk untuk periode 1 Januari 2016 - 30 Juni 2017. Prakiraan situs web: 1 - Meteoinfo.ru; 2 - Gismeteo.ru; 3 - Fobos (meteovesti.ru); 4 - Rp5.ru; 5 - Yandex.ru; 6 - Intellicast.com; 7 - Prakiraan komprehensif Bagrov.Kami sampai pada esensi. Dari data itu dapat dilihat bahwa pada hari pertama suhu siang hari, Yandex berkeliling di sekitar 3 sumber sekaligus: meteoinfo, intellicast dan perkiraan komprehensif Bagrov. Yang terakhir menunjukkan kesalahan terendah selama 1-2 hari. Intellicast dan perkiraan komprehensif mengarah selama 3-4 hari. Yandex hanya di 3 posisi.
Harap dicatat bahwa Gismeteo paling populer di Runet tidak begitu akurat. Pada hari pertama, kesalahan rata-rata 2 derajat banyak. Anti-pemimpin peringkat adalah situs meteovesti.ru
Jangan berpikir bahwa tidak ada lagi data segar. Pada awal 2018, bagian
"Evaluasi perkiraan di berbagai situs Internet" muncul di situs web kantor metodologis Pusat Hydrometeorological Rusia. Bagian ini menerbitkan data di 47 kota, baik secara individu maupun bersama-sama.
Banyak yang mungkin mengatakan bahwa ini adalah data yang sudah ketinggalan zaman, tetapi sudah ada laporan pertanggungjawaban Oktober yang baru. Kami akan mempelajarinya. Ambil sampel 27 kota untuk ETR.

Prakiraan suhu harian untuk Yandex selama satu hari dapat dibandingkan dalam akurasi intellicast dan perkiraan komprehensif. Untuk 2-5 hari ke depan, Intellicast sedikit melewati Yandex. Dengan perkiraan suhu malam, Meteum sedikit lebih buruk. Pada hari pertama, 3 situs memotongnya: meteoinfo, intellicast dan perkiraan yang komprehensif. Pada hari berikutnya, tren berlanjut. Pada hari ke 6, Yandex menyalip intellicast dan meteoinfo.
Untuk wilayah Asia, distribusinya kira-kira sama. Dalam hampir semua kasus, Yandex mem-bypass tiga meteoinfo, intellicast dan complex. Banyak yang telah memperhatikan bahwa situs web resmi meteoinfo memberikan akurasi berjasa. Ya itu. Sekarang situs web menggunakan skema pemrosesan data model statistik independen yang disebut
REP (perhitungan elemen cuaca) . Skema ini tidak buruk, tetapi agak lebih buruk dari perkiraan yang komprehensif. Di musim dingin, dia buruk memprediksi pendinginan malam. Saya menarik perhatian Anda pada kenyataan bahwa semua skema pemrosesan data ini ditemukan jauh sebelum penciptaan Yandex. Meteum.
Masalah output dan tampilanTidaklah cukup untuk membuat ramalan berkualitas tinggi, masih perlu belajar bagaimana menampilkannya secara memadai untuk orang awam. Ketika pengguna mengunjungi situs cuaca, pertama kali ia melihat ramalan selama 10 hari, mendapatkan gambaran umum tentang perubahan suhu. Tetapi jika Anda menggali lebih dalam, melihat suhu, maka banyak nuansa akan terbuka. Misalnya, situs mengatakan bahwa suhu akan +15 derajat pada siang hari, tetapi kemudian Anda membuka bagan suhu dan memahami bahwa +15 ini akan terjadi pada malam hari, dan pada siang hari suhu akan lebih rendah! Situasi ini disebut pembalikan suhu, ketika lebih hangat di malam hari daripada siang hari. Masalah menurunkan suhu maksimum dan minimum di sini adalah bahwa nilai min dan maks ditangkap dari seluruh rangkaian waktu, tanpa membagi siang dan malam. Dari sudut pandang orang awam, ini adalah tipuan. Semua situs berdosa. Suhu maksimum biasanya ditetapkan dari 08 hingga 20 jam, tergantung pada musim, kondisi cuaca, dan koordinat stasiun cuaca. Minimum diamati dari 20 hingga 08 jam, sekali lagi, tergantung pada musim dan kondisi cuaca. Ini disebut hari meteorologi. Misalnya, stasiun cuaca utama di
Moskow di VDNKh mengirimkan suhu maksimum 21 jam, dan minimum 9 jam.
Di bawah ini saya telah mengutip situasi perilaku suhu atipikal ketika penting untuk menangkap suhu maksimum dan minimum tidak dari seluruh rangkaian waktu, tetapi pada interval yang ditetapkan secara ketat. Jika kondisi tidak terpenuhi, maka pengguna akan tertipu, meskipun perkiraan kualitatif.

Masalah lain adalah bahwa beberapa tahun yang lalu Yandex mulai memberikan data iklim untuk perkiraan jangka panjang, yang tidak sepenuhnya benar. Yandex memutuskan untuk menggunakan file reanalysis komputer CFSR mentah (NCEP) selama 7 tahun terakhir, menciptakan sampel iklim kecil. Sekarang mereka telah beralih ke periode rata-rata 10 tahun, yang tidak mengubah situasi. Juga di situs muncul parameter "Probabilitas presipitasi", yang juga dihitung selama 10 tahun terakhir berdasarkan analisis ulang komputer, tetapi ada masalah serius. Analisis ulang komputer sangat buruk mensimulasikan curah hujan konvektif dan salju ringan di musim dingin, sehingga Yandex dapat memberikan probabilitas 0%, dan menurut stasiun cuaca 50%, hanya karena stasiun cuaca memiliki meteran curah hujan yang mencatat curah hujan nyata, bukan virtual . Oleh karena itu, lebih tepat untuk rata-rata data melalui stasiun cuaca, daripada melalui analisis ulang komputer. Saya menulis ke Yandex dan menerima jawabannya: “Kami menambahkannya (catatan saran) ke daftar penawaran pengguna kami. Para ahli kami selalu berkenalan dengan ide-ide ini ketika mereka mempersiapkan perubahan apa pun pada layanan, dan mencoba, jika memungkinkan, untuk memperhitungkannya. " Setelah 6 bulan, tidak ada yang berubah.
Tetap hidupSaya juga menyarankan agar Yandex menggunakan prakiraan model iklim jangka panjang CFSv2 alih-alih data rata-rata selama 10 tahun. Ini diperbarui 4 kali sehari dan mempertimbangkan perkiraan selama 9 bulan sebelumnya. Tentu saja, kita berbicara tentang memperoleh dekade rata-rata atau data rata-rata bulanan. Tapi ini ramalan nyata, bukan informasi sejarah. Sebagai contoh, sekarang model mengkhianati bahwa
November di bagian Eropa Rusia akan menjadi hangat dan kering .
Itu sangat lucu untuk menonton Yandex secara epik meluncurkan peta perkiraan, meskipun pada saat itu earth.nullschool.net, windytv.com dan ventusky.com sudah ada. Layanan ini memberikan informasi berkali-kali tentang berbagai model. Yandex menulis bahwa perbedaan utama dari mereka adalah bahwa mereka memiliki akurasi yang lebih tinggi. Baik, baik.
Masalah pendinginan malamSekarang dalam meteorologi sinoptik, masalah prediksi suhu malam hari di bawah kondisi pendinginan udara antiklon masih merupakan masalah akut. Apa masalahnya? , . , -30 : , , . . -35...-37 ! , , - . , . 2 , . – GEM. – NAEFS. , , , . , .
, «» - . , intellicast, meteoinfo , . Gismeteo meteovesti.ru
, . – , . – . , , , , , , , , .