Yandex如何准确预测冬天的降水量? 我们分析预测服务的准确性

11月,我发表了一篇文章“ Yandex.Meteum-没有技术的技术。 准确地向该地区营销” ,这将Yandex预测的质量与其他服务相关联。 重点是温度,没有分析其他参数。 结论是:与已经证明的预测服务相比,Yandex温度预测没有显示任何出色的结果。 我建议您阅读全文。 这次是时候检查另一个关键参数-降水量了。

图片

验证条件和控制预测


该研究的主要目的是与其他预报服务相比,了解Yandex降水预报的质量。 我提请您注意以下事实:重点是预测现象,而不是降水阶段或其数量。

作为控件的预测,我们使用了intellicast.com网站上的数据,该网站在一月份与wundeground服务合并 ,但这并没有影响预测,只改变了界面。 第二个控制预报是来自俄罗斯水文气象中心方法办公室网站的综合预报 。 我在以前的出版物中谈到了这一预测。

该预测被手动拦截。 评估期为气象日,即从上午8-9时至20-21。 我没有考虑到夜间降水。 预测估计为2018年11月3日至2019年3月31日,即俄罗斯欧洲部分地区和乌拉尔部分地区冬季气候下降的时期,并且没有对流影响。

Yandex预测也仅在白天捕获。 同时,我尝试将网站的预测与Alice在推送通知中发送的预测相关联。 后来发现,预测之间并不一致,但是我们将进一步讨论。

选择城市是为了让我能够占领乌拉尔南部的一部分和俄罗斯欧洲领土的主要部分。 我画了一条从库尔干(Kurgan)到莫斯科(Moscow)的路线,并以大约相等的间隔选择了该站点上的城市。 这些是库尔干,乌法,喀山和莫斯科。 两点之间的平均距离是591 km。

Roshydromet用来评估长达72小时的天气预报的《近距离常规天气预报手册》被用作评估技术。 正如我所说,对我而言,评估降水的事实而不是其数量或阶段很重要。 因此,我在表中输入了两个参数:干燥(无沉淀)或沉淀。

如果站点在一天中的任何时候都预报有降水,则预报显示为“降水”等级,如果预报中没有降水,则为“干燥”。

Roshydromet站的官方等级用作事实信息。 如果在一个气象站上的降水量计在12小时内至少记录了0.1毫米,则状态为“降水”输入表中。 此外,预后和实际的等级是相关的。 我给出了研究中使用的气象站数量:28661(库尔干),28722(乌法),27595(喀山),27612(莫斯科,VDNH)。

例如,Yandex预测白天会出现小雪,而气象站不会进行记录,则将天气预报设置为0%。 如果有任何降水,那么100%。 因此,所有预测都置于平等的评估条件下。

为了透明起见,我发布了包含所有数据的源表链接 。 我不仅尝试评估预测,还尝试将它们与提前期为零的概要图相关联,这使我能够确定Yandex给出最低正则结果的概要情况。

研究成果


最初,我假设Yandex将在其他站点上显示类似结果,或者它们将略低于竞争对手。 我不得不在11月底告别了这个假设,当时事实证明Yandex的准确性与扔硬币相当。 结果处于随机预测的水平,范围从50%到60%。
对于5个月,Yandex在24小时内的沉淀准确度为58%。 Intellicast / Wunderground占81%,水文气象中心的综合预测占80%!

图片

Yandex设法发现了一个有趣的功能-距离莫斯科越远,准确性越低。 在库尔干,平均准确度为45.6%,在莫斯科为67.8%。 竞争对手的预测范围从75%到85%,在冬季看来非常不错。

图片

Yandex在冬季的主要问题是虚假降雨。 Yandex会预测会出现降水,而其他服务会预计会出现干旱,这是典型的情况。 最可悲的是,Yandex甚至可以预测在反气旋广泛的地区的降水。 例如,11月12日,Yandex预测喀山全天会有降雨,但不应有任何降雨,因为反气旋中心经过该地区,天气晴朗,没有物理降雨。

图片

12月20日在库尔干也发生了类似的情况。 再次,在城市上空建立了一个反气旋,但Yandex持续发出降水。 有很多这样的奇怪情况,我只是举了最生动的例子。

图片

事实证明,另一个问题是Alice及其通过主Yandex应用程序发送的推送通知。 例如,在1月3日,该网站写道,1月4日将不会下雨,而爱丽丝则寄给我说:“雪很美。 明天要下小雪。” 在过去的五个月中,只有极少数这样的案例,但是服务之间的分歧导致了不同的想法。

图片

当然,大多数时候爱丽丝都报告与该地点相同的预报,但没有降雨。 Meteum的错误被转换为所有其他服务的工作,需要做一些事情。

气候资料


我们计算了24小时的降水量预测,但我想概述Yandex中存在的另一个重要问题。 天气。”
在上一篇文章中,我已经写过Yandex发布了所有城市的平均月降雨量。 问题是数据源。 该站点指出了NOAA的来源,我可以假设Yandex仅使用美国计算机再分析CFSR的数据。 再分析适用于温度研究,但对降水的研究极度困难。 该计算机模型不能很好地再现实际的降水,特别是强度低的降水。 气象站的降水量计记录实际的降水量,然后计算机(重新分析)计算出实际的降水量。 因此,可能会发生错误。

在夏季,当启动对流过程时,这种差异尤为明显,并且这些模型对他们来说是非常可怜的朋友。 与通过雷暴单元(雷云)之后的降水相比,额叶降水更容易计算。 在山区或海洋气候中,误差会增加。 因此,在研究气候时,建议仅依赖最近的气象站的数据 。 仅当我们根本没有模拟数据时,才应诉诸计算机重新分析。

图片

例如,Yandex Ufa每年的降水量为803毫米,尽管实际上年降水量为586毫米。 Yandex超大型降水量达37%。 相反,在符拉迪沃斯托克(Vladivostok),Yandex低估了40%的降水。 根据Yandex的说法,乌法的降水量比符拉迪沃斯托克要多,这绝对是愚蠢的。 我就此问题写信给Yandex,但我的呼吁被忽略了。 尽管按站下载现成的阵列并进行处理,但是对于Yandex来说,这并不是一个大问题。

结论


Yandex对24小时的降水量的预测要比其他预报服务的质量差。 对于5个月,Yandex在24小时内的沉淀准确度为58%。 Intellicast / Wunderground占81%,水文气象中心的综合预测占80%! Yandex设法发现了一个有趣的功能-距离莫斯科越远,准确性越低。 在库尔干,平均准确度为45.6%,在莫斯科为67.8%。 预报参数彼此不一致:在晴朗的反气旋天气中会预报降水。
我强烈不建议将Yandex信息用作预测的基本或唯一来源。

图片

主图:insidecorp.ru
GFS概要卡-meteoweb.ru/alter/prec.php

Source: https://habr.com/ru/post/zh-CN447456/


All Articles