Macroeconomic nowcasting (st)ability: Evidence from vintages of time-series data
Nowcasting to zadanie analizy szeregów czasowych, którego celem jest prognozowanie bieżącego stanu obserwowanego zjawiska. Jest ono kluczowe w przypadku złożonych systemów, w których uzyskanie natychmiastowych pomiarów jest trudne lub niemożliwe. Wiodącą dziedziną opierającą się na algorytmach nowcastingu to makroekonomia. W przypadku danych makroekonomicznych elementem szczególnie odróżniającym nowcasting od innych zastosowań prognostycznych jest struktura zbioru informacji, znana jako data vintage. Odnosi się ona do sposobu publikacji danych - początkowo udostępnianych jako wartości wstępne, a następnie stopniowo korygowanych. Rewizje te zwiększają trudność analizy, ponieważ mogą powodować zmiany w dynamice i interakcjach między zmiennymi. W pracy analizujemy zjawisko substitution bias, które występuje, gdy specyfikacje modeli oparte na różnych vintages tego samego szeregu czasowego różnią się, prowadząc do odmiennych wyników prognoz. Wykazujemy empirycznie, że prognozowanie w trybie pseudo-real-time nie jest substytutem prognozowania w rzeczywistym czasie. W przeciwieństwie do innych badań wykorzystujących obserwacje z aktualnych vintages jako zamiennik danych real-time, nasze wyniki wskazują, że to nie dane pseudo-real-time, lecz dane wstępne mogą stanowić dobrą alternatywę, gdy bieżące wydania danych nie są dostępne lub są trudne do pozyskania. Wnioskujemy, że wybór metody predykcji powinien zależeć od tego, czy celem jest prognoza wczesnego, czy późniejszego wydania danych. W tym kontekście dopasowanie statusu rewizji zestawów treningowych i ewaluacyjnych prowadzi do istotnego wzrostu dokładności i redukcji błędów prognozy. Metody real-time są zasadniczo preferowane, gdy prognozowane mają być wartości wstępne. Ma to duże znaczenie w praktyce, ponieważ terminowość jest dla uczestników rynku ważniejsza niż całkowita eliminacja obciążenia. Z kolei metody pseudo-real-time są bardziej odpowiednie do prognozowania danych po późniejszych rewizjach, charakteryzujących się mniejszym błędem systematycznym; sprawdzają się lepiej tam, gdzie ograniczanie szumu jest ważniejsze niż utrzymywanie przepływu danych w czasie rzeczywistym. Obszerne studium przypadku z zakresu danych makroekonomicznych potwierdza tę tezę. Przyjmując, że wczesne publikacje reprezentują rzeczywiste wartości zmiennej objaśnianej, modele trenowane na danych real-time osiągają współczynnik korelacji rang Spearmana równy 0,9511 (±0,0332) oraz współczynnik korelacji Pearsona 0,9528 (±0,0622). Modele trenowane na danych wstępnych uzyskują bardzo zbliżone wyniki: Spearman 0,952 (±0,029) oraz Pearson 0,9488 (±0,0638). Natomiast modele oparte na danych z aktualnych vintages wypadają nieco słabiej, osiągając odpowiednio 0,9046 (±0,1047) dla korelacji rang Spearmana i 0,876 (±0,1607) dla korelacji Pearsona.
Artykuł:
Expert Systems with Applications
Autorzy z PW:
Elżbieta Jowik, Agnieszka Jastrzębska
Dyscyplina:
Rok wydania: