Prognozowanie na podstawie modelu liniowego

Klasyczny model liniowy z wieloma zmiennymi objaśniającymi ma następującą postać:

gdzie:

Y – zmienna objaśniana,

-składnik losowy,

(i = 0,1,2,…, k) – nieznane parametry strukturalne modelu.

Zapis jest interpretowany jako model odnoszący się do populacji generalnej, którego prawdziwość zamierzamy sprawdzić na podstawie próby. Zakładamy że dysponujemy n-elementowymi szeregami czasowymi obserwacji  na wszystkich zmiennych modelu. W przypadku danych przekrojowych n oznacza liczbę obserwowanych w próbie obiektów. Po uwzględnieniu znanych wartości poszczególnych zmiennych, zależność można zapisać w postaci układu n równań liniowych:

W zapisie wektorowo-macierzowym ogólną postać liniowego modelu ekonometrycznego z wieloma zmiennymi objaśniającymi zapisujemy następująco:

gdzie:

y -wektor o wymiarach n x 1 obserwacji na zmiennej objaśnianej,

X – macierz o wymiarach n*(k+l) obserwacji na zmiennych objaśniających,

a -wektor o wymiarach (k+l) *1 nieznanych parametrów strukturalnych modelu,

e – wektor o wymiarach n x 1 składników losowych.

 

Równanie macierzowe zawiera nieznane parametry strukturalne oraz składniki losowe, których własności a priori nie znamy. Najczęściej stosowaną w praktyce metodą estymacji parametrów strukturalnych a modelu ekonometrycznego jest metoda najmniejszych kwadratów (MNK). Stosowanie jej wymaga spełnienia określonych założeń. Są one opisane w każdym podręczniku ekonometrii więc nie będziemy się tu nimi zajmować Wyznaczanie klasyczną MNK wektora ocen (estymatorów) parametrów strukturalnych modelu wymaga wykorzystania poniższej formuły:

gdzie symbol „’ ” (prim) jest znakiem transpozycji.

Klasyczna MNK zapewnia uzyskanie estymatorów o wszystkich pożądanych właściwościach statystycznych (nieobciążoność, zgodność, efektywność). Na podkreślenie zasługuje fakt, iż niespełnienie któregokolwiek z założeń stosowalności MNK powoduje konieczność zastosowania innej metody estymacji.

Wyznaczenie wektora a ocen parametrów strukturalnych umożliwi weryfikację modelu ekonometrycznego. Dokonuje się jej z dwóch punktów widzenia: merytorycznego i statystycznego. W trakcie oceny merytorycznej zwraca się uwagę na to, czy otrzymane wyniki potwierdzają teoretyczne rozważania o objaśnianym zjawisku, czyli czy są zgodne z teorią ekonomiczną, która legła u podstaw budowy modelu. Weryfikacja merytoryczna obejmuje również badanie zgodności znaków ocen parametrów strukturalnych z wiedzą ekonomiczną o badanym zjawisku.

Weryfikacja statystyczna sprowadza się do oceny stopnia dopasowania modelu ekonometrycznego do danych empirycznych, wielkości popełnionych w trakcie estymacji błędów, istotności wpływu wyróżnionych zmiennych objaśniających na zmienną objaśnianą, a także do sprawdzenia, czy spełnione są określone założenia dotyczące składnika losowego modelu. Weryfikacji statystycznej dokonuje się za pomocą różnorodnych sumarycznych charakterystyk otrzymywanych w procesie estymacji modelu.

 

Prognozowanie można przeprowadzać z wykorzystaniem jedynie modeli "dobre". "Dobry" model to taki, którego parametry strukturalne posiadają sensowną interpretację ekonomiczną, cechuje go wysoki stopień dopasowania do danych empirycznych, a wszystkie zmienne objaśniające wywierają istotny wpływ na zmienną objaśnianą. Dążenie do spełnienia tych wszystkich wymogów "dobrego" modelu jest procesem, w trakcie którego otrzymujemy wiele jego wariantów (różne postacie analityczne, odmienne zbiory zmiennych objaśniających itp.). Wykorzystywanie do konstruowania prognoz modelu nie spełniającego kryteriów wynikających z jego merytoryczno-statystycznej oceny jest bezproduktywną czynnością.

Pod względem rachunkowym wyznaczenie prognozy jest dość proste, gdyż polega na podstawieniu – w miejsce wyróżnionych zmiennych objaśniających – odpowiednich danych liczbowych i wykonaniu określonych działań algebraicznych, zgodnie z analityczną postacią modelu. Jeśli zatem oszacowany liniowy model ekonometryczny spełnia wymogi "dobrego" modelu, to prognozę wartości zmiennej objaśnianej uzyskamy w następujący sposób:

gdzie  są ustalonymi wartościami zmiennych objaśniających w okresie prognozowanym.

Relację tą można również zapisać w wygodniejszej, macierzowej postaci jako:

gdzie xi. jest wektorem wartości zmiennych objaśniających dla okresu T, czyli:

Zwrócić należy uwagę na fakt, że aby model ekonometryczny mógł być wykorzystywany w procesie predykcji, powinny być spełnione tzw. podstawowe założenia teorii predykcji, a mianowicie:

 

1. struktura opisywanych przez model zjawisk ekonomicznych (tj. postać analityczna oraz wartości parametrów) nie ulegną zmianie w okresie prognozowanym;

2. składnik losowy modelu ma stały rozkład w czasie (stabilność parametrów rozkładu składnika losowego);

3. znane są wartości zmiennych objaśniających modelu w okresie prognozowanym;

4. dopuszczalna jest ekstrapolacja modelu poza zaobserwowany w próbie obszar zmienności zmiennych objaśniających.

Powyższe założenia są zazwyczaj uzupełniane dwoma podstawowymi postulatami teorii predykcji:

§ dla każdej prognozy ekonometrycznej powinna być obliczona wartość miernika określającego stopień dokładności jaki charakteryzuje dane  prognozowanie,

§ prognozę należy budować w taki sposób, aby miernik określający dokładność predykcji przybierał możliwie najkorzystniejszą wartość.

Postulaty te spełnia tzw. zasada predykcji nieobciążonej, według której prognozy budowane są na poziomic wartości oczekiwanej zmiennej prognozowanej w okresie T.

Założenia oraz postulaty teorii predykcji są zazwyczaj spełnione przy konstrukcji prognoz krótkookresowych. Jest to związane z problemami inercji zjawisk gospodarczych. Znacznie większe ryzyko dezaktualizacji modelu ekonometrycznego ponoszone jest przy prognozowaniu na dłuższe okresy.

Na podstawie jednorównaniowego modelu ekonometrycznego można budować zarówno prognozy punktowe, jak i przedziałowe.

Wyznaczone na podstawie modelu ekonometrycznego prognozy mogą – pomimo spełnienia wszystkich wymaganych warunków – różnić się od rzeczywiście zaobserwowanych wartości zmiennej prognozowanej. Wynika to przede wszystkim z istnienia w modelu ekonometrycznym składnika losowego.

W związku z tym konieczne jest określenie rzędu wielkości spodziewanego błędu przy wyznaczaniu prognozy. Dla prognozy punktowej tego rodzaju miernikiem jest średni błąd predykcji ex ante, który wyraża się wzorem:

Występujący we wzorze symbol S2 jest nieobciążonym i zgodnym estymatorem wariancji j2 składnika losowego:

gdzie e jest wektorem reszt modelu.

Symbolem D2(a) oznaczono macierz wariancji i kowariancji estymatorów parametrów strukturalnych:

Elementy diagonalne tej macierzy są wariancjami estymatorów parametrów, a pierwiastki kwadratowe z nich – średnimi błędami szacunku parametrów strukturalnych. Poza główną przekątną znajdują się kowariancje estymatorów parametrów.

Średni błąd predykcji ex ante można obliczyć ze wzoru:

gdzie:

xiT, xjT – ustalone wartości zmiennych objaśniających w okresie prognozowanym,

D2 (ai) – ocena wariancj i oceny ai,

cov(ai, aj) -ocena kowariancji ocen ai oraz aj.

Jak wynika ze wzorów , średni błąd prognozy ex ante maleje wraz ze wzrostem dokładności oszacowań parametrów strukturalnych modelu wariancji składnika losowego (co ma miejsce wtedy, gdy rośnie liczebność próby) i zmienności zmiennych objaśniających w próbie. Jego wartość wzrasta natomiast wraz ze wzrostem różnicy między prognozowanymi wartościami zmiennych objaśniających, a ich wartościami średnimi w próbie.

Jeżeli zasadne jest założenie o normalności rozkładu składników losowych e w modelu , to istnieje możliwość wyznaczenia prognozy przedziałowej dla prognozowanej wartości zmiennej. W takim przypadku zmienna losowa:

ma – w przypadku małej próby – rozkład t-Studenta o n-(k+1) stopniach swobody. Prognozę przedziałową ustala się wówczas zgodnie z następującą formułą:

gdzie:

Y*T -wartość prognozy dla zmiennej objaśnianej w okresie T,

YT -rzeczywista wartość zmiennej objaśnianej w okresie T,

ta – wartość odczytana z tablic rozkładu t-Studenta,

DT. – średni błąd prognozy ex ante,

g – przyjęty z góry poziom ufności, zwany wiarygodnością prognozy.

W przypadku dużej próby (n > 30), prognozę przedziałową konstruujemy na podstawie relacji:

gdzie ua,x wartością odczytaną z tablic dystrybuanty rozkładu normalnego.

Przedział prognozy rozszerza się wraz ze wzrostem wiarygodności prognozy oraz zwiększaniem się średniego błędu prognozy (DT) do 1.

Dla małej próby, średni błąd prognozy przedziałowej jest określony następująco:

a w przypadku dużej liczebności próby:

Błąd ten można również wyznaczyć jako połowę długości przedziału prognozy. Długość przedziału prognozy jest różnicą między górną i dolną granicą tego przedziału.

Względny błąd prognozy przedziałowej jest ilorazem bezwzględnego średniego błędu prognozy do wartości prognozy punktowej, czyli: