Ekonometria

praca semestralna

 

 

 

1. Wstęp

 

W swojej pracy chciałem przedstawić własny model ekonometryczny przedstawiający zależność zużycia energii elektrycznej przez gospodarstwa domowe od liczby ludności oraz nowych mieszkań oddanych do użytku. Do badania zależności wykorzystałem dane z lat 1980-1995, opublikowane w rocznikach statystycznych GUS.

Następnie przeprowadziłem oszacowanie modelu, jego parametrów strukturalnych (stosując metodę najmniejszych kwadratów) oraz ustaliłem zależności występujące między zmiennymi objaśniającymi (liczba ludności, liczba nowych mieszkań) a objaśnianą (zużycie energii) za pomocą programu Microfit 3.0.

                Oczywistym jest że liczba mieszkańców naszego kraju wpływa na zużycie energii. Bardziej istotne było tu wprowadzenie drugiej zmiennej (liczby mieszkań oddanych do użytku) w celu sprawdzenia hipotezy czy faktycznie wpływa ona na zużycie energii. Na tym w istocie skupiła się część poznawcza pracy. Wszelkie wnioski i wyniki oszacowań znajdują się na końcu pracy, w podsumowaniu, po wszystkich wyliczeniach.

            W tablicy 1 przedstawione są dane z poszczególnych lat. Widać wyraźnie, że o ile wzrost liczby ludności jest stały i w miarę jednostajny, to liczba nowych mieszkań wykazuje tendencje zarówno wzrostowe jak i spadkowe. Przejdźmy więc do obliczeń w celu wykazania zależności.

 

Tablica 1. Zestawienie zużycia energii elektrycznej przez gospodarstwa domowe oraz liczby ludności i nowych mieszkań oddanych do użytku w latach 1980-1995

OBS.

ZUŻYCIE ENERGII  (GWh)

LICZBA LUDNOŚCI (tys.)

NOWE MIESZKANIA  (tys.)

OBS.

ZUŻYCIE ENERGII  (GWh)

LICZBA LUDNOŚCI (tys.)

NOWE MIESZKANIA  (tys.)

1980

10701

35578

185

1988

17796

37862

189.6

1981

12163

35902

187

1989

18663

37963

150.2

1982

12624

36227

186.1

1990

20558

38119

134.2

1983

11939

36571

195.8

1991

19318

38245

136.8

1984

13772

36914

195.9

1992

18430

38365

133

1985

14944

37203

189.6

1993

18206

38459

94.4

1986

15649

37456

185

1994

18206

38544

76.1

1987

17066

37664

191.4

1995

18075

38588

67.1

Źródło: Rocznik statystyczny GUS, 1994-96

 

2. Oszacowanie i interpretacja parametrów strukturalnych modelu

 

Zestawienie danych:

Wydruk 1. Zestawienie danych – zużycie energii elektrycznej przez gospodarstwa domowe (GWh), liczba ludności (tys.), liczba nowych mieszkań oddanych do użytku (tys.) w Polsce w latach 1980-95

OBS.        ENERGIA    LUDNOŚĆ     MIESZKANIA  C   

 1980       10701      35578       185         1.0000                          

 1981       12163      35902       187         1.0000                          

 1982       12624      36227       186.1       1.0000                          

 1983       11939      36571       195.8       1.0000                          

 1984       13772      36914       195.9       1.0000                          

 1985       14944      37203       189.6       1.0000                          

 1986       15649      37456       185         1.0000                           

 1987       17066      37664       191.4       1.0000                          

 1988       17796      37862       189.6       1.0000                          

 1989       18663      37963       150.2       1.0000                           

 1990       20558      38119       134.2       1.0000                          

 1991       19318      38245       136.8       1.0000                          

 1992       18430      38365       133         1.0000                          

 1993       18206      38459       94.4        1.0000                          

 1994       18206      38544       76.1        1.0000                          

 1995       18075      38588       67.1        1.0000

Źródło: Rocznik statystyczny GUS, 1994-96

 

Wyznaczenie podstawowych miar statystycznych i ich interpretacja:

Wydruk 2. Podstawowe miary statystyczne

Sample period    :1980 to 1995                                               

  Variable(s)      :    ENERG.    LUDN.    MIESZK. 

  Maximum          :    20558     38588     195.9                             

  Minimum          :    10701     35578      67.1                             

  Mean             :   16509.6   37478.8   156.075                             

  Std. Deviation   :    2899.0   980.1243  44.5159                             

Źródło: Wydruk programu Microfit 3.0

 

INTERPRETACJE:

Maksymalna ilość zużytej energii przez gospodarstwa domowe w latach 1980-95 wyniosła w 1990 roku 20558 GWh, natomiast minimalna ilość wyniosła w roku 1980 – 10701 GWh. Średnie zużycie energii w latach 1980-95 wyniosło 16509.6 GWh. Odchylenie standardowe informuje, że ilość zużytej energii przez gospodarstwa domowe w poszczególnych latach różni się przeciętnie od średniej arytmetycznej o 2899 GWh.

            Maksymalna liczba ludności wyniosła 38588 tys. w roku 1995. Natomiast najniższą liczbę ludności w okresie 1980-95 zanotowano w roku 1980 i wynosiła ona 35578 tys. Przeciętna liczba ludności w badanym okresie wynosi 37478.8 tys. Odchylenie standardowe równe 980.1243 informuje, że liczba ludności w poszczególnych latach różni się średnio od średniej arytmetycznej o 980.1243 tys.

            Maksymalna liczba nowych mieszkań oddanych do użytku w badanym okresie wyniosła 195.9 tys. i przypadła na rok 1984. Minimalna liczba mieszkań oddanych do użytku przypada na rok 1995 i wynosi 67.1 tys. Średnia liczba nowych mieszkań oddanych do użytku w badanym okresie wynosi 156.075 tys. Odchylenie standardowe informuje, że liczba mieszkań oddanych do użytku różni się przeciętnie od średniej arytmetycznej o 44.5159 tys.

 

 

 

 

Dokonuję oszacowania parametrów strukturalnych modelu

ZEt = b0 + b1Lt + b1Mt

gdzie:

ZEt – zmienna endogeniczna; zużycie energii elektrycznej przez gospodarstwa domowe

              w Polsce w latach 1980-95 (w GWh)

Lt – zmienna egzogeniczna; liczba ludności w Polsce w latach 1980-95 (w tys.)

Mt – zmienna egzogeniczna; liczba nowych mieszkań oddanych do użytku w Polsce w

               tys. w latach 1980-95

 

 

 

 

 

 

 

 

 

 

 

 

Wydruk 3. Wyniki estymacji modelu

 

  Ordinary Least Squares Estimation

 *******************************************************************************

  Dependent variable is  ZE         

  16 observations used for estimation from 1980 to 1995                        

 *******************************************************************************

  Regressor              Coefficient       Standard Error         T-Ratio[Prob]

  C                        -67058.9            31612.7             -2.1213[.054]

  L                        2.2338              .78823               2.8340[.014]

  M                        -0.98233            17.3551            -.056602[.956]

 *******************************************************************************

 

  R-Squared                     .58756   F-statistic F( 2,  13)    9.2599[.003]

  R-Bar-Squared                 .52411   S.E. of Regression              1999.9

  Residual Sum of Squares     5.20E+07   Mean of Dependent Variable     16509.6

  S.D. of Dependent Variable    2899.0   Maximum of Log-likelihood    -142.6554

  DW-statistic                  1.8658                                         

 *******************************************************************************

Źródło: Wydruk programu Microfit 3.0

 

Parametry strukturalne zostały oszacowane następująco:

ZEt = -67058.9 + 2.2338*Lt + -0.98233*Mt             (t=1..16)

              +- 31612              +- 0.78823            +- 17.3551     

Wyraz wolny został oszacowany na poziomie –67058.9 ze średnim błędem szacunku

+- 31612.

Jeżeli liczba ludności wzrośnie o 1 tys., to zużycie energii elektrycznej przez gospodarstwa domowe wzrośnie o 2.2338 GWh ze średnim błędem szacunku +- 0.78823 GWh, ceteris paribus.

Jeżeli liczba nowych mieszkań wzrośnie o 1000, zużycie energii elektrycznej spadnie o 0,98233 GWh ze średnim błędem szacunku +- 17.3551, ceteris paribus.

 

 

 

 

 

 

 

 

3. Miary dopasowania i ich interpretacja

 

Zgodnie z wydrukiem z programu Microfit 3.0 (Wydruk 3), miary dopasowania zostały oszacowane następująco:

 

            błąd standardowy reszt

 

S.E. of Regression   =  1999.9

 

Teoretyczne zużycie energii elektrycznej przez gospodarstwa domowe w latach 1980-95 odchyla się przeciętnie od wartości empirycznych o ± 1999.9 GWh.

 

współczynniki determinacji i zbieżności

 

R-Squared   =  0.58756         φ2 = 0.41244

 

 

58,75% całkowitej zmienności ilości zużycia energii zostało wyjaśnione przez model empiryczny.

41,24% całkowitej zmienności ilości zużycia energii nie zostało wyjaśnione przez model empiryczny.

 

skorygowane współczynniki determinacji i zbieżności

R-Bar-Squared   =   0.52411          φ2 (bar) = 0.47589

 

52,41% calkowitej zmienności ilości zużycia energii zostało wyjaśnione przez model empiryczny.

47,58% całkowitej zmienności ilości zużycia energii nie zostałow wyjaśnione przez model empiryczny.

 

 

 

 

współczynnik zmienności losowej V

V = 12,11%

 

12,11% przeciętnego poziomu ilości zużycia energii stanowi przeciętne odchylenie wartości teoretycznych od empirycznych  tej zmiennej.

 

4. Weryfikacja parametrów modelu

 

Wydruk 4. Testy diagnostyczne

Diagnostic Tests

 *******************************************************************************

 *    Test Statistics  *        LM Version         *         F Version         *

 *******************************************************************************

 *                     *                           *                           *

 * A:Serial Correlation*CHI-SQ(  1)= 0.020082[.887]*F(  1,  12)= 0.015080[.904]*

 *                     *                           *                           *

 * B:Functional Form   *CHI-SQ(  1)=  0.85578[.355]*F(  1,  12)=  0.67811[.426]*

 *                     *                           *                           *

 * C:Normality         *CHI-SQ(  2)=   8.7272[.013]*       Not applicable      *

 *                     *                           *                           *

 * D:Heteroscedasticity*CHI-SQ(  1)=   3.5616[.059]*F(  1,  14)=   4.0087[.065]*

 *******************************************************************************

   A:Lagrange multiplier test of residual serial correlation

   B:Ramsey's RESET test using the square of the fitted values

   C:Based on a test of skewness and kurtosis of residuals

   D:Based on the regression of squared residuals on squared fitted values

Źródło: Wydruk programu Microfit 3.0

 

I.                    BADANIE INDYWIDUALNEJ ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH

(test t-Studenta)                                                                                                          a=0,05

 

a)         badam istotność parametru b0:

            t0 = -2,1213

            t a/2 = t (0,025; T-k-1) = t (0,025; 13) = 2,161

                                                                       H0: b0=0

H1: b00

t0 < t a/2  brak podstaw do odrzucenia H0, parametr b0 statystycznie nieistotnie różni się od zera.

 

[Prob] = 0,054                                                                                 a=0,05

[Prob] > a  brak podstaw do odrzucenia H0, parametr b0 statystycznie nieistotnie różni się od zera.

[Prob] = 0,054                                                                                 a=0,1

[Prob] < a  odrzucamy H0, parametr b0 statystycznie istotnie różni się od zera.

 

b)         badam istotność parametru b1:

            t1 = 2,8340

            t a/2 = t (0,025; T-k-1) = t (0,025; 13) = 2,161

                                                                       H0: b1=0

H1: b10

t1 > t a/2  odrzucamy H0 na rzecz H1, parametr b1 statystycznie istotnie różni się od zera, a więc zmienna Lt (liczba ludności) statystycznie istotnie wpływa na ZEt (zużycie energii w gospodarstwach domowych)

 

[Prob] = 0,014                                                                                 a=0,05

[Prob] < a  odrzucamy H0 na rzecz H1, parametr b1 statystycznie istotnie różni się od zera, a więc zmienna Lt (liczba ludności) statystycznie istotnie wpływa na ZEt (zużycie energii w gospodarstwach domowych)

[Prob] = 0,014                                                                                 a=0,1

[Prob] < a  odrzucamy H0 na rzecz H1, parametr b1 statystycznie istotnie różni się od zera, a więc zmienna Lt (liczba ludności) statystycznie istotnie wpływa na ZEt (zużycie energii w gospodarstwach domowych)

 

c)         badam istotność parametru b2:

            t1 = -0,056602

            t a/2 = t (0,025; T-k-1) = t (0,025; 13) = 2,161

                                                                       H0: b2=0

H1: b20

t0 < t a/2  brak podstaw do odrzucenia H0, parametr b2 statystycznie nieistotnie różni się od zera, a więc zmienna Mt (liczba mieszkań oddanych do użytku) statystycznie nieistotnie wpływa na ZEt (zużycie energii elektrycznej przez gospodarstwa domowe)

 

[Prob] = 0,956                                                                                 a=0,05

[Prob] > a  brak podstaw do odrzucenia H0, parametr b2 statystycznie nieistotnie różni się od zera, a więc zmienna Mt (liczba mieszkań oddanych do użytku) statystycznie nieistotnie wpływa na ZEt (zużycie energii elektrycznej przez gospodarstwa domowe)

 

[Prob] = 0,956                                                                                 a=0,1

[Prob] > a  brak podstaw do odrzucenia H0, parametr b2 statystycznie nieistotnie różni się od zera, a więc zmienna Mt (liczba mieszkań oddanych do użytku) statystycznie nieistotnie wpływa na ZEt (zużycie energii elektrycznej przez gospodarstwa domowe)

 

II.                  BADANIE ŁĄCZNEJ ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH

(test Fishera-Snedecora)                                                                                                     a=0,05

 

F = 9,25

Fa = F (2, 13) = 3,81

                                                                       H0: b* =0

H1: b* 0

F > Fa  odrzucamy H0 na rzecz H1, łącznie parametry strukturalne statystycznie istotnie różnią się od zera, a więc łącznie zmienne objaśniające statystycznie istotnie wpływają na ZEt (zużycie energii w gospodarstwach domowych)

 

[Prob] = 0,000                                                                                 a=0,05

[Prob] < a  a  odrzucamy H0 na rzecz H1, łącznie parametry strukturalne statystycznie istotnie różnią się od zera, a więc łącznie zmienne objaśniające statystycznie istotnie wpływają na ZEt (zużycie energii w gospodarstwach domowych)

 

[Prob] = 0,000                                                                                 a=0,1

[Prob] < a  a  odrzucamy H0 na rzecz H1, łącznie parametry strukturalne statystycznie istotnie różnią się od zera, a więc łącznie zmienne objaśniające statystycznie istotnie wpływają na ZEt (zużycie energii w gospodarstwach domowych)

 

III.               WERYFIKACJA HIPOTEZY O NORMALNYM ROZKŁADZIE SKŁADNIKA ZAKŁÓCAJĄCEGO

(test Jarqua-Bera)

 

c2 (2) = 8.7272

                                                           H0: xt ~ N

H1: xt N

[Prob] = 0,013                                                                                 a=0,05

[Prob] < a  odrzucamy H0, składnik zakłócający nie ma rozkładu normalnego

 

[Prob] = 0,013                                                                                 a=0,1

[Prob] < a  odrzucamy H0, składnik zakłócający nie ma rozkładu normalnego

 

 

IV.                TESTOWANIE WYSTĘPOWANIA AUTOKORELACJI PIERWSZEGO RZĘDU

(test Durbina-Watsona)                                                                                                         a=0,05

 

            DW = 1,8658

            dL (T; k; a) = dL (16; 2; 0,05) = 0,982

            dU (T; k; a) = dU (16; 2; 0,05) = 1,539

 

            DW należy do przedziału (0, 2) w związku z czym podejrzewamy autokorelację dodatnią

                                                                       H0: r1 = 0

H1: r1 > 0

DW > du   nie ma podstaw do odrzucenia H0, r1 = 0, w modelu nie występuje autokorelacja.

 

 

 

 

 

 

V.                  TESTOWANIE WYSTĘPOWANIA AUTOKORELACJI WYŻSZEGO RZĘDU

(test Godfrey’a)

 

H0: brak autokorelacji wyższego rzędu 

H1: występuje autokorelacja wyższego rzędu

 

F (1, 12) = 4,4039

 

[Prob] = 0,058                                                                                 a=0,05

[Prob] > a  brak podstaw do odrzucenia H0, autokorelacja wyższego rzędu nie występuje

 

[Prob] = 0,058                                                                                 a=0,1

[Prob] < a  odrzucamy H0 na rzecz H1, w modelu występuje autokorelacja wyższego rzędu

 

VI.                TESTOWANIE POPRAWNOŚCI WYBORU POSTACI ANALITYCZNEJ

(test Ramsey’a)

 

H0: postać analityczna funkcji jest właściwa

H1: postać analityczna funkcji nie jest właściwa

 

F (1, 12) = 0.015080

 

[Prob] = 0,904                                                                                 a=0,05

[Prob] > a  brak podstaw do odrzucenia H0, wybrana postać analityczna funkcji jest właściwa

 

[Prob] = 0,904                                                                                 a=0,1

[Prob] > a  brak podstaw do odrzucenia H0, wybrana postać analityczna funkcji jest właściwa

VII.             TESTOWANIE HETEROSKEDASTYCZNOŚCI ROZKŁADU SKŁADNIKÓW LOSOWYCH

 

H0: E (xt)2 = const

H1: E (xt)2 ≠ const                                                     t = (1..16)

 

F (1, 14) = 4,0087

 

[Prob] = 0,426                                                                                 a=0,05

[Prob] > a  brak podstaw do odrzucenia H0, wariancja składników zakłócających jest stała w czasie

 

[Prob] = 0,426                                                                                 a=0,1

[Prob] > a  brak podstaw do odrzucenia H0, wariancja składników zakłócających jest stała w czasie

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5. Podsumowanie

 

Tablica 2. Zestawienie miar dopasowania modelu

miara

dopasowania

 

Φ2

 

Φ2 skor.

Se

 

wartość

0,58756

0,41244

0,52411

0,47589

1999,9

12,11%

Źródło: Obliczenia własne

 

 

Tablica 3. Zestawienie weryfikacji parametrów modelu

test weryfikacyjny

t-Studenta, istotność parametru

t-Studenta, istotność parametru

t-Studenta, istotność parametru

F, łączna istotność parametrów struktur.

J-B, normalność rozkładu składnika zakłócaj.

α=0,05

ß0= 0

ß10

ß2= 0

ß*0

xt N

α=0,1

ß00

ß10

ß2= 0

ß*0

xt N

Źródło: Obliczenia własne

 

 

Tablica 3 cd. Zestawienie weryfikacji parametrów modelu

test weryfikacyjny

DW, autokorelacja składników losowych

t. Godfrey’a autokorelacja wyższych rzędów

t. Ramsey’a poprawność wyboru post. analititycz.

t. White’a zmienność wariancji skł. zakłóc.

α=0,05

r1 = 0

brak

właściwa

E (xt)2 = const

α=0,1

---

występuje

właściwa

E (xt)2 = const

Źródło: Obliczenia własne

 

 

 

 

 

 

 

 

 

     Na pierwszy rzut oka widać największą wadę modelu. Są nim współczynniki R2 oraz Φ2 zarówno zwykłe jak i skorygowane. W prawidłowym modelu wartości R2 powinny być wyższe od 90%, natomiast w moim oszacowaniu osiągnęły ledwo powyżej 50%. Świadczy to o zły dobraniu zmiennych objaśnianych. Przy bliższym przyjrzeniu się można stwierdzić, że winę za taki stan rzeczy ponosi druga zmienna objaśniająca, liczba nowych mieszkań oddanych do użytku. Wyraźnie daje się zauważyć że błąd szacunku parametru tej zmiennej jest dużo większy od samego parametru. Przypuszczenia zostają potwierdzone podczas testowania istotności parametrów – ta zmienna nie wpływa istotnie na zmienną objaśnianą. Wprowadza więc ona tylko zamęt w modelu, skutecznie obniżając wartość miar dopasowania.

     Dość silnie zatem musi być dopasowana pierwsza zmienna objaśniająca (liczba ludności), gdyż mimo przeszkód średni błąd szacunku wyrażony współczynnikiem zmienności losowej V wynosi 12%. Mieści się to w jednym z przedziałów, które uznaje się za poprawne w ocenie modelu.

     Nie jest niestety spełnione jedno z założeń stochastycznych, a mianowicie składnik losowy nie ma rozkładu normalnego i to przy obu poziomach istotności. Wpływa to negatywnie na ocenę modelu. Drugie założenie (dotyczące homoskedastyczności, czyli stałości wariancji w czasie)jest na szczęście spełnione. Test White’a dowiódł, że siła oddziaływania na zmienną endogeniczną jest stała (E (xt)2 = const).

     Pozytywnym aspektem modelu jest fakt nieistnienia autokorelacji składnika zakłucającego. Test Durbina-Watsona wykazał, że na poziomie istotności równym 0,05 nie występuje żadna autokorelacja.

     Na poziomie istotności a=0,05 nie występuje autokoralacja wyższych rzędów, natomiast przy a=0,1 korelacja wyższych rzedów występuje.

     Test Ramsey’a wykazał, że na obu poziomach istotności wybrana postać analityczna modelu jest właściwa.

            Podsumowując, model nie należy do udanych. Szczególnie źle dobrana jest druga zmienna objaśniająca (liczba nowych mieszkań oddanych do użytku). Cała praca pozwoliła stwierdzić z całą pewnością, że należałoby poszukać na jej miejsce bardziej odpowiedniej zmiennej. Mimo to kierunek jest słuszny, model nie okazał się zlepkiem samych „wad”, ma swoje mocne strony, jak np. istotna wartość łączna parametrów strukturalnych czy właściwa postać analityczna.

 

 

Spis Treści:

1. Wstęp                                                             str.1

2. Oszacowanie i interpretacja

    parametrów strukturalnych modelu           str.2

3. Miary dopasowania i ich interpretacja     str.5

4. Weryfikacja parametrów modelu               str.6

5. Podsumowanie                                             str.12