ho - бесплатный хостинг!

Методологічні основи економетричного моделювання

 

Навчальні питання:

1. Основні математичні припущення щодо економетричного моделювання.

2. Економетрична модель та експериментальні дані.

 

1. Основні математичні припущення щодо

економетричного моделювання

Розглянемо наступну ситуацію. Припустимо, що нам треба продати автомобіль, і ми вирішили дати оголошення у газету. Виникає питання: яку ціну вказати в оголошенні? Очевидно, ми будемо керуватися інформацією о ціні, котру виставляють інші продавці подібних автомобілів, тобто автомобілів, які володіють близькими значеннями таких факторів, як рік випуску, пробіг та ін.

         Поставимо задачу визначення ціни автомобіля, яка формується під дійством декотрих факторів (рік випуску, пробіг і т.д.). Такі величини зазвичай називають залежними (результативними, ендогенними ознаками), а фактори, від котрих вони залежать – незалежними (пояснюючими, екзогенними, факторами).

Вказана конкретна ціна – спостережливе значення залежної змінної залежить також і від випадкових явищ – таких, наприклад, як характер продавця, можливі терміни продажу автомобіля та ін.

Окремий продавець навряд чи буде будувати яку-небудь математичну модель, але менеджер крупного салону, який спеціалізується на торгівлі автомобілями на другорядному ринку, скоріш за все захоче мати більш точніше уявлення за очікувану ціну і за можливу поведінку випадкової складової. Слідуючий крок являється економетричних моделюванням.

Загальним моментом для будь-якої економетричної моделі є розбиття залежної змінної на частини – пояснюючу та випадкову. Сформулюємо задачу моделювання загальним неформальним чином: на основі експериментальних даних визначити пояснюючу частину і, розглядаючи випадкову складову як випадкову величину, отримати оцінку параметрів їх розподілу.

Таким чином, економетрична модель має слідуючий вид:

                   У=f(х12,…,хр)+ε,                                                                   (1)

де      У –залежна змінна, що спостерігається;

f (х1, х2, …,хр) – пояснююча частина, що залежить від значень пояснюючих змінних х1, х2, …,хр;

ε – випадкова складова.

Зупинимось на цілях моделювання. Припустимо, що отриманий слідуючий вираз для пояснювальної частини змінної У – ціни автомобіля:

ŷ = 18000 – 1000 х1 – 0,5 х2,

де      ŷ – очікувана ціна автомобіля (в у.о.);

х1 – термін експлуатації  (в роках);

х2 – пробіг (в тис.км).

Практичне значення отриманого результату: він дозволяє зрозуміти, як саме формується економічна змінна – ціна на автомобіль; він дозволяє виявити вплив кожної з пояснюючих змінних на ціну автомобіля (так, в даному випадку ціна нового автомобіля 18000 у.о. – при х1 = 0, х2 = 0, причому тільки за рахунок збільшення терміну експлуатації на 1 рік, ціна автомобілю зменшується у середньому на 1000 у.о., а тільки за рахунок збільшення пробігу на 1000 км – на 0,5 у.о.); цей результат дозволяє прогнозувати ціну на автомобіль, якщо відомі його основні параметри.

Розглянемо основні математичні припущення економічного моделювання. Нехай маємо р пояснюючих змінних х1, х2, …, хр та залежну змінну У.

 Змінна У являється випадковою величиною, що має при заданих значеннях факторів деякий розподіл, а пояснюючі змінні невипадкові.  

 Звичайно робиться якесь припущення відносно розподілу У. Частіш усього допускається, що умовні розподіли У при кожному допустимому значенні факторів – нормальні. Подібне припущення дозволяє отримати значно більш «просунуті» результати.

Пояснюючі змінні хj (j=1,р) можуть вважатися як випадковими, так й детермінованими. Проілюструємо цей тезис на нашому прикладі. Можна заздалегідь визначити для себе параметри автомобіля і шукати оголошення про продаж автомобілю з такими параметрами. У цьому випадку випадковою величиною залишається тільки залежна змінна – ціна. Але можна випадковим чином вибирати оголошення про продаж, у цьому випадку параметри автомобілю – пояснюючі змінні – також виявляються випадковими величинами.

Класична економетрична модель розглядає пояснюючі змінні хj як детерміновані, однак основні результати статистичного дослідження моделі залишаються в значній мірі тими ж, що і в випадку, якщо вважати хj випадковими змінними.

Пояснююча частина – позначимо її Уп – у будь-якому випадку уявляє собою функцію від значень факторів – пояснюючих змінних:

                                 Уп = f (х1, х2, …, хр).

Таким чином, економетрична модель має вигляд

                                 У = f (х1, х2, …, хр) + ε.

Найбільш природним вибором пояснюючої частини випадкової величини У являється її середнє значення – умовне математичне сподівання

Мх1,х2,…хр (У), яке отримано при даному набору значень пояснюючих змінних х1, х2,…, хр. Далі математичне сподівання будемо позначати Мх (У). Дійсно, за своїм сенсом пояснююча частина – це очікуване значення залежної змінної при заданих значеннях пояснюючих змінних.

Рівняння

                               Мх (У) = f (х1, х2, …, хр)

називається рівнянням регресії.

При такому природньому вибору пояснюючої частини економетрична модель має вигляд:

                                         У=Мх(У)+ε,                                                                   (2)

де εвипадкова величина, яку називають похибкою. В курсі математичної статистики рівняння (2) зветься рівнянням регресійної моделі.

Відмітимо, що економетрична модель не обов’язково являється регресійною, тобто пояснююча частина не завжди уявляє собою умовне математичне сподівання залежної змінної. Систематичні похибки вимірювання пояснюючих змінних – одна з можливих причин того, що економетрична модель не являється регресійною

З математичної точки зору регресійні моделі виявляються істотньо більш простим об’єктом, чим економетрична модель загального типу. Відмітимо ще декотрі властивості регресійної моделі.

Розглянемо рівність (2) і візьмемо від обох частин математичне сподівання для заданого набору значень пояснюючих змінних. У цьому випадку отримаємо рівність:

            Мх (У) = Мх (У) + Мх (ε) => Мх (ε) = 0 => М (ε) = 0,                                                                           

тобто у регресійній моделі очікуване значення імовірної похибки дорівнює нулю. Можна показати, що звідси слідкує некорельованість похибок та пояснюючих змінних (якщо пояснюючі змінні розглядаються як   імовірні величини). Ця обставина виявляється найбільш істотньою умовою обґрунтованості результатів аналізу економетричної моделі.

 

2. Економетрична модель і експериментальні дані

Щоб отримати досить достовірні та інформативні дані о розподілі будь-якої випадкової величини, необхідно мати вибірку її спостережень досить великого об’єму. Такі вибірки уявляють собою набори значень

                         і1, хі2, …, хір; уі), і = 1,2,…, n,

де р – кількість пояснюючих змінних, n – число спостережень.

Як правило, число спостережень n досить велике і значно перебільшує число р пояснюючих змінних. Проблема, однак, заключається у тому, що спостереження уі, що розглядаються у різних вибірках як випадкові величини Уі і що отримані при різних наборах значень пояснюючих змінних хі, мають,  загалом, різні розподіли. А це означає, що для кожної випадкової величини Уі ми маємо лише одне спостереження, і тому ніякого адекватного висновку о розподілу випадкової величини зробити неможливо.

У класичному курсі економетрії розглядається два типи вибіркових даних.  

Просторова вибірка або просторові дані. В економіці під просторовою вибіркою розуміють набір показників економічних змінних, які отримані у даний момент часу. Очевидно, о просторовій вибірці можна говорити у тому випадку, якщо усі спостереження знаходяться приблизно в незмінних умовах, тобто уявляють собою набір незалежних випадкових даних із декотрої генеральної сукупності.

Таким чином, будемо називати просторовою вибіркою серію із n незалежних спостережень (р+1) – вимірної випадкової величини

                                   і1, хі2, …, хір; Уi).

У цьому випадку різні випадкові величини Уі виявляються незалежними, що тягне за собою некорельованість їх похибок, тобто

                                     r (εі, εj) = 0, і≠j,                                                                                                               

де r (εі, εj) – коефіцієнт кореляції між похибками і та j.

 Дана умова істотньо спрощує модель і її статистичний аналіз.

Як визначити, чи являється вибірка серією незалежних спостережень? На це запитання не має однозначної відповіді. Зазвичай за незалежні приймають величини, які не зв’язані причинно.

Обернемось до нашого прикладу. Нехай У – ціна машини, Х – рік випуску, а (хі, уі), …, (хn, уn) – серія даних, що отримана із газети. Різні продавці не знайомі між собою, вони дають свої оголошення незалежно один від одного, так що припущення о незалежності спостереження виглядає досить розумно.

З другого боку, людина, що назначає ціну за свій автомобіль, керується цінами попередніх оголошень, так що заперечення проти незалежності спостережень також має право на існування.

Із цього можна зробити висновок: рішення за просторовий характер вибірки в деякій мірі суб’єктивне і зв’язано з умовами моделі, що використовується.

Отже, економетрична модель, що побудована на основі просторової вибірки експериментальних даних (хі, уі) має вигляд:

        уі=f(хі1і2,…,хір)+εi,і=1,2,…,n,                                                           (3)

де похибки задовольняють умовам     

                                 М[εі]= 0;                                                                      (4)

                          r(εіj)=0, і≠j;                                                                    (5)

                                  D(εі)=δі2.                                                                     (6)

Щодо умови (6) тут можливі два випадки:

а) δі2 = δj2 при усіх і та j. Властивість постійності дисперсії похибок регресії називається гомоскедастичністю. У цьому випадку розподіли імовірних величин Уі відрізняються тільки значеннями пояснювальної частини (математичним сподіванням).

б) δі2 ≠ δj2, і≠j. У цьому випадку має місце гетероскедастичність моделі. Гетероскедастичність «псує» багато яких результатів статистичного аналізу і, як правило, потребує усунення.

Як визначити гомоскедастичність або гетероскедастичність моделі? В деяких випадках це достатньо очевидно. Наприклад, ціна автомобіля, котрому 15 років, навряд чи може піднятися вище 2000 у.о., так що стандартна похибка ціни у цьому випадку навряд чи може бути більш, ніж 300-400 у.о.

Динамічний ряд. Динамічним рядом називається вибірка спостережень, у котрих важливі не тільки самі спостерігаємі значення імовірних величин, але і порядок їх слідкування одне за одним. Частіше усього послідовність обумовлена тим, що експериментальні дані уявляють собою серію спостережень однієї імовірної величини у послідовні моменти часу. У цьому випадку динамічний ряд називається часовим рядом. При цьому припускається, що тип розподілу спостерігаємої імовірної величини не змінюється, але його параметри змінюються в залежності від часу.

Моделі часових рядів, як правило, виявляються більш складнішими, ніж моделі просторової вибірки, так як спостереження у випадку часового ряду в загалом не являється незалежними, а це означає, що похибки регресії можуть корелювати одна з одною, тобто умова (5) не виконується, що значно ускладнює статистичний аналіз моделі.

Слід відмітити, що без розуміння природи даних неможливо визначити, чи маємо ми діло із просторовою вибіркою, чи із часовим рядом. Нехай, наприклад, є  500 пар чисел (хі, уі), …, (х500, у500), де у – ціна автомобіля, а х – рік випуску. Можливі такі варіанти:

1) n газет були упорядковані за датою їх випуску, і з кожної газети було узято (випадковим чином) по одному оголошенню. У цьому випадку – це часовий ряд;

2) газети були довільним чином перемішані, і не зважаючи уваги на дату, імовірним чином було обрано n оголошень. У цьому випадку – це просторова вибірка. Теоретично можливо, що ці дані будуть однакові, однак у випадку ми повинні постулювати некорельованість похибок регресії, хоча у першому випадку це неправомірно!