ho - бесплатный хостинг!

Лінійний множинний регресійний аналіз

 

Навчальні питання:

1. Класична нормальна лінійна модель множинної регресії.

2. Оцінка значущості множинної регресії.Коефіцієнт детермінації.

3. Визначення довірчих інтервалів для  функції регресії та її параметрів.

 

1. Класична нормальна лінійна модель множинної регресії

 

Економічні явища, як правило, визначаються більш чим одним одночасно та сукупно діючих факторів. У зв’язку з цим виникає задача дослідження залежності однієї залежної змінної У від декількох пояснюючих змінних Х12,…,Хр. Ця задача вирішується за допомогою множинного регресійного аналізу. Множинна регресія широко використовується при рішенні питань попиту, доходності акцій, при вивченні витрат виробництва, у макроекономічних розрахунках і тощо.

Загальна множинна регресійна модель має слідуючий вигляд:

,       (1)

де      y - залежна змінна;

x1, x2,…, xp - фактори (незалежні змінні).

Якщо множинна регресійна модель є лінійною (ЛМР), то вона подається у вигляді:

.       (2)

Позначимо  i-е спостереження змінної y через yi, а факторів xi1, xi2,…, xip. Відтоді модель (2) можна подати у вигляді:

,,       (3)

або у матричній формі:

,

де      - вектор (матриця-стовпець) значень залежної змінної;

 - вектор (матриця-стовпець) коефіцієнтів регресійної моделі;

 - вектор (матриця-стовпець) похибок;

 - матриця значень факторів.

Відмітимо основні припущення регресійного аналізу:

1. В моделі (3) похибка  (або залежна змінна ) є випадковою величиною, а фактори  невипадкові величини ().

2. Математичне сподівання похибки  дорівнює нулю:

, .

3. Дисперсія похибки  (або залежної змінної ) постійна дія будь-якої i:

.

тобто виконується умова гомоскедастичності.

4. Похибки  та  не корельовані:

, .

5. Похибка  (або залежна змінна ) є нормально розподіленою випадковою величиною.

6. Матриця значень факторів невироджена, тобто її ранг дорівнює :

.

Модель (4.20), для якої виконуються припущення 1-6, називається класичною нормальною лінійною моделлю множинної регресії (CNLMR-model).

Оцінкою цієї моделі за вибіркою є рівняння регресії:

,       (4)

де      -  оцінка математичного сподівання залежної змінної ;

 - оцінка коефіцієнтів  регресійної моделі (або коефіцієнти регресії).

Як і раніше, для оцінки коефіцієнтів CNLMR-model використовують МНК:

.

Після розв’язання системи нормальних рівнянь

отримаємо значення коефіцієнтів рівняння регресії, які в матричній формі мають вигляд:

,       (5)

де      - вектор (матриця-стовпець) коефіцієнтів рівняння регресії.

 

Оцінки  є незміщеними, обґрунтованими та ефективними.

Оцінка дисперсії похибок

       (6)

є незміщеною та обґрунтованою.

 

Коефіцієнт (індекс) множинної кореляції R використовується для оцінки тісноти спільного впливу факторів на залежну змінну:

.       (7)

Властивості коефіцієнта множинної кореляції R:

1. Коефіцієнт множинної кореляції приймає значення на відрізку , тобто .

Чим ближче R до одиниці, тим тісніше зв’язок між залежною y та  факторами x1, x2,…, xp.

2. При R=1 кореляційний зв’язок є лінійною функціональною залежністю.

3. При R=0 лінійний кореляційний зв’язок відсутній.

Щодо оцінки ступеня взаємозв’язку, можна керуватись аналогічними емпіричними правилами, як і для випадку ЛПР (лекція 3.1).

 

2. Оцінка значущості множинної регресії. Коефіцієнт детермінації

 

Оцінка значущості ЛМР.

 

Значущість рівня ЛМР у цілому оцінюється за допомогою F-критерія Фішера

       (8)

із зрівнянням його з табличним значенням

.       (9)

 

F-тест.

Якщо , то рівняння ЛМР признається статистично значущим на рівні значущості  (зазвичай, ).

Якщо , то рівняння ЛМР признається статистична незначущість ЛМР на рівні значущості .

Другий варіант F- тесту: якщо рівень значущості фактичного F- критерію , то рівняння ЛМР – статистичного значуще на рівні значущості .

          Якщо , то ЛМР – статистичного незначуще на рівні значущості .

 

          Оцінка значущості коефіцієнтів рівняння ЛМР.

 

Оцінка значущості коефіцієнтів рівняння ЛМР здійснюються за допомогою t-критерію Ст’юдента:

       (10)

із зрівнянням його з табличним значенням

,       (11)

де      - середньоквадратичне відхилення (стандартна похибка) коефіцієнт а регресії ;

 - оцінка середньоквадратичного відхилення похибок;

 - відповідний діагональний елемент матриці .

 

t-тест.

Якщо , то коефіцієнт  признається статистично значущим; якщо , то   статистично незначущий на рівні значущості .

Другий варіант (див. t-тест для ЛПР у лекції 3.1): при   статистично значущий (незначущий ) на рівні значущості .

 

Коефіцієнт (індекс) множинної детермінації R2

 

Для оцінки адекватності регресії моделі, мірою якості рівняння регресії використовують коефіцієнт детермінації, який визначається, як  і раніше, за формулою:

.       (12)

Нагадаємо, що R2 характеризує частку варіації залежної змінної, що обумовлена варіаціями факторів.

 

Властивості коефіцієнта множинної детермінації R2:

1. Коефіцієнт множинної детермінації приймає значення на відрізку , тобто .

Чим ближче R2 до одиниці, тим краще регресія апроксимує емпіричні дані.

2. Якщо R2=1, між змінними y та x1, x2,…, xp існує лінійна функціональна залежність.

3. Якщо R2=0, то варіація залежної змінної повністю обумовлена виливом випадкових та неврахованих факторів.

Для оцінки ступеня апроксимації емпіричних даних рівнянням ЛМР можна керуватись аналогічними емпіричними правилами, як і для випадку ЛПР (лекція 3.1).

Зауваження

Недоліком коефіцієнта множинної детермінації R2 являється те, що він, взагалі, збільшується при додаванні нових факторів, хоча це не обов’язково означає поліпшення якості регресійної моделі. Тому має сенс використовувати скоригований (адаптований, виправлений) коефіцієнт детермінації , який визначається за формулою:

.       (13)

На відміну від R2 скоригований коефіцієнт  може зменшуватись при введенні у модель нових факторів, які не чинять істотного впливу на залежну змінну.

 

3. Визначення довірчих інтервалів для функції регресії та її параметрів

 

Прогнозне значення  визначається за шляхом підстановки у рівняння регресії (4) відповідних значень факторів :

.       (14)

Довірчий інтервал прогнозу обчислюється за слідуючими формулами:

,       (15)

де      - умовне математичне сподівання залежної змінної в точці прогнозу;

 - оцінка стандартної похибки прогнозу, яка обчислюється за формулою  

;       (16)

           - матриця значень факторів;

           - вектор (матриця-стовпець) значень факторів для прогнозу.

 

          Довірчі інтервали для коефіцієнтів регресійної моделі:

, .       (17)

 

          Обчислення коефіцієнтів еластичності.

          Коефіцієнт еластичності  показує – на скільки відсотків (від середньої) змінюється у середньому  при зміненні тільки  на 1% та обчислюється за формулою:

, .       (18)

          Важливою економічною характеристикою моделі є сумарна еластичність:

.       (19)

          Сумарна еластичність показує на скільки відсотків (від середньої) змінюється у середньому  при зміненні всіх факторів на 1%.