Лекція №4 «мультиколінеарність»




Скачати 208.37 Kb.
НазваЛекція №4 «мультиколінеарність»
Дата конвертації19.07.2013
Розмір208.37 Kb.
ТипЛекція
mir.zavantag.com > Математика > Лекція
Лекція №4

«МУЛЬТИКОЛІНЕАРНІСТЬ»

(Поняття мультиколінеарності. Методи визначення мультиколінеарності та способи її усунення. Метод Ферара-Глобера. Метод головних компонент)
1. Поняття мультиколінеарності

Однією з чотирьох умов, які необхідні для оцінювання параметрів загальної лінійної моделі 1МНК, є умова , яка стосується матриці вихідних даних X. Ця матриця має розміри і повинна мати ранг m, тобто серед пояснювальних змінних моделі не повинно бути лінійно залежних. Проте оскільки економічні показники, які входять до економетричної моделі як пояснювальні змінні, на практиці дуже часто пов’язані між собою, то це може стати перешкодою для оцінювання параметрів моделі 1МНК та істотно вплинути на якість економетричного моделювання.

Тому в економетричних дослідженнях вельми важливо з’ясувати, чи існують між пояснювальними змінними взаємозв’язки, які називають мультиколінеарністю.

Мультиколінеарність означає існування тісної лінійної залежності, або кореляції, між двома чи більше пояснювальними змінними.

Вона негативно впливає на кількісні характеристики економетричної моделі або робить її побудову взагалі неможливою.

Так, мультиколінеарність пояснювальних змінних призводить до зміщення оцінок параметрів моделі, через що з їх допомогою не можна зробити коректні висновки про результати взаємозв’язку залежної і пояснювальних змінних. У крайньому разі, коли між пояснювальними змінними існує функціональний зв’язок, оцінити вплив цих змінних на залежну взагалі неможливо. Тоді для оцінювання параметрів моделі метод найменших квадратів не придатний, оскільки матриця буде виродженою.

Нехай зв’язок між пояснювальними змінними не функціональний, проте статистично істотний. Тоді попри те, що оцінити параметри методом найменших квадратів теоретично можливо, знайдена оцінка може призвести до таких помилкових значень параметрів, що сама модель стане беззмістовною.

Основні наслідки мультиколінеарності.

1. Падає точність оцінювання, яка виявляється так:

а) помилки деяких конкретних оцінок стають занадто великими;

б) ці помилки досить корельовані одна з одною;

в) дисперсії оцінок параметрів різко збільшуються.

2. Оцінки параметрів деяких змінних моделі можуть бути незначущими через наявність їх взаємозв’язку з іншими змінними, а не тому, що вони не впливають на залежну змінну. У такому разі множина вибіркових даних не дає змоги цей вплив виявити.

3. Оцінки параметрів стають досить чутливими до обсягів сукупності спостережень. Збільшення сукупності спостережень іноді може спричинитися до істотних змін в оцінках параметрів.

З огляду на перелічені наслідки мультиколінеарності при побудові економетричної моделі потрібно мати інформацію про те, що між пояснювальними змінними не існує мультиколінеарності.


^ 2. ознаки мультиколінеарност

1. Коли серед парних коефіцієнтів кореляції пояснювальних змінних є такі, рівень яких наближається або дорівнює множинному коефіцієнту кореляції, то це означає можливість існування мультиколінеарності. Інформацію про парну залежність може дати симетрична матриця коефіцієнтів парної кореляції або кореляції нульового порядку між пояснювальними змінними:

. (4.1)

Проте коли до моделі входять більш як дві пояснювальні змінні, то вивчення питання про мультиколінеарність не може обмежуватись інформацією, що її дає ця матриця. Явище мультиколінеарності в жодному разі не зводиться лише до існування парної кореляції між незалежними змінними.

Більш загальна перевірка передбачає знаходження визначника (детермі­нанта) матриці r, який називається детермінантом кореляції і позначається . Числові значення детермінанта кореляції задовольняють умову: .

2. Якщо = 0, то існує повна мультиколінеарність, а коли = 1, мультиколінеарність відсутня. чим ближче до нуля, тим певніше можна стверджувати, що між пояснювальними змінними існує мультиколінеарність. Незважаючи на те, що на числове значення впливає дисперсія пояснювальних змінних, цей показник можна вважати точковою мірою рівня мультиколі­неарності.

3. Якщо в економетричній моделі знайдено мале значення параметра при високому рівні частинного коефіцієнта детермінації і при цьому F-критерій істотно відрізняється від нуля, то це також свідчить про наявність мультиколінеарності.

4. Коли коефіцієнт частинної детермінації , який обчислено для регресійних залежностей між однією пояснювальною змінною та іншими, має значення, яке близьке до одиниці, то можна говорити про наявність мультиколінеарності.

5. Нехай при побудові економетричної моделі на основі покрокової регресії введення нової пояснювальної змінної істотно змінює оцінку параметрів моделі при незначному підвищенні (або зниженні) коефіцієнтів кореляції чи детермінації. тоді ця змінна перебуває, очевидно, у лінійній залежності від інших, які було введено до моделі раніше.

Усі ці ознаки мультиколінеарності мають один спільний недолік: ні одна з них чітко не розмежовує випадки, коли мультиколінеарність істотна і коли нею можна знехтувати.

^ 3. алгоритм феррара-глобер
Найповніше дослідити мультиколінеарність можна з допомогою алгоритму Феррара — Глобера. Цей алгоритм має три види статистичних критеріїв, згідно з якими перевіряється мультиколінеарність всього масиву незалежних змінних (- «хі» — квадрат); кожної незалежної змінної з рештою змінних (^ F-критерій); кожної пари незалежних змінних (t-критерій).

Усі ці критерії при порівнянні з їх критичними значеннями дають змогу робити конкретні висновки щодо наявності чи відсутності мультиколінеарності незалежних змінних.

Опишемо алгоритм Феррара — Глобера.

Крок 1. Стандартизація (нормалізація) змінних.

Позначимо вектори незалежних змінних економетричної моделі через . Елементи стандартизованих векторів обчислимо за формулою:

(4.2)

де — число спостережень ;

— число пояснювальних змінних, ;

— середнє арифметичне k-ї пояснювальної змінної;

— дисперсія k-ї пояснювальної змінної.

Крок 2. Знаходження кореляційної матриці

(4.3)

де — матриця стандартизованих незалежних (пояснювальних) змінних, — матриця, транспонована до матриці .

Крок 3. Визначення критерію («хі-квадрат»):

(4.4)

де — визначник кореляційної матриці r.

Значення цього критерію порівнюється з табличним при ступенях свободи і рівні значущості . Якщо то в масиві пояснювальних змінних існує мультиколінеарність.

Крок 4. Визначення оберненої матриці:

(4.5)

Крок 5. Обчислення F-критеріїв:

(4.6)

де — діагональні елементи матриці C. Фактичні значення критеріїв порівнюються з табличними при n – m і m – 1 ступенях свободи і рівні значущості . Якщо Fkфакт > Fтабл, то відповідна k-та незалежна змінна мультиколінеарна з іншими.

Коефіцієнт детермінації для кожної змінної

(4.7)

Крок 6. Знаходження частинних коефіцієнтів кореляції:

(4.8)

де — елемент матриці C, що міститься в k-му рядку і j-му стовпці; i — діагональні елементи матриці C.

Крок 7. Обчислення t-критеріїв:

(4.9)

Фактичні значення критеріїв порівнюються з табличними при ступенях свободи і рівні значущості . Якщо tkj(ф) > табл, то між незалежними змінними і існує мультиколінеарність.

Розглянемо застосування алгоритму Феррара — Глобера для розв’язу­вання конкретної задачі.

Приклад. На середньомісячну заробітну плату впливає ряд чинників. Вирізнимо серед них продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили. Щоб побудувати економетричну модель заробітної плати від згаданих чинників згідно з методом найменших квадратів, потрібно переконатися, що продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили як незалежні змінні моделі — не мультиколеніарні.

Вихідні дані наведені в табл. 4.1.

Таблиця 4.1-

Номер
цеху

Продуктивність праці, людино-днів

Фондомісткість,
млн. грн.

Коефіцієнт плинності
робочої сили, %

1

32

0,89

19,5

2

29

0,43

15,6

3

30

0,70

13,5

4

31

0,61

9,5

5

25

0,51

23,5

6

34

0,51

12,5

7

29

0,65

17,5

8

24

0,43

14,5

9

20

0,51

14,5

10

33

0,92

7,5

Дослідити наведені чинники на наявність мультиколінеарності.

Розв’язання.

Крок 1. Нормалізація змінних.

Позначимо вектори незалежних змінних — продуктивності праці, фондомісткості, коефіцієнтів плинності робочої сили — через . Елементи стандартизованих векторів обчислимо за формулою:



де n — кількість спостережень, = 10; m — число незалежних змінних, m = 3; — середнє арифметичне значення вектора ; — дисперсія змінної .

Із формули бачимо, що спочатку потрібно обчислити середні арифметичні для кожної пояснювальної змінної:







Усі розрахункові дані для стандартизації змінних згідно з поданими співвідношеннями наведено в табл. 4.2.

Таблиця 4.2 –



















3,3

0,004

-3,4

10,89

0,000016

11,56

0,2487

0,0091

-0,2518

0,3

-0,156

1,6

0,09

0,024336

2,56

0,0226

-0,3531

0,1185

1,6

0,114

-0,4

1,89

0,012995

0,16

0,0980

0,2580

-0,0296

2,3

0,024

-4,4

5,29

0,000576

19,36

0,1733

0,0543

-0,3258

-3,7

-0,676

9,6

13,89

0,005776

92,16

-0,2788

-0,1720

0,7108

5,3

-0,078

-1,4

28,09

0,005776

1,96

0,3994

-0,1720

-0,1037

0,3

0,064

-3,6

0,09

0,004096

12,96

0,0226

0,1448

0,2666

-4,7

-0,156

0,6

22,09

0,024336

0,35

-0,3541

-0,3531

0,0444

-8,7

-0,076

0,6

75,89

0,005778

0,35

-0,6556

-0,1720

0,0444

4,3

0,334

-6,4

14,49

0,111555

40,95

0,3240

0,7559

-0,4739

Всього







176,1

0,19524

182,4










Дисперсії кожної незалежної змінної мають такі значення:







Тоді знаменник для стандартизації кожної незалежної змінної буде такий:

:

:

:

Матриця стандартизованих змінних подається у вигляді:

.

Крок 2. Знаходження кореляційної матриці:



де — матриця, транспонована до .

Ця матриця симетрична і має розмір 3 х 3.

Для даної задачі



Кожний елемент цієї матриці характеризує тісноту зв’язку однієї незалежної змінної з іншою. Оскільки діагональні елементи характеризують тісноту зв’язку кожної незалежної з цією самою змінною, то вони дорівнюють одиниці. Зауважимо, що при знаходженні добутку матриць за рахунок зміщеності коефіцієнтів парної кореляції числові значення діагональних елементів можуть наближатись до одиниці. Якщо це так, то вони заміняються одиницями, а інші значення матриці r збільшуються на величину, що визначається як різниця між одиницею і діагональним елементом.

Інші елементи матриці r дорівнюють:







тобто вони є парними коефіцієнтами кореляції між пояснювальними змінними. Користуючись цими коефіцієнтами, можна зробити висновок, що між змінними існує зв’язок. Але чи можна стверджувати, що цей зв’язок є виявленням мультиколінеарності, а через це негативно впливатиме на оцінку економетричної моделі?

Щоб відповісти на це запитання, потрібно ще раз звернутися до алгоритму Феррара — Глобера і знайти статистичні критерії оцінки мультиколінеарності.

Крок 3. Обчислимо детермінант кореляційної матриці r і критерій :

а)

б)

При ступені свободи і рівні значущості  = 0,01 критерій табл = 11,34. оскільки факт < табл, доходимо висновку, що в масиві змінних не існує мультиколінеарності.

Крок 4. Знайдемо матрицю, обернену до матриці r:




Крок 5. Використовуючи діагональні елементи матриці C, обчислимо F-критерії:







Для рівня значущості = 0,05 і ступенів свободи  = 7 і  = 2 критичне (табличне) значення критерію F = 4,74.

Оскільки:

F1факт < Fтабл;

F2факт < Fтабл;

F3факт < Fтабл,

то ні одна з незалежних змінних не мультиколінеарна з двома іншими.

Щоб визначити наявність попарної мультиколінеарності, продовжимо дослідження і перейдемо до кроку 6.

Крок 6. Обчислимо частинні коефіцієнти кореляції, скориставшись елементами матриці C:







Частинні коефіцієнти кореляції характеризують тісноту зв’язку між двома змінними за умови, що третя не впливає на цей зв’язок.

Порівнявши частинні коефіцієнти кореляції з парними, які було наведено раніше, можна помітити, що частинні коефіцієнти значно менші за парні. Це ще раз показує, що на підставі парних коефіцієнтів кореляції не можна зробити висновків про наявність мультиколінеарності чи її відсутність.

Крок 7. Визначимо t-критерій на основі частинних коефіцієнтів кореляції.







Табличне значення t-критерію при  7 ступенях свободи і рівні значущості  = 0,05 дорівнює 1,69. Усі числові значення t-критеріїв, знайдених для кожної пари змінних, менші за їх табличні значення. Звідси робимо висновок, що всі пари незалежних змінних не є мультиколінеарними.

Отже, незважаючи на те, що між пояснювальними змінними досліджуваної моделі існує лінійна залежність, це не мультиколінеарність, тобто негативного впливу на кількісні оцінки параметрів економетричної моделі, не буде.

Якщо ^ F-критерій більший за табличне значення, тобто коли k-та змінна залежить від усіх інших у масиві, то необхідно вирішувати питання про її вилучення з переліку змінних.

Якщо — критерій більший за табличний, то ці дві змінні ( і ) тісно пов’язані одною з одною. Звідси, аналізуючи рівень обох видів критеріїв і , можна зробити обґрунтований висновок про те, яку зі змінних необхідно вилучити з дослідження або замінити іншою. Проте заміна масиву незалежних змінних завжди має узгоджуватись з економічною доцільністю, що випливає з мети дослідження.

Найпростіше позбутися мультиколінеарності в економетричній моделі можна, відкинувши одну зі змінних мультиколінеарної пари. Але на практиці вилучення якогось чинника часто суперечить логіці економічних зв’язків. Тоді можна перетворити певним чином пояснювальні змінні моделі:

а) взяти відхилення від середньої;

б) замість абсолютних значень взяти відносні;

в) стандартизувати пояснювальні змінні

і т. iн.

За наявності мультиколінеарності змінних потрібно звертати увагу й на специфікацію моделі. Іноді заміна однієї функції іншою, якщо це не суперечить апріорній інформації, дає змогу уникнути явища мультиколінеарності.

Коли жодний з розглянутих способів не дає змоги позбутися мультиколінеарності, то параметри моделі слід оцінювати за методом головних компонентів.

















- Методи звільнення від мультиколінеарності















4. метод головних компонентів
Цей метод призначений для оцінювання моделей великого розміру, а також для оцінки параметрів моделі, якщо до неї входять мультиколіне­арні змінні.

Існують різні модифікації методу головних компонентів, які різняться між собою залежно від того, що береться за основу при визначенні ортогональних змінних — коваріаційна чи кореляційна матриця незалежних змінних.

Алгоритм головних компонентів

Крок 1. Нормалізація всіх пояснювальних змінних:



Крок 2. Обчислення кореляційної матриці



Крок 3. Знаходження характеристичних чисел матриці r з рівняння



де E — одинична матриця розміром  m.

Крок 4. Власні значення упорядковуються за абсолютним рівнем вкладу кожного головного компонента до загальної дисперсії.

Крок 5. Обчислення власних векторів розв’язуванням системи рівнянь



за таких умов:



Крок 6. Знаходження головних компонентів — векторів



Головні компоненти мають задовольняти умови:

;

;


Крок 7. Визначення параметрів моделі :



Крок 8. Знаходження параметрів моделі :



запитання до лекції №2

1. З яких елементів складається математична модель?

2. Назвіть типи математичних моделей. Чим вони різняться між собою?

3. До якого типу математичних моделей належить економетрична модель?

4. Які особливості має економетрична модель?
рекомендовані теми рефератів до лекції №2

1.

Схожі:

Лекція №4 «мультиколінеарність» iconЛекція Лекція Природозберігаючі технології по захисту водного басейну (3 год.)

Лекція №4 «мультиколінеарність» iconЦивільний процес. Лекція
Психолого-педагогічні аспекти профілактики насильства в молодіжному середовищі. Лекція
Лекція №4 «мультиколінеарність» iconЛекція 7 8
Лекція 7 Українська революція І пошук її зовнішньополітичних орієнтацій. Початки дипломатичної діяльності унр. (4 год.)
Лекція №4 «мультиколінеарність» iconЛекція 3
Лекція: Поняття предмета права промислової власності, коло та характеристика однорідних суспільних відносин
Лекція №4 «мультиколінеарність» iconЛекція Об’єкт, предмет І завдання дисципліни. 3
Лекція Механізм функціонування соціально-трудових відносин як організаційної системи. 35
Лекція №4 «мультиколінеарність» iconЛекція ІІ. Участь України у роботі ООН
Лекція І. Відстоювання Україною національних інтересів після розпаду СРСР на міжнародній арені
Лекція №4 «мультиколінеарність» iconЛекція №1. Київська Русь (2 год.)
Лекція №3. Україна в другій половині XIV — середині XVII ст. Утворення козацтва (2 год.)
Лекція №4 «мультиколінеарність» iconЛекція 1
...
Лекція №4 «мультиколінеарність» iconЛекція 1 Фінансова діяльність держави § Фінанси як економічна І юридична категорія
Лекція 4 Правові засади фінансової діяльності органів державної влади та органів місцевого самоврядування
Лекція №4 «мультиколінеарність» iconЛекція №1
Лекція № Поняття культури. Античність – джерело європейської культури (2 год.)
Додайте кнопку на своєму сайті:
Школьные материалы


База даних захищена авторським правом © 2013
звернутися до адміністрації
mir.zavantag.com
Головна сторінка