Також може мати місце мультиколінеарність коли лінійна комбінація предикторів сильно корелює з іншою лінійною комбінацією предикторів. У цьому випадку знання значення першої групи предикторів багато говорить про значення другої групи предикторів.
Короткий огляд: мультиколінеарність це проблема через надмірну кореляцію між двома пояснювальними змінними в рамках прогнозної моделі.
Проблема мультиколінеарності полягає в тому впливає на точність оцінки коефіцієнтів регресії та може спричинити нестабільність оцінок. Це також може зробити значення p, які використовуються для визначення значущості коефіцієнтів регресії, неможливими для інтерпретації.
Для чого використовується множинна лінійна регресія? Побудова множинної лінійної регресійної моделі дозволяє кількісно визначити зв’язок між залежною змінною (y) і набором пояснювальних змінних (x).
Рішення ідеальної колінеарності полягає в тому змінити список регресорів. Недосконала колінеарність дуже відрізняється від досконалої колінеарності, незважаючи на схожість назв. Недосконала колінеарність виникає, коли два або більше регресорів сильно корельовані.
10.2 Коефіцієнт інфляції дисперсії (VIF) – Колінеарність Індекс визначається наступним чином VIFj=11−R2j≥1 V I F j = 1 1 − R j 2 ≥ 1 де R2j R j 2 є індексом відповідності моделі, яка має Xj як залежну змінну та інші регресори як незалежні змінні.