Задать вопрос
Вы можете уточнить интересующие вопросы любым удобным для Вас способом
VK
Telegram
Mail
WhatsApp

Множественная регрессия временных рядов. Gretl. Коррекция автокорреляции, процедура Кохрейна-Оркатта (Cochrane-Orcutt).

Статья с подробным разбором.
Получение исходных данных
Корреляционный анализ
Оценка линейной логарифмической модели по МНК
Проверка нормальности распределения остатков
Проверка на гетероскедастичность (тест Вайта, тест Бройша-Пэгана (Breusch-Pagan)
Проверка автокорреляции (тест Бройша-Годфри)
Идентификация временных рядов (коррелограмма ACF, PACF)
Коррекция автокорреляции. Процедура Кохрейна-Оркатта (Cochrane-Orcutt).
Окончательная модель. Интерпретация результатов.
Видео
Для анализа выбраны данные временных рядов по экономике Швейцарии с 2000 года по 2020 год. Источник данных: https://data.worldbank.org/country/switzerland?view=chart
Зависимая переменная:
Q – валовой внутренний продукт в текущих ценах, долл. США.
Независимые (факторные) переменные:
К – инвестиции в основной капитал (капитал), долл. США;
L – оплата труда сотрудников (затраты на труд), долл. США.
Задачей является построение функции Кобба-Дугласа:
Q = A·Lα·Кβ,
А – технологический коэффициент; а, β – коэффициенты эластичности по труду и капиталу.
Экспорт данных из файла Excel
Интерпретируем данные как временные ряды, выбираем годичные данные с начальным периодом 2000 год.
Данные: временные ряды.
Так как функция Кобба-Дугласа является степенной, то для её построения воспользуемся линейной логарифмической функцией вида:
Ln(Q) = b[1] + b[2]*Ln(K) + b[3]*Ln(L)
Для этого нам нужны логарифмы переменных Q, K, L.
Выделяем данные переменные правой кнопкой мыши, далее выбираем в главном меню: добавить, а из выпадающего списка: логарифмы выделенных переменных.
Добавление логарифмических переменных
Строим корреляционную матрицу из переменных Ln(Q), Ln(K), Ln(L). Павой кнопкой мыши выделяем переменные и в появившемся меню выбираем корреляционная матрица.
Построение корреляционной матрицы
Получим:
Корреляционная матрица
Объясняемая переменная Ln(Q) имеет тесную связь с факторными переменными Ln(K), Ln(L), так как соответствующие парные коэффициенты корреляции составляют 0,9774 и 0,9833 соответственно. Значения парных коэффициентов корреляции близки к единице – связь весьма тесная. Отметим высокую зависимость между факторными переменными Ln(K) и Ln(L), соответствующий коэффициент корреляции равен 0,9461. Это достаточно высокое значение, данная высокая корреляция может быть причиной мультиколлинеарности в искомой модели. Однако коэффициент корреляции между факторными переменными ниже коэффициентов корреляции между каждой из факторных переменных и зависимой. Поэтому будем считать влияние мультиколлинеарности не существенным.
Построим графики временных рядов Ln(K), Ln(L), Ln(Q). Выделяем правой кнопкой мыши данные переменные и выбираем из списка: График временного ряда
Построение графиков временных рядов
Из предлагаемых вариантов выбираем: отобразить на одном графики. Получаем графики временных рядов.
График временных рядов
Все графики имеют тенденцию плавного возрастающего тренда. Скорость роста логарифмов рассматриваемых переменных примерно одинаковая.
Построим модель множественной линейной регрессии, в которой зависимая переменная Ln(Q), а независимые (факторные) переменные Ln(K), Ln(L). Воспользуемся МНК (метод наименьших квадратов). В главном меню выбираем: модель – метод наименьших квадратов.
Выбор метода оценивания
Далее заполняем диалоговое окно спецификации модели.
Спецификация модели МНК
Получаем оценку линейной логарифмической модели по методу наименьших квадратов.
Исходная модель МНК
Модель запишется в виде:
^l_Q = -24,5 + 1,10*l_K + 1,01*l_L (1)
(2,19) (0,194) (0,145)

T = 21, R-квадрат = 0,988
(в скобках указаны стандартные ошибки)
Оценим значимость модели в целом. Нулевая гипотеза: R-квадрат равен нулю. Альтернативная гипотеза: R-квадрат отличен от нуля. Вероятность принятия нулевой гипотезы показывает P-значение (F), оно равно 5,14*10-18. Это значение намного меньше 0,05, следовательно, при 5% уровне значимости можем отвергнуть нулевую гипотезу в пользу альтернативной. Модель регрессии можем принять значимой в целом. Действительно значение коэффициента детерминации составляет 0,988. Это значит, что полученная модель на 98,8% объясняет изменение результативного признака Ln(Q).
Оценим значимость коэффициентов регрессии. Нулевая гипотеза: соответствующий коэффициент регрессии равен нулю. Альтернативная гипотеза: коэффициент регрессии отличен от нуля. Вероятности принятия нулевых гипотез показывает p-значение каждого из коэффициентов. Для константы оно равно 1,53*10-9, для Ln(K) p-значение равно 2,38*10-5, а для Ln(L) p-значение равно 1,55*10-6. Все p-значения меньше 0,05, следовательно, при 5% уровне значимости принимаем альтернативную гипотезу для каждого коэффициента регрессии. Каждый коэффициент регрессии является статистически значимым.
Статистика Дарбина—Уотсона меньше единицы, следовательно, в модели предполагаем автокорреляцию остатков случайных отклонений.
Проверим выполнение предпосылок Гаусса-Маркова для МНК.
Проверим подчинены ли остатки модели нормальному распределению. В окне модели выбираем: тесты – нормальность остатков.
Выбор теста на нормальность остатков
Получим:
Тест на нормальность остатков для модели (1)
Нулевая гипотеза теста: остатки имеют нормальное распределение. Альтернативная гипотеза: остатки не подчиняются нормальному закону распределения. Вероятность принятия нулевой гипотезы теста составляет 0,7264, что больше 0,05. Следовательно, при 5% уровне значимости принимаем нулевую гипотезу. Остатки имеют нормальное распределение.
Проверим гомоскедастичность остатков. Для этого проведём тест на наличие гетероскедастичности. Воспользуемся тестом Уайта. В окне модели выбираем: тесты – гетероскедастичность – тест Уайта.
Выбор теста Уайта
Получаем результаты теста.
Тест Уайта
Нулевая гипотеза теста: гетероскедастичность отсутствует, остатки модели гомоскедастичны. Альтернативная гипотеза: гетероскедастичность есть. Вероятность принятия нулевой гипотезы теста составляет 0,436, что больше 0,05. При 5% уровне значимости принимаем нулевую гипотезу, т. е. гетероскедостичности в модели нет, остатки – гомоскедастичны.
Проведём ещё один тест на наличие гетероскедастичности – тест Бройша-Пэгана (Breusch-Pagan).
Тест Бройша-Пэгана
Нулевая гипотеза теста Бройша-Пэгана (Breusch-Pagan): гетероскедастичность отсутствует, остатки модели гомоскедастичны. Альтернативная гипотеза теста: гетероскедастичность есть. Вероятность принятия нулевой гипотезы теста Бройша-Пэгана (Breusch-Pagan) составляет 0,311, что больше 0,05. При 5% уровне значимости принимаем нулевую гипотезу. Получили тот же результат, что и при проведении теста Уайта.
Оценим автокорреляцию в полученной модели. Предварительно, по значению статистики Дарбина-Уотсона мы установили наличие автокорреляции. Нам необходимо установить её порядок. Воспользуемся тестом Бройша-Годфри. В окне модели выбираем: тесты – автокорреляция. Предварительно задаём порядок лага 3. Т. е. будем оценивать автокорреляцию до 3-го лага.
Выбор теста на автокорреляцию
Получим результаты теста.
Тест Бройша-Годфри
Можем отметить значимость коэффициента при переменной uhat_1 (коэффициент автокорреляции 1-го порядка), так как p-значение для него равно 0,0104, что меньше 0,05. И при 5% уровне значимости можем принять альтернативную гипотезу о значимости коэффициента. Для 2-го и 3-го порядков p-значения выше 0,05. Значит они не являются значимыми. Все статистики тестов: LMF, TR^2, Ljung-Box Q' подтверждают альтернативную гипотезу теста – наличие в модели автокорреляции, так как для всех значения меньше 0,05. Значит в модели (1) присутствует автокорреляция и она является авторегрессией первого порядка.
Полученную модель регрессии (1) не можем признать удачной, так как в ней не выполняется условие отсутствия автокорреляции. Отметим, что автокорреляция как правило характерна для моделей временных рядов. Разработано множество способов устранения её. Мы в данной работе воспользуемся процедурой Кохрейна-Оркатта (Cochrane-Orcutt). Данная процедура хорошо подходит для рядов авторегрессии 1-го порядка и моделей, остатки которых имеют нормальное распределение. Это как раз наш случай.
Идентифицируем рассматриваемые ряды с помощью коррелограммы. Строим для переменной Ln(Q). Выделяем данную переменную, в главном меню выбираем: переменная – коррелограмма. Максимальный лаг берём 4.
Построение Коррелограммы
Получим кореелограмму для временного ряда Ln(Q). Аналогично строим коррелограммы для временных рядов Ln(K), Ln(L).
Коррелограмма Ln(Q)
Коррелограмма Ln(K)
Коррелограмма Ln(L)
Для идентификации временного ряда по коррелограмме воспользуемся представленной ниже таблицей. Данные ряды являются рядами AR(1) (авторегрессии первого порядка), так как автокорреляционная функция ACF убывает по экспоненте, а частная автокорреляционная функция PACF имеет только один выраженный 1-ый лаг, для остальных лагов её значение близко к нулю.
Таблица оценки коррелограммы
Сохраняем остатки модели (1). В меню модели выбираем: сохранить – остатки.
Сохранение остатков модели
Далее сохраняем первый лаг остатков. Выделяем переменную uhat1, в главном меню выбираем: добавить – лаги для выделенных переменных. Количество лагов выбираем 1.
Сохранение первого лага остатков
Получаем переменную первого лага остатков uhat1_1.
Процедура Кохрейна-Оркатта (Cochrane-Orcutt) начинается с оценки коэффициента регрессии без константы между uhat1 и uhat1_1. Строим по МНК данную модель без константы.
Построение авторегрессия без константы
Получим модель:
Модель авторегрессии без константы
Коэффициент регрессии в ней ρ = 0.658366
Далее согласно методу пересчитываем новые переменные модели по формулам:
Ln(Q)*t = Ln(Q)t – ρ* Ln(Q)t-1;
Ln(K)*t = Ln(K)t – ρ* Ln(K)t-1;
Ln(L)*t = Ln(L)t – ρ* Ln(L)t-1.
По новым переменным строится следующая модель:
Ln(Q)*t =   b[1] + b[2]* Ln(K)*t + b[3]* Ln(L)*t
В которой оценивается так же коэффициент авторегрессии ρ.
Процедура продолжается до тех пор, пока не будет выполнено условие:
t+1 - ρt|<α, где α – заданное приближение.
Но нам не надо делать множество этих итераций с преобразованием переменных и вычислением нового коэффициента авторегрессии, так как в программе Gretl эта процедура встроена и делается автоматически. Для её выполнения в главном меню выбираем: модель – объединённые временные ряды – AR ошибки (GLS) – AR(1)
Выбор процедуры Кохрейна-Оркатта
Заполняем диалоговое окно:
Диалоговое окно процедуры Кохрейна-Оркатта
Получим модель:
Окончательная модель
Статистика Дарбина-Уотсона равно 1,967, значение очень близко к 2. Значит автокорреляции нет в модели. Цель достигнута.
Оценим значимость модели в целом. Нулевая гипотеза: R-квадрат равен нулю. Альтернативная гипотеза: R-квадрат отличен от нля. Вероятность принятия нулевой гипотезы показывает P-значение (F), оно равно 4,46*10-10. Это значение намного меньше 0,05, следовательно, при 5% уровне значимости можем отвергнуть нулевую гипотезу в пользу альтернативной. Модель регрессии можем принять значимой в целом. Значение коэффициента детерминации составляет 0,992. Это значит, что полученная модель на 99,2% объясняет изменение результативного признака Ln(Q).
Оценим значимость коэффициентов регрессии. Нулевая гипотеза: соответствующий коэффициент регрессии равен нулю. Альтернативная гипотеза: коэффициент регрессии отличен от нуля. Вероятности принятия нулевых гипотез показывает p-значение каждого из коэффициентов. Для константы оно равно 6,68*10-6, для Ln(K) p-значение равно 1,4*10-5, а для Ln(L) p-значение равно 1,6*10-5. Все p-значения меньше 0,05, следовательно, при 5% уровне значимости принимаем альтернативную гипотезу для каждого коэффициента регрессии. Каждый коэффициент регрессии является статистически значимым.
Проверим подчинены ли остатки модели нормальному распределению.
Нормальность остатков окончательной модели
Нулевая гипотеза теста: остатки имеют нормальное распределение. Альтернативная гипотеза: остатки не подчиняются нормальному закону распределения. Вероятность принятия нулевой гипотезы теста составляет 0,9188, что больше 0,05. Следовательно, при 5% уровне значимости принимаем нулевую гипотезу. Остатки имеют нормальное распределение.
Построим график наблюдаемых и расчётных значений модели. В окне модели (3) выбираем: графики – график наблюдаемых и расчётных значений – наблюдаемые от расчётных
Построение графика наблюдаемых и расчётных значений
Получаем график:
График наблюдаемых и расчётных значений
По графику видно, что наблюдаемые значения близки к значению прогнозных, все точки располагаются вдоль прямой линии, существенных отклонений (выбросов) нет. Следовательно, модель адекватна исходным данным. Можем её признать удовлетворительной.
Преобразуем линейную логарифмическую функцию в степенную:
Ln(Q) = -23,3 + 1,07*Ln(K) + 0,991*Ln(L)
Q = e-23,3 + 1,07*Ln(K) + 0,991*Ln(L)
Q = e-23,3K 1.07 L 0.991
Степени в данной функции являются коэффициентами эластичности. При возрастании величины капитала на 1% выпуск возрастёт на 1,07%, а при возрастании затрат труда на 1% выпуск возрастёт на 0,991 %.
Заявка на услуги
Укажите наиболее удобный для ВАС способ связи
и с Вами свяжутся в ближайшее время
Загрузить свой файл
Нажимая на кнопку, Вы соглашаетесь на обработку персональных данных в соответствии с Условиями.
Made on
Tilda