Контрольная работа: Построение регрессионной модели
|
Название: Построение регрессионной модели Раздел: Рефераты по экономико-математическому моделированию Тип: контрольная работа | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задание Таблица 1
Построить линейное регрессионное уравнение. 1. Построить поле корреляции и линию регрессии на одном графике. Вычислить: 2. коэффициент детерминации; 3. среднюю ошибку аппроксимации; 4. t-статистики; 5. доверительные интервалы. 6. Сделать выводы Построить показательную зависимость и повторить пункты 1–6. Сравнить построенные модели. Решение: Построим поле корреляции:
Рис. 1. Поле корреляции пенсии от прожиточного минимума По полю корреляции слабо прослеживается зависимость пенсии от прожиточного минимума. Рассчитаем параметры уравнения линейной парной регрессии. Для расчета параметров a и b уравнения линейной регрессии у = а + bx решим систему нормальных уравнений относительно а и b:
По исходным данным рассчитываем Sх, Sу, Sух, Sх2 , Sу2 . Таблица 2
Найдем дисперсию переменных:
Найдем параметры a и b уравнения линейной регрессии:
Уравнение регрессии:
Построим линию регрессии на рис. 1. С увеличением прожиточного минимума на 1 тыс. руб. пенсия увеличивается на 0,667 тыс. руб. Рассчитаем линейный коэффициент парной корреляции:
Т.к. коэффициент в интервале от 0,3 до 0,7 связь средняя, прямая. Определим коэффициент детерминации:
Т.е. вариация пенсий на 20,8% объясняется вариацией прожиточного минимума. Найдем среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации имеет значение меньше 30% – это говорит о среднем уровне надежности уравнения регрессии. Рассчитаем F-критерий:
Критическое значение распределения Фишера определяют либо по таблицам распределения Фишера, либо расчетным путем с использованием функции FРАСПОБР() табличного процессора Excel. Для уровня доверия 0,95, одного фактора и 12 значений: Fкр = F(0,05; 1; 10) = 4,964 Т.к. Fкр > Fфакт , то необходимо отклонить гипотезу о статистической значимости параметров уравнения. Т.е. использовать данную функцию для аппроксимации нельзя. Найдем стандартную ошибку остаточной компоненты по формуле:
Найдем средние квадратичные (стандартные) ошибки оценивания коэффициента b и свободного члена а уравнения регрессии:
Найдем t – критерий Стьюдента для обоих параметров:
Сравнивая значения t-статистики для каждого из коэффициентов линейной регрессии с табличным значением (α = 0,05; k = 12) tтабл = 2,228, можно сказать, что с вероятностью 95% коэффициент а надёжен, коэффициент b ненадёжен при данном уровне значимости. Для расчета доверительного интервала определяем предельную ошибку Δ:
Доверительные интервалы для коэффициентов регрессии: a – Δa < a < a + Δa 48,81 < a < 227,01 b – Δb < b < b + Δb – 0,249 < b < 1,583 Таким образом, полученные оценки коэффициента регрессии b не являются эффективными и состоятельными, а само уравнение Это обусловлено большой ошибкой уравнения регрессии. Для построения уравнения показательной кривой у = а · еb х линеризуем переменные логарифмированием обеих частей уравнения: ln у = ln а + b·x Y = A + b·x ГдеY = ln y, A = ln a. Для расчетов будем использовать данные таблицы 4. Таблица 4
Найдем дисперсию переменных:
Найдем параметров А и В регрессии составили: b =
Получено линейное уравнение:
Произведем потенцирование полученного уравнения и запишем его в обычной форме:
Тесноту связи оценим через индекс корреляции рху :
Связь средняя. Определим коэффициент детерминации:
Т.е. вариация результативного признака на 18,38% объясняется вариацией факторного признака. Найдем среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации имеет значение меньше 30%, т.е. надежность уравнения средняя. Рассчитаем F-критерий: (m – число параметров при переменной x)
Fкр = 4,964 Т.к. Fкр > Fфакт , т.е. необходимо отклонить гипотезу о статистической значимости параметров уравнения. Найдем стандартную ошибку остаточной компоненты по формуле:
Найдем средние квадратичные (стандартные) ошибки оценивания коэффициента b и свободного члена а уравнения регрессии:
Найдем t – критерий Стьюдента для обоих параметров:
Сравнивая значения t-статистики для каждого из коэффициентов линейной регрессии с табличным значением (α = 0,05; k = 12) tтабл = 2,228, можно сказать, что с вероятностью 95% коэффициент а надёжен, коэффициент b ненадёжен при данном уровне значимости. Для расчета доверительного интервала определяем предельную ошибку Δ:
Доверительные интервалы для коэффициентов регрессии: a – Δa < a < a + Δa 52,19 < a < 232,43 b – Δb < b < b + Δb – 0,01376 < b < 0,02004 Построим линию показательной зависимости на поле корреляции:
Рис. 2. Рассчитанные линии регрессий У линейной зависимости меньше стандартная ошибка и больше значение F-критерия. Поэтому из двух уравнений регрессий линейное более достоверно. Но низкая надежность коэффициента регрессии b, говорит, что результаты аппроксимации будут иметь достаточно низкую надежность (80%). |



=
= 



