Реферат: Взаимосвязи экономических перемененых

Название: Взаимосвязи экономических перемененых
Раздел: Рефераты по экономической теории
Тип: реферат

Взаимосвязи эк перемен-х.

С того вр-ни как эк-ка стала самост наукой, исслед-ли пытаются дать предст-ия о возм-ых путях разв-ия эк-ки, предвидеть буд знач эк пок-лей, найти инст-ты, позволяющие изм-ть ситуацию в желат-м напр-ии и спрогнозир-ть ее развитие.

Но разл эк школы предлаг-т разные, а зачастую противопол-е методы решения этих задач. Пол-ки или управ-ие выбир-т 1 из предлаг-х методов решений. В рез-теполуч-т какой-то эффект. Плох он или хорош и м.б. дьбиться лучшего рез-та проверить затруд-но, т.к. эк ситуация никогда не повт-ся точно, т.е. нет возм-ти применить 2 разные стратегии при одних и тех же усл-ях и сравнить конеч рез-ты.

Поэтому 1-й из центр задач эконометр анализа яв-ся предсказ-ие или прогнозир-ие развития 1 и то1 же ситуации при создании тех или иных усл-ий.

Поведение люб эк пок-ля зависит от мно-ва фак-ров. Все их учесть реально невоз-но, но в этом и не возн-т необ-ти. Обычно только огран кол-во фак-ров возд-т на исслед-й эк пок-ль. Доля влияния ост-х незнач-на.

Введение в модель огрнан кол-ва ф-ров реально доминир-х в эк процессе яв-ся серьез-й предпосылкой для качест анализа прогнозир-я и упр-ия ситуацией.

Эк теория выявила мно-во устойч завис-тей. Нап-р хорошо изучена зав-ть спроса или потр-ия от ур-ня дохода и цен на товары; зав-ть м/у безраб-й и инфл-ей…

Люб эк пол-ка закл-ся в регул-ии эк перем-х и д базир-ся на знании того как эти перем-ые связаны с др ключевыми для принимаемого решения политиком или предприн-лем.

Пр-р: Нельзя непоср-но регул-ть темп инфл-ии, но на нее м возд-ть ср-ми фискальной и монетар пол-ки. Поэтому прежде всего изуч-ся взаимосвязь м/у предл-ем дененг и ур-нем цен.

Но в реал ситуации даже устоявшиеся зав-ти м прояв-ся по-разному. Еще более слож задачей яв-ся анализ малоизуч и вновь возн-их нестаб-х завис-тей в эк-ке. Именно для них наиб-ее актуально построение эконометр моделей. Их невоз-но строить, проверять и совершен-ть без стать анализа реал эмпир данных. Но сам по себе стат анализ не вскрывает ситуации, возн-ей в эк-ке, он дает только соот-ие не показ-ыя в силу каких причин 1 перем-ая влияет на др.

Решение этой задачи яв-ся рез-том качест анализа получ-х соот-ий, кот-ый д сопровож-ся либо предшест-ть стат анализу.

В естест науках иссл-ли имеют дело со строго устан-мися зав-тями, когда опр знач-ю 1-й перем-й соот-т вполне опр знач-е др y=f(x). В бол-ве эк завис-ях такой взаимосвязи нет. Пр-р: нет строгой зав-ти м/у ур-нем дохода и потр-ия. Это связано со сно-вом причин. В част-ти с тем, что при анализе не учит-ся целый ряд р ф-ров, влияющих на переем-ые.

Кроме того влияние м.б. не прямым, а опосред-м. В треьих нек-ые влияния оказ-ся просто случ-ми, поэтому в эк-ке гов-т не о функц-х, а о коррел-х или стат завис-тях.

Корреляционная зависимость.

Стат наз-ся зав-ть , пр кот-й изм-ие 1-й из величин влечет изм-ие распред-ия др вел-ны. В част-ти стат зав-ть, прояв-ся в том, что при изм-ии 1-й вел-ны, изм-ся матем ожидание (ср знач) др вел-ны, наз-ся корреляц-м .

Поэтому сущность коррел анализа м.б. продемонстр-на на 2-х вар-тах взаимосвязи м/у перем-ми.

I ). Предпол-м, что мы рассм-ем поведение 2-х перем-х У и Х, кот-ые яв-ся равноценными в том смысле, что среди них нельзя выделить первичную (независ) и вторичную (завис) перем-ую. Нап-р: спрос на товар и его цена. При иссл-ии силы зав-ти м/у такими перем-ми обращ-ся к коррел анализу, основ-й мерой в кот-м яв-ся коэф-т выбороч коррел-ии -1≤rxy≤1.

Вполне вер-но, что связь в этих случаях м не носить направ хар-ра, а м показ-ть и одинак направ-ть, когда рост 1-й перем-й сопр-ся ростом знач-я др перем-й или наоборот.

II ). Когда мы м выделить так назыв-ю объясняющ (независ) перем-ю и объясняемую (завис). В этом случае изм-ие 1-й из них яв-ся причиной для изм-ия 2-й, но такая зав-ть не яв-ся одннознач. Пр-р: выдел-ся неск-ко семей с одинак составом ее членов и одинак ур-нем дохода Х. Ур-нь потр-ия в этих семях м.б. разным у1,у2…ук., т.е каждому значению Х соот-т нек-ое случ распред-е У, т.е. У – яв-ся случ вел-ной (СВ).

Анализ-ся как в среднем объяняющ перем-я Х влияет на знач-ие объясняемой перем-й У.

М(у/х)=f(х). М – мат ожидание. m=1. Такое выраж-е наз-ся ф-ией регр-ии у на х.

Если мы рассм-м пару пок-лей Х и У, то речь идет о парной регрессии .

Если мы рассм-м ф-ию, в кот-й поведение У зав-т от нек-го мно-ва фак-в М(У/х1,х2…х m )= f ( x 1,x2… xm ), то мы имеем дело с множест регр-ей.

Для отражения того факта, что реал знач-я завис перем-й не всегда совпадают с ее усл мат ожиданием, эта зав-ть доп-ся нек-м слогаемым, являющ-ся случ вел-ной, что указ-т а стахостич (стат) суть этой зав-ти.

У=М(У/х)+ε

У=М(У/х1,х2…хn)+ε

В таком виде записи, соот-ия наз-ся регрессионными урав-ми лин регресс моделями.

Осн причинами включ-ия в модель случ ф-ра (откл-ия) яв-ся:

1). Невключ-е в модель всех объясняющ перем-ых. Любая модель – вседа упрощ-е реал ситуации и поэтому мы не м однозн-но гов-ть о знач-ях объясняемой перем-й в этих ситуациях.

2). Неправ-й выбор функц формы модели , что зачастую возн-т в усл-ях слабой изучен-ти эк процесса.

III ). Агрегир-ие перем-ых.

Во многих моделях исп-ся зав-ти м/у какими-то фак-ми, кот-ые сами предс-т слож комб-ии др более простых фак-ров. Изм-ие этих простых фак-ров м оказать влияние на поведение обопщенных пок-лей, но мы в модели этого не учтем. Пр-р: сов спрос и сов предл.

IV ). Ошибки изм-ий , кот-ые отраж-ся на несоответ-тт модел знач-й эмпир данным (з/п в конверте).

V ). Огранич-ть стат данных.

Мы строим лин модель, являющ-ся непрерыв-й, но для ее постр-ия исп-ем огран выборку из массива ген сов-ти данных, что наклад-т огран-ия на соот-ие модели эмпир данным.

VI ). Непредказ-ть чел фак-ра .

Эта причина м испортить люб самую качест модель.

Т.о. случ слогаемые в модели отраж-т влияние мно-ва субъек-ых ф-ров. И решение задачи постр-ия модели, соот-ей эмпир данным и целям иссл-ия яв-ся слож многоступен-й процессом, кот-ый м разбить на 3 этапа:

1). Выбор формы урав-ия регр-ии.

2). Опр-ие парам-в выбранного ур-ия.

3). Анализ кач-ва постр-го ур-ия и проверка его соотв-ия (адекват-ти) эмпир данным, на основе кот-ыхвозм-но соверш-ие ур-ий.

Выбор формы зав-ти – спецификация ур-ия .

В лучае парной регр-ии он осущ-ся с помощью постр-ия коррел поля.

График

В осях коор-т y=M(У/x)+ε для зав-ти наносятся точки выборки х1у1; х2у2; х3у3…хiyi…xnyn. (xiyi) i=1;n.

Получили коррел поле или диаграмму рисования.

Возм-ны разл ситуации.

3 Графика

На 1) связь м/у х и у близка к лин-й.

На 2) ее нельзя предст-ть как лин зав-ть Скорее всего это парабола.

На 3) явная зав-ть м/у х и у отсут-т. Какую бы зав-ть мы не выбрали рез-ты моделир-ия б неуд-ны.

В случае множест регр-ии У=М(У/х1,х2…хn)+ε

Задача опр-ия вида зав-ти услож-ся.

Парная линейная регрессия.

Если ф-ия регр-ии линейна, то гов-т о лин регр-ии, кот-ая соот-т требованию линей-ти отн-но ее парам-ра.

В таких моделях теорет ур-ие регр-ии У=М(У/х)+ε =β0+β1х+ε, коэф-ты β0 и β1 наз-ся теоретич коэф-ми , ε – случ теорет откл-ие.

Для любой выбороч пары х и yi, yi= β0+β1хi+ε, т.е. индив знач-е у предст-ны в виде суммы 2-х компонентов: систем-ой β0+β1хi и случайной εi.

В соот-ии с общей генер сов-тью всевозм-х сочетаний у и х, модель запис-ся в форме У= β0+β1Х+ε и задача построения урав-ия сост-т в том, чтобы по имеющ-ся выборке огран-го объема (хi;yi) i=1,n получить эмпир ур-ие регр-ии = b 0+ b 1 x , где b0 и b1 – оценки для коэф-тов теорет ур-ия.

Тогда по данным выборки ỹi=b0+b1xi, получ-е знач-е для у б.отл-ся от теорет-го на нек-ую вел-ну, харак-ую точность оценки эмпир урав-ем теорет знач-ия завис-й переем-ой yi - i = ei . => в общем виде мы получ-м yi=b0+b1xi+ei.

Но т.к. оценки для коэф-та β0→b0 и β1→b1 расч-ся по конкр-м выборкам, то для разных выборок из одной и той же генер сов-ти м.б. получ-ны отличающ-ся знач-ия.

Задача сост-т в том, чтобы найти наилучшие из этих оценок.

Т.к. нас не интер-т разность знач-ий завис перем-й по теорет и эмпир ур-иям (мы не знаем теорет Ур-ия), то под откл-ми б.понимать М(У/хк)-ук (теорет откл-ие) = εк. εк- это откл-ие точки выборки от ее теорет вел-ны, а ук-ỹк=ек – (эмпир откл-ие) откл-ие эмпир знач-я от соотв-ей вел-ны, получ-ой по построй-ой модели. И не б.ставить около ук выборки.

Задача моделир-я сост-т в том, чтобы минимиз-ть все откл-ия эмпир знач-ий завис переем-ой от соот-их вел-н рассчит-х по модели.

Это м сделать за счет минимизации 1-й из след-х ∑:

1). ∑ei=∑(yi-ỹi)= ∑(yi-b0-b1xi)

Минимум такой ∑ не м. яв-ся мерой кач-ва урав-ия, т.к. сущ-т мно-во прямых линий, для кот-ых ∑ei=0, в част-ти у=у ср

2). ∑|ei|=∑|yi-ỹi|= ∑|yi-b0-b1xi|. Обычно называют методом наименьших модулей (МНМ). Реализ-ия этой задачи дел-ся методом градиентного спуска.

3). ∑ei²=∑(yi-ỹi)²= ∑(yi-b0-b1xi)²

Минимизация такой ∑ яв-ся наиболее разраб-й. Получила название метода наименьших квадратов (МНК). Вычисл процедуры наиболее просты по срав-ию со всеми ост-ми методами. И при выпол-ии опр-х предпосылок оценки парам-ов ур-ия b0 и b1 облад-т оптим св-вами.

Кроме 3-х названных еще исп-ся метод момента (тер вер) и методы max правдоподобия.

Метод наименьших квадратов (МНК).

Состоит в минимизации нек-й ф-ии Q(bo,b1)=∑ei²=∑(yi-bo-b1xi)². Всегда, когда ничего др не указано, суммир-ие от 1 до n. Из урав-ия очевидно, что это квадрат-я ф-ия, у кот-ой сущ-т экстремум в форме минимума. Ф-ия Q непрер-на и вогнута ↓.

Необх-м усл-ем для нахожд-я точки ее min яв-ся рав-во произв-х ф-ий по пар-рам bo, b1, 0. ∂-част произ-ая.

Когда перем-я только одна вел-на, а все ост-ые знач-ия xi рассм-ся как const.

bo и b1 – const, поэтому они вынос-ся из знака ∑.

Разделим оба ур-ия на n.

Получили сис-му из 2-х ур-ий с 2 неизв-ми. Она имеет единст рещение, если ее опр-ль ≠0.

- дисп-ия разброса объясн-й перем-й. Она в случ выборках никогда ≠0. А если это происх-т, то дост-но из выборки изъять 1 пару или добавить и усл-ие б вып-ся.

D≠0

Выраж-е, стоящее в числ-ле предс-т собой ковариацию м/у перем-ми х и у.

Отсюда ковариация перем-ой самой с собой предст-т дисп-ию

Чтобы получить bo его знач-ия

В числ-ле прибавим и отнимем

=> bo и b1 расч-ся по выборке и bo только гаран-т прохождение линии регр-ии ч/з ср точку выборки.

Рас-м коэф-т

Умножим и разделим на Sу/

Это коэф-т выбороч корре-и м/у х и у.

=> b1 пропорц-ен коэф-ту выбороч коррел-и, а коэф-м пропорц-ти яв-ся отн-ие стандартов откл-ий рассматр-х фак-ров, что позволяет соизмерить эти ф-ры даже при усл-ии, что они яв-ся разноразмерными вел-ми.

Т.е. в лин ур-ии ỹ=bo+b1x х и у м иметь разн ед-цы изм-ия. Допустим х – тыс руб, у -%. Если r уже рассчитан, то мы м легко найти ур-ия парной регр-ии у на х и построить ур-ие х на у.

Отсюда

Проведенные рассуж-ия позволяют сделать неск-ко выводов:

1). Оценки коэф-тов по МНК позв-т их легко расч-ть, т.к. яв-ся ф-ями от выборки.

2). Оценки яв-ся точечными (числовыми) оценками теорет-х коэф-в.

3). Вычисления коэф-та bo всегда пок-т, что люб ур-ие регр-ии всегда проходит ч/з ср точку выборки

4). Ур-ие регр-ии строится так, что ∑ei=0 =>

Покажем это. Из сис-мы ур-ий для коэф-в д вып-ся усл-ие

-2∑(yi-bo-b1xi)=0

-2∑(yi-ỹi)=0

-2∑ei=0 =>∑ei=0

5). Случ откл-ия ei некоррел-ны (не зависят) со случ вел-ми yi.

6). Случ откл-ие ei не коррел-т с объясняющими перем-ми, т.е. Sxe=0.

Для опр-ия вида зав-ти построим поле коррел-ии.

Для вычисления по МНК стр-ся табл.

Для анализа правил-ти опр-ия коэф-в необ-мо расч-ть ỹi и ei=(yi-ỹi)

Для анализа силы лин зав-ти вычисляем коэф-т коррел-ии.

Под интерпретацией пон-ся словесное описание получ-х рез-тов с трактовкой найденных коэф-в так, чтобы получ зав-ть стала понятна ч-ку, не имеющего навыков эконометр анализа. После интерпретации рез-тов всегда встает вопрос о кач-ве оценок и самого ур-ия в целом.

Проверка качества уравнения регрессии.

Регресс-й анализ позвол-т найти точечные оценки коэф-в ур-ий регр-ии. При этом мы знаем, что знач-е завис-й перем-й yi=βo+β1xi+εi зависит от случ откл-ий εi=> У случ вел-ны, завис-ие от этих откл-ий. И пока мы не опр-м какому закону распред-ия подчинены случ вел-ны εi, мы не м.б. уверены в кач-ве оценок коэф-в урав-ия, а => и самого ур-ия ỹ=bo+b1x.

Причем б показано, что , т.е. это тоже случ вел-на, причем если х м считать экзогенным (задав-м из вне) фак-ром, то у – случ вел-на.

Теорет-ки b1 м разложить на неслуч и случ составл-ую. Для этого рассм-м ковариацию м/у х и у.

и воспол-ся нек-ми правилами для вычисл-ия ковариации:

1). cov(u,a)=0

2). cov(u, av)= a cov(u,v)

Тогда = cov(x,βo) +cov(x,β1x)+cov(x,ε) = β1cov(x,x)+cov(x,ε) = β1S²x+cov(x,ε)

Отсюда

β1 – нек-ая const, а 2 слогаемое предст-т случ составл-ую, входящую в вел-ну коэф-та.

Но т.к. мы не знаем теоретич-х откл-ий ε, то рассч-ть это слогаемое непоср-но нельзя.

Точно также м показать, что коэф-т do имеет случ и неслуч состав-ую.

Доаказано, что для получения по МНК наилуч-х рез-тов необ-мо, чтобы выпол-ся ряд требований отн-но случ вел-ны ε.

Предпосылки МНК (условия Гаусса-Маркова).

1). Матем ожидание случ откл-ия ε=0 для всех набл-ий М(εi)=0 для люб εi. Это усл-ие озн-т, что в ср случ откл-ие не оказ-ют влияние на завис переем-ую, хотя в каждом из набл-ий они м.б. положит или отрицат, больш или малыми, но не д.б. причины, чтобы εi имело системат-ие откл-ия.

2). Дисп-ии откл-ий пост-ны.

D(εi)=D(εj)=σ²=const i≠j.

Подразумевает, что несмотря на то, что в каждом из набл-ий случ откл-ия м.б. различ-ми, нет никакой причины, вызывающей большую или меньшую ошибку при опр-ии откл-ий.

Выполнимость этой предпосылки наз-т гомоскедастичность , ее невыпол-ие гетероскедастичность .

Рассм-м, что это озн-т.

D(εi)=M(εi-M(εi))²=

По 1 усл-ию M(εi)=0, поэтому = M(εi)²

И => усл-ие м записать M(εi)²=σ².

Причины и последствие невыпол-ия этой предпосылки б рассм-ть в общем анализе.

3). Случ откл-ие εi и εji≠j не зависят др от др. Это означает, что отсут-т систем-я связь м/у 2 любыми парами откл-ий, т.е.

Если это усл-ие вып-ся, то гов-т об отсут-ии а/коррел м/у случ откл-ми.

Это соотн-ие еще перепис-т в форме M(εi,εj)=0 (i≠j).

4). Случ откл-ие д.б. незав-мо от объясняющ-х переем-х. Обычно это усл-ие вып-ся автомат-ки, если объяснящие перем-ые – известные вел-ны.

Но м показать, что в принципе это выпол-ся в любых мделях данного типа.

Пояснение

5). Модель яв-ся линейной отн-но ее парам-ов βо β1.

Теорема Гаусса-Маркова.

Основ-ся на предпосылках МНК.

Если все 5 предпос-к вып-ся, то оценки коэф-в, получ-е с помощью МНК облад-т след сво-вами:

А). Оценки яв-ся несмещенными, т.е.

Б). Оценки яв-ся состоятельными, т.к. дисп-ии их с ростом объема выборки стрем-ся к 0.

Т.е. ↑ объема выборки приводит к устойчивости оценок коэф-в ур-ия. Сч-ся, что объем выборки д удовл-ть соот-ию n>3m-1, где m-кол-во объясняющих переем-х.

В). Оценки эфф-ны, т.е. они имеют наименьшую дисп-ию разброса отн-но теорет-х вел-н по срав-ию с такими же оценками полученных с примен-м и люб др методов расчета.

В англоязыч науч лит-ре эти оценки получ-ли название BLUE (голубые оценки) по первыем буквам (наилуч лин состоят эффект). Если наруш-ся предпосылки 2 и 3, то дисп-ии откл-ий не пост-ны, случ откл-ия связаны др с др и коэф-ты теряют св-ва несмещен-ти и эффек-ти.

При этос б сделаны след предположения:

1). Объясняющ перем-ые не яв-ся случ.

2). Случ вел-ны εi имеют норм распр-ие с пар-ми 0 и ε²

εi²~N(0;σ²)

Число набл-ий n>3m-1 сущ-но > числа объясняющ перем-х. Отсут-т ошибки специф-ии. М/у объясняющ перем-ми в случае m≥2 отсут-т зав-т (мультикол-ть).

Анализ точности определения оценок коэффициентов регрессии.

Изв-но, что мат ожидания расчет коэф-в совпадают с их теоретич вел-ми

При этом чем < откл-ие оценок от этих теоретич вел-н, тем надежнее построенное ур-ие.

Покажем, что дисп-ии оценок D(b1) и D(bo) непоср-но связаны с дисп-ей случ откл-ий в теоретич модели D(εi)=D(εj)=σ²=consti≠j.

Для этого запишем вел-ну b

Обозначим за

=∑Сiyi

Аналог-но преобр-м знач-е для bo.

Обозначим

=∑diyi

Причем Ci и di –нек-ые const рассчит-е по выборке, что очевидно из их обозначений.

Оценим теперь вел-ну дисп-ий для коэф-та b1

D(b1)=D(∑Ciyi)=

И т.к. мы знаем значение для дисп-ии разброса случ откл-ий, то м записать

=σ²∑Сi²=

Т.о. мы нали знач-ие дисп-ии на основе дисп-ии теоретич откл-ия ε.

Аналог-но для bo.

Мы м получить, что она равна

D(bo)=D(b1)x²

Т.о. дисп-ия разброса коэф-та прямопропорц-на дисп-ии случ откл-ий => чем > фак-р случ-ти, тем менее точными б оценки и чем > число набл-ий в выборке, тем меньше б эти вел-ны разбросаны.

Кроме того дисп-ии обратнопропорц-ны выбороч дисп-ии объясняющ перем-й S²x, т.е. чем шире область изм-ий объясняющ перем-й, тем точнее б оценки. Но в силу того, что дисп-ии случ теоретич откл-ий σ² нам неиз-ны, мы б их заменять несмещен-й дисп-ей расчет случ откл-ий.

,

где m- число объясняющ переем-х. Для парной регр-ии .

Тогда стандарт откл-ия

Наз-ся стандартной ошибкой в случ откл-ии. И для того, чтобы рассч-ть дисп-ию разброса коэф-в эмпир-го ур-ия регр-ии, мы б исп-ть формулы

Проверка гипотез относ-но коэф-ов лин ур-ия регр-и.

Эмпир ур-ия регр-ии строятся на основе конеч выборки, извлеч-й из генер сов-ти случ образом, поэтому как б показано коэф-ты ур-ия яв-ся случ вел-нами.

При проведении эк анализа перед иссл-лями оч часто возн-т необ-ть сравнить расчет коэф-ты bo и b1 с нек-ми теоретич коэф-ми βо и β1.

Это срав-ие осущ-ся по схеме проверки гипотез. Предпол-м, провер-ся гипотеза Но:, состоящая в том, что эти вел-ны совпадают.

Но:=b1=β1. Тогда с ней конкурир-ая гипотеза Н1: не совпадает. Как изв-но из тер.вера для проверки таких гипотез рассч-ся t стат-ка Стьюдента, кот-ая при справед-ти гипотезы но имеет распред-ие Стьюдента с числом степеней свободы с парной регр-ей

tb1= (b1-β1)/Sb1

ν=n-2 (n-m-1)

n – объем выборки

m– кол-во объясняющ перем-х

Гипоеза Но б отклонена, если расчет знач-ие по модулю, т.к. нам безрал-но в какую сто-ну произошло откл-ие, окаж-ся > или = вел-ной, найденной из табл Стьюдента.

α-ур-нь знач-ти.

Сч-ся, что в эк задачах α м принимать знач-я 0,05 или 0,01, т.е. мы поверяем гипотезу с вер-тью 95 или 99%.

α/2 берется в связи с тем, что откл-ие м.б. как отриц, так и положит.

При невып-ии этого усл-ия сч-ся, что нет осн-ий для откл-ия гипотезы Но. Однако вел-ны теорет коэф-в как правило неиз-ны, поэтому на начал этапе анализа рассм-ся задача о наличие зав-ти м/у фак-ми х и у. Эта проблема провер-ся на основе гипотезы Но:b1=0 связи нет. С ней конкур-т H1:b1≠0 связь присут-т.

В такой пост-ке гов-т, что провер-ся гипотеза о стат знач-ти коэф-та ур-ия регр-ии.

Если приход-ся принять гипотезу Но, то мы гов-м коэф-т незначим (слишком близок к 0) и соответ-ю объясняющ перем-ую скорее всего из ур-ия следует искл-ть. В против случае коэф-т стат-ки значим. Н указ-т на наличие опр-й лин зав-ти м/у фак-ми.

Тогда расч-ся стат-ка Стьюдента по соотн-ю и по таблицам Стьюдента находят соответ-но вел-ну .

Если она ≤ расчет вел-ны, то мы м сказать, что есть осн-ия отклонить гипотезу Но и принять Н1.

Коэф-т отличен от 0. Для парной регр-ии мы не б проверять стат знач-ть bo, т.к. он только гаран-т прохождение линии регр-ии ч/з ср точку выборки.

Сущ-т грубое правило, позвол-ее делать первонач выводы о поведении коэф-в ур-ия при отсут-ии таблиц Стьюдента.

По нему срав-ся вел-на ошибки Sb1, допущенной при нахождении коэф-та с вел-ной этого коэф-та.

А). Если станд ошибка > чем коэф-т, то 0<|tb1|≤1. В этом случае гов-т коэф-т незначим.

Б). Если ошибка не превосх-т половины вел-ны коэф-та, то 1<|tb1|≤2. Гов-т коэф-т слабозначим.

В). Если они соот-ся в диапозоне 2<|tb1|≤3, то коэф-т значим.

Г). Если ошибка <1/3 коэф-та, то 3<|tb1|, коэф-т сильно значим. Это гарантия наличия практ-ки лин зав-ти м/у изучаемыми фак-ми.

Безусл- но на tb1 сущест влияние оказ-т объем выборки n.

Чем >n, тем <погр-ть.

Но при n>10 выписанное грубое правило оценки раб-т практически всегда.

Интервальные оценки коэффициента линейного уравнения регрессии.

Если для эмпир ур-ия выпол-ся предпос-ки Гауса-Маркова, то мы м утвер-ть, что найденные оценки коэф-в б подчин-ся норм закону распред-ия, в соот-ии с кот-м теоретич откл-ие εi распр-ны нормально с пар-ми 0 и σ².

εi~N(0;σ²)

Это усл-ие соглас-ся с усл-ми центр предел теоремы тер.вера , в соот-ии с кот-ой если случ вел-на испыт-т влияние оч большого числа независ-х случ вел-н, влияние каждой из кот-ых на эту случ вел-ну мало, то рассматр-ая случ вел-на имеет распред-ие близкое к нормальному (асимптотически нормальное).

А мы пок-ли, что εi как раз отражают влияние, оказываемое на завис перем-ую фак-ми не включ-ми в модель, кот-ых в эк-ке как правило оч много. Но их влияние на у мало, иначе мы д.б. бы их вкл-ть в модель.

=> если n≥3-1, то у нас вып-ся усл-ия центр пред теоремы. Мы м гов-ть, что εi распр-ны нормально, а это позв-т не только найти наилучшее BLUE оценки для коэф-та, но и построить для них интервальные оценки, что дает опред-ые гарантии проверки точности нахождения коэф-в при смене исход-й выборки.

Причем к-т b1=∑Ciyi также как и у объясн-я перем-я, являясь лин комб-ей его выбороч вел-н yi при Ci=const, также б иметь норм распред-ие. Причем мы пок-ли уже, что его мат ожидание совп-т с вел-ной теорет к-та, а дисп-ия

=> к-т b1 имеет норм распр-ие с пар-ми β1, D(d1).

Поэтому t стат-ка для коэф-та подчинена распр-ию Стьюдента с доверит-й вер-тью γ=1-α, что соот-т утвер-ию

Тогда мы м записать, что вер-ть

Преобр-м выраж-ие, стоящее в скобках

-tкрSb1≤b1-β1≤tкрSb1

-b1-tкрSb1≤-β1≤tкрSb1-b1

-b1-tкрSb1≤β1≤b1+tкрSb1

Получ соот-ие дает доверит-й инт-л, кот-ый с надеж-тью 1-α покрывает теорет коэф-т β1.

Доверительные интервалы для зависимой переменной.

Одной из осн-х задач эконометр анализа яв-ся прогнозир-ие знач-ий завис перем-ой при опр-ых знач-ях Хпр объясн-й перем-ой.

Здесь возм-н двоякий подход. Либо предсказ-ся усл-ое мат ожидание объясн-й перем-ой при нек-ой объясн-й перем-ой Хпр. М(У/х=Хпр). Либо прогноз-ся нек-ое конкр значение завис перем-ой при извест-м значении объясн-й перем-ой. Тогда гов-т о предсказании конкр вел-ны

1). Предсказание ср значения.

Предпол-м, что мы построили нек эмпир значение парной регр-ии ỹi=b0+b1xi, на основе кот-го хотим предсказать ср вел-ну завис перем-й у при х=Хпр. В данном случае рассчит-ое по урав-ию вел-на ỹпр=b0+b1xпр яв-ся только оценкой для искомого мат ожидания.

Встает вопрос насколько м эта оценка откл-ся от ср мат ожидания для того, чтобы ей м.б. доверять с надеж-тью γ=1-α.

Чтобы построить доверит инт-л, покажем, что случ вел-на ỹпр имеет норм распр-ие с нек-ми конкр переем-ми.

Мы знаем, что ỹпр=b0+b1xпр. Подставим в это ур-ие знач-ие для bo и b1, найденное в виде лин комбинаций выборочных вел-н объясн-й перем-й yi.

Т.е. мы пок-ли, что расчет вел-на яв-ся лин комб-ей нормально распред-й случ вел-ны yi=> она дейст-но имеет норм распред-ие и мы м рассч-ть пар-ры этого распред-ия М(Ỹпр) и D(Ỹпр).

М(Ỹпр)=M(bo+b1Xпр)= М(bo)+XпрM(b1) = βo+Xпрβ1

D(Ỹпр)=D(bo+b1Xпр) =

Т.к. bo вычисл-ся ч/з значение для b1, то они м/у собой зависят и поэтому

= D(bo)+X²прM(b1)=2cov(bo,b1Xпр)***=

Рас-м вел-ну ковариации.

Заменим вел-ну bo ч/з правило ее вычисления из эмпир ур-ия регр-ии, аналог-но поступим со знач-ем βо, записав его знач-ие ч/з теорет ур-ие регр-ии.

Тогда получаем

-

это дисп-ия для значения b1

Мы знаем вел-ну дисп bo и b1. Подставим сюда их значения:

Преобразуем данное выр-ие прибавив и отняв к скобке

В этом выр-ии заменяем σ² несмещенной оценкой по эмпир ур-ию регр-ии σ²=∑ei²/n-2 и тогда мы м рассчитать Т стат-ку

, получаемого из значения теорет дисп-ии заменой дисп теорет откл-ия σ² на So², вычис-ое по выборке ∑ei²/n-2. А тогда мы м, используя табл Стьюдента, выч-ть вер-ть того, что |T|≤tрасч

Тогда ν=n-2.

И м посчитать, сделав такие же преобр-ия как для коэф-в ур-ия, что мат ожидание нах-ся в инт-ле:

2). Предсказание индив знач-ий завис перем-й.

Предположим, что нас интер-т нек-ое конкр-е знач-ие вел-ны завис-й перем-й yo. При ее сопост-ии со знач-м, кот-ое м.б. рассч-но по ур-ию регре-ии.

Мы знаем, что yo б норм распр-но с пар-ми ỹ~N(βo+β1xпр;σ²). Одновр-но с этим

с таким же ср и дисп-ей, рассч-й для ỹпр.

Построим нов перем-ую U= ỹo- ỹпр и нас б интер-ть поведение такой случ вел-ны.

М(ỹо- ỹпр)= М(ỹо)-М(ỹпр)=0

D(ỹо- ỹпр)= D(ỹо)+D(ỹпр)=>

Каждую из кот-ых мы м оценить, используя выбор значения.

=>S²(ỹj-ỹпр)= S²(ỹо)+S²(ỹпр)

Каждая из них нам изв-на. Первая вел-на оцен-ся

Т.о. мы м расч-ть стандарт ее откл-ия в рез-те чего получили Трасч данной случ вел-ны.

Проверка общего кач-ва ур-ия регрессии. Коэф-т детерминации R ².

Расчет ур-ие регр-ии всегда проходит так, что не все точки выборки принадлежат этой прямой. Обычно оно лишь частично объясняет поведение точек выборки. Сущ-т диаграмма Венна, позволяющая интерпретир-ть ур-нь этой оценки.

5 графиков:

На счеме 1 х никак не влияет на поведение У. 2;3;4 пок-т все усиливающееся влияние объясняющей перем-й на объясняемую. На 5 ф-р х полностью объясняет поведение У.

Суммарной мерой общего кач-ва ур-ия регр-ии яв-ся коэф-т детерминации R².

Поясним его смысл и покажем методику вычисления.

Предпол-м, что мы рассч-ли эмпир ур-ие рер-ии ỹ=bo+b1x. Тогда yi=ỹ+ei.

Рассм-м вел-ну откл-ия точек выборки завис-й перем-й от их ср вел-ны.

Преобразуем эту разность прибавив и отняв от нее соответ-е знач-ие, рассчит-е по ур-ию регр-ии.

Тогда 2 слогаемое – та часть, кот-ая не объяснена в этом откл-ие ур-ем регр-ии, а 1 это часть объясненная ур-ем регр-ии. Получ выр-ие возведем в квадрат.

и просуммир-м по всем знач-м i.

Рассм-м сред слогаемое

Мы получили знач-ие для мат ожидания вел-ны

Разделим это рав-во на лев часть.

В лев сто-не записана доля разброса точек выборки отн-но ур-ия регр-ии и доля разброса не объясненная этим ур-ем.

Т.е. объясненная доля разброса, если ее принять за коэф-т детер-ии ур-ия б опр-ся как

Очевидно, что 0≤R²≤1, т.е. когда ∑ei²=0, все точки выборки лежат а прямой линии регр-ии, то R²=1 идеальный вар-т.

А если совпадает с дисп-ей разброса объясняемой перем-й, т.е. ур-ие регр-ии ничего не объяснило в поведении завис перем-й R²=0.

Возм-ны усл-ия наруш-ия этого соотн-ия, при кот-ых R²≤0. Они связаны с тем, что неправ-но выбрана специф-ия модели, т.е. вид зав-ти м/у х и У.

Если модель строится на основе данных врем-х рядов, то R² как правило нах-ся в диапазоне 0,6≤R²≤0,7.

Покажем как в случае парной регр-ии коэф-т детер-ии связан с вел-ной выбороч-й коррел-ии м/у перем-ми х и У.

Для этого выпишем долю разброса, объясненную ур-ем регр-ии.

Запишем вместо b1 его вел-ну:

Числ-ль и знам-ль преоб-м для чего умножим их на ∑ квадратов откл-ий по объясняющ перем-й

Заметим, что

Тогда мы в нашем выраж-ии

Множественная линейная регрессия.

Общеиз-но, что на люб эк пок-ль чаще всего оказ-т влияние не 1, а какие-то мно-во ф-ров. Тогда мы д исп-ть ур-ие множест регр-ии y=βo+β1x1+β2x2…+βmxm+ε, те.е знач-ие у зависит от m ф-ров.

При m≥2, регр-ия сч-ся множест-й. Если мы составим нек-ый вектор

m х 1, то мы м рассм-ть как ур-ие заданное в векторно-матричной форме, сформировав из значений объясняющ-х перем-ых некую матрицу, строками кот-ый яв-ся значения объясн-й перем-й, входящие в 1 выборочную компоненту.

Столбцы представлены наборами значений каждого из фак-ров, входящих в модель.

Тогда сов-ые знач-ия завис перем-й м.б. предст-ны в виде в-ра столбца.

Случ откл-ия также м рассм-ся как нек-ый столбец

Но исходя из того, что в модели при βо всегда коэф-т =1, то матрицу значений объясн-их перем-ых пополняют 1-м столбцом, состоящим из 1 и обознач-т за Х.

Эта матрица имеет размерность nx (m+1).

Ур-ие регр-ии в матрично-вей форме мы м представить как У=Хβ+ε

При этом д вып-ся усл-ие n≥3m-1 и все усл-ия Гауса-Маркова, кот-ые кратко запишем в форме

1). М(εi)=0 для люб i.

2). D(εi)=D(εi)=σ² для люб i и j

3). Отсут-т связь м/у откл-ми

4). Случ откл-ия не зависят от объясняющ перем-ых cov(εi;xi)=0.

5). Модель линейна отн-но расчет пар-ов, но в ур-ях множест регр-ии возн-т необ-ть выпол-ия еще одного усл-ия.

6). В модели отсут-т соверш мульт-ть м/у объясняющ перем-ми. Нап-р: в модель нельзя одновр-но включать данные годовые и квартальные в этом же году, т.к. годовые склад-ся из поквартальных.

7). Как уже б показано для исп-ия t стат-ки и расчета стандартов откл-ий д вып-ся требование о том, что случ откл-ия εi имеют норм распр-ие εi~N(0;σ²). Выполнимость этой предпосылки дает возм-ть при соотв-ии модели осн требованиям модели Гауса-Маркова утвер-ть, что мы нашли наилучшие оценки коэф-в ур-ия, чем м бы их получить, используя люб др метод нахождения.

Предпол-м, что мы вычислили оценки коэф-та, тогда ур-ие множест регр-ии, построенное на основе выборки, б запис-ть в форме аналогич записи в парной регр-ии.

ỹ=bo+b1x1+b2x2+…+bmxm

y=bo+b1x1+b2x2+…+bmxm+e, где е – вектор расчетных откл-ий

И для любого набора значений ф-ров в выборке б вып-ся

ỹi=bo+b1xi1+b2xi2+…+bmxim

yi- ỹi=ei

А тогда по методу МНК мы м опр-ть ф-ию Q=∑ei²= ∑(yi-bo-b1xi1-b2xi2-…-bmxim)²

И найти от этой ф-ии част производные по ее парам-м (коэф-там ур-ия).

Получаем сис-му из m+1 ур-ия с m+1 неизв-м. Если ее приравнят к 0, то получим сис-му лин ур-ий отн-но коэф-в ур-ия регр-ии, кот-ая всегда б иметь единств решение, т.к. мы м добиться того, чтобы опр-ль сис-мы был ≠0.

Но в тех случаях, когда кол-во объясняющ перем-х m>2, решение таких сис-м нач-т вызывать трудности, поэтому расчет коэф-в делают в матрчно-вект-й форме.

Расчет коэффициентов множественной линейной регрессии.

Предпол-м, что исход выборка предст-на как

Век-р искомых коэф-в и вектор откл-ий

Тогда вел-на Q м.б. запис-на в виде произв-ия 2-х век-ров как

А Ỹ б опр-ся как

=> е=У-Ỹ

, т.к. транспонирование озн-т, что строки стан-ся столбцами и наоборот.

Но т.к. Q –нек-ое число, то каждое из выраж-й здесь также из себя предс-т число.

При трансп-ии матрица сост-ая из 1 эл-та переходит сама в себя.

Воспол-ся этим св-вом и докажем, что 2 и 3 слогаемое в выр-ии совп-т. Для этого транспон-ем любое из них.

2).

Найдем производную от этого выр-ия по любой из компонент в-ра В.

Распишем в явном виде значение для 2 и 3 выраж-ий, т.кк производ от 1-го слог-го по люб bj=0.

Тогда производ-я по люб из значений bj м.б. предст-на как эл-ты произведения из соответ строки этой матрицы (век-ра-столбца), т.е.

Рассм-м теперь последнее из слогаемых, но сначала распишем матрицу

Размер-ть 1-й (m+1)n, 2-й n(m+1)

Размер-ть итоговой (m+1)(m+1)

Полученная матрица всегда симметр-на отн-но глав диагонали, т.к. под знаком суммир-я множители м поменять местами.

Б считать, что эл-ми матрицы Z яв-ся Zij, причем, чтобы не запис-ть нулевые строку и столбец, добавленные в выборку.

Z=(Zij) i=1, m+1

j=1, m+1

Б считать, что эл-ты Z имеют индексы:

,

где индекс 0 соотнес с этой добавленной строкой и столбцом.

Тогда все выраж-ие б равно

Тогда при вычил-ии производ-й от такого выраж-ия каждая производ-я по bj б встреч-ся дважды: 1-й раз во внеш суммир-ии, 2-й во внутр.

Поэтому производ-й от 3-го слогаемого б рав-на:

И чтобы найти значи-я для век-ра В, мы д эту производ-ю приравнять к 0.

Общее выражение для нахождения коэф-в в ур-ях множест регрессии.

Значения для эл-тов век-ра B при m=1 и m=2получить на практике в общем матричном виде, что позволит понять принцип нахож-ия коэф-в ур-ий с люб кол-вом объясняющ перем-ых.

Но при решении задач с 2 объясняющ перем-ми (m=2) мы б польз-ся преобразован-ми знач-ми, получ-ми из общего вида m=2 в форме:

Для b2 получаем симметрично

bo – усл-ие прохождения ч/з среднюю точку выборки.

1-3 (дисп-ии откл-ий) не м.б. отрицат. 4-6 (ковариации) м.б. люб

Дисперсии и стандартные ошибки коэффициентов.

Их знание позвол-т анализ-ть точность найденных оценок коэф-в, строить их доверит интер-лы и проверять соответ-ие гипотезы.

Наиболее удобным для такой проверки знач-я дисп-ий и станд откл-ий, запис-й в матр-но-векторной форме.

Если мы запишем вектор теорет откл-ий

,

введем вспомогат век-р I, состоящий из ед-ц

,

то мы сможем, используя единич матрицу, записать матрицу ковариаций случ откл-ий в форме:

D(εi)=D(εj)=σ²

Исходя из этого К(ε)=σ²Е, где Е- единич матрица.

Усл-ия Гауса-Маркова б выглядеть:

1). Мε)=0

2). D(ε)=σ²I (век-р единич)

3). К(ε)=σ²Е

Рассм-м, когда знач-я для коэф-в с учетом их соотн-ия с теоретич коэф-ми из ур-ия регр-ии.

Откл-ие теорет век-ра от расчет

Построим ковариационную матрицу для теорет коэф-в, использую получ-е соот-ие.

Т.к. матрица симметр-на относ-но глав диагонали, то обрат к ней матрица тоже симмет-на=>

Кроме ε все значения яв-ся const из выборки. Поэтому множ-ли можно вынести из мат ожидания, сохранив порядок умножения.

=> для люб знач-ия коэф-та bj мы можем представить единич дисп-ию его вел-ны ч/з выбороч знач-я, зная что оценкой для σ² яв-ся

σ²→So²=∑ei²/n-m-1, а из матрицы обратной мы возьмем соответ-й эл-т с глав диаг-ли матрицы Z.

А тогда мы получ-ем возм-ть рассч-ть t-стат-ку.

При проверке гипотез отн-но коэф-в ур-ие множ регр-ии также как и для ур-ия парной регр-ии. Отличие состоит в том, что при построении доверит инт-ла отн-но завис-й перем-й у.

. Для мат ожидания →

В остальном, выраж-е для доверит интер-в полностью соот-т значению доверит инт-в в ур-ях парной регр-ии.

Анализ качества эмпирических уравнений и множества линейных регрессий.

Построение эмпир ур-ия яв-ся начальным этапом эмпир анализа. 1-ое построенное Ур-ие по имеющейся выборке оч редко яв-ся удовл-м по всем хар-м. Поэтому след важнейшая задача – проверка кач-ва ур-ия.

В экономет-ке принята устоявшаяся схема такого анализа. Она провод-ся по след напр-ям:

1). Проверка стат знач-ти коэф-в рассматр-го ур-ия регр-ии.

2). Проверка общего кач-ва ур-ия.

3). Проверка св-в данных, выполнимость кот-ых предназначалась при оценивании ур-ий, т.е. это проверка усл-ий Гауса-Маркова.

1). Проверка стат знач-ти коэф-в рассматр-го ур-ия регр-ии.

Как и в парных ур-иях, эта проверка дел-ся на основе t-статистик.

Т.е. рассч-ся tbj=|bj/Sbj|.

И если |tbj|>tкр, то коэф-т сч-ся значимым.

Если |tbj|<tкр, коэф-т не значим, т.е. он стат-ки близок к нулю. Это значит, что фактор xj прак-ки не связан линейно с завис переменной.

Его присут-ие в ур-ии неоправданно со стат т.зр., и он м лишь искажать реальн картину взаимосвязей. Поэтому рекоменд-ся такие ф=ры из ур-ия исключать.

Зачастую, строгую проверку м не делать. Достаточно и грубой оценки.

|tbj|≤1 – не значим

1<|tbj|≤2 – слабо значим

2<|tbj|≤3 значим

3<|tbj| - сильно значим.

Коэф-т искл-т, если |tbj|≤1

2). Проверка общего кач-ва ур-ия.

Для этого, как и в парной регр-ии, исп-ся F стат-ки.

Fкр=Fα1,υ1,υ

υ1=mυ2=n-m-1

И также, как в t стат-ке, если Fрасч>Fкр, то ур-ие сч-ся значимым.

Как б показано, 0<R²<1.

Но для того, чтобы соотнести ур-нь детермин-ии с каждым из объясн-их ф-ров, его коррет-т на число степеней свободы в исходной выборке. Вводят скоррек-й коэф-т

Т.е. в знаменателе записана несмещенная оценка общей дисп-ии независ-й перемен-й. А в числ-ле мы расс-м вел-ну, соответ-ую So²=∑ei²/(n-m-1).

В этом случае соот-ие м.б. предст-но ч/з исходное значение коэф-та детерминации:

Обычно привод-ся данные как для одного, так и для др коэф-та детерм-ии. Но абсолютизировать эти пок-ли нельзя.

Сущ-т мно-во вар-тов, когда при высоком знач-ии R² (R²→1), не б вып-ся усл-ий Гаусса-Маркова, и ур-ие окаж-ся низкого кач-ва.

Анализ статистической значимости коэффициента детерминации.

Он провер-ся по Fтат-ке. Проверка соот-т гипотезе Ho:β1=β2-…βm=0.

Если Fрасч≤Fкр, то десается вывод, что совокуп влияние всех объясн-х переем-х, исп-х в модели, не зависимую пере-ю стат-ки не значит. У ур-ия низкое кач-во.

Если же гипотеза откл-ся (Fр>Fкр), то объясненная дисп-ия разброса завис-ой переем-й соизмерима с дисп-ей, вызванной случ откл-ми. Очевидно, что R и R²=0 или ≠0 одновр-но. А это значит, что по МНК наилуч-я линяя регр-ии ỹ=yср, а => у лин не зависит от объясн-их переем-х.

В случаях парной регр-ии, проверка нулевой гипотезы для R² равносильна проверке на стат значимость t стат-к из соотношения

т.к. m=1, ar²=(rxy)²

Проверка равенства 2-х коэффициентов детерминации.

Основана на исп-ии стат-ки Фишера для проверки необх-ти включения или искл-ия в ур-ии множест регр-ии доп объян-их переем-х.

Предположим, что изнач-но построено ур-ие, содерж-ее m объясн-их переем-х:

и для него вычислим коэф-т детерм-ии R²I. Исключим из исх-ой выборки все объясняющ переем-ые, имеющие номер > чем к. Тогда, по ост выборке мы м построить др ур-ие регр-ии:

ŷ и для него опр-м R²II. Всегда R²II≤R²I, т.к. включ в модель кажд доп пере-й объясн-т еще какую-то долю ее разброса отн-но ур-ия регр-ии. Тогда нас интер-т на сколько кач-во одного ур-ия отлич-ся от кач-ва др ур-ия.

Поэтому гипотеза Но состоит в том, что коэф-ты детер-ии совпадают (кач-во одинаковое), а с ней конкур-т Н1.

R²I= R²II – кач различно.

В соответ-ии с ними рассч-ся R²стат:

, где m-k – кол-во исключ объясн-х переем-х.

Если Fрасч≤Fкр, то кач-во ур-ий приблизит одинаково, значит переем-ые исключ-ны правильно.

Если F расч>Fкр, кач-во ур-ий сущ-но разл-но, и мы не д.б.исключать эти переем-ые.

Замечание: обычно на практике не искл-ся одновр-но несколько объясн-х переем-ых. Их берут по одному и каждый раз сч-т F стат по соотн-ю:

, где k – кол-во исключ объясн-х переем-х. Как правило k =1.

При этом м искл-ть не последующие объясн переем-е, а любую, начиная с тех, у кот-ых mint стат.

Таким же образом м идти проверка целесообр-ти включения доп объясн-х переем-х в исход модель.

Допустим, что это б модель I, и мы к ней добавили Р объясн-х переем-х.

Расч-ли 3-ю модель:

и у него коэф-т детерм-ии R²III.

Тогда сч-т Fстат= (R²III-R²I)/(1-R²III) * [n-(m+p)]/p и ее проверяют по F кр Фишера.

Проверка гипотезы о совпадении уравнений 2-х различных выборок.

Это еще одно напр-ие исп-ия F-стат Фишера. Такая проверка дел-ся тестом Чоу, кот-ый сост-т в:

Пусть имеется 2 выборки объема n1 и n2. У каждой постоено свое ур-ие регр-ии

для n1

для т2.

И мы хотим проверить отл-ие и

Тогда:

Предположим, что мы рассч-ли ∑ квадратов откл-ий для этих ур-ий

Потом по объед-й выборке (n1+n2) построим ур-ие регр-ии.

и для него также вычислим

и затем считаем Fстат, сравнивающую эти суммы квадратов откл-ий.

. Тогда Fкр=Fα. υ1=m+1 υ2=(n1+n2)-2m-2. Потому что для S мы имеем (n1+n2)-m-1 степеней свободы.

Для + степеней свободы

= (n1+n2-2m-2).

Тогда, если Fрасч<Fкр, то мы м утвер-ть, что эти ур-ия имеют одинак ур-нь кач-ва, Но не откл-ся.

И мы м исп-ть любое из ур-ий, рассч-х по этим выборкам, т.е. выборки м.б. объединять.

Такую проверку приход-ся делать при построении дин рядов. Предположим, мы строим ур-ие парной регр-ии объмов продаж. min авто с to до t2. При этом знаем, что в t1 изменены пошлины, те.е. изм-сь институц среда.

За (to до t1) есть выборка n1 и ур-ие .

За (t1; t2) выборка n2 и ур-ие

А потом по объед выборке строим обязат ур-ие ỹ

График.

Если Но не откл-ся, то мы реально м строить ỹ по сов-й выборке без учета институц изм-ий и исп-ть его для прогноза на ((t2-to)/3)

Проверка выполнимости предпосылок МНК.

Проверка на отсут-ие а/коррел остатков (ста-ка DW)

Стат знач-ть коэф-в ур-ия регр-ии и близость ед-цы к-та детерм-ии еще не гаран-т выс кач-во построенного ур-ия, т.к. м не вып-ся какие-то из предпосылок Гауса-Маркова.

Одной из таких предпос-к яв-ся незав-ть случ откл-ий др от др, что гаран-ся усл-ем

Послед-ая коррел-я откл-ий наз-ся а/коррел и показ-т, что если построена упорядоч-я по вр-ни (или номерами выборки) послед-ть откл-ий, то это озн-т, что или в выборке испол-ны перекрест знач-я или задан времен-й ряд, в кот-м послед-ие вел-ны генерир-ся предыд-ми. Поэтому в выкладках м исп-ся обозначеия

, т.е. откл-ия соседние по вр-ни.

В эк задачах как правило встреч-ся положит а/коррел и очень редко возм-на отрицат.

В больш-ве случаев это связано с тем, что в модели отсут-т нек-ый ф-р, кот-ый возд-т на объясн-ую переем-ую в постоян напр-ии.

Сущность а/коррел м объяснить на след примере.

Предпол-м иссл-ся спрос У на прохлад напитки в зав-ти от дохода Х для домохоз-ва по среднемес данным. Предпол-м, что трендовая зав-ть, построен-я по этой выборке в виде ур-ия парной регр-ии.

б опис-ся нек-ой линией

График.

Но реал потреб-ие прохлад напитков безусл-но зависит от вр-ни года. Т.е. фактич-е т выборки в зав-ти от сезона года б нах-ся или все выше или все ниже линии.

Аналог картина набл-ся в макре по циклам деловой акт-ти.

Положит а/коррел озн-т, что в бол-ве случаев за положит откл-ми след-т полож, а за отриц отриц-ые, что и озн-т однонапр-ую связь м/у откл-ми – ковариация полож-на.

Среди осн-ых причин, вызыв-х наличие а/коррел обычно выд-т:

1). Ошибки специф-ии модели , т.е. не учет в модели какой-то важной объясн-й переем-й или неправ-й выбор формы зав-ти.

2). Инерция в изм-ие эк пок-лей . Многие эк пок-ли (инф-ия, безр-ца, объем ВНП) облад-т опр-й циклич-тью, связ-й с волнообр-тью.

Нап-р эк подъем приводит к росту занят-ти, сокр инф-ии, ↑ ВНП. Он продол-ся до тех пор, пока изм-ия конъюнктуры рынка и ряда др эк хар-к рынка не приведут к замедл-ию роста, затем его ост-ке и дальней-му снижению пок-лей. Но в люб случае эта трансфо-ия осущ-ся замедл-но и облад-т опр-й инерцией.

3). Эффект паутины. Во многих эк процессах и в пр-ве пок-ли реаг-т на изм-ие эк усл-ий с временным лабом.

Нап-р: предл-ие с/х прод-ии реаг-т на изм-ие цены на нее с запазд-ем = периоду до получения нов урожая.

Большая цена в прошлом году вызовет рост про-ва в этом году. Скорее всего произ-т ее перепро-во => цена ↓, в след году б исп-ны под зерновые < площадей => цена ↑ и т.д. пока не уст-ся равновесие.

4). Сглаживание данных . Общеизв-но, что врем тренды стр-ся на основе сглаж-ия данных по врем рядам.

=> каждая след-ая средняя в нашем вар-те входить 2 предидущ знач-ия, т.е. ср зав=т др от др. И это служит причиной наличия положит а/коррел у врем рядов.

Последствия и способы обнаружения автокорреляции. Графический метод.

Если регресс-я модель рассч-сь по МНК, то

1). Оценки пар-ров ур-ия оставаясь несмещ-ми отн-но среднего перестают быть эф-ми, т.е. наилучшими из всех возм-х.

2). Дисп-ии этих оценок вычисл-ые по станд формулам б смещенными в сто-ну убывания, что повлечет за собой увелич-е t-статистик.

что м привести к признанию стат-ки знач-ми (tbj>tкр) тех переем-х в ур-ии, кот-ые такими не яв-ся.

3). Вел-на So²=∑ei²/(n-m-1) также окаж-ся смещенной отн-но теоретич дисп-ии откл-ий σ², а поэтому применение t и F статистик окаж-ся необоснов-м, б получены неправ-е выводы по модели и ухуд-ся ее прогозные кач-ва.

Чтобы обнаружить а/коррел исп-т неск0ко методов.

Графический метод.

В этом случае стр-ся графики, связыв-ие номер выбора выборочной компоненты или время, для кот-го взята переем-я и соответ-ие знач-ия для откл-ий, получ-х исходя из рассчит-го ур-ия регр-ии.

4 графика.

На первых 3-х графиках изобр-на нек-ая зав-ть вел-ны откл-ия от № выборочной пары. М предпол-ть, что в модели присут-т а/коррел остатков. На 4 графке такой зав-ти нет, поэтому мы м предпол-ть отсут-ие а/коррк. Причем сч-ся, что ≈ 10% точек м.б. неподчинены осн зав-ти и а/коррел отсут-т.

Метод Дарбина-Уотсона.

По нему рассч-ся к-т а/коррел остатков первого пор-ка, кот-ый совп-т со знач-м коэф-та выбороч-й коррел

Но мы знаем, что мат ожидания (ср знач) откл-ий =0 в методе МНК => получили

Но на практике для такого анализа исп-т стат-ку DW, для кот-й сущ-т расчет-е таблицы

Покажем, что эти вел-ны дейст-но совп-т. Для этого преобр-м числ-ть

Последняя ∑ отл-ся от первой на 1 слогаемое. А т.к. знач-е ei невелики, то мы м предпол-ть, что они м/у собой совп-т. Тогда

≈2∑ei² -2∑eiei-1

Тогда

А т.к. мы предпол-ли, что ∑ei² ≈∑ei-1², то

=> ста-ка DW б вести аналог-но поведению выбор коэф-та коррел м/у откл-ми.

Если r eiei-1 =1, DW=0

r eiei-1 =0, DW=2

r eiei-1 =-1, DW=4

Т.е. все знач-я этой стат-ки нах-ся в инт-ле (0;4) при 2 а/коррел остатков отсут-т. И вопрос закл-ся в том, насколько м эта стат-ка откл-ся от 2, чтобы мы м утвер-ть, что а/коррел отсут-т.

Таблицы DW построены с.о., что в соот-ии с заданным n выбир-ся опр-ая таблица, входами в кот-ую яв-ся m-число объясняющих переем-х и n- объем выборки

Таблица

Предпол-м n=k и в модели исп-ны m=2. Тогда из таблицы б найдены 2 числа dl и du, dl<du<2. Мы сможем отложить на шкале их значения.

В зав-ти от того, куда попадет значение DW, мы м делать выводы о наличие или отсут-ии а/коррел остатков в модели. Но т.к. по этому методу мы ничего не м сказать окончат-но при попадании в зоны неопр-ти.

Метод рядов.

Основан на учете чередования знаков у отклонений ei. Для этого поступают с.о. Нап-р для нашей задачи, рассч-й для парной регр-ии, выставим посл-ть знаков по откл-ию.

(--)(++)(--)(+++)(-)(++) n=12

Затем объед-ся инт-лы совпадающих знаков. Каждая из образ-ых послед-тей наз-ся рядов (ряд одинак знаков). В нашей задаче к=6. Кол-во одинак знакв в отдел-м ряду наз-ся длиной ряда. Если рядов сущ-но мало по отн-ию к объему выборки n, то вер-на положит а/коррел, а если их много, то возм-на отрицат а/коррел.

Для более детального анализа поступ-т с.о. Пусть n – объем выборки. n1 – кол-во положит знаков. n2 – отрицат. В нашем случае n1=7 n2=5.

При достаточно большом кол-ве наблюдений n>20, мы м посчитать мат ожидание кол-ва рядов знаков.

и дис-ию разброса этого кол-ва рядов

Тогда, если принять, что мат ожидание м оценить ч/з таблицы распред-ия кол-ва рядов, кот-ое д нах-ся в инт-ле , то при попадании в этот инт-л а/коррел остатков б отсут-ть. В противном случае, если , то у нас положит а/коррел, а если k≥ - отрицат. Для такого распред-я б построены таблицы Экхарда, в соот-ии с кот-ми м опр-ть нижнюю и верхнюю гр-цу числа К. К1<K<K2 по 2 входам +n1 и –n2.

Таблицы имеют стр-ру

Нижняя граница К1

Таблица имеет своб поля. Если попадаем в своб поле, то к1 выбираем наименьший в этой строке.

Верхняя гр-ца К2.

Выбор осущ-ся также как для К1 и знач-я берутся для своб полей также как и в 1 случае.

В отл-ии от критерия DW этот метод дает однознач ответ, причем н помнить, что метод DW не применим для регресс моделей, содерж-х в кач-ве объясн-х переем-х нек-ые лаговые объясн вел-ны. Даже если этот лаг имеет 1 пер-д. Нап-р в модели . Для таких моделей исп-ся спец n-стат-ка Дарбина, по кот-й , где - вычис-ся из стат-ки DW. Обычно ее принимают =1-1/2DW, т.к. .

обычно при-т равной квадрату станд-й ошибки коэф-та при лаговой переменной. В нашем примере .

Методы устранений автокорреляции.

Изв-но, что осн причиной наличия в ур-ие регр-ии случ откл-ия яв-ся не учет всех объясняющ перем-х в модели и ошибки в выборе зав-ти.

Поэтому устранять а/коррел нач-т с того, что пробуют ввести в модель еще какую-то сущест (значимую) объясняющ переем-ую. Если это не помогает, то пытаются исходя из теоретич знаний изм-ть форму зав-ти в модели.

Но если все разумные приемы совершенст-я модели исчерпаны, а а/коррел все-таки сохр-ся, то м предпол-ть, что она связана с какими-то внутр св-вами переем-й.

Тогда в моделях прибегают к а/регрессионным преобр-м, суть кот-ых закл-ся в след-ем.

А/регр преобр-е 1 пор-ка получ-т с.о. Запис-т теорет модель для нек-го года t

yt=βo+β1xt+εt

Тогда для предыдущего года она б иметь вид

Вычтем из 1 ур-ия 2.

В этом случае мы получаем модель, построенную на приращенных переем-х в году t.

Δyt=β1Δxt+Ut, где Ut – случ вел-на = εt – εt-1

Для таких моделей исход выборка сокр-ся на 1 и если n-1>3m+1, то мы м построить новую модель включающую в себя своб член bo, кот-ый б гаран-ть прохождение ч/з ср точку нов выборки.

Δỹt=bo+b1Δxt+Ut

Δỹt*=bo+b1Δxt*+Ut

В такой модели а/коррел остаткв уже наверняка б отсут-ть. Если же объем выборки не позвол-т уменьшить ее на 1, то прибегают к вспом преобр-ям исх-х переем-х с исп-ем стат-ки DW.

В этих случаях также а/крел из модели б.устран-ся.

Кроме метода разности прим-ся еще неск-ко методов. Нап-р когда в кач-ве нов переем-й вводятся неполн полусуммы значений переем-х по выборке, а только их половинные вел-ны.

yt*= (yt + yt-1)/2

xt*= (xt + xt-1)/2

Метод исп-ия сглаж по люб кол-ву интервалов изм переем-ых. Но все-таки прежде чем исп-ть эти вспом методы, необ-мо сначала попроб-ть изм-ть специф-иб модели.

Мультиколлиниарность.

Если объясняющ переем-ые связаны строгой лин зав-тью, то гов-т, что м/у ними сущ-т соверш мульт-ть. На практике м столконуться не с соверш, а с сильной мульт-тью, т.е. когда ур-нь коррелир-ти м/у объясняющ-ми переем-ми >0,7.

|rxkxj|>037

0≤|rxkxj|≤1

Мульт-ть яв-ся проблемой для ур-ий множест регр-ии. Покажем как она прояв-ся в ур-ии множест регр-ии при m=2 и при усл-ии, что м/у х2 и х1 сущ-т строгая лин зав-ть.

х2=γo+γ1x1

Тогда ỹ=βo+β1x1+β2x2+ε

ỹ=βo+β1x1+β2(γo+γ1x1)+ε = (βo+β2γo)+ (β1+β2γ1)x1+ε =

Обозначим выр-ия, чтоящие в скобках за АО и а1 =АО+а1х1+ε

Получили ур-ие парной регр-ии, в соот-ии с кот-м, используя метод МНК, найдем значения для оценок а0 и а1. Но от этих оценок мы не сможем перейти к оценкам коэф-в исх ур-ия βo β1 β2, т.к. получили для их опр-ия всего 2 ур-ия.

{аО= βo+β2γo

{а1= β1+β2γ1

γo и γ1 нам изв-ны.

Т.о. соверш муль-ть не позвол-т однозначно опр-ть коэф-ты в ур-ии множест регр-ии, т.к. таких коэф-в всегда б на 1 >, чем ур-ий => не сможем сделать выводы о знач-ти этих коэф-в и не сможем опр-ть какой вклад дает каждая из объясн-х перем-х в поведение завис перем-й.

Но соверш мульт-ть бывает только на теории, на практике обычно возм-на сильная мульт-ть. В этом случае зав-ть наз-ся несоверш мульт-ть.

Графически это сост-ие м проиллюстр-ть с.о.:

4 графика:

1) Муль-ть отсут-т. Каждая из объясн-х перем-х оказ-т изолир-е влияние на у. 2) и 3) м/у х1 и х2 сущ-т зав-ть, кот-ую м изм-ть ч/з коэф-т выбороч коррел rх1х2.

Тогда 1) |rx1x2|<0,3

2) 0,3≤|rx1x2|≤0,7 – м/у объясн-ми перем-ми возм-на несоверш мульт-ть.

3). |rx1x2|>0,7 – м/у перем-ми сущ-т несоверш мульт-ть.

Посл-ия наличия мульт-ти:

1). Большие вел-ны дисп-ии оценок, а => станд ошибок коэф-в. Это расшир-т инт-лы для коэф-в ур-ий и м повлиять на правильность вывода о стат знач-ти коэф-та.

2). Т.к. ↓ t стат-ка, то мы м неверно опр-ть стат знач-ть объян-их перем-х и не взять в модель ту из них, кот-ая дейст-но опр-т поведение завис перем-й. Кроме того коэф-ты ур-ия стан-ся очень чувствит-ми к любым изм-ям в выборке.

3). Возм-но получение неверного знака и коэф-та уравнения.

Определения мультиколлиниарности.

Сущ-т неск-ко методов, по кот-м м.б. уст-но наличие в модели мульт-ти переем-х. Косвенными признаками ее наличия м.б:

1). К детерм R² высок, но нек-ые из коэф-тов регр-ии стат не значимы, т.е. имеют низкие t стат-ки.

2). Парная коррел-я м/у объясняющ перем-ми rxixj дост-но высока. Этот признак б надеж-м только в случае 2-х объясн-х переем-х. При их > кол-ве более целесообр-но испол-ие частн коэф-в коррел-ии.

3). Част к-ты коррел высоки. Они опр-т силу лин зав-ти м/у любыми 2 перем-ми без учета влияния на них др переем-х.

Измер-е силы такой лин зав-ти, когда rxy очищен от влияния всех ост-х переем-х наз-т част коэф-м коррел. Нап-р, в случае ур-ия множест регр-ии с 3 объясняющ переем-ми, мы м рассчитать коэф-т част коррел м/у переем-ми х1 и х2 без учета влияния 3 перем-ой. Такой коэф-т обознач-ся

Из этого соотн-ия уже м сделать вывод, что коэф-т част коррел сущ-но отл-ся от коэф-та парной коррел-ии r12.

В общем случае коэф-т част коррел м/у объясн-ми переем-ми xi и xj при усл-ии, что i<j обознач-т .

Приведем без док-ва формулу для расчета люб к-та част коррел в модели, содерж-й m-объясн-х переем-х.

Для этого запишем матрицу парных коэф-в коррел

Причем эта матрица симмет-на, т.к. rij=rji.

Затем к этой матрице состав-т обратную матрицу

,

кот-ая также симмет-на отн-но гл диагонали.

Тогда к-т

И в этом случае квадрат такого к-та б опр-ть част коэф=т детерм-ии, кот-ый опр-т % изм-ия i переменной в след-ии влияния на нее перем-й с №j, что позвол-т при усл-ии, что мы 1-й № зафиксир-ли за завис-й перем-й, а 2-1 соотнесли с х1, а 3-й с х2, выяснить влияние только одной из этих перем-х на завис-ю перем-ю без учета влияния др перем-й.

Тогда коэф-т част детерм-и , а

4). Сильная вспомогат (доп) регр-ия.

Мульт-ть м.б. рез-том того, что какая-либо из объясн-х перем-х яв-ся лин комб-ей др объясн-х перем-х.

Чтобы это выяснить для каждой из объясн-х перем-х стр-ся ур-ия регр-ии этой перем-й отн-но ост-х перем-ых.

Ур-ие множест регр-ии m-1 объяс-й перем-й.

Для такого ур-ия вычисл-т f-стат-ку как

И если оказ-ся, что F стат-ка Fр≤Fкр, то мы говорим, что R² незначим, лин зав-ти xi от ост-х объясн-х переем-х нет, муль-ть отсут-т.

Если Fр>Fкр, то мы откл-ем гипотезу об отсут-ии такой зав-ти, гов-им, что она присут-т в модели => имеет место мульт-ть.

Методы устранения мультиколлиниарности.

Прежде чем рассм-ть эти методы, необ-мо отметить, что в нек-ых случаях мульт-ть не яв-ся таким серьез препятствием для исп-ия модели, чтобы прилагать усилия к ее опр-ию и устранению.

Если осн задача моделир-ия сост-т в прогнози-ии буд знач-ий завис переем-й, то при дост-но больших вел-нах к-та детерм-ии (или R²≥0,9) мульт-ть никак не скаж-ся на кач-ве прогноза.

Если же целью иссл-ия яв-ся выявл-ие каждой из объясн-х перем-ых на завис перем-ую мульт-ть не позволит этого сделать, т.к. она искозит t стат-ки, т.е. стан-ся серьез проблемой.

Единого метода устранения мульт-ти в модели не сущ-т. Это связано с тем, что причины наличия мульт-ти неоднозначны. В многих случаях она зав-т от имеющ-ся выборки.

Рас-м наиболее часто применяемые методы устранения мульт-ти объясн-х переем-х в моделях множ лин регр-ии.

1). Исключение перем-й из модели.

Наиболее простой метод, когда из модели искл-ся 1 или неско-ко переем-х, но при его прим-ии необ-ма остор-ть, т.к. возм-ны ошибки специф-ии.

Нап-р: мы строим модель спроса на какое-то благо, выбирая в кач-ве объясн-х перем-х его цену и цены товаров-заменит. Эти цены часто коррел-т др с др. Но если из модели искл-т цену заменит-ля, то мы скорее всего допустим ошибку специф-ии, получим смещен оценки и сделанные выводы окаж-ся неверн.

Поэтому в приклад-х эконометр-х иссл-х желат-но не искл-ть объяс-е перем-е до тех пор пока их коллин-ть не станет серьез-й проблемой. В част-ти в рассмот-й модели, если необ-м прогноз объема реал-ии искл-ть цену замен-ля нельзя, но если хотим оценить при каком соотн-ии цен на благо и его замен-ли спрос б наибол-м, необ-мо макс-но снижать ур-нь зав-ти м/у этими объясн-ми перем-ми.

2). Получение доп данных или нов выборки.

Т.к. мульт-ть непоср-но зависит от выборки, то возм-но что при изм-ии выборки она перестанет быть серьез пробл-й. Иногда для этого дост-но ↑ объем выборки или сокр-ть вел-ну периодич-ти набл-ий, т.е. от погодовой выборки перейти к покварт или помесяч, иногда ежеднев.

Но получение нов выборки или расшир-е старой возм-но не всегда или связано с большими матер затратами.

Кроме того такой подход, устранив мульт-ть, с вызвать наличие в модели а/коррел-ю остатков, что огран-т возм-ть применения этого метода.

3). Изм-ие специф-ии модели.

Когда или меняется форма зав-ти или добавл-ся объясн перем-е не учтенные в превонач модели, но при этом они д оказать сущест влияние на объясн-ю перем-ю, т.е. если Хк – доп перем-я, то |ryxk|≥0,3. Испол-ие такого метода приводит к уменьшению ∑ квадратов откл-ий в модели ∑ei² ↓, тем самым сокр-ся станд откл-ия к-та Sbi и как след-ие возраст-т стат знач-ть этих к-тов и растет R².

4). Испол-ие предвар инф-ии о нек-ых парам-х модели.

Речь идет о том, что при построении модели множест регр-ии исходя из уже испол-ия моделях парной регр-ии ỹ=bo+b1x1, когда b1=0,82, мы добав-м в модель объян-ю перем-ю х2, кот-ая м.б. корред-на с объясн-й перем-ой х1. Теоретич ур-ие регр-ии с 2 объясн-ми перем-ми сразу запишем в форме y=βo+0,82x1+β2x2+ε

В этом случае ур-ие факт-ки б яв-ся ур-ем парной регр-ии, для кот-го проблемы мульт-ти не сущ-т. Огранич-ть испол-ия этого метода обусл-на тем, что:

1. зачастую затруднено получение достовер предварит инф-ии.

2. Вер-ть того, что принятый изв-й коэф-т б одним и тем же в разн моделях не высок

5). Преобразование переем-х.

Этот метод в нек-ых случаях позвол-т полностью устр-ть мульт-ть. Предпол-м, что по имеющ-ся выборке мы рассч-ли эмпир ур-ие регр-ии ỹ=bo+b1x1+b2x2 и выяснили, что х1 и х2 коррел-ны м/у собой.

В этой ситуации м опр-ть регул-ие зав-ти отн-но каждой из этих переем-ых в отдел-ти, используя в кач-ве нов выборки не абсолют вел-ны перем-х, а их отн-ия. Тогда исход выборку (xi1, xi2, yi) i=1;n, мы делим или на правую или на 2 из объясн-х перем-х.

Тогда в соот-ии с этими выборками мы сможем построить или ур-ие или

Вполне вер-но, что в такой модели мульт-ть уже б отсут-ть.

Гетероскедастичность

Нарушение предпосылки о том, что в модели отсут-т связь м/у случ откл-ми и объян-ой переем-й.

Возн-т вопрос о киках дисперсиях Д(εi) Д(εj) идет речь. Дело в том, что задача реш-ся по конкр-й выборке сформул-й на основе генер-й сов-ти и м/у знач-ми вошедшими в выборку м нах-ся любое кол-во эл-тов и ген сов-ти.

Предпол-м, что на основе выборки б построено ур-ие регр-ии.

График

Тогда отн-но т пересечения линии регр-ии с прямой x=xii=1;n. Для точек, лежащих м/у xi и xi+1 в каждом из подинт-в разбиения в свою очередь м.б. расч-на дисп-ия разброса откл-ий этих точек от линии регр-ии.

Именно о таких дисп-ях, а не о дисп-ях самих откл-ий в модели идет речь в усл-ях

Гаусса-Маркова, что все норм распред-ия в промежутках д.б. одинаковы.

Если это требование не вып-ся, то т.к. в кач-ве оценки для σ² по выборке So²=∑ei²/(n-m-1), то возн-т необ-ть проверить сущ-т ли связь м/у отд-ми знач-ми ei и xi хотя бы в нашей выборке.

Естест-но если она есть, то норм распр-ие при переходе от одной т. Выборки к др б менять свое пведение.

Если же этот эф-т отсут-т, то мы м предпол-ть с нек-м ур-нем достовер-ти, что он отсут-л и в генер сов-ти. То же самое касается мат ожидания конкр значения М(εi)=0.

Обнаружение гетероскедастичности. Графический метод.

В нек-ых практич ситуациях зная хар-р данных, появление проблемы гетероск-ти м предвидеть заранее и попытаться устранить эту причину заранее, но чаще ее прих-ся решать уже после постр-я ур-ия регр-ии.

Обнаружение гетероск-ти яв-ся сложной задачей, т.к. для расчета дисп-ии откл-ий по ур-ию σ²(ei) необ-мо знать распред-ие случ вел-ны У при опр-м значении xi.

Как правило в выборке встреч-ся min эл-тов, в кот-ых одному значению объяс-й переем-й соот-т неп-ое мно-во значений У.

А поэтому мы не м оценить как ведет себя эта случ вел-на, т.к. в табл конкр-му знач-ю xi соот-т единст или 2, а max 3 знач-я для yi. А поэтому мы не м выбрать единств метод.

Графический метод.

Обычно исп-ся для ур-ий парной регр-ии. Когда стр-ся графики квадратов откл-ий по соответ-их им знач-ям объясн-й переем-й.

5 графиков

В этом случае, если кол-во т имеющих откл-ие или не вошедших в общую закономер-ть не превышает 10% объемов выборки, то мы м сделать дост-но достовер выводы.

На 1 графике все квадраты откл-ий не зав-т от знач-ия xi, т.к. нах-ся в 1 и том же диапазоне. Мы м сказать, что у парной регр-ии в этом случае гетер-ть отсут-т.

На всех ост-х графиках прослеж-ся зав-ть вел-ны квадрата откл-ия от вел-ны объясн-ся переем-й.

На 2 и 3 – это прямая зав-ть. На 4 они сначала возр-т, потом убыв-т с какого-то знач-ия х. На 5 они убыв-т с ростом xi.

Т.е. сущ-т какая-то зав-ть, поэтому м сделать предпол-е, что гетер-ть остатков в модели присут-т.

Но как правило граф метод сопровож-т др специф-ми методами обнаруж-я гетероск-ти.

Тест ранговой корреляции Спирмена.

Зав-ть м/у откл-ем ei и переем-й xi опр-ся на основе t стат-ки отн-но коэф-та выбор-й коррел-ии.

, где di – разность номеров мест, кот-ые зан-т I значения объясн переем-й и откл-ия из одной и той же выборочной пары при ранжировании этих пок-лей по возраст-ю.

Тогда расч-ся t стат-ка.

И если оказ-ся по грубой оценке, что tр≤1, мы м наверняка не используя табл Стьюдента утвер-ть, что коэф-т выбор коррел-ии не значим, гетер-ть остатков в модели отсут-т.

При люб др знач-х необ-мо срав-ть расчет знач-е с критич.

tкр= tα/2, υ

И если tp<tкр, то гетер-ть отсут-т. В против случае она присут-т в модели.

Тест Парка.

Он предпол-л опр-ть гетер-ть на основе срав-ия знач-ия σ²(ei), где i- любое с нек-ой функц зав-тью

, где vi – вел-ны откл-ий для данной нелин зав-ти, кот-ая м.б. сведена к линейной методом логарифмирования.

lnσ²i= lnσ²+βlnxi+Vi.

И если мы обозначим соответ-ие знач-ия за нек-ые вел-ны, то получим лин модель.

Zi=αo+βxi* +Vi, кот-ую м оценить методом МНК, если вместо σ²i взять вел-ны ei², а xi* найти прологарифмировав исх-цю выборку zi=lnei².

Если окаж-ся, что коэф-т при переем-ой xi* значим, то связь м/у объясн-й переем-й и квадратами откл-ий сущ-т, а => в модели присут-т гетер-ть остатков. Сущ-т еще неск-ко тестов, являющ-ся разновид-тью теста Парка.

Тест Голдфельда-Квандта.

Все набл-ия в выборке упорядоч-ся отн-но вел-ны объяс-й переем-й xi.

Затем выборка разбив-ся на 3 необяз-но равные части k, n-2k, k, но так, чтобы 3m+1≤k≤n/3 и отдельно оцен-ся ур-ие регр-ии для 1 и 3 части выборки, для кот-ых затем оцен-ся ∑ квадратов откл-ия

и стр-ся Fстат-ка для вел-ны

F= (S3/k-m-1)/(S1/k-m-1)= S3/S1.

Нах-ся Fкр=Fα, υ1=υ2=k-m-1 и если Fр>Fкр, то гетер-ть в модели присут-т. В против-м случае она отсут-т.

Замечание: Если при расчетах оказ-сь, что S1>S3, то стр-ся обрат вел-на, т.к. в этом случае зав-ть б вида 5 (граф метод), а в исх вар-те вида 2 или 3.

Методы смягчения проблемы гетероскедастичности.

Метод взвешенных наименьщих квадратов МВНК.

Основан на педпол-ии, что нам изв-ны знач-ия σi² для генер сов-ти.

Тогда исход урав-ие y=βo+β1xi+εi делят на соответ-ю вел-ну.

,

т.е. мы стандартизируем каждый эл-т исх-й вел-ны стандарта откл-ия объясн-й перем-й отн-но ур-ия регр-ии (xi/σi; yi/σi)

Но в этом случае в модели появ-ся еще 1 объясн-я перем-ая zi=1/σi, кот-ую также необ-мо расч-ть.

Итоговое ур-ие эмпир регр-ии б содер-ть 2 объясн-ие перем-ые, но в нем не б своб члена. Кач-во оценок коэф-в такого ур-ия б гарантир-м.

Но т.к. знач-ие σi² для генер сов-ти в подавл-ем бол-ве случаев неизв-ны, то исп-т 2 др метода, в кот-ых дисп-ии откл-ий неизв-ны.