Реферат: Экономическая кибернетика
Название: Экономическая кибернетика Раздел: Рефераты по экономико-математическому моделированию Тип: реферат |
Эк. Кибернетика. Игра – матем. Модель конфликтной ситуации. Стратегия игрока – это правила выбора действий в сложившейся ситуации. Решение игры – это нахождение оптимальной стратегии для каждого игрока, т.е. нахождение цены игры. Оптимальная стратегия игрока – это стратегия, которая в среднем (настрив. на длительную игру) дает игроку возможный наибольший выигрыш. Неонтогонистическая – если выигрыш одной из сторон склад. из проигрыша др. стороны, иначе антогонистическая – выигрыш одного равен проигрышу др. Матричные игры. - самые простые игры. Играют 2 чел. У каж конечное число стратегий. Список стратегий известен каж играющему, т.е. игра с полной инф. Игра одноходовая. Величина выигрыша известна заранее, опис. В числовых единицах. Оба дейст. Сознательны, никто не поддается. Игра яв-ся антогонистической. Правила определяют победителя. Игры с седловой точкой обладают св-м устойчивости – если один игрок примен оптим стратегию, то др. игроку не выгодно отклон-ся от своей оптим стратегии. Первонач сведен по т. вероятности. Случайные событие – это событие, которое может произойти или не произойти в данной ситуации. Вероятность – это количественная характеристика, мера появ-я событий. P( А)=(число благопр. событий)/(общее число событий). М(х)= å i хi pi – матем. ожидание . D(x)= å i х2 i pi – (M(x))2 – дисперсия. s (x)= Ö D(x) – средне квадратичное отклонение – показывает степень разбросанности значений случайной величины относительно матем. ожидания. Правило 3 сигм ( s ) : P í M(x)-3 s (x)<x<M(x)+3 s (x) ý = 0 ,997 ÷ Вероятность того, что сличайная величина х попадает в интервал с концами матем. ожидания -3s(х) и +3s(х) равняется 0,997. Многоуголь. распределение – ломанная линия соед-я последовательно точки с коор-ми (хi ;pi ). Смешанные стратегии. - распределение вероятностей на множестве его чистых стратегий, обобщение обычной стратегии. Чистая стратегия – это стратегия, которая применяется с вероятностью 1. Теорема Неймана : Любая матричная игра имеет оптимальное решение возможно среди смешанных стратегий. Стратегия А i активная первого игрока – если вероятность исполь-я в оптим стратегии больше нуля (Аi -акт, если р* i >0); S* A - оптим стратегия. Стратегия В j активная второго игрока – если вероятность исполь-я ее в опти стратегии больше нуля (Bi -акт, если q* i >0); S* B - оптим стратегия. Неактивная стратегия – вероятность применения, которой в оптим стратегии равна нулю. Теорема устойчивости: Если один игрок применяет свою оптим стратегию, то 2 игроку не выгодно выходить за рамки своих активных стратегий. Теорема : В матр. игре количество активных стратегий у каж игрока одинаковое. Применение решений в усл. неопределенности. Рассмотрим игру человек и природа. Человек – лицо принимающее решение. Природа – экон-я среда в состоянии рынка. Отличия от матричной игры : Активные решения принимает только чел, он хочет найти наиболее оптим решение. У природы стихийное поведение и она не стремится к выигрышу. Считается, что чел знает список сост природы, но не знает какое из них будет фактическим. В игре с природой чел труднее сделать свой выбор, поэтому сущ несколько подходов нахождения оптимального решения. Подход определяется склонностью чел к риску. Риск – это может быть упущенная выгода или необход понести дополнит произв-е затраты. Элементы матрицы – это ожидание резуль. Деятельности в завис от сост природы. 1) Подход махмах “ оптимистический” : В каж точке мы находим макс элемент и после этого находим макс из полученных чисел. gi =maxj aij Þg=maxi gi =gi0 Þ выб Аi0 . Выбираем макс значение. Чел ориентир на самый лучший возмож результат, не обращ внимание на возмож неудачи. 2) Критерий Вальда – критерий пессимизма : Находим в каж строчке миним элемент и выбираем ту стратегию, которая дает макс гарантируемый доход. ai =minj aij Þa=maxi ai =ai Þ выб Аi0 . 3)Критерий Гурвица ( l ) – ур пессимизма : Человек выбирает 0£l£1. Находим число a i = l a i +(1- l ) g i Þa maxi a i = a i0 Þвыб Аi0 . Если l=1 – кр Вальда (пессимизма), если l=0 – кр оптимизма. Конкретная величина l опред-ся эк-ой ситуацией. 4) Критерий Сэвиджа – кр минимального риска : Состав март риска по формуле rij = b j -аij . bij =max aij Þ rij =bj -aij . R=(rij ) –матр риска; ri =maxj rij Þ mini ri =ri0 Þ выб Аi0 . Если бы мы знали, то мы бы выбрали наиболее эф-е решение. Для самого эф-го решения: rij =0 (если Пj ) Þ Аi . Риск = величине упущенной возможности. У каж критерия есть свои особенности применения. Если мы оценив ситуацию по разным критериям, то мы можем принять более обоснован решение. Трудность обоснования яв-ся, что природа не стремится к выигрышу. Принятие решения в усл риска. Рассотрим вариант игры чел и природы в случаи, когда нам известно сост природы. Природа к выигрышу не стремится. Находим стратегию, которая приносит макс средний доход. Средний доход расчитывается по правилу теории вероятности. Величина среднего дохода равна матем ожиданию при этой стратегии. 1) М(Ai )=n åj=1 aij pj Находим макс maxi M(Ai ) 2) Правило минималь среднего риска. R=(Ai )=n åj=1 rij pj . Находим наимень mini R(Ai ). Лемма : Указ выше 2 критерия в результате всегда приводят к выбору одной и той же оптим стратегии. Док-во: Найдем миним сред риска mini R(Ai )= mini åj rij pj = mini (åj (bj -аij )pj )= mini (åj bj pj -åj аij pj )={åj bj pj – не зависит от переменной i, значит это const С}= mini (С-åj аij pj )Þ минимум разности соот-ет максимуму вычитаемого. maxi åj аij pj =M(Ai ). Номера стратегий, на которых достиг миним среднего риска, равны номерам стратегий обеспеч наиболь средний выигрыш. Бейссовский подход нахождения оптимального решения. Бейсовский подход: Если первонач распредел вероятности мы получ доход `Q` . Если мы можем провести эксперемент дающий новое распред вероятности в завис от первонач `Q` и нового `Q’ , мы делаем свой выбор стратегии. p'Þ`Q’` . Некоторые св-ва матричной игры. Замеч№1 О масштабе игр : Пусть даны 2 игры одинаковой размерности с платежной матрицей р(1) и р(2) . При чем при любых i и j выпол (а(2) ij =aa(1) ij +b), некоторые числа a и b. Тогда: 1) опт стратегии 1 игрока в 1 и 2 игре одинаковые. Опт стратегии 2 игрока одинаковы в обеих играх. 2) Цена второй игры V2 =aV1 +b. Для некот методов решений все элементы матр должны быть не отрицательными. Заме№2 О доминировании стратегий : Этот прием применяется для умень размерности игры. А : Аi доминирует над Ак (Аi >Ак ), если для любого j выпол нерав-во аij >akj и хотя бы одно из этих нерав-в строгое. Ак – заведомо невыгодна; сред размер выигрыша меньше; р* к =0, стратегия пассивная. В : Вj доминирует над Вt (Вj >Вt ), если для любого i выпол нерав-во аij >ait и хотя бы одно из этих нерав-в строгое. Bt – невыгодна Þ q* t =0 – актив стратегия. Доминир стратегии вычеркиваются и получ матр меньшей размерностью. Замеч№3 Сравнение операций по методу Парето : Допустим есть операции Q1 , Q2 ,… Qn . Для каж опер-и расчит 2 параметра: 1) E(Q) – эффективность (доход); 2) r(Q) – степень риска (s-сред квадратич отклон). Самая лучшая операция – это опер с наилуч эф-ю и с наимень риском. F(Q)= k E(Q)-r(Q) , где k - это склонность к риску (не мат проблема). Находим макс из этих критериев maxi F(Qi ). Операция Qi >Q, если эф-ть не менее E(Qi )³E(Qj ), а риск опер r(Qi )£r(Qj ) и хотя бы одно из нерав-в строгое. Доминир страт отбрас, как заведомо невыгодные. Множ Парето – это все недоминир-е операции. Наиболее эф-е среди них. Понятие о позиционных игр. У каж игрока своя платежная матрица. Выигрыш одного не означ проигр др. Таким способом можно высчитывать взаимные интересы игроков, а также возможность образования коалиции. Можно расчит динамические игры учитывая фактор времени и т.д. Позиционные игры – возникает в случаи, когда надо принимать последо-но несколько решений, при чем выбор решения опираются на предыдущ-е решения. Рассотрим простейш случ позиц-й игры с природой. Решение изобр в виде дерева решений. Дерево решений – граф-е изобр-е всех возможных альтернатив игрока и сост природы с указ вероятности соответ-х состояний и размеров выигрыша в каж ситуации. Альтернатива игрока изобр квадратом – список возможных стратегий в соот-й ситуации. Сост-е природы кружочком, чел на них влиять не может. Делается оценка каж вершины и наход макс оценка ситуаций соот-х каж ветви дерева решений. EMV – денежное решение; EMV= å i ( отдача в i- ом сост-и )pi maxвершина (EMV)=? |