ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 혼합전략균형의 응용
    Game Theory 2022. 4. 26. 10:48

    순수전략이 3개인 게임

    순수전략이 3개인 게임

     

    혼합전략의 특성: 혼합전략균형에서 양의 확률로 사용되는 순수전략은 모두 같은 기대보수 값을 가진다.

     

    A.1: 상대의 각 순수전략의 확률이 $q_1,q_2$로 주어졌을 때, A의 전략 1에 대한 기대보수

    $u_A(1;q_1,q_2)= 1\cdot q_1+4\cdot q_2+1\cdot (1-q_1-q_2)= 1+ 3q_2$

     

    A.2: 상대의 각 순수전략의 확률이 $q_1,q_2$로 주어졌을 때, A의 전략 2에 대한 기대보수

    $u_A(2;q_1,q_2)= 2\cdot q_1+2\cdot q_2+5\cdot (1-q_1-q_2)= 5 - 3q_1-3q_2$

     

    A.3: 상대의 각 순수전략의 확률이 $q_1,q_2$로 주어졌을 때, A의 전략 3에 대한 기대보수

    $u_A(3;q_1,q_2)= 3\cdot q_1+3\cdot q_2+3\cdot (1-q_1-q_2)= 3$

     

    위의 A의 3전략에 대한 기대보수가 모두 같아야하므로 연립하여 확률 $q_1,q_2$를 구하면 $q_1=0,q_2=\frac{2}{3}$이다.

    따라서 B는 혼합전략균형시에는 전략 1을 사용하지 않는다. 

    -> 강열등전략이 아니여도 혼합전략균형에 사용되지 않을 수 있다.


    버스 하차벨 누르기 게임

    - N명이 동시에 버튼 누르기 여부를 결정한다.

    - N명중 1명 이상 눌렀을 때, 모든 경기자가 원하는 정거장에 내려서 얻는 편익은 a

    - 버스 하차벨을 눌렀을 때, 각 경기자들에게 비용은 c (c<a)

     

    순수전략균형

    - k: 하차벨을 누른 경기자들의 수 

    - 다수의 경기자가 존재하기 때문에 경기자들을 구분하지 않고 하차벨을 누른 경기자가 k명일 때 경기자들이 이탈할 유인이 있는지 확인

     

    1. k=0일때(아무도 하차벨을 누르지 않았을 경우)

    하차벨을 누르지 않은 사람의 효용:0 

    하차벨을 누르지 않은 사람이 눌렀을 때의 효용: a-c

    a-c>0 따라서 전략을 수정했을 때 효용이 증가하기 때문에 이탈유인이 존재-> 균형X

     

    2. k=1일때(한명만 하차벨을 누른 경우)

    하차벨을 누른 사람의 효용: a-c 

    누른 사람이 누르지 않았을때의 효용:0

    전략을 수정했을 때 효용이 감소하므로 이탈유인이 존재 하지 않는다. -> 균형 

     

    3. k가 2이상 일때(두명 이상 하차벨을 누른 경우)

    하차벨을 누른 사람의 효용: a-c

    하차벨을 누른 사람이 누르지 않았을 때 효용: a

    전략을 수정했을 때 효용이 증가하므로 이탈유인이 존재 -> 균형X

     

    순수전략하에서는 k=1일때, 순수전략균형이 형성된다.

     

     

    혼합전략 균형

    혼합전략시 각 경기자들의 전략은 하차벨을 누를 확률의 형태로 표현된다. $\sigma_i=p\in(0,1)$

    임의의 경기자 $i$에 대해서 생각한다.

    $i$를 제외한 $n-1$명의 경기자가 하차벨을 누를 확률이 각각 $p$라 한다.

    경기자 $i$가 얻는 보수는 경기자들 중 한명이상 누른 경우와 아무도 누르지 않은 경우로 나뉜다.

    $i$를 제외한 경기자들이 아무도 누르지 않을 확률은 $(1-p)^{n-1}$이다.

    1명이상 누르는 경우는 아무도 누르지 않은 경우에 여집합이므로 $1-(1-p)^{n-1}$이다.

     

    혼합전략 균형이 존재하기 위해서는 $i$의 각 전략 (push,not-push)에 대한 기대보수가 동일해야한다.

     

    $i$가 눌렀을때의 기대보수: 나머지 경기자의 전략과 상관없이 항상 편익 a-c를 얻는다.

    $u_i(push;\sigma_{k:k\ne j})=(a-c)\cdot (1-(1-p)^{n-1})+(a-c)\cdot(1-p)^{n-1}=a-c$

     

    $i$가 누르지 않았을 때의 기대보수: 안누르고 내릴때의 편익a * 1명이상 누를 경우 + 못내릴때의 편익0*아무도 누르지 않을 경우

    $u_i(not-push;\sigma_{k:k\ne j})=a\cdot (1-(1-p)^{n-1})+0\cdot(1-p)^{n-1}=1-(1-p)^{n-1}\cdot a$

     

    혼합전략 균형 특성에 따라 위의 $i$의 모든 전략에 대한 기대보수가 동일해야 하므로

    $a-c=(1-(1-p)^{n-1})\cdot a$

    $p^*=1-\frac{c}{a}^{\frac{1}{n-1}}$

     

    위의 식을 해석하면 게임의 참여하는 경기자들의 수(n)가 증가할 수록 게임에서 행위를 할 확률 p가 작아짐을 알 수 있다.

     

    이는 어떠한 상황에 닥친 군집이 모두가 합리적으로 행동한다면

    군집의 수가 커질수록 각 개체가 상황에 개입할 확률이 줄어듬을 암시하고 있다.

     

    이를 책임감의 분산 또는 방관자 효과라고 부른다. 

    댓글

Designed by Tistory.