ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 불완전정보와 베이즈 균형
    Game Theory 2022. 5. 31. 13:59

    불완비 정보

    완비정보 하에서는 경기자들이 모두 게임의 구조 및 상대 경기자들의 보수 구조를 알고 있기 때문에 이에 대응하여 자신의 전략을 구성한다.

    하지만 불완비정보하에서는 상대방에 대한 정보를 완전히 가지고 있지 않은 상황이므로 전략을 선택할 때 상대 전략에 대한 고려가 어렵다.

    예를 들어 판매원이 물건을 팔때 상대방에 대한 인적정보가 적을 수록 상대를 설득하기 위한 전략의 폭이 좁아지는 것과 같다. 

     

    사적정보 (Private information)

    특정 경기자만 다른 경기자들은 모르는 정보를 가지고 있다면 이러한 정보를 사적정보라고 한다. 

     

    정보의 비대칭성

    어떠한 경기자에게만 사적정보가 존재하는 상황을 정보의 비대칭성이 있다고 한다. 

     

    하시니의 기여

    불완비 정보의 상태에서는 상대의 전략에 대한 정보가 없기 때문에 자신의 전략을 구성하는데 어려움이 있다. 

    하시니는 자연이라는 개념을 도입하면서 제 3의 경기자가 사적정보가 없는 경기자에게 상대의 유형을 확률적으로 결정해주면서 

    상대방 유형 자체를 모르는 불완비 정보의 상태에서 자연이 어떠한 결정을 했는지 모르는 불완전 정보의 형태로 게임을 바꾸어

    정보의 비대칭 상황에서도 상대방 유형에 대한 확률분포를 기반으로 각 상황에 맞는 전략을 구성할 수 있도록 하였다. 

     

    베이즈 균형(BNE)

    베이즈 균형은 불완비 정보에서 다음을 만족하는 전략명세이다.

     

    - 사적정보가 없는 경기자: 다른 경기자의 유형에 대한 확률분포 및 다른 경기자의 전략에 대해 자신의 기대보수를 극대화하는 전략을 취함

    - 사적정보가 있는 경기자: 자신의 유형,다른 경기자 유형에 대한 확률분포 및 다른 경기자의 전략에 대해 자신의 기대보수를 극대화 하는 전략을 취한다. 

     

     

    베이지안 게임에서 사용되는 조건부 확률이란 여러 상황중 하나의 구체적인 상황이 될 확률이 주어졌을 때 그 상황내에서 어떠한 상호작용에 대한 확률을 구하는 것이다.

    불완비정보 게임에서는 자연이 어떠한 상황을 선택하는 확률이 부여가 되고 그 상황내에서 각 경기자들의 전략들이 조합되었을 때의 효용을 구하기 때문에 조건부 확률을 이용한다. 

     


    불완비정보 성 대결 게임

    성대결 게임

    성대결 게임은 남성과 여성이 원하는 데이트 장소를 결정하는 게임으로 남성은 B(aseball), 여성은 C(inema)을 더 선호 한다.

    서로 선택한 장소가 겹치는 경우 효용이 존재하며(데이트 성사), 자신이 선호하는 장소로 겹치는 경우 효용이 더 크다.

    만약 서로가 다른 장소를 선택하는 경우(데이트 결렬) 효용은 없다.

     

    불완비 정보

    불완비 정보 상황은 서로에 대한 정보가 없는 상황에서 발생하므로 위의 남녀가 처음 만난 상황이라고 가정한다.

    여기서 중요한 점은 경기자 1은 2에게 호감이 있다는 사실은 공통지식으로 경기자 모두가 알지만

    경기자 2가 1에게 호감이 있는지 없는지는 사적 정보로서 2만 알고 있다.

    따라서 경기자 1은 불완비 정보의 상황에 놓여 있다.

     

    이때 모든 상황에 대한 고려를 하기 위하여 자연이라는 개념을 도입한다.

    2도 호감이 있는 경우 table 1, 2는 호감이 없는 경우를 table 2로 하여

    2의 호감여부를 자연이라는 제 3자가 확률적으로 결정해준다고 생각해보자.

    이렇게 되면 1은 2의 호감 여부를 아예 모르는 상태에서 자연이 어떠한 결정을 했는지 모르는 불완전 정보상황에 놓이게 된다. 

     

    위의 table을 바탕으로 게임트리를 구성하면 아래와 같이 나타난다.

     

    트리 분석

    경기자 1은 자연이 호감여부를 선택 했지만 모르는 상태이기 때문에 두개의 하부트리가 하나의 노드로 묶인다.

     

    경기자 2는 자신의 호감여부를 알고 있기 때문에 호감여부에 따라 두개의 하부트리가 각각 구분된다.

    하지만 경기자 1이 B인지 C인지 모르는 상태이기 때문에 하부트리 내부에서는 노드가 하나의 노드로 묶인다. 

     

    따라서 경기자1의 전략집합은 (node 1) {B,C}이고 경기자2의 전략집합은 (node2-1 node2-2) {BB,BC,CB,CC}이다. 

     

    BNE 구하는 방법-1

    1의 각 전략에 대한 2의 최적대응을 구한뒤 해당 최적대응에 대하여 1의 전략이 최적대응인지 따지는 방법

     

    - 경기자 1이 B를 선택한 경우

     

    경기자 2의 최적대응은 node2-1에서는 B, node2-2에서는 C이므로 경기자 1의 전략 B에 대한 2의 최적대응은 BC이다. $BR_2(B)=BC$

     

    경기자 2의 최적대응에 대해 경기자 1의 전략 B가 최적 대응이기 위해서는 자신의 전략 B,C중 BC에대해 B의 기대효용이 가장 커야한다.

    각 기대 효용을 계산하면

    $EU_1(B,BC)=\frac{1}{2}*2+\frac{1}{2}*0=1$

    $EU_1(C,BC)=\frac{1}{2}*0+\frac{1}{2}*1=0.5$

    $EU_1(B,BC)>EU_1(C,BC)$

    경기자2의 최적대응 BC에 대한 경기자 1의 최적대응이 B이므로 (B,BC)는 BNE가 성립한다. 

     

    - 경기자 1이 C를 선택한 경우

     

    경기자 2의 최적대응은 node2-1에서는 C, node2-2에서는 B이므로 경기자 1의 전략 C에 대한 2의 최적대응은 CB이다. $BR_2(C)=CB$

     

    경기자 2의 최적대응에 대해 경기자 1의 전략 C가 최적 대응이기 위해서는 자신의 전략 B,C중 CB에대해 C의 기대효용이 가장 커야한다.

    각 기대 효용을 계산하면

    $EU_1(C,CB)=\frac{1}{2}*1+\frac{1}{2}*0=0.5$

    $EU_1(B,CB)=\frac{1}{2}*0+\frac{1}{2}*2=1$

    $EU_1(C,CB)<EU_1(B,CB)$

    경기자2의 최적대응 CB에 대한 경기자 1의 최적대응이 B이므로 BNE가 성립하지 않는다. 

     

    BNE 구하는 방법-2

    모든 조합에 대해 사전적으로 기대보수를 계산하여 보수 행렬을 구성한다.

     


     

    'Game Theory' 카테고리의 다른 글

    경매(auction)의 개념  (0) 2022.06.04
    불완비정보하의 쿠르노 모형  (0) 2022.06.01
    반복게임과 방아쇠 전략  (0) 2022.05.30
    신빙성과 자기구속  (0) 2022.05.30
    전개형 게임에서의 불완전 정보  (0) 2022.05.30

    댓글

Designed by Tistory.