-
혼합전략균형Game Theory 2022. 4. 24. 14:50
이전까지는 전략적 상황에 놓인 경기자들이 주어진 전략 중 하나를 확실히 선택하는 경우에 대하여 최적대응을 구하였다.
그리고 각 경기자들의 최적균형이 교차하는 지점에서 해당 게임의 균형이 형성되는 것을 다루었다.
즉 각 경기자들은 순수전략(하나의 전략을 선택)하고 그에 대한 대응을 고찰하였다.
혼합전략 균형이란 각 경기자들이 순수전략과 다르게 상대의 전략에 확률을 부여하고 확률에 따라 전략을 선택하는 경우에 대해 다룬다.
각 경기자들이 순수전략을 선택하는 게임상황은 경기의 참여자들이 상대의 전략의 구성에 대해서는 알고 있지만
상대가 전략의 구성중 무엇을 어떻게 선택할지에 대한 정보가 없었다.
따라서 상대의 각 전략에 대해 하나를 선택했다고 가정하고 그에 대한 자신들의 최적대응을 구하는 형태로 균형이 형성되었다.
하지만 혼합전략을 택하는 게임상황에서는 상대가 자신의 전략중 어떤것을 어떻게 선택할지에 대한 정보가 확률의 형태로 주어진것이다.
때문에 상대의 전략 뿐아니라 전략 선택방식(확률)에 대한 고려도 필요하다.
예를 들어 처음보는 이와 가위,바위,보 게임을 한다고 하면 각 경기자들에게 주어진 정보는 상대가 가위,바위,보 중 하나를 선택할지에 대한 것 뿐이다.
상대가 가위를 냈을때, 바위를 내야한다는 최적대응은 알고 있지만 그 최적대응은 전략적 상황에서 효용에 대한 불확실성이 매우 높다.
하지만 오래 알고 있는 이와 반복적으로 가위,바위,보 게임을 하면 상대가 무엇을 낼지에 대한 확률을 경험적으로 알 수 있다.
만약에 상대가 가위를 많이 내는 경향을 가지고 있다면 이를 이용해서 바위를 내는 최적대응을 활용시 전략적 상황에 불확실성을
순수전략일때보다 낮출 수 있다.
위와 같은 특징 때문에 순수전략하에서 내쉬균형이 형성되지 않는 게임상황에서도 혼합전략하에서는 내쉬균형이 형성될 수 있다.
전략의 선택 방법에 대한 추가적인 정보(확률)가 주어졌기 때문이다.
혼합전략하의 게임은 반복적 게임을 통해서 경기자의 전략 선택 확률이 주어지면 그에 대한 고려가 더해짐으로서 게임의 균형이 형성된다.
혼합전략하의 게임시에는 각 경기자들의 전략이 확률의 형태로 주어진다. $\sigma_1\in[0,1]$, $\sigma_2\in[0,1]$
※ 순수전략은 혼합전략의 확률을 모두 하나의 전략에 배분한 특수한 형태이다.
혼합전략 하의 균형
$\sigma_i$을 경기자 $i$의 혼합전략이라고 하면
$\sigma_1$은 경기자 1이 자신의 각각의 순수전략을 택하는 확률을 나타내는 혼합전략이고,
$\sigma_2$는 경기자 2가 자신의 각각의 순수전략을 택하는 확률을 나타내는 혼합전략이다.
경기자 1,2가 가능한 모든 혼합전략을 모은 집합인 전략집합을 각각 $\sum_1,\sum_2$라 할때 혼합전략균형은 다음과 같이 정의된다.
$(\sigma_1^*,\sigma_2^*$가 다음 두 조건을 만족하면 혼합전략균형이다.
- 모든 $\sigma_1\in\sum_1$에 대해 $u_1(\sigma_1^*,\sigma_2^*)\ge u_1(\sigma_1,\sigma_2^*)$
- 모든 $\sigma_2\in\sum_2$에 대해 $u_2(\sigma_1^*,\sigma_2^*)\ge u_1(\sigma_1^*,\sigma_2)$
순수전략 균형과 마찬가지로 선택한 혼합전략에서 단독으로 이탈시 더 나은 보수를 받을 수 없기 때문에 이탈유인이 없는 상태를 말한다.
혼합전략균형과 내쉬균형의 존재
- 유한게임(finite game): 경기자의 수와 순수전략의 수가 유한한 게임
- 내쉬균형의 존재: 혼합전략균형을 포함할 경우 모든 유한게임은 적어도 하나의 내쉬균형을 가진다.
혼합전략균형을 찾는 방법
1. 최적 대응의 교점을 구하는 방법
- 게임의 3요소 정의
1. 경기자: 1,2
2. 전략: $\sigma_1=p\in[0,1]$, $\sigma_2=q\in[0,1]$
3. 보수: 위의 보수행렬에 표현되어 있음
위의 그림은 동전던지기 게임 상황을 보수행렬로 나타낸 것이다. 해당 게임은 순수 전략하에서는 게임의 균형이 존재하지 않는다.
혼합전략하에서 최적 대응을 이용하여 게임의 균형을 구하는 방법은 아래와 같다.
- 경기자 1의 최적대응 구하기
1-1. 경기자 2의 확률이 q의 형태로 주어졌을 때 경기자 1이 H를 선택시 받는 보수
$u_1(H,q)=1\cdot q+(-1)\cdot (1-q)$
-> 경기자 1이 H선택시, 경기자 2가 q의 확률로 H를 선택 했을 때의 보수 + 경기자 2가 (1-q)의 확률로 T를 선택 했을 때의 보수
1-2. 경기자 2확률이 q의 형태로 주어졌을 때 경기자 2가 T를 선택시 받는 보수
$u_1(T,q)=(-1)\cdot q + 1\cdot (1-q)$
-> 경기자 1이 T선택시, 경기자 2가 q의 확률로 H를 선택 했을 때의 보수 + 경기자 2가 (1-q)의 확률로 T를 선택 했을 때의 보수
2-1. 경기자 1에게 H선택이 최적 대응일 조건: $u_1(H,q)>u_1(T,q)$ (H선택시 보수가 T선택시 보수보다 많다.)
$2q-1>1-2q$
$q>\frac{1}{2}$
2-2. 경기자 1에게 T선택이 최적 대응일 조건: $u_1(T,q)>u_1(H,q)$ (T선택시 보수가 H선택시 보수보다 많다.)
$1-2q>2q-1$
$q<\frac{1}{2}$
2-3. 경기자 1에게 H,T선택이 모두 최적 대응일 조건: $u_1(T,q)=u_1(H,q)$ (H와 T선택시 보수가 모두 동일하다.)
$1-2q=2q-1$
$q=\frac{1}{2}$
3. 위의 결과를 토대로 경기자2의 확률 q에 대한 경기자 1의 최적대응 함수를 나타내면 아래와 같다.
경기자 1의 최적대응함수 도출 과정을 경기자2에게 동일하게(경기자1의 확률 p가 주어졌을때의 경기자2의 최적대응)적용하면 경기자2의 최적 대응함수를 구할 수 있다.
위에서 구한 각 경기자들의 최적대응함수를 그래프로 나타내면
경기자1의 최적대응함수 $BR_1$을 살펴보면
경기자2의 확률 q가 1/2미만 일때는 자신이 H를 선택할 확률 p를 0으로 하며 T를 선택한다.
경기자2의 확률 q가 1/2 일때는 H와 T가 무차별 하므로 자신이 H를 선택할 확률 p가 무엇이 되도 상관없다.
경기자2의 확률 q가 1/2초과 일때는 자신이 H를 선택할 확률 p를 1으로 하며 H를 선택한다.
경기자2의 최적대응함수 $BR_2$를 살펴보면
경기자1의 확률 p가 1/2미만 일때는 자신이 H를 선택할 확률 q를 1로 하며 H를 선택한다.
경기자1의 확률 p가 1/2 일때는 H와 T가 무차별 하므로 자신이 H를 선택할 확률 q가 무엇이 되도 상관없다.
경기자1의 확률 p가 1/2c초과 일때는 자신이 H를 선택할 확률 q를 0을로 하여 T를 선택한다.
위에 그래프에서 두 최적대응함수가 만나는 지점 $p=\frac{1}{2}$와 $q=\frac{1}{2}$는 이 게임의 내쉬균형이다.
$(p^*,q^*)=(\frac{1}{2},\frac{1}{2})$
순수전략하에서 없던 균형을 혼합전략하에서는 도출하였다.
2. 혼합전략의 특성을 이용하여 혼합전략균형 찾기
혼합전략균형에서 기대보수의 특성
혼합전략균형에서 양의 확률로 사용되는 순수전략은 모두 같은 기대보수 값을 지닌다.
-> 기대보수가 높은 순수전략이 있다면 애초에 혼합전략을 사용할 이유가 존재하지 않기 때문이다.
1. 경기자 1: 2가 혼합전략 q를 사용할 때, H와 T로부터의 기대보수가 같아야한다. -> q도출
2. 경기자 2: 1이 혼합전략 p를 사용할 때, H와 T로부터의 기대보수가 같아야한다. -> p도출
혼합전략 균형 특징
1. 순수전략 균형이 존재하는 경우에도 혼합전략균형이 존재할 수 있다.
2. IDSDS와 혼합전략균형: 강열등전략 반복적 제거를 통해서 제거되는 순수전략은 혼합전략 균형에서 사용되지 않는다.
-> IDSDS를 통해 각 경기자들의 전략 중 강열등 전략을 제거한뒤에 혼합전략균형을 구하는 것이 효율적이다.
3. 각 경기자의 위험에 대한 태도는 경기자가 각 순수전략에 부여하는 확률이 아닌 게임의 결과에 따른 보수에 반영되어 있다.
'Game Theory' 카테고리의 다른 글
부분게임 완전균형 (0) 2022.05.02 혼합전략균형의 응용 (0) 2022.04.26 내쉬균형의 응용 - 네트워크 효과가 있는 경우 (0) 2022.04.19 내쉬균형의 응용 - 부정적인 외부성이 있는 경우 (0) 2022.04.19 내쉬균형의 응용 - 호텔링 모형 (0) 2022.04.19