서론
굳이 포커를 이야기하지 않더라도, 게임이론이나 내쉬 균형에 대해서 들어본 사람은 많을 것이다.
그러나 구체적으로 이것이 어떤 내용을 다루고 있는지, 좋은 예시가 어떤 것이 있는지까지 아는 사람은 적은 것 같다.(적어도 비전공자 입장에선) 흔히 가장 쉬운 예시로 죄수의 딜레마를 들곤 하는데, 이마저도 어렴풋한 설명 외에는 제대로 된 해설을 본적이 없는 것 같다.
본 글에서는 이러한 게임 이론의 예시중 가장 훌륭하다고 생각하는 예시인 혼합전략 내쉬균형 문제를 예시로 들어보고자 한다. 이 문제 자체는 워낙 유명한 문제이지만, 구체적인 상황은 콜린 브루스의 책 '왓슨 내가 이겼네'에서 가져왔음을 밝힌다.
상황
현재 전쟁상태로 적군과 대치중이다. 첩보를 통해 적군에서 아주 큰 대포를 쏜다는 소식을 알게 되었다.
이 대포는 화력이 어마어마한대신 재장전이 너무 느려서 한발밖에 쏘지 못하는 대포이다.
대포를 피해서 도망가기에는 너무 늦은 상태이다. 다만 다행히 우리에게는 근처에 두개의 언덕 A와 B가 있다.
A언덕은 튼튼하고 주변에 탈주로도 확보되어 있다.
만약 우리가 A언덕에 있는데 상대가 B언덕에 대포를 발사한다면 우리는 100% 확률로 생존한다.
(A언덕에 있는데 A언덕으로 대포를 쐈다면 100% 확률로 사망한다.)
B언덕은 낮고 탈주경로도 확보되어 있지 않다.
만약 우리가 B언덕에 있는데 상대가 A언덕에 대포를 쏜다면 우리는 50%의 확률로만 생존가능하다.
(B언덕에 있는데 B언덕으로 대포를 솼다면 100% 확률로 사망한다.)
당연히 A언덕이 B언덕보다 좋기 때문에 그쪽으로 도망을 가고 싶지만, 적군도 그것을 알고 있다는 것이 문제.
이러한 심리를 이용해서 B언덕으로 도망갈수도 있지만, 적군이 이것마저 읽어서 B로 쏜다면...?
그럼 역의 역발상으로 다시 A로...? 하... 병력을 나눠서 배치해야하나? 아니면 동전이라도 던져야 하나??
정리
아군의 생존확률 | 아군의 선택 | ||
A 언덕(x) | B 언덕(1-x) | ||
적군의 선택 | A 언덕(y) | 0% | 50% |
B 언덕(1-y) | 100% | 0% |
상황을 정리하면 위의 표와 같다.
이러한 상황에서의 행동 방침을 결정하기 위해 우리는 아군과 적군의 선택 확률을 설정해야 한다.
아군이 A 언덕을 선택할 확률이 x
적군이 A 언덕을 선택할 확률이 y
라고 할때, 아군이 생존할 확률을 P(생존) 이라고 한다면...
P(생존) = 0 * x * y + 0.5 * 1 * x * (1-y) + 0.5 * (1-x) * y + 0 * (1-x) * (1-y) = 0.5x + y - 1.5xy
가 될 것이다. 이 함수는 당연히 x와 y에 의해 결정되는 값이다.
고등학교 수학시간에 배운 지식을 활용하여, 이 함수값을 x에 대해 편미분하면...
∂P(생존)/∂x = 0.5 - 1.5y
즉 y = 1/3 일때가 이 함수의 변곡포인트가 된다. 실제로 y = 1/3을 대입하게 되면 x에 어떤 값이 오더라도 항상 일정한 값으로 결정되어 버림을 알수 있기도 한다. 이말인 즉슨, 적군이 A언덕을 선택할 확률이 33%가 되는 순간 아군이 어떠한 행동을 하던지간 결과는 항상 동일하게 결정된다는 뜻이다.
추가로 y < 1/3 이면 x가 커질수록 P(생존)값이 커지기에 x = 1일때 최대값, y > 1/3이면 x가 작아질수록 P(생존)값이 커지기에 x = 0 일때 최댓값이다. 즉 적군이 A 언덕을 선택할 확률이 33% 미만이라면 나는 A 언덕에 100%로 올인해야 하는 것이고, A 언덕을 선택할 확률이 33% 초과라면 나는 B 언덕에 100% 올인해야 한다는 것이다.
적군의 입장에서는 당연히 생존확률을 최소화시키고 싶을 것이기 때문에 P(사살) = 1 - P(생존) 을 구하면
P(사살) = 1 - P(생존) = 1 - 0.5x - y + 1.5xy
가 되고 이를 y 에 대해서 편미분하면
∂P(사살)/∂y = 1.5x - 1
즉 x = 2/3일 때가 이 함수의 변곡포인트가 된다. 즉 66%로 아군이 언덕 A에 병력을 배치하는 순간 적군은 어떤 행동을 하더라도 사살률을 높일 수 없다는 것. 위와 마찬가지로 x > 2/3 이면 y가 커질수록 사살률이 높아지니 y = 1일때 최댓값, x < 2/3이면 y가 작아질수록 사살률이 높아지니 y = 0 일때 최댓값.
결국 균형값을 찾으면 x = 2/3, y = 1/3이 된다. 이말인즉슨...
1) 아군을 배치할 때 병력의 2/3는 A 언덕, 1/3은 B 언덕에 배치한다.
혹은..
2) 주사위를 굴려서 1234가 나오면 A언덕에 몰빵 / 56이 나오면 B 언덕에 몰빵한다.
라는 결론이 최적이라는 뜻이다. 이렇게 할때의 생존확률은 결국 1/3 = 33%.
애초에 상황자체가 불공평하였기 때문에, 생존률 50% 미만의 결과가 나올수 밖에 없단 것.
만약 동전을 던졌다면 어떻게 되었을까?
즉 A 언덕에 몰빵할 확률을 1/2로 설정하였다면(x=1/2) P(생존) = 1/4 + 1/4y, 즉 상대에게 오로지 선택을 맡기게 되는 결과물이다. 당연히 상대가 y = 0으로 설정하는 수를 둔다면 아군의 생존확률은 1/4 = 25% 밖에 안된다는 것.
혹자는 이렇게 말할수도 있다.
어차피 상대가 충분히 똑똑해서 y = 1/3로 설정하는 순간 생존확률은 x와 무관하게 1/3 = 33% 로 고정되어버리는데, 이러한 논의가 의미가 있는지. 물론 이것 자체는 옳은 이야기이다. 그러나 상대의 전략을 모르고, 읽을수도 없는 상태라면 적어도 내 결과가 상대에 의해 바뀌지 않도록 해야하는 것이 최선이 아닐까.
몰빵전략으로 행동하였고 결과적으로 생존했다 하더라도 주사위를 던질때에는 수많은 평행세계의 아군중 33%가 살아남았지만, 동전을 던지는 순간에는 수많은 평행세계의 아군중 오로지 25%만 살아남게 된다는 것을 잊지 말자.
'포커 > 포커 이론' 카테고리의 다른 글
왜 콜드 콜은 나쁜걸까? (0) | 2024.12.15 |
---|---|
우리는 왜 뱃(Bet)해야 하는가? (0) | 2024.12.08 |
6max Cash Game 포지션별 오픈 레인지 (0) | 2024.12.01 |
마이크 카로의 AKQ 게임 (0) | 2024.11.09 |
텍사스 홀덤의 기본적인 확률표 (0) | 2024.11.08 |