융합시사상식

 

 
 

 

매월 연재되는 융합 시사 상식에서는 실생활과 연관된 시사 뉴스에서 숨겨진 수학과학
원리를 찾아내, 융합적 사고력 키우는 호기심 가득한 과학 이야기가 펼쳐집니다.

퀴즈 정답자 중 당첨자를 선정하여 문화상품권을 보내드립니다.

 

융합과학상식

가장 성공적인 전략 Tit-for-Tat
기간 : 2017-02-22 ~ 2017-03-20 당첨자발표 : 2017-03-20

 

 

가장 성공적인 전략 Tit-for-Tat

 

 

도덕 시간에 배우는 내용과 여러 동화나 소설의 주제를 종합해 본다면 "착하게 살자"로 요약할 수 있다.

더 나아가 종교적인 가르침, 법의 기본 정신도 결국 착하게 살아야 한다고 말한다.

하지만 우리는 종종 그 반대의 경우를 보게 된다.

착하고 정직하게 사는 것보다 남을 속이고 나쁘게 사는 것이 더 현명하게 보이는 현실.

우리는 왜 착하게 살아야 할까?

죄수의 딜레마와 Tit-for-Tat에 대하여 알아보자.


 

 

죄수의 딜레마

 

 

영화 '다크 나이트'에서 조커는 두 척의 배를 나포하여 외부와 단절 시켰다.

한 배에는 일반인들이 타고 있고 다른 배에는 죄수와 간수들이 타고 있다.

각각의 배에는 폭탄이 설치되어 있으며, 폭탄의 기폭 장치는 서로 다른 배에 넘겨진 상태다.

최선의 선택을 하기 위해서는 기폭 장치를 눌러야 할까?

죄수의 딜레마(prisoner's dilemma)는 두 사람의 협력적인 선택이 둘 모두에게 최선의 선택임에도 불구하고 자신의 이익만을 고려한 선택으로 인해 자신뿐만 아니라 상대방에게도 나쁜 결과를 부르는 현상을 말한다.

2011년 미국의 한 퀴즈쇼에서 전설적인 퀴즈의 달인들을 물리치고 우승한 경력이 있을 정도로 인간의 언어를 이해하고 판단하는 능력이 뛰어나다.

다크 나이트에서도 두 배 모두 기폭 장치를 누르지 않으면 모두 살 수 있지만 의심으로 인해 기폭 장치를 누른다면 한 배 또는 두 배의 사람이 모두 죽을 수 있다.

이처럼 죄수의 딜레마는 게임 이론에 국한되지 않고 회적 딜레마에 광범위하게 적용될 수 있다.

 

 

 

죄수의 딜레마 상황

 

두 명의 범죄 조직원이 체포되어 각각 독방에 수감되었다.

두 명의 조직원을 공범으로 기소하기 위해서는 증거가 부족한 상황이다.

이런 상황에서 경찰은 자백을 받아 범죄를 입증할 계획을 세우고 각 범죄자들을 대상으로 심문을 한다.

이때 경찰은 범죄자가 자백을 할 수 있는 기회를 주며, 두 공범에게 아래와 같은 동일한 제안을 한다. 

 

 

내가 만약 두 공범 중의 한 사람이라면 어떤 선택을 할까?

간단하게 설명하면 상대가 자백하던지, 반대로 묵비권을 행사하던지 상관없이 자신은 자백하는 것이 자신의 이익을 지키는 제일 나은 선택이다.

이것이 바로 '우월전략'으로 상대가 뭘 하든지 자신의 이익을 최대한 추구하는 전략이다.

하지만 내가 자백을 하든지 묵비권을 행사하든지 상대방이 자백하는 것 또한 상대방에게 제일 나은 선택이다.

그렇다면 결국 둘 다 10년의 징역을 살게 된다.

이것은 두 사람이 모두 징역 1년을 살게 되는 것보다 기간이 더 길어지는 결과를 낳는다.

분명 상황을 분석하여 가장 합리적인 선택을 했지만 그 결과는 최악의 상황인 것이다.

'개인의 합리적인 선택이 반드시 최선의 결과로 이어지지 않는다'라는 결론이 바로 죄수의 딜레마에서 알 수 있는 시사점이다.

 

 

 

반복되는 죄수의 딜레마(Iterated Prisoner's Dilemma)

실험과 Tit-for-Tat 

 

죄수의 딜레마를 한 번이 아니라 여러 차례(200회) 시행한다면 매번 자백을 할지 묵비권을 행사할지를 결정해야 한다.

반복되는 죄수의 딜레마 실험의 취지는 합리적인 사고가 최선을 결과를 이끌어내지 않는다는 것을 인정하고 어떤 전략이 가장 효율적인지 알아보는 것이다.

이를 위해 1980년 정치학자인 '로버트 엑셀로드'는 반복적인 죄수의 딜레마 게임에서 최대 이익을 얻기 위한 전략을 서로 겨루어 보자고 대회를 제안했다.

모두 15개의 프로그램들이 전략을 제시했는데, 최종적으로 1등을 차지한 전략이 우 4줄 밖에 안 되는 프로그램이었다.

그것은 '팃포탯(Tit-for-Tat)'이라고 불리는 프로그램이었다.

'Tit'과 'Tat'은 '가볍게 치기'를 의미한다.

즉 'Tit for Tat'은 '상대가 가볍게 치면 나도 가볍게 친다'는 뜻으로 '눈에는 눈, 이에는 이'라는 말에 해당한다. 

팃포탯 전략을 풀어보면 아래와 같다.

 

① 처음에는 협력하고 먼저 배신하지 않는다.

② 상대방이 협력했으면 협력하고, 배반했으면 배반한다.

 

여기서 주목할 점은 상대가 한번 배신했던 상대라도 시 협력의 손길을 내밀면 협력해 준다는 것이다.

즉 198회 배신한 상대가 199회에 협력을 한다면 200회에는 다시 협력한다는 것이다.

엑셀로드는 1차 대회의 결과를 널리 알리고 보다 많은 사람들을 참가시켜 2차 대회를 열었다.

2차 대회에는 모두 63개의 프로그램이 참가했으며 팃포탯이 또 1등을 차지했다.

이는 상당히 놀라운 일이었다.

1차 대회의 우승자인 팃포탯의 전략은 모든 각도에서 분석되어 참가자들에게 그 자료가 제공되었기 때문이다.

두 번의 대회를 통해 엑셀로드가 내린 결론은 '최대 이익을 창출하는 가장 효과적인 행동은 상대방을 속이는 것이 아니라 서로 협력하는 것이다'이다.

그리고 '상대방이 협력하지 않으면 즉각적으로 보복에 나서는 의지를 지녀야 협력체계를 유지할 수 있다'이다. 

 

 

팃포탯에 인간적인 개념을 대입해보면 정말로 이상적인 인간상이 된다.

처음 보는 사람에게 무조건 협력의 제스처를 내미는 선량함을 가졌다.

또한, 자신에게 가해진 위해를 용납하지 않고 즉각적으로 보복하며 불의를 참지 못한다.

상대방이 스스로 뉘우치는 행동을 보이면 과거를 잊고 다시 화해의 손길을 내미는 관용을 가지고 있다.

즉 기본적으로 착하고 신사적이지만, 배신을 용납하지 않는다.

또한, 잘못을 저지른 사람을 몇 번이고 용서할 줄 아는 넓은 마음을 가진 것이다.

이는 모든 종교의 근본 이념인 사랑과 용서와도 일맥상통한다.

죄수의 딜레마는 배신을 가장 합리적인 전략이라고 상정하지만,

우리가 굳이 '열등 전략'인 협력을 선택해야 하는 이유를 팃포탯 전략을 통해 설명할 수 있다.

 

 

 

 

 

[정답]

IPD실험을 하나의 사회라고 본다면

착하게 살 것인지 나쁘게 살 것인지를 협력과 배신의 선택으로 볼 수 있다.

IPD실험에서 팃포탯 전략의 우수함은 두 차례 우승으로 증명 되었으며,

팃포탯 전략은 협력을 기본 원칙으로 삼는다.

우리가 삶의 원칙을 협력(=착하게 살기)으로 한다면,

행복한 삶 즉 게임에서 이길 수 있다.

따라서 죄수의 딜레마에서 우월 전략인 배신을 선택하지 않고

열등 전략인 협력(=착하게 살기)을 선택해야 하는 근거가

바로 팃포탯 전략이라고 할 수 있다.

 

당첨을 축하드립니다!

ID : hangyul0528

 

참여한 친구들

번호 제목 센터명 작성자 등록일
3정답yubeen2017-03-08
2정답임다~~~!!!hanjun072017-03-02
1정답입니다다다다(팃포텟에 관한 의견)hangyul05282017-02-28