다른 한 아이의 성별 추정 문제

다른 한 아이의 성별 추정 문제

「행동경제학」을 보면 다음 문제가 나온다. 이 문제의 정답은 상식과 어긋난다. 스스로 답을 한번 구해보아야 왜 흥미로운지를 알 수 있다.

우리집 옆으로 이사온 가족은 아이가 2명이다. 아들인지 딸인지는 모른다.

(문제 1) 이웃집 아주머니에게 ‘딸이 있으세요?’ 물었더니 대답은 ‘네’였다. 다른 한 아이도 딸일 확률은 얼마인가?

(문제 2) 이웃집 아주머니에게 ‘큰 아이가 딸입니까?’라고 물었더니 대답은 ‘네’였다. 다른 한 아이도 딸일 확률은 얼마인가?

(문제 3) 이웃집 아주머니이 딸을 1명 데리고 걷고 있는 것을 보았다. 다른 한 아이도 딸일 확률은 얼마인가?

$ \frac{문제에서 말하는 경우의 수}{모든 가능한 상황} $로 확률을 계산하려면 표본공간 $ \Omega $가 등확률인 근원사건으로 구성되어 있어야 한다. (첫째의 성별, 둘째의 성별) 로 정의하되, 남자는 □ 여자는 ★로 표기한다.

\[\Omega = \{(□, □), (□, ★), (★, □), (★, ★)\}\] \[P[(□, □)] = P[(□, ★)] = P[(★, □)] = P[(★, ★)] = 1/4\]

문제 1

이웃집 아주머니에게 ‘딸이 있습니까’라고 물었더니 대답은 ‘네’였다. 다른 한 아이도 딸일 확률은 얼마인가?

이웃집 아주머니의 답은 “딸이 적어도 하나 있다”는 뜻과 동일하다. 가능한 상황($ A_1 $)은 (□, ★), (★, □), (★, ★)이다. 이 중에서 다른 아이도 여자인 사건($ B $)은 (★, ★) 하나 뿐이므로 답은 1/3 이다.

\[A_1 = \{(□, ★), (★, □), (★, ★)\}\] \[B = \{(★, ★)\}\] \[P[B\ \mid A_1] = \frac{P[A_1 \cap B]}{P[A_1]} = \frac{1/4}{3/4} = \frac{1}{3}\]

문제 2

이웃집 아주머니에게 ‘큰 아이가 딸입니까?’라고 물었더니 대답은 ‘네’였다. 다른 한 아이도 딸일 확률은 얼마인가?

큰 아이가 딸인 상황($ A_2 $)은 (★, □), (★, ★) 이다. 이 중에서 다른 아이도 여자인 사건(B)은 (★, ★ 하나 뿐이므로 답은 1/2 이다.

\[A_2 = \{(★, □), (★, ★)\}\] \[B = \{(★, ★)\}\] \[P[B\ \mid A_2] = \frac{P[A_2 \cap B]}{P[A_2]} = \frac{1/4}{2/4} = \frac{1}{2}\]

문제 3

이웃집 아주머니이 딸을 1명 데리고 걷고 있는 것을 보았다. 다른 한 아이도 딸일 확률은 얼마인가?

문제 3을 읽고 문제 1과 아무런 차이도 없다고 속단해 답이 1/3이라고 생각했다.

결론적으로 문제 3은 문제 1이 아닌 문제 2와 유사한 상황이다. 문제 2는 두 자식 중 “첫째” 자식이 딸이라는 정보를 주고, 문제 3은 두 자식 중 “내 눈에 목격된” 자식이 딸이라는 정보를 준다. 반면, 문제 1은 두 자식 중 “특정되지 않은” 자식이 딸이라는 정보를 준다. 특정된 자식이 딸이라는 정보인지(문제 2~3), 특정되지 않은 자식이 딸이라는 정보인지(문제 1)가 다른 것이다.

표본공간을 새로 정의하면 풀이가 깔끔해진다. 이상의 문제풀이에서 (첫째의 성별, 둘째의 성별)로 표본공간을 구성했던 것과 달리, 이 문제를 위해서는 (동행 중인 자제의 성별, 동행 안한 자제의 성별) 로 정의한다. 남자는 ○ 여자는 ▲로 표기한다.

\[\Omega' = \{(○, ○), (○, ▲), (▲, ○), (▲, ▲)\}\]

새로운 표본공간 $ \Omega’ $ 은 $ \Omega $와 같이 등확률인 근원사건으로 구성되었다. $ \Omega’ $ 와 $ \Omega $의 근원사건은 다음과 같이 대응된다. 즉, 표본공간 $ \Omega $에서도 문제 3을 풀 수는 있지만, 그냥 식이 복잡해질 뿐이다.

표본공간 $ \Omega $와 $ \Omega' $의 근원사건간 일대일 대응
$ \Omega $ $ \Omega' $ 확률
(□, □) (○, ○) 1/4
(□, ★) (○, ▲), (▲, ○) 중 50%의 확률로 하나 1/4
(★, □) (○, ▲), (▲, ○) 중 50%의 확률로 하나 1/4
(★, ★) (▲, ▲) 1/4
\[A_3 = \{(▲, ○), (▲, ▲)\}\] \[B = \{(▲, ▲)\}\] \[P[B\ \mid A_3] = \frac{P[A_3 \cap B]}{P[A_3]} = \frac{1/4 }{2/4} = \frac{1}{2}\]

시사점

이 문제를 해석하면, 특정된 자식에 대한 정보를 받았을 때, 그 외의 자식에 대한 성별 추정은 하나의 독립사건처럼 남, 여 중 하나의 문제로 귀결된다는 점이다. 그래서 문제 2~3의 답은 1/2이다.

반면, 특정되지 않은 자식에 대한 정보를 받았을 때, 그 외의 자식에 대한 성별 추정은 특정되지 않은 자식이 누구인지에 종속되게 된다. 그래서 1/3이라는 기묘한 답이 나온다.

아울러, 모든 사건들을 나열하고 가짓수를 세는 방법은 아주 직관적이지만, 그 직관을 이용할 때에는 문제 상황을 기술할 수 있도록 표본공간을 엄밀히 정의해야 한다는 교훈도 얻는다.