어제 연구실 회식을 갔다가, 박사과정에 있는 연구실 선배가 얼마 전에 댕했다는 돌발 퀴즈에 관해 들었다.
조금 간단히 변형해서 여기에 쓰자면,
버스가 평균적으로 20분 걸려서 도착하는 버스 정류소에서, 10분 전에 버스가 지난 것을 알게 되었다. 버스가 올 때 까지 “얼마나 기다릴 것”이라고 예측되는가?
(단, 버스의 도착 간격은 exponential distribution을 따른다) ((지진의 발생이나 버스의 도착, 혹은 은행 같은 곳의 줄 서는 것이라거나, 전화선에 전화 요청이 오는 것 등은 이렇게 발생/도착 간격이 이상적으로 봤을 때 exponential distribution을 따르는 값으로 보이게 된다))
라는 문제.
Queueing theory; 대기열 이론 을 자주 다루게되는 내가 있던 연구실에선 아주 간단한 문제지만(…), 답은 상당히 비직관적이다. 지나가던 사람을 붙잡고 — 내 경우야 IRC에서 후배를 붙잡고(…) — 이 문제를 냈더니 고민하더라고;
답은 20분 이다.
설명하자면, 흔히 memoryless property라고 부르는 exponential random variable 특성이 작용한 것인데, 조건부 확률로 쓰면, 기다릴 시간을 T라고 했을 때,
P( T > t + 10 | T > 10 ) = 10분 기다렸는데 t 분 기다릴 확률
라는 확률 분포가 된다. 정작 여기에 확률 밀도 함수;probability density function 을 넣어서 적분하면, 저 식 자체가 P( T > t)인 원래 값으로 되돌아가서(…), 이걸 적분해서 얻어지는 결과로 평균적으로 “20분” 기다린다는 결론이 난다.
자신이 보기에 직관적인가 비직관적인가? 사실 익숙하다면 바로 답이 나오는 문제이긴하지만[…].
이건 묵교수님께서 내셨던 공수2 문제 아닌가! 난 이런 종류의 지식을 직관적으로 쉽게 이해 하는 사람이 참 신기하다는 ;;; 난 이런 거 이해 하려면 머리싸매고 하루 종일 끙끙되야 함 ;;;
정류소에 왔을 때 마지막으로 버스가 언제 지나갔는지를 아는지 모르는지의 여부가 다음 버스가 오는 시간에 영향을 미치는가? 하는 질문에 영향이 없다고 한다면 문제에 평균 20분이라고 했으니 답은 20분이 되는군요…;
수원 / 제목에 썼듯이(후략). 근데 저것도 좀 익숙(?)해지다보면 다 짬밥통밥으로(…)
danew / 그 질문에 대한 답변을 선택하는게 문제가 아니라, 그 문제에 대한 답은 “생각할 필요가 없다”가 되는거지요;
그냥 단순히 (기다릴 시간 * 확률) 을 합해보는것만으로도 위에서 설명한 결론이 나옵니다 ~_~
exponential distribution 자체가 좀 비직관적이지.;
근데 분석하는 현상만 놓고보면 exponential은 그런대로 “말이되는” 분포이긴 하지 않냐 ~_~
(직관성과는 좀 별개로; 그래서 고민만 좀 많이하고나면(후략) )
제가 바로 그 후배[…]
당연하다 생각했는데, 갑자기 이런 걸 물어보길래 낚시인 줄 알고 잠깐 검색했었음[..]
당연한걸 당연하게 받아들일 때 그 부분을 넘어가게(?) 되는거지…