Link:INB Home|INB English| INB русский язык|INB العربية|INB Türkiye|INB فارسی|INB Español|INB Français|INB Português|INB Deutsch|INB 國語|INB 中文|INB 日本语|INB 한국어|INB ภาษาไทย|INB tiếng Việt||[연재] 휴대폰·이메일 사용의 ‘폭발성’ 어떻게 설명되나?
INB 한국어 포럼
(산업 및 기본 과학자)에 오신 것을 환영합니다 여기에 산업 시대는 원시 생물 정신 과학자와이 네트워크 공간을 통해 당신과 내가 둘 다 미친 실험실에 온, 투지로 가득하다. 홈 INBforum.com, 영구 이름 :twtmo.forums2u.com
INB 한국어 포럼

(산업 및 기본 과학자)에 오신 것을 환영합니다 여기에 산업 시대는 원시 생물 정신 과학자와이 네트워크 공간을 통해 당신과 내가 둘 다 미친 실험실에 온, 투지로 가득하다. 홈 INBforum.com, 영구 이름 :twtmo.forums2u.com


You are not connected. Please login or register

《《《《《《《上一页INBforum   Go down

上一页INBforum》》》》》》》이전 주제 보기 다음 주제 보기 Go down  메시지 [페이지 11]

1 [연재] 휴대폰·이메일 사용의 ‘폭발성’ 어떻게 설명되나? on Tue Apr 19, 2011 4:01 pm

Admin


Admin
BY [You must be registered and logged in to see this link.] l 2011.03.30


사회물리학의 낯선 여행 (5)









[You must be registered and logged in to see this image.]

한겨레 자료사진/ 장철규 기자





요즘은 집전화 뿐 아니라 전자우편(이메일), 휴대폰, 인터넷폰 등이 중요한 의사소통의 수단으로 쓰이고 있지요. 특히 휴대폰의 경우에는 하루가 다르게 새로운 모형이 출시되고 새로운 기능이 덧붙여지고 쓰임새도 다양해지고 복잡해지고 있습니다. 저도 나름 적응하려고 하지만 대개 뒤처지는 편입니다. 그런데 어쩌다보니 핀란드에 와서 하고 있는 연구가 휴대폰 이용 패턴에 관한 것입니다.




여기서 질문을 하나 해볼까요.



여러분은 이메일이나 휴대폰을 얼마나 자주 이용하시나요? 다시 말해서 한 번 통화를 한 뒤 또는 이메일을 보낸 뒤 다음 번 통화할 때 또는 이메일을 보낼 때까지 걸리는 시간이 대략 어느 정도 되나요? 어떤 규칙이나 패턴이 있는지, 아니면 내킬 때마다 무작위하게 이용하는지, 전화나 이메일이 오는 것도 무작위한지 어떤지 생각해봅시다.









사례연구: 휴대폰 이용 패턴을 그려보자






아래 그림은 유럽의 어떤 통신회사로부터 얻은 자료에서 비교적 활발히 휴대폰을 이용한 사람 중 아무나 한 명을 뽑아 휴대폰 이용 패턴을 그려본 것입니다. 6부터 7까지는 월요일, 7부터 8까지는 화요일이며 휴대폰으로 음성 통화(받거나 걸거나)를 하기 시작한 순간을 빨간 세로줄로 표시했습니다. 참고로 모든 자료는 초 단위로 기록되어 있습니다. 이 이용자는 아마도 밤부터 새벽까지는 잘 테고 아침이나 점심시간 무렵에 종종 휴대폰을 이용하며 오후부터 저녁까지는 일이나 공부 등을 하느라 통화를 하지 않다가 저녁부터는 휴대폰을 꽤 많이 사용하는 것으로 보입니다. 물론 저 혼자만의 상상의 나래입니다.



[You must be registered and logged in to see this image.]

사실 위에 그린 이틀 분량의 자료만으로는 알 수 있는 게 별로 없습니다. 저 이용자가 누구인지 전혀 알 수 없을 뿐 아니라 통화내용 역시 전혀 모르기 때문에 어떤 동기로 전화를 했는지 또는 전화를 받아 무슨 얘기를 들었는지 모릅니다. 하지만 1년에 이르는 기간 동안 수백만의 이용자들이 언제 휴대폰을 이용했고 얼마나 오래 통화했는지를 기록한 자료가 있으므로 통계적인 특성을 파악할 수 있습니다.




마크 뷰캐넌의 <사회적 원자>에 비추어 말해보자면, 수백만의 사회적 원자들이 모인 집합 행동을 통계적으로 파악할 수 있지만 각 사회적 원자의 내부구조를 알 수는 없는 상황입니다. 각 사회적 원자의 내부구조를 들여다보기 위해 실제 원자를 들여다볼 때처럼 고성능의 실험기기가 필요하지 않지만 그렇다고 저 사람들을 붙잡고 휴대폰을 이용할 때마다 왜 이용하느냐고 무슨 얘기를 주고받았냐고 물어보기도 쉽지 않은 일입니다. 물론 심리학이나 사회학에서 발달해온 조사 방법을 이용하여 조사, 분석할 필요가 있고 그런 이해를 바탕으로 할 때에만 더 올바르게 현상을 바라볼 수 있겠죠.









완전한 규칙과 완전한 무작위 사이의 실제 상황






이 글에서는 물리학자들이 이 문제에 어떻게 접근하는지를 소개하겠습니다. 가장 먼저 던질 수 있는 질문 중 하나는 “저 시계열(통화 시각을 나열한 것)은 어떠한 규칙에 의한 결과인가?”입니다. 두 극단을 생각해보면 하나는 일정한 주기를 갖는 완전히 규칙적인 과정이고 다른 하나는 완전히 무작위적인 과정, 즉 푸아송 과정(Poisson process)입니다.



[You must be registered and logged in to see this image.]

[You must be registered and logged in to see this image.]

원래 시계열과 똑같은 통화 회수를 갖되 완전한 규칙 과정(위)과 완전한 무작위 과정(아래)의 시계열을 만들어봤습니다. 어느 쪽이 실제 시계열과 더 비슷해 보이나요? 아무래도 규칙적인 과정보다는 무작위 과정이 실제와 더 비슷해 보이지만 실제와는 여전히 꽤 큰 차이가 있습니다. 이 차이를 더 분명하게 드러내기 위해, 한 번 통화를 하고나서 다음번에 통화할 때까지의 시간 간격, 즉 사건 사이 시간 (inter-event time)의 분포를 보겠습니다.




일단 완전히 규칙적인 과정에서 사건 사이 시간은 모두 똑같습니다. 무작위 과정에서는 짧은 사건 사이 시간은 많지만 긴 사건 사이 시간은 적지요. 사건 사이 시간의 분포는 지수함수 꼴인데 쉽게 말해 두꺼운 꼬리와 반대로 얇은 꼬리를 갖고 있습니다.




그렇다면 실제 시계열의 사건 사이 시간의 분포는 어떤 모양일까요? 네, 두꺼운 꼬리를 갖는 거듭제곱 분포입니다. 바라바시(A.-L. Barabasi)는 2005년에 <네이처>에 낸 논문[You must be registered and logged in to see this link.]에서 이메일 이용 기록에서 관찰된 사건 사이 시간이 거듭제곱 분포를 따른다고 발표합니다. 그의 책 <버스트>에도 이 내용이 소개되어 있지요.









바라바시의 연구: ‘폭발성’을 보여주는 패턴의 발견






[You must be registered and logged in to see this image.]사건 사이 시간의 분포가 거듭제곱 꼴이라는 게 무슨 뜻일까요. 옆 그림에서 보듯이 지수함수 분포와 마찬가지로 짧은 사건 사이 시간은 많고 긴 사건 사이 시간은 적습니다. 하지만 지수함수 분포보다 긴 사건 사이 시간이 나타나는 경우가 훨씬 많아서 분포의 꼬리(그림의 오른쪽 아래 부분)가 두꺼워진다는 차이가 있습니다.



이제 실제 시계열을 아래처럼 ‘편의상’ 가까이 모여 있는 사건들을 묶어서 다시 그려보면 두꺼운 꼬리가 어떤 의미인지 분명해집니다. 각 묶음 사이의 긴 공백이 바로 긴 사건 사이 시간을 뜻하며, 완전한 무작위 과정에 비해 실제 현상에서는 긴 사건 사이 시간이 훨씬 많이 나타남을 알 수 있습니다. 이로 인해 오랫동안 기다린 후 그동안 밀린(?) 사건들이 몰아서 나타나게 됩니다.



[You must be registered and logged in to see this image.]



물론 어떤 기준으로 가까운 사건들을 묶을 수 있느냐에 명쾌한 답은 없습니다. (실은 명쾌한 기준이 없다는 사실이 더 중요합니다.) 화요일 정오(위 그림에서 7.5로 표시된 곳) 양 옆의 두 묶음은 ‘묶음 기준’을 완화하면 하나의 묶음이 될 수도 있습니다. 이렇게 시계열이 어느 정도 잘 정의된 묶음들로 표현되는 현상을 한 마디로 ‘버스트(burst; 폭발성)’라고 합니다.




그런데 지금까지 ‘두꺼운 꼬리’와 ‘거듭제곱 분포’를 섞어 썼는데 두꺼운 꼬리를 가졌다고 모두 거듭제곱 분포인 것은 아닙니다. 인간 행동의 시계열에서 두꺼운 꼬리가 나타난다는 사실은 변함이 없지만 그것이 거듭제곱 분포인지 로그정규분포인지 또는 그 외 어떤 함수로 표현되는지에 따라 그 시계열에 숨어 있는 규칙이나 메커니즘을 다르게 이해할 수 있습니다. 다양한 관점이 제안될 수 있고 그래서 어느 해석/모형이 더 적절한지 논란이 벌어지기도 합니다. 바라바시의 2005년 논문이 이런 논란을 불러일으켰고 여전히 진행되고 있습니다.









바라바시의 모형: 거듭제곱 분포, 사건 폭발성은 일의 우선순위 때문






바라바시는 2005년 논문에서 이메일의 사건 사이 시간 분포가 거듭제곱 지수가 -1인 거듭제곱 분포임을 보인 뒤 이를 이해하기 위해 간단한 모형을 제시합니다. 제가 사람들로부터 이메일을 받을 때마다 답장해야 한다고 합시다. 저의 일 목록에 ‘갑에게 답장’, ‘을에게 답장’ 등이 추가됩니다. 이때 할 일마다 중요도, 즉 우선순위가 다릅니다. 이를테면 ‘갑에게 답장’에는 0.7, ‘을에게 답장’에는 0.2의 중요도를 정해줍니다. 한 시간마다 답장을 하나씩만 쓸 수 있는데 우선순위가 가장 높은 답장만 씁니다. 일을 하나 처리하면 그 빈자리에 ‘병에게 답장’ 같은 새로운 일이 추가됩니다. 각 일에 정해지는 중요도는 0과 1 사이의 무작위 수라고 가정합니다.




이제 어떤 일(즉 받은 이메일에 대한 답장)이 목록에 추가된 후 처리될 때까지 걸리는 시간의 분포를 구할 수 있습니다. 그 결과 거듭제곱 지수가 -1인 거듭제곱 분포가 얻어집니다. 여기서 일이 추가된 후 처리될 때까지 걸리는 시간은 ‘기다림 시간(waiting time)’으로 정의합니다. 참고로 사건 사이 시간은 한 번 이메일을 보낸 후 다시 보낼 때까지 걸린 시간이므로 기다림 시간과는 조금 다릅니다. 바라바시의 간단한 모형에서 얻어진 기다림 시간의 거듭제곱 분포는 실제 사건 사이 시간의 거듭제곱 분포와 정확히 일치하지 않지만 둘 다 같은 분포를 보일 것이라고 논의합니다.




그리고 일 목록에 있는 일의 개수가 고정되어 있으면 지수가 -1이고 일이 생기고 처리되는 속도에 따라 일의 개수가 시간에 따라 변한다면 지수가 -3/2임이 알려져 있습니다. 실제로 아인슈타인, 다윈, 프로이트 등이 편지를 주고받은 자료로부터 거듭제곱 지수 -3/2가 발견되었고[You must be registered and logged in to see this link.] 앞서 말한 휴대폰 이용 패턴에서는 약 -0.7의 거듭제곱 지수가 얻어졌습니다.




거듭제곱 분포에서 지수가 다르다는 건 어떤 거시적인 요인이 작용한다는 걸 뜻합니다. 그런데 이 글에는 공간보다 시간을 다루므로 여기서 ‘거시’는 ‘긴 시간규모’로 해석하면 됩니다. 이는 흔히 ‘기억 효과’로 불리기도 합니다. 지금까지 어떤 일이 일어났는지와 무관하게 다음 일을 정하는 기억이 없는 경우와 달리 휴대폰, 이메일 이용 패턴에서는 과거의 일이 먼 미래에도 영향을 끼친다고 할 수 있습니다. 미래에 영향을 끼치는 정도에 따라 거듭제곱 지수가 달라질 수 있고, 바라바시 모형의 경우 ‘일 목록의 크기가 고정되는지 여부’가 거듭제곱 지수를 바꾸는 중요한 요인이라는 말입니다.




지금까지 통계물리나 확률 과정의 여러 모형에서 나타나는 거듭제곱 분포를 소개할 때면 늘 보편성이나 보편성 부류에 대한 논의가 따라옵니다. 휴대폰, 이메일의 경우에도 보편성 부류를 논의할 수 있는지 모호한 측면이 있습니다. 이용자마다 거듭제곱 지수가 조금씩 달라지기도 하는데 이 작은 차이를 보편성으로부터의 오차로 이해할 것인지 아니면 보편성이 없다고 이해할 것인지 확정하기 힘들기 때문입니다.




여기서 중요한 점은 인간 행동에 관한 시계열에서 나타나는 거듭제곱 분포를 그럴듯하면서도 간단한 모형으로 설명하고자 했다는 점입니다. 우리는 할 일들에 중요도/우선순위를 매기고 중요한 일부터 하는 경향이 있으며 바로 이것이 거듭제곱 분포의 원인이라는 주장입니다. 어쩌다 중요도가 매우 낮은 일이 생겼다면 이 일은 다른 새로운 더 중요한 일에 밀려서 처리되기까지 오랜 시간이 필요하며 기다림 시간 분포의 꼬리를 두껍게 합니다.






아마랄의 반론: 로그정규분포일 뿐이며 두꺼운 꼬리는 생활주기 탓





바라바시의 설명과 모형에 대한 반론이 바로 제기되었습니다. 주로 아마랄(L.A.N. Amaral) 그룹에서 제기된 반론[You must be registered and logged in to see this link.][You must be registered and logged in to see this link.]은 일단 사건 사이 시간의 분포는 거듭제곱 분포보다는 로그정규분포에 가깝다는 것입니다. 또한 긴 사건 사이 시간은 ‘중요도가 낮은 일’보다는 이메일 이용자들이 밤에는 자고 주말에는 일을 하지 않는 ‘생활 주기’에 의한 결과라는 주장입니다.



로그정규분포는 정규분포가 변형된 형태인데 역시 두꺼운 꼬리를 보이며 꼬리만 보면 거듭제곱 지수가 -1입니다. 이메일 자료를 꼬리만이 아니라 전체적으로 보면 로그정규분포에 더 가깝다는 주장이 통계적 검정 결과에 근거하여 제시됩니다. 또한 이메일 이용은 아무래도 업무나 공부 등 주중 낮 시간에 하는 활동에 연관되므로 밤 시간이나 주말 동안의 쉬는 시간이 당연히 두꺼운 꼬리에도 영향을 줄 것입니다.



이 주장을 정량적으로 뒷받침하기 위해 이들은 앞서 소개한 무작위 푸아송 과정을 변형한 더 복잡해진 푸아송 과정 모형을 제시합니다. 사건이 일어날 확률이 언제나 일정한 원래 푸아송 과정과 달리, 사건이 일어날 확률이 요일이나 시각에 따라 변하는데 이를 실제 이용자들의 일간/주간 이용 패턴을 측정하여 집어넣습니다.



또한 그 확률에 의해 일단 한 사건이 일어나면 연달아 다른 사건들이 일어나도록 함으로써 사건의 ‘폭발성’이 가능케 합니다. 이를테면 다른 일을 하다가 이메일을 확인하러 자리에 앉으면 이왕 앉은 김에 여러 통의 이메일을 확인하고 또 답장을 보낸 뒤에 다시 다른 일을 하러 간다는 말입니다. 일간/주간 패턴에 의해 긴 사건 사이 시간이 설명되고 ‘연달은 사건’에 의해 짧은 사건 사이 시간(폭발성)이 설명됩니다. 그리고 그렇게 얻어진 전체적인 사건 사이 시간 분포는 실제 분포와 매우 닮았습니다.






‘바라바시 vs 아마랄’ 논쟁을 풀 방법은 없을까?





자 이제, 여러분은 “중요도가 다른 일들 때문에 두꺼운 꼬리 분포가 나타난다”는 바라바시의 설명과 “일간/주간 패턴 때문에 두꺼운 꼬리 분포가 나타난다”는 아마랄 그룹의 설명 중 어느 쪽에 손을 들어 주겠습니까? 물론 과학은 인기투표도 아니고 다수결도 아닙니다. 다만 어느 쪽도 확실한 증거를 제시하지 못하는 문제에 부딪혔을 때, 우리는 그 문제를 해결하기 위해 직관과 느낌에 기댈 때도 있습니다.



그런데 사실 이건 양자택일의 문제로 보기도 힘듭니다. 분명 우리는 밤에 잠을 자고 주말에는 쉬지만 또한 뭔가 일을 할 때에는 중요한 일부터 하는 경향을 보이기 때문이죠. 분명 두 가지 요인이 모두 작용합니다. 하지만 각 요인이 전체 결과에 얼마나 영향을 끼치는가, 그래서 어느 쪽이 더 큰 설명력을 갖는가는 여전히 남겨진 문제입니다.



이 논란을 해결하는 데 보탬이 되고자 제가 생각해낸 아이디어는 일간/주간 패턴을 시계열에서 제거한 뒤에도 여전히 사건 사이 시간이 거듭제곱 분포를 나타내는지 아닌지 보자는 것이었습니다.[You must be registered and logged in to see this link.] 일간/주간 패턴만이 두꺼운 꼬리의 원인이라면 일간/주간 패턴을 제거함으로써 두꺼운 꼬리도 사라질 것입니다. 하지만 그게 아니라면 두꺼운 꼬리는 여전히 남아 있을 테고 일간/주간 패턴만이 원인이라고 할 수 없습니다.



일간/주간 패턴을 없애는 방법으로 시간축을 고무줄처럼 적당히 늘이거나 줄이는 방법을 씁니다. 한 이용자의 휴대폰 이용 시각들을 고무줄 위에 펜으로 표시해봅시다. 사건의 밀도가 높은 활성 시간대는 시간축을 잡아 늘임으로써 사건의 밀도를 낮추고, 사건의 밀도가 낮은 비활성 시간대는 시간축을 줄임으로써 밀도를 높여 전체적인 밀도를 모두 균일하게 만들 수 있습니다. 여기서 말한 시간에 따른 사건의 밀도가 바로 일간/주간 패턴을 뜻합니다. 이 밀도에서 패턴을 제거한 새로운 시간축을 얻은 뒤에 거기에서 사건 사이 시간을 다시 계산하여 그 분포를 보면 됩니다. 다시 말해서 고무줄을 늘이거나 줄이면 그 위에 표시된 이용 시각의 위치가 변합니다. 그 새로운 위치로부터 사건 사이 시간을 다시 계산할 수 있습니다.



여기서 사건의 밀도를 모든 이용자에 대해 측정하여 일관되게 쓸 것인지, 아니면 개인의 활동 정도에 따라 그룹을 나누어 사건의 밀도를 그룹별로 측정할 것인지, 아니면 개인별로 측정할 것인지에 관한 조금 미묘한 문제가 있습니다. 적어도 우리가 시도한 방법에 의하면 휴대폰 자료의 경우에 일간/주간 패턴을 제거하고도 여전히 사건 사이 시간은 두꺼운 꼬리(더 나아가 거듭제곱 분포)를 보여주고 있습니다. 다시 말해서 밤에 자고 주말에 쉬는 효과를 보정해주더라도 휴대폰 이용 패턴에는 여전히 ‘폭발성’이 남아 있으며, 구체적으로 말해서 사건 사이 시간 분포가 보정에 의해 거의 변하지 않음을 보았습니다.



앞서 말했듯이 두꺼운 꼬리의 원인인 긴 사건 사이 시간은 밤에 자고 주말에 쉬기 때문에 나타날 수도 있지만 우리가 할 일들에 서로 다른 중요도를 부여하기 때문일 수도 있습니다. 그렇게 보면 두 요인 중 하나를 제거한다고 해서 두꺼운 꼬리가 사라지지 않는 게 당연해보일 수도 있습니다.



하지만 바라바시의 모형은 인간 행동을 매우 단순하게 바라볼 뿐 아니라 그가 한 가정도 (제 소견으로는) 증명된 바 없기에 아직 하나의 가설에 불과합니다. 개개인이 자신의 일을 처리할 때 엄밀한 규칙이나 우선순위에 따라 하더라도 다양한 외부요인에 의해 결과적으로 매우 무작위하게 보일 가능성도 있습니다. 휴대폰만 하더라도 자신이 전화를 걸 때는 일정한 규칙과 습관이 있을지라도 걸려오는 전화는 더 무작위하게 느껴집니다.



만일 이게 사실이라면 바라바시의 모형보다 ‘다양한 외부요인’이 더 중요해집니다. 물론 그 외부요인에는 밤에는 자야 하는 물리적, 생물학적 조건이 포함될 것입니다. 이런 외부요인을 적절히 제거하고 나서도 여전히 거듭제곱 분포일지 아닐지는 해보기 전에 확실히 대답할 수 없습니다.






물리학 안팎의 학제간 연구가 필요하다





계속해서 관련된 연구가 이루어지고 있지만 인간 행동에 관해 물리학자들끼리만 논쟁을 하면 분명한 한계가 있게 마련입니다. 바라바시의 모형은 ‘왜 거듭제곱 분포가 나타나는가’에 대한 그럴듯한 가설이지만 그 가정들이 정당화되지 않는 이상 가설로 남을 수밖에 없습니다. 아마랄 그룹의 반박과 그들이 제시한 모형은 실제 자료에 더 잘 맞지만, 실제 자료에서 뽑아낸 변수들을 모형에 그대로 넣었기 때문에 그만큼 모형 자체의 설명력이 떨어집니다. 그들의 주장도 일리는 있지만 제가 얻은 결과에 비추어보면 여전히 설명되지 않는 부분이 남습니다.



결국 이 문제를 제대로 해결하려면 ‘사회적 원자’의 ‘내부구조’를 알아야 합니다. 즉 사람들은 언제 어떤 동기로 왜 통화를 하고 이메일을 이용하는지, 정보를 주고받는 다른 사람들과의 관계가 한 사람의 휴대폰, 이메일 이용 패턴에 어떤 영향을 끼치는지 등을 알아야 합니다. 제가 물리학 외에 어떤 분야에서 어떤 관련된 연구가 있는지 모르기 때문일 수도 있습니다. 저의 한계이기도 하고 어쩌면 물리학자들의 한계이기도 합니다. 더 많은 학제간 소통이 필요한 이유이기도 합니다.







1) A.-L. Barabasi, Nature 435, 207 (2005).[You must be registered and logged in to see this link.]
2) A. Vazquez, J.G. Oliveira, Z. Dezso, K.-I. Goh, I. Kondor, A.-L. Barabasi, Physical Review E 73, 036127 (2006).[You must be registered and logged in to see this link.]
3) D.B. Stouffer, R.D. Malmgren, L.A.N. Amaral, [You must be registered and logged in to see this link.][You must be registered and logged in to see this link.]
4) R.D. Malmgren, D.B. Stouffer, A.E. Motter, L.A.N. Amaral, Proceedings of National Academy of Science (USA) 105, 18153 (2008).[You must be registered and logged in to see this link.]
5) H.-H. Jo, M. Karsai, J. Kertesz, K. Kaski, [You must be registered and logged in to see this link.][You must be registered and logged in to see this link.]]

사용자 정보 보기 http://kr.inbforum.com

上一页INBforum   Go down

上一页INBforum이전 주제 보기 다음 주제 보기 위로  메시지 [페이지 11]

Permissions in this forum:
답글을 올릴 수 없습니다

Copyright ©2009-2010 LTD Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.

IT:SINGLESERVGoogle谷歌翻译TranslateFORUMSOFTLAYERGoogle谷歌广告联盟AdSenseAsia

 

Free forum | © PunBB | Free forum support | 연락하기: | Report an abuse | Have a free blog with Sosblogs