Share           Pin It

지난 주에 다음검색 페이지의 구조가 2단구성에서 3단구성으로 변경되었습니다. 상단에 놓여있던 다양한 메뉴들이 왼쪽 날개로 옮겨졌습니다. 이미 3단구성은 (메이저 브랜드 중에서는) MS의 검색엔진 Bing에서 시작으로 해서, 구글, 네이버, 네이트 등에서 이미 적용한 구조입니다. 그래서 전혀 새로울 것은 없습니다. 빙의 3단구조에서 오른쪽 날개 영역에 들어간 광고의 가시성/주목도가 구글의 F자 구조에서의 그것보다 더 높다는 조사결과를 읽은 직후에 다음검색도 3단으로 개편해야 된다고 글을 적은지도 벌써 3년이 지났습니다. (참고. Unnavering... Suggestions for healing Naverose/Naverious and for being Daumish) 정확히 이 글을 적은지 1년 뒤에 네이버가 3단구성을 선보였고, 또 2년의 시간이 더 지나서 다음도 3단 레이아웃을 선보였습니다. 이미 작년에 3단으로 개편해서 오픈하려고 했지만, 내부 사정으로 많이 늦어졌습니다. 자세한 내부 사정은 저도 잘 모르지만, 검색페이지의 웹표준을 준수하기 위해서 많은 테스트를 거쳤고, 또 한국 검색의 특성상 검색 페이지에 다양한 출처들이 존재하기 때문에 모든 출처별 검색결과를 개편된 틀에 맞춰넣기 위해서 다소 늦어진 듯합니다. 개편 후에 렌더링 속도가 30%이상 향상되었다고 하는데.... 

3단구성으로 개편된 다음검색 결과페이지

저보다 먼저 3단 개편에 대한 생각을 가지신 분들도 많았겠지만, 그래도 3년 전에 3단으로 가야된다고 주장했던 사람으로써 이제서라도 3단으로 개편한 것은 환영합니다. 조금 깔끔해진 느낌도 나지만, 반대로 포인트가 없다는 생각이 많이 듭니다. 페이지 내의 색상 등이 주는 포인트도 없지만, 이미 다른 검색서비스들이 같은 구조/모양으로 선보였기 때문에 특색이 없다는 느낌을 받습니다. 물론 이미 다른 검색 서비스들이 같은 구조의 결과를 제공해주고 있기 때문에 새로운 사용자들도 쉽게 적응할 수 있다는 장점은 있겠지만... 그리고 최신 브라우저에서 오른쪽 하단의 관련검색어가 계속 노출되도록 조정한 것은 마음에 듭니다. 앞으로 상단의 검색창과 왼쪽 날개의 메뉴도 화면에서 고정되고, 스크롤시에는 중앙의 검색결과만 이동하도록 해주면 사용성이 더 개선될 걸로 개대가 됩니다.

3년 전에 적었던 글에서는 위와 같은 3단구성의 그림을 제시했지만, 이미 보편화된 구조이기 때문에 다른 시도를 해보는 것은 어떨까?라는 생각도 해봤습니다. 가장 먼저 떠오른 생각이 왜 굳이 메뉴를 왼쪽 날개에 고집해야하는가?에 대한 생각입니다. 그래서 그냥 메뉴를 오른쪽 끝으로 이동해보았습니다. 이런 구조의 검색페이지는 사용하는데 어색할까요? 이제껏 2단 구성에서도 그렇지만, 여전히 3단 구성에서도 검색결과보다는 검색출처가 우선시 되고 있습니다. (2단 구성에서는 검색창 바로 밑, 그리고 3단 구성에서는 F자의 최정점에 메뉴/출처구분이 존재함) 정확한 검색결과보다는 우리는 많은 정보를 가지고 있다는 것을 자랑하는 듯한 인상을 받습니다.  아래의 그림처럼 메뉴를 오른쪽으로 옮겼을 때는 검색결과가 가장 먼저 노출됩니다. 물론 관련검색어나 검색광고가 먼저 나오고 나오고 있긴 하지만... 메뉴를 오른쪽으로 옮기고 나니, 기존에 오른쪽 날개에서 운영되던 실시간이슈어 등이 좀 더 주목을 받는 형태로 바뀌었습니다.

메뉴 영역을 오른쪽 끝으로 옮긴 3단구조

지금 어떤 구조가 더 낫다라는 것을 말하려는 것이 아니라, 그냥 개편오픈 후에 이런 구조로 보면 어떨까?를 생각한 것입니다. 제가 UI/UX 전문가도 아니고... 근데 이번 개편을 준비하면서 담당자들이 제가 제시한 형태의 모양도 고민을 해봤을까요? 아니면 구글이나 네이버가 이미 선보인 '메뉴 - 검색결과 - 부가정보'라는 틀을 별다른 비판/고민없이 그대로 받아들렸을까요? 진실은 항상 저 너머에 있습니다. Truth is beyond there.

2등이 1등보다 좋은 좀은 좀더 무모해져도 된다는 것입니다. 일종의 도전에 대한 환상을 가져야하고, 실패에 대한 부담감도 적습니다. 그런데 다음은 그런 2등의 자유를 제대로 못 누리고 있다는 생각을 자주 합니다. 4년을 고민했지만 여전히 혼자서는 풀지 못한 숙제입니다. 물론 모바일에 더 빨리 뛰어들었고 최근에는 다음TV 등의 새로운 플랫폼 사업에도 참여하고 있지만... 그래도 여전히 새로움을 리딩한다는 느낌은 적습니다. 트렌드에 가장 민감하게 반응하는 다음보다는 트렌드를 처음 만들어내는 다음의 모습을 기대합니다. ... 그런 면에서는 본인부터 각성하고 반성해야할 부분이 많으니...

댓글을 달아 주세요

Share           Pin It

지난 목요일에 다음검색에 새로운 서비스가 오픈했습니다. 이름하여 소셜픽 Social Pick 서비스입니다. 이 글은 소셜픽 검색을 자세히 설명할 목적은 아닙니다. 단지 저도 프로젝트에 일부 참여했기 때문에 제가 담당했던 부분에 대한 내용과 그리고 이 프로젝트가 진행과정 그리고 오픈 이후의 제 생각을 간단히 적어볼까 합니다. 소셜픽검색에 대한 자세한 설명은 다음검색 공식블로그의 글을 참조하세요.

소셜픽검색은 말그대로 Social + Pick + Search의 조합어입니다. 소셜은 여러 사람들에게 회자되고 있는 이슈라는 의미이고, 픽은 그런 이슈를 잘 설명해주는 문서를 뽑는다는 의미이고, 검색은 말그래도 그런 이슈와 문서를 검색 키워드를 통해서 제공해주는다는 의미가 있습니다. 즉, 현재 인터넷에 많이 회자되고 있는 이슈 (& 이슈키워드)를 잘 설명해주는 문서들을 선택해서 보여준다는 의미입니다. 사람들 사이에 회자가 되는 이슈키워드를 수집하는 과정과 또 사람들 사이에 회자되는 뉴스/문서를 수집하는 과정으로 이뤄져있고, 만약 해당 이슈키워드를 사용자가 입력하면 그 결과로 사회망에서 이슈가 되었던 관련 문서를 보여주는 것입니다. 여기서 이슈키워드를 뽑아내는 작업에 제가 깊이 관여했기 때문에 이 부분은 러프하지만 충분히 설명드리겠습니다. 그리고 문서 관점에서 이슈문서는 트위터 등의 SNS에서 많이 언급되었거나 미디어다음의 뉴스댓글이 많은 경우에 해당되는 문서를 추출한 것입니다.

소셜픽의 화면구성은 위에서 보듯이 대표컨텐츠 (뉴스와 블로그, 카페 등)와 실시간 트위터 반응으로 이뤄있습니다. 이번 오픈은 1차 오픈이기 때문에 가장 간단한 형태로 이슈에 대한 사실을 다룬 컨텐츠와 이슈에 대한 사용자 반응을 다룬 컨텐츠로 분리해서 보여줍니다. 추후에 이 서비스가 어떻게 발전해나가는 지를 지켜보는 것도 재미있을 것입니다. (작년말부터 기획했던 서비스인데, 지금 보여주는 것은 기획된 내용의 10%에도 못 미치는 수준입니다.) 그리고, 특정 개인에게는 참 불행한 일이었으나, 어느 운동선수의 이혼소식이 소셜픽 첫날부터 100만회이상의 조회를 기록했습니다.

이슈키워드를 뽑는 방법은 쉽습니다. 이미 국내의 포털 서비스를 이용해보셨던 분들은 검색 우측 날개 영역에 '실시간 이슈어'라는 것에 익숙해있습니다. 소셜픽을 위한 이슈키워드를 발굴하는 것도 실시간이슈어를 뽑는 로직과 거의 비슷합니다. 평소에는 잘 검색되지 않던 단어가 어느 순간에 갑자기 많이 검색이 되면 그런 검색어를 이슈어로 선정하고 있습니다. 그런데 어느 수준까지를 이슈어로 볼 것인가?에 대한  기준을 마련하는 과정이 어렵습니다. 그런데 기존의 실시간 이슈어의 경우에는 단순히 검색창에 유입되는 검색어의 쿼리량/비율의 변화만으로 대략 급등성을 판단하면 되었는데, 소셜픽에서의 이슈검색어는 단순히 많은 이들이 관심을 가졌다고 해서 무조건 선정할 수가 없었습니다. 바로 해당 키워드에 반응하는 신뢰할만한 문서 또는 검색결과가 존재할 경우에 이슈어로 선정해야 합니다. 그렇기 때문에 검색쿼리량에 더해서 뉴스기사가 생성되는 정도라던가 트위터 등에서 언급되는 다양한 단어들의 증감같은 요소도 함께 고려해서 점수화했습니다. 그리고, 실제 이슈어로 선정되었더라도 말했듯이 신뢰할만한 문서가 없는 경우에는 이슈어에서 제외됩니다.

또 한가지 중요한 점은 하나의 이슈를 설명해주는 이슈어가 오직 하나가 아니라는 점입니다. 위에 보여주고 있는 '이종범 은퇴'라는 이슈에 대해서 '이종범 은퇴'가 당연히 이슈어가 되겠지만, 이것과 관련된 다른 검색어들 -- 예를들어, 이종법, 이종범 전격은퇴, 이종범 타이거즈 등 -- 도 해당 이슈에 반응하는 이슈검색어로 함께 등재해야 합니다. 그리고 하나의 이슈가 시간이 지남에 따라서 다양한 양상으로 진행되기 때문에 최초에 잡았던 몇 개의 이슈키워드로 해당 이슈를 계속 설명해줄 수가 없습니다. 이것을 위해서는 기존 검색서비스에서의 관련검색어의 로직을 일부 차용했습니다. 관련검색어는 사용자들이 연속으로 던지를 쿼리를 수집하거나 같은 문서에 포함된 단어들을 수집하는 방식으로 데이터를 구축합니다. 소셜픽에서도 비슷한 방법을 사용했습니다. 더 자세한 설명은 생략하겠습니다.

원래는 다른 이름으로 시작한 프로젝트인데 최근에 소셜픽이라는 이름으로 정해졌습니다. 저는 소셜픽이라는 이름이 별로 마음에 들지 않습니다. 단순히 '이슈 검색'이라는 측면보다는 진화하는 (검색) 플랫폼, 즉 검색을 담는 새로운 플랫폼이라는 측면에서 소셜픽검색이 발전할 것을 기대했었습니다. 그런데 소셜픽은 군중에 의해서 선택된 것이라는 좋은 의미를 담고 있지만, 일단 하나의 브랜드 이름으로 부르기에는 너무 강하고 거칠다는 느낌을 받습니다. 그리고, 이제 '소셜'이라는 용어가 지겹고 식상할 때도 되었습니다. 최근에는 소셜이라는 용어가 개념적인 용어도 아니고, 기술적인 용어도 아닌 마케팅 용어로 많이 사용되기 때문에 거부감이 심해졌습니다. 소셜픽이라는 이름으로 제가 처음부터 구상했던 새로운 검색 플랫폼으로의 진화를 담을 수 있을지 여전히 미지수입니다. 그리고 현재의 모습으로는 소셜픽이라는 이름이 서비스에 부합되지만, 처음 기획했던 나머지 부분들을 채운 후에도 이 이름이 적합한 이름인지에 대한 확신이 없습니다.

댓글을 달아 주세요

Share           Pin It
 오늘 다음검색에 몇 가지 개편이 있었습니다. 제가 관여했던 부분은 크게 두부분이었습니다. 첫째는 사용자들이 입력한 검색어와 연관된 관련검색어에 개편이 있었고 (2011년 초에는 제가 관련검색어 데이터분석의 메인이었지만, 지금은 다른 분에게 인수인계가 끝났고, 기타 일부 관련검색어 페어만 제공해주고 있음), 다른 것은 인물프로필 부분입니다. 오늘은 이 인물 프로필 부분에서 제가 관여했던 것에 대해서 짧게 글을 적습니다. 구체적으로 어떤 식 (계산식이나 가중치 등)으로 구했는지는 이곳에서 밝힐 수는 없습니다.

 인물 프로필에서도 제가 관여했던 부분은 두 곳입니다. 첫번째는 동명이인이 존재할 때, 대표1인을 선정해서 크게 노출시켜주는 것이고, 두번째 것은 인물관계도의 데이터를 제공해주는 것입니다. 아래의 캡쳐화면 '유리'를 검색한 경우입니다. '유리'라는 이름을 가진 연예인들이 많이 있습니다. 그런데, 현 시점에서 '유리'를 검색하면 많은 경우 소녀시대의 유리를 떠올립니다. (10년 전이었다면 '쿨'의 '유리'를 떠올렸겠지만... 세월이란..) 개편 전에는 3명까지 한줄에 (사진과 함께) 노출하였습니다. 그런데 오늘부터 동명이인에 대해서 대표1인을 선정해서 크게 보여주고, 나머지 인물들은 밑에 따로 보여줍니다. 물론, 동명이인에서 대표1인을 선정하기 어려운 경우는 기존처럼 한줄에 3명씩 보여줍니다. 그리고, 한 인물과 관련된 여러 인물들이 존재합니다. 그런 경우 해당 인물들을 인물연관도를 측정해서 함께 보여주도록 했습니다. 제가 다음검색에서 인물프로필의 대표일인선정과 인물관계도에 대한 애매한 것을 정해드리겠습니다.

2011:12:15 13:36:29

소녀시대 '유리'를 검색한 화면. 동명이인에 대해서 소녀시대 '유리'를 대표1인으로 선정하여 보여주고, 또 유리와 관련된 인물들을 일목요연하게 정리해서 보여주고 있습니다.


 동명이인에서 대표1인 선정.
 대표1인을 선정하는 방법은 참 쉽습니다. 그냥 집단지성 Collective Intelligence에 맡기는 것입니다. 위의 예에서처럼 '유리'를 검색하는 사용자들이 많이 있을 것입니다. 그러면 그들이 생각하는 '유리'에 적합한 인물을 클릭해서 볼 것입니다. 네, 맞습니다. 같은 키워드에 대해서 가장 많은, 아니 압도적으로 많은 클릭을 받은 인물을 대표1인으로 선정을 합니다. 그런데 클릭회수가 비등해서 우열을 가리기 어려운 경우에는 특정 인물을 특정하면 또 다른 문제가 발생합니다. 그런 경우에는 그냥 클릭순으로 같은 등위에서 노출순서만 정해서 나열해서 보여줍니다.

 그런데, 지금은 '유리'에 대해서 소녀시대 '유리'를 떠올리겠지만, 갑자기 새로운 이슈가 발생해서 쿨의 '유리'를 찾는 이들이 많아진다면 이때는 쿨의 '유리'를 대표1인으로 보여줘야할 경우가 생기기도 합니다. 그렇기 때문에 단순히 특정 기간동안 받은 클릭회수의 합으로 순위를 선정하는 것에 더해서, 최근에 많은 클릭을 받은 인물을 대표1인으로 선정하도록 가중치의 조정이 필요합니다. 중요한 것 하나더. 원래 인기가 없은 검색어 (인명)에 대해서는 데이터가 부족해서 대표1인을 선정하지 않았습니다.

 인물관계도
 제가 다음에 입사한 이후로 계속 보여주고 싶었던 기능이 관련/연관인물 정보입니다. 다음의 영화섹션에 들어가면 인물별로 관련인물이 나옵니다. (예, 유리) 그런데, 이곳에서 제공해주는 관련인물들이 참 멋쩍은 경우가 많습니다. 단순히 신장이 같거나 나이가 같은 동일 직업군의 아무나 한명을 보여주고 있습니다. 그리고, 같은 작품에 출연한 경우에 대해서도 작품의 수나 이름 등이 제대로 특정되지 않은 경우가 많았습니다. 제가 진짜 보여주고 싶었던 정보는 특정 인물과 진짜 관련된 인맥이었습니다. 그런데 작년 여름에 우연한 기회에 인맥도를 구하게 되었고, 또 이를 바탕으로 1년을 넘게 기다린 지금 그 정보를 검색에서 활용하게 되었습니다.

 인물연관도를 구하는 원칙은 간단합니다. 가능한 모든 연결을 찾아내서, 가장 강하고 많은 연결을 가진 인물들 사이의 관계를 보여주자입니다. 그렇기 때문에 가족관계나 그룹멤버여부 등의 피지컬한 관계도 확인했고, 같은 영화/TV에 출연했는지 아니면 음반작업을 같이했는지의 로지컬한 관계도 확인했고, 또 동향인이거나 동문여부 등의 조금 약한 관계들도 모두 모았습니다. 그래서, 가족이나 그룹멤버와 같은 강한 연결의 경우 연관도가중치를 높여주었고, 동문/동향의 경우에는 가중치를 조금 낮게줬습니다. 그래도 발견된 모든 연결을 하나도 버리지는 않았습니다.

 그 외에도 검색에서 유용한 정보가 있습니다. 어떤 특정인물을 많이 찾아봤는지에 대한 검색인기도입니다. 지금 다음스타랭킹에서도 검색량 등을 분석해서 여러 분야의 스타들의 랭크를 보여주고 있습니다. 인물연관도에서는 실제 검색인기도는 무의미한 데이터입니다. 검색인기도가 인물관계도와 전혀 무관하기 때문입니다. 그렇지만, 관련인물을 나열하는 경우에 일부 유용한 정보를 제공해주고 있습니다. 인물의 나열순서는 우선 연관도가 높은 경우에 앞에 노출됩니다. 그렇지만, 연관도점수가 같은 경우에는 누굴 먼저 보여줄지 애매합니다. 그래서 제가 애정남했습니다. 즉, (검색)인기도가 높은 인물을 먼저 보여주기로 했습니다.

 인물별로 현재 다음에서 획득한 여러 DB정보를 활용해서 인물연관도를 구했습니다. 그 중에서도 다음검색의 인물프로필에서는 가족여부, 같은 소속사여부, 작품출연여부, 고향과 출신학교, 그리고 트위터에서의 최근 멘션관계에 대해서는 별도의 탭으로 보여주도록 했습니다. 그리고, 국회의원의 경우 최근 입법발의된 법안에 대해서 같은 찬성/반대했는 인물들을 함께 보여주도록 했습니다. 그런 입법의 찬반성향에 따라서 국회의원들을 그루핑했다고 볼 수 있습니다. (근데, 이노무 나라의 국회에 있는 양반들은 자신의 전문성이나 양심에 따라서 입법활동을 하는 것이 아니라, 단지 자신이 속한 당의 정책에 따라서 무더기 입법활동을 벌이고 있는 것이 참 개탄스럽습니다. 그런 정보가 국회의원의 의정활동 탭을 보시면 살짝 눈치챌 수가 있습니다.

 오늘 1차 오픈을 했지만, 아직 완벽한 것이 아닙니다. 계속 더 나은 요소들을 발굴해서 더 나은 연관도를 구해서 계속 업데이트할 예정입니다. 오늘 오픈했지만, 지금도 계속 작업중입니다. (전 오늘 휴가입니다. 그래서 지금 이 글을 적을 수 있는 거에요.) 모든 내용을다 공개할 수 없음을 양해바랍니다. 그렇지만, 더나은 결과로 계속 보답하겠습니다.
 

댓글을 달아 주세요

  1. 박재호 2011.12.15 15:17 신고 Address Modify/Delete Reply

    휴가에도 회사나오시잖아요. ㅋㅋ
    집에 난방 안되서.

  2. 박재호 2011.12.15 15:24 신고 Address Modify/Delete Reply

    지금 이것저거 해보고 있는데
    가카,정봉주,김어준 등의 최근 이슈 인물들의 관계도는 너무 빈약하네요..
    뉴스에서 인물명을 추출해서 Vector 가중치를 고려하여 뽑은 정보를 활용하는것은 어떨까요?(동명이인 처리가 힘들긴 하겠지만)

  3. 백수 2011.12.16 21:35 신고 Address Modify/Delete Reply

    오늘 점심 시간에 윤아로 검색했을때 대표가 나오지 않았던 것은 사람들이 모르는 사람이 누구인지 궁금해서 클릭한 횟수가 갑자기 늘어서일까요? ^^ 아직 초기라 불안전해서일까요? 오후에 급하게 업데이트가 있었을까요? ㅋㅋㅋ 여튼 좋네요~

Share           Pin It
 11월 코리안클릭지표가 발표/공유되었습니다. 다음 검색의 점유률은 19.2%였습니다. 검색의 일부를 담당하는 이로써 조금 부끄러운 수치입니다. 한때는 20%중반까지 올라갔습니다. 그때는 조금만 더 하면 30%를 넘어 40%, 50%도 넘길 수 있을 것같았지만, 현실은 19.2%입니다. 참 녹녹치가 않습니다. 20%는 2011년 12월의 현재이고 현실입니다. 그러나 20%의 현실이 아닌, 80%의 가능성을 믿습니다.

 작년 12월에도 다음검색의 문제점이라는 글을 적었습니다. 아마 ‘다음검색을 생각하며’라는 글이었을 겁니다. 축구 중 다친 다리 때문에 한의원 침상에서 침맞으며 즉흥적으로 떠오른 생각을 정리한 글이었는데, 지금 다시 꺼내본다면 지난 1년이 많이 아쉬울 것같습니다. 지난 1년의 기억은 뒤로 하고 다시 2012년을 준비하기 위해서 오늘 또 글을 적습니다.

 20%라는 마켓쉐어로 글을 시작했습니다. 우리의 목표 (적어도 단기적인 검색유닛의 목표)는 한동안 검색점유률 30%였습니다. 그러나 지난 몇일 동안 고민 끝에 내린 결론은 우리의 목표는 "PV를 늘리는 것이 아니라 UV를 늘리는 것이다"입니다. 그래서 결론적으로 PV를 늘리는 것입니다. 지난 몇 년동안 PV를 늘리기 위해서 많이 노력했습니다. 눈에 띄게는 다음탑이나 여러 섹션들에 다양한 검색어들 (라이브검색어, 펀검색어, 실시간이슈어 등)을 노출하였습니다. 그리고 보이지 않는 부분에서는 검색서제스트, 관련검색어, 기사내링크 등의 알고리즘 및 데이터를 보강하고, UI/UX 등을 변경하는 작업 등도 진행했습니다. 이런 시도들은 기본적으로 기존 사용자들에게 다양한 검색어를 최대한 노출해서 우발적으로라도 검색을 해보도록 유도하는 것이었습니다. 즉, 극단적으로 PV를 늘려보자는 시도였습니다.

 그런데 다음을 애용하는 사용자의 풀은 한정되어있습니다. (그 중에서도 다음검색을 사용하는 풀은 더 제한되어있습니다.) 그런 사용자들에게 여러 검색어들을 노출하는 것이 검색사용으로 유도를 할 수도 있었겠으나, 역으로 지나친 검색어 노출로 그들의 본래 가졌던 다음서비스에 대한 애정을 떨어뜨리는 역할도 했을 것입니다. 검색이 아닌 더 나은 서비스나 정보를 제공해주는 기회를 막았을 수도 있습니다. PV를 부자연스럽게 늘리면 여러 부작용이 따릅니다. 극단적으로 기존 애용자들의 이탈까지도 생각할 수 있습니다.
원론적인 얘기지만 PV를 늘리는 정석은 UV를 늘리는 것입니다. 사용자들이 다음서비스 및 검색에 애정을 갖게 하고, 계속 또는 신규로 사용하도록 만들어야 합니다. 작년에도 적었듯이 차별화를 넘어서 독창성으로 사용자들에게 어필을 해야 합니다. 검색에서 정석은 더 정확하고 더 많은 정보를 즉시에 제공해주는 것입니다. 그러나 이것은 이미 구글이나 네이버에서도 하고 있습니다. 여러 기술적인 분야에서 더 정확한 검색결과를 원한다면 구글을 이용하는 편이 낫고 (특히 영문자료), 더 잡다한 것을 원한다면 네이버를 이용하는 편이 낫습니다. 이런 상황에서 다음만의 독창성을 보여줘야 합니다.

 개인적으로 화두를 꺼낸 키워드는 ‘FUN’입니다. FUN은 단순히 재미를 뜻하는 것이 아니라, 사용자들이 만족할만한 검색경험을 준다는 의미입니다. 검색 만족은 어떻게 얻을 수 있을까요? (하나의 정답이 있는 질문이 아닙니다. 각자가 고민하고 또 함께 고민할 문제입니다.) 사용자들은 A라는 정확한 결과를 기대하고 검색을 하는 경우도 있지만, 보통은 A 비슷한 것을 기대하고 (다양한 검색어 조합으로) 검색을 합니다. A 비슷한 것을 기대한 사용자에게 A를 보여주는 것이 최고의 검색경험이 아닐까요? 그런데 지금의 구조에서는 A 또는 A 비슷한 것을 얻기 위해서 너무 먼 길을 돌아가야 합니다. 그 길이 너무 멀어서 (다음에서) 한 걸음을 더 나가지 않고, 그냥 구글이나 네이버로 발길을 돌려버립니다. 요즘은 트위터나 페이스북에 그냥 질문형태로 올려서 답변을 얻기도 합니다. 한 걸음을 덜 걷게 해주는 것이 최고의 경험입니다.

 지금 구체화 중인 몇몇 아이디어들은 이 글에서 적지는 않겠습니다. 처음 글을 적을 때는 의식의 흐름상, 이쯤에서 자연스럽게 구체적인 아이디어까지도 몇 가지 소개하려 했습니다. 그러나, 검색유닛이 아닌 전사 게시판에 아직 발표되지 않은 검색유닛의 내년도 전략안(일부)이나 적어도 제가 담당할 일을 노출시키는 것은 재미도 감동도 없을 것같아서 생략합니다. 어쨌든 더 나은 경험, 그래서 재미있는 경험을 전달해주는 그런 서비스로 거듭날 때입니다. (내부 전략안 및 방향성에 대한 비밀아닌 기밀을 외부에 적을 수 없음을 양해바랍니다.)

 대한민국의 검색시장은, 적어도 PC에서는, 이미 포화상태에 있다고 말합니다. 그러나, 다음검색은 아직 80%의 가능성을 남겨놓고 있습니다. 그 가능성을 믿습니다.

 (회사 내부 게시판에 적은 글입니다. 특히 문제가 될만한 내용이 없는 것으로 판단되어 블로그에 아카이빙해둡니다.)

댓글을 달아 주세요

Share           Pin It
 현재 다음검색이 처한 가장 큰 비극은 낮은 시장점유율도 아니고, 낮은 검색품질도 아니다. 다음검색의 비극은 구글과 네이버로부터 시작되었다. 단지 그들이 세계 그리고 한국의 검색시장에서 우리의 강력한 경쟁사, 아니 독점적 메이저리티이기 때문이 아니다. 그런 겉으로 들어나는 것보다는 그들이 설정해놓은 검색의 정의/틀 안에서 다음 및 기타 주자들이 아등바등 경쟁을 하는 것에서 구글과 네이버는 다음검색의 비극의 시작이다. 지난 몇년 간의 다음검색의 발전 방향을 되돌아보면, 우리가 하려던 많은 일들이 구글이 설정해놓은 글로벌 검색의 프레임, 그리고 네이버가 제공해주는 통합검색 및 소소한 기능들을 따라잡기 위해서 모든 힘을 쏟아부었다. 단순히 구글과 네이버와 구별되는 차별성 differentiation의 부족을 말하는 것이 아니다. '다음'이라는 정체성을 보여주는 유일성 uniqueness의 부재를 말하는 것이다. 이제껏 검색서비스를 하면서 구글과 네이버의 울타리 내에서, 그들이 정해놓은 룰 rule에 맞춰서 아등바등하지 않았던가. 잠시 조금 더 빨리 치고 나가더라도 우리가 한 일은 결국 구글과 네이버의 울타리 ('검색이 다 그래')를 벗어날 수 없었다. 극단적으로 말해서 사람들은 우리가 선보인 기능/서비스에 대해서 '저 기능 구글/네이버에서 베낀 거 아냐?' 또는 '구글/네이버에도 저 기능정도는 다 있을거야.' 등의 반응/평가를 내렸다. 이는 차별성의 문제가 아니라 유일성의 문제다. 지금이라도 많은 이들이 머리를 맞대로 앉아서 우리의 정체성을 찾고, 우리가 고객들에게 전달해줄 수 있는 가치와 의미가 무엇인가?에 대한 심각한 고민과 자기반성을 해야 한다. 그런 어려운 과정을 지금이라도 거치지 않는다면, 앞으로도 영원히 우리는 다음검색이 아니라 구글과 네이버의 검색을 하게 될 것이다.

 우리에게 지금 필요한 것은 단지 와우 WoW를 지속적으로 보여줄 수 있는 능력을 갖추는 것보다, 우리의 펀드먼털 fundamental을 확립하고 이를 바탕으로 고객들에게 다음만이 줄 수 있는 가치를 제공해줌으로써 다음검색으로 고객들을 끌어들이는 것이다. 2010년동안 50여가지의 새로운 검색서비스와 기능을 신규/개편 오픈했다지만, 여전히 시장에서의 검색점유율은 하등의 차이가 없고, 네이버의 기침 한번에 1~2%가 오르락내리락하고 있는 것을 지금 보고 있지 않은가? 이는 우리가 지난 기간동안 여전히 펀드먼털이 아니라 와우에만 치중한 결과라고 결론을 내릴 수 밖에 없다. 소문난 잔치에 먹을 것이 없다라는 속담이 공으로 생긴 것이 아니다. 우리는 이제껏 잔치/이벤트를 소문내기에 바빴지, 막상 손님들이 찾아왔을 때 먹을 제대로 된 음식이나 그들이 시간을 보낼 잔치프로그램을 개발하는데 너무 소홀했다는 점을 인정하지 않을 수가 없다. 2010년을 되돌아보면 기능의 추가에 바빴다. 그러나 그보다 더 큰 의미의 추가에 너무 소홀했다. '늦었다고 생각할 때는 이미 너무 늦었다'라고 거성이 말했지만, 오늘은 내일보다는 늦지 않았다. 다음이 줄 수 있는 가치와 의미를 다음검색을 통해서 줄 수가 있어야 한다. 그러기 위해서, 그런 가치와 의미가 무엇인가?부터 정확히 찾아야 한다.

 그런 의미에서 본부/전사에 걸친 자발적인 검색X팀 (Cross팀)을 만들 것을 건의한다. 단순히 엘리트집단, 또는 싱크탱크를 만들자는 말이 아니다. 매월 1일마다 단행하는 그런 의미없는 조직의 개편을 바라는 것도 아니다. 검색이란 과연 무엇일까? 미래의 검색은 어떤 모습일까? 우리가 그리고 고객들이 꿈꾸는 그런 미래의 검색에 맞춰서 우리가 갖춰야할 역량은 무엇이고, 또 어떻게 다음검색이 발맞춰나가야하는 걸까? 등에 대해 함께 고민을 하고, 밑그림을 그리는 그런 '자발적' 조직을 만들어야 한다. ('자발적'이라 표현했지만, 시작은 윗선에서 강력한 의지보여줘야함.) 그렇지만, 소위 말하는 형식적인 TFT를 만드는 것은 반대한다. 열정으로만 묶인 그런 자발적인 조직이 아니라면, 내가 굳이 이렇게 글을 적을 이유도 없다. 일주일에 몇시간씩 (정규 업무 외의 시간) 모여서 함께 고민을 하고 나름의 결론을 도출해서, 실서비스에도 향상을 줄 수 있으면 좋겠다. 이글을 읽고 있는 분들이라면, 소수는 제외하고, 적어도 '돈'보다는 다른 무언가를 바라고 꿈꾸면서 다음이라는 곳에 들어와서 삶의 터전을 꾸려나가고 있으리라고 믿는다. 그들의 꿈과 열정을 믿는다. 그들, 아니 우리의 비전을 실현시킬 기회를 갖자는 것이다. 그런 기회를 이룰 자발적인 조직체를 만들 수는 없는 것일까?

 혁신에 이르는 길은 여러 가지가 있다. 가장 즐겨 사용되는 예시로 잔디밭에 길을 내는 것이다. 새로 조성된 정원의 잔디밭에 길을 내고자할 때 어떻게 할거냐고 물었다. 어느 지혜로운 분은 1년 정도 길을 만들지 말고 그냥 놔둬라고 했다. 실제 1년이 지난 후에 그 정원의 잔디밭에는 훌륭한 길이 만들어졌다. 바로 많은 학생들이 편하고 짧은 길로 자주 다니다보니 자연스럽게 그곳에 길이 났다고 한다. 그때서야 그 현자가 이제 이길을 따라서 길을 만드세요라고 조언을 해줬다고 한다. 우리에게 너무 익숙한 혁신에 이르는 방법이다. 그러나, 이런 짓을 우리는 10년을 해왔다. 그결과가 바로 네이버로제 Naverose (네이버병)에 걸린 다음의 모습이다. 낯선 여성에게서 내 남자의 향기를 느끼는 것이 아니라, 다음에서 네이버의 향기 Naverous를 느낀다. 사용자들이 많이 다니는 곳에 길을 내는 것은 너무 명확하고 안전한 점진적 혁신 방법이다. 그러나 그러면 언제까지나 우리는 2류인생에 만족하고 만다. 지금 LG전자를 보면서 하는 욕을 다음도 듣고 있다. 그저 2등에 만족하는 인간들이라고... 혁신에 이르는 다른 길은 누구도 상상하지 못했던 것을 제시하는 급진적인 방법도 있다. 물론 현재 전진적 향상이 다음의 많은 서비스들에 필요하지만, 적어도 1~20%정도는 급진적 혁신에 힘을 투자하고 역량을 키워나가야 한다. (길이 없는 곳에 길을 내는 것이 지금 정권의 4대강 밀어붙이기식으로 비칠까봐 조심스럽긴하다.) 여기서 또 '다모'의 마지막 장면이 생각난다. 길이 있어서 내가 가는 것이 아니라, 내가 가는 곳이 바로 길이다. 만들어진 길이 아닌 우리가 만들 길을 꿈꾸자.

 입사후 한 3개월정도 지난 시점에 다음인 게시판에 글을 올린 적이 있다. '다음'이라는 브랜드에 관한 글이었다. 그때 어떤 분이 (바로 댓글이 지워졌지만) 입사 1년도 못된 초짜가 다음에 대해서 얼마나 안다고 이런 글을 올리느냐?라는 비아냥을 들은 적이 있다. 내가 개발자로써 다음을 안 것은 1년도 못되었지만, 사용자로써 다음을 안지는 거의 10년이 되는 시점이었다. 개발자가 아니라 고객의 입장에서 한 고언이 그렇게 묵살된 적도 있었다. 그때, 그분이 적어도 3년은 회사를 다녀봐야 다음에 대해서 이해할 수 있다고 했다. 2011년 3월 11일이 되면, 나도 이제 입사 3년을 채우게 된다. 이제는 나도 말할 자격을 거의 얻은 셈인가? 그런데 아직도 나는 눈을 가리고 귀를 닫고 입을 막아야만 하는가? 3년 전에 가졌던 그 기분과 생각이 지금도 변함이 없다. 주위 사람들에게 자주 말하지만, 난 다음에서 개발자로써 지낸 시간이 단 한시간도 없다. 언제나 다음서비스의 사용자였고, 미약한 컨트리뷰터였을 뿐이었다. 개발자로써의 내 목소리가 아니라, 사용자로써의 내 목소리가 외면당할 때의 배신감은 너무나 컸다.

 1년간 열심히 활동하던 다음인 게시판에서 절필을 선언할 때는 마음이 참 괴로웠다. 그리고 1년간 Yammer에서 필요이상으로 잘난 체하는 것같아서 2000번째 포스팅을 마지막으로 그만 둔지가 6개월이 다 되어가지만, 아직도 내 심장은 뛰고 있다. 3년 전에도, 2년 전에도, 1년 전에도 뛰던 그 심장 그대로 아직도 뛰고 있다. 이 시대는 지식이 없는 시대는 아니다. 그러나 열정과 용기는 쌓이는 지식에 반비례하는 것같다. 죽은 지식이 우리의 열정마저 죽게 하고 있다. 다음이라는 조직 내에 보이지 않게 깊숙이 잠재하는 그 위험을 왜 도려내려고 하지 않는지 아직도 이해할 수가 없다. 3년 전에도 그랬고 지금도 그렇다. 아니라고 말하겠지만, 그 말 속에 긍정이 있다는 것을 부인하지 못할 것이다. 그리고 당신의 심장은 이미 멈췄더라도 이제 막 입사한 사람들의 열정을 식히지는 말았으면 좋겠습니다.

 여전히 꿈을 꾸고 심장이 뛰고 있는 다음인들의 비전을 실현시킬 수는 없는 걸까?
 예전에 적었던 블로그글을 추가합니다.

(휴가중에 적은 글입니다.)
----
내부인들을 위해서 적은 글입니다. 다른 오해는 없으시길 바랍니다. '다음'이라는 대한민국의 대표 포털을 만들어가는 것은 다음이라는 회사에서 월급을 받으면서 일하는 기획자나 개발자, 운영자들이 아니라, 다음을 사랑하고 애용하는 모든 고객들이라고 생각합니다. 그래서, 내부용으로 적은 글이지만, 외부에 공개합니다. 다음을 사랑하신다면 다음에 대해서 가차없는 비판을 보내주세요. 욕을 먹는 것이 무관심보다는 낫습니다. 소수의 일부에 의해서 꾸며지는 세상이 아니라, 대한민국 전 국민들이 참여해서 만들어가는 다음의 다음을 꿈꿉니다.

댓글을 달아 주세요

  1. Favicon of http://raystyle.net BlogIcon Ray  2010.12.08 16:53 신고 Address Modify/Delete Reply

    지나치게 몸사리는 느낌이 있다는 것에서 LG 와 비슷한 느낌이라는 것은 동의합니다. Fast Follower 전략은 좋은 전략이지만 항상 써야할 전략은 아니라고 봅니다.

  2. drifting 2010.12.08 19:34 신고 Address Modify/Delete Reply

    X팀이 고립될 수도 있지 않을까요. 제기하신 문제는 고민을 안하는 분위기가 아니라 고민을 발전시키고 실현시키는 경영정책/서비스정책에 대한 것 같아서요. 그렇다면 결론에 한가지가 더 추가되어야한다고 봅니다. 다수의 힘으로 정책방향을 바꾼다던지, 과감한 인적쇄신을 한다던지요. 결국 X팀이 힘을 갖는 방향이 있어야 할 것 같다는 생각입니다.

    • Favicon of https://bahnsville.tistory.com BlogIcon Bahniesta 2010.12.09 11:42 신고 Address Modify/Delete

      empowering.. 중요한 지적이십니다. 조직도에 없는 조직이지만, 그래도 처음에 윗선에서 조직을 만들자라는 공감대를 갖는 것도 중요하고, 무엇보다도 그런 비전을 위해서 자신의 재능과 시간을 기부할 수 있는 그런 분들이 꼭 필요하죠.

  3. 뜨거운 도시 남자 2010.12.09 02:51 신고 Address Modify/Delete Reply

    한때 메일과 카페로 포털업계를 호령했던 당시의 다음이 그립네요.
    저도 10년이 넘게 다음을 지켜보고 활동했던 유저로서 최근 다음 행보의 답답함을 느낀답니다.
    남들이 네이버로 다 갈아탈때 꿋꿋히 다음을 지켰는데 오랫동안 관리하고 운영되었던 카페도 방문자들의 급격한 이탈로 네이버로 이동하게 되었어요. 물론 저는 운영직에서 내려오고 안갔지만요.

    언젠가는 다시 비상하는 다음이 되기를 바랍니다.

  4. Favicon of http://zankke.tistory.com/ BlogIcon 낭만짱깨 2010.12.09 09:17 신고 Address Modify/Delete Reply

    Daum,돌아보자면 검색의 품질이나 서비스의 Wow에 끌려 15년을 넘게 Daum을 아껴 이용해 온 사용자입니다.다음의 선전에 희망을 버리지 않고 늘 기대를 갖게 되는 것은, 바로 이 글에서 보여주고자 하는 내부의 노력과 성찰을 서비스로 녹여내는 열정들이 구석구석 살아 숨쉰다는 믿음 때문일 것입니다. Next Naver, Next Google이 아니라 Next Future를 바라보는 Daum이 될 것임을 믿어 의심치 않습니다.런칭 시점의 요란한 잔치와는 달리, 지금은 흔적도 없이 그 존재의 가치를 잃어가고 있는 모 포털의 메일서비스 기획으로 출발했을 때, Daum은 넘볼 수 없는 높은 벽이었고 지금도 의심하지 않습니다.두서없는 졸필이지만 Daum을 사랑하는 이용자의 "기대"라는 점은 전달되었으면하는 그 마음 뿐입니다. Naverous가 아닌 Daum like를 보여 주시길 기대합니다. 곧 그렇게 되실거라 믿겠습니다.화이팅 하세요~~

    • Favicon of https://bahnsville.tistory.com BlogIcon Bahniesta 2010.12.09 11:45 신고 Address Modify/Delete

      의견 감사합니다. Naverous Daum이 아니라, Daumish Daum을 만들 겁니다. 아니지... Daumish는 제가 정의할 문제는 아니네요. 풋노트에도 밝혔듯이, 다음의 사랑하시는 사용자들이 만들어가는 그런 Daum Eco를 함께 만들어가야죠.^^

  5. 2010.12.13 15:23 Address Modify/Delete Reply

    비밀댓글입니다

Share           Pin It
 메타블로그나 검색엔진 등을 통해서 이 글이 머신런닝에서 말하는 EM (Expectation Minimization) 알고리즘에 대한 포스팅인 걸로 생각/기대하고 들어오신 분들에게는 먼저 죄송하다는 말을 전합니다. 이 글은 EM 알고리즘에 대한 것이 아닙니다. EM 알고리즘을 기대하셨던 분들에게는 제가 이 포스팅을 통해서 말하려던 바가 완전히 실패한 것입니다. 저는 여러분들이 가졌던 그런 기대와, 실제 제품/서비스들이 그런 기대를 충족시키느냐에 따른 고객만족 Satisfaction에 대한 글을 적으려고 합니다. (참고. 그렇지만, 제목에 사용한 Expectation Minimization은 분명 EM알고리즘에서 차용한 표현입니다.)

 많은 서비스나 제품들을 출시하면서 기업들은 고객 만족의 정도를 측정하려고 합니다. 고객이 만족했다면 제대로된 서비스/제품의 기획/생산/출시일테고, 그렇지 못하다면 실패한 것입니다. 고객이 만족했다면, 소위 최근의 소셜마케팅/버징에서 얘기하듯이, 만족한 고객들에서 시작해서 제품/서비스에 대한 입소문이 타기 시작하고, 그런 입소문이 점점 번져서 더 큰 성공 (제품의 판매 및 서비스 이용자의 증가 등)으로 이러질 것입니다. 그런데, 이런 만족도를 측정하는 것이 말처럼 쉽지가 않습니다. 만족도를 측정하는 것이 어려운 이유는 모든 고객들이 다른 가치기준을 가지고 서비스/제품의 품질이나 만족도를 평가하기 때문입니다. 즉, 주관적인 만족도를 객관적인 수치로 표현하다는 것 자체가 어불성설일 수도 있습니다. 일단 주관도를 제외하더라도, 각 고객들이 처음에 서비스/제품을 접할 때 기대하는 기채치/기대수준이 모두 다르다는 것입니다. 그런 기대치를 상향시키면 고객들은 만족할 것이고, 그렇지 못하면 고객들은 실망할 것입니다. 이런 고객의 기대치와 만족도를 도식화하려던 시도가 있었습니다. 바로 Kano Model입니다. 

 Kano 모델은 이름에서 유추되듯이 1980년대에 Noriaki Kano 교수님에 의해서 처음 개발되어서 전파된 개념입니다. (대학에서 품질공학을 배우면 잠시 언급되는 모델입니다.) (카노모델에 대한 위키피디어 바로가기) 앞서 하이퍼링크한 위키피디어의 내용을 보시면, 카노모델을 바로 이해할 수 있습니다. 그래도, 짧게 설명한다면 고객의 만족도는 기본적으로 기대치 (기본기능)에 비례한다는 것입니다. 처음에 고객들이 어떤 제품/서비스가 제공해줄 것이라는 기능을 만족시키면 그것에 비례해서 고객의 만족도가 증가합니다. 바로 아래의 그림에서 파란색선이 보여주는 바입니다. 기본 기능에 충실하면 고객의 기대는 선형으로 증가하고, 그렇지 못하면 선형으로 감소하게 됩니다. 그런데, 카노모델에서 중요한 것은 선형의 파란색선이 아니라, 붉은색선과 녹색선이 나타내는 바입니다. 붉은색선은 기본 전체가 제품/서비스가 기본기능에는 충실할 때, 더 부가적인 기능을 제공해주면 고객들의 만족도가 선형이 아니라 비선형으로 증가하게 된다는 것을 뜻합니다. 즉, 고객이 예상/기대하지 못했던 새로운 기능이 추가되면 고객들은 만족한다는 것입니다. 붉은색선이 만족도의 양의 positive 영역에만 존재한다는 것도 주목할 것입니다. 즉, 그런 부가기능의 제공여부는 고객의 기본기대치/만족도에는 영향을 주지 않는다는 것입니다. 반대로, 녹색선이 보여주듯이 고객이 처음부터 제품/서비스에 기대했던 기본 기능을 충족시키지 못하면 파란색처럼 선형으로 만족도가 감소하는 것이 아니라 그 이상의 실망을 안겨주게 됩니다. (설명이 조금 잘못된 부분이 있을 수 있습니다.) 요약하면, 기본기능을 만족시키지 못하면 제품/서비스의 만족도는 크게 떨어지고, 기본기능만을 만족시키면 만족도는 선형으로 증가하고, 기본기능을 만족시키면서 부가기능까지 제공된다면 만족도가 기하급수적으로 증가한다는 것입니다. 여담이지만, 현재 출시되면 많은 서비스들 (제가 다니는 회사를 포함해서)이 기본기능을 만족시키지도 못하면서, 불필요한 부가기능들의 제공에 몰두하는 현상을 볼 수가 있습니다. 부가기능으로 인해서, excitement가 증가할 것으로 기대하겠지만, 기본에 충실하지 못하는 제품/서비스는 결국 고객실망으로 연결되게 됩니다.

위키피디어에 실린 카노모델을 설명하는 그래프 (GIF 그림을 그냥 가져왔는데, 투명GIF네요. 블로그 바탕이 검은색이라OTL. 죄송하지만 그림은 클릭해서 큰 사진으로 보세요.)



 최근에 다음검색에서 개편한 사항을 가지고 얘기를 해보고자 합니다. 첫번째 사례는 벌써 1년도 더 전에 개편한 사항이고, 두번째는 2~3개월 전에 개편한 내용입니다.

 첫번째 사례는 바로 내부적으로 '라인업'이라고 불린 프로젝트입니다. 당시에 SBS의 라인업이라는 프로그램이 막 중도종료한 때부터 시작했던 프로젝트입니다. 제가 2008년 3월에 다음에 처음 입사해서 맡았던 프로젝트 중에 하나가 바로 라인업입니다. 라인업은 제목에서 예상되듯이 '라인'을 '위로 올린다 (업)'는 의미를 가지고 있습니다. 여기서 말하는 '라인'은 다음검색의 검색결과 페이지에서 각각 출처별로 묶어서 보여주는데, 이 출처별 묶음을 '컬렉션 Collection'이라고 내부적으로 부르고 있습니다. 즉, 이 출처별 묶음인 컬렉션을 라인이라고 해석하면 됩니다. 이전 포스팅에서도 밝혔지만, 이 출처별보기가 네이버에서 검색기술의 한계 때문에 태어난 사생아인데, 국내에서는 너무 일반화되어서 사용되고 있습니다. 그래도, 출처별로 보여주면 많은 장점이 존재합니다. 그렇지만, 사용자가 입력한 검색어에 가장 충실한 컬렉션이나 문서가 존재함에도 불구하고 다른 이유 때문에 별로 연관성이 없는 문서/컬렉션이 최상단에 올라와서 사용자들의 검색만족도를 떨어뜨리는 부작용을 제공해주는 경우가 많습니다. 대표적으로 (지금은 거의 완화되었지만) 2008년이나 2009년 정도까지는 네이버에서 검색을 하면 (광고 컬렉션이나 특수 목적의 스페셜/컨텐츠/뉴스 컬렉션을 제외하고) 대부분 지식iN 컬렉션이 최상단에 노출되고, 다음에서 검색하면 카페 컬렉션이 최상단에 노출되는 경우가 많았습니다. 찾고자 하던 정보가 지식iN이나 카페에 존재했더라면, 사용자가 만족했겠지만 다른 컬렉션 (예를들어, 블로그 컬렉션)에 존재했다면 사용자는 원하던 검색결과를 찾기 위해서 불필요한 컬렉션을 먼저 스캔해서 봐야했고, 또는 스크롤다운을 해서 검색결과를 찾아가야하는 경우가 발생하게 됩니다. 이런 경우, 검색엔진을 이용하는 사용자들의 기대치는 가장 상단에 올라오는 결과가 내가 찾는 그 결과라는 기대치를 가지고 검색엔진을 이용하는데, 앞서 카노모델에서 설명하듯이 기본 기대치/기능을 충족시켜주지 못하는 결과가 나오게 됩니다. 그런 점에 착안해서, 사용자들이 가장 보고 싶어하는 결과를 최상단에 올려주자는 것이 라인업 프로젝트의 기본 목적입니다. 자세히 설명을 드릴 수는 없지만, 라인업 프로젝트를 위해서 1. 회사의 정책 점수 (예, 광고컬렉션을 최상단에 노출되어야 한다. 특수 목적의 컬렉션 (영화나 TV드라마 등)이 잘 매칭되면 최상단에 노출되어야 한다. 새로운 컬렉션 (예, 실시간 검색)이 오픈했기 때문에 상당기간동안 상단에 노출시켜서 사용자들의 주목/관심을 끌어들인다. 등) 2. 사용자 피드백 점수 (쉽게 설명해서, 많은 사용자들이 클릭한 컬렉션을 가능하면 상단에 노출시킨다. 일종의 집단지성 Collective Intelligence를 활용한 것입니다.) 그리고, 3. 문서/컬렉션 매칭점수 (즉, 사용자가 입력한 키워드와 잘 매칭되는 컬렉션을 상단에 노출시킨다. 즉, 보기 좋은 떡이 먹기도 좋다.)를 적절히 이용해서 현재 컬렉션간의 동적 경쟁을 시켜서, 가장 적합하다고 판단되는 컬렉션을 최상단에 노출시켜주고 있습니다. 그런데, 이런 동적 컬렉션 랭킹에도 분명 문제점이 있습니다. 바로, 고객의 (역?)기대치를 만족시키지 못한다는 것입니다. 매번 (일정기간은 컬렉션 순서가 고정되겠지만) 또는 쿼리마다 컬렉션의 노출순서가 달라진다는 점입니다. 검색엔진을 많이 사용한 사용자들은 검색을 하기 전에 미리 대강 알고 있습니다. 내가 특정 쿼리를 입력하면 카페 컬렉션은, 블로그 컬렉션은, 뉴스 컬렉션은 몇번째 즈음에 노출될 것같다는 감을 가지고 있습니다. 그런데, 라인업에서 제공하는 동적인 랭킹으로 인해서 사용자들이 기대했던 위치에 카페, 블로그, 뉴스 등의 컬렉션이 노출되지 않을 수도 있다는 것입니다. 사용자들의 만족도를 높이기 위해서 단행한 조치가, 역으로 사용자들의 기대치를 역행시키는 결과를 제공해주는 꼴이 되었습니다. 제품/서비스의 일관선 Consistency가 사용자의 기대치 모델에서 필수한 요소인데, 라인업 프로젝트의 결과물은 그런 점에서 일부 문제가 있습니다. (물론, 라인업 프로젝트를 통해서 많은 이들이 원하는 결과물이 최상단에 노출되기 때문에 전반적인 만족도는 향상되었습니다. 단지, 사용자들의 다른 기대가 조금 비틀어졌다는 것입니다.)

 두번째 사례는, '다음 통합웹 검색 MOAS'에서 밝혔던 바로 그 프로젝트입니다. 내부적으로 컬렉션 간의 결과를 썪는다는 이유에서 Fusion이라는 일반적인 이름을 사용했습니다. (그래서, 제가 담당하고 있는 시점에서 나만의 이름을 붙여주지 못해서 MOAS라는 이름을 지난 포스팅에서 그냥 명명했습니다. MOAS = Mother of All Searches 즉, 모든 검색의 어머니) 지난 포스팅을 참조하시면 알겠지만, 모아스 (모았어)는 풀텍스트 (문서의 길이가 긴 경우) 컬렉션들 (뉴스, 카페, 블로그, 게시판, 지식, 웹문서 - 처음에는 뉴스는 미포함이었지만, 지금은 가끔 포함되는 듯함)의 결과를 하나의 통합웹 컬렉션에 묶어서 보여주는 것입니다. 라인업에서는 컬렉션 단위로 가장 적합한 문서를 가진 컬렉션을 최상단에 노출시키는 것이지만, 모아스에서는 문서 단위에서 가장 최상의 문서를 최상단에 노출시켜주는 것입니다. 긴 설명은 생략하고, 모아스의 이런 방향은 제가 오래 전부터 생각하던 바라서 바람직한 시도였습니다. 그런데, 이 통합웹 컬렉션을 서비스해주는 측면에서 사용자들의 기대를 일부 만족시키지 못하는 면이 있습니다. 다음검색을 사용해보신 분들은 아시겠지만, 어떤 쿼리/검색어에 대해서는 출처별보기가 노출되고 (기존의 라인업 결과), 또 어떤 쿼리에 대해서는 통합웹 컬렉션이 노출됩니다. 많은 트라이를 해보시면, 적당히 쿼리의 길이가 길고 단어수가 많은 경우 (즉, 소위 롱테일 쿼리) 통합웹이 노출되고, 1~2 단어의 단문 쿼리에 대해서는 기존의 출처별보기가 노출되고 있습니다. 바로 이 점을 얘기하고 싶은 것입니다. 사용자들이 어떤 쿼리를 입력했을 때, 결과가 출처별보기가 나올 것같다 또는 모아보기가 나올 것같다라는 기대를 가지게 못한다는 점입니다. 출처별로 보일 것같은 쿼리를 던졌는데 모아보기가 노출되고, 반대고 모아보기가 나올 것을 기대했는데 출처별보기가 나오고... 도대체 어떤 쿼리 (형식/패턴)를 다음검색에 던져야, 출처별보기 또는 모아보기가 나올지 좀처럼 예측을 할 수가 없다는 점입니다. 그런데, 어떤 경우에 어떤 결과가 나온다는 식의 좀 구체적이고 정형화된 문서/가이드라인이라도 제공해주면 좋을텐데, 다음검색 공식 블로그에 단지 통합웹 컬렉션 오픈에 대한 공지만 나왔지, 조금 구체적인 가이드라인을 제공해주지 못했다는 아쉬움이 남습니다. 제 개인적인 바램/욕심으로는 현재 '통합웹 - 출처 구분없이 적합한 순으로 보여드립니다. - 출처별보기'라는 통합웹 컬렉션의 상단 설명에 '통합웹 가이드라인'이라는 링크를 걸어줘서 어떤 경우에 통합웹이 활성화되는지 등에 대한 간단한 가이드라인이라도 제공해주면 좋겠다는 바램입니다.

 낚시제목에서 시작해서, 카노모델을 (부정확하게) 설명드렸고, 또 다음검색에서 선보인 두가지 프로젝트/기술에서 일부 사용자들의 기대와 어긋난 결과를 제공해주는 (또는 기대를 하지 못하는) 경우가 발생할 수 있다고 글을 적었습니다. ... 적당한 클로징 멘트가 생각이 나지 않으니, 이만 적겠습니다.

댓글을 달아 주세요

Share           Pin It
 이제껏 본 블로그를 통해서 제가 지금 다니고 있는 회사 (다음 커뮤니케이션) 및 경쟁사들의 서비스나 그들의 경영/서비스 전략에 대해서 많은 비판을 올렸습니다. 제 짧은 세치혀로 그런 비판을 하는 것이 옳은가에 대한 가치판단은 아직도 서지 않습니다. 그래서, 나름 회사에 사죄한다는 의미에서 다음검색에서 담당했던 몇몇 부분들에 대해서 소개하는 글들을 몇 차례 적어볼까 합니다. 하나의 서비스/제품이 나오기까지 많은 사람들이 관여하기 때문에, 저만의 공으로 돌릴 수는 없지만 그래도 제가 했던 부분까지에 대한 소개글을 적어볼까 합니다. 그래서, 오늘은 그 첫번째 글로 다음검색의 '통합웹 컬렉션' (내부에서 통합검색에서 '출처'별 영역을 컬렉션 Collection이라 지칭하기 때문에 본 포스팅에서도 그 용어를 그대로 사용하겠습니다.)에 대한 글부터 시작하겠습니다. (아래에 용어들이 혼용되어서 이해하기가 조금 어려울 수도 있다는 점 미리 밝힙니다.)

 여러 포스팅들을 통해서 현재의 (한국의) 검색은 구글이 만들어놓은 패러다임과 네이버가 만들어놓은 패러다임에 종속되어있다고 말했습니다. 당연히 세계적으로 구글의 점유율이 거의 70%이고, 한국에서는 네이버의 점유율이 60%에 이르는 현 시점에서 어쩔 수 없는 것입니다. 그런데, 구글은 검색 그 자체에 대한 패러다임을 만들어놓았다면, 네이버는 한국적 (?) 검색에 대한 패러다임을 만들어놓았습니다. 구글의 검색 이야기는 일반 배제하고, 네이버가 만들어놓은 한국 검색의 병패는 바로 검색결과를 출처별 (컬렉션)로 보여주도록 만들었다는 것입니다. 물론, 정보의 성격에 따라서 출처별로 따로 보여줘야하는 경우가 많이 있지만, 네이버에서 시도했던 것은 검색어/쿼리에 내재된 사용자의 의도라던가 검색된 정보의 성격 등을 모두 무시하고 단순히 카페글, 지식글, 블로그글 등으로 구분했다는 점입니다. 이런 출처별 구분이 사용자들에게 더 좋은 결과를 보여주기 위한 방편으로 설계되었다면 제가 병폐라는 말까지 사용하지 않을 것입니다. 이런 출처별 보기의 시작은 기술력의 부재에서 시작했습니다. 더 엄밀히 말하면, 대용량의 데이터를 효과적으로 처리하지 못하고, 이종의 출처에서 온 정보들에 대한 랭킹기술이 부재했다는 것입니다. 그래서, 해당 출처 내에서만 검색결과를 만들어내고, 그 내에서 랭킹요소를 적용해서 통합검색에서 출처/컬렉션별로 단순하게 나열하는 것으로 검색이 끝나도록 만들었습니다. 그런데, 자신들의 기술력 부재에 대한 자성의 반응보다는 마치 사용자들의 편의를 위해서 이렇게 만들어두었다는 식의 마케팅에 집중했고, 또 그런 노력에 의해서 한국이용자들은 모두 검색하면 당연히 출처별로 보여줘야된다는 인식을 가지게 되었습니다. 그래서, 후발업체들인 다음이나 네이트 등도 당연히 출처별로 검색결과를 보여줘야되는구나라는 생각을 가졌던 것같습니다. 순전히 웹검색에 초점을 맞추던 90년대의 네이버나 엠파스 (그리고 야후, 구글 등)의 검색결과를 기억하신다면 당시에는 출처의 구분이 없었습니다. (그런데, 요즘은 구글도 출처별로 구분하기 시작해서, 전 별로 좋아하지 않습니다. 그래도, 나름 스마트하게 출처구분을 해주고 있어서 다행이라면 다행입니다.) 어쨌던 네이버의 이런 노력 (기술력의 부재의 결과)으로 '한국의 검색 = 출처별 검색'이라는 등식이 성립하였습니다. (출처별 보여주기가 나쁘다거나 장점이 없다라고 말하는 것이 아닙니다. - 단순히 네이트 '수手맨틱'검색 광고에서처럼 출처별보기를 매도하는 것이 아닙니다.) 

 제가 회사에 들어오기 전부터 그리고 회사에 들어온 이후로 계속 주장했던 것이 바로 이런 출처별 경계를 없애자는 것이었습니다 (참고). 그런데, 2년의 시간이 흐른 후에 그 작업을 제가 직접 담당하게 되었습니다. (그런데, 처음 3개월간의 프로토타입을 만드는 것까지만 저 혼자서 담당했고, 그 이후에 팀을 옮기게 되어서 다른 후속작업들은 다른 동료들이 마무리하였습니다. 그런데, 서비스가 오픈한 이후에 제 노력에 대한 보상 (?)은 어느 곳에도 없더군요. 참, 씁쓸하고 욕나오는 현실.) 이 글에서는 제가 처음 3개월동안 시도했던 출처통합에 대한 얘기를 다룰려고 합니다. 제 손을 떠난 이후의 작업에 대해서는 제가 잘 모르는 일이니 생략하겠습니다. 미리 밝혀두지만, 제가 3개월동안 작업했던 내용이나 알고리즘이 현재의 다음통합웹 컬렉션에 어느 정도 반영되었는지는 알 수가 없습니다. 완전히 새롭게 탄생했을 수도 있기 때문에, 아래에 적는 내용을 100% 신뢰하지는 마십시오. 그리고, 이 프로젝트의 아쉬운 점 한가지는 저는 보통 새로운 일을 시작할 때 제일 먼저 프로젝트/코드명을 정하는 것인데, 이 프로젝트에는 제가 정한 이름을 붙여주지 못했습니다. 단순히 위에서 내려온 일반적인 Fusion이라는 이름을 그냥 사용했습니다. 그래서, 지금이라도 이 프로젝트의 이름을 모아스 MOAS로 정했습니다. 한글로 '모았어' 즉, 모아보기라는 의미도 가지지만, 영문으로 Mother of All Searches, 즉, '모든 검색의 어머니'라는 이름을 붙여주려고 합니다. (*참고. MOAS는 미국의 대표적인 강력 폭탄인 MOAB이라는 Mother of All Bombs에서 영감을 얻은 것입니다.)

그림의 하단에 '통합웹'이라는 부분이 MOAS입니다. 기존에는 카페/블로그/게시판/지식/웹문서가 별도의 컬렉션으로 노출되었지만, 현재는 하나의 통합웹컬렉션으로 노출되고 있습니다. (참고로, 실시간검색 컬렉션에 공통적으로 나오는 @falnlov 는 눈에 익죠?)


 모아스를 설명하기 전에, 출처별 검색의 특징을 먼저 자세히 알 필요가 있는데... To make a long story short, '출처별로 다른 랭킹 알고리즘을 사용한다'입니다. 예를들어, 카페글의 경우 카페의 등급이 랭킹에 반영될텐데, 게시판글은 게시판 등급이라는 것이 존재하지 않습니다. 그리고, 뉴스 (모마스에는 미포함)글은 최신순이 정확도보다 더 높은 가중치를 받는 경우도 많습니다. 그리고, 다음검색에서는 초창기의 다음검색의 다음소프트라는 회사에서 만든 검색엔진을 사용한 부분도 있고, 회사 내에서 자체개발한 신규검색엔진을 사용하는 부분도 있습니다. 즉, 검색엔진에 따라서 검색색인방법과 랭킹방법이 다르다는 것입니다. 물론, 현재는 많은/대부분 컬렉션들이 신규엔진으로 교체되었습니다. 즉, 출처별로 검색된 문서에 태깅된 쿼리와의 매칭정도 및 검색스코어가 모두 다르고, 또 각 컬렉션의 특징을 반영해줘야하기 때문에, 단순히 출처별로 검색된 모든 문서들을 검색스코어에 따라서 나열해준다고 해서 컬렉션 퓨전이 이뤄지지 않습니다. 그래서, 이들 랭킹/검색스코어를 조정해주는 것이 컬렉션퓨젼/모아스의 핵심입니다.

 모아스에 반영된 요소들 (자세한 내용은 생략하겠습니다. 나중에 이 글이 기업정보를 빼돌렸다는 이상한 오해의 소지가 될 수가 있으니...)을 간략히 나열하겠습니다. 혹시, 더 자세한 설명이 필요한 부분은 별도로 요청해주시면, 후속글을 통해서건 아니면 별도의 방법을 통해서 알려드리겠습니다.
  • 문서별 랭킹점수: 출처별로 랭킹스코어를 계산하는 방식이 다르다고 했습니다. 그렇지만, 출처별로 해당 문서를 검색결과를 선정할 때 사용했던 점수를 모아스에서 완전히 무시할 수가 없습니다. 그런데, 앞서 말했듯이 출처별로 랭킹스코어의 스케일이 모두 다르기 때문에 스케일을 0~1로 정규화시켜줬습니다. 정규화 방법이나 선형변환, Min/Max, 표준화 등의 여러 방식이 있습니다.
  • 문서 매칭점수: 앞에 말한 문서 랭킹점수는 검색엔진에서 사용하는 모든 랭킹요소 (최신순, 정확도 등)을 고려해서 만든 문서점수라면, 문서매칭점수는 현재 검색화면상에서 보이는 검색스니펫 Snippet/summary이 사용자가 입력한 검색어 Query와의 매칭정도를 말하는 것입니다. 즉, 현재 화면상에서 검색스니펫이 사용자입력 키워드와 더 적합하게 일치하는 경우에, 모아스 결과에서 상단에 위치하게 되는 것입니다. 문서매칭점수에서 고려될 요소 중에 하나가, 문서스니펫이 얼마나 정상적이냐도 중요한 요소입니다. 문서스니펫이 상대적으로 짧다면 문제가 있을 가능성이 높고, 또는 문서가 'ㅋㅋㅋㅋ' 등으로 채워졌다면 이런 결과를 상단에 노출시켜줄 수도 없습니다. 
  • 컬렉션 매칭점수: 개별 문서스니펫에서 매칭점수를 구하듯이, 개별출처 전체에서의 매칭점수를 구했습니다. 이런 컬렉션매칭점수가 필요한 이유는, 더 적합한/매칭된 컬렉션에서 나온 문서를 최종결과에서 상단으로 올려주기 위한 것입니다.
  • 컬렉션 프리퍼런스: 이것은 사용자들이 선호하는 컬렉션의 결과를 상단에 놓기 위한 장치입니다. 특정 검색어 또는 특정 검색패턴에서 사용자들이 '카페'글을 주로 확인을 한다 등의 정보가 있다면 해당 패턴의 검색어에서는 카페글이 더 높은 우선순위를 가지게 되는 것입니다. 보통 컬렉션 프리퍼런스는 정책적인 점수가 반영이 될 수도 있고, 또 사용자들의 피드백이 반영이 될 수가 있습니다. 여담으로, 2008년도 이전의 다음검색에서는 검색최상단이 대부분 '카페'글이었습니다 (지금은 아님). 그런데, 네이버의 경우 '지식iN'이 검색최상단에 위치하는 경우가 많았습니다. 이는 다음에서는 카페를, 네이버에서는 지식을 우선시한다는 정책적인 결정이 있었기 때문입니다. 즉, 이런 정책/정치적인 논리에 의해서 최종 퓨젼결과가 달라질 수가 있다는 것입니다.  (... 컬렉션별로 줄을 세우는 방식에 대해서는 기회가 되면 다시 다루겠습니다.)
  • 중복여부: 같은 키워드에 대해서 중복/중첩된 글이 많이 나온다면 해당 문서의 중요도가 바뀔 수 있습니다. (모아스 랭킹에는 사용되지 않았지는 않았고, 단지 화면에서 중복문서 보여주기 용도로만 사용했음.)
  • 그 외에도, 글의 최신성도 사용될 수가 있고, 출처 내에서의 랭킹/순서도 모아스 랭킹에 이용되었습니다. 즉, 출처별 검색에서 카페라는 출처에서 '문서 A - B - C'의 순서로 문서를 보여주도록 소팅이 되었다면, 모아스에서도 가능하면 같은 순서를 유지하도록 해주는 것입니다. 물론, 매칭점수나 최신성점수 등에 의해서 ABC의 순서는 바뀔 수도 있습니다. 그래도, 이런 역전현상을 줄여주기 위해서 원 출처별 정열순서를 모아스에서 반영을 해준 것입니다.
  • 쿼리의 종류: 사용자들이 입력한 키워드와 서비스제공자들이 추천해주는 키워드 (실시간 급등어 등) 여부에 따라서 사용자들의 검색패턴/검색선호도가 조금씩 차이가 있습니다. 그리고, 실시간급등어의 경우 최신성이 많이 중요하기도 합니다. 그래서, 이런 사용자 입력 키워드 여부에 따라서 퓨젼/모아스 결과가 달라지게 됩니다.
  • 마지막으로 (다른 요소들이 더 사용되었을 것임), 위의 결과들을 하나로 뭉쳐주는 것...이 필요한데... (생략)

 마지막으로 퓨젼/모아스에서 중요한 요소는 도대체 언제 출처를 묶어서 보여줄 것이고, 또 언제 출처별로 따로 보여줄 것이냐에 대한 판단이 필요합니다. 이 부분은 제가 담당하지 않았기 때문에 확증적으로 말씀드릴 수 없지만... 롱테일 키워드 (조합형 검색어 및 검색어가 긴 경우)에 대해서 보통 모아스가 반응하고, 1~2 단어의 짧은 검색어에 대해서는 기존 방식인 출처별로 보여주는 경우가 많습니다. 사실 사용자들이 검색결과에 대해서 기대하는 것이 있기 때문에, 언제 모아스가 나오고 또 언제 출처별검색이 나온다라는 것을 예상할 수가 있어야하는데, 지금은 사용자들이 예측하기가 어렵습니다. 검색기대의 일관성 Consistency of Search Expectaction에 대한 고려가 다음검색에서는 많이 부족합니다. (ㅠㅠ)

 어제 밤에 이 글을 적겠다고 결심했을 때는 더 다양한 이야기를 펼쳐놓으려고 했는데, 막상 글을 적기 시작하니 어떤 내용을 담아야할지에 대한 판단이 흐려져서 그냥 생각나는 부분들만 적었습니다. 가능하면 후속글들을 통해서 빠진 부분들을 보충하겠습니다. 

댓글을 달아 주세요

  1. Tony 2010.09.01 11:50 신고 Address Modify/Delete Reply

    그래서 정치가 필요하신거에요... ㅋㅋ

  2. Favicon of http://www.seosem.kr BlogIcon 대기권탈출 2010.09.01 16:42 신고 Address Modify/Delete Reply

    다음 통합웹검색에 대해 좀 더 알게된 것 같습니다. 마지막에 언급하신 부분(검색기대의 일관성)이 어쩌면 사용자에게는 가장 큰부분 같은데 키워드광고 수익을 위해서는 어쩔 수 없는지 아니면, 다른 이유가 또 있는지 아쉽습니다.
    보통 상업적인 키워드가 포함되지 않았으면 띄워쓰기 상관없이 9자부터 통합웹검색을 보여주더군요. 다음은 새로운 검색방식을 선보였지만 사용자는 어떻게 느낄지 의문이 드네요.

    • Favicon of https://bahnsville.tistory.com BlogIcon Bahniesta 2010.09.01 19:40 신고 Address Modify/Delete

      아직은 통합웹 컬렉션을 좀더 conservative하게 적용하고 있습니다. 프로젝트를 시작할 때, 모바일에서는 좀더 공격적으로 적용한다고 들었는데,... 실제 적용되는 시점에는 제가 해당 프로젝트에 전혀 관여를 하지 못해서 어떻게 진행되는지 잘 모르겠네요.

Share           Pin It
 지난 주에 어제 실시된 6.2지방선거의 여론조사와 인터넷에 나타난 민심에 대해서 '여론조사와 샘플링의 덫'이란 글을 적었습니다. 선거가 실시되기 전에 글을 적었기에, 실제 선거결과를 가지고 후속글을 적는 것이 마땅한 것같아서 간단히 의견을 더하려고 합니다. 먼저 지난 글을 간단히 요약하면, 수도권의 서울시장, 경기도지사, 인천시장의 선거여론조사에서 여당의 후보들이 야당의 후보들보다 10%이상의 압승이 예상된다는 여론조사들이 주요 방송/신문사들에 보도되었습니다. 그런데, 다음검색에서 간단히 'vs 검색'을 해보면, 인터넷에서는 어떤 후보자를 많이 찾아보는지 알 수가 있다고 했습니다. 오프라인 여론조사에서는 여당후보들의 압승이 예상되었지만, 인터넷에서는 야당후보들에 대한 관심이 더 높았습니다. 이런 이유로, 오프라인의 조사에서는 주소 집전화번호를 이용해서 낮시간에 전화를 받을 수 있는 가정주부들이나 어르신들의 성향이 많이 반영되었기 때문에, 나름 보수층들이 선호하는 여당후보의 지지가 높다고 했습니다. (여담이지만, 조중동으로 대표되는 보수/수구언론들이 여론의 향방을 자신들에게 유리하게 끌고가기 위해서 조작아닌 조작조사를 했던 것도 중요한 이유로 보입니다. 과장된 여론조사가 오히려 반작용을 일으켰다는 분석도 있습니다.) 그러나, 인터넷 검색의 경우 남성직장인들과 2~30대의 젊은층이 상대적 많이 이용하기 때문에 진보성향의 야당후보들에게 많은 관심이 가는 것이 당연하다는 글이 었습니다. 이 둘의 상반된 조사의 공통된 특징은 여론조사에서 샘플링을 잘못하면 아무리 좋은 기법을 사용하더라도 잘못된 결과가 나올 수 있다는 것입니다. 때론 그런 잘못된/과장된 결과 때문에 진짜 여론을 읽지 못할 수도 있다는 말을 했습니다. 실제 하워드 딘의 경우, 그의 추종자들의 말만 듣고 실패한 경우이고, 다음 아고라 등을 비롯한 수많은 인터넷 커뮤니티에서 활동하는 이들도 커뮤니티 내의 여론/성향만을 믿고 잘못된 결론에 이르는 경우가 많습니다. 잘못된/편향된 샘플링은 조사의 신뢰도도 떨어뜨리지만, 잘못된 결론에 이르기도 합니다. 여담으로, 제품 기획/마케팅에서 포커스그룹 또는 테스트그룹의 실효성이 종종 제기되는 것도 여론조사의 편향된 샘플링과 원론적으로 같은 이유에서 발생합니다. 고객지향혁시 Customer-driven innovation이 많은 경우 성공하지만, 중요한 포인트들을 놓쳐버리고 대실패하는 경우도 같은 이치이고, 반면에 스티브 잡스 주도의 애플이 아이폰, 아이패드 등의 여러 분야에서 일반 분석/비평가들의 예상을 깨고 성공하는 것도 이런 편향된 샘플링을 극복했기 때문에 가능한 것입니다. '전문가의 의견이 중요하지만 전문가가 모든 것을 말해주지는 않는다'라는 교훈도 얻을 수 있습니다. (좀 길게 벗나간 얘기를 했습니다.)

 선거전의 여론조사에서는 여당후보의 압승이, 인터넷 트렌드에서는 야당후보의 선전/압승이 예상되었습니다. 실제 어제밤의 개표결과는 모두 아시겠지만, 서울시장은 근소한 차이로 여당의 오세훈 시장이 수정했고, 경기도지사에서는 5%정도의 차이로 김문수 지사가 수성했습니다. (여론조사에서 오세훈시장과 김문수지사가 최소 10~15%이상의 격차를 보일 거라고 했습니다.) 그리고 인천시장의 경우, 오히려 야당후보인 송영길 전의원이 안상수 현 시장을 5%정도의 차이를 두고 신승을 거두었습니다. 단순 승패를 가리는 블리언 정확도에서는 여론조사가 67%의 정확도를, 인터넷 트렌드가 33%의 정확보를 보이기 때문에 여론조사가 일견 승리한 것같습니다. 그런데, 정량적인 수치면에서 이번 여론조사들은 모두 참패한 것과 다름이 없습니다. 물론, 인터넷 트렌드도 정량적인 부분에서 참패한 거나 매한가지입니다. 100년이상의 경험과 노하우를 가진 여론조사들이 최근의 여러 선거에서 매번 죽을 쑤는 이유가 참 궁금합니다. 심지어, 선거후의 출구조사에서도 최근의 선거들이 여론을 제대로 짚어내지 못한 경우가 많았습니다. 금번 선거에서는 방송4사 (MBC, KBS, SBS, CBS)가 공동으로 출구조사를 실시했는데, 선거전 여론조사보다는 정확도가 높았지만 과거에 보여줬던 포스는 못 보여준 것같습니다. 이런 일련의 사건들을 보면서, 이제 여론조사방법도 달라져야할 것같다는 생각이 듭니다. 지난 글에서 밝혔듯이, 인터넷에서 검색되는 검색어회수나 신문/방송/블로그에 언급되는 키워드의 출현빈도 등으로 여론의 향방을 결정하는 새로운 조사방법이 적용되어야할 것같습니다. 그리고, 기존의 집전화 위주의 일부 유권자/소비자를 대상으로 하던 여론조사 방식을, 핸드폰으로 확대하는 것이 단기적으로는 실효성이 있는 여론조사 방법일 듯합니다. 그리고, 현재 난립하고 있는 수많은 여론조사기관들의 도덕성/모럴 해저드 Moral Hazard도 생각해봐야 합니다. 단순히 조사의뢰기관에서 받는 수익 때문에, 그들에게 유리한 결과를 보여주는 그런 부도덕한 조사기관들은 이 사회에서 퇴출되어야 합니다. 그리고, 그런 편향된 결과를 가지고 자신들이 옳다고 주장하는 그런 기관들의 부도덕성도 문제를 제기해야 합니다. 대표적으로 현재 한나라당이나 정부기관들이 사업을 추진하면서 잘못된/편향된 여론조사를 가지고 정책을 운영하는 그런 비도덕성을 개선하지 못한다면 대한민국의 민주주의는 영원히 1.0에 머무를 것입니다. 그리고, 인터넷에 흐르는 또 다른 편향된 민심도 경계를 해야 합니다. 일부의 오피니언 세터 또는 오피니언 리더들의 편향된 여론주도는 대한민국 민주주의 3.0에서는 없어져야 합니다. 그러나, 인터넷에서는 일부 부작용도 보이지만, 바로 새로운 정보가 추가되어서 잘못된 정보들이 빨리 자정되는 모습은 참 긍정적입니다. 군중에 의견을 삽입시키는 것이 여론이 아니라, 궁중 속에서 삭트는 생각들을 정리해서 보여주는 것이 여론입니다. 과연 21세기의 여론의 향방은 어떻게 될까요? 어떻게 하면 그런 여론을 잘 찾아내고, 더 나아가 긍정적인 방향으로 여론을 리딩할 수가 있을까요? 

 기독교에 '퀘바디스 도미네 Quo Vadis'라는 유명한 말이 있습니다. 바로 '주여, 어디로 가시나이까?'를 뜻하는 라틴어입니다. 같은 질문을 지금해야할 듯합니다. '여론은 어디로?' 여론을 조사하는 기관도 그 방법의 세련함을 더해야하고, 이런 여론조사결과를 의뢰하고 활용하는 기관들의 도덕성도 더욱 투명해져야 합니다. 여론이 가는 그곳에 미래가 있습니다. 그러나 잘못된 여론의 끝은 몰락/파멸이라는 것도 잊어서는 안 됩니다.

댓글을 달아 주세요

Share           Pin It
 오늘 6월 2일의 지방선거 때문에 지금 여론조사가 한참입니다. (물론 천안함사건으로 인한 전쟁설이나 그로 인한 경제하강이 더 큰 이슈이긴 합니다.) 현재 여러 조사기관에서 각 지역별 후보들의 지지율을 발표하고, 또 각 후보들은 자신들에게 유리한 지지율데이터도 공개하고 있습니다. 현재 각 지역의 지지율에 관련된 신문기사들이 많기 때문에 별도의 수치나 링크는 생략하겠습니다. 그리고, 전국의 지지율을 언급하는 것도 문제가 있으니, 일단 수도권 (서울, 경기, 인천)만을 생각해보겠습니다. 현재 조사기관에 따라 수치는 조금씩 다르겠지만, 여당후보 (오세훈, 김문수, 안상수)들이 야당후보 (한명숙, 유시민, 송영길)를 5~10%정도 앞선 것으로 보도되고 있습니다. 그런데, 제가 의문을 가지고 있는 것은 인터넷 상으로 현재 정권의 무능과 부정에 대해서 많은 이들이 질타하고 있고, 반여친야성향이 인터넷 공간에서는 늘리 퍼져있다는 것입니다. 이런 공감대에서 여당후보들이 5~10%이상의 큰 격차로 선두를 지키고 있다는 것이 참 의아하다는 것입니다. 그래서, 다음검색에서 검색트렌드를 보았습니다. 검색트렌드는 다음검색창에 입력된 검색어들의 최근 추이를 보여주는 서비스입니다. (검색트렌드 바로가기: 한명숙 vs 오세훈, 유시민 vs 김문수, 송영길 vs 안상수) 이상의 결과들에서 보듯이, 앞선 여론조사에 반해서 야당후보들의 인기가 여당후보들의 그것보다 더 높다는 것을 알 수가 있습니다. 앞의 여론조사와 후의 인터넷 검색트렌드 중에서 어느 것이 진실에 가까운지는 실제 6월 2일이 지나봐야 알 수가 있습니다. 그런데, 현시점에 말할 수 있는 것이, 전화를 통한 여론조사던 인터넷 검색창의 검색트렌드던 모두 bias가 있다는 것입니다. 즉, 샘플링을 어떻게 하느냐에 따라서 (그리고, 설문내용을 어떻게 정하느냐에 따라서) 여론결과가 많이 차이가 난다는 것입니다.

 샘플링의 오류에 의한 잘못된 여론조사의 가장 대표적인 예로 1936년의 미국대선입니다. 당시에 갤럽과 리터러리 다이제스트라는 인기있는 잡지는 1000만명의 시민들에게 대선에서 누가 승리할 것인지에 대한 설문엽서를 보냈습니다. 결과는 랜든이 57%의 지지율로 43%를 얻은 루즈벨트에 압승을 할 것이라고 예측을 했습니다. (실제 236만명의 응답을 받음) 그런데, 실제 대선의 결과는 루즈벨트가 62%의 득표률을 얻어서 대통령으로 당선되었습니다. 왜 이런 여론조사의 결과와 실제 선거의 결과가 많이 달랐을까요? 그것은 바로 갤럽과 리터러리 다이제스트가 엽서를 발송한 1000만명의 표본집단에 있습니다. 그들은 당시에 전화가입 및 자동차 소유자에서 1000만명의 설문인단을 임의로 선정하였습니다. 임의로 샘플링하는 것은 여론조사의 전형이지만, 그들의 실수는 표본집단을 전화 및 자동차 소유자 중에서 선택했다는 것입니다. 즉, 당시에 전화 및 자동차를 소유하고 있다는 것은 중산층 이상의 부를 소유한 집단입니다. 현재도 비슷하지만, 중산층 이상의 부유층들은 민주당보다는 공화당을 선호합니다. 그렇기 때문에 공화당 후보인 랜든이 압승할 것이라는 여론조사결과가 나왔습니다. 그런데, 실제 투표에서는 여론조사의 대상이 될 수 없었던 전화나 자동차를 소유할 수가 없는 중하층들의 성향이 반영이 되어, 민주당 후보인 루즈벨트가 대통령으로 선출이 되었습니다. 그리고, 최근의 미국 대선에서도 샘플링의 오류가 발생했다. 1936년과 같은 갤럽조사는 아니었지만, 인터넷의 성장과 함께 붐을 일으켰던 전 버몬트 주지사인 하워드 딘의 얘기다. 그는 인터넷에서 스타였고, 그래서 마치 민주당 대선후보 (& 대통령)가 될 기세였다. 그러나, 그의 추종자들만이 밋업 meetup에 모여들었다. 성향이 비슷한 이들 사이에 발생하는 이런 집단현실왜곡이 샘플링의 오류의 일종이다.

 이런 샘플링의 오류가 현재의 수도권후보들에 대한 지지율이나 다음검색의 트렌드차트에 그대로 반영이 된 것같습니다. 현재 여론조사는 대부분 유선전화에 의존합니다. 즉, 낮시간에 유선전화를 받을 수 있는 경우 (회사로 전화오지 않는 이상)는 대부분 가정주부나 노년층입니다. 가정주부의 경우에 그 성향은 잘 알 수가 없으니, 현재 노년층의 경우 여당에 편향된 경우가 많이 있습니다. 역으로, 남성투표자들이나 청년층에 대한 여론성향이 전화여론조사에서는 반영이 되어있지 않을 가능성이 높습니다. (대단으로, 핸드폰으로 여론조사를 시도하는 것도 괞찮을 것으로 보입니다.) 그리고, 다음검색의 경우에는 역으로 인터넷 사용인구가 전화조사와 반대가 된다는 것입니다. 대부분 젊은층이 컴퓨터/인터넷에 익숙하고, 아직까지 일반가정에 고속인터넷이 설치되지 못한 경우도 많아서 인터넷 사용자층이 (회사에서 인터넷에 접속하는) 남성의 비율이 상대적으로 높을 것으로 예상이 됩니다. (사회생활을 하는 경우, 후보자들이 쏟아내는 단순한 홍보전단이나 주장을 받아들이기보다는 동료, 친구들과 다양한 의견을 주고받고, 또 다른 과거 데이터를 조회해볼 가능성도 높기 때문에 투표의 결과가 단순치는 않을 것입니다.) 이런 사용자층의 문제도 있지만, 지역에도 문제가 있습니다. 여론조사의 경우, 해당 지역에 거주하는 유권자들로 한정이 되지만, 인터넷에 접속하는 사람들은 해당 지역을 벗어나서도 검색을 해볼 수가 있기 때문에 실제 해당 지역의 여론추이와 다를 수가 있습니다. (그런데, 다음검색의 검색트렌드에서 '지역'탭을 눌러보면, 해당 지역에서의 검색결과도 여당후보보다는 야당후보들에 대해서 더 많은 검색을 해봤다는 것을 알 수가 있습니다. 단순히 IP로 매핑된 예측값이라 실제와 조금 오차는 있을 수 있습니다.) 그리고, 또 하나 우려되는 부분은 동명이인의 존재도 검색결과에 문제를 일으킵니다. 그런데, 현재 동명이인으로 오인될 수 있는 이는 인천시의 여당후보인 안상수씨밖에 없습니다. (실제 검색트렌드에서 2달 전에 안상수씨의 검색추이가 높았던 것은 인천시장 후보인 안상수씨가 아니라, 봉은사문제를 일으킨 한나라당 원내대표인 안상수씨에 대한 검색결과입니다.) 여론조사에서와 검색트렌드에서 공통으로 나타나는 것이 바로 샘플링 오류입니다. 이런 샘플링 오류를 완전히 상쇄시켜서 실제 여론의 추이와 가장 비슷하게 예측할 수 있는 방법이 있을까요? 그런 방법이 있다면 '대박'... (물론 방법이 없는 것은 아닙니다. 전체 유권자들을 모두에게 설문조사하는 것입니다. 그래도, 설문지를 어떻게 만드느냐에 따라서 결과가 또 많이 달라집니다.) 어쨌던 현재로써는 6월 2일이 되어, 실제 득표률을 확인해보는 수밖에 없을 것같습니다.

  * 참고로, 인터넷 검색트렌드를 이용해서 다양한 사회현상을 분석하는 것은 일반적인 방법론이 되었습니다. 대표적으로 HitWise나 comScore같이 인터넷 트래픽을 수집,조사, 분석하는 전문회사들이 있습니다. 그리고, HitWise에서 글로벌 리서치 총괄담당인 빌 탠서 Bill Tancer는 이런 내용을 기반으로 <검색의 경제학 Click>이라는 책을 발표했습니다.

 ** 검색트렌드의 그래프를 캡쳐해서 글에 삽입하는 쉬운방법이 있었지만, 어제 읽은 Nicholas Carr의 Wired 기고문에 영감을 얻어서 이 글을 읽는 분들의 집중력, 더 깊은 사고, 연관 사고에 도움을 주기 위해서 일체의 그림을 넣지 않았습니다. Nicholas Carr의 The WEb Shatters Focus, Rewires Brains 참조.

 *** 덧, 만약 이번에 여론조사가 아니라 검색트렌드가 더 예측력이 높다면, 국내외 모든 여론조사기관들은 이제 뭘 하고 살아야 하나? 요즘 잘 하는 교묘한 설문지 만들기를 십분 활용해서 천안함 합조단같은데랑 공조하면 될 것같다.

댓글을 달아 주세요

  1. Favicon of http://blog.daum.net/hazzling BlogIcon nandaro 2010.05.26 22:22 신고 Address Modify/Delete Reply

    음~ 그렇군요 역시~ 음~
    관건은 젊은 층의 투표율인가? ㅋ

Share           Pin It
 지난번 같은 제목의 글에서 제가 구상중인 소셜검색 Social Search에 대한 얘기는 미뤄둔채, 일반적인 소셜검색의 여러 유형들에 대한 글만 적었습니다. 오늘도 제가 현재 나름 준비중인 소셜검색에 대한 구체적인 사항은 적지 않을 예정입니다. 대신, 오늘은 제가 생각하는 소셜검색에 이르기 전 단계의 내용들, 즉 소셜그래프라던가 또 소셜그래프에 엮인 글들에 대한 이야기를 전개하려 합니다. 제가 지금 테스트 버전으로 실험 중인 것이 다음뷰이기 때문에, 어쩌면 아래의 그림/설명은 다음뷰의 프레임워크에 치중되어있을 수 있다라는 점을 양해바랍니다.

 블로그와 다음뷰 (또는 메타블로그)를 사용해보신 분들은 아시겠지만, (사람의 측면에서, 아래의 그림과 같이) 블로고스피어를 구성하는 요소는 블로그에 글을 적는 블로거 (또는 아래의 그림에서 Writer), 그런 블로그글을 읽고 평가해주는 평가자 (Recommender), 그리고 검색 등을 통해서 그런 블로그글을 읽는 소비자 (Consumer)로 나눌 수 있을 것같습니다. 물론, 마이너한 다른 요인들이 존재하겠지만, 현재 제 머리 속의 그림으로는 글작성자, 글추천자, 그리고 글소비자로 나눌 수 있을 것같습니다. 물론, 글작성자가 다른 글을 읽는 글소비가 될 것이고, 또 그런 글에 대한 평가를 내리는 글추천자가 되는 일종의 Trinity를 형성할 수는 있지만, 일단은 모두가 별개의 사람으로 간주하겠습니다. 제가 소셜검색을 구상할 때, 염두에 뒀던 것은 글쓴이의 주제에 대한 전문성입니다. 물론, 소셜검색에서도 일반 텍스트 검색과 같이 검색어와 문서의 관련성 Relevancy이나 글의 작성시기 Recency도 중요하고, 일반 소셜검색에서 말하는 검색자/소비자와 글쓴이의 관계 (친밀도 Intimacy)도 중요합니다. 이런 일반 요소에 더해서, 글쓴이의 전문성에 가중치를 주고 싶습니다. 실제, 글쓴이의 전문성이라는 요소는 Aardvark에서 질문자들의 질문에 가장 적합한 답을 해줄만한 답변자를 찾는 아이디어에서 차용한 것입니다. 글쓴이의 전문성을 확인할 수가 있다면, 비슷한 방식으로 추천자의 신뢰성이나 소비자의 관심분야 등도 구축할 수 있을 것입니다. (이런 전문성, 신뢰성, 관심분야를 '프로파일'이라는 용어로 통일하겠습니다.)

블로고스피어 Trinity: 글작성자 글추천자 글소비자


 이어서, 위의 그림의 각 요소 및 관계에 대해서 좀 자세히 설명하겠습니다. (원 - 사람, 사각형 - 프로파일, 원사각형 - 히스토리)
  • 글작성자: 글작성자가 직접 자신의 전공/전문분야를 텍스트나 카테고리형식으로 명시화시켜줄 수도 있겠지만, 실제 그/그녀가 이제껏 작성한 글들이 그/그녀의 프로파일입니다. 그/그녀가 최근에 '박지성' '맨체스터유나이티드' '첼시' '프리미어리그' 등과 같은 글/단어를 많이 사용했다면, 그/그녀의 전문성은 축구, 프리어리그 등으로 국한시켜줄 수가 있습니다. 이렇게, 글쓴이의 최근 글들에서 그/그녀가 전문성을 가진 분야의 키워드/태그들을 뽑아낼 수가 있습니다. 실제, 다음뷰의 데이터에서도 전문/파워블로거들의 경우 이런 작성자 프로파일을 쉽게 만들어낼 수가 있었습니다. 그런데, 특정분양에 특정해서 글을 쓰지 않는 일반 블로거들의 경우에도 같은 방식으로 프로파일링이 가능한가?에 대한 고민은 여전하고, 또 전문 스패머들의 경우 특정단어들을 가지고 스패밍/어뷰징을 시도하기 때문에 글들에서 사용된 키워드들만을 가지고 전문가로 오인하게되는 위험을 안게 됩니다. 이를 해결하는 방법으로, 글쓴이의 인기도라는 항목/요소를 이용하는 방법도 있습니다. (구체적인 사항은, 다음번 포스팅으로 미루겠습니다.)
  • 글추천자: 글작성자의 프로파일은 그/그녀가 쓴 글들에서 얻듯이, 글작성자의 프로파일은 그/그녀가 추천했던 행위에서 얻을 수 있습니다. 즉, 이제까지 추천했던 글들의 품질이 얼마나 좋았느냐?에 따라서, 이 추천자가 추천한 글들이 신뢰할만한지 아니면 그저그런지를 짐작할 수가 있습니다. (작성자 프로파일처럼 추천자의 프로파일도 전문성이라는 요소로 만들어낼 수도 있습니다. 이 부분까지 고려된다면 너무 복잡해지기 때문에, 일단은 추천자 프로파일은 추천신뢰도라는 항목으로만 묶어두겠습니다.) 실제 다음뷰에서, 추천자들이 몇개의 글을 추천했고 그런글들이 다음뷰의 베스트로 몇 건이 올라갔는지 등을 고려해서 추천신뢰도를 구하고 있습니다. (다음뷰/블로거뉴스에 대한 간략한 설명은 '한장으로 보는 블로거뉴스 & 열린편집' 글 참조)
  • 글소비자: 글소비자의 프로파일 (관심분야)도 같은 형식으로 이제까지 어떤 글들을 보았는지에 대해서 조사해보면 다 나옵니다. 범위를 더 좁히면, 이제까지 검색창에서 입력한 키워드들을 종합해보면 글소비자/검색자의 관심분야를 쉽게 확인할 수 있습니다. 그런데, 이런 검색자의 검색히스토리를 검색엔진서버에 남겨놓고, 또 이를 분석해서 활용한다는 것은 개인 프라이버시 등의 법적 문제를 야기하기 때문에, 검색자/소비자 프로파일을 만들겠다는 생각은 현실성이 떨어집니다. (실제, 이런 프로파일을 만들어서 활용만할 수 있다면, 더 나은 검색결과제공 및 광고활용 등이 가능합니다. 그러나, 법적인 문제 뿐만 아니라, 현실적으로 어떻게 구현해서 활용할 것인가에 따른 여러 기술적인 어려움들도 있습니다.) 글소비자의 프로파일링은 어렵지만, 검색광고에서와 같이 현재의 '검색어'로도 글소비자의 프로파일이 충분합니다. (물론, 글소비자의 다양한 컨텍스트정보를 활용할 수 있다면 금상첨화겠지만...)
  • 그런데, 제가 그림에서 글작성자는 붉은색으로, 글추천자는 푸른색으로, 그리고 글소비자는 노란색으로 표시한 이유는... 글작성자는 뜨겁고 순수한 열정으로 글을 작성해줬으면 하는 바램에서, 글추천자는 냉철하고 중립위치에서 글을 평가해줬으면 하는 바램에서, 그리고 글소비자는 글작성자의 열정과 생각에 공감을 하면서 글을 읽어줬으면 하는 바램에서, 빵강, 파랑, 노랑으로 표시해뒀습니다. 이것이 제가 생각하는 진짜 건전하고 지속가능한 블로고스피어, 나아가 웹생태계 Web EcoSystem을 만들어가는 것이라 생각합니다. (관련글들은... 생략)

 그리고, 글작성자, 글추천자, 그리고 글소비자 사이의 관계에 대해서 잠시 언급하면... 먼저, 글추천자는 글작성자와 (개인적 친분이 있을 수도 있겠지만) 중립의 위치에서 냉정하게 글을 평가해줘야 합니다. 그래서, 제가 neutrality라고 표시해두었습니다. 역으로, 글작성자는 글추천자에게 어떠한 피드백도 줄 수가 없기에 화살표시가 없습니다. 또, 글작성자가 특정인의 추천자로부터 글을 추천받았다 손치더라도, 나중에 보상심리로 그 추천자의 글을 추천해주는 그런 일 (상호추천 Mutual recommendation)이 발생하면 안되기 때문에, 추천자에서 작성자로의 일방향 화살표를 해두었습니다. 두번째, 글소비자는 글추천자의 추천을 전적으로 신뢰하는 관계가 되어야 합니다. 트위터나 다른 많은 미디어에서도 그렇듯이, 특정 유명인이 글을 추천해주면 크게 의심없이 글을 읽는 것과 같은 현상을 말하는 것입니다. 추천자의 신뢰도 및 권위 Authority를 믿기 때문에, 추천된 글을 읽을 수가 있습니다. (역으로 화살표가 없는 것은 어쩌면 당연한 것이니 설명 생략) 마지막으로, 글작성자와 글소비자의 관계는 조금 더 복잡합니다. 이들 사이에는 원래부터 알고 지내던 지인/친구 관계일 수도 있지만, 글소비자가 일방적을 글작성자를 추종하는 관계일 수도 있습니다. 그래서, 글소비자로 향하는 화살표는 흰색으로 표시해두었습니다. 일반 블로그들에서도 보듯이 '친구블로그'와 '구독블로그'로 나뉩니다. 소셜검색에서, 친구가 적은 글을 보겠다는 니즈와 전문가/유명인의 글을 보겠다는 니즈가 동시에 있습니다. 이런 현상을 검은화살표와 흰화살표로 표시한 것입니다. 결국 이들 간의 관계는 친밀도 Intimacy로 표시됩니다. 친구사이의 근접도 closeness와 유명인/전문가에 대한 권위를 포괄해서 친밀도 또는 연결도 connectedness로 표시했습니다.

 이상의 이런 글작성자, 글추천자, 글소비자의 역할 및 관계를 잘 이해한다면 재미있는 소셜검색이 탄생할 거라 생각합니다. 지금은 조금씩 다음뷰의 데이터로 가능성만을 확인하고 있는데, 혼자서 시험삼아 진행하는 거라 속도도 많이 느리고 의미있는 (양과 질 모두) 성과를 만들어낼 수 있을까?라는 생각도 가지면서 준비/진행중에 있습니다. 다음에 다시 같은 제목의 글을 적게 된다면, 실제 위의 요소를 소셜검색/소셜랭킹에 어떻게 녹여낼 것인가?에 대한 글을 작성해보도록 하겠습니다.

댓글을 달아 주세요

  1. Favicon of http://mytears.org BlogIcon 정태영 2010.03.28 14:54 신고 Address Modify/Delete Reply

    blogrank ranking weblogs based on connectivity and similarity features

    이 논문을 한 번 읽어보시면 도움이 되지 않을까 싶습니다. :) 구상하셨던 내용과 유사한 내용이 정리되어 있는 논문입니다.

  2. 성준 2010.04.12 16:32 신고 Address Modify/Delete Reply

    근데 제가 글 소비자의 입장이라면 전 프로파일을 남기는 것에 대해 큰 거부감은 아직(?) 없습니다. 그런데 이게 법적인 문제를 야기한다니... 좋은 검색이 가능하다면 프로파일 남기는 것을 동의하고 사용하면 안될런지...

    그리고 요즘 트위터를 쓰면서 개인적으로 느끼는 문제지만 identity가 두개 이상 있었으면 좋겠다는 생각을 가져 봅니다. 물론 아이디를 두개를 가지면 되는 것이긴 한데.... 소셜검색이라면 이경우도 소비자로써 복수의 아이덴티티를 제공하면 좋겠다 싶은 생각이... (써놓고 보니 설계상 무시해도 될 듯..)

    여튼 한장의 그림(도표)에 집적된 고민을 보는 것은 때론 즐거움을 주네요.,