'social search'에 해당되는 글 2건

  1. 2010.03.28 소셜검색 My Drawing of Social Search... (2) (3)
  2. 2010.03.06 소셜검색 My Drawing of Social Search (2)
Share           Pin It
 지난번 같은 제목의 글에서 제가 구상중인 소셜검색 Social Search에 대한 얘기는 미뤄둔채, 일반적인 소셜검색의 여러 유형들에 대한 글만 적었습니다. 오늘도 제가 현재 나름 준비중인 소셜검색에 대한 구체적인 사항은 적지 않을 예정입니다. 대신, 오늘은 제가 생각하는 소셜검색에 이르기 전 단계의 내용들, 즉 소셜그래프라던가 또 소셜그래프에 엮인 글들에 대한 이야기를 전개하려 합니다. 제가 지금 테스트 버전으로 실험 중인 것이 다음뷰이기 때문에, 어쩌면 아래의 그림/설명은 다음뷰의 프레임워크에 치중되어있을 수 있다라는 점을 양해바랍니다.

 블로그와 다음뷰 (또는 메타블로그)를 사용해보신 분들은 아시겠지만, (사람의 측면에서, 아래의 그림과 같이) 블로고스피어를 구성하는 요소는 블로그에 글을 적는 블로거 (또는 아래의 그림에서 Writer), 그런 블로그글을 읽고 평가해주는 평가자 (Recommender), 그리고 검색 등을 통해서 그런 블로그글을 읽는 소비자 (Consumer)로 나눌 수 있을 것같습니다. 물론, 마이너한 다른 요인들이 존재하겠지만, 현재 제 머리 속의 그림으로는 글작성자, 글추천자, 그리고 글소비자로 나눌 수 있을 것같습니다. 물론, 글작성자가 다른 글을 읽는 글소비가 될 것이고, 또 그런 글에 대한 평가를 내리는 글추천자가 되는 일종의 Trinity를 형성할 수는 있지만, 일단은 모두가 별개의 사람으로 간주하겠습니다. 제가 소셜검색을 구상할 때, 염두에 뒀던 것은 글쓴이의 주제에 대한 전문성입니다. 물론, 소셜검색에서도 일반 텍스트 검색과 같이 검색어와 문서의 관련성 Relevancy이나 글의 작성시기 Recency도 중요하고, 일반 소셜검색에서 말하는 검색자/소비자와 글쓴이의 관계 (친밀도 Intimacy)도 중요합니다. 이런 일반 요소에 더해서, 글쓴이의 전문성에 가중치를 주고 싶습니다. 실제, 글쓴이의 전문성이라는 요소는 Aardvark에서 질문자들의 질문에 가장 적합한 답을 해줄만한 답변자를 찾는 아이디어에서 차용한 것입니다. 글쓴이의 전문성을 확인할 수가 있다면, 비슷한 방식으로 추천자의 신뢰성이나 소비자의 관심분야 등도 구축할 수 있을 것입니다. (이런 전문성, 신뢰성, 관심분야를 '프로파일'이라는 용어로 통일하겠습니다.)

블로고스피어 Trinity: 글작성자 글추천자 글소비자


 이어서, 위의 그림의 각 요소 및 관계에 대해서 좀 자세히 설명하겠습니다. (원 - 사람, 사각형 - 프로파일, 원사각형 - 히스토리)
  • 글작성자: 글작성자가 직접 자신의 전공/전문분야를 텍스트나 카테고리형식으로 명시화시켜줄 수도 있겠지만, 실제 그/그녀가 이제껏 작성한 글들이 그/그녀의 프로파일입니다. 그/그녀가 최근에 '박지성' '맨체스터유나이티드' '첼시' '프리미어리그' 등과 같은 글/단어를 많이 사용했다면, 그/그녀의 전문성은 축구, 프리어리그 등으로 국한시켜줄 수가 있습니다. 이렇게, 글쓴이의 최근 글들에서 그/그녀가 전문성을 가진 분야의 키워드/태그들을 뽑아낼 수가 있습니다. 실제, 다음뷰의 데이터에서도 전문/파워블로거들의 경우 이런 작성자 프로파일을 쉽게 만들어낼 수가 있었습니다. 그런데, 특정분양에 특정해서 글을 쓰지 않는 일반 블로거들의 경우에도 같은 방식으로 프로파일링이 가능한가?에 대한 고민은 여전하고, 또 전문 스패머들의 경우 특정단어들을 가지고 스패밍/어뷰징을 시도하기 때문에 글들에서 사용된 키워드들만을 가지고 전문가로 오인하게되는 위험을 안게 됩니다. 이를 해결하는 방법으로, 글쓴이의 인기도라는 항목/요소를 이용하는 방법도 있습니다. (구체적인 사항은, 다음번 포스팅으로 미루겠습니다.)
  • 글추천자: 글작성자의 프로파일은 그/그녀가 쓴 글들에서 얻듯이, 글작성자의 프로파일은 그/그녀가 추천했던 행위에서 얻을 수 있습니다. 즉, 이제까지 추천했던 글들의 품질이 얼마나 좋았느냐?에 따라서, 이 추천자가 추천한 글들이 신뢰할만한지 아니면 그저그런지를 짐작할 수가 있습니다. (작성자 프로파일처럼 추천자의 프로파일도 전문성이라는 요소로 만들어낼 수도 있습니다. 이 부분까지 고려된다면 너무 복잡해지기 때문에, 일단은 추천자 프로파일은 추천신뢰도라는 항목으로만 묶어두겠습니다.) 실제 다음뷰에서, 추천자들이 몇개의 글을 추천했고 그런글들이 다음뷰의 베스트로 몇 건이 올라갔는지 등을 고려해서 추천신뢰도를 구하고 있습니다. (다음뷰/블로거뉴스에 대한 간략한 설명은 '한장으로 보는 블로거뉴스 & 열린편집' 글 참조)
  • 글소비자: 글소비자의 프로파일 (관심분야)도 같은 형식으로 이제까지 어떤 글들을 보았는지에 대해서 조사해보면 다 나옵니다. 범위를 더 좁히면, 이제까지 검색창에서 입력한 키워드들을 종합해보면 글소비자/검색자의 관심분야를 쉽게 확인할 수 있습니다. 그런데, 이런 검색자의 검색히스토리를 검색엔진서버에 남겨놓고, 또 이를 분석해서 활용한다는 것은 개인 프라이버시 등의 법적 문제를 야기하기 때문에, 검색자/소비자 프로파일을 만들겠다는 생각은 현실성이 떨어집니다. (실제, 이런 프로파일을 만들어서 활용만할 수 있다면, 더 나은 검색결과제공 및 광고활용 등이 가능합니다. 그러나, 법적인 문제 뿐만 아니라, 현실적으로 어떻게 구현해서 활용할 것인가에 따른 여러 기술적인 어려움들도 있습니다.) 글소비자의 프로파일링은 어렵지만, 검색광고에서와 같이 현재의 '검색어'로도 글소비자의 프로파일이 충분합니다. (물론, 글소비자의 다양한 컨텍스트정보를 활용할 수 있다면 금상첨화겠지만...)
  • 그런데, 제가 그림에서 글작성자는 붉은색으로, 글추천자는 푸른색으로, 그리고 글소비자는 노란색으로 표시한 이유는... 글작성자는 뜨겁고 순수한 열정으로 글을 작성해줬으면 하는 바램에서, 글추천자는 냉철하고 중립위치에서 글을 평가해줬으면 하는 바램에서, 그리고 글소비자는 글작성자의 열정과 생각에 공감을 하면서 글을 읽어줬으면 하는 바램에서, 빵강, 파랑, 노랑으로 표시해뒀습니다. 이것이 제가 생각하는 진짜 건전하고 지속가능한 블로고스피어, 나아가 웹생태계 Web EcoSystem을 만들어가는 것이라 생각합니다. (관련글들은... 생략)

 그리고, 글작성자, 글추천자, 그리고 글소비자 사이의 관계에 대해서 잠시 언급하면... 먼저, 글추천자는 글작성자와 (개인적 친분이 있을 수도 있겠지만) 중립의 위치에서 냉정하게 글을 평가해줘야 합니다. 그래서, 제가 neutrality라고 표시해두었습니다. 역으로, 글작성자는 글추천자에게 어떠한 피드백도 줄 수가 없기에 화살표시가 없습니다. 또, 글작성자가 특정인의 추천자로부터 글을 추천받았다 손치더라도, 나중에 보상심리로 그 추천자의 글을 추천해주는 그런 일 (상호추천 Mutual recommendation)이 발생하면 안되기 때문에, 추천자에서 작성자로의 일방향 화살표를 해두었습니다. 두번째, 글소비자는 글추천자의 추천을 전적으로 신뢰하는 관계가 되어야 합니다. 트위터나 다른 많은 미디어에서도 그렇듯이, 특정 유명인이 글을 추천해주면 크게 의심없이 글을 읽는 것과 같은 현상을 말하는 것입니다. 추천자의 신뢰도 및 권위 Authority를 믿기 때문에, 추천된 글을 읽을 수가 있습니다. (역으로 화살표가 없는 것은 어쩌면 당연한 것이니 설명 생략) 마지막으로, 글작성자와 글소비자의 관계는 조금 더 복잡합니다. 이들 사이에는 원래부터 알고 지내던 지인/친구 관계일 수도 있지만, 글소비자가 일방적을 글작성자를 추종하는 관계일 수도 있습니다. 그래서, 글소비자로 향하는 화살표는 흰색으로 표시해두었습니다. 일반 블로그들에서도 보듯이 '친구블로그'와 '구독블로그'로 나뉩니다. 소셜검색에서, 친구가 적은 글을 보겠다는 니즈와 전문가/유명인의 글을 보겠다는 니즈가 동시에 있습니다. 이런 현상을 검은화살표와 흰화살표로 표시한 것입니다. 결국 이들 간의 관계는 친밀도 Intimacy로 표시됩니다. 친구사이의 근접도 closeness와 유명인/전문가에 대한 권위를 포괄해서 친밀도 또는 연결도 connectedness로 표시했습니다.

 이상의 이런 글작성자, 글추천자, 글소비자의 역할 및 관계를 잘 이해한다면 재미있는 소셜검색이 탄생할 거라 생각합니다. 지금은 조금씩 다음뷰의 데이터로 가능성만을 확인하고 있는데, 혼자서 시험삼아 진행하는 거라 속도도 많이 느리고 의미있는 (양과 질 모두) 성과를 만들어낼 수 있을까?라는 생각도 가지면서 준비/진행중에 있습니다. 다음에 다시 같은 제목의 글을 적게 된다면, 실제 위의 요소를 소셜검색/소셜랭킹에 어떻게 녹여낼 것인가?에 대한 글을 작성해보도록 하겠습니다.

댓글을 달아 주세요

  1. Favicon of http://mytears.org BlogIcon 정태영 2010.03.28 14:54 신고 Address Modify/Delete Reply

    blogrank ranking weblogs based on connectivity and similarity features

    이 논문을 한 번 읽어보시면 도움이 되지 않을까 싶습니다. :) 구상하셨던 내용과 유사한 내용이 정리되어 있는 논문입니다.

  2. 성준 2010.04.12 16:32 신고 Address Modify/Delete Reply

    근데 제가 글 소비자의 입장이라면 전 프로파일을 남기는 것에 대해 큰 거부감은 아직(?) 없습니다. 그런데 이게 법적인 문제를 야기한다니... 좋은 검색이 가능하다면 프로파일 남기는 것을 동의하고 사용하면 안될런지...

    그리고 요즘 트위터를 쓰면서 개인적으로 느끼는 문제지만 identity가 두개 이상 있었으면 좋겠다는 생각을 가져 봅니다. 물론 아이디를 두개를 가지면 되는 것이긴 한데.... 소셜검색이라면 이경우도 소비자로써 복수의 아이덴티티를 제공하면 좋겠다 싶은 생각이... (써놓고 보니 설계상 무시해도 될 듯..)

    여튼 한장의 그림(도표)에 집적된 고민을 보는 것은 때론 즐거움을 주네요.,

Share           Pin It
 올해도 여전히 '소셜'이 화두다. 저같이 IT업계에 몸을 담은 테키들뿐만 아니라, 일반인들에게도 소셜은 특별하다. 인터넷 자이언트 구글조차도 제대로 엮어내지 못하는 (현재까지 대부분 실패한) 분야가 소셜인데, 하찮아보이던 자그마한 벤쳐기업들인 페이스북이나 트위터는 나름 성공했던 분야가 소셜이다. 그런데 소셜이란 어느날 갑자기 하늘에서 떨어진 것이 아니다. 사람을 뜻하는 한자어 '인간 人間'도 뜻을 풀어보면 '사람 사이' 즉 소셜이다. 수렵 또는 목축생활에서 벗어나 경작을 하면서부터 인간은 모여서 마을을 만들었다. 물론, 그전의 수렵 및 목축 생활에서도 서로를 보호하기 위해서 가족 단위로 군집을 이루었다. 아니, 사람의 탄생 자체가 소셜이 아닌가? 남여 두 사람이 만나야, 새로운 생명체가 탄생한다. 혼자가 불완전해서 두명이 모이고 또 새끼를 치고 그렇게 가계를 형성하고, 그러면서 이웃 가계와 경쟁도하고 협력도하면서 마을을 형성하고, 또 뭉치고 흩어지고는 반복하면서 인류의 역사에서 소셜/사회는 뗄레야뗄 수가 없는 개념이었다. (종교 얘기는 아니지만) 성경에서도 태초의 하나님이, 유일신이지만, '우리'라고 불렀다. 더 깊은 개념으로 삼위일체라는 용어를 사용하지만,... 그리고 남자 (아담)가 외로워보여서 여자 (하와/이브)를 만들었다고 한다. 그리고 그네들이 아이를 낳았다고 한다. 사람에서 시작하지 않고, 신에서 시작해서 소셜은 부정할 수 없는 개념이다. 그런데, 이런 자연스러운 개념이 기술을 만나면서 새롭게 부각되고 있다. 2000년대 초의 원시적인 싸이월드나 마이스페이스, 어쩌면 90년대 후반의 한메일과 카페, 들이 등장하더니, 10년이 지난 지금에는 페이스북이 자이언트 구글을 제치고 가장 많은 PV를 만들어내는 인터넷 대표 서비스가 되었다. 여기까지 소셜에 대한 얘기다. 그렇다. 태초에는 아니었지만, 인터넷에는 구글이 있다. 구글이 무엇이냐? 구글링 googling이 검색하다라는 의미로 쓰인다. 구글은 검색이다. 구글은 인터넷의 지배자다. 그 지배자가 하룻강아지인 페이스북과 트위터를 만났다. 기술적으로, 검색이 소셜을 만났다. 그래서 태어나는 것이 '소셜검색'이다. 서론이 길었지만, 오늘은 이 소셜검색에 대해서 얘기해보고 싶다. 

 소셜을 정의하는 방법도 여러가지고, 검색을 정의하는 방법도 여러가지다. 그렇기에 소셜검색을 정의하는 방법은 더 다양하다. 모든 이들의 생각을 나열할 수도 없고, 하나로 묶을 수도 없으니 생각나는 대표적인 정의 또는 관점만 살펴보자. 그리고, 위키피디아에서 social search를 찾아보면 현재 나름 소셜검색을 지원해주는 수많은 기업들의 이름을 볼 수가 있다.
  • 소셜네트워크검색: 가장 쉬운 개념이다. 소위 말하는 마이스페이스, 페이스북, 또는 트위터 등의 소셜네트워크 서비스 내에 존재하는 다양한 정보나 사람을 검색하는 것을 소셜검색이라고 부르는 이들이 있다. 가장 직관적인 관점이다. 이걸 굳이 더 자세하게 설명해서 뭣하리요...
  • 소셜그래프(서클)검색: 이건 좀 더 확장되었으면서, 가장 소셜검색에 가까운 개념이다. 소셜그래프 또는 소셜서클은 나와 연결된 사람들 (또는 그들의 글)을 뜻한다. 그렇다. 나와 연결된 이들이나 그들의 생각/글을 검색하는 것이 소셜검색이다. 그래서, 나와 얼마나 가까우냐가 중요한 요소로 작용한다. 단순히 트위터의 팔로잉 관계로만 있다고 소셜그래프에 넣을 것인가? 아니면 같은 학교를 졸업했는 사람을 소셜그래프에 넣을 것인가? 등과 같은 짜증나게 많은 요인들을 또 고민해야 한다. 어쨌던 간단히 많은 연결이 있으면 가깝다 (intimacy 친밀도)고 말할 수가 있다. 트위터의 팔로잉 관계면서 페이스북의 친구라면 엄청 가까운 걸로 착각할 수도 있다. 여기에 같은 지역이나 나이 또는 학교 등을 포함시키면... 에휴, 더 나아가 이메일 송수신기록이나 채팅기록 등까지 포함시키면 더욱 조밀한 소셜그래프를 만들 수가 있다. ... 그러고 보니, 소셜서클은 사람보다는 그들의 글에 더 맞는 개념인 것같다. (이건 그냥 개인 추측이다.) 지루한 설명을 했지만 소셜그래프/서클검색은 소셜네트워크검색보다 조금 더 복잡하다. SN검색이 하나의 네트워크만 고려하면 되지만, 이것은 여러 개의 네트워크들의 중첩효과까지도 고려해야 한다. ...
  • 소셜필터링 또는 소셜추천: 간혹 소셜검색을 이렇게 사용하는 이들도 있다. 기본적으로 협업필터링 collaborative filtering (CF)와 비슷한 개념이다. 단지 CF는 사람사이의 관계에 대한 고려는 없이 전체 군집에서 비슷한 성향의 사람군이나 제품군을 묶어서 추천해주는 것이지만, SF에서는 CF의 기본 필터링/추천방법론에 소셜이라는 사람사이의 관계를 넣었다는 것이 특징적이다. 즉, 분야의 전문가나 많은 군중이 추천해주는 것보다는 내 친구가 추천해주는 것을 더 믿는다라는 기본 가정에서 시작한다. 그래서, 종종 이렇게 말한다. 오늘날 (소셜넷트워킹에서) 신뢰 Trust는 권위 Authority보다는 친밀도 Intimacy에 있다. 사실, 요즘 책의 서평을 보면 소위 전문가들의 추천사는 못 믿겠다. 입에 발린 추천이 늘려있다. 그렇기에 내 친구가 추천해주는 책을 읽게 된다. (소셜필털링인 아닌) 친구의 추천은 또 다른 장점이 있다. 그 친구는 나의 context 정보를 알고 있다는 거다. 나의 학력수준이나 평소에 관심사를 알고 있기에 친구는 내게 더 적합한 책이나 서비스, 제품을 추천해줄 것이다. (신뢰의 바탕 위에) 역으로, 친구의 추천을 받았을 때도, 내가 친구의 컨텍스트를 이미 알고 있기에 그 친구가 왜 이런 제품을 추천해줬는지를 짐작할 수 있다. 소셜필터링/추천이 더욱 고도화되고 앞서 말한 소셜그래프가 더욱 명확히 되면, 이런 컨텍스트 정보도 지식의 형태로 사용이 가능해질 것이다. 그러면, 사람과 사람의 관계에서 추천을 해주듯이 소셜필터링/추천으로 소개받은 제품이나 글들이 더욱 신뢰를 가질 수 있고, 더욱 보고 싶어질 것이다. ... 여담으로, 트위터에서 나의 평소 트윗기록을 본 사람들은 내가 올린 단축URL들이 보통 영어로된 IT관련 소식이라는 걸 짐작하고 그냥 무시하거나 한번쯤 클릭해서 보거나 등의 행동을 일으킬 것이다. 이게 소셜추천이면서 컨텍스트추천의 일례다. 너무 러프하고 비직관적인 예를 들어서 미안합니다.
  • (Updated) 크라우드서치: 소셜검색의 중요한 측면 중에 하나가 크라우드검색 (Crowd search) 또는 Search by Social/Crowd를 들 수 있습니다. 앞에 제시된 소셜검색들은 소셜그래프 상에 있는 데이터/정보를 검색하는 것이지만, 크라우드서치는 소셜그래프에 의한 검색입니다. 즉, 트위터나 페이스북에 궁금한 점을 질문하면, 자신의 소셜 그래프 내에 속한 사람들이 답변을 달아주는 것입니다. 네이버 지식인지 모든 이에게 질문을 하고 답변을 받는 것에 반해서, 크라우드서치는 자신과 친분 및 관계가 있는 이들에게만 질문을 하고 답변을 받는, 형태측면에서는 조금 클로즈드 closed 질의입니다.
  • 그리고,... 또 당신이 생각하는 그 모든 소셜검색도 소셜검색이다.
  • 아, 그리고 중요한 것... 사람추천... Aardvark와 같이 정보를 보여주는 것이 아니라, 전문가나 친구를 보여주는 경우도 존재한다. Aardvark에 큰 기대를 걸었는데, 스스로 구글의 품에 들어간 것이 아직까지도 아쉽다. 구글의 품에서 더 큰 성공을 거둘 것을 기대하지만, 구글 검색 패러다임을 바꾸어줄 Aardvark 검색 패러다임을 기대했는데... 애도

 진짜 본론에 들어가기 전에 서론과 본론의 서론이 너무 길어졌다. 벌써 힘이 빠져서 제대로된 본론을 적지 못하고 그냥 간략히 결론으로 가자.

 대략적으로 제가 구상중인 소셜검색은... 친구관계와 전문성이 동시에 만족시켜주는 걸 생각하고 있습니다. 똑부러지게 보여드릴 단계가 아니라서 구체적으로 말씀드리진 못하지만,... 그냥 검색의 랭킹의 관점에서 다음의 요소들이 고려되어야 합니다.
  • (당연히) 검색어와의 관련성 (전통적인 검색엔진)
  • 글작성자의 전문성 (이 부분이 제가 특히 주목하는 부분인데, 자세한 것은 생략, Aardvark가 일부 구현)
  • 글작성자와의 친밀도 (전통적인 소셜검색엔진)
  • 최신성 (전통 검색엔진에서도 중시를 하는 부분이지만, 소셜검색에서는 더욱 중요합니다.)
죄송합니다. 진짜 본론은 다음에 기회를 만들어서 작성하겠습니다.

댓글을 달아 주세요

  1. Favicon of http://dreamreader.tistory.com BlogIcon dreamreader 2010.03.07 03:39 신고 Address Modify/Delete Reply

    리플 남겨주셔서 방문해 봤습니다. ^^
    쓰신 블로그 글에서 열정이 느껴져서 대단하다 생각되네요. ^^
    아직 트위터 등 소셜 쪽은 하지 않고 있지만
    소셜 쪽에는 아무래도 사생활적인 메시지가 많을 것 같아서
    개인적으로는 소셜 검색은 그리 찬성하지는 않는 쪽입니다. ㅎ