Share           Pin It
 나름 검색일을 하면서 검색에서 가장 중요한 것은 사용자들이 찾고자 하는 키워드와 그런 사용자의 니즈와 의도에 맞는 정보/컨텐츠/문서다. 그런데, 이 블로그에서는 그런 컨텐츠의 중요성보다는 그런 정보를 둘러싸고 있는 컨텍스트/문맥의 중요성을 더 자주 언급하고 있다. 컨텐츠는 너무 명확하기 때문에 굳이 재차 강조할 필요가 없는 것도 하나의 이유지만, 그것보다는 요즘은 진짜 컨텐츠보다는 컨텍스트가 더 중요하다고 느끼기 때문이기도 하다. 앞으로도 여전히 컨텍스트가 컨텐츠의 부가정보 역할만을 할지도 모르겠지만, 컨텍스트에 대한 더 심도깊은 연구가 없다면 범람하는 수많은 컨텐츠들은 소위 모래 위에 세운 성이 될 것이다. 컨텍스트를 얘개하면서 늘 삼간 (三間), 즉 시간, 공간, 인간이 마치 모든 컨텍스트의 전부인 것처럼 얘기했다. 실제 요즘의 많은 서비스들이 이들 삼간의 범위에서 벗어나는 경우를 못 본 것도 있고, 더 이상의 컨텍스트를 찾기도 어려웠다. 그런데, 이런 3가지 간(間)자 컨텍스트보다 더 중요한 컨텍스트 정보가 있다는 것을 너무 늦게 깨달았다. 제목에서는 제 4의 컨텍스트라고 적었지만, 실제는 제 0의 컨텍스트가 더 적합한 표현인 것같다. 그래도, 편의상 시간 공간 인간을 제 1, 2, 3 컨텍스트라고 칭했기에 네번째 발견된 컨텍스트란 의미에서 제 4의 컨텍스트라고 표현했다.

 컨텍스트 정보가 컨텐츠만큼의 중요도를 가지기 시작한 것은 궁극적으로 개인화 Personalization 때문이다. 내가 지금 숨쉬고 있는 이 시간, 내가 누리고 있는 이 공간, 그리고 나와 관계를 맺고 있는 인간 (순화시켜서 '친구/지인'이라고 해야하겠지만, 그냥 편의상 인간이라 하자.)이라는 주변정보가 나를 설명해주고 있다. 나..라는 존재는 언제 어디서 누구와에 의해서 정의되는 것같다. 그런데, 그런 주변 정보에 집중을 하다보니 '나'라는 그 본질에 대한 인식을 놓쳐버린 것같다. 지금 이 시간이 나를 투영하지 못하고, 내가 살고 있는 곳이 내 정체성을 보여주지 못하고, 나와 관계를 맺는 그들이 나를 설명해주지 못한다. 단지 조금 도와줄뿐이다. 결국 나를 정의하기 위해서는 바로 '나'를 제대로 살펴봐야 한다. 그런데, '나'를 관찰한다는 것이 어떨 의미일까? '나'를 어떻게 컨텍스트 정보로 활용할 것인가? 참 어려울 수도 있지만, 여러 쉬운 방법들도 분명 있다. 바로 '역사'가 나의 나됨을 설명해준다.

 History... 아니, Mystory라고 부르는 것이 더 적합하겠다. 내가 이제껏 어떤 일을 했는지, 즉 나의 관심사가 뭔지를 명시화할 수 있다면 바로 '나'라는 컨텍스트 정보를 얻을 수 있다. 그런데, 인터넷 시대에 나에 대한 많은 히스토리를 모을 수 있다. 바로, 내가 인터넷 검색창에 입력한 수많은 키워드들이 내가 어떤 정보에 관심을 가졌고, 반응을 했는지 알려준다. 그리고, 검색한 결과에서 내가 클릭해서 읽은 많은 문서들이 내가 어떤 정보에 관심이 있는지 말해준다. 그리고, 내가 트위터나 블로그 등에서 적었던 많은 글들이 내가 어떤 것에 관심이 있는지 말해준다. 내가 지금 적고 있는 이 글을 통해서도 나는 컨텐츠나 컨텍스트 등과 같은 것에 관심이 있다는 것을 말해주고 있다. 우리가 행한 인터넷/온라인에서의 모든 행위들이 나를 투영해주고 있다. 물론, 여기에 기존의 시간, 공간, 인간의 정보가 더 결합되면 더더욱 나에 대해서 완전한 아바타를 만들어줄지도 모르겠다. (참고. 이젠 컨텍스트 Context에 집중하자. 컨텐츠 Content는 항상 컨텍스트 안에서 정의된다.)

 벌써 사용화되어서 사용되고 있는지는 모르겠지만, 몇몇 검색과 관련된 논문에서 나의 과거 검색 히스토리를 이용해서 검색의 개인화를 이루려던 시도가 있었다. 평소에 내가 자주 찾거나 반응했던 정보의 카테고리에 맞는 검색결과를 먼저 노출시켜주는 것이다. 예를들면, 'java'라는 키워드에 대해서 컴퓨터 프로그래밍 언어를 떠오를 수도 있고, 자바커피가 생각날 수도 있고, 아니면 인도네시아 자바섬이 연상될 수도 있다. 그런데, 내가 다음이라는 인터넷 회사에 다니고 있고 평소에 프로그래밍에 대한 키워드를 자주 사용했다는 것을 알고 있다면, (똑똑한) 검색엔진이라면 내가 'java'라는 키워드를 입력했을 때 나에게 먼저 프로그래밍과 관련된 결과들을 보여줄 것이다. 이것이 일종의 검색히스토리를 이용한 검색개인화의 한가지 방법이다. 물론, 맹점은 내가 갑자기 커피에 관심이 생겼다거나 인도네시아로 여행을 가고 싶어서 java를 입력했는데도, 여전히 프로그래밍관련 정보/문서들만 보여줄 수도 있다는 심각한 결점을 가지고 있다. 그렇기 때문에 단순히 검색히스토리뿐만 아니라, 시공인의 다른 컨텍스트 정보와 통합을 이룰 필요가 있다. 예를들어, 평일 업무시간이 아닌 점심/저녁시간에 java를 검색을 한다거나 주말 또는 바캉스 시즌을 앞둔 시점에 java를 검색하는 경우, 또는 인도네시아 현지에서 java를 검색하는 경우 등에 대해서는 프로그래밍보다는 커피나 자바섬에 대한 정보에 우선순위를 두는 등의 더 진화된 개인화검색엔진도 상상해볼 수가 있다.

 또 다른 것으로 사람들이 트위터나 블로그에 올린 많은 글들에서 핵심되는 키워드들을 추려낼 수가 있다. 텍스트마이닝에서 보통 사용하는 TF/IDF (Term Frequency / Inverse Document Frequency)라는 Vector Space Model을 활용하면 쉽게 개인마다 관심이 있는 또는 전문성이 있는 키워드를 발라낼 수가 있다. 이렇게 저자/개인마다 관심키워드를 추출해서 매핑시켜준다면, 향후에 특정 주제/키워드에 관심/전문성이 있는 이들을 쉽게 찾아줄 수가 있다. 또는 특정 키워드에 대해서 무수한 문서들을 마구잡이로 보여줄 것이 아니라, 입력된 키워드에 전문성을 가진 저자가 작성한 글들을 먼저 보여주는 방법을 취할 수도 있다. (참고. 소셜검색 (1)소셜검색 (2)소셜검색 (3)) 지금 다음검색의 소셜웹검색에서 개인ID로 검색을 한 경우 보여주는 관심키워드가 이와 유사한 방식으로 보여주고 있다. (자세한 알고리즘을 모두 말할 수는 없지만, 실제는 제가 말하려는 전문성이나 관심에 대한 명확한 예제는 아니다. 왜냐하면, 전문성/관심보다는 실시간성에 대해서 너무 큰 가중치가 들어간 키워드들이기 때문에, 실제 개인의 관심/전문성을 말하기에는 문제가 있다.) 그런데, 이런 실시간 관심키워드를 더 오랜 시간을 두고 수집을 하거나 아니면 그/그녀가 작성한 다른 모든 문서들을 수집/분석을 한다면 분명 그/그녀의 관심/전문성이 반영된 키워드세트를 쉽게 모을 수가 있다. 실제, 실서비스화는 못 시켰지만, 나름 토이문제로 나 자신에 대해서 내가 작성한 모든 블로그글/트윗을 분석해서 키워드를 뽑은 결과, 트위터, 애플, 제주도, 아이패드, 다음검색 등과 같이 제가 평소에 자주 사용하고 관심을 가졌던 분야에 대한 키워드세트를 만들 수가 있었다.

 좀 더 무섭게 들어간다면... 내가 이제껏 쇼핑몰에서 구경했던 모든 상품 및 구매했던 상품들에 대한 히스토리를 통해서 나의 관심사를 파악해서 내가 관심을 가질 법한 상품에 대한 광고를 계속 보여줄 수도 있다. 많은 회사들이 이걸 하고 싶어 한다. 그러나, 개인정보/프라이버시라는 법적인 허용범위를 벗어난 서비스에 대한 부담 때문에 제대로 하지 못하는 경우가 대부분이다. 그리고, 최근에 이슈가 된 스마트폰들이 개인정보 - 나이, 성별, 위치, 개인식별ID 등을 사용자동의없이 수집하는 것에 대한 문제제기도 되고 있다. (참고, WSJ 기사) 세상의 많은 회사들이 나보다 나를 더 잘 알고 싶어서 난리다. 개인적으로 개인정보/프라이버시는 개인에 관한 정보보다는 그런 정보에 대한 관리권 Control의 주체로 프라이버시 문제가 새롭게 정의되어야 한다고 생각하고 있지만, '나'에 대한 정보는 중요하면서도 매우 위험하다. 글의 논점이 '프라이버시'로 조금 옮겨갔지만, 어쨌던 그만큼 '나'라는 컨텍스트 정보가 중요하다는 반증이다. 

 다음에서 소셜검색 (지금의 실시간검색, 소셜웹검색, 그리고 마이소셜검색이 아닌)을 한다고 했을 때, 처음에는 이런 '나'에 대한 정보 (즉, 관심/전문 키워드)를 활용하고, 나의 관게정보를 활용한 서비스를 내놓기를 기대했지만, 아직은 여러 여건상 단편적인 소셜검색서비스들만 내놓은 것같다. 다음단계는 분명한 것같지만, 여전히 갈길이 먼 것같다. (참고로 저는 소셜웹검색에서 '관심유저' 데이터만 뽑아줬을 뿐, 다음의 소셜검색 전략에 대해서 일체 들은 바가 없다.) 이건 내부적으로 논의되었는지 아닌지 나는 잘 모르겠다. 내부적으로 논의되었더라도 내게는 알려주지 않은 것이니 본 포스팅의 모든 것은 내 머리속에서 자유연상으로 나온 결과다. 내부기밀에 대한 발설이 아니니 지레짐작으로 앞서나가지는 말기 바란다. 현재까지도 나름 그런 규칙을 정해서 지킬려고 노력했지만, 앞으로도 본 블로그에 올라오는 모든 포스팅들은 내가 다니는 회사 '다음'의 입장과는 전혀무관한 것임을 밝힌다. 그냥 다음이라는 회사에서 검색/데이터마이닝을 하는 어떤 사람의 생각일 뿐이다. 

댓글을 달아 주세요

Share           Pin It
 검색의 미래라는 세번째 포스팅입니다. 이번 포스팅은 제 글을 여러 차례 보신 분들이라면 전혀 새로울 것이 없는 글입니다. 이전에 올렸던 Context (문맥삼간 - 시간, 공간, 인간) 포스팅이나 Googling is Over (Off-Demand 검색으로 진화 예상), 아니면 소셜검색 등의 포스팅을 재탕/결합한 것이 이번 포스팅입니다. 그래서, 더 깊은 통찰을 보여드릴 수도 없고, 더 새롭고 자세한 설명도 불가능합니다. 이전에 적었던 포스팅들은 아래와 같습니다. 생각보다 헛소리를 많이 했었네요. 자세한 사항은 이전에 적었던 글들을 참고하시기 바랍니다.

 아래는 Flic.kr에서 mike.elliot이라는 분이 올려놓은 사진입니다. (Flic.kr URL) 이 그림 한장이 현재의 검색과 미래의 검색 (소셜검색)의 차이를 잘 보여주고 있습니다. 현재의 검색패러다임은 사용자가 적당한 키워드를 입력하면 해당 키워드를 가지고 있는 문서들을 보여주는 것입니다. 그림에서 보여주듯이 User Finds Information인 것입니다. 이전 포스팅에서 이런 검색을 On-Demand 검색이라고 명명했습니다. 즉, 사용자의 요구 On-Demand에 반응해서 결과를 제공한다는 뜻입니다. 그런데, 미래의 검색에서는 세상의 모든 정보들이 그 정보를 가장 원하고 잘 수용할 수 있는 사용자들을 자동으로 찾아서 알려주는 형태로 바뀔 거라고 예상을 합니다. 아래의 그림에서는 Information Finds User라고 표현이 되었고, 이전의 포스팅에서는 Off-Demend 검색이라고 명명했습니다. 즉, 사용자의 요구가 없더라고 그 사용자에게 필요한 정보와 환경이 자동을 갖춰진다는 개념입니다. 

by mike.elliot @ Flic.kr http://www.flickr.com/photos/mike-elliott/4647689080/


 위의 그림에서는 Social Search만을 다루고 있지만, 실제 미래의 검색은 단순히 소셜검색이라고 보기 보다는 문맥검색 (Context-Aware Search)라고 보시는 것이 더 맞을 것입니다. 물론, 소셜/인맥도 하나의 문맥이지만, 현재 널리 이용되고 있는 시간과 공간문맥까지도 포함되어야 합니다. 참고로, 엄밀히 말해서 개인화 검색과 문맥검색이 다른 용어이고 다른 기술이겠지만, 이 글에서는 큰 틀에서 같은 것으로 간주하겠습니다. 어떻게 보면 개인화 검색은 더 Pull형태의 검색 (사용자가 지정한 Preference에 반응하는 검색)이고, 문맥검색은 그런 Push/Pull의 개념보다는 Automation이나 Pervasive/Ambient/Ubiqutous의 개념에 가깝습니다. 어떻게 보면, 현재의 시간과 공간 문맥의 경우 Pervasive한 문맥정보이고, 인간/소셜 문맥은 사용자가 지정한 Preference 정보입니다. 결론적으로 미래의 검색은 사용자가 지정한 선호도에 반응하는 검색이고, 또 사용자가 미처 지정하지 않더라도 현재의 사용자 상태 및 이제까지의 사용자의 경험 (예를들어, 사용자가 자주 입력하는 검색키워드의 묶음, 작성된 글에서 사용하는 단어나 주제, 주로 읽는 뉴스/기사의 출처 및 카테고리 등)을 시스템이 알아내서 사용자의 검색행동에 함께 반응하는 그런 형태가 될 것입니다. ... 딴소리지만, 이렇게 될려면 엄청난 컴퓨팅 파워가 필요하겠죠.

 더 자세한 논의는 앞서 나열한 이전 포스팅들을 참조하세요.

댓글을 달아 주세요

Share           Pin It
 루팡이 범죄를 저지르기 전에 예고 편지를 보내듯, 블로깅 전에 이런 예고장을 쓰는 건 제 스타일이 아니지만, 지난 한달동안 거의 블로깅을 못했던 것을 반성하고 앞으로 더 왕성한 활동을 하겠다는 일종의 다짐과 약속이라는 취지에서 이렇게 블로깅 예고를 합니다. 여러번 검색에 관한 포스팅들을 올렸지만, 최근 울산대/포항공대의 세미나 강연을 준비하면서 떠올랐던 생각들을 글로써 정리하는 것도 필요할 것같다는 생각을 했습니다. 단순히 검색의 과거/히스토리는 굳이 제가 적을 필요가 없을 것같습니다. 그래서, 제가 나름 생각하는 검색의 미래 (어쩌면 '현재'가 더 적합한 표현)에 대한 포스팅을 올릴려고 합니다.

 최소 4편의 포스팅을 예정하고 있습니다.
  1. 왜 모바일인가? 단순히 스마트폰의 보급으로, 컴퓨팅/인터넷 환경이 PC에서 스마트폰/모바일로 변했다는 것을 말하려는 것은 아닙니다. 물론, 그런 환경의 변화가 후속 포스팅들을 가능케하지만, 모바일기기들이 가지는 중요한 특징, 즉 PC가 가지지 못했던 특징 (역으로 모바일기기의 한계)과 인간이 태생적으로는 가질 수 없는 감각,들을 소개하려고 합니다. '왜 모바일인가?'는 검색과는 무관할 수 있지만, 후속 포스팅에서 보여줄 '검색의 현재/미래'의 모습에는 중요한 역할을 하기 때문에 별도의 포스팅을 잡았습니다.
  2. 현재까지의 검색. 검색 및 검색엔진 (그리고 여러 검색회사들)에 대한 많은 지식을 가지고 있겠지만, 현재까지 발전되어온 검색엔진의 모습과 그들이 주요 관심사를 집어보는 것도 중요할 것같아서 간단한 포스팅을 예정중입니다. 물론, 예전에 'Googling is Over'라는 포스팅에서도 밝혔던 내용일 수 있습니다. 제가 감히 'G. is Over'라고 말할 수 있었던 근거일 수도 있습니다. 검색의 끝을 선언하는 것이 아니라, 현재까지의 검색 엔진의 발전방향의 전환을 말하는 것입니다.
  3. 개인화 검색. 뭐 이건 너무 당연한 소리입니다. 그리고, G.Over 포스팅에서도 밝혔던 내용입니다.
  4. 비접촉 검색. 모바일기기의 한계 그리고 모바일기기의 가능성이라는 역설적인 환경/변화때문에 가능한 미래입니다. 자세한 내용은 후속 포스팅에서...
일단 위와 같이 4개의 포스팅을 준비중입니다. 실제, 준비랄 것도 없이, 그냥 글을 적으면 되는데, 글을 적을 시간과 의지가 생기는 순간 하나씩 실타래를 풀어갈 예정입니다. 글을 적으면서 파생되는 다양한 얘기들도 5, 6, 7... 등의 포스팅에서 더 다루도록 하겠습니다.

댓글을 달아 주세요