본문 바로가기

Gos&Op

검색의 미래 The Future of Search... (1)

 미래는 항상 지적 호기심을 자극하는 주제이고, 검색일을 하다보니 검색의 미래는 어떤 모습일까를 종종 상상하게 됩니다. 지난 주 초에 우연히 '검색의 미래'에 대한 글을 적고 싶어졌습니다. 아직 어떤 구성으로, 어떤 내용을 채워넣을지에 대한 정해진 것이 없지만 지금의 의욕이 사라지기 전에 짧게라도 글을 적는 것이 좋을 것같습니다. 검색이라는 무거운 주제를, 그리고 미래라는 모호한 주제를 한편의 글로 완성시킬 능력이 없기에 일단 (1)이라는 태그를 붙였습니다. 어젠가 다른 이슈를 만나면 시리즈를 이어갈 수도 있을 것이지만, 또 그렇지 않다면 (1)로써 미완의 글이 될 수도 있습니다. 늘 그렇듯이 지금 당장 생각나는 생각을, 또 글을 적으면서 생각나는대로 글을 적어나가렵니다. 그리고, 검색을 해보면 다 나올만한 검색의 역사 등 상투적인 내용은 가급적 이 글에서 배제하겠습니다.

 처음 '검색의 미래'에 대한 글을 적고 싶은 충동을 느낌 것은 트위터 때문입니다. 트위터의 타임라인을 보다보면 간단하게 검색을 하면 자세하게 다 나올 법한 것들을 묻는 경우를 종종 봅니다. 간단하게는 '1500파운드는 얼마에요?' 등부터 '트위터와 페이스북을 비교한 논문 알려주세요.' 등과 같이 조금더 학술적인 것까지 질문이 종류가 참 다양합니다. 지금 1파운드의 환율이 얼마인지 검색을 해보면 1710원이라는 걸 바로 알 수가 있고, 여기에 1500을 곱하면 약 257만원이라는 걸 바로 알 수가 있다. 그리고, 트위터와 페이스북을 비교한 논문을 찾으려면 'comparison of twitter and facebook filetype:pdf' 등의 검색어로 구글링해보면 많은 검색결과가 나온다. 물론 이렇게 찾는 결과가 처음에 의도했던 바로 그 글이 나온다는 보장이 없다. 그래서 화면에 보이는 많은 결과들 중에서 지금 내게 필요한 정보를 2차 필터링을 해야하는 수고가 뒤 따르게 된다. 이런 트위터에서 별 생각이 없이 툭툭 던지는 질문들을 보면서 검색의 미래가 더이상 찾는 것이 아니라 묻는 것이구나라는 걸 깨닫게 된다. 검색이라는 것은 사람의 생각이 기계화된 언어로 전달될 때만 가능하다. 많은 검색엔진의 검색창에 사람이 알고 싶은 자연어를 입력하는 것이 아니라, 몇몇 핵심되는 검색어를 입력해야 한다. 어떤 검색어를 선택하느냐에 따라서 내가 의도했던 결과를 얻을 수 있는지가 결정이 난다. 이렇게 생각/질문을 1차 검색어로 변환하는 과정에서 정보의 손실이 발생한다. 그런 1차 검색어로 색인된 문서를 걸러와서 랭킹/정열하는 과정에서 2차 변환이 생긴다. 그리고, 마지막으로 화면에 노출된 결과들을 모니터링하면서 내게 필요한 것만 선별하면서 또 3차 변환이 생기게 된다. 이런 여러 차례의 변환/오류의 과정은 검색이 가져야할 정확성을 해치게 된다. 결국 현재의 검색은 시스템/아키텍쳐 그 자체로써의 내재된 오류 덩어리다라고 말해도 무관하지가 않다.

 그런데, 트위터에서의 질문은 어떨까? 아니, 더 쉽게 말해서 다음지식이나 네이버지식iN에서 던지는 질문은 어떤가? 사람의 생각이 글로 표현되면서 변환이 발생하지만, 질문이라는 자연어 문장으로 표현되는 것이 몇몇 검색어로 바뀌는 것보다는 정보 손실이 적다. 그리고, 그런 질문을 이해하는 주제도 컴퓨터/기계가 아니라 사람이기 때문에 질문자의 의도를 바로 파악을 할 수가 있다. 때로는 질문자의 컨텍스트 정보 (나이, 지리정보, 성별, 시급성, 사용언어, 답변의 요구수준 등)까지도 공유하는 경우가 많기 때문에 질문자에게 더 적합한 결과를 제공해줄 수가 있다. 더 많은 정보를 얻을 수는 없더라도 더 정확한 정보를 얻을 수는 있다. 물론, 사람이 답변을 제공을 해준다면 더 적합한 답변이 있는데도 당장 알고 있는 제한된 정보만을 제고해줄 수도 있다. 어쨌던 그런 사람으로써의 한계를 극복한다면, 제시받은 답변이 처음 질문, 아니 질문의 의도/생각에 더 적합한 것일 가능성이 높다. 그렇기에 여러차례 변환, 필터링되면서 발생했던 여러 사소한 정보손실을 막을 가능성이 높다. 검색어와 문서와의 관계로 설명되는 검색이, 앞으로 질문과 답변의 형태로 바뀔 가능성이 더 높아 보인다. 트위터에서 올라오는 수많은 사소한 질문들이 짜증이 나는 경우도 많지만, 그런 사소한 질문들이 검색이라는 큰 프레임워크를 바꾸어버릴 것같다.

 지금 검색의 재왕은 분명 구글이다. 그런데 두달 전에 구글이 Aardvark라는 소셜검색을 단돈 $50M에 인수했다. Aardvark가 제출한 WWW2010의 논문에서도 말하듯이, 구글의 검색 패러다임이 체계화된 지식의 보고인 Library라면 Aardvark의 패러다임은 오랫동안 자연스럽게 형성된 Village였다. 우리가 살고 있는 동네가 바로 Aardvark가 실현하려던 것이다. 지금은 모두 개인화되어서 이웃을 모르고 살아가는 경우가 허다하지만, 조금만 과거로 눈길을 돌려보자. 한적한 시골 동네에 갑자기 아이가 배탈이 났다면 어머니는 앰블런스를 부를까? 분명 그렇지 않았을 것이다. 이제까지 배탈이 났을 때 먹으면 좋았던 여러 민간요법을 찾아보고 아이의 배를 어루만져주었을 것이다. 그런 사소한 지식도 없다면, 할머니나 아니면 동네 어르신들께 좋은 방법이 있는지 물어봤을 것이다. 그 동네 내에서 문제가 해결되지 않는다면 또 옆동네와 연결이 있는 어떤 분을 중심으로 옆동네에서 해결책을 찾아오는 그런 흐름으로 동네에서 발생한 문제를 해결해나갔다. 도서관 Library라는 것은 이렇게 동네에서 만들어진 민간요법이나 지혜가 사라지는 것을 막기 위해서 체계적으로 정리해서 보관하고, 또 필요할 때 열람해주는 기능을 제공하는 곳이다. 이런 Library를 바탕으로 만들어진 현재의 검색엔진들은 근원적으로 지식/지혜에 접근하는데 한계가 있다. 일단 지식이 말/글로 표현되지 못한다면 Library에 저장될 수도 없고 열람될 수도 없다. 그런 표현/저장의 과정이 위에서 검색어 검색과 비슷한 일종의 정보손실이 발생한다. 그리고 열람된 정보를 다시 해독해서 실생활에 적용하는 과정에서 또 다른 정보손실이 발생할 가능성이 높다. TV 광고에서 보여줬던 '요리를 글로 배웠어요'라는 문구가 이런 두번째 정보손실을 잘 설명해주고 있다. 사람의 지혜와 경험이 글이라는 지식의 체계로 제대로 표현될 수 없듯이, 기호화된 지식도 실생활로의 적용이 용이한 것은 아니다. 그런 측면에서 Aardvark가 제시하려던 과거, 아니 근원으로의 회귀는 지식의 미래를 보여주고 있다. 구글이 급하게 Aardvark를 인수했다는 그 점만으로도 현재 검색의 한계를 여실히 볼 수가 있다.

 분명, 트위터를 통한 실시간 문답이 검색의 미래인 것같은데... 실시간의 오류도 함께 생각해야 한다. 트위터에서 올린 질문에 대해서 돌아오는 답변이 진짜 내가 찾던 그 답변일까?를 검증하지 않을 수가 없다. 내 질문에 답변을 했던 그 답변자가 진짜 내 질문에 전문성을 가진 이인가?라는 의심을 가지게 된다. 어쩌면, 진짜 내 소셜그래프 Social Graph 상에는 내 질문에 제대로 답변을 해줄 그런 전문가가 포함되어 있을 수가 있다. (그런 측면에서, 많은 팔로워를 가지는 것은 분명 긍정적인 효과가 있다. 단지 그 사람이 영향력있는 인사인 것처럼 보이는 것보다는 어쩌면 내가 필요할 때 내게 도움을 줄 수 있는 전문가가 포함되었을 가능성이 높다는 측면에서 많은 팔로워를 두는 것은 좋다.) 그런데, 제가 처음에 '실시간의 오류'라고 말을 적었습니다. 질문자는 질문을 할 때, 매번 실시간입니다. 내가 바로 트위터에 접속해 있으니 질문을 할 수가 있는 것입니다. 그런데, 내 질문에 답변을 해줄 그 '전문가'가 실시간으로 접속해 있을까?라는 생각을 해보게 됩니다. 나는 실시간인데, 상대는 비실시간이라면 실시간 질의가 무슨 소용이 있을까?라는 생각을 하게 됩니다. 그런 측면에서 전통적인 검색을 통해서 더 빠른 '실시간?'답변을 얻을 수 있습니다. 묻는 것이 검색의 미래라지만, 실시간의 오류를 극복하지 못한다면 묻는 것이 찾는 것보다 더 못한 결과를 줄 수 밖에 없습니다.

 ... 이상에서 조금 적흥적으로 글을 적었습니다.

 이전 글들에서, 현재 검색트렌드로, 소셜검색, 실시간검색, 위치기반검색이라는 말을 자주 했습니다. 그리고, 이런 소셜 + 실시간 + 위치를 종합한 것이 모바일검색이라는 말도 종종 했습니다. 그런데, 처음 검색의 미래를 생각할 때, 분명 사람들은 소셜검색이 검색의 미래다라고 말하는 이도 있을 것이고, 실시간검색이 검색의 미래다. 위치기반검색이 검색의 미래다. 아니면, 모바일검색이 검색의 미래다라고 말하는 이들도 있을 것입니다. 맞지만 틀린 말입니다. 소셜, 실시간, 위치, 모바일은 단지 현재 보이는 검색/서비스의 트렌드이지 검색 그 자체의 미래는 아닙니다. 어떠한 결과가 요약/필터링되어서 내게 전달되느냐의 관점에서 단지 검색의 한 축일 뿐입니다. 문맥검색 Contextual Search는 단지 지금의 검색엔진이 구현해야할 하나의 기능일뿐, 이 기능을 검색의 미래인양 주장하는 것은 너무 편협한 생각인 것같습니다. 

 두번째로, 현재까지의 검색은 검색어를 검색창에 타이핑해 넣으면 적당한 결과들이 화면에 노출되는 것이었습니다. 그런 측면에서 최근 여러 회사들이 선보이고 있는 말로 검색하는 보이스검색이나 사진을 찍어서 비슷한 이미지를 찾거나 해당정보를 찾아내는 이미지검색 등도 주목을 받고 있습니다. 또 다른 면에서 사용자들이 검색어를 직접 타이핑하지 않고, 주어진 검색어세트에서 셀렉트 & 드래그해서 검색어조합을 만들어가는 것도 어쩌면 모바일에서 필요한 검색기능으로 보입니다. 보이스검색, 이미지검색, 터치검색 이런 것들도 검색의 미래라고 부르기에는 문제가 있어 보입니다. 단지 검색인터페이스의 한 종류이지, 이런 기능 또는 인터페이스를 잘 만들어낸다고 해서 미래의 검색시장을 장악할 수 있을 것같지가 않습니다. 앞의 문맥검색이나 비타이핑검색이 현재 검색엔진에서 많이 부족한 측면이고 보완해나가야할 기능들임에는 틀림이 없지만, 지금 검색을 준비하는 사업자들의 입장에서 이런 기능을 추가하는 것으로 검색의 미래를 준비하는 것인양 착각하면 큰 오산입니다.

 세번째로,더 근본적인 문제를 파고들어볼까 합니다. 계속 말했지만, 이제까지의 검색초점은 얼마나 많은 문서를 찾아서 색인하고, 색인된 문서들을 얼마나 빨리 그리고 효과적으로 보여줄 것인가가 관건이었습니다. 소위 말하는 크롤링 crawling, 색인 indexing, 랭킹 ranking이 검색의 전부였습니다. 그런데, 여기에 큰 문제점이 있습니다. 제가 종종 말하지만 '(Archived) Knowledge is Dead', 즉 이미 문서화된 지식은 벌써 죽은 지식입니다. 검색이 지금 당장 또는 앞으로 필요한 정보를 제공해줘야하는데, 이미 오래 전에 박제된 정보만을 찾아서 보여준다면 검색으로써의 효용이 없습니다. (지나친 논리적 과장이 맞습니다.) 실시간검색이나 질문에 의한 답변을 얻는 것이 중요해진 것도 이런 아카이빙된 정보가 아니라, 지금 살아서 생기넘치는 정보를 얻는다는 측면에서 중요한 이슈입니다. 검색의 미래를 생각할 때, 단순히 어떤 부가정보를 더 많이 활용할 것인가 (문맥검색), 어떤 형태로 검색이 이뤄질 것인가, 또는 어떤 정보를 찾을 것인가 등은 이미 다 이뤄진 검색패러다임/아키텍쳐 내에서 정의되는 것입니다. 기구축된 패러다임에서 미래를 찾는 것 자체가 어리석은 일입니다. 검색의 미래는 분명 새로운 패러다임이 만들어지면서 정해질 것입니다. 그런 측면에서 제가 Aardvark에 큰 기대를 걸었었고, 또 구글이 바로 인수되면서 큰 실망을 했습니다. 지금 당장은 Village Model이 Library Model보다 부족한 점들이 많지만 새로운 검색패러다임을 보여줄 거라고 기대했는데, 스스로 기존 검색패러다임에 흡수되어버렸습니다.

 결론을 내리면, 검색은 더이상 '찾는 것'이 아닙니다. Searching is no more Googling. 그냥 살아있는 정보가 내 앞에 '나타나는 것'입니다. 필요해서 찾는 것이 검색이 아니라, 필요할 때 보여지는 그것이 검색입니다. 그런 검색이 가능하기 위해서 문맥검색도 더욱 보강되어야 하고 다양한 검색인터페이스도 구축되야하고 또 지식/정보의 창구도 더욱 확충되어야 합니다.

 자잘한 것에 미래를 맡기기에는 미래는 너무 불명확하고 큽니다.

반응형