'구조화검색'에 해당되는 글 1건

  1. 2010.06.26 검색의 미래는 정말 없는가? Known Unknown Future of Search (2)
Share           Pin It
 지난 여러 포스팅에서 검색의 미래나나 소셜검색 등에 대한 저의 짧은 생각들을 적었습니다. 특히 검색의 미래에 대한 포스팅에서 '검색은 미래가 아니다'라는 도발적인 선언을 했습니다. 현재 익숙한 검색행위가 완전히 사라진다는 것을 뜻하는 것이 아니지만, 검색 Googling이라는 조금 부자연스러운 검색패턴에 진화가 있을 것은 확실해 보입니다. 그런 형태로 단순히 인터넷 포털들이 제공하는 문답형지식서비스에서부터 최근 소셜네트워킹을 이용한 지식서비스, 그리고 사용자의 (검색) 의도 intent 나 문맥 context를 미리 파악해서 정보를 제공하는 (또는 더 나아가 필요한 액션들을 취해주는) 그런 서비스들로 진화할 것으로 보았습니다. 물론 그런 환경에서도 현재의 검색행위가 완전히 사라지지는 않을 것입니다. 아무리 검색의 패턴이 바뀐다하더라도 그래도 차후 몇년간 주요 이슈가 될 검색서비스에 대해서 무시하고 지나칠 수는 없습니다. 새하늘과 새땅이 창조되기까지는 아직 5년, 10년, 또는 그 이상의 긴 여정이 필요하기 때문입니다. 그런 의미에서 제가 생각하는 (현재도 그렇지만) 앞으로 더욱 주목/중요해지는 검색서비스는 적어도 두가지입니다. 지난 포스팅들에서 전개해가고 있는 소셜검색서비스가 그 첫번째이고, 두번째는 구조화검색입니다. 이 두 서비스가 미래가 없는 검색의 미래/핵심이 될 것입니다. 소셜검색에 대한 얘기들은 따로 시리즈로 전개하고 있으니, 이번 포스팅에서는 구조화검색에 대해서만 간단히 기술하겠습니다.

 구조화검색 structured search은 말그래도 검색의 결과가 사용자들의 (검색) 의도에 맞게 재배치되어서 전달되는 것입니다. (재배치란 단순히 레이아웃의 위치조정을 포함해서, 검색결과에서의 부분선택, 검색결과통합, 또는 수정 등을 포괄한 것입니다.) 넓은 의미에서 기존의 IR (Information Retrieval)에서 BM25나 최신순, 또는 인기도 (e.g., PageRank) 등을 고려해서 소팅된 결과를 제공해주는 것도 일종의 구조화이고, 검색결과를 클러스터링해서 비슷한 이슈끼리 모아주는 것도 구조화이고, 한국의 다음이나 네이버 등에서 제공해주는 일명 통합검색, 즉 카페, 블로그, 지식, 뉴스 등의 소스/섹션별로 묶어서 보여주는 것, 그리고 섹션의 노출순서를 동적으로 조정해주는 것 모두가 구조화입니다. 그리고, (미국) MS 빙에서 제공해주는 가격비교형식의 쇼핑 키워드들에 대한 재정열이나 구글 스퀘어드 Squared와 같이 더 진화된 형식의 구조화도 있습니다. 현재로썬 울프람알파에서 제공해주는 검색결과가 가장 구조화된 형태입니다. 그리고, 오해를 할 수 있는 부분이, 단순히 검색결과, 즉 출력을 재조정하는 것만이 구조화검색이 아니라, 입력에서도 검색쿼리를 지능적으로 만드는 것도 구조화입니다. 가장 단순한 구조화입력으로 '상세검색'을 들 수가 있습니다. 그리고, 다음검색에서 선보였든 슬래쉬 (/) 검색도 일종의 구조화입력으로 볼 수가 있습니다. (참고. 슬래쉬검색에 대한 자세한 사항은 다음검색블로그를 참조하세요.) 지능적으로 검색어를 입력하고, 지능적으로 검색결과를 보여주는 모든 것이 구조화검색이라고 보시면 될 것같습니다. 여러가지 개선사항이 있지만, 구조화검색의 대략적인 모습은 위키피디아 또는 학술논문으로 보면 될 것같습니다. 검색어를 입력했을 때, 단순히 검색어를 포함한 문서목록을 보여주는 것이 아니라, 특정 개념 (키워드/검색어)에 대해서 기승전결/서본결론이라는 완전한 형식을 취할 뿐만 아니라, 여러 곳에 흩어진 정보를 하나의 페이지 내에 추가, 편집, 및 인용을 하고, 또 부가정보들에 대한 레퍼런스/사이트들을 보여주는 등... 즉, 여러 목록들 중에서 사용자가 가장 적합한 문서를 선택해서 검토하는 것이 아니라, 검색결과페이지 그 자체로 완벽한 답변이 될 수 있는 형태로의 진화를 구조화검색으로 보고 있습니다. (완벽함이란 더 더할 것도 없고, 굳이 뺄 것도 없는 그런 상태)

  입출력에 따른 구조화검색
  • 구조화 입력: 검색창에 몇개의 단어조합으로 검색자의 의도에 부합하는 육하원칙에 맞는 검색결과를 찾아낼 수가 없다. 그런 약점을 보완해주기 위해서 예전부터 '상세검색'이라는 옵션들이 제공되고 있고, 최근에는 검색 후에 옵션들을 변경하는 기능들을 많이 지원해주고 있습니다. 검색옵션을 변경하는 것과 함께, 많이 사용되는 구조화입력으로는 사용자들이 입력할만한 검색어를 미리 보여주고 선택하도록 하는 검색서제스트, 입력된 검색어와 연관성이 높은 검색어를 보여주는 관련검색어, 관련검색어와 비슷한 것으로 입력된 검색어를 확장 또는 축소해서 제안하는 확장검색어, 그리고 최근 네이트가 밀고 있는 시맨틱검색 (검색서제스트, 관련/확장검색어와 특별히 다른 점은 없음)이나 네이버가 선보인 시쿼스검색 (상세/검색옵션변경과 같음) 등도 일종의 구조화입력으로 보면 될 것같습니다. 그리고, 이렇게 사용자가 입력한 키워드에 반응하는 검색쿼리포뮬레이션 외에도, 실시간 이슈어와 같이 정해진 검색어세트도 일종의 구조화로 볼 수 있을 것같습니다. 그 외에도 미디어다음의 기사내에 포함된 검색링크도 일종의 구조화고, 다음의 여러 서비스에서 마우스 드래그를 통해서 검색을 하는 것도 모두 구조화입력으로 보면 될 것같습니다. 쉽게, 모든 쿼리포뮬레이션 query formulation이 모두 구조화입니다. (검색창에 입력하는 키워드도 사용자들의 복잡한 추상화과정을 거쳐서 만들어진 것이기 때문에 구조화입니다.) 그리고 현재 많이 연구되고 있고, 실서비스들이 오픈되고 있는 보이스검색이나 이미지스캔검색 등도 구조화입니다. 이런 구조화입력에 대해서는 별로 이견이 없을 것으로 보입니다. 
  • 구조화 출력: 구조화입력도 나름 복잡하고 진화속도가 더딘 것이 사실이지만, 구조화출력만큼 어렵지는 않습니다. 물론, 그 정도에 따라서 달리 해석되겠지만... 가장 간단한 구조화 출력으로는 검색된 결과를 특정 조건에 따라서 정열해서 보여주는 것입니다. Okapi BM25와 같이 입력된 검색어의 존재유무 및 빈도 등에 따른 정열, (특히 뉴스 및 실시간 검색에서 중요한) 가장 최근에 작성된 문서순으로 정열, 또는 현재의 구글을 존재케만든 웹그래프 상에서의 인링크 인기도 PageRank에 따른 정열 등이 가장 원시적인 구조화 출력입니다. 그리고 한국의 검색에서 너무 익숙해진 정보의 출처별로 묶어서 보여주는 통합검색 Integrated Display이라는 것도 구조화 출력입니다. (재미있는 것은, 이 통합검색이라는 것이 앞서 말한 단순 검색결과 정열보다 기술적으로 완성된 것이 아니라는 점입니다. 실제 기술력의 부재가 가져온 사생아가 바로 통합검색입니다. 그런데, 한국사회에서 너무 익숙해져버렸다는 점이 항상 아쉬운 대목입니다.) 통합검색에서 출처별로 검색결과를 제공해주기 때문에, 출처별 정열방식도 큰 이슈가 되었습니다. 몇 가지 정열 규칙이 있지만, 간단하게 말해서 서비스제공자들의 정책적인 부분 (예, 지금은 많이 바뀌었지만 2~3년 전까지만 해도 네이버에서는 지식iN의 결과를, 다음에서는 카페의 결과를 가능하면 최상단에 노출시켜준 적이 있었습니다.), 사용자가 입력한 검색어의 패턴이나 화면상에 보이는 검색매칭정도 (예, '~사진'과 같은 검색어에 대해서 이미지 섹션을 최상단에 노출시켜주는 경우), 그리고 중요한 항목으로 사용자들이 많이 클릭을 하는 섹션을 먼저 보여주는 방식 등의 여러 조건에 맞도록 통합검색의 출처별로 정열해주고 있습니다. 그리고, 최근 몇년 사이에는 쇼핑 등의 몇몇 버티컬을 중심으로 검색결과를 구조화해서 보여주는 시도들이 많이 있습니다. 검색된 일반 텍스트 문서를 원본 그대로 보여주는 것이 아니라, 문서 내에 포함된 특정 속성에 맞는 결과만을 추려서 재정리해서 보여주는 것입니다. 오랫동안 테스트 중인 구글스퀘어드의 경우, 쇼핑 관련 키워드가 입력되면 여러 문서들에서 해당 상품과 관련된 정보들을 취합해서 테이블 형식으로 보여줍니다. 각 테이블은 상품명, 가격, 상품설명, 구입처 등의 컬럼들로 세분화해서 보여줍니다. 그렇기 때문에, 장문의 문서를 모두 검토하지 않고도, 해당 문서의 요약정보를 한눈에 파악할 수 있습니다. 현재로써는 가장 진화한 형태의 구조화검색의 모습이 아닌가 생각합니다. 물론, 울프람알파의 구조화 검색결과가 더 흥미롭습니다. 그런데 구체적인 방법을 알 수가 없으니 설명은 생략하겠습니다. (울프람알파는 아직 범용 검색엔진으로 보기에는 무리가 있습니다.) 현재로썬 일부 버티컬 검색을 중심으로 검색결과를 재조합, 재정열, 재배치하는 형식으로 진화하고 있지만, 장래에는 호리존털에서도 비슷한 과정을 거칠 것으로 보인다. 앞서 말했듯이, 제가 구상하는 최종 검색결과의 형태는 '위키피디아'입니다. 특정 주제어에 대해서 여러 곳/사람들의 생각을 필요한 부분만 발췌해서 추가하고, 시기가 지났거나 잘못된 정보를 삭제되고, 단순한 목록의 나열이나 정해진 속성값을 보여주는 것이 아니라 사람들의 의식의 흐름에 맞게 기승전결로 해당 주제어를 설명하고, 또 검색결과 내에서 완전히 설명할 수 없는 경우 외부/레퍼런스링크를 남겨서 사용자들에게 제공해주는 그런 모습이 구조화 출력의 최종 모습이 아닌가 생각합니다. 물론, 특히 UI/UX 측면에서는 위키피디아의 모습이 제 머리속의 구조화검색이라고 말하기는 어렵지만, 위키피디아가 보여주는 다이내믹한 모습이 제가 생각하는 구조화의 그것과 닮았다는 것입니다.
 우리는 완벽한 검색결과를 원하는 것이지, 현재처럼 파편화되고 중복된 문서목록을 원하는 것이 아닙니다. 가장 적합한 하나의 문서를 최상단에 보여주는 것이 현재까지의 검색이었다면, 앞으로는 가장 사용자의 의도에 맞는 새로운 페이지를 (동적으로) 만들어서 제공해주는 것이 검색이 될 것입니다. 이런 것 (지능적 구조화)은 앞으로 소셜검색에서도 당연히 이뤄져야할 것이고, 앞선 검색의 미래에 관련된 포스팅들에서 말한 질문성검색 및 컨텍스트검색 등의 미래의 모든 검색에서 공통적으로 해당되는 사항입니다. 

 처음에 의도했던 글이 된 것도 아니지만 (특히, 입출력별 구조화 설명이 제대로 이뤄지지 못했음), 요는 Structured Search라는 것이 이미 우리 일상에 깊이 관여하고 있지만, 미래에는 더 동적이고 지능적인 검색결과를 제공해주는데 더 많은 핵심역량을 발휘해야 한다는 정도로 글을 이해해주셨으면 합니다. 검색랭킹을 넘은 검색최적화의 단계가 필요합니다.

관련 포스팅.

댓글을 달아 주세요

  1. 유똥 2010.08.03 14:48 신고 Address Modify/Delete Reply

    자세히 읽고픈데 너무 엄청난....글의 압박이네요... 조그만 사진이라도 좀있었으면^^;

    • Favicon of https://bahnsville.tistory.com BlogIcon Bahniesta 2010.08.04 12:38 신고 Address Modify/Delete

      그러게요. 매번 사진을 함께 올릴 걸이라는 생각도 하지만, 괜히 어슬픈 사진들은 집중력만 저하시킨다는 연구가 있어서 필요한 경우가 아니라면그냥 글만 씁니다.