이번 글에서 추천 알고리즘에 따른 분류는 아닙니다. CF, 유저기반, 아이템기반 등의 일반적인 알고리즘의 설명은 다음 글에서 자세히 다룰 예정입니다. 이 글에서는 -- 적당한 표현이 떠오르지 않는데 -- 추천대상 또는 형태상의 분류를 다루고 있습니다. (아래는 그냥 '하다'체로 적겠습니다. 처음에 그렇게 적어놨었었네요.)
추천 시스템을 크게 나누면 전체추천, 그룹추천, 개인추천 (개인화), 및 연관아이템추천으로 나눌 수 있을 것같다.
전체추천은 말 그대로 불특정 다수에게 추천하는 형태다. 일반적으로 다음이나 네이버에 접속했을 때 첫화면에 보여지는 무수한 글/이미지/상품들이 전체추천이다. 일반적으로 에디터 또는 운영자들이 그날의 이슈에 따라서 선별해서 보여준다 (보통 featuring한다고 표현함). 조금 발전된 형태가 조회수나 댓글수 등을 확인해서 인기가 높은 글이나 아이템을 보여주는 형태다. 검색에서 실시간이슈도 불특정 다수에게 같은 내용을 제시하기 때문에 전체추천이다. 검색창에 글을 입력하면 나타나는 suggest도 전체추천에 해당한다.
그룹추천은 사용자들을 특정 그룹 (세그먼트)로 나눠서 각 그룹에 특화된 컨텐츠를 추천해주는 형태다. 다음탑 또는 쇼핑하우에 들어가면 내또래라는 영역이 존재하는데, 이는 성연령대를 기준으로 특정 그룹에서 좋아하는 키워드나 상품을 추천해주는 형태다. 미담 내에도 개별 기사들의 조회한 성, 연령, 접속지역을 분석해서 각 세대의 인기 기사를 보여주는데, 이것도 그룹추천이다. 네이버에는 청소년, 재태크족, 주부 등으로 그룹을 나눠서 인기키워드를 보여주는 서비스가 있다. 그룹별추천에는 앞서 내또래처럼 사용자의 데모그래픽 등의 메타데이터를 기반으로 그룹열 신택틱하게 세분화할 수도 있고, 네이버 인기키워드처럼 사용자와 키워드 페어를 그룹핑/클러스터링해서 의미단위로 그룹핑할 수도 있다. (참고로 네이버 그룹별 키워드는 LDA라는 알고리즘을 사용했다. LDA는 추후에 다시 다루게 될까?)
개인추천은 말그대로 개인별로 맞춤추천, 즉 (추천)개인화다. 개인의 과거 이력을 바탕으로 그/그녀의 관심사를 특정하고, 그것에 맞는 아이템을 보여주는 형태다. 일반적으로 CF 알고리즘이 사용된다. 나중에 다시 자세히 다루겠지만, 사용자를 어떻게 모델링할 것인가? (프로파일링)이 개인화추천의 핵심이다. 검색했던 키워드, 읽었던 기사 또는 기사내의 주요 단어, 구독하거나 유사한 행동 패턴을 보인 다른 사용자/친구 등이 모두 개인 프로파일에 포함될 수 있다. (자세한 것은 추후에 따로 다룰 예정이다.)
연관아이템추천은 사용자를 그루핑하거나 개인별 맞춤추천을 해주는 것이 아니다. 개별 아이템별로 관련 아이템을 보여주는 형태다. 미디어다음에서 기사를 보면 오른쪽 날개 영역에 관련기사/이슈를 보여주기도 하고, 언론사들은 기사 하단에 관련기사를 피쳐링해서 보여주기도 한다. 다음의 쇼핑하우에서 상품을 검색해보면 아래쪽에 추천 영역이 노출되는데, 그곳에서 '최근본상품' 탭이 아이템추천이다. 아마존과 유튜브의 관련동영상이 바로 CF기반의 연관아이템추천이디. 일반적으로 메타데이터를 이용해서 (일반화시켜서) 클러스터링해서 관련아이템을 뽑아내거나 CF방식으로 관련아이템을 뽑을 수 있다. 추천시스템에서는 일반적으로 CF방식을 사용하지만, 커버리지문제 때문에 CBF와 하이브리드 형태로 조합되거나 너무 쌩뚱맞은 추천을 막기 위해서 메타데이터를 이용한 재가공/필터링이 이뤄지기도 한다. 그리고, 함께 구입한 물건을 연결하는 장바구니 분석은 아주 협소한 형태의 CF 분석방법이다. (기술적으로, Association Rule 기법이라 부름) 그리고 만약 개인의 프로파일이 최근 본 아이템들이면, 연관아이템과 결합되면 바로 개인화추천이 된다. (아마존 탑 페이지 참조)
다음 글에서는 CF를 중심으로 알고리즘 측면에서의 추천 시스템을 분류할 예정이다.
추천시스템 전체 목록
- 추천 시스템과의 조우 (PR시리즈.1)
- 추천 시스템을 위한 데이터 준비 (PR시리즈.2)
- 추천대상에 따른 추천 시스템의 분류 (PR시리즈.3)
- 알고리즘에 따른 추천 시스템의 분류 (PR시리즈.4)
- 추천 시스템을 위한 유사도 측정 방법 (PR시리즈.5)
- 추천 시스템의 성능 평가방법 및 고려사항 (PR시리즈.6)
- 추천 시스템에서의 랭킹과 필터링 문제 (PR시리즈.7)
- 추천 시스템의 쇼핑하우 적용예 (PR시리즈.8)
- 개인화 추천 시스템에 대하여 (PR시리즈.9)
- 추천 시스템의 부작용 - 필터버블 (PR시리즈.10)
- 추천 시스템의 레퍼런스 (PR시리즈.11)
- 추천 시스템에 대한 잡다한 생각들 (PR시리즈.12)
- 추천 시스템을 위한 하둡 마훗 사용하기 (PR시리즈.13)
- 추천 시스템에 대해서 여전히 남은 이야기들 (PR시리즈.14)
==
페이스북 페이지: https://www.facebook.com/unexperienced