본문 바로가기

랭킹

(4)
개인화 추천 시스템에 대하여 (PR시리즈.9) 불특정 다수를 위한 추천을 제외하면, 대부분의 추천은 개인화에 바탕을 두고 있습니다. 개인의 선호도를 바탕으로 명시점수를 예측하거나 특정 아이템을 선호할 확률을 계산해서 보여주기 때문입니다. 그리고 나와 유사한 사용자들이 좋아하는 제품들이나 내가 좋아하는 제품의 관련 제품들도 개인의 선호에 바탕으로 맺어지는 것입니다. 그렇기에 추천 개인화라는 타이틀이 조금 어색하지만, 최근에 제가 고민하는 플랫폼/프로세스에 대한 간략한 스케치만 다루겠습니다. 그리고, 추천 개인화에 관심이 있으신 분들은 Netflix에서 나온 Mining Large Streams of User Data for Personalized Recommendations를 읽어보시기 바랍니다. 제가 생각하는 추천 시스템 또는 추천 개인화는 1. 개..
추천 시스템에서의 랭킹과 필터링 문제 (PR시리즈.7) 일곱번째 주제는 랭킹으로 정했습니다. 보통 추천 시스템은 Top N개의 아이템을 추천해줍니다. Top N을 결정하는 것은 일반적인 의미에서 랭킹 문제로 볼 수 있습니다. 그리고 추천 시스템을 검색엔진의 특수형/변형이라고 볼 수도 있습니다. 검색엔진은 사용자가 입력한 키워드 (쿼리)에 대해서 가장 적합한 (매칭률, 인기도, 최신성, 다양성 등 고려) 문서들을 제공하는 것이지만, 추천 시스템에서의 쿼리는 키워드가 아니라 유저 또는 아이템 그 자체입니다. 즉, 어떤 사용자를 쿼리해서 그/그녀에게 가장 적합한 아이템을 검색결과로 던져주거나 특정 아이템에 대해서 가장 연관성이 높은 것을 제시하는 것이 추천 시스템입니다. 입력의 형태만 키워드에서 유저 또는 아이템으로 바뀌었을 뿐, 기본 작동원리는 검색엔진의 그것과..
한장으로 보는 '블로거뉴스 & 열린편집' 그림 한장으로 다음 블로거뉴스와 열린편집을 도식화해보았습니다. 열린편집 알고리즘에 대해서는 이미 특허도 출원이 되었고, 발표 및 논문의 형태로 공개가 될 예정이라 자세한 사항은 특허문서나 논문 (조만간 발표될 예정)을 참조하시기 바랍니다. 자세한 내용을 어느 선까지 다루어야할지 애매하기 때문에 간단한 설명만 다룹니다. (회사에서 진행하고 있는 서울대 컴공과 학생들을 위한 발표자료를 준비 중에 잠시 만든 자료/그림이라서 자세한 내용을 다루지 못합니다.) 블로거뉴스 - 블로거이라면 다음의 블로거뉴스에 기자단으로 등록한다. (등록방법은 다른 포스팅들을 참조바람) - 자신의 글을 블로그에 등록한다. - 블로그에 글을 등록할 때, 블로거뉴스에 발행을 선택하거나 블로거뉴스 홈페이지에서 RSS를 이용해서 글을 발행한..
랭킹 이야기 이전 글들을 종합해 보면 제가 어디서 어떤 일들을 하고 있는지 알 수 있을 것이다. 일명 (호라이즌) 포탈을 운영하는 곳에서 일하고 있기 때문에 회사 내에 다양한 서비스들이 존재한다. 즉 내가 이 회사에 몸을 담고 있다고 하더라도 다른 팀이나 서비스들에 대해서는 경우에 따라서 전혀 모를 수도 있다는 소리다. 팀의 성격상 cross-team 업무가 많기는 하지만 회사에서 운영하고 있는 대부분의 서비스들에 대해서 전혀 아는 것이 없다고 해도 맞는 말이다. 그런데 오늘 다른 팀의 서비스에 대해서 좀 이야기를 하고 싶어졌다. 블로거뉴스나 한참 때의 아고라의 글들 중에 자신의 글의 랭킹이라던가, 베스트글에 존재여부 등에 대해서 매우 민감한 반응을 보이는 이들이 종종있다. 어쩌면 그들이 직감한 것이 맞을 수도 있지..