본문 바로가기

Messages from Bahn

(1184)
[제주 + 사진] It's Jeju #12 ~ #22 It's Jeju 두번째 글입니다.#12. 메밀밭바다 배경으로 메밀밭 사진을 찍을 수 있다고 해서 찾아간 곳입니다. 다른 장소가 있었겠지만 일단 정차한 곳에서는 바다배경보다는 산쪽이 더 나아보였습니다. 가을 제주를 돌아다니면 형형색색의 밭들을 볼 수 있습니다. 하얀 메밀꽃, 누른 풀잎, 알록달록한 코스모스 등... 그 모든 것을 한장에 담고 싶었는데, 직접 볼 때와 사진 속의 장면이 너무 다릅니다. 그리고 날씨가 맑았더라면...? #13. 태풍후에태풍이 지난 다음날 바닷가로 나갔습니다. 비와 바람은 잦아들었지만 바위에 부서지는 파도는 여전히 생동감이 넘칩니다. #14. 만선의 꿈태풍이 지난 바로 다음 날에도 만선의 꿈을 갖고 바다에는 고기배들이 보입니다. 설명할 수 없지만 다양한 생각들이 스쳐지나갑니다...
추천 시스템을 위한 유사도 측정 방법 (PR시리즈.5) 이전 글에서 CF를 중심으로 추천 알고리즘을 설명했습니다. CF 방식은 나와 유사한 사용자의 아이템을 추천하거나 내가 관심있어하는 아이템의 관련 아이템을 추천해주는 방식입니다. 관련 아이템이라는 것도 결국 그 아이템에 관심있어하는 다른 사용자들이 공통적으로 본 아이템들로 정의가 됩니다. 유사 사용자 또는 관련 아이템에서 공통적으로 '유사성 = 관련성'이라는 개념이 등장합니다. CF가 매우 간단한 알고리즘이기 때문에, 초기의 많은 추천 시스템에서는 어떻게 유사도를 잘 구할 것인가가 주요 연구주제였습니다. 오늘은 이 유사성 또는 유사도를 어떻게 구하느냐에 대한 설명을 하겠습니다. 일반적으로 유사도 similarity measure는 두 오브젝트 사이의 거리 distance 또는 차이 difference의 역..
[제주 + 사진] It's Jeju #01 ~ #11 오늘 아침에 다녀온 형제섬 일출을 끝으로 제주+사진 두번째 프로젝트인 It's Jeju를 마쳤습니다. Imaginge Jeju 때와 마찬가지고 총 99장의 사진을 사진을 찍은 순서대로 추가했습니다. 벌써 세번째 프로젝트에 대한 설레임이 앞서지만, 지난 프로젝트를 정리하는 차원에서 앞으로 총 9개의 포스팅을 통해서 It's Jeju의 사진들을 블로글르 통해서 공개합니다. 모든 사진은 앞의 페이스북 링크를 통해서 보실 수 있습니다. 바로 세번째 프로젝트는 아니겠지만, 언젠가는 'This is NOT Jeju'라는 타이틀로 컬렉션을 별도로 만들어보고 싶다는 생각이 듭니다.#01. 추사유배지첫번째 Imagine Jeju 프로젝트를 마치기도 전에 테스트삼아서 만든 사진인데, 그냥 두번째 프로젝트 첫 사진으로 삼았..
알고리즘에 따른 추천 시스템의 분류 (PR시리즈.4) 앞으로 다양한 주제의 글이 남아있지만, 이번 포스팅이 추천 시스템에서는 가장 핵심이 되는 추천 알고리즘에 대한 글입니다. 본격적으로 추천 알고리즘이 개발된 것은 20여 년 밖에 되지 않지만, 실 서비스에서 쉽게/바로 적용이 가능하고 그 효과도 즉각적으로 측정이 가능하기 때문에 다양한 방법들이 개발되었습니다. 밑에서 자세히 설명하겠지만 대부분의 알고리즘들이 매우 간단하여, 데이터마이닝에 큰 지식이 없는 이들도 쉽게 구현, 적용할 수 있어서 다양한 분야의 전문가들이 추천 알고리즘에 살을 붙여서 개념의 간단성에 비해서 매우 다양한 방법들이 존재합니다. 가장 원시적인 추천 알고리즘은 컨텐츠 기반의 필터링 (CBF)이 될 듯합니다. 아이템의 속성/메타데이터를 이용해서 연관 아이템을 묶어주기 때문에 별로 어렵지 않..
지난 1년동안 읽은 도서들.. (2013) 이 글은 작년 이맘 때, 같은 글을 적었기 때문에 올해 또 적습니다. (참고.지난 1년간 읽은 도서들.. (2012)) 작년에는 읽은 도서를 기준으로 작성했는데, 올해는 그냥 구입한/선물받은 것을 기준으로 나열하겠습니다. 대부분의 책들은 '구입 = 완독'을 의미하기 때문에, 구매도서를 나열하는 것도 큰 차이가 없습니다. 작년에 비해서 반정도밖에 읽지 못했습니다. 중간에 바빴다기 보다는 올해는 선정성공률이 떨어졌기 때문입니다. 이런 저런 통로를 통해서 추천받은 책 중에서, 평소에 좋아하는 주제/분야의 책을 다시 찜해두고 한꺼번에 구입하는데, 올해 구입했던 책 중에서 많은 것들이 별로 재미없고 지루해서 독서 속도가 많이 떨어진 경우가 많습니다. 물론 그런 경우에는 중간에 읽는 것을 포기하는 경우가 다반사입니..
추천대상에 따른 추천 시스템의 분류 (PR시리즈.3) 이번 글에서 추천 알고리즘에 따른 분류는 아닙니다. CF, 유저기반, 아이템기반 등의 일반적인 알고리즘의 설명은 다음 글에서 자세히 다룰 예정입니다. 이 글에서는 -- 적당한 표현이 떠오르지 않는데 -- 추천대상 또는 형태상의 분류를 다루고 있습니다. (아래는 그냥 '하다'체로 적겠습니다. 처음에 그렇게 적어놨었었네요.) 추천 시스템을 크게 나누면 전체추천, 그룹추천, 개인추천 (개인화), 및 연관아이템추천으로 나눌 수 있을 것같다. 전체추천은 말 그대로 불특정 다수에게 추천하는 형태다. 일반적으로 다음이나 네이버에 접속했을 때 첫화면에 보여지는 무수한 글/이미지/상품들이 전체추천이다. 일반적으로 에디터 또는 운영자들이 그날의 이슈에 따라서 선별해서 보여준다 (보통 featuring한다고 표현함). 조금..
아듀 제주 2013 절대 끝이 없는 터널같았는데 2013년도 이제 채 한달이 남지 않았습니다. 여러 곳에서 올해의 인물, 사건, 키워드 등을 뽑고 있으니, 저도 월별로 사진 한장씩 선정해서 2013년을 되돌아보려 합니다. 아직 20여일이 남았지만, 연말에는 또 다른 일로 바쁘거나 계획된 주제의 글을 적을 예정이라서, 휴가를 내고 사진을 정리하면서 생각난 김에 바로 글을 적기로 했습니다. 사진 선정 기준은 그저 제주의 계절을 잘 보여주는 경우도 있고, 그저 나름 사진이 잘 나와서 뽐내고 싶은 것도 있지만, 저의 (제주+사진) 경험에 많은 초점을 뒀습니다. 1월부터 8월까지는 겨우 1~200장 내외의 사진밖에 찍지 않아서 (아이폰 사진 제외) 그저 잘 나온 것 위주로 선정했습니다. 그래서 이미 공유되었던 사진들과 겹칠 수도 있..
추천 시스템을 위한 데이터 준비 (PR시리즈.2) 두번째로 추천에 사용되는 데이터에 대해서 간단히 설명하겠습니다. 추천방식에 따라서 필요한 데이터가 달라지지만, 가장 일반적인 내용을 설명하고 추후에 특정 알고리즘이나 방식에 맞는 데이터는 별도로 설명하겠습니다. (특정 용어가 특정/다른 상황에서 적절하지 않을 수도 있습니다.) 추천의 기본 원리는 과거는 곧 미래다입니다. 그렇기에 추천을 위해서 필요한 데이터는 유저들의 행위 behavior 기록입니다. 상품 구매 이력, 이벤트 참석 이력, 기사를 공유했거나 like를 한 이력, 영화나 드라마를 보거나 평점을 남긴 이력 등의 모든 것들이 추천시스템에서 활용합니다. 그런 모든 이력들이 제품이나 컨텐츠에 대한 사용자의 선호/관심을 나타내는 지표로 사용합니다. 좀 더 구체적으로 쇼핑 추천을 예로 들겠습니다. A라..