본문 바로가기

Messages from Bahn

(1184)
눈길 발자국 이정표 그리고 결단 눈이 온다는 예보처럼 일어나니 많은 눈이 내렸습니다. 장비를 모두 챙겨서 밖으로 나갑니다. 오늘 눈이 오면 주변을 돌아다니며 사진을 찍기로 마음 먹었습니다. 설마 눈오는 오전에 사람들이 나보다 먼저 산책을 했겠어라는 생각을 가지고 집 뒤에 쏟은 삼의악오름으로 향했습니다. 지난 밤에 일찍 잠들어서 보지 못했던 응사를 아침에 다시보기 하느라 조금 늦게 출발했더니, 벌써 몇 분이 저보다 먼저 눈밭에 발자국을 남겨놓았습니다. 조금 아쉬운 마음도 들었지만, 또 그 자국을 보면서 생각을 합니다.누군가가 나보다 먼저 이 길을 걸었고, 자국을 남겨놓았다는 것은 내가 그것을 따라가면 안전하게 정상에 도달할 수 있다는 의미입니다. 발자국에 맞춰서 걷기 시작합니다. 그런데 어느 순간부터 마음이 급해졌는지 걸음걸이 속도가 빨..
데이터 매니페스토: 데이터 기반의 실행조직 (새벽에 문득 잠에서 깨어 이 글을 적는다.) 최근 데이터 또는 데이터 기반 접근법에 대한 관심이 뜨겁다. 어쩌면 내가 밥벌어먹고 살려고 또 내 몸값을 올리려고 이런 표현을 사용/전파하고 있는지도 모르겠다. 관련 뉴스를 보면서 과연 데이터 기반의 실행조직이라는 것이 실체가 있는 것인지? 아니면 그들도 자기들을 세일즈하기 위해서 억지로 기사를 쏟아내고 있는 것은 아닌지? 또는 구글이나 몇몇 잘 나가는 기업들이 데이터를 가지고 돈을 잘 벌고 있으니 그걸 부각시키고 과대포장하고 있는 것은 아닌지? 등에 대한 의문이 들기는 한다. 그런 의심은 일단 뒤로 하고, 데이터가 공기처럼 편재하고 있다는 것은 사실이다. 많은 기업들이 스스로 좀 더 가치있는 데이터를 생산해내거나 고객들로부터 그런 데이터를 수집하려고 노력중..
커뮤니케이션 문제는 커뮤니케이션으로 해결된다. 12월이 되니 여러 가지 이슈로 많은 글을 적게 됩니다. 개인의 취미 생활에서부터 사회 문제까지 적고 싶은, 그것보다 적어야하는 글들이 쏟아집니다. 일전에 다음인들에 의한 제주사진전@한남에 대한 글을 올렸는데 (참고. 다송밤을 준비하며... (제주 사진전 at 한남)), 그것의 경과/결과에 대한 글도 적어야 하는데, 다른 글들 때문에 미뤄지거나 취소될 듯합니다. 어쨌든 지금 글은 사진전의 연장선에서 나온 얘기이고, 그리고 더 근본적인 대한민국의 현실에 관한 얘기입니다. 사진전을 준비하면서 저는 제주에서 있으면서 사진을 좋아하는 동료들에게 사진 기부를 독려하고 모아서 서울로 보내주는 역할을 했습니다. 나머지 전시 관련 사항은 서울에서 알아서 하기로 했습니다. 처음 기획 단계에는 개별 회의실에 개인별로 전시..
추천 시스템의 유사도에 대한 심화이해 (PR시리즈.17) 이 글은 이전에 다뤘던 글들에 비해서 조금 더 관념적이면서 기술적인 글을 담고 있습니다. 그렇다고 해서 수식이나 프로그래밍 코드가 포함된 것은 아닙니다. 추천 시스템 (CF방식)에서 어떤 유사도 similarity measure를 사용하느냐에 따라서 추천 시스템의 성능에 큰 영향을 준다고 설명했습니다. 일반적으로 Euclidean distance, jacard index, correlation coefficient, cosine 등의 유사도를 많이 사용하고 있다고 말했습니다. 그리고, 추천 시스템에 따른 예측값과 실측값의 Error term이나 이들의 correlation의 정도로 추천 시스템의 정확도를 평가한다고 말씀 드렸습니다. (하단 링크 참조) 이 글에서는 유사도 또는 성능평가 측도에 대해서 좀더..
학과/전공에 따른 데이터마이닝 구분 최근 빅데이터 Big Data, 스마트 데이터 Smart Data, 데이터분석 Data Analytics, 예측분석 Predictive Analytics, 데이터 사이언티스트 Data Scientist 등과 같은 용어가 범람하는 것은 그만큼 데이터마이닝 Data Mining에 대한 수요와 인기가 높아졌다는 반증일 것입니다. 이전 글에서 데이터마이너가 되기 위해서 이런 학과에 진학하거나 수업을 들으면 된다는 류의 Q&A를 몇 차례 다뤘습니다. 일반적인 의미에서 그런 진학/진로 상담이 별로 어렵지는 않습니다. 하지만 세부적으로 들어가면 각 학과마다 조금씩 관점의 차이가 있기 때문에 단순히 이런 수업을 수강하면 된다 식의 조언으로는 충분치 못한 것같아서, 오늘은 학과/전공별로 데이터마이닝이 어떻게 다른지에 대..
추천 시스템과 다중인격 (PR시리즈.16) 추천 시스템 관련 이야기는 이제 그만 하려고 했는데, 미처 다루지 못했던 이슈가 계속 떠오릅니다. 제목은 조금 이상하게 정했지만, 추천이 개인화를 목적으로 두지만 경우에 따라서 반개인화가 목적이 될 때도 있고 또 지나친 개인화는 추후에 프라이버시 문제와 연결될 수가 있습니다. 여기서 말하는 프라이버시 문제는 일반적인 개인정보 수집 및 사용에 관한 것이 아니라, 다양한 페르소나를 가지는 개인을 하나로 합쳐서 보여줄 때 발생하는 문제를 의미합니다. 한 사람을 하나의 페르소나로 정의하지 못합니다. 여러 가지 특성을 가지고 있습니다. 저는 직장인이고, 30대 남성이고, 제주에 살고 있습니다. 그 외에 사진을 많이 찍고 데이터마이닝에 관심을 가지고 있습니다. 주말에는 교회를 나가고 또 축구하는 것도 좋아합니다. ..
2014년에는 어떤 책들을 읽을까? 2013년을 되돌아보며 후회되는 것 중에 하나가 독서량이 많이 줄었다는 거다. 독서할 시간이 없었다기보다는 독서할 의욕이 없었다가 맞다. 왜 의욕이 부족했느냐?고 묻는다면 — 이미 몇 번 밝힌 듯하지만 — 재미있는 책을 읽지 못했다는 것이다. 분수에 맞지 않게 어려운데 두꺼운 책을 한 두번 읽기 시작하면 재미도 떨어지고 독서속도도 떨어진다. 자연스레 책은 뒤로 미루로 TV나 인터넷으로 눈을 돌리게 된다. 평소와 다름없는 방식으로 책을 선정했다고 생각했지만, 2013년에는 책선정에 실패한 경우가 많았었다. 굳이 또 변명하자면 올해는 유독 500페이지 이상의 두꺼운 책을 많이 구입했던 것같기도 하다. 글의 제목은 마치 내가 2014년에 어떤 책을 읽을지 미리 알려주는 것같지만, 실은 경험을 바탕으로 이런 책..
개인 우연 창발 그리고 창의 문득 서구의 개인주의가 창의력의 원천일 수도 있겠다는 생각이 들었습니다.여전히 사실인지 아니면 그냥 신화인지는 확인할 길이 없으나 Pixar 스튜디오에는 화장실이 건물 중앙에 한 곳에만 있다고 합니다. 누구나 생리현상은 해결해야 하고, 그럴려면 중앙에 있는 화장실로 모여야 합니다. 그렇게 모이고 부딪히면서 서로 얘기를 하다보면 다양한 이야기들이 오갈 것입니다. 때로는 자신이 가지고 있는 문제를 토로하는 경우도 있을테고, 때로는 최근에 자신이 했던 프로젝트나 잘 된 일을 뽐내기도 할 것입니다. 그렇게 우연히 마주친 이들과 이야기를 나누다 보면 자신이 가지고 있는 문제를 해결해줄 사람과 대화하기도 하고, 또는 그런 이를 연결해주기도 합니다. 이렇게 우연에 의한 창발을 기대하며 화장실은 하나만 만들었다는 얘기..