본문 바로가기

Tech Story

추천 시스템과 프라이버시 (PR시리즈.20)

이 주제에 대해서 자세히 다룰 능력이 되지 않지만 이 주제를 뺀다면 글이 완성될 수 없기 때문에 생각했던 그리고 주워들었던 일반적인 내용만이라도 짧게 다룹니다. 프라이버시라고 제목에 적었지만 단지 프라이버시 뿐만 아니라, 여러 법적인 문제들은 늘 서비스 또는 알고리즘을 개발하는데 이슈가 됩니다. 특히 추천은 궁극적으로 개인화로 가기 때문에 개인정보 및 사용에 대한 고민이 많을 수 밖에 없습니다. (이 글은 조금 민감한 주제이므로, 미리 밝히는데 이 글은 오로지 개인의 일탈적 생각일 뿐, 제가 몸담고 있는 조직의 생각/프랙티스는 아닙니다. 어떤 것들은 그냥 가능성 또는 잠재성만을 얘기하는 것일 뿐 저의 신념을 얘기하는 것도 아닙니다.)

이전 글에서 사적인 영역에서 봤던 것을 기준으로 추천된 것이 공적인 영역에서도 노출될 수 있다는 우려의 글을 적은 적이 있습니다. 조금 낯이 뜨겁고 민망한 경우지만 웃으며 넘길 수도 있습니다. 그렇지만 하나의 기기 (대표적으로 스마트폰)로 개인의 모든 정보가 접근 가능해지고, 하나의 식별자 (이메일 등)로 모든 연결된 곳에서의 활동이 저장되고 통합된다는 것을 깊이 생각해보면 아찔하다는 생각이 듭니다. 가볍게 무시될 수도 있지만 또 그냥 넘길 수가 없는 것이 프라이버시 문제입니다.

다른 글에서 (추천 시리즈 외의 글) 개인정보의 개념이 바뀌고 있다는 뉘앙스의 글/말을 한 적이 있습니다. 페이스북의 저크버그는 개인정보/프라이버시의 시대는 끝났다라는 위험한 선언까지도 했지만 어쨌든 프라이버시에 대한 생각이 많이 바뀌었고 둔화되었습니다. 다른 글에서 저는 이제 개인정보는 개인에 대한 정보에 관한 것이 아니라 그 정보에 대한 통제권/제어권의 문제다라고 적었습니다. 이제는 그리고 앞으로는 개인의 정보를 숨길 수가 없습니다. 지난해 문제가 되었던 NSA의 감시 및 첩보활동에서 보듯이, 우리가 아무리 숨기려고 해도 그것을 캐내려는 시도가 많습니다. 그리고 무의식적으로 우리 정보를 흘리고 다니고 있습니다. 이미 내 주민등록 번호는 공용이다라는 우스개 소리도 합니다.

어쩌면 그래서 개인의 이름, 생년월일, 관심사, 다녀왔던 곳 등의 정보는 더 이상 개인정보가 아닐 수도 있습니다. 프라이버시 문제를 다룰 때 이런 정보를 보호해야 한다는 접근법은 어쩌면 맞지 않을 수도 있습니다. 이제는 그런 정보에 대한 통제권이라는 측면에서 프라이버시를 다뤄야한다고 생각합니다. 내가 페이스북에 사진을 공개한다면 내 친구들이나 때로는 불특정인이 저의 개인 페이지에서 그걸 볼 수가 있습니다. 그러나 그 사진을 허락도 없이 — 저작권/초상권 문제와는 별개로 — 다른 곳에서 이용할 수는 없습니다. 나의 정보는 내가 통제하는 범위 내에서 공개되고 사용되어야 합니다. 그런 의미에서 정보 통제권을 말하는 것입니다. 이미 공개된 (때로는 그냥 아무런 숫자조합으로도 만들어지는) 주민번호나 전화번호 자체가 문제가 되는 것이 아니라, 그것을 불법적으로 사용하는 것이 문제입니다. 전화번호나 이메일 주소를 공개했다면 정상적인 연락을 받겠다는 의미이지 스팸 문제나 메일을 받겠다는 의미가 아닙니다. 그런 스팸은 저의 통제권을 벗어난 것입니다. 즉, 프라이버시 침해라고 말할 때 그것이 나의 통제권 안에 있느냐 밖에 있느냐를 따져야합니다.

그런 측면에서 추천에서도 나의 구매나 조회 기록이 다른 사람들에게 도움을 줄 수 있도록 추천 데이터로 사용되어야 된다는 허락이나, 나에게 맞는 개인화된 추천을 받아보겠다 등과 같은 명시적 허락이 필요합니다. 서비스 제공자의 입장에서는 이런 옵트인 opt-in 방식은 여러모로 꺼려지기 때문에, 적어도 옵트아웃 opt-out 방식으로 사용하지 말것 또는 추천하지 말것 등의 옵션이 제공될 필요가 있습니다. 특정 히스토리만 빼달라와 같은 CS 까지 들어온다면 서비스 제공자 입장에서는 애초에 추천 서비스를 하지 않는 것이 가성비가 더 나을지도 모르겠다는 생각도 문득 듭니다.

프라이버시나 법적인 문제는 저의 전문 영역이 아니라서 이정도에서 끝맺겠습니다.

추천시스템 전체 목록

  1. 추천 시스템과의 조우 (PR시리즈.1)
  2. 추천 시스템을 위한 데이터 준비 (PR시리즈.2)
  3. 추천대상에 따른 추천 시스템의 분류 (PR시리즈.3)
  4. 알고리즘에 따른 추천 시스템의 분류 (PR시리즈.4)
  5. 추천 시스템을 위한 유사도 측정 방법 (PR시리즈.5)
  6. 추천 시스템의 성능 평가방법 및 고려사항 (PR시리즈.6)
  7. 추천 시스템에서의 랭킹과 필터링 문제 (PR시리즈.7)
  8. 추천 시스템의 쇼핑하우 적용예 (PR시리즈.8)
  9. 개인화 추천 시스템에 대하여 (PR시리즈.9)
  10. 추천 시스템의 부작용 - 필터버블 (PR시리즈.10)
  11. 추천 시스템의 레퍼런스 (PR시리즈.11)
  12. 추천 시스템에 대한 잡다한 생각들 (PR시리즈.12)
  13. 추천 시스템을 위한 하둡 마훗 사용하기 (PR시리즈.13)
  14. 추천 시스템에 대해서 여전히 남은 이야기들 (PR시리즈.14)
  15. 추천 시스템과 머신러닝 (PR시리즈.15)
  16. 추천 시스템과 다중인격 (PR시리즈.16)
  17. 추천 시스템의 유사도에 대한 심화이해 (PR시리즈.17)
  18. 추천 시스템의 설계 (PR시리즈.18)
  19. 추천 시스템과 어뷰징 (PR시리즈.19)
  20. 추천 시스템과 프라이버시 (PR시리즈.20)

==

페이스북 페이지: https://www.facebook.com/unexperienced

반응형