메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

컬럼/인터뷰

빅데이터(big data)의 시대에 프라이버시는 무엇을 의미하는가? 데이터 투명성이 익명화보다 나은 이유에 대하여

한빛미디어

|

2012-01-25

|

by HANBIT

15,583

제공 : 한빛 네트워크
저자 : 테렌스 크레이그
역자 : 한순보
원문 : What does privacy mean in an age of big data?

우리가 온라인에서 (쇼핑하고, 인터넷을 돌아다니고, 이야기하고, 체크인하고, "좋아요!"를 하는 등) 더 많은 것을 할수록, 우리 자신에 대한 데이터의 어마어마한 흔적이 남겨지고 있는 것은 분명하다. 안전장치(safeguards)가 어느 정도 수준의 보호책을 제공하지만, 항상 기술은 틈이 생길 수 있으며 데이터 수집의 목적이 변할 수도 있다. 디지털 데이터가 움직이는 대상(moving target)이고 앞으로도 항상 그렇다고 한다면, 그 사실이 프라이버시에 대한 우리 기대를 어떠한 식으로 만들까? 다음의 인터뷰에서 "프라이버시와 빅데이터(Privacy and Big Data)"의 공동저자인 테렌스 크레이그(@terencecraig)가 이러한 질문과 관련된 이슈에 대해 검토해 본다.

테렌스 크레이그 광고주가 우리의 데이터를 어떻게 사용하는지에 집중함으로써, 우리는 더 큰 그림 일부를 놓치고 있을 수 있다고 당신 책은 주장하고 있습니다. 구체적으로 우리가 놓치고 있는 것은 무엇인가요?

테렌스 크레이그: 내가 사람들에게 이야기하는 한 가지는, 회사가 나에게 비누를 더 효율적으로 팔게 되는 것에 대해 나는 실제로 상관하지 않는다는 점입니다. 내가 정말 관심이 있는 것은 내게 비누를 팔기 위해 수집하고 있는 정보량과 데이터 사용이 미래에 일어날 수 있다는 점입니다.

공동 작가인 메리 루들로프(Mary Ludloff)와 내가 책에서 하려고 한 이야기의 요점 중 하나는, 데이터 수집을 하는 이유는 데이터가 결국 사용되는 방법과는 관련이 없다는 점입니다. "한번 데이터가 회사에 있게 되면, 그것이 그곳에 있다."라는 문제와 대조적으로 "프라이버시 침해"에만 너무 많은 관심을 둡니다. 그리고 잠재적으로, 전자 문명이 존재하는 한 그곳에 있습니다. 그 데이터가 어떻게 사용될지는 아무도 예측할 수 없습니다.

종종 데이터 수집과 관련된 익명성의 장래에 대하여 당신의 의견은 무엇인가?

테렌스 크레이그: 데이터를 수집하는 누군가가 그들이 그 데이터를 익명화할 수 있다고 주장하는 것은 근본적으로 무책임한 것입니다. 우리는 넷플릭스의 역익명화(de-anonymization), AOL 검색 정보 누출, 그리고 그 밖의 것들을 보았습니다. 찬양을 목표로 공개한 의료 데이터가 있는 곳에서 그 데이터가 오히려 재빨리 역익명화 된 여러 경우가 있었습니다. 예를 들면, 한 연구원이 매사추세츠 주지사였던 윌리엄 웰드(William Weld)의 익명화된 의료 기록을 어떻게 열람할 수 있었는지를 설명하는 부분을 전자프론티어재단(Electronic Frontier Foundation)은 가지고 있습니다. 그리고 이것과 관련해, 하버드 게놈(genome) 프로젝트는 사람들에게 참여에 따르는 프라이버시 위험을 이해시키도록 노력합니다.

회사가 고객의 데이터에 대해 좋은 의도가 있다고 가정해도, (그리고 나는 대부분의 큰 회사가 그렇다고 가정할 것입니다.) 이 회사는 여전히 해킹될 수 있습니다. 나쁜 직원이 회사를 이용할 수도 있습니다. 정부가 회사 시스템의 백도어(backdoor)를 제공하라고 요구할 수도 있습니다. 궁극적으로 모든 것이 고객에게는 위험합니다.

데이터가 익명화될 수 없고, 회사가 개인 데이터에 대한 악의적 계획이 없다고 가정하면, 우리는 프라이버시에 대해 무슨 기대를 할 수 있을까요?

테렌스 크레이그: 우리는 진화의 원점(=원시 시대)으로 돌아간 것이며 이는 본질적으로 아무것도 없는 것입니다. 수렵채집인은 프라이버시가 없었습니다. 다세대에 걸친 가족끼리 움막집을 공유하는 작은 시골 마을에서 프라이버시가 정말 실제로 있지는 않았습니다.

문제는 우리의 초기(=원시 시대)를 반영하지만 커다란 차이가 하나 있는 사회 공동체를 어떻게 다룰 것인가 입니다. 이전에는, 우리 생활의 사적인 세부사항을 알고 있는 누군가는, 우리가 직접 만나고 대개 우리와 관련되어 있습니다. 하지만 이제 지리적인 경계가 인터넷에 의해 사라졌습니다. 이것은 무엇을 의미할까요? 또한 사회 공동체로서 이것을 다루기 위해 어떻게 발전해 나가야 할까요?

이를 염두에 두며, 저는 디지털 프라이버시를 목표로 한다는 생각을 포기했습니다. 만약 디지털화된 사회에서 완전한 참여자가 되는 것에 대해 보답 받고 싶다면, (프라이버시를) 포기해야만 한다고 생각합니다. 중요한 것은 데이터를 수집하고 있는 큰 기관이 반드시 투명성을 갖도록 하는 것입니다. 이러한 기관들이 데이터를 가지고 하는 것에 대해 우리가 이해하고 사람들과 함께 공유할 필요가 있으며, 따라서 이것이 전체적으로 데이터를 정당하게 사용하는 것인지 아닌지에 우리가 동의 할 수 있습니다. 소비자, 시민이 이 (데이터 사용) 과정의 제어를 시작할 수 있도록 투명성이 필요합니다. 투명성은 중요한 것입니다. 데이터를 숨기거나 비공개로 유지할 수 있다는 생각은, 글쎄요… 말이 마구간을 떠났다는 소리입니다(=소 잃고 외양간 고친다는 말입니다.)

정부가 갖고 있는 데이터, 뿐만 아니라 데이터에 관해 통과시킨 법. 두 가지 모두의 관점에서 정부 역할은 무엇입니까?

테렌스 크레이그: 기본적으로 정부가 수집하는 모든 것이 이용 가능해야 한다고 믿습니다. 결국 정부는 온갖 사람에 대한 거대한 데이터 수집가의 일부입니다. 정부는 데이터를 구매하거나 보안 상의 이유로 구글, 페이스북, 그리고 휴대폰 회사와 같은 주요 수집가에게 데이터를 요구합니다. 2008년에서 2009년까지 사법 당국이 스프린트(sprint)에 보낸 수백만 건의 요청은 우리 책에서 중요한 이야기로 다루어집니다. 정부가 이 정보로 무엇을 하는지 밝히는 것이 중요합니다.

분명히, 투명성과 운영상의 보안 요구 사이에서 균형은 필요합니다. 제가 바라는 점은 "우리 정부가 모든 데이터로 하는 것이 여기에 있습니다. 정부가 다양한 방법으로 수집한 데이터가 여기 있습니다. 그 데이터로 하고 있는 것이 여기 있습니다. 괜찮겠습니까?"라는 일반적인 생각을 갖는 것입니다. 제가 좋아할 만한 종류의 법이긴 하지만, 현재 어디에서도 찾을 수 없습니다.
TAG :
댓글 입력
자료실

최근 본 상품0