default_top_notch
default_setNet1_2

[과학소묘] 빅데이터와 개인정보보호에 대한 소고

기사승인 [221호] 2022.09.26  

공유
default_news_ad1
   
  △ 사진출처 : Pixa bay  

   과학기술에 관심이 있는 사람들은 지금이 빅데이터의 시대라는 것을 부정하지 않을 것이다. 하지만 그들에게 ‘빅데이터가 무엇이냐?’고 물었을 때 그 정의를 분명히 말할 수 있는 사람은 매우 소수일 것이다. 사실 필자에게 질문한다고 해도 한 마디로 딱 잘라서 설명하기 어려운 개념이다. 예를 들어 학생들이 즐겨 찾는 인터넷에는 빅데이터가 “기존 데이터베이스 관리도구의 능력을 넘어서는 대량의 정형 데이터, 또는, 데이터베이스 형태가 아닌 비정형 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다”로 설명하고 있다. 그렇다면 ‘기존 기술의 기준은 무엇인가?’ 라는 생각이 자연스럽게 떠오르게 될 것이다.

   빅데이터는 클라우드 컴퓨팅과 비슷한 시기에 연구자들에게 알려지기 시작했는데, 당시 컴퓨팅 분야 연구자들에게는 클라우드 컴퓨팅과 빅데이터 모두 ‘과거의 메인프레임이라 불리는 대형 컴퓨터를 사용하여 대규모의 데이터를 분석하는 기술과 무엇이 달라진 것인가?’로 많은 질문을 유발하였다. 물론, 이미 이 시기에 아마존에서는 대량의 구매 기록을 기반으로, 유사 도서를 추천해주는 서비스가 제공되고 있었지만, 추천 시스템조차 새로운 기술은 아니었기에 빅데이터를 유의미하게 구분하기는 어려웠다.

   하지만 근래에 이르러서 필자는 빅데이터를 ‘대량의 데이터로부터 어떤 사건이나 정보를 추출하여 범인이 쉽게 이해하기 어려운, 고도의 통찰력을 얻고자 하는 행위 및 관련 기술’로 이해하게 되었다. 그리고 이 통찰을 바탕으로 편리한 서비스를 제공하여, 정당한 이윤을 추구하는 것이 빅데이터의 긍정적인 방향이라 할 수 있을 것이다. 다만, 빅데이터가 개인을 대상으로 사용되면, 그 사람에 대해서 본인도 미처 인지하지 못하는 다양한 객관적인 사실들을 알아낼 수 있기 때문에, 활용 방법에 따라서 사용자의 취향을 만족시키고 편의를 제공하는 긍정적인 방향의 서비스가 되거나 사용자의 개인정보를 침해하는 악의적인 행위가 될 수도 있는 문제가 발생할 수 있다.

   빅데이터라는 용어가 대중에게 알려진 계기인 ‘2012년 미국의 대형할인 마트인 타깃(Target)에서 빅데이터를 활용한 마케팅과 관련된 해프닝’은 빅데이터의 명암을 보여주는 대표적인 사례이다. 이 업체는 고객의 집에 우편으로 고객이 구매한 물품과 연관된 물품의 할인 쿠폰을 보내주는 마케팅을 하고 있었는데, 고등학생인 딸 앞으로 유아용품 할인 쿠폰이 온 것을 확인한 부모가 업체에 항의를 하였고, 당시 매니저는 해당 고객에게 사과를 하는 일이 있었다. 이것으로 이 일화가 끝났다면 빅데이터의 부정확성에 대한 논란 정도로 남았겠지만, 한 달 뒤 해당 학생이 실제로 임신 중이라는 것이 밝혀지면서 당시 학생이 구매한 물품들에 기반한 예측 시스템이 정확히 작동한 것으로 알려지게 되었다. 이에 많은 사람들이 구매 이력과 같은 정보가 타인으로 하여금 나의 사생활을 예측하게 할 수도 있다는 것을 깨닫게 되었고, 빅데이터가 편리하기만 한 것이 아니라 개인정보를 침해할 수 있는 문제로도 발전할 수 있다는 것을 알게 되었다.

   한편, 검색엔진, SNS, 그리고 스마트폰의 등장으로 다양한 서비스들이 등장하였는데, 이와 같은 서비스들 또한 대부분이 빅데이터를 기반으로 사용자에게 최적화된 서비스를 제공하는 것을 목적으로 하고 있다. 이 최적화된 서비스들은 검색 정보를 기반으로 다양한 형태의 광고를 제공할 수 있다. 예를 들어 A사의 시계를 검색하였다면, 다음날 A사의 시계에 대한 할인 광고에 노출될 가능성이 증가하여, 거리를 걷다가 해당 제품이 인근 상점에서 할인 판매 중이라는 광고를 받을 수도 있는 것이다.

   단순히 생각하면 관심사에 맞는 유용한 광고를 제공해주고 있어 유익하다고 생각할 수 있지만, 악의적인 공격자가 이 정보들을 획득한다면 개인정보보호 관점에서는 사생활 정보가 노출되고 있는 것이다. 특히, 공격자가 특정 대상의 사생활 정보를 수집하는 행위가, 대상의 아이디, 비밀번호, 금융 결제 정보와 같은 주요 개인정보를 획득하기 위한 사전 작업의 전형적인 형태인 것을 고려하면 이 문제는 매우 심각하다고 할 수 있다. 즉 획득한 사생활 정보를 바탕으로 공격 대상자를 피싱사이트로 연결하거나, 백도어나 랜섬웨어와 같은 멀웨어가 설치되도록 유도하는 광고에 접근하도록 하며, 그 결과 주요 개인정보의 노출로 금전적으로 큰 손해를 유발하게 된다.

   최근 빅데이터의 긍정적인 면만을 부각시켜, 데이터사이언스, 소셜분석, 데이터마이닝과 관련된 산업들이 힘을 얻고 있지만, 개인정보보호와 빅데이터의 산업의 성장이 양립하기 어렵기 때문에 많은 이들은 빅데이터 산업의 발전을 위해서 개인정보보호법이 우선적으로 완화되어야 한다고 이야기하고 있다. 하지만 연구자들이라면 이 두 사안을 최대한 양립시키고자 하는 상황에서 새로운 연구 방향을 찾을 수 있을 것이다.

정준호 동국대학교 컴퓨터공학전공 조교수

<저작권자 © 동국대학원신문 무단전재 및 재배포금지>
default_news_ad4
default_side_ad1

인기기사

default_side_ad2

포토

1 2 3
set_P1
default_side_ad3

섹션별 인기기사 및 최근기사

default_setNet2
default_bottom
#top
default_bottom_notch