검색
LAW&스마트

'데이터 비식별화 논쟁

전응준 변호사 (법무법인 유미)

사회 전반에서 데이터 마이닝, 빅데이터 분석이 시도되면서 이용자들의 불안감도 커지고 있다. 사업자들은 생각보다 많은 정보를 가지고 있다. 예컨대 구글맵의 타임라인 서비스는 지도에 안드로이드 이용자의 과거 위치정보를 일별로 보여준다. 이는 이용자의 추억을 되살려 주는 유용한 서비스이지만 프라이버시에 대한 위협적 요소도 될 수 있다.

빅데이터의 시대에서 개인정보를 보호하기 위한 기술로 제시된 것이 데이터 비식별화이다. 비식별화는 가명처리, 총계처리, 데이터 마스킹 등 데이터의 일부를 삭제, 대체하여 개인을 식별할 수 없도록 하는 것을 말한다. 개인정보는 개인을 식별할 수 있는 일체의 정보를 말하므로 데이터를 변조하여 개인이 식별되지 않는다면 이론적으로 프라이버시의 문제는 없다고 할 수 있다. 그러나 실제로는 비식별화되었다는 데이터를 다른 공개정보와 결합하여 결국 해당 정보의 주인을 알아낸 여러 사례가 존재한다.

어떠한 비식별화 데이터도 무한한 자원을 투입하면 개인을 식별할 수 있다. 여기서 중요한 것은 어느 정도까지 식별이 불가능하여야 사회나 개인이 그 위험을 수용할 수 있을 것인가이다. 재식별의 위험성을 수학적인 차원에서 영으로 만든 비식별 데이터는 유의미한 정보를 갖고 있지 못할 가능성이 높다. 당시 사회통념을 기준으로 위험성이 거의 없고 그 정도 위험은 사회적으로 수용할 수 있다고 볼 만한 수준에서 비식별성 여부가 결정되어야 의미 있는 데이터가 생성될 것이다.

현재 확정된 유럽연합의 개인정보보호 일반규정은 새롭게 가명화(pseudonymisation) 개념을 정의하면서 데이터의 가명처리를 장려하기 시작했고 작년 개정된 일본 개인정보보호법도 익명가공정보라는 개념을 두면서 그에 대하여는 본인 동의 없이도 제3자에게 제공할 수 있도록 했다. 특히 일본의 태도는 다소 파격적인데 데이터산업의 욕구를 입법으로 나타낸 것으로 보인다. 우리나라에서는 비식별화와 익명화 개념 정의에서부터 혼란이 있고 비식별화 알고리즘에 대한 구체적인 검증도 부족하다. 이념적 차원에서 비식별화의 위험성을 고민하는 것을 넘어서서 비식별화 기술의 안전성 판단, 무단 재식별화 방지 등을 현실적으로 고민해야 하는 시점에 와 있다.
리걸에듀