검색
LAW&스마트

AI산업과 데이터

1799745.jpg179975.jpg

 

우리가 보통 인공지능(Artificial Intelligence)이라고 부를 때, 이는 사람만이 독특하게 가졌다고 생각되는 추론 능력, 학습 능력, 지각 능력 등을 보유한 기계 또는 소프트웨어를 지칭한다. 전통적인 소프트웨어가 빠른 연산능력과 기억 능력 등을 보여주었지만 사람이 natural intelligence에 기반하여 행하는 기본적인 행위들을 제대로 하지 못하는 영역이 있었다. 이것이 가능한 기계 내지 소프트웨어를 인공지능이라고 불러왔다. AI 또는 인공지능이라고 하면 마치 만능인 것처럼 보이고 요즘에는 소프트웨어가 작동하는 곳이라면 어디에서나 AI라는 단어를 붙여 쓰지만 많은 경우 엄밀하게 말하면 AI라는 단어가 풍기는 신박함을 따오기 위한 마케팅적인 요소가 강하고 엄밀하게 인공지능이 구현된 경우가 아닌 경우도 많다.

 

컴퓨터공학자 등 연구자들에 의하여 인공지능을 구현하기 위한 여러 가지 방법들이 수십년 이상 연구되었고 최근에 가장 각광받는 방법론은 머신러닝(Machine Learning, 기계학습)이라고 부르는 방식이다. 이는 아주 많은 데이터를 학습시켜 컴퓨터가 스스로 규칙을 형성하도록 하여 기존의 룰 베이스의 소프트웨어가 할 수 없었던 모호한 기준을 구별해 내는 방식이다. 이와 같은 방식의 머신러닝 방식에 의한 인공지능 연구 개발 방법론이 전세계적으로 각광을 얻다 보니 많은 연구자들이 치열한 경쟁을 하게 되었고 최근에 있었던 서울대의 논문 표절 이슈 역시 그 부작용이라고 볼 수도 있다.


아무튼 머신러닝 방식의 인공지능 연구 개발을 위해서는 다량의 좋은 데이터가 필요하다는 점에는 별다른 이견이 없다. 언어 모델을 만들기 위해서는 컴퓨터가 읽어낼 수 있는 음성 데이터나 대화 데이터와 같은 정보가 필요하고, 자율주행 기술을 개발하기 위해서는 차량을 주행하기 위한 도로주행 영상 데이터가 필요하며, 신용도 평가를 위해서는 신용 거래 데이터가 필요하다. 그런데 이러한 데이터는 개개인의 개인정보를 담고 있거나 또는 창작물로서 저작권과 같은 권리가 문제될 수도 있다. 사람이 아닌 기계가 개인정보나 창작물이 담긴 데이터를 스스로 학습하고 그 결과물인 소프트웨어에는 이러한 데이터 자체가 남지 않는다. 그럼에도 여전히 우리나라의 경우 인공지능 연구 개발 과정에서 데이터와 관련한 법적인 문제가 발생할 수 있다는 우려는 많은 보도를 통하여 확인되고 있기도 하다. 인공지능을 중요한 산업 분야로 보고 그 개발을 촉진하기 위한 정부의 노력은 지속되어 왔고 많은 자금이 투입되고 있다. 그렇지만 어느 순간에 선량한 개발자들이 범법자가 될 가능성은 여전히 존재하고 또한 데이터 이용의 장벽으로 인하여 한국이 해외보다 인공지능 개발을 위한 최적화된 국가가 아니라는 지적이 여전히 존재한다. 더 늦기 전에 정부가 전봇대를 뽑아야 할 시점이다.

 

  

강태욱 변호사 (법무법인 태평양)

관련 법조인