검색
학계,학회

“법률분야 AI 개발… 판결문 등 빅데이터 확보 절실”

전정현 변호사·김병필 교수, 공동논문서 주장

인공지능(AI) 기술이 법률분야에서 발전하기 위해서는 무엇보다 판결문과 계약서 등 빅데이터 확보가 시급하다는 주장이 나왔다.

 

전정현(41·사법연수원 38기) 법무법인 광장 변호사와 김병필(40·38기) 카이스트 경영대학 초빙교수는 최근 저스티스에 공동으로 게재한 '인공지능과 법률 서비스:현황과 과제'논문에서 "적절한 학습용 데이터 없이는 사례 기반 인공지능이나 심층학습 기술의 발달은 불가능하다"며 "판결문과 계약서 등 법률서비스 관련 빅데이터 확보 방안이 시급하다"고 강조했다.

 

150966_1.jpg

 

이들은 "인공지능에 판결문을 학습시키기 위해서는 쟁점 하나당 1000건 이상의 하급심 판결이 필요하다"며 "현재와 같은 극히 제한된 판결문 공개 시스템 하에서는 그러한 분량의 판결문을 확보하는 것이 현실적으로 불가능하다"고 지적했다. 이어 "따라서 인공지능을 적절하게 학습시키기 위해서는 하급심 판결문 공개가 현재보다 훨씬 더 확대될 필요가 있다"며 "법률분야 인공지능 연구자들이 사용할 수 있는 비식별화(가명처리 등 데이터의 일부를 삭제하거나 대체해 개인을 식별할 수 없도록 하는 것)된 판결문 데이터베이스를 구축해 제공할 필요가 있다"고 설명했다.

 

AI에 판결문 학습시키기 위해

쟁점 당 1000건 이상 판결문 필요

 

그러면서 "법원이나 법무부·검찰 등이 1심 판결문에 적절한 수준으로 개인정보 비식별화 조치를 해 인공지능 연구자들에게만 자료를 제공하는 방안을 고려해 볼 수 있다"며 "자료를 수령한 연구자들에게는 재배포나 재식별화 금지 의무를 부담시키거나 다른 기술적 보안 장치를 둔다면 개인정보 유출에 대한 우려도 극복할 수 있을 것"이라고 조언했다.


이들은 나아가 "계약서의 경우 판결문보다 데이터 확보가 더욱 어렵다"며 "미국의 경우 공개회사들이 계약서 공시 의무를 부담하고 있어 공시된 계약서를 통한 연구를 수행하기가 상대적으로 용이하다"고 소개했다. 이어 "우리나라에서는 기업이 계약서 자체를 공시할 의무를 부담하지 않기 때문에 대량의 계약서를 확보하기가 불가능하다"며 "정부 당국이나 관련 산업 분야의 협회가 계약서 데이터를 수집해 비식별화 조치를 취하고 이를 연구 목적의 데이터베이스로 구축하는 작업이 선행될 필요가 있다"고 했다.

 

하급심 판결문 공개 현재보다 확대…

비식별화 처리로 제공돼야


두 사람은 또 법률분야 인공지능 기술 발전을 위한 표준적 과제로 △판결문 예측 인공지능 △분쟁조정위원회의 조정안 생성 인공지능 개발 등을 제시했다.


이들은 "최근 컴퓨터 공학 분야에서 판결문 데이터를 학습해 사건의 결과를 예측하는 인공지능을 개발하려는 시도가 이어지고 있다"며 "미국 스탠포드대 연구자들은 1816~2015년 사이의 미국 대법원 판결문 총 2만8000건을 학습시켜 대법원 판결문을 예측하는 인공지능 'CodeX' 를 개발한 결과 70.2%의 정확도를 달성했다. 영국 연구자들은 유럽인권재판소 판결문 584건을 학습시켜 평균 79%의 정확도로 재판 결과를 예측할 수 있었다"고 전했다.

 

미 스탠포드大서 대법원 판결문 예측 AI개발

… 정확도 70.2% 달성

 

그러면서 "국내에서 가장 먼저 시도해 볼 수 있는 유사한 시도로서 특정한 청구권원의 민사사건에서 판결문을 인공지능이 학습하도록 해 손해배상액을 예측하거나 특정한 범죄의 형사 사건에서 유죄 여부와 형량을 예측하는 기술 개발을 고려해 볼 수 있다"며 "또 인공지능을 통해 특정 분쟁 사건에 있어 조정안을 예측하고 그 조정안 초안을 자동으로 생성하게 한다면 분쟁 당사자들의 예측 가능성을 높이고 조정위원들의 업무 부담을 경감시킬 수 있을 것"이라고 덧붙였다.

미국변호사