![]() |
안희철 법무법인 디라이트 변호사. |
데이터 크롤링(crawling·온라인상 정보 수집 및 가공)이란 웹페이지를 그대로 가져온 후 그 정보에서 필요한 데이터를 추출하는 행위다.
다른 웹페이지의 데이터를 추출하는 크롤링은 한국의 현행법상 적법한 행위일까? 이 문제는 △형법상 컴퓨터 등 업무방해행위 △저작권법상 데이터베이스 저작권 침해행위 △개인정보 보호법 위반행위에 해당하는 지를 살펴봐야 한다.
▶형법상 컴퓨터 등 업무방해행위
형법 제314조는 컴퓨터 등 정보처리장치 또는 전자기록 등 특수매체기록을 손괴하거나 정보처리장치에 '허위 정보 또는 부정한 명령을 입력'하거나 '기타 방법'으로 정보처리에 장애를 발생하게 해 사람의 업무를 방해하는 행위에 대해 처벌한다고 규정하고 있다.
이 죄가 성립되려면 정보처리장치가 사용목적에 부합하는 기능을 하지 못하거나, 사용 목적과 다른 기능을 하는 등 정보처리에 장애가 현실적으로 발생해야 한다.
숙박업체 '여기어때'가 경쟁업체인 '야놀자'의 제휴 숙박업소 목록, 가격정보 등을 크롤링한 사건에서, 대법원은 여기어때가 서버 본래 목적에 따라 숙박업소의 정보를 전송 받고자 서버의 명령구분들에 거리 정보를 입력해 전국 숙박업소 정보를 전송 받아 '허위의 정보 또는 부정한 명령의 입력'에 해당하지 않는다고 봤다.
크롤링 프로그램을 이용한 접속으로 API 서버 접속에 장애가 발생했다고 단정할 수 없고, 여기어때가 크롤링 프로그램을 이용한 접속으로 인한 장애의 발생 가능성을 미필적으로나마 인식하고 용인했다고 볼 수 없다고 했다. 컴퓨터 등 업무방해행위가 불성립한다고 판단한 것이다(대법원 2021도1533 판결).
타 사의 웹사이트에서 데이터를 크롤링으로 가져오는 과정에서 해당 데이터가 웹사이트상에 모두에게 공개돼 있다면 허위 정보 또는 부정한 명령을 입력해 해당 데이터를 가져온다고 보기 어렵다. 타 사 서버의 장애 발생 가능성을 의욕하고 있다고도 보기 어렵다. 이 경우 컴퓨터 등 업무방해행위에 해당한다고 판단될 가능성은 낮다.
▶저작권법상 데이터베이스 저작권 침해
데이터베이스 저작권은 데이터의 수집·갱신·검증에 상당한 투자를 한 자에 대해 인정하는 데이터베이스에 대한 복제·전송 등의 권리를 말한다(저작권법 제2조 제19호).
데이터베이스 저작권자 허락 없이 데이터베이스의 전부 또는 일부를 반복적으로 복제함으로써 데이터베이스의 통상적인 이용과 충돌하거나 제작자의 이익을 부당하게 침해하는 경우, 저작권이 침해된 것으로 본다(저작권법 제93조).
지식공유 플랫폼인 '리그베다위키'의 데이터나 구인 플랫폼인 '사람인 HR'의 데이터의 경우 법원에서 저작권을 인정한 바가 있다.
이 데이터를 크롤링 하는 경우 저작권 침해로 판단될 가능성이 크다. 다만 야놀자 사건에서 대법원은 야놀자의 숙박업소 데이터는 이미 상당히 알려진 정보로서 그 수집에 상당한 비용이나 노력이 들었을 것으로 보이지 않거나 이미 공개되어 있던 정보이고, 갱신 등에 관한 자료가 없다는 점에서 데이터베이스 저작권 침해를 인정하지 않았다.
▶개인정보 보호법 위반
개인정보 보호법상 '개인정보'는 살아 있는 개인에 관한 정보로서 성명·주민등록번호 및 영상 등을 통해 개인을 알아볼 수 있는 정보, 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합해 알아볼 수 있는 정보 등을 의미한다(개인정보 보호법 제2조 제1호).
개인정보처리자는 정보주체의 동의를 받은 경우 등 개인정보 보호법이 규정하는 바에 따라 개인정보를 수집할 수 있으며, 그 수집 목적 범위에서 이용할 수 있다(개인정보 보호법 제15조).
만일 개인정보에 대해 동의를 받지 않고 크롤링을 통해 수집하게 되면 개인정보 보호법 위반으로 형사처벌을 받을 수 있다.

최수경
영남일보(www.yeongnam.com), 무단전재 및 수집, 재배포금지