인쇄술의 발명으로 지식 공유가 가능해졌고 결과적으로 인류의 진보를 가져왔다. 인터넷도 정보 공유로 3차 산업혁명을 이끌었다. 이보다 한 단계 넘어선 4차 산업혁명은 빅데이터의 적극적인 활용에 달려 있다. 인공지능(AI)은 기계학습(machine learning)으로 빅데이터의 정보를 분석해 학습함으로써 능력을 확장시키기 때문이다.
AI가 보편적 서비스로 활용되고 능력을 높이기 위해서는 빅데이터 확보가 필수적이다. 다만 특정 기업이 빅데이터를 독점하는 것은 문제다. 의도적으로 원재료에 해당하는 데이터셋을 악용하는 경우에는 결과가 왜곡될 수도 있다. 사용자는 AI의 학습 과정을 확인할 길이 없어 결과만을 볼 수 있기 때문이다. 이러한 문제점을 막기 위한 방안으로 빅데이터 공개를 제안하기도 한다. 빅데이터를 공개함으로써 대중이라는 사회적 감시 시스템을 활용할 수 있기 때문에 오남용을 막을 수 있다는 주장이다. 일종의 인공지능 윤리의 적용인 것이다.
우리 주변에서 쉽게 볼 수 있는 빅데이터로는 네이버에 올리는 이용자의 글이나 구글의 검색 결과물 등을 들 수 있다. 이 과정에서 빅데이터의 소유권은 이용약관이라는 사적 계약으로 정해진다. 사업자는 이용자가 올리는 사진이나 게시물의 정보를 이용할 수 있는 권한을 갖는다. 이에 따라 사업자의 이용은 거의 무상에 가깝다. 이용자에게 별도의 비용을 지불하지 않기 때문이다. 그렇지만 사업자는 빅데이터를 활용해 적지 않은 수익을 발생시키기 때문에 공정한 것인지는 의문이다.
유감스럽게도 빅테이터를 활용할 수 있는 사업자는 많지 않다. 포털서비스처럼 대중을 대상으로 하는 서비스를 제공하는 경우가 아니라면 빅데이터 수집이 쉽지 않기 때문이다. 빅데이터는 AI의 부가가치를 높일 수 있기 때문에 중요성을 부인하기 어렵다. 부가가치 창출을 위해 빅데이터를 확보하는 것이 중요하나 적지 않은 비용 때문에 데이터를 구매하는 것은 쉬운 일이 아니다. 하나의 방안으로 공정이용(fair use)을 들 수 있다. 데이터 이용 환경의 차별은 AI의 발전에서 차별로 이어지기 때문이다.
공정이용은 공익 목적을 위해 저작권자의 허락 없이 저작물을 이용할 수 있는 제도다. AI 발전이나 빅데이터 활성화를 위한 입법안을 준비하고 있다. 즉 빅데이터 분석 등을 위해 저작물 등을 사용할 경우에는 공정이용이 가능하도록 저작권법을 개정하자는 것이다. 다만 빅데이터 분석을 위해 상업적 목적으로 판매되는 경우는 대상에서 제외하고자 한다. 자칫 빅데이터 산업에 부정적인 영향을 미칠 수 있기 때문이다.
빅데이터는 소유보다 활용하는 과정에서 가치가 창출된다. 그러기 위해서는 누구라도 빅데이터 이용이 자유로워야 한다. 빅데이터 민주화는 공정한 이용으로 가능하다. 빅데이터 이용의 자유가 AI의 발전을 이끌고 4차 산업혁명의 성공으로 이어질 것이기 때문이다. 다만 중요한 점은 자유에는 책임이 따른다는 것이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >